📊 Épidémiologie — Cours Complet PASS/LAS
Définitions, méthodes descriptives et analytiques, études de cohorte, cas-témoins, essais randomisés et niveaux de preuve
1. Définition de l’épidémiologie
2. Fonctions, objectifs et méthodes
3. Épidémiologie descriptive
4. Prévalence (étude transversale)
5. Incidence (étude de cohorte)
6. Lien entre prévalence et incidence
7. Sélection des participants : exhaustive vs échantillon
8. Surveillance épidémiologique continue
9. Études ponctuelles : le Baromètre santé
10. Épidémiologie explicative (analytique)
11. Étude de cohorte et risque relatif
12. Étude cas-témoins et odds ratio
13. Cohorte vs cas-témoins : comparaison
14. Épidémiologie en population générale vs clinique
15. Épidémiologie évaluative : l’essai randomisé
16. Niveaux de preuve
17. Exercices
18. FAQ
🔬 Définition de l’épidémiologie
L’épidémiologie est un raisonnement et une méthode appliqués à la description des phénomènes de santé, à l’explication de leur étiologie (leurs causes : chez qui la maladie apparaît, quels sont les facteurs de risque) et à la recherche des méthodes d’intervention les plus efficaces pour arrêter ou prévenir les maladies.
La caractéristique essentielle de l’épidémiologie, par rapport à la médecine clinique, est son intérêt pour les groupes d’individus et non pour les individus eux-mêmes — qu’il s’agisse d’un échantillon restreint ou d’une population nationale entière (comme ce fut le cas pendant la pandémie de Covid-19). Cette spécificité implique un mode de pensée, une approche des événements de santé et des outils de description et de mesure différents de ceux de la médecine clinique. Le but final reste toujours de procurer les meilleurs soins et de prévenir la maladie au maximum.
🎯 Fonctions, objectifs et méthodes de l’épidémiologie
L’épidémiologie s’articule autour de 5 fonctions, 4 objectifs et 3 méthodes complémentaires :
| Fonctions | Objectifs | Méthode correspondante |
|---|---|---|
| Surveillance | Identifier et prioriser les problèmes de santé | Descriptive — Décrire un événement de santé (qui, quand, où, quelle maladie ?). État des lieux par la prévalence, l’incidence, etc. |
| Mesure de l’importance des problèmes de santé | ||
| Recherche étiologique | Planifier des actions pour résoudre ces problèmes (prévention primaire, secondaire, tertiaire) | Explicative (analytique) — Expliquer un événement de santé : pourquoi ? Quels facteurs de risque ? Pourquoi l’incidence augmente ou diminue ? Pourquoi la maladie n’est pas répartie équitablement ? |
| Identification des groupes à risque | Évaluer les actions mises en place | Évaluative — Évaluer les solutions apportées : qu’est-ce qui est efficace ? Difficulté à établir les liens de causalité (ex. : la hausse du prix de la cigarette est-elle réellement liée à la baisse du tabagisme ?). |
| Évaluation de la santé |
📋 Épidémiologie descriptive
L’épidémiologie descriptive étudie la distribution de la maladie dans les populations selon trois axes : les caractéristiques de l’individu (âge, sexe, état civil, profession), le lieu (résidence, région, pays, lieu de travail) et le temps (mois, saison, années). Elle s’exprime sous forme de taux selon des indicateurs de santé statiques ou dynamiques :
| Type d’indicateur | Définition | Source de données |
|---|---|---|
| Morbidité | Prévalence (nombre de cas existants) et incidence (nouveaux cas, aussi appelé taux d’attaque lors d’une épidémie) | Enquêtes épidémiologiques |
| Mortalité | Fréquence des décès. Attention : la mortalité n’est pas spécifique d’une maladie — on parle plutôt de létalité pour mesurer la proportion de décès parmi les personnes atteintes | INSEE |
| Natalité | Fréquence des naissances | INSEE |
L’épidémiologie descriptive permet de connaître les besoins de la population et constitue une aide à la planification sanitaire. Elle précède souvent l’épidémiologie analytique.
📸 Prévalence (étude transversale)
L’étude de prévalence, ou étude transversale, fonctionne comme une photographie : elle mesure le nombre de cas (et donc la prévalence) d’un problème ciblé à un instant donné, tout en recueillant les facteurs associés (caractéristiques socio-économiques, niveau d’éducation, conditions environnementales, style de vie, etc.).
L’étude est menée à une date précise (un instant t), avec un recueil simultané des données relatives à la maladie et aux facteurs de risque, de façon concomitante à l’inclusion des sujets.
Taux de prévalence = Nombre total de cas / Population totale × 100Par exemple, les données montrent une augmentation de la prévalence des épisodes dépressifs caractérisés depuis 2005, affectant les deux sexes mais plus prononcée chez les femmes. Une hausse particulièrement importante a été observée chez les 18-24 ans en 2021, se distinguant nettement de la stabilité observée les années précédentes. Ce type d’analyse descriptive et visuelle sert à établir un contexte initial et peut orienter l’attention (ici, vers les jeunes adultes plutôt que vers les personnes plus âgées). Ces différences peuvent être confirmées par des tests statistiques.
📈 Incidence (étude de cohorte descriptive)
L’étude d’incidence consiste à suivre dans le temps une population définie (la cohorte) afin de déterminer l’incidence d’un événement de santé.
Taux d'incidence = Nombre de nouveaux cas sur une période / PopulationDurant la période épidémique de la Covid-19, l’incidence (nombre de nouveaux cas rapportés à la population) était surveillée et comparée de près, dans le temps et entre pays.
🛁 Lien entre prévalence et incidence
L’analogie classique est celle de la baignoire. L’incidence correspond aux nouveaux cas qui « coulent » dans la baignoire. Parmi ces cas, certains vont guérir ou décéder, et vont donc « sortir » de l’ensemble des cas. Ce qui reste dans la baignoire — c’est-à-dire les cas encore malades (ni décédés, ni guéris) — représente la prévalence.
| Type de maladie | Indicateur dominant | Explication |
|---|---|---|
| Maladies à guérison rapide (grippe, gastro-entérite) | Incidence | Les cas sortent vite de la « baignoire », la prévalence reste faible |
| Maladies chroniques (diabète, cancer) | Prévalence | Les cas s’accumulent dans la « baignoire » car il n’y a pas de guérison rapide |
👥 Sélection des participants : exhaustive vs échantillon
| Mode | Principe | Avantages | Inconvénients |
|---|---|---|---|
| Exhaustive | Toute la population est incluse (ex. : statistiques de mortalité) | Élimine tout biais de sélection | Complexe, champs de données limités, qualité de l’information souvent médiocre (sauf bases de données existantes) |
| Échantillon | Extrait par sondage de la population. Type d’étude le plus fréquent. | Coût moindre, qualité meilleure avec plus de données par personne | Précision dépend de la taille de l’échantillon, nécessite une bonne représentativité, volontariat des répondants |
Lorsqu’on travaille sur un échantillon, il faut distinguer trois niveaux de population : la population source (dont est issu l’échantillon), la population étudiée (l’échantillon qui participe effectivement à l’étude) et la population cible (celle à laquelle les résultats devraient s’appliquer). Par exemple, pour une étude sur les pratiques alimentaires des infirmières en Suède, la population source est l’ensemble des infirmières inscrites à leur registre professionnel, la population étudiée est la part de ces femmes effectivement incluses, et la population cible est l’ensemble des infirmières du pays.
🔎 Surveillance épidémiologique continue
La surveillance épidémiologique est un processus continu et systématique de collecte de données, à l’opposé des enquêtes ponctuelles. Elle concerne des problèmes pouvant faire l’objet d’une prévention, d’un traitement ou d’une action de santé publique. La rapidité du traitement de l’information et de la diffusion des résultats est indispensable pour déclencher des actions. Sa finalité est de fournir des informations servant à la prise de mesures de prévention ou de contrôle.
🩺 Le Réseau Sentinelles
Le Réseau Sentinelles est un réseau de recherche et de veille en soins de premier recours (médecine générale et pédiatrie) en France métropolitaine. Il fonctionne à partir d’un échantillon aléatoire représentatif de l’ensemble des médecins. Chaque semaine, les médecins généralistes Sentinelles transmettent les données de leurs patients pour les indicateurs suivis, via une connexion internet sécurisée. Le réseau surveille 10 indicateurs de santé : 9 maladies infectieuses et 1 indicateur non infectieux (l’acte suicidaire). Parmi les surveillances les plus anciennes, on compte les syndromes grippaux (depuis 1984), la maladie de Lyme (depuis 2009) et les maladies respiratoires et bactériennes (depuis quelques années).
Le calcul pour estimer l’incidence à l’échelle nationale est : (Nb moyen de cas vus par un médecin Sentinelles × Nb total de médecins généralistes en France) / Population française. Ce système permet le recueil, l’analyse, la prévision et la redistribution en temps réel de données épidémiologiques.
Exemple concret : pour la maladie de Lyme, le taux d’incidence est resté stable jusqu’en 2015, puis a augmenté. La prévention s’est avérée difficile (impossible d’empêcher la prolifération des tiques), d’où le choix d’informer les populations par des campagnes médiatiques et d’affichage.
🏛️ Santé publique France
Santé publique France est l’agence d’expertise scientifique sous tutelle de l’État, dont les objectifs sont d’améliorer et de protéger la santé des populations. Elle s’articule autour de trois axes : assurer un système national de veille et de surveillance pour détecter et anticiper les risques sanitaires, améliorer la connaissance sur l’état de santé de la population et concevoir les stratégies de prévention, et promouvoir la santé en agissant sur les environnements et en répondant aux crises sanitaires.
Ses missions incluent l’observation épidémiologique, la veille sur les risques sanitaires, le lancement de l’alerte sanitaire, la promotion de la santé et la réduction des risques, le développement de la prévention et de l’éducation pour la santé, et la préparation aux crises sanitaires. Elle construit ses indicateurs à partir de bases de données spécifiques : le système de surveillance syndromique SurSaUD, les enquêtes épidémiologiques en population générale et le Système National des Données de Santé (SNDS).
🚨 Surveillance syndromique SurSaUD
Contrairement à la plupart des systèmes de surveillance basés sur des diagnostics confirmés biologiquement, le système SurSaUD (Surveillance Sanitaire des Urgences et des Décès) repose sur des indicateurs sanitaires non spécifiques : signes cliniques, symptômes, indicateurs « proxy » (absentéisme, ventes de médicaments). Il centralise quotidiennement les informations de plus de 600 services d’urgence (réseau OSCOUR), 60 associations SOS Médecins et 3 000 communes (données de mortalité via l’INSEE), couvrant respectivement 86 % de l’activité des urgences, 90 % de l’activité SOS Médecins et 80 % des décès quotidiens.
💾 Système National des Données de Santé (SNDS)
Le SNDS rassemble une vaste quantité de données de santé dans le but d’améliorer la qualité des soins, de soutenir la recherche et d’informer les politiques de santé publique. Il intègre les données de l’Assurance Maladie (feuilles de soins via le SNIIRAM, médicaments prescrits, dispositifs médicaux), les données de facturation des hôpitaux (Programme de Médicalisation des Systèmes d’Information — PMSI), les données des causes de décès (certificats de décès) et les données relatives aux handicaps (Maisons Départementales des Personnes Handicapées — MDPH). L’accès au SNDS est réglementé pour protéger la confidentialité des patients : une autorisation spécifique est requise.
🗺️ GEODES
GEODES est une plateforme de cartographie interactive mise en place par Santé publique France. Elle permet d’accéder à des données géographiques de santé publique à l’échelle nationale, régionale et départementale, et de visualiser les disparités territoriales (ex. : le diabète présente des variations régionales de prévalence, qui augmentent au fil des années).
📋 Études ponctuelles : le Baromètre santé
Le Baromètre de Santé publique France est un dispositif d’enquêtes périodiques mis en place en 1992. Il permet la surveillance épidémiologique des principaux comportements, attitudes et perceptions de la population résidant en France vis-à-vis de sa santé, ainsi que l’étude des facteurs associés et des déterminants des comportements de santé. Ces enquêtes constituent des outils précieux pour la mise en œuvre et l’évaluation des actions de santé publique.
Certaines éditions portent sur une thématique unique (nutrition en 1996/2002/2008, cancer en 2005/2010/2015, addictions en 2017, tabac en 2018, etc.), d’autres sont multithématiques (ex. : le baromètre 2021 couvrait santé, environnement, addictions, vaccinations, Covid-19, nutrition et santé mentale, sur un échantillon de 24 514 personnes dont la moitié a répondu, parmi les 18-85 ans).
Ces études reposent sur des enquêtes auprès d’échantillons représentatifs, utilisant des méthodologies variées (enquêtes téléphoniques, questionnaires en ligne). Le sondage aléatoire peut se faire à 1 degré (tirage aléatoire d’un numéro de téléphone) ou à 2 degrés (tirage au sort d’un foyer, puis tirage au sort d’un individu dans le foyer).
🔍 Épidémiologie explicative (analytique / étiologique)
L’épidémiologie explicative vise à étudier les relations entre l’exposition à des facteurs de risque et la survenue de maladies, et à rechercher les facteurs de risque qui influencent leur survenue au sein d’une population. Le but est de mettre en évidence l’association entre une exposition (E) et une maladie (M) : les personnes exposées à E sont-elles plus atteintes par M que les non-exposées ? La comparaison entre groupes et la notion de risque sont centrales.
📌 Facteurs de risque, marqueurs de risque et facteurs protecteurs
Un facteur de risque est une caractéristique individuelle (âge, sexe, maladies préexistantes, génétique, exposition environnementale, comportement alimentaire) associée à une survenue plus fréquente d’une maladie. Il est possible d’agir sur l’exposition à un facteur de risque (tabac, alcool). Un marqueur de risque augmente également la probabilité de survenue de la maladie, mais aucune action n’est envisageable sur le marqueur (âge, sexe). Le risque est la probabilité de survenue d’un événement donné. Il existe aussi des facteurs protecteurs (activité physique, certains aliments) qu’il est tout aussi important de connaître.
📐 Étude de cohorte et risque relatif
Le principe d’une étude de cohorte est de sélectionner un ensemble de sujets partageant des caractéristiques communes, de les suivre dans le temps à l’échelle individuelle, et de comparer l’incidence d’une pathologie entre un groupe d’individus exposés et un groupe d’individus non exposés. Si l’hypothèse est correcte, il y aura plus de malades dans le groupe des exposés.
📊 Le risque relatif (RR)
Le résultat s’exprime sous forme d’un risque relatif, qui est le rapport entre la fréquence de la maladie dans le groupe exposé et la fréquence dans le groupe non exposé :
RR = [a / (a+b)] / [c / (c+d)]
Où a = exposés malades, b = exposés non malades, c = non-exposés malades, d = non-exposés non malades.
| Valeur du RR | Interprétation |
|---|---|
| RR = 1 | Aucune association entre l’exposition et la maladie |
| RR > 1 | L’exposition est un facteur de risque (augmente l’incidence chez les exposés) |
| RR < 1 | L’exposition est un facteur protecteur (diminue l’incidence chez les exposés) |
🏛️ L’étude de Framingham
Référence historique en épidémiologie, la cohorte de Framingham a débuté en 1948 aux États-Unis avec 5 209 participants, choisis pour la représentativité de cette ville par rapport à la population américaine. L’étude en est désormais à sa 3e génération de participants. On lui doit une grande partie des connaissances sur les maladies cardiovasculaires : identification de l’hypertension comme facteur de risque de maladies cardiaques (1957), de maladies neurologiques (1967), d’insuffisance cardiaque (1971), rôle du diabète (1974), du cholestérol avec les effets protecteurs des HDL (1977), et reconnaissance de l’obésité comme facteur de risque indépendant (1983).
🔄 Cohortes prospectives vs rétrospectives
| Critère | Cohorte prospective | Cohorte rétrospective (historique) |
|---|---|---|
| Information sur l’exposition | Recueillie avant la survenue de la maladie | Recueillie après la survenue de la maladie (à partir de registres) |
| Événement (maladie) | Survient après l’inclusion dans l’étude | Survenu avant l’inclusion dans l’étude |
| Avantages | Suivi rigoureux, informations de qualité supérieure | Plus rapide et moins coûteuse |
| Inconvénients | Coûteuse, longue, problèmes de rétention des participants | Risque de biais d’information (difficulté des participants à se remémorer les événements passés) |
🥗 Exemple : la cohorte NutriNet-Santé
NutriNet-Santé est une grande étude de cohorte française en population générale, avec suivi en ligne de l’alimentation. Son but est d’étudier les liens entre consommation alimentaire et risque de maladies cardiovasculaires. Les participants, indemnes de maladies cardiovasculaires à l’inclusion, ont enregistré leur consommation via des enregistrements de 24h répétés et validés, classés selon le degré de transformation (classification NOVA). Le suivi de 2009 à 2018 a montré qu’une augmentation de 10 points de la part d’aliments ultra-transformés dans le régime alimentaire était associée à une augmentation de 12 % du risque de maladies cardiovasculaires.
⚠️ Les problèmes de méthode des cohortes
La puissance statistique impose des tailles d’échantillon suffisantes. Les biais de sélection sont liés aux modes de recrutement et au volontariat des participants. Les biais d’information proviennent de la diversité des données recueillies à différents moments (examens cliniques, questionnaires, prélèvements, imagerie). L’attrition (participants « perdus de vue » ou devenus « non-répondants ») au cours du temps accroît les biais de sélection et peut compromettre la cohérence du suivi.
🔎 Étude cas-témoins et odds ratio
L’étude cas-témoins compare des personnes malades (les cas) à des personnes non malades (les témoins), appariés sur certains critères (âge, sexe). On compare ensuite la fréquence de l’exposition antérieure dans les deux groupes. Ce type d’étude est privilégié lorsque la pathologie étudiée est rare et l’exposition fréquente.
On estime l’odds ratio (OR), qui est une approximation convenable du risque relatif. L’interprétation est la même (OR = 1 : aucune association ; OR > 1 : facteur de risque ; OR < 1 : facteur protecteur), mais ce ne sont pas des incidences qui sont comparées. En effet, dans une étude cas-témoins, les cas sont déjà sélectionnés (nombre fixé d’avance), il est donc impossible de calculer une incidence, et par conséquent un risque relatif au sens strict.
Exemple : une étude cas-témoins menée pendant la pandémie de Covid-19 a comparé 3 426 cas (malades) et 1 713 témoins (non-malades). Résultats : le télétravail partiel ou complet présentait un OR < 1 (facteur protecteur par rapport au travail en présentiel), tandis que les réunions en présentiel montraient un OR > 1 (facteur de risque : 1,15 fois plus de risque d’infection).
⚖️ Cohorte vs cas-témoins : comparaison
| Critère | Étude de cohorte | Étude cas-témoins |
|---|---|---|
| Point de départ | On part de l’exposition, on observe qui développe la maladie | On part de la maladie, on cherche qui a été exposé |
| Résultat | Risque relatif (RR) — calcul d’incidence | Odds ratio (OR) — calcul de fréquence d’exposition |
| Avantages | Étude des expositions rares, possibilité d’étudier plusieurs maladies | Adaptée aux maladies rares ou à délai d’apparition long, possibilité d’étudier plusieurs expositions |
| Inconvénients | Longue durée, coûteuse, attrition, échantillon important nécessaire, non adaptée aux maladies rares | Biais de mémoire, difficulté à trouver des témoins, recueil d’information compliqué, peu adaptée aux expositions rares |
En pratique, avant d’entreprendre une étude de cohorte (longue et coûteuse), il est fréquent de débuter par une étude cas-témoins. Si celle-ci met en évidence des hypothèses intéressantes, cela peut justifier le lancement d’une cohorte.
🩺 Épidémiologie en population générale vs clinique
| Critère | Épidémiologie en population générale | Épidémiologie clinique |
|---|---|---|
| Population étudiée | Population générale (sujets sains et malades) | Patients déjà diagnostiqués ou traités pour une maladie |
| Moment de la maladie | Phase asymptomatique → survenue de la maladie | Phase symptomatique → évolution, guérison, décès, séquelles |
| Objectif | Décrire et expliquer pourquoi la maladie se développe — prévention primaire | Comprendre les facteurs influençant les résultats cliniques — prévention secondaire ou tertiaire |
| Méthodes | Identiques (cohortes, cas-témoins). Ce qui change est la population et le moment considéré. | |
Exemple d’épidémiologie en population générale : l’étude NutriNet, qui étudie les relations entre alimentation et mortalité ou incidence des maladies chroniques chez des sujets initialement sains. Exemple d’épidémiologie clinique : la cohorte NS-PARK, qui suit des patients déjà atteints de la maladie de Parkinson dans les centres experts français pour comprendre les différents profils de progression et adapter les traitements de façon personnalisée.
🧪 Épidémiologie évaluative : l’essai randomisé
L’épidémiologie évaluative vise à évaluer l’efficacité d’une intervention ou action de santé. L’essai contrôlé randomisé (ECR) est le schéma d’étude obligatoire avant la mise sur le marché d’un nouveau traitement. Il est aussi utilisé pour évaluer de nouvelles techniques chirurgicales ou programmes de santé publique. Il répond aux critères de sécurité et d’efficacité.
📐 Principe méthodologique
L’essai comporte un groupe contrôle (équivalent à un groupe témoin), car les résultats d’une étude sur un seul groupe ne permettent pas de distinguer les effets du traitement de l’évolution naturelle de la maladie. Les groupes sont constitués par le chercheur de manière aléatoire (randomisation par des biostatisticiens), afin que ni le médecin ni le patient ne décide de l’attribution du traitement.
🎲 La randomisation
La randomisation est le point capital de tout essai contrôlé. Elle consiste en l’attribution au hasard des traitements évalués, afin que le traitement reçu ne dépende pas des caractéristiques propres du patient. Les groupes sont ainsi comparables : les facteurs de pronostic et de gravité y sont identiques. Si la randomisation est correcte et qu’il n’y a pas d’autres biais, les différences observées en fin d’étude peuvent être attribuées aux traitements évalués. Elle permet d’éviter le biais de sélection et offre le meilleur niveau de preuve.
🕶️ Simple et double aveugle
L’étude en simple aveugle (simple insu) signifie que seul le patient ignore quel traitement il reçoit. En double aveugle (double insu), ni le patient ni le médecin ne le savent. Cela évite les biais de réalisation (différences dans l’administration des soins, le suivi, la compliance) et les biais d’interprétation/évaluation. C’est le seul moyen de garantir la comparabilité entre les groupes tout au long de l’essai.
🏆 Niveaux de preuve
Chaque type d’étude n’apporte pas le même niveau de preuve scientifique. La hiérarchie est la suivante :
| Grade | Niveau | Type d’étude |
|---|---|---|
| A — Preuve scientifique établie | Niveau 1 | Essais comparatifs randomisés de forte puissance, méta-analyses d’ECR, analyses de décision fondées sur des études bien menées |
| B — Présomption scientifique | Niveau 2 | Essais comparatifs randomisés de faible puissance, études comparatives non randomisées bien menées, études de cohortes |
| C — Faible niveau de preuve scientifique | Niveau 3 | Études cas-témoins |
| Niveau 4 | Études comparatives avec biais importants, études rétrospectives, séries de cas, études épidémiologiques descriptives |
