Méthodologie de l'étude

Population recrutée à l'inclusion

Recrutement et critères d'inclusion

Les 7290 participants de la Cohorte RECORD ont été recrutés entre mars 2007 et février 2008 dans le cadre des Examens Périodiques de Santé de la Sécurité Sociale réalisés par le Centre d'Investigations Préventives et Cliniques sur quatre de ses sites localisés à Paris, Argenteuil, Trappes et Mantes-la-Jolie. Les critères d'inclusion suivants avaient été spécifiés :
- les participants devaient avoir entre 30 et 79 ans au moment de l'examen ;
- ils devaient résider dans l'une des 112 communes sélectionnées a priori et représentées sur la carte ci-contre (accéder à la liste des 111 communes et 10 arrondissements parisiens de l'étude) ;
- les participants devaient être en mesure de répondre par eux-mêmes (ou avec une aide minimale) au questionnaire de l'étude proposé en langue française.

Présélection des communes de l'étude

La sélection des communes à retenir dans l'Etude RECORD s'est appuyée sur un découpage du territoire en codes postaux, qui sont directement renseignés dans la base de données du Centre IPC. Nous nous sommes appuyées sur les effectifs de patients du Centre IPC par code postaux de résidence sur l'ensemble de l'année 2006. Nous avons sélectionné les codes postaux d'au moins 15000 habitants au recensement de 1999 qui avaient fourni les effectifs de patients les plus importants au Centre IPC en 2006 (en termes de nombre de patients à la fois par habitant et par nombre d'îlots ou quartier IRIS dans le code postal). Toutefois, lors de cette sélection, les codes postaux au revenu médian le plus faible ont été surreprésentés.

Comme l'illustre la carte ci-contre des revenus médian par commune en 2005, l'échantillon comprend à la fois des communes défavorisées (par exemple, La Courneuve, Sarcelles, Mantes-la-Jolie, Evry, etc.) et des communes très favorisées (Versailles, Neuilly-sur-Seine, Le Vésinet, etc.). Par ailleurs, l'échantillon comprend très territoires très densément urbanisés et des territoires moins urbanisés. Au total, les 1915 quartiers de l'étude garantissent une grande diversité de situations sociales et territoriales dans l'échantillon, sans laquelle il ne serait pas possible de s'intéresser aux effets des environnements géographiques de vie sur la santé.

Biais de sélection liés à la non-participation à l'étude

Il a été proposé à toutes les personnes qui répondaient aux trois critères d'inclusion listés ci-dessus de participer à l'Etude RECORD. Parmi les personnes qui étaient éligibles sur la base de l'âge et du lieu de résidence, 10,9% ont été exclues du fait de leur incapacité à répondre un questionnaire auto-administré en français. Des enquêteurs spécifiquement formés à cette tâche étaient chargés d'expliquer le principe de l'étude aux personnes sélectionnées. Les personnes qui acceptaient de participer ont signé un formulaire de consentement (accéder au formulaire de consentement). Parmi les personnes invitées à participer, 83,6% ont complété le protocole de collecte des données.

Il est important de garder à l'esprit que les participants de l'étude RECORD ne reflète pas exactement la population des communes d'où ils proviennent, et ceci pour trois raisons : parce qu'ils ont été recrutés lors de leur passage au Centre IPC sans avoir été préalablement sélectionnés de façon aléatoire dans la population générale ; parce que certaines personnes ont été exclues du fait de leur incapacité à répondre à un questionnaire auto-administré ; et parce que certains individus ont refusé de participer à l'étude ou n'ont pas complété le protocole de collecte des données.

Du fait de ces biais de sélection, les proportions de personnes ayant tel problème de santé ou tel facteur de risque de maladie que l'on estime à partir de la Cohorte RECORD risquent d'être incorrectement supérieures ou inférieures aux valeurs réelles dans la population des communes et d'âge correspondants. Plus problématique encore du fait de l'objectif de nos travaux, si les expositions environnementales et les phénomènes de santé que nous étudions influent sur les chances de participation à l'étude, alors les associations qui nous intéressent entre facteurs contextuels et santé telles que nous les observons dans l'étude risquent elles-mêmes de ne pas refléter les associations qui existent dans la population source.

Toutefois, dans un certain nombre d'analyses, il est malgré tout possible de se prémunir d'une partie de ces biais de sélection par un ajustement approprié des modèles ou par l'introduction de pondérations. A cette fin, il est toutefois utile d'identifier les variables environnementales et, idéalement les variables de santé, qui influent sur les chances de participation à l'étude. Dans la première étude réalisée à partir des données, nous nous sommes donc intéressés aux déterminants individuels et contextuels des chances de participation à la Cohorte RECORD (accéder aux résultats de l'étude). Nous avons trouvé que les personnes qui résidaient à proximité des centres de santé, ceux qui provenaient de quartiers socialement favorisés et ceux qui habitaient dans des quartiers à faible densité de population avaient des chances plus élevées de participer à l'étude. Une analyse de la relation entre niveau socio-économique du quartier et diabète de type 2 a montré qu'il était possible de corriger certains de ces biais de sélection liés au quartier.

Données recueillies à l'inclusion

Quant aux données collectées à l'inclusion, la base d'analyse de l'Etude RECORD comprend d'une part l'ensemble des données de routine de l'examen de santé, c'est-à-dire :

  • les données du bilan biologique (NFS, hémoglobinémie, urée, créatininémie, glycémie, potassium, cholestérolémie, triglycérides, ASAT, gamma GT, albuminurie, glycosurie, hématurie, etc.) ;
  • la tension artérielle, un électrocardiogramme, la spirométrie, des mesures anthropométriques (poids, taille, tour de hanche, tour de taille, données d'impédancemétrie), un examen dentaire, un visiotest.

En plus de ces mesures, la taille des participants a été mesurée en position assise, permettant de calculer la longueur des jambes (voir par exemple Davey Smith G et al. Leg length, insulin resistance, and coronary heart disease risk: the Caerphilly Study. J Epidemiol Community Health. 2001;55:867-72).

Nous disposons également des données de trois questionnaires remplis en routine lors de l'examen de santé :

  • un questionnaire socio-administratif comprenant les informations suivantes : mode de recrutement, statut d'emploi, profession, niveau d'études, couverture sociale, statut d'occupation du logement, nombre d'enfants, difficultés financières, problèmes d'accès aux soins, activités récréatives et soutien social (accéder au questionnaire) ;
  • un questionnaire médical détaillé comprenant les des informations suivantes : expositions professionnelles, activité physique, consommation d'alcool et de tabac, antécédents personnels et familiaux, état de santé actuel et traitements (accéder au questionnaire) ;
  • un questionnaire psychologique comprenant notamment le QD2 de Pichot relatif à la symptomatologie dépressive et le questionnaire de Stress Perçu » de Cohen (accéder au questionnaire).

Les participants ont par ailleurs répondu à un questionnaire spécifique à l'étude RECORD (accéder au questionnaire). Celui-ci a été relu en présence des enquêtés par des enquêteurs spécifiquement formés pour le faire. Le questionnaire renseigne les aspects suivants :

  • adresse de résidence actuelle et précédente des participants ;
  • informations socio-économiques additionnelles : revenus du ménage et niveau d'étude des parents ;
  • connaissances de santé cardiovasculaire ;
  • perceptions et attitudes par rapport à la santé (importance accordée à la santé, lieux de contrôle interne ou externe, etc.) ;
  • activité physique récréative détaillée au cours des 7 derniers jours ;
  • temps de marche détaillés au cours des 7 derniers jours ;
  • vécu des participants au sein de leur quartier (attachement au quartier, sentiment d'appartenance, opinions au sujet du quartier, réputation du quartier et stigmatisation, sentiment de captivité résidentielle, insertion sociale au sein du quartier, activités associatives, confiance-méfiance et hostilité-bienveillance par rapport aux voisins, soutien social de la part du voisinage, impact du quartier sur le bien-être psychologique).

L'ensemble du protocole de recueil de données a été approuvé par la CNIL préalablement à tout recueil (accéder aux autorisations de la CNIL).

Appariement de données individuelles

Appariement des données de consommation de soins du SNIIR-AM

Nous avons reçu l'autorisation de la CNIL d'associer à chacun des participants des données sur l'ensemble des consommations de soins réalisées à partir de 2006 et remboursées par l'Assurance Maladie (accéder à l'autorisation de la CNIL).

Le numéro de Sécurité Sociale des participants de l'étude RECORD n'est en aucun cas accessible aux chercheurs de l'Inserm. Il n'existe que dans les fichiers du Centre d'Investigations Préventives et Cliniques (Centre IPC). En lien étroit avec la Direction de la Stratégie, des Etudes et des Statistiques de la CNAM-TS, un protocole détaillé d'appariement des données de l'Assurance Maladie à la Cohorte RECORD a été mis au point. Celui-ci fait intervenir le Centre IPC et différents services de la CNAM-TS localisés à Paris et Evreux afin de procéder à un double encryptage du numéro de Sécurité Sociale nécessaire à l'appariement. Ce protocole complexe garantit l'impossibilité pour les chercheurs de l'Inserm d'accéder au numéro de Sécurité Sociale. A chaque fois, la transmission des données de consommations de soins aux chercheurs de l'Inserm se fait par remise d'un CD en main propre.

Les données de consommation de soins des participants de l'étude concernent le médecin traitant choisi par la personne, les consultations de professionnels de santé, les actes médicaux et biologiques, les hospitalisations et les consommations médicamenteuses. Les mises en Affections de Longue Durée sont également renseignées.

Les données des années 2006–2008 ont d'ors-et-déjà été appariées à l'Etude RECORD et sont en cours d'analyse. Les données sont manipulées dans la confidentialité la plus absolue et ne sont accessibles qu'aux chercheurs de l'étude.

Appariement des données de mortalité

Les données de mortalité, puis les données de mortalité par cause, seront régulièrement appariées à la base de données RECORD.

Géocodage et appariement de données contextuelles

Lors de l'examen de santé, les participants ont indiqué leur adresse de résidence ainsi que leur adresse de résidence précédente. Au-delà, depuis le début de l'étude, nous effectuons un suivi des déménagements des participants. Un tel calendrier résidentiel nous permettra d'étudier les effets des environnements de résidence successifs des personnes sur leur santé.

La conformité de chacune de ces adresses a d'abord été vérifiée par comparaison à une base de données d'adresses de l'Insee (opération de normalisation des adresses). Les participants ont été systématiquement rappelés lorsque les adresses fournies étaient incomplètes ou n'étaient pas conformes aux référentiels géographiques à utiliser pour le géocodage. Les Départements de la Voirie ou d'Urbanisme d'un grand nombre de communes ont été sollicités en cas de difficultés pour localiser des adresses (notamment, pour les anciennes adresses, suite à des changements intervenus sur la voirie).

Avec le soutien de l'Insee, nous avons ensuite eu recours à l'application GEOLOC pour géocoder l'ensemble de ces adresses. L'avantage d'un recours à cette application est qu'elle permet, parce qu'étant adossée aux bases géographiques de l'Insee, d'attribuer les adresses à des zonages de types pâtés de maison ou petits quartiers (îlots et IRIS) de façon beaucoup plus fiable que les procédures de géocodage qui attribuent directement des coordonnées spatiales aux adresses. En plus de ces codes de zone, l'application GEOLOC permet d'attribuer aux adresses un code correspondant à la voie et des coordonnées spatiales (x, y). Nous remercions donc l'Insee, et particulièrement Jean-Luc Lipatz, de nous avoir permis d'accéder aux ressources logicielles de géocodage de l'Insee.

Les référentiels géographiques de l'Insee couvrent pour l'essentiel les communes de plus de 10000 habitants, correspondant à plus de 90% des adresses que nous avions à géocoder. Pour les adresses restantes, nous avons eu recours au Universal Geocoder de la société GeoConcept, que nous remercions chaleureusement, afin d'attribuer aux participants des coordonnées spatiales (x, y).

L'ensemble de ces opérations nous a permis d'attribuer des coordonnées spatiales (x, y) associées au lieu de résidence à 100% des participants de l'étude.

A partir de cette localisation précise des participants, il s'agit de tenir compte de leur quartier local de résidence, en suivant différentes approches complémentaires pour en délimiter l'espace (accéder à un de nos articles sur cette thématique). Au sein de ces quartiers, nous chercherons à mesurer un grand nombre de facteurs relatifs à l'environnement physique, à l'environnement de services et à l'environnement d'interactions sociales.

icone-link.png