Study Methodology
Population recruited at baseline
Recruitment and inclusion criteria
The 7290 participants of the RECORD Study were recruited between March 2007 and February 2008 during general health checkups of the National Health Insurance System conducted by the IPC Center in 4 different sites located in Paris, Argenteuil, Trappes and Mantes-la-Jolie. Due to the inclusion criteria:
- the participants were 30 to 79 year old at the baseline health examination;
- they were residing in one of the 112 a priori selected municipalities represented on the map provided here (access to the list of municipalities and Paris districts included in the study);
- the participants had to be able to answer themselves (or with minimal help) to the study questionnaire in French.
A priori selection of the municipalities
The selection of the municipalities to investigate in the RECORD Study was grounded on a subdivision of the territory into postal codes, which are systematically known for all of the patients of the IPC Center. In order to select the municipalities, we considered the number of patients of the IPC Center by postal codes in 2006. We retained the postal codes with at least 15000 people in the 1999 Census that provided the largest numbers of patients to the IPC Center in 2006 (in terms of numbers of patients per inhabitant or per IRIS neighborhood in the postal code). However, in this selection, the postal codes with the lowest median incomes were overrepresented.
As shown on the map reported here displaying median income per municipality in 2005, the RECORD sample includes both disadvantaged municipalilities (i.e., La Courneuve, Sarcelles, Mantes-la-Jolie, Evry, etc.) and highly socially advantaged municipalities (Versailles, Neuilly-sur-Seine, Le Vésinet, etc.). Moreover, the sample comprises very densely populated territories and less urbanized territories. Overall, the 1915 neighborhoods represented in the study cover a wide array of social and territorial situations, without which it would not be possible to investigate the effects of geographic life environments on health.
Selection biases related to the non-participation in the study
We proposed to all people visiting the health centers who fulfilled the three aforementioned inclusion criteria to participate in the RECORD Study. Among the people who were eligible according to their age and place of residence, 10.9% were excluded because of their inability to answer to a self-administered questionnaire in French. Specifically trained survey technicians explained the aims and the nature of the study to the selected participants. People who accepted to participate signed a consent form (access to the consent form). Among the people invited to participate, 83.6% completed the entire data collection protocol.
It is important to keep in mind that the RECORD participants do not exactly represent the population of the municipalities where they were living, for the 3 following reasons:
- the participants were recruited during their visit to the IPC Center for a health checkup, without a priori random selection in the general population;
- some of the eligible people were excluded because of their inability to fill the French self-administred questionnaire of the study;
- some of the persons invited to participate refused to enter the study or did not complete the data collection protocol.
Because of these selection biases, the proportion of people with a particular health problem or with a particular risk factor of diseases estimated from the RECORD Cohort may be incorrectly higher or lower than the true proportion in the population from the corresponding age groups and municipalities. A still more problematic issue given our research objectives is that, if the environmental exposures and health outcomes considered influence the odds of participation in the study, then the associations of interest between contextual factors and health may not accurately reflect the true associations as they exist in the source population.
However, in a number of analyses, it is possible to correct part of these selection biases through the appropriate adjustment of the statistical regression models. In order to do so, it is useful to identify the environmental variables, and ideally the health variables, that influence the odds of participation in the study. In a study, we therefore investigated the individual and neighborhood factors that were associated with the odds of participation in the RECORD Cohort (access to the findings of the study). We found that people living closer to the health centers, those from higher socioeconomic status neighborhoods, and those from more sparsely populated neighborhoods had higher odds of study participation. An investigation of the relationship between neighborhood socioeconomic status and type 2 diabetes showed that it was possible to correct some of these neighborhood-related selection biases.
Data collected at baseline
Regarding data collected at baseline, the database available for the analyses comprises the different information collected during the health checkup, including:
- biological data from a blood test and from a urinary test;
- blood pressure, an ECG, spirometry, anthropometric measures (weight, size, hip and waist circumference, impedancemetry data), data from a dental examination, and a vision test.
In addition, we measured participants' height in sitting position, which allowed us to determine leg length (see for example Davey Smith G et al. Leg length, insulin resistance, and coronary heart disease risk: the Caerphilly Study. J Epidemiol Community Health. 2001;55:867-72).
We also have data from 3 questionnaires that are filled by the patients of the health centers:
- a socio-administrative questionnaire comprising the following information: mode of recruitment, employment status, occupation, educational attainment, health insurance, housing tenure, number of children, financial strain, access to care, recreational activities, social support (questionnaire downloadable here);
- a detailed medical questionnaire comprising the following information: occupational circumstances, physical activity, alcohol consumption, smoking, personal and family history of diseases, current health status, and treatments (questionnaire downloadable here);
- a psychological questionnaire comprising the QD2A questionnaire of Pichot related to depressive symptomatology and the Perceived Stress Scale questionnaire of Cohen (questionnaire downloadable here).
The participants also filled a questionnaire specific to the RECORD Study (questionnaire downloadable here). The questionnaire was self-administered but was checked by trained survey technicians in presence of the participants. The questionnaire collected the following information:
- previous and current residential address of the participants;
- additional socioeconomic information: household income and parents' educational attainment;
- cardiovascular health-related knowledge;
- perceptions and attitudes towards health (priority given to health, external and internal locus of control, etc.);
- detailed information on recreational physical activity over the previous 7 days;
- detailed information on walking behavior over the previous 7 days;
- experiences made by individuals in their residential neighborhood (attachment to the neighborhood, feeling of belongingness, opinions and perceptions on the neighborhood, neighborhood reputation and stigmatisation, feelings of residential captivity, family, friends and acquaintances in the neighborhood, community participation, mistrust and hostility towards the neighbors, neighborhood-based social support, perceived impact of neighborhood on psychological well-being).
The data collection protocol has been approved by the French Data Protection Authority (CNIL) (download the authorization of CNIL).
Appariement de données individuelles
Appariement des données de consommation de soins du SNIIR-AM
Nous avons reçu l'autorisation de la CNIL d'associer à chacun des participants des données sur l'ensemble des consommations de soins réalisées à partir de 2006 et remboursées par l'Assurance Maladie (accéder à l'autorisation de la CNIL).
Le numéro de Sécurité Sociale des participants de l'étude RECORD n'est en aucun cas accessible aux chercheurs de l'Inserm. Il n'existe que dans les fichiers du Centre d'Investigations Préventives et Cliniques (Centre IPC). En lien étroit avec la Direction de la Stratégie, des Etudes et des Statistiques de la CNAM-TS, un protocole détaillé d'appariement des données de l'Assurance Maladie à la Cohorte RECORD a été mis au point. Celui-ci fait intervenir le Centre IPC et différents services de la CNAM-TS localisés à Paris et Evreux afin de procéder à un double encryptage du numéro de Sécurité Sociale nécessaire à l'appariement. Ce protocole complexe garantit l'impossibilité pour les chercheurs de l'Inserm d'accéder au numéro de Sécurité Sociale. A chaque fois, la transmission des données de consommations de soins aux chercheurs de l'Inserm se fait par remise d'un CD en main propre.
Les données de consommation de soins des participants de l'étude concernent le médecin traitant choisi par la personne, les consultations de professionnels de santé, les actes médicaux et biologiques, les hospitalisations et les consommations médicamenteuses. Les mises en Affections de Longue Durée sont également renseignées.
Les données des années 2006–2008 ont d'ors-et-déjà été appariées à l'Etude RECORD et sont en cours d'analyse. Les données sont manipulées dans la confidentialité la plus absolue et ne sont accessibles qu'aux chercheurs de l'étude.
Appariement des données de mortalité
Les données de mortalité, puis les données de mortalité par cause, seront régulièrement appariées à la base de données RECORD.
Géocodage et appariement de données contextuelles
Lors de l'examen de santé, les participants ont indiqué leur adresse de résidence ainsi que leur adresse de résidence précédente. Au-delà, depuis le début de l'étude, nous effectuons un suivi des déménagements des participants. Un tel calendrier résidentiel nous permettra d'étudier les effets des environnements de résidence successifs des personnes sur leur santé.
La conformité de chacune de ces adresses a d'abord été vérifiée par comparaison à une base de données d'adresses de l'Insee (opération de normalisation des adresses). Les participants ont été systématiquement rappelés lorsque les adresses fournies étaient incomplètes ou n'étaient pas conformes aux référentiels géographiques à utiliser pour le géocodage. Les Départements de la Voirie ou d'Urbanisme d'un grand nombre de communes ont été sollicités en cas de difficultés pour localiser des adresses (notamment, pour les anciennes adresses, suite à des changements intervenus sur la voirie).
Avec le soutien de l'Insee, nous avons ensuite eu recours à l'application GEOLOC pour géocoder l'ensemble de ces adresses. L'avantage d'un recours à cette application est qu'elle permet, parce qu'étant adossée aux bases géographiques de l'Insee, d'attribuer les adresses à des zonages de types pâtés de maison ou petits quartiers (îlots et IRIS) de façon beaucoup plus fiable que les procédures de géocodage qui attribuent directement des coordonnées spatiales aux adresses. En plus de ces codes de zone, l'application GEOLOC permet d'attribuer aux adresses un code correspondant à la voie et des coordonnées spatiales (x, y). Nous remercions donc l'Insee, et particulièrement Jean-Luc Lipatz, de nous avoir permis d'accéder aux ressources logicielles de géocodage de l'Insee.
Les référentiels géographiques de l'Insee couvrent pour l'essentiel les communes de plus de 10000 habitants, correspondant à plus de 90% des adresses que nous avions à géocoder. Pour les adresses restantes, nous avons eu recours au Universal Geocoder de la société GeoConcept, que nous remercions chaleureusement, afin d'attribuer aux participants des coordonnées spatiales (x, y).
L'ensemble de ces opérations nous a permis d'attribuer des coordonnées spatiales (x, y) associées au lieu de résidence à 100% des participants de l'étude.
A partir de cette localisation précise des participants, il s'agit de tenir compte de leur quartier local de résidence, en suivant différentes approches complémentaires pour en délimiter l'espace (accéder à un de nos articles sur cette thématique). Au sein de ces quartiers, nous chercherons à mesurer un grand nombre de facteurs relatifs à l'environnement physique, à l'environnement de services et à l'environnement d'interactions sociales.