S'abonner

Mise en œuvre de la démarche FAIR en épidémiologie : choix et utilisation du standard de métadonnées DDI - 19/03/25

Doi : 10.1016/j.jeph.2025.202914 
Vally SELVARASA 1, Adel SAKHRI 1, Vincent BENOIT 1, Grégoire REY 1,
1 Inserm, UMS47, France Cohortes, France 

Auteur correspondant: (Grégoire REY)

Résumé

Introduction

La démarche FAIR offre un cadre pour optimiser la réutilisation des données, réduisant ainsi le gaspillage, augmentant les comparaisons, la reproductibilité et le partage des données aux niveaux national et international. La mise en œuvre de ces principes nécessite l'adoption de standards communs de données et de métadonnées. Nous nous concentrons ici sur les standards de métadonnées, essentiels pour décrire et découvrir les données. Bien que plusieurs standards existent, aucun n'est couramment utilisé en épidémiologie. Nous présentons notre démarche de sélection et d'utilisation de standards de métadonnées adaptés aux besoins des cohortes de France Cohortes.

Méthodes

L'épidémiologie se distingue par la diversité et la sensibilité des données personnelles, l'utilisation fréquente de questionnaires complexes et de mesures subjectives, et le besoin de connaître les sources de biais liées aux écarts de mesure. Un benchmark des standards a été réalisé pour objectiver le choix, en tenant compte des communautés utilisatrices et de l'outillage existant. Ensuite, des vocabulaires contrôlés ont été sélectionnés. Enfin, une standardisation des documentations existantes a été entreprise, utilisant des techniques de machine learning et des LLM pour classer automatiquement les variables dans des concepts, avec des reprises ciblées.

Résultats

Le standard DDI a été choisi pour répondre à ces besoins. Il est reconnu et adopté par les domaines de la statistique publique et des sciences humaines et sociales. Sa structure riche permet de documenter précisément le contexte et les modalités de recueil, ainsi que les variations de mesure d'un même concept. Le référentiel MeSH a été retenu comme vocabulaire contrôlé central pour catégoriser les concepts. L'application des méthodes basées sur les LLM est prometteuse.

Discussion/Conclusion

Le standard DDI est en cours d'utilisation dans le cadre du catalogue France Cohortes. La documentation obtenue offrira une base de connaissances aisément interopérable et facilitant une réutilisation des données respectant des critères d'intégrité scientifique.

Le texte complet de cet article est disponible en PDF.

Mots clés : FAIR, Documentation, Epidémiologie



© 2025  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 73 - N° S1

Article 202914- mars 2025 Retour au numéro
Article précédent Article précédent
  • Devenir des patients admis en réanimation avec une hémopathie maligne entre 2015 et 2021 : une étude de cohorte à partir du Système national des données de santé (SNDS)
  • Ana-Maria VILCU, Anne THIEBAUT, Lucas MORIN
| Article suivant Article suivant
  • Prévalence de la dénutrition et adéquation du codage PMSI à partir de l'enquête EPIDENUT
  • Aurélia RETBI, Jeanne COCAUL, Bastien GENET, Benjamin GRANGER, Pauline FAUCHER, Sophie TEZENAS DU MONTCEL, Pierre RUFAT

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.