Mise en œuvre de la démarche FAIR en épidémiologie : choix et utilisation du standard de métadonnées DDI - 19/03/25
Résumé |
Introduction |
La démarche FAIR offre un cadre pour optimiser la réutilisation des données, réduisant ainsi le gaspillage, augmentant les comparaisons, la reproductibilité et le partage des données aux niveaux national et international. La mise en œuvre de ces principes nécessite l'adoption de standards communs de données et de métadonnées. Nous nous concentrons ici sur les standards de métadonnées, essentiels pour décrire et découvrir les données. Bien que plusieurs standards existent, aucun n'est couramment utilisé en épidémiologie. Nous présentons notre démarche de sélection et d'utilisation de standards de métadonnées adaptés aux besoins des cohortes de France Cohortes.
Méthodes |
L'épidémiologie se distingue par la diversité et la sensibilité des données personnelles, l'utilisation fréquente de questionnaires complexes et de mesures subjectives, et le besoin de connaître les sources de biais liées aux écarts de mesure. Un benchmark des standards a été réalisé pour objectiver le choix, en tenant compte des communautés utilisatrices et de l'outillage existant. Ensuite, des vocabulaires contrôlés ont été sélectionnés. Enfin, une standardisation des documentations existantes a été entreprise, utilisant des techniques de machine learning et des LLM pour classer automatiquement les variables dans des concepts, avec des reprises ciblées.
Résultats |
Le standard DDI a été choisi pour répondre à ces besoins. Il est reconnu et adopté par les domaines de la statistique publique et des sciences humaines et sociales. Sa structure riche permet de documenter précisément le contexte et les modalités de recueil, ainsi que les variations de mesure d'un même concept. Le référentiel MeSH a été retenu comme vocabulaire contrôlé central pour catégoriser les concepts. L'application des méthodes basées sur les LLM est prometteuse.
Discussion/Conclusion |
Le standard DDI est en cours d'utilisation dans le cadre du catalogue France Cohortes. La documentation obtenue offrira une base de connaissances aisément interopérable et facilitant une réutilisation des données respectant des critères d'intégrité scientifique.
Le texte complet de cet article est disponible en PDF.Mots clés : FAIR, Documentation, Epidémiologie
Vol 73 - N° S1
Article 202914- mars 2025 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?