S'abonner

Suivi temporel de clusters de patients pour extraire les informations à partir des bases de données médico-administratives - 24/02/23

Doi : 10.1016/j.respe.2023.101442 
J. Lambert 1, , A-L. Leutenegger 2, A-S. Jannot 3, A. Baudot 4
1 Inserm, Université Paris Cité, PariSanté Campus, équipe HeKA, UMR1138, Paris, France 
2 Inserm, Université Paris Cité, NeuroDiderot, UMR1141, Paris, France 
3 Inserm, Université Paris Cité, équipe HeKA, UMR1138, Medical Informatic and Public Health, HEGP, Paris, France 
4 Aix Marseille Université, Inserm, MMG, UMR1251, Marseille, France 

Auteur correspondant

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Résumé

Introduction

L'identification de clusters (sous-groupes) de patients à partir des bases de données médico-administratives est particulièrement importante pour mieux comprendre l'hétérogénéité des maladies et des parcours de soin. Cependant, ces bases de données sont complexes car elles contiennent différents types de variables longitudinales qui sont mesurées à différentes périodes, générant ainsi des données tronquées. Les données tronquées représentent une limite importante dans les méthodes classiques de clustering longitudinal. En effet, les patients ayant de telles données doivent être retirés de l'analyse ou leurs données doivent être imputées. Dans notre étude, nous avons développé deux nouvelles approches permettant d'identifier des clusters de patients à partir des données longitudinales tronquées contenues dans les bases de données médico-administratives ne nécessitant ni exclusion de patients ni imputation.

Méthodes

Les deux approches que nous avons développées sont basées sur une stratégie appelée cluster tracking. Les clusters sont d'abord identifiés à chaque pas de temps, puis sont suivis au cours du temps. L'identification des clusters se fait directement à partir des données brutes dans la première approche alors qu'elle se fait via des réseaux de patients construits à partir des données brutes dans la deuxième approche. Le suivi des clusters, identique pour les deux approches, repose sur l'identification des patients en commun entre deux clusters de temps consécutifs. Nous avons utilisé ces approches pour analyser les médicaments antithrombotiques prescrits entre 2008 et 2018 contenues dans l’Échantillon généraliste des bénéficiaires (EGB), une cohorte nationale française. Nous avons également comparé ces approches avec trois méthodes classiques de clustering longitudinal.

Résultats

Nos deux approches nous ont permis d'identifier des trajectoires de clusters correspondant à des pathologies identifiées par ailleurs. Elles ont aussi permis de mettre en évidence des clusters de patients plus homogènes par rapport aux trois méthodes classiques de clustering longitudinal.

Discussion/Conclusion

Nous proposons des approches basées sur le cluster tracking pour prendre en compte les données longitudinales tronquées contenues dans les bases de données médico-administrative et ainsi améliorer la quantité d'information extraite.

Mots-clés

Clustering longitudinal ; Cluster tracking ; Trajectoire de clusters ; Bases de données médico-administratives ; Réseaux de patients

Déclaration de liens d'intérêts

Les auteurs déclarent ne pas avoir de liens d'intérêts.

Le texte complet de cet article est disponible en PDF.

© 2023  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 71 - N° S1

Article 101442- mars 2023 Retour au numéro
Article précédent Article précédent
  • Comparaisons des pathologies et recours aux soins déclarés en enquête avec les données médico-administratives des répondants
  • C. Luzy, J-B. Hazo, A. Leduc
| Article suivant Article suivant
  • Facteurs de confusion non mesurés : quels designs et méthodes adopter ?
  • E. Herquelot, N. Assi, C. Vabre, F. Raguideau, A. Panes

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2026 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.