CO10.4 - Méthodes de signatures pour l'inférence de données d'épidémiologie en temps réel - 20/04/23
Résumé |
Introduction |
Dans de nombreuses applications médicales, nous faisons face au traitement de données temporelles multidimensionnelles échantillonnées à des temps de mesure différents. Par exemple, lors d'une hospitalisation, les données biologiques et les signes vitaux sont mesurés à des temps différents et donc pour traiter ces informations ensemble, il faut utiliser une méthodologie adaptée. La signature d'une série temporelle est un outil issu de l'analyse stochastique popularisée par les travaux de Chen et Lyons [1,6]. A la manière de nombreuses méthodes d'extraction de features (ondelettes, transformée de Fourier, etc.), elle permet d'extraire de l'information de séries temporelles et de les représenter dans un espace commun. A la différence d'autres méthodes, elle s'adapte particulièrement bien au contexte multivarié dans lequel chaque individu est caractérisé par un signal temporel multidimensionnel échantillonné à des temps de mesure différents [4,3,7]
Méthodes |
Nous avons développé une modélisation à base de signature et d'une régression linéaire pénalisée ayant pour objectif de prédire l’évolution d'une série temporelle à partir de séries temporelles multivariées. Nous appliquons cet algorithme à l’étude de donnés d’épidémiologie collectées pendant la première vague de l’épidémie de COVID-19 issues de [8]. Notre méthode nous permet de prédire l’évolution du nombre d'admissions dans les hôpitaux des neuf régions françaises en temps réel à partir de données populationnelles (fréquentation de lieux publics, météo, couverture vaccinale) recueillies par Météo France, Google et différents services de santé publique.
Résultats |
Nous avons étudié les propriétés théoriques de l'estimateur issu de cette régression et apportons des garanties théoriques concernant cet estimateur. Sur les données COVID, nous obtenons une meilleure performance de notre algorithme comparativement aux méthodes concurrentes d’équations différentielles contrôlées neuronales [5], GRU [2] et de combinaisons d'estimateurs issus de modèles d'apprentissage statistique.
Conclusion |
Les signatures sont un outil performant pour analyser des données de santé.
Mots clés |
Apprentissage statistique , Epidémiologie , Signatures , Séries temporelles , Systèmes dynamiques
Déclaration de liens d'intérêts |
Les auteurs n'ont pas précisé leurs éventuels liens d'intérêts.
Le texte complet de cet article est disponible en PDF.Vol 71 - N° S2
Article 101630- mai 2023 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.