Using machine learning and electronic health record (EHR) data for the early prediction of Alzheimer's Disease and Related Dementias - 17/04/25

Doi : 10.1016/j.tjpad.2025.100169 
Sonia Akter a, #, Zhandi Liu b, #, Eduardo J. Simoes c, Praveen Rao a, b,
a Institute for Data Science and Informatics, University of Missouri, USA 
b Department of Electrical Engineering and Computer Science, University of Missouri, USA 
c Department of Biomedical Informatics, Biostatics and Medical Epidemiology, University of Missouri, USA 

Corresponding author at: Department of Electrical Engineering & Computer Science, University of Missouri, Columbia, USA.Department of Electrical Engineering & Computer ScienceUniversity of MissouriColumbiaUSA

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Sous presse. Épreuves corrigées par l'auteur. Disponible en ligne depuis le Thursday 17 April 2025
Cet article a été publié dans un numéro de la revue, cliquez ici pour y accéder

Highlights

Developed ML models for early ADRD prediction using de-identified EHR data.
GBT achieved AUC-ROC scores of 0.809–0.833 over 1–5-year prediction windows.
SHAP identified depression, age, heart disease, sleep apnea, and headache as risks.
Sleep apnea and headache were highlighted as novel risk factors for ADRD.
Early detection helps delay ADRD progression and improve patient outcomes.

Le texte complet de cet article est disponible en PDF.

Abstract

Background

Over 6 million patients in the United States are affected by Alzheimer's Disease and Related Dementias (ADRD). Early detection of ADRD can significantly improve patient outcomes through timely treatment.

Objective

To develop and validate machine learning (ML) models for early ADRD diagnosis and prediction using de-identified EHR data from the University of Missouri (MU) Healthcare.

Design

Retrospective case-control study.

Setting

The study used de-identified EHR data provided by the MU NextGen Biomedical Informatics, modeled with the PCORnet Common Data Model (CDM).

Participants

An initial cohort of 380,269 patients aged 40 or older with at least two healthcare encounters was narrowed to a final dataset of 4,012 ADRD cases and 119,723 controls.

Methods

Six ML classifier models: Gradient-Boosted Trees (GBT), Light Gradient-Boosting Machine (LightGBM), Random Forest (RF), eXtreme Gradient-Boosting (XGBoost), Logistic Regression (LR), and Adaptive Boosting (AdaBoost) were evaluated using Area Under the Receiver Operating Characteristic Curve (AUC-ROC), accuracy, sensitivity, specificity, and F1 score. SHAP (SHapley Additive exPlanations) analysis was applied to interpret predictions.

Results

The GBT model achieved the best AUC-ROC scores of 0.809–0.833 across 1- to 5-year prediction windows. SHAP analysis identified depressive disorder, age groups 80–90 yrs and 70–80 yrs, heart disease, anxiety, and the novel risk factors of sleep apnea, and headache.

Conclusion

This study underscores the potential of ML models for leveraging EHR data to enable early ADRD prediction, supporting timely interventions, and improving patient outcomes. By identifying both established and novel risk factors, these findings offer new opportunities for personalized screening and management strategies, advancing both clinical and informatics science.

Le texte complet de cet article est disponible en PDF.

Keywords : Alzheimer's disease, Dementias, Machine learning (ML), Electronic health record data, Early prediction


Plan


© 2025  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.