S'abonner

Performance of a Natural Language Processing Method to Extract Stone Composition From the Electronic Health Record - 30/09/19

Doi : 10.1016/j.urology.2019.07.007 
Cosmin A. Bejan a, Daniel J. Lee b, c, Yaomin Xu a, d, Ryan S. Hsi e,
a Department of Biomedical Informatics, Vanderbilt University Medical Center, Nashville, TN 
b Division of Urology, University of Pennsylvania Health System, Philadelphia, PA 
c Leonard Davis Institute of Health Economics, Philadelphia, PA 
d Department of Biostatistics, Vanderbilt University Medical Center, Nashville, TN 
e Department of Urology, Vanderbilt University Medical Center, Nashville, TN 

Address correspondence to: Ryan S. Hsi, M.D., Department of Urology, Vanderbilt University Medical Center, A-1302 Medical Center North, Nashville, TN 37232.Department of Urologic SurgeryVanderbilt University Medical CenterA-1302 Medical Center NorthNashvilleTN37232

ABSTRACT

Objectives

To demonstrate the utility of a natural language processing (NLP) algorithm for mining kidney stone composition in a large-scale electronic health records (EHR) repository.

Methods

We developed StoneX, a pattern-matching method for extracting kidney stone composition information from clinical notes. We trained the extraction algorithm on manually annotated text mentions of calcium oxalate monohydrate, calcium oxalate dihydrate, hydroxyapatite, brushite, uric acid, and struvite stones. We employed StoneX to identify patients with kidney stone composition data and mine >125 million notes from our institutional EHR. Analyses performed on the extracted patients included stone type conversions over time, survival analysis from a second stone surgery, and disease associations by stone composition to validate the phenotyping method against known associations.

Results

The NLP algorithm identified 45,235 text mentions corresponding to 11,585 patients. Overall, the system achieved positive predictive value >90% for calcium oxalate monohydrate, calcium oxalate dihydrate, hydroxyapatite, brushite, and struvite; except for uric acid (positive predictive value = 87.5%). Survival analysis from a second stone surgery showed statistically significant differences among stone types (P = .03). Several phenotype associations were found: uric acid-type 2 diabetes (odds ratio, OR = 2.69, 95% confidence intervals, CI = 1.91-3.79), struvite-neurogenic bladder (OR = 12.27, 95% CI = 4.33-34.79), struvite-urinary tract infection (OR = 7.36, 95% CI = 3.01-17.99), hydroxyapatite-pulmonary collapse (OR = 3.67, 95% CI = 2.10-6.42), hydroxyapatite-neurogenic bladder (OR = 5.23, 95% CI = 2.05-13.36), brushite-calcium metabolism disorder (OR = 4.59, 95% CI = 2.14-9.81), and brushite-hypercalcemia (OR = 4.09, 95% CI = 1.90-8.80).

Conclusion

NLP extraction of kidney stone composition from large-scale EHRs is feasible with high precision, enabling high-throughput epidemiological studies of kidney stone disease. These tools will enable high fidelity kidney stone research from the EHR.

Le texte complet de cet article est disponible en PDF.

Plan


 Funding Support: This study was supported by CTSA award no. UL1 TR002243 from the National Center for Advancing Translational Sciences. Its contents are solely the responsibility of the authors and do not necessarily represent official views of the National Center for Advancing Translational Sciences or the National Institutes of Health.
 Declarations of Interest: All authors have no conflict of interest to disclose.


© 2019  Elsevier Inc. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 132

P. 56-62 - octobre 2019 Retour au numéro
Article précédent Article précédent
  • AUTHOR REPLY
  • Bradley C. Holland, Tobias S. Köhler
| Article suivant Article suivant
  • Size is Not Everything That Matters: Preoperative CT Predictors of Stone Free After RIRS
  • Alexandre Danilovic, Bruno Aragão Rocha, Fabio Cesar Miranda Torricelli, Giovanni Scala Marchini, Carlos Batagello, Fabio Carvalho Vicentini, Olivier Traxer, Publio Cesar Cavalcante Viana, Miguel Srougi, William C. Nahas, Eduardo Mazzucchi

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.