S'abonner

Clinical features-based machine learning models to separate sexually transmitted infections from other skin diagnoses - 30/03/24

Doi : 10.1016/j.jinf.2024.106128 
Nyi Nyi Soe a, b, Phyu Mon Latt a, b, Zhen Yu b, d, David Lee a, Cham-Mill Kim c, Daniel Tran c, Jason J. Ong a, b, Zongyuan Ge d, Christopher K. Fairley a, b, Lei Zhang e, a, b,
a Melbourne Sexual Health Centre, Alfred Health, Melbourne, Australia 
b Central Clinical School, Faculty of Medicine, Nursing and Health Sciences, Monash University, Melbourne, Australia 
c Melbourne Medical School, Faculty of Medicine, Dentistry and Health Sciences, The University of Melbourne, Melbourne, Australia 
d Monash e-Research Centre, Faculty of Engineering, Airdoc Research, Nvidia AI Technology Research Centre, Monash University, Melbourne, Australia 
e Clinical Medical Research Center, Children's Hospital of Nanjing Medical University, Nanjing, China 

Correspondence to: Clinical Medical Research Center, Children’s Hospital of Nanjing Medical University, Nanjing, Jiangsu Province 210008, China.Clinical Medical Research Center, Children’s Hospital of Nanjing Medical UniversityNanjingJiangsu Province210008China

Summary

Introduction

Many sexual health services are overwhelmed and cannot cater for all the individuals who present with sexually transmitted infections (STIs). Digital health software that separates STIs from non-STIs could improve the efficiency of clinical services. We developed and evaluated a machine learning model that predicts whether patients have an STI based on their clinical features.

Methods

We manually extracted 25 demographic features and clinical features from 1315 clinical records in the electronic health record system at Melbourne Sexual Health Center. We examined 16 machine learning models to predict a binary outcome of an STI or a non-STI diagnosis. We evaluated the models’ performance with the area under the ROC curve (AUC), accuracy and F1-scores.

Results

Our study included 1315 consultations, of which 36.8% (484/1315) were diagnosed with STIs and 63.2% (831/1315) had non-STI conditions. The study population predominantly consisted of heterosexual men (49.5%, 651/1315), followed by gay, bisexual and other men who have sex with men (GBMSM) (25.7%), women (21.6%) and unknown gender (3.2%). The median age was 31 years (intra-quartile range (IQR) 26–39). The top 5 performing models were CatBoost (AUC 0.912), Random Forest (AUC 0.917), LightGBM (AUC 0.907), Gradient Boosting (AUC 0.905) and XGBoost (AUC 0.900). The best model, CatBoost, achieved an accuracy of 0.837, sensitivity of 0.776, specificity of 0.831, precision of 0.782 and F1-score of 0.778. The key important features were lesion duration, type of skin lesions, age, gender, history of skin disorders, number of lesions, dysuria duration, anorectal pain and itchiness.

Conclusions

Our best model demonstrates a reasonable performance in distinguishing STIs from non-STIs. However, to be clinically useful, more detailed information such as clinical images, may be required to reach sufficient accuracy.

Le texte complet de cet article est disponible en PDF.

Highlights

Applied machine learning to differentiate STIs from non-STIs based on symptoms.
CatBoost model demonstrated highest performance in distinguishing STIs vs non-STIs.
Lesion duration and morphology were the most important predictors.
Requires prospective validation across diverse populations prior to clinical use.

Le texte complet de cet article est disponible en PDF.

Keywords : Sexually transmitted infections, Machine learning, Electronic health records


Plan


© 2024  The Author(s). Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 88 - N° 4

Article 106128- avril 2024 Retour au numéro
Article précédent Article précédent
  • Lymphopenia is associated with broad host response aberrations in community-acquired pneumonia
  • Susanne E. Doeleman, Tom D.Y. Reijnders, Sebastiaan C.M. Joosten, Alex R. Schuurman, Tjitske S.R. van Engelen, Jan Verhoeff, Valentine Léopold, Xanthe Brands, Bastiaan W. Haak, Jan M. Prins, Maadrika M.N.P. Kanglie, Inge A.H. van den Berk, Daniël R. Faber, Renée A. Douma, Jaap Stoker, Anno Saris, Juan J. Garcia Vallejo, W. Joost Wiersinga, Tom van der Poll
| Article suivant Article suivant
  • Ivermectin for COVID-19 in adults in the community (PRINCIPLE): An open, randomised, controlled, adaptive platform trial of short- and longer-term outcomes
  • Gail Hayward, Ly-Mee Yu, Paul Little, Oghenekome Gbinigie, Milensu Shanyinde, Victoria Harris, Jienchi Dorward, Benjamin R. Saville, Nicholas Berry, Philip H. Evans, Nicholas P.B. Thomas, Mahendra G. Patel, Duncan Richards, Oliver V. Hecke, Michelle A. Detry, Christina Saunders, Mark Fitzgerald, Jared Robinson, Charlotte Latimer-Bell, Julie Allen, Emma Ogburn, Jenna Grabey, Simon de Lusignan, FD Richard Hobbs, Christopher C. Butler, PRINCIPLE Trial Collaborative Group

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.