S'abonner

Validation of a generative artificial intelligence tool for the critical appraisal of articles on the epidemiology of mental health: its application in the Middle East and North Africa - 19/03/25

Doi : 10.1016/j.jeph.2025.202990 
MOUSSA Cheima 1, ALTAYYAR Sarah 1, VERGONJEANNE Marion 1, 2, GELLE Thibaut 1, , PREUX Pierre-Marie 1, 2
1 Inserm U1094, IRD UMR270, University Limoges, CHU Limoges, EpiMaCT - Epidemiology of chronic diseases in tropical zone, Institute of Epidemiology and Tropical Neurology, Omega-Health, Limoges, France 
2 CHU Limoges, Clinical Data and Research Center CDCR, Limoges, France 

Corresponding author. Thibaut Gellé, University Limoges, CHU Limoges, EpiMaCT - Epidemiology of chronic diseases in tropical zone, Institute of Epidemiology and Tropical Neurology, Omega-Health, Limoges, FranceUniversity LimogesCHU LimogesEpiMaCT - Epidemiology of chronic diseases in tropical zoneInstitute of Epidemiology and Tropical NeurologyOmega-HealthLimogesFrance
Sous presse. Manuscrit accepté. Disponible en ligne depuis le Wednesday 19 March 2025

Abstract

Mental health disorders have a high Disability-Adjusted Life Years in the Middle East and North Africa. This rise has led to a surge in related publications, prompting researchers to use AI tools like ChatGPT to reduce time spent on routine tasks. Our study aimed to validate an AI-assisted Critical Appraisal (CA) tool by comparing it with human raters.

We developed customized GPT models using ChatGPT-4. These models were tailored to evaluate studies using the Newcastle-Ottawa Scale (NOS) or the Jadad Scale in one model, while another model evaluated STROBE or CONSORT guidelines.

Our results showed a moderate to good agreement between human CA and our GPTs for the NOS for cohort, case control and cross-sectional studies and for the Jadad scale, with an ICC of 0.68 [95%CI: 0.24 - 0.82], 0.69 [95%CI: 0.31 - 0.88], 0.76 [95%CI: 0.47 - 0.90] and 0.84 [95%CI: 0.57 - 0.94] respectively. There was also a moderate to substantial agreement between the two methods for STROBE in cross sectional, cohort, case control studies, and for CONSORT in trial design, with a K of 0.63 [95%CI: 0.56 -,0.70], 0.57 [95%CI: 0.47 - 0.66], 0.48 [95%CI: 0.38 - 0.50] and 0.70 [95%CI: 0.63 - 0.77] respectively. Our custom GPT models produced hallucinations in 6.5% and 4.9% of cases, respectively. Human raters took an average of 19.6 ± 4.3 minutes per article, whereas our customized GPTs took only 1.4.

ChatGPT could be a useful tool for handling repetitive tasks yet its effective application relies on the critical expertise of researchers.

Le texte complet de cet article est disponible en PDF.

Keywords : artificial intelligence, ChatGPT, critical appraisal, mental health, MENA


Plan


© 2025  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.