P132 - RUBY-THYRO - Un process d'intelligence artificielle pour structurer les données de santé en pathologie thyroïdienne - 20/04/23

Résumé |
Introduction |
La constitution de bases de données et la construction d'entrepôts de données de santé est un enjeu majeur pour tous les établissements de soins et de recherche. Actuellement, la majorité des bases sont constituées par extraction manuelle des informations, projet par projet. L'enjeu de cette collecte est particulièrement important en pathologie thyroïdienne. En effet, les nodules sont fréquents (50 % des personnes). Dans 90 % des cas, ils sont bénins et ne nécessitent pas de traitement. Pour identifier ces 10 % restant, l’évaluation du risque est basée sur une échographie et une cytoponction. Ces examens étant personne-dépendants, chaque centre doit comparer ses résultats aux standards internationaux issus de cohortes de plusieurs milliers de patients. Le nombre de patients par centre étant important, l'extraction de données de vie réelle est chronophage et non systématique. De plus, ces bases de données permettront de développer d'autres outils basés sur l'Intelligence artificielle (IA) afin d'estimer le risque de malignité. L'objectif de ce travail était d'appliquer des algorithmes d'IA par « Natural Language Processing » à des patients pris en charge pour une pathologie thyroïdienne et d’évaluer les performances de ce process.
Méthodes |
Les patients pris en charge pour une pathologie thyroïdienne au Centre Antoine Lacassagne ont été détectés par un réseau de neurones appliqué sur les comptes rendus (CR) de première consultation médicale. Parmi ces patients, certains ont été tirés au sort pour la construction de l'outil. Pour ces patients, une base de données a été réalisée manuellement. Les CR de 1ère consultation médicale, d’échographie, d'anesthésie, opératoire et anatomopathologique ont ensuite été extraits informatiquement. Après avoir identifié les caractéristiques cliniques nécessaires, les CR extraits ont été annotés via l'outil BRAT. La population a été scindée en deux groupes, un pour l'entrainement des algorithmes (80 %), l'autre pour le test (20 %). Les algorithmes de réseau de neurones convolutif SpaCy ont été appliqués. Les performances des informations extraites par Ruby-Thyro ont été comparées à la base de données manuelle en calculant le score F1 et l'accuracy.
Résultats |
Parmi les 9307 patients identifiés pour une pathologie thyroïdienne, 1000 ont été tirés au sort pour l'entrainement et le test du modèle. Trente-et-une variables d'intérêt ont été recueillies dans les différents comptes rendus et annotées [CE1]. Dans les comptes rendus d'anesthésie, pour les variables poids, taille, score ASA, la consommation de tabac, la présence d'une hypertension artérielle, la prise d'anticoagulant les performances étaient de 0,96, 0,87, 0,98, 0,63, 0,84, 0,71 pour le score F1 et 0,93, 0,80, 0,96, 0,86, 0,94, 0,96 pour l'accuracy, respectivement. Les performances pour les autres variables sont en cours d'analyse et seront exposées lors du congrès.
Conclusion |
Ces premiers résultats de performance mettent en évidence l'aide majeure de l'IA dans la collecte et la structuration automatique de bases de données. L'entrepôt de données généré pourra être utilisé pour des études rétrospectives ou être exploité pour la création d'un outil de prédiction de la malignité basé sur l'IA. Sa possibilité d’être utilisé en « temps réel » permettra également de simplifier nombre de tâches humaines chronophages et les erreurs associées. Par ailleurs, cette utilisation concluante en pathologie thyroïdienne, démontre la faisabilité de la transposition du modèle RUBY initialement conçu pour la pathologie sénologique.
Mots clés |
Intelligence artificielle, NLP, Extraction de données, Thyroïde
Déclaration de liens d'intérêts |
Les auteurs n'ont pas précisé leurs éventuels liens d'intérêts.
Le texte complet de cet article est disponible en PDF.Vol 71 - N° S2
Article 101781- mai 2023 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.