Développement d’un algorithme d’intelligence artificielle pour le diagnostic de mélanome à partir d’une banque d’images issues de la pratique courante - 20/11/21
Résumé |
Introduction |
Le diagnostic de mélanome est l’un des points les plus cruciaux de la prise en charge dermatologique. Récemment, le développement d’algorithmes de deep learning pour le diagnostic de tumeurs cutanées malignes et en particulier de mélanome amorce une révolution dans le diagnostic par le dermatologue. Cependant, la plupart des algorithmes des études publiées ont été développés sur des bases de données publiques. Nous avons développé un algorithme destiné au diagnostic de tumeurs cutanées malignes à partir des photographies de vie réelle, prises dans le cadre de soin.
Matériel et méthodes |
Les données utilisées pour le développement et la validation de l’algorithme sont la banque d’images dermoscopiques constituées dans le cadre du soin à l’hôpital Saint-Louis, comprenant 985 images dermoscopiques annotées pour le diagnostic par 2 médecins diplômés (aspect clinique, et résultat histologique pour les tumeurs malignes). La seconde base est la base publique de photos dermoscopiques ISIC comprenant 24 464 images dermoscopiques. Nous avons entraîné un algorithme (un réseau de neurones convolutif de type EfficientNet-B1) à l’identification des tumeurs malignes (TM) (mélanome, carcinomes) versus bénignes (naevus, HCF, tumeurs vasculaires bénignes) (TB), et au diagnostic de lésions mélanocytaires ou non mélanocytaires, au sein de la base locale. Nous avons évalué la performance de l’algorithme entre différentes bases de données en l’entrainant sur la base de données ISIC et en le testant sur la base locale.
Résultats |
Notre algorithme entrainé sur la base ISIC a une précision diagnostique (aire sous la courbe ROC) de 0,90 sur la base ISIC, et de 0,79 pour le diagnostic de TM vs TB sur notre base locale. Pour identifier les facteurs participant à cette baisse de performance, nous avons analysé 33 photos « mal classées » pour le diagnostic de tumeurs mélanocytaires ou non par l’algorithme. Les principales sources d’erreur sont les lentigos (classés en non mélanocytaire) et les CBC tatoués et les kératoses séborrhéiques (classé en mélanocytaire). L’analyse de 33 photos mal classées a permis d’identifier des erreurs récurrentes: biopsies antérieures remaniant la lésion (7), trait de crayon sur la photo (4), erreur d’annotation dans l’image (4), localisation muqueuse (1), erreur de diagnostic identique à celle du médecin prescripteur (8).
Discussion |
Le développement d’un algorithme sur une base de photos issues de la vie réelle permet d’identifier les facteurs pouvant altérer ses performances, et qu’il faudra prendre en compte lors du développement de ce type d’outils auprès des dermatologues. Le développement de l’algorithme va être poursuivi par un apprentissage fédéré entre différentes bases de données hospitalières pour améliorer ses performances.
Le texte complet de cet article est disponible en PDF.Mots clés : Algorithme, Intelligence artificielle, Mélanome, Réseau neuronal convolutif
Plan
Vol 1 - N° 8S1
P. A138-A139 - décembre 2021 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?