Retour
CHAPITRE 7
Lecture automatisée des OCT à l'aide de l'intelligence artificielle

M. LAMARD,

G. QUELLEC,

B. COCHENER-LAMARD

Introduction
La lecture automatisée des clichés médicaux est une réalité depuis de nombreuses années dans certaines disciplines. Elle a ainsi trouvé sa place dans l'interprétation des mammographies et sert de second avis avec pertinence [ 1 ]. Actuellement, quelques outils d'interprétation des images ophtalmologiques sont déjà commercialisés et certains utilisent l'intelligence artificielle fondée sur l'apprentissage profond ( deep learning ). Les challenges sont pourtant importants, ces algorithmes doivent pouvoir s'adapter aux différentes marques d'appareil d'acquisition, au vieillissement des composants électroniques, aux données bruitées, mal acquises, et bien sûr à la variabilité des manifestations pathologiques des patients. Ce chapitre évoque rapidement les principes de l'intelligence artificielle et de l'apprentissage profond, propose un état de l'art de la recherche sur l'OCT et présente les résultats les plus importants actuellement disponibles ainsi que les perspectives à venir.
Principes de l'apprentissage profond
L'apprentissage profond hérite de recherches qui remontent aux années 1940 avec l'invention du neurone artificiel [ 2 ]. McCulloch et Pits ont modélisé le comportement d'un neurone biologique en utilisant des équations mathématiques simples. Ce neurone ( fig. 7-1
Fig. 7-1
Neurone biologique.Les entrées sont stockées dans un vecteur de nombres x. Il y a autant de poids synaptiques (w) que d'entrées, le neurone effectue une somme pondérée des entrées par les poids puis applique une fonction appelée fonction (φ). Le résultat est ensuite transmis à la sortie du neurone (γ).
) possède plusieurs entrées, où les informations sont stockées sous la forme de valeurs numériques. Elles sont pondérées grâce aux poids synaptiques puis transmises au noyau afin d'être traitées. Le résultat est ensuite envoyé vers la sortie.
Plusieurs de ces neurones ont été associés en réseau afin de créer des programmes pouvant apprendre à exécuter une tâche spécifique, comme la détection de lésions dans une image ( fig. 7-2
Fig. 7-2
Schéma d'un réseau de neurones.Les disques verts correspondent aux entrées du réseau, les bleus aux neurones artificiels des couches cachées, le jaune au neurone de sortie. Ce réseau est donc composé de 3 couches cachées de 5 neurones.
) [ 3 ]. Les données connues forment les entrées. L'information parcourt le réseau à travers les neurones, de gauche à droite afin, après de nombreux calculs, d'arriver à la sortie du réseau. Concernant l'OCT, les entrées peuvent être un volume 3D d'images ou une coupe de l'OCT et la sortie, une probabilité de présence de pathologies.
Pour apprendre, le programme doit, sur une base d'entraînement où pour chaque exemple l'interprétation clinique est connue, ajuster tous les poids synaptiques. Ces méthodologies ont évolué et des réseaux de neurones plus performants pour le traitement d'images sont apparus à la fin des années 1990 [ 4 ]. De nos jours, ces réseaux, appelés réseaux de neurones à convolutions, peuvent contenir des millions de neurones artificiels, organisés en plusieurs dizaines de couches. L'appellation « apprentissage profond » provient de la capacité du réseau à apprendre et du nombre important de couches cachées. Ces réseaux sont utilisés dans de nombreuses applications (recherche sur Internet, traduction, etc.) et bien entendu en ophtalmologie.
Revue de la littérature et résultats
L'analyse automatique des images OCT est assez ancienne. Une revue de la littérature [ 5 ], publiée en 2015, énumère des méthodes permettant le débruitage, le recalage ainsi que divers traitements sur les volumes OCT. Les algorithmes présentés ne font jamais appel à l'apprentissage profond. Les premières études utilisant cette méthodologie novatrice commencent à apparaître en 2016. Cette thématique se développe très rapidement au vu du nombre de communications dans les congrès récents. Dans ce chapitre, nous n'abordons que les algorithmes traitant les OCT en utilisant l'apprentissage profond.
En plus des applications précédentes, ces nouvelles études ont pour sujets principaux : la segmentation de structures ( fig. 7-3
Fig. 7-3
Exemple de segmentation des couches de la rétine.
et 7–4
Fig. 7-4
Exemple de segmentation d'une poche de fluide.
) et la classification ( fig. 7-5
Fig. 7-5
Exemple de classification d'une coupe OCT en normale ou anormale.
et 7–6
Fig. 7-6
Exemple de classification d'un volume OCT en normal ou anormal.
). L'objectif de la segmentation est de localiser et de détourer des éléments sur les clichés d'OCT permettant de quantifier précisément les structures étudiées. La classification donne un label à chaque volume/image comme pathologique/non pathologique sans en expliciter la raison sur des critères cliniques. Les algorithmes peuvent travailler coupe par coupe ou sur le volume 3D directement. Dans ces études, les résultats des algorithmes sont souvent comparés aux interprétations d'experts humains, mais aussi, dans certains cas seulement, aux logiciels déjà commercialisés. Les principales mesures de comparaison utilisées dans la littérature sont décrites sur les figures 7-7
Fig. 7-7
Principaux scores utilisés dans la littérature pour quantifier la qualité d'une segmentation ou d'une classification.
et 7–8
Fig. 7-8
Courbe ROC représentant la sensibilité en fonction de la spécificité.Plus l'aire sous la courbe ROC est proche de 1, meilleurs sont les résultats.
.
SEGMENTATION DES COUCHES DE LA RÉTINE
L'une des applications les plus anciennes est la segmentation des différentes couches de la rétine (voir fig. 7-3 ). Les études de la littérature proposent la segmentation d'un nombre variable de couches : 9 [ 6–9 ], 7 [ 7 ], 5 [ 8 ] et 3 [ 7 , 9 ]. Les évaluations sont effectuées sur un jeu de données en général assez limité en quantité, avec des pathologies non exhaustives. Cinquante volumes OCT (3 000 images) dont 25 provenant de patients atteints de dégénérescence maculaire liée à l'âge (DMLA) sont utilisés par Shah et al. [ 9 ]. Les autres équipes utilisent des bases plus petites : 1 140 images [ 10 ], 120 [ 7 ], 110 [ 11 ]. Les résultats sont comparés avec une segmentation manuelle et aussi avec les références du domaine comme Spectralis®, OCTExplorer®, DOCTRAP™, OCTRIMA™, AURA™, BERN™, IOWA™, etc. [ 6–9 ]. Tous les auteurs exposent de bons résultats et toujours des améliorations par rapport aux méthodes de référence. Les erreurs de positionnement des couches de la rétine sont en moyenne de 4,5 μm par rapport à la segmentation manuelle [ 9 ], He et al. [ 10 ] retrouvent même une erreur de 2,82 μm. Par ailleurs, la vitesse d'exécution est largement améliorée par rapport aux méthodes classiques : les calculs ne prennent en général pas plus de quelques secondes pour traiter un volume entier. En plus de la segmentation classique, Muhammad et al. [ 12 ] et Maetschke et al. [ 13 ] déterminent la présence d'un glaucome sans effectuer de segmentation explicite des couches de la rétine et directement sur les données brutes avec un pourcentage de classification correcte de 93,1 % pour le premier et une aire sous la courbe ROC ( receiver operating characteristic ) de 0,94 pour le second. Les bases utilisées sont respectivement de 102 yeux et 624 patients.
POCHE DE FLUIOE
La localisation et l'estimation du volume des poches de fluide sont aussi des sujets très populaires (voir fig. 7-4 ). Certaines études regroupent tous les types de poches de fluide, alors que d'autres font une distinction. Le coefficient de Dice est souvent utilisé pour quantifier la qualité de la segmentation : il correspond au taux de recouvrement de la segmentation automatique et de la vérité terrain obtenue par segmentation manuelle (voir fig. 7-7 ). En segmentant toutes les poches de fluide sans distinction, Venhuizen et al. [ 14 ] et Girish et al. [ 15 ] obtiennent un coefficient de Dice de 0,75 et 0,71, respectivement. Sur des systèmes d'acquisition variés, 0,73 est obtenu par Liu et al. [ 16 ] et 0,71 par Gopinath et al. [ 17 ]. Venhuizen et al. [ 14 ] ont utilisé 15 volumes et Girish et al. [ 15 ], 30 volumes. Liu et al. [ 16 ] ont étudié les données de la base publique RETOUCH ( https://retouch.grand-challenge.org/ ) et Morley et al. [ 18 ] ont choisi 1 200 volumes (400 DMLA, 400 œdèmes maculaires diabétiques, 400 occlusions veineuses).
En distinguant les poches de fluide, Yadav et al. [ 19 ] obtiennent 0,61-0,70-0,73 comme coefficient de Dice pour, respectivement, les fluides intrarétiniens, les fluides sous-rétiniens et les décollements d'épithélium pigmentaire. Des scores plus faibles (0,52-0,68-0,61) sont obtenus par Morley et al. [ 18 ].
Certains auteurs se concentrent sur un seul type de lésion comme Xu et al. [ 20 ], qui obtiennent un coefficient de Dice de 0,85 sur 50 patients atteints de décollements d'épithélium pigmentaire.
L'étude de l'œdème maculaire est aussi commune : un coefficient de Dice de 0,91 est obtenu par Lee et al. [ 21 ] avec 1 289 OCT; 328 cas sont utilisés par Vahadane et al. [ 22 ] pour un F1-score de 0,92. Des résultats plus faibles sont obtenus sur de petites bases par Perdomo et al. [ 23 ] et Bai et al. [ 24 ].
DÉGÉNÉRESCENCE MACULAIRE LIÉE À L'ÂGE
En complément des poches de fluide, certains auteurs proposent des solutions pour le dépistage de la DMLA. Cette classification permet d'identifier les cas pathologiques sans donner plus de précision clinique. Lee et al. [ 25 ] propose une étude sur de nombreux cas (52 690 normaux et 48 312 pathologiques) en obtenant une aire sous la courbe ROC de 0,928. Un score impressionnant de 0,997 sur une base 269 volumes de DMLA intermédiaire et 115 sujets normaux est obtenu par Apostolopoulos et al. [ 26 ]. Treder et al. [ 27 ] obtiennent aussi des résultats intéressants avec un pourcentage de classification correcte de 99,7 % sur des images pathologiques et de 92,0 % sur des images saines, sur un total de 1112 images utilisées.
Au sein de l'équipe du LaTIM (INSERM-UMR1101), nous avons conçu un algorithme de classification des lésions de la DMLA utilisant l'apprentissage profond [ 28 ] sur une base de données publique [ 29 ]. Nous obtenons des résultats parfaits avec des aires sous la courbe ROC égales à 1 pour les 3 classes. Ces résultats sont meilleurs que ceux de Kermany et al. [ 30 ] pour la néovascularisation choroïdienne (1,00), l'œdème maculaire (0,9987) et les drusen (0,9920).
DÉPISTAGE
Le dépistage, prenant en compte toutes les pathologies identifiables sur un volume OCT, est certainement un des objectifs les plus attendus. Kermany et al. [ 30 ] et De Fauw et al. [ 31 ] se sont attachés à ce problème en publiant des résultats quasi parfaits sur les suites à donner à l'examen (visite chez l'ophtalmologiste urgente, semi-urgente, examen de routine ou normale). En effet, les aires sous la courbe ROC atteignent 0,992 pour l'une des machines d'acquisition (Topcon 3D OCT-2000®, Topcon Medical System), permettant de dépister les cas les plus urgents [ 31 ], et même 0,999 pour Kermany et al. [ 30 ] (Spectralis OCT®, Heidelberg Engineering). Bien que la méthodologie, émanant de Google pour De Fauw et al. [ 31 ], soit originale et associant une phase de segmentation en 15 classes et une classification finale, les résultats sont surtout la conséquence de l'utilisation d'une base de données de très grande qualité. Seuls 1 109 volumes ont été utilisés, mais ils ont été interprétés chacun par 8 experts. La vérité terrain est donc quasiment parfaite et l'intelligence artificielle a pu apprendre plus facilement, car chaque lésion/pathologie était parfaitement décrite. Les très bons résultats de Kermany et al. [ 30 ] sont aussi dus à une base de données parfaitement interprétée.
DIVERS
Des algorithmes d'intelligence artificielle sont aussi utilisés pour d'autres tâches comme l'estimation du positionnement du capteur OCT [ 32 ], la segmentation de nerf optique [ 33 , 34 ] et des micro-vascularisations de la fovéa [ 35 ].
INTÉRÊT DE LA COMMUNAUTÉ D’INTELLIGENCE ARTIFICIELLE
L'intérêt pour cette modalité s'est concrétisé par l'organisation de deux concours internationaux, mettant en concurrence la communauté scientifique :
  • le concours RETOUCH (Retinal OCT Fluid Challenge – http://retouch.grand-challenge.org ) concernait la détection et la segmentation des poches de fluides. Huit participants ont travaillé sur les 112 volumes proposés. Les scores de segmentation du meilleur participant étaient de 0,61-0,70-0,73 pour le coefficient de Dice sur les 3 types de poches de fluide et pour la classification; des aires sous la courbe ROC de 0,85-0,84-0,87 ont été obtenues pour les mêmes lésions;
  • le concours ROCC (Retinal OCT Classification Challenge) concernait la détection de la rétinopathie diabétique. Le meilleur des 3 participants a obtenu un pourcentage de classification correcte pour chaque volume de 93,3 % et une sensibilité de 86,67 %.
Ces concours perdureront dans le temps par leur base de données qui, en général, reste disponible pour la communauté scientifique, permettant aux différentes équipes de comparer leurs travaux sur des données identiques. Quelques équipes, suite à une publication, proposent également leurs données en libre accès. Nous pouvons citer les travaux de Kermany et al. [ 30 ] qui mettent à disposition 84 495 coupes d'OCT classées en 4 catégories (normal, néovascularisation choroïdienne, œdème maculaire diabétique, drusen).
Conclusions et perspectives
L'activité de recherche concernant le traitement automatique des images OCT de la rétine maculaire n'est pas récente. Cette recherche bénéficie depuis 2006 de l'apport de réseaux de neurones à convolutions. Cette branche de l'intelligence artificielle est en train de révolutionner le traitement de l'information en général et donc aussi celui des OCT. Les objectifs de ces intelligences artificielles sont divers et concernent principalement la segmentation et la classification des structures et pathologies rétiniennes. Certains résultats sont extrêmement encourageants et même parfaits dans certains cas [ 29 , 31 ]. La comparaison des résultats des différentes études est souvent difficile à faire en raison de l'utilisation de bases de données différentes et souvent non publiques. Leur taille et leur qualité d'interprétation ont une large influence sur les résultats. Quoi qu'il en soit, même si ces recherches ont moins d'ancienneté et sont moins structurées que celles portant sur les rétinophotographies, les avancées proposées dans la littérature incitent à penser que leur arrivée dans les cabinets des ophtalmologistes est pour bientôt. Ces nouveaux outils vont pouvoir déterminer, avec beaucoup de précision, les diverses pathologies présentes, les localiser, les quantifier. Bien entendu, les recherches vont continuer et de nouveaux axes vont émerger. Nous pouvons imaginer que le suivi temporel du patient, la fusion d'informations diverses (OCT + fond d'œil) feront l'objet de toutes les attentions. D’autres outils pourront aussi pratiquer le dépistage de masse si l'accès aux OCT se démocratise. Le futur s'annonce passionnant avec certainement une évolution de la pratique médicale, permettant d'économiser beaucoup de temps dans l'interprétation des OCT.
BIBLIOGRAPHIE
1
Cherian AK, Poovammal E, Malathy C, Survey on mammographic detection and diagnosis of breast cancer, Int J Pharm Technol 2016; 8 : 5188 - 5197.
2
McCulloch WS, Pitts W, A logical calculus of the ideas immanent in nervous activity, Bull Math Biophys 1943; 5 : 115 - 133.
3
Rosenblatt F, The perceptron : a probabilistic model for information storage and organization in the brain, Psychol Rev 1958; 65 : 386 - 408.
4
LeCun Y, Bottou L, Bengio Y, Haffner P, Gradient-based learning applied to document recognition, Proc IEEE 1998; 86 : 2278 - 2323.
5
Baghaie A, Yu Z, D'Souza RM, State-of-the-art in retinal optical coherence tomography image analysis, Quant Imaging Med Surg 2015; 5 : 603 - 617.
6
Fang L, Cunefare D, Wang C, et al. Automatic segmentation of nine retinal layer boundaries in OCT images of non-exudative AMD patients using deep learning and graph search, Biomed Opt Express 2017; 8 : 2732 - 2744.
7
Hamwood J, Alonso-Caneiro D, Read SA, et al. Effect of patch size and network architecture on a convolutional neural network approach for automatic segmentation of OCT retinal layers, Biomed Opt Express 2018; 9 : 3049 - 3066.
8
Pekala M, Joshi N, Freund DE, et al. Deep Learning based Retinal OCT Segmentation, ArXiv:1801.09749 ; [cs.CV].
9
Shah A, Zhou LN, Abrámoff MD, Wu XA, Multiple surface segmentation using convolution neural nets : Application to retinal layer segmentation in OCT images, Biomed Opt Express 2018; 9 : 4509 - 4526.
10
He Y, Carass A, Jedynak BM, et al. Topology guaranteed segmentation of the human retina from OCT using convolutional neural networks, ArXiv:1803.05120v1 ; [cs.CV].
11
Roy AG, Conjeti S, Karri SPK, et al. Relaynet : retinal layer and fluid segmentation of macular optical coherence tomography using fully convolutional networks, Biomed Opt Express 2017; 8 : 3627 - 3642.
12
Muhammad H, Fuchs TJ, De C, et al. Hybrid deep learning on single wide-field optical coherence tomography scans accurately classifies glaucoma suspects, J Glaucoma 2017; 26 : 1086 - 1094.
13
Maetschke S, Antony B, Ishikawa H, et al. A feature agnostic approach for glaucoma detection in OCT volumes, ArXiv:1807.04855v2 ; [cs.CV].
14
Venhuizen FG, Van G, Liefers B, et al. Deep learning approach for the detection and quantification of intraretinal cystoid fluid in multivendor optical coherence tomography, Biomed Opt Express 2018; 9 : 1545 - 1569.
15
Girish GN, Thakur B, Chowdhury SR, et al. Segmentation of intra-retinal cysts from optical coherence tomography images using a fully convolutional neural network model, IEEE J Biomed Health Inform 2018;
16
Lu D, Heisler M, Lee S, et al. Retinal fluid segmentation and detection in optical coherence tomography images using fully convolutional neural network, ArXiv:1710.04778v1 ; [cs.CV].
17
Gopinath K, Sivaswamy J, Segmentation of retinal cysts from Optical Coherence Tomography volumes via selective enhancement, ArXiv:1708.06197v2 ; [cs.CV].
18
Morley D, Foroosh H, Shaikh S, Bagci U, Simultaneous detection and quantification of retinal fluid with deep learning, ArXiv:1708.05464v1 ; [cs.CV].
19
Yadav S, Gopinath K, Sivaswamy J, A generalized motion pattern and FCN based approach for retinal fluid detection and segmentation, ArXiv:1712.01073v1 ; [cs.CV].
20
Xu Y, Yan K, Kim J, et al. Dual-stage deep learning framework for pigment epithelium detachment segmentation in polypoidal choroidal vasculopathy, Biomed Opt Express 2017; 8 : 4061 - 4076.
21
Lee CS, Tyring AJ, Deruyter NP, et al. Deep-learning based, automated segmentation of macular edema in optical coherence tomography, Biomed Opt Express 2017; 8 : 3440 - 3448.
22
Vahadane A, Joshi A, Madan K, Dastidar TR, Detection of diabetic macular edema in optical coherence tomography scans using patch based deep learning, Biomedical Imaging (ISBI 2018), 2018 IEEE 15, 2018, IEEE , 1427 - 1430.
23
Perdomo O, Otalora S, Gonzalez FA, et al. OCT-NET : a convolutional network for automatic classification of normal and diabetic macular edema using sd-oct volumes, Biomedical Imaging (ISBI 2018), 2018 IEEE 15, 2018, IEEE , 1423 - 1426.
24
Bai F, Marques MJ, Gibson SJ, Cystoid macular edema segmentation of Optical Coherence Tomography images using fully convolutional neural networks and fully connected CRFs, ArXiv:1709.05324v1 ; [cs.CV].
25
Lee CS, Baughman DM, Lee AY, Deep learning is effective for the classification of OCT images of normal versus age-related macular degeneration OCT image, Ophtalmology Retina 2017; 1 : 322 - 327.
26
Apostolopoulos S, Ciller C, de Zanet D, et al. RetiNet : automatic AMD identification in OCT volumetric data, ArXiv:1610.03628v1 ; [cs.CV].
27
Treder M, Lauermann JL, Eter N, Automated detection of exudative age-related macular degeneration in spectral domain optical coherence tomography using deep learning, Graefes Arch Clin Exp Ophthalmol 2018; 256 : 259 - 265.
28
Quellec G, Charrière K, Boudi Y, et al. Deep image mining for diabetic retinopathy screening, Med Image Anal 2017; 39 : 178 - 193.
29
Thiery T, Detection automatisée par apprentissage profond de pathologies rétiniennes en tomographie par cohérence optique et en rétinophotographie, Brest 2018;
30
Kermany DS, Goldbaum M, Cai W, et al. Identifying medical diagnoses and treatable diseases by image-based deep learning, Cell 2018; 172 : 1122. ; 4.e9
31
De Fauw J, Ledsam JR, Romera-Paredes B, et al. Clinically applicable deep learning for diagnosis and referral in retinal disease, Nat Med 2018; 24 : 1342 - 1350.
32
Gessert N, Schlüter M, Schlaefer A, A deep learning approach for pose estimation from volumetric OCT data, Med Image Anal 2018; 46 : 162 - 179.
33
Devalla SK, Renukanand PK, Sreedhar BK, et al. DRUNET : a dilated-residual U-Net deep learning network to segment optic nerve head tissues in optical coherence tomography images, Biomed Opt Express 2018; 9 : 3244 - 3265.
34
Devalla SK, Chin KS, Mari JM, et al. A Deep learning approach to digitally stain optical coherence tomography images of the optic nerve head, Invest Ophthalmol Vis Sci 2018; 59 : 63 - 74.
35
Prentasic P, Heisler M, Mammo Z, et al. Segmentation of the foveal microvasculature using deep learning networks, J Biomed Opt 2016; 21 : 75008.