P089 - Création d'un système d'aide informatisée au codage CIM: choix de métrique et utilisation de la hiérarchie CIM - 20/04/23
Résumé |
Introduction |
Différentes versions de la CIM (Classification Internationale des Maladies) sont routinement utilisées dans plusieurs dizaines de pays pour l'annotation d'évènements de soins. En France notamment, l'annotation des séjours hospitaliers à l'aide de la CIM10-FR, par les cliniciens et/ou les services d'information médicale, est le pilier central du financement hospitalier à travers la tarification à l'activité (T2A). Pourtant le codage CIM est une tâche à la fois chronophage et difficile. Cette difficulté se traduit par une faible qualité des données, avec par exemple, une concordance inter-codeur estimée entre moyenne et pauvre pour les diagnostics principaux au niveau de détail requis pour la tarification. Il existe donc un triple enjeu pour la création de systèmes d'aide au codage: un gain de temps clinique, ainsi que l'amélioration de la qualité des données épidémiologiques pour la recherche et pour le financement du système de soin. Avec la publication de jeux de données hospitalières ouverts, de nombreux articles s'intéressant au codage CIM à partir de données du dossier clinique ont été publiés dans la dernière décennie. Néanmoins, ces publications étudient une grande variété d'algorithmes au moyen de métriques de performance et sur des sous-ensembles de données hétérogènes ciblant l'automatisation du codage plutôt que l'assistance au codage. A contre-pied de cette tendance, nous cherchons, par notre étude, à dégager plutôt les principes généraux pour la construction d'un système d'assistance informatisée au codage.
Méthodes |
Nous utilisons le jeu de données ouvert de réanimation MIMIC-III pour construire un système d'aide au codage CIM-9 basé sur les prescriptions médicamenteuses à l'aide d'un réseau de neurones séquentiel. Nous investigons dans un premier temps le choix de la métrique de performance à optimiser pour produire le système de recommandation de codes le plus performant. Dans un second temps, nous interrogeons l'intérêt de la pratique de filtrage (basé sur la fréquence et/ou catégories) des codes pour la construction de système d'aide au codage. Enfin, nous investigons également l'utilisation des propriétés hiérarchiques de la CIM à l'aide de réseaux de neurones pour la création d'un système d'aide au codage, en tirant parti de la corrélation des labels, en considérant le problème d'équilibre des classes et en utilisant explicitement les liens hiérarchiques.
Résultats |
Nos expériences montrent que la métrique de performance la plus couramment utilisée, la micro F1, est aussi la moins adaptée à la création d'un système d'aide au codage. Nos résultats suggèrent également qu'utiliser l'ensemble des codes, plutot qu'un sous-ensemble choisi, permet d'en retrouver un nombre plus important pour un même nombre de codes proposés. En effet, notre réseau de neurone permet d'extraire de l'information pour la quasi totaité des codes même lorsque leur fréquence est très faible ou leur lien avec la prise médicamenteuse insoupçonné. Enfin, nos résultats suggèrent également que l'utilisation de la hiérarchie des codes est bénéfique, notamment pour les niveaux les plus profonds de la hiérarchie.
Conclusion |
Notre approche permet de dégager des principes généraux pour la construction d'un système d'aide au codage ainsi que la quantification de ses perfomances. L'exploitation de ces principes nous permet de surpasser les performances de l'état de l'art utilisant les prescriptions médicamenteuses pour l'aide au codage.
Mots clés |
Computer assisted coding (CAC) , Recommender systems , Hierarchical multilabel classification (HMC) , International classification of diseases (ICD) , MIMIC-III
Déclaration de liens d'intérêts |
Les auteurs n'ont pas précisé leurs éventuels liens d'intérêts.
Le texte complet de cet article est disponible en PDF.Vol 71 - N° S2
Article 101733- mai 2023 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.

