Utilisation de la PLS-DA pour la caractérisation de profils patients issus d'un clustering TAK© sur leur historique de traitement dans le Système national des données de santé - 20/04/23

Résumé |
Introduction |
Dans le cadre d'une étude observationnelle avec des données en vie réelle des bases du Système national des données de santé (SNDS) sur la dermatite atopique, une description de l'historique des séquences de traitements a été réalisée. En appliquant un algorithme de clustering non-supervisé prenant en compte la temporalité des traitements, quatre groupes de patients ont été identifiés issus du clustering de la méthode TAK©. L'objectif de cette analyse est de caractériser ces groupes de patients à travers leurs antécédents du parcours de soins en appliquant une méthode multivariée supervisée de réduction de l'espace: l'analyse discriminante des moindres carrés partiels (PLS-DA).
Méthodes |
La PLS-DA est une extension de l'analyse PLS où la variable de réponse qualitative (ici un des quatre groupes A, B, C et D issus du clustering allant de ceux les plus médicamentés à ceux ayant le moins de traitements avant l'inclusion) est remplacée par des variables indicatrices de ses classes. Ici la PLS-DA est appliquée sur un ensemble de 26 variables caractérisant la phase de pré-inclusion comprenant le nombre de consultations chez le généraliste, chez le dermatologue, consultations hospitalières, nombre d'hospitalisations, hospitalisations et arrêts de travail liés à la dermatite, entre autres. Elle permet de sélectionner des profils de patients à travers leurs variables de soins ayant les plus importantes valeurs de « loadings » (pondérations) quantifiant les contributions relatives de chacune des variables explicatives originales à chaque composante PLS-DA (ou profil). Pour chaque patient, un score quantifiant son adhésion au profil identifié est obtenu en multipliant pour chaque composante les variables originales par les pondérations. Le pouvoir discriminatoire de chaque variable est estimé grâce à la somme pondérée des corrélations au carré entre chaque composante PLS-DA et les variables de soins originales.
Résultats |
Quatre profils de patients ou composantes PLS-DA ont été identifiés avec une variabilité expliquée variant de 16 % à 6 %. Seul le premier profil a permis une discrimination entre les groupes de TAK, en particulier entre patients ayant eu reçu de longues séquences de traitements précédant l'entrée dans l’étude par rapport aux groupes avec peu de traitements (A versus C, D). Les patients ayant le plus haut score pour ce profil ont relativement plus de dispensations de médicaments et d'examens de laboratoire (spécifiques à la dermatite ou non), davantage de consultations chez le dermatologue que les sujets des groupes C et D du TAK qui ont plutôt tendance à consulter davantage de médecins généralistes. Le taux d'erreur de classification était élevé et ne pouvait permettre la réalisation de prédictions fiables.
Conclusion |
Cette étude a permis d'identifier des signatures de parcours de soins permettant de caractériser des groupes de patients aux trajectoires de traitements différentes. La PLS-DA a été utilisée à des fins de la sélection de caractéristiques et pour ses propriétés discriminatoires, elle pourrait dans un autre contexte être utilisée pour faire des prédictions de classes pour de nouvelles observations.
Le texte complet de cet article est disponible en PDF.Mots clés : Clustering, PLS-DA, Analyse discriminante, SNDS, Dermatite Atopique
Vol 71 - N° S2
Article 101800- mai 2023 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.