Méthodologie pour identifier la structure hiérarchique des données : application aux grandes bases de données - 25/04/15
pages | 2 |
Iconographies | 0 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Introduction |
Choisir le modèle statistique approprié aux besoins de l’étude est déterminé par le type et la nature des données. Cependant, la structure hiérarchique des données reste encore peu évaluée pour définir le modèle statistique adapté. Dans de nombreux domaines, la population que l’on souhaite étudier s’intègre au sein de groupes plus vastes (des élèves regroupés dans des classes, des soins administrés dans des hôpitaux). Des méthodes ne tenant pas compte de cette structure hiérarchique peuvent être inadaptées et fournir des résultats biaisés. Le modèle multiniveau est un outil prenant en compte l’effet contextuel d’une étude mais, par manque de connaissance ou par manque de puissance, cette méthode reste peu utilisée. Dans le cadre d’une grande base de données extraite du système MédiHandTrace (évaluant, de façon informatisée, les pratiques d’hygiène des mains des soignants lors de leurs parcours de soin), notre objectif était d’identifier une structure hiérarchique des données, de la mesurer et en fonction du résultat de la prendre en compte dans les modèles statistiques.
Méthodes |
Au sein du service « maladies infectieuses et tropicales » de l’hôpital Nord de Marseille, le système MédiHandTrace a enregistré les parcours des soignants dans les chambres. Dans ce contexte, nous pouvons supposer une structure hiérarchique de nos données : les parcours (niveau 1) étant rattachés à un soignant (niveau 2a) et/ou à une chambre (niveau 2b). Nous avons mesuré la structure hiérarchique des données à l’aide d’un modèle logistique multiniveau vide, décrivant la répartition initiale de la variance entre les différents niveaux, à partir de trois critères : (1) le coefficient de corrélation intra-classe (ICC, mesurant la corrélation entre les parcours d’un même individu) ; (2) le critère d’information d’Akaike (AIC) de ce modèle vide, comparé à celui d’un modèle logistique vide ; (3) les résidus contextuels. Deux variables dépendantes d’intérêt ont été retenues pour typer les parcours des soignants et le respect des règles d’hygiène des mains : VD1=’Très acceptable/Inacceptable’ et VD2=« Acceptable/Inacceptable ».
Résultats |
Sur une période de six mois, notre analyse a porté sur 4629 parcours effectués par 50 soignants du service dans 7 chambres. Un niveau soignant a été mis en évidence pour nos deux variables dépendantes : (1) pour VD1, 42 % de la variation totale du respect au lavage des mains était attribuée à des différences entre les individus (ICC=0,42), avec un AIC du modèle logistique multiniveau de 1633, contre 2036,7 pour celui du modèle logistique, et le résidu contextuel du modèle vide était différent pour chaque individu ; (2) pour VD2, ICC=0,33, AIC du modèle logistique multiniveau=3543,1 contre 4036,5 pour celui du modèle logistique, et le résidu contextuel du modèle vide était différent pour chaque individu. En revanche, nous n’avons pas mis en évidence de niveau chambre pour nos deux variables dépendantes.
Conclusion |
Notre étude a permis d’identifier un niveau hiérarchique dans la structure de nos données parmi deux supposés a priori. Si elle peut paraître évidente, une structure hiérarchique n’est pas systématiquement recherchée ni prise en compte dans le modèle final. Détecter la pertinence de cette structure se teste pourtant avec une relative simplicité. Dans l’analyse de bases de grande dimension, du fait de la puissance statistique, le recours à des modèles multiniveaux devrait être plus systématiquement étudié.
Le texte complet de cet article est disponible en PDF.Mots clés : Multiniveau, Grande base de données, Modèle vide, Structure hiérarchique
Plan
Vol 63 - N° S2
P. S54-S55 - mai 2015 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?