S'abonner

Méthodologie pour identifier la structure hiérarchique des données : application aux grandes bases de données - 25/04/15

Doi : 10.1016/j.respe.2015.03.040 
P. Reynier a, , A. Soto b, S. Boudjema b, c, P. Brouqui b, c, R. Giorgi a, d, J.-C. Dufour a, d
a Aix-Marseille université, UMR912 SESSTIM (AMU-Inserm-IRD-AMSE), Marseille, France 
b Infectious Disease Unit CHU Nord, AP–HM, Marseille, France 
c Aix-Marseille université, URMITE, UM63, CNRS 7278, IRD 198, Inserm 1095, Marseille, France 
d AP–HM, BIOSTIC, pôle de santé publique, Marseille, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 2
Iconographies 0
Vidéos 0
Autres 0

Résumé

Introduction

Choisir le modèle statistique approprié aux besoins de l’étude est déterminé par le type et la nature des données. Cependant, la structure hiérarchique des données reste encore peu évaluée pour définir le modèle statistique adapté. Dans de nombreux domaines, la population que l’on souhaite étudier s’intègre au sein de groupes plus vastes (des élèves regroupés dans des classes, des soins administrés dans des hôpitaux). Des méthodes ne tenant pas compte de cette structure hiérarchique peuvent être inadaptées et fournir des résultats biaisés. Le modèle multiniveau est un outil prenant en compte l’effet contextuel d’une étude mais, par manque de connaissance ou par manque de puissance, cette méthode reste peu utilisée. Dans le cadre d’une grande base de données extraite du système MédiHandTrace (évaluant, de façon informatisée, les pratiques d’hygiène des mains des soignants lors de leurs parcours de soin), notre objectif était d’identifier une structure hiérarchique des données, de la mesurer et en fonction du résultat de la prendre en compte dans les modèles statistiques.

Méthodes

Au sein du service « maladies infectieuses et tropicales » de l’hôpital Nord de Marseille, le système MédiHandTrace a enregistré les parcours des soignants dans les chambres. Dans ce contexte, nous pouvons supposer une structure hiérarchique de nos données : les parcours (niveau 1) étant rattachés à un soignant (niveau 2a) et/ou à une chambre (niveau 2b). Nous avons mesuré la structure hiérarchique des données à l’aide d’un modèle logistique multiniveau vide, décrivant la répartition initiale de la variance entre les différents niveaux, à partir de trois critères : (1) le coefficient de corrélation intra-classe (ICC, mesurant la corrélation entre les parcours d’un même individu) ; (2) le critère d’information d’Akaike (AIC) de ce modèle vide, comparé à celui d’un modèle logistique vide ; (3) les résidus contextuels. Deux variables dépendantes d’intérêt ont été retenues pour typer les parcours des soignants et le respect des règles d’hygiène des mains : VD1=’Très acceptable/Inacceptable’ et VD2=« Acceptable/Inacceptable ».

Résultats

Sur une période de six mois, notre analyse a porté sur 4629 parcours effectués par 50 soignants du service dans 7 chambres. Un niveau soignant a été mis en évidence pour nos deux variables dépendantes : (1) pour VD1, 42 % de la variation totale du respect au lavage des mains était attribuée à des différences entre les individus (ICC=0,42), avec un AIC du modèle logistique multiniveau de 1633, contre 2036,7 pour celui du modèle logistique, et le résidu contextuel du modèle vide était différent pour chaque individu ; (2) pour VD2, ICC=0,33, AIC du modèle logistique multiniveau=3543,1 contre 4036,5 pour celui du modèle logistique, et le résidu contextuel du modèle vide était différent pour chaque individu. En revanche, nous n’avons pas mis en évidence de niveau chambre pour nos deux variables dépendantes.

Conclusion

Notre étude a permis d’identifier un niveau hiérarchique dans la structure de nos données parmi deux supposés a priori. Si elle peut paraître évidente, une structure hiérarchique n’est pas systématiquement recherchée ni prise en compte dans le modèle final. Détecter la pertinence de cette structure se teste pourtant avec une relative simplicité. Dans l’analyse de bases de grande dimension, du fait de la puissance statistique, le recours à des modèles multiniveaux devrait être plus systématiquement étudié.

Le texte complet de cet article est disponible en PDF.

Mots clés : Multiniveau, Grande base de données, Modèle vide, Structure hiérarchique


Plan


© 2015  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 63 - N° S2

P. S54-S55 - mai 2015 Retour au numéro
Article précédent Article précédent
  • Prédiction de la survie sans métastase dans le cancer du sein primaire à partir de modèles de Cox de grande dimension
  • C. Zemmour, F. Bertucci, P. Finetti, B. Chetrit, D. Birnbaum, T. Filleron, J.-M. Boher
| Article suivant Article suivant
  • Utilisation de la méta-analyse par comparaison indirecte pour répondre à une question clinique jamais résolue : quelle dose d’énoxaparine dans la prévention des événements thromboemboliques veineux après chirurgie orthopédique ?
  • C. Chapelle, P. Mismetti, M. Cucherat, S. Laporte

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.