Pièges et mésusages en analyse de données - 19/11/23
Pitfalls and misuse in data analysis
Résumé |
L’analyse de données est une des pierres angulaires de la recherche biomédicale et de la médecine fondée sur les preuves. Les conclusions qu’elle produit et le corpus d’applications sanitaires qui en découlent sont cependant fragilisés par une diversité de pièges statistiques, erreurs communes et mauvaises pratiques méthodologiques tolérées. La persistance de ces écueils dans la littérature altère la nature des interprétations et constitue un frein aux découvertes et consensus scientifiques. Dans le contexte de flux massif et croissant de publications et de résultats non expertisés (prépublications, communications sur les réseaux sociaux), la rigueur méthodologique et une solide formation statistique sont plus que jamais les meilleurs remparts à une crise de reproductibilité et de confiance. Dans cet article, nous nous appuyons sur la littérature méthodologique récente pour passer en revue les principaux écueils méthodologiques, qu’ils soient bien connus comme ceux relatifs à la significativité ou à la multiplicité de comparaison, ou moins familiers comme la dichotomisation, la sélection de variable ou les problèmes d’autocorrélation spatiales et temporelles. Cette démarche s’inscrit dans une longue série de mises au point et rappels initiée depuis plusieurs décennies par la communauté méthodologique pour maintenir un niveau de maîtrise et de critique indispensable à la fiabilité de la recherche biomédicale.
Le texte complet de cet article est disponible en PDF.Summary |
Data analysis is one of the cornerstones of biomedical research and evidence-based medicine. However, the conclusions it produces and the body of health applications derived from it are undermined by a variety of statistical pitfalls, common errors, and tolerated methodological malpractice. The persistence of these pitfalls in the literature alters the nature of interpretations and acts as a brake on scientific discoveries and consensus. In the context of a massive and growing flow of publications and non-expertised results (pre-publications, communications on social networks), methodological rigor and solid statistical training are more than ever the best bulwarks against a crisis of reproducibility and confidence. In this article, we draw on recent methodological literature to review the main methodological pitfalls, be they well-known ones such as those relating to the significance or the multiplicity of comparisons, or less familiar ones such as dichotomisation, variable selection, or problems of spatial and temporal auto-correlation. This approach is part of a long series of refinements and reminders initiated several decades ago by the methodological community to maintain a level of control and criticism that is essential to the reliability of biomedical research.
Le texte complet de cet article est disponible en PDF.Mots clés : Méthodologie, Mythes statistiques, Erreurs de raisonnements, Reproductibilité, Biais, Significativité
Keywords : Methodology, Statistical myths, Fallacies, Reproducibility, Bias, Significance
Plan
Vol 9 - N° 5-6
P. 440-450 - novembre 2023 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?