P090 - L'approche fédérée permet-elle de préserver la valeur scientifique et statistique des résultats ? - 20/04/23
Résumé |
Introduction |
Les hôpitaux ont de plus en plus la volonté de valoriser leurs données et souhaitent limiter au maximum leur sortie en dehors de leur environnement. L'approche fédérée permet de générer des résultats agrégés à partir de plusieurs établissements de soin sans transfert des données. L'objectif de ce projet est d’évaluer si cette approche permet de conserver la valeur scientifique et statistique des résultats obtenus.
Méthodes |
Trois bases de données étanches (en silos) ont été constituées à partir des patientes de l’étude de vie réelle KADOR dans le cancer du sein précoce. Aucune donnée individuelle n'a quitté la plateforme de données intégrant les bases de données étanches et seules des données agrégées ont été générées à partir des fonctions d'analyse sous R et des fonctions d'agrégation disponibles dans DATASHIELD (Fig. 1). Statistiques descriptives, matrices de corrélation, analyses de survie et modèles de régression ont été réalisées sur les données brutes (base complète), reproduites sur chaque échantillon indépendant puis les résultats ont été agrégés afin de comparer les résultats obtenus.
Résultats |
Au total, 315 patients ont été inclus dans l’étude KADOR, 3 échantillons aléatoires de taille différente ont été générés (N1=157, N2=94, N3=64). Onze variables dérivées et 24 tables (103 items individuels/variables) ont été générées dans les rapports statistiques ; 100 % des variables dérivées ont pu être reproduites à partir de DATASHIELD et 93,9 % des items individuels ont été reproduits à partir des fonctions implémentées dans DATASHIELD: 100 % des 73 variables de statistiques descriptives, 89 % des 9 paramètres de la matrice de corrélation, 67 % des 12 paramètres des analyses de survie et 78 % des 9 paramètres du modèle de régression. Selon les méthodes d'agrégation disponibles dans DATASHIELD, les résultats obtenus peuvent différer par paramètre (par exemple les pourcentages et moyennes sont similaires, néanmoins les valeurs des quartiles peuvent différer).
Conclusion |
La comparaison des résultats a permis de montrer que la plupart des analyses ont pu être reproduites par requête fédérée implémentée dans DATASHIELD. Les résultats obtenus avec l'approche fédérée sont dépendants de la méthode d'agrégation utilisée. La création de fonction spécifique dans DATASHIELD peut permettre l'ajout de méthode d'agrégation supplémentaire (courbes de Kaplan-Meier notamment).
Mots clés |
Approche fédérée , Données de vie réelle , Datashield
Déclaration de liens d'intérêts |
D.Pau, C. Monteil, I. Diabate, C. Bachot sont employés par Roche SAS.
Le texte complet de cet article est disponible en PDF.Vol 71 - N° S2
Article 101734- mai 2023 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.