Analyse de sensibilité d’un modèle de prédiction pour estimer l’exhaustivité des bases de données des réclamations des médecins - 25/04/15
Résumé |
Introduction |
Les bases de données administratives de remboursement de médecins contiennent les informations concernant les consultations fournies aux patients par les médecins rémunérés à l’acte. Ces bases de données sont une source importante pour la recherche en santé et la surveillance des maladies chroniques. Cependant, une préoccupation croissante lors de l’utilisation de ces bases de données pour la recherche en santé et la surveillance des maladies chroniques est le potentiel de la capture incomplète des services médicaux rendus aux patients, particulièrement pour les médecins qui sont non rémunérés à l’acte, ce qui peut entraîner un biais de sélection. Des modèles de prédiction non linéaires basés sur la réclamation des médecins rémunérés à l’acte pourraient potentiellement être utilisés pour estimer la somme de la capture incomplète pour les médecins non rémunérés à l’acte. Notre objectif était d’utiliser les techniques de simulation pour évaluer les facteurs qui peuvent influencer la performance d’un modèle de régression non linéaire construit dans un échantillon de dérivation, puis appliqué à un échantillon externe indépendant.
Méthode |
Ces simulations ont été développées à partir d’un exemple réel dans lequel nous avons appliqué un modèle non linéaire aux données de réclamation des médecins rémunérés à l’acte de deux provinces canadiennes, ceci pour estimer l’exhaustivité des bases de données pour les médecins non rémunérés à l’acte. Ceci a été fait dans le contexte de l’estimation de la prévalence du diabète. Nous avons étudié l’impact des divers paramètres du modèle de simulation sur les estimations de la prévalence, incluant la taille de l’échantillon, la corrélation parmi les covariables et la distribution de covariables dans les deux populations. Le modèle correctement spécifié et le modèle mal spécifié ont été étudiés. La performance des modèles a été évaluée en utilisant l’erreur absolue moyenne (MAE), la racine carrée de l’erreur quadratique moyenne (RMSE), le pseudo-R2 et le pourcentage de biais dans les estimations des paramètres.
Résultats |
Dans chacun de ces modèles, lorsque la corrélation et la taille de l’échantillon augmentent le MAE, le RMSE et le nombre prédit de cas augmente aussi. Pour le modèle correctement spécifié et supposant que les variables ont été échantillonnées de la même distribution dans les deux populations, la plage de MAE était de 1,53 à 2,46 et pour le RMSE, elle était de 2,22 à 3,30. Dans le modèle mal spécifié, la plage de MAE était de 1,87 à 3,35 et pour le RMSE elle était de2,86 à 4,70. Pour presque tous les coefficients, la valeur absolue du biais augmente significativement lorsque la corrélation augmente. Lorsque les covariables étaient générées à partir de deux populations différentes, la performance du modèle était substantiellement mauvaise par rapport à lorsqu’elles étaient générées à partir de la même population.
Conclusion |
Les résultats soulignent l’importance de la spécification correcte du modèle, de l’évaluation de la colinéarité et des hypothèses à propos de la distribution des covariables dans l’échantillon de dérivation afin d’obtenir des résultats précis dans un échantillon de validation externe.
Le texte complet de cet article est disponible en PDF.Mots clés : Prévalence, Administrative Databases, Prediction Model, Completeness, Surveillance
Plan
Vol 63 - N° S2
P. S53 - mai 2015 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?