Prédiction de la survie sans métastase dans le cancer du sein primaire à partir de modèles de Cox de grande dimension - 25/04/15
Résumé |
Introduction |
L’étude de données d’expression issues des puces à ADN a permis d’identifier des signatures prédictives de la rechute métastatique dans le cancer du sein primaire. En général, les procédures de sélection appliquées en vue de réduire le nombre de gènes liés à la prédiction ne prennent pas en compte les corrélations. Dans le cadre de ce travail, nous proposons d’étudier les performances de méthodes de régression de grande dimension – CoxBoost, LASSO et Elastic net – dans l’identification de signatures pronostiques du statut métastatique de patientes atteintes d’un cancer du sein primaire.
Méthodes |
L’analyse a été menée sur trois jeux de données publiques et rétrospectives, correspondant à un total de 384 patientes atteintes d’un cancer du sein sans envahissement ganglionnaire. Le jeu d’apprentissage original de van’t Veer et al. (2002) a été utilisé pour déterminer les sets optimaux de gènes à partir d’une procédure automatique de sélection basée sur la cross-validation. Les classificateurs ont été construits à partir de seuils sur les prédicteurs linéaires issus des modèles sélectionnés correspondant à un taux de mal classés inférieur à 10 % dans le groupe de mauvais pronostic (pas de métastase dans les cinq premières années de suivi). La validation s’est faite sur les sets de van de Vijver et al. (2002) et de Desmedt et al. (2007), et les performances des classificateurs comparées à celles de la signature d’Amsterdam à 70 gènes.
Résultats |
La procédure de sélection a permis l’identification de sets de gènes prédictifs plus parcimonieux, jusqu’à six gènes seulement. Sur les deux jeux de validation, Elastic net, LASSO et CoxBoost ont conduit à la définition de signatures génomiques prédictives du statut métastatique à cinq ans avec des performances comparables. Sur la population de Desmedt, elles présentent des résultats respectifs de 59 %, 56 % et 54 % en précision globale, de 83 %, 75 % et 83 % en sensibilité, et de 53 %, 52 % et 48 % en spécificité. En comparaison, la signature d’Amsterdam a 45 % en précision globale, 97 % en sensibilité et 34 % en spécificité. Le recoupement des listes de gènes et les concordances de classifications entre les trois méthodes sont élevés. Toutes apportent une information pronostique significative en analyse multivariée avec les facteurs classiques (âge, diamètre tumoral, grade SBR, statuts ER et HER2). Les ontologies associées aux gènes surexprimés dans le groupe prédit de mauvais pronostic sont concordantes entre elles et sont majoritairement liées à la prolifération cellulaire. Les signatures rapportent également une très bonne sensibilité pour prédire le statut métastatique jusqu’à quatre ans de suivi.
Conclusion |
Puisqu’elles permettent la détection de sets de gènes relativement restreints et ainsi de faciliter leur application dans les essais cliniques, les méthodes de régression à grande dimension sont attrayantes et renforcent la robustesse des modèles sélectionnés en limitant le nombre de gènes prédisant à tort un mauvais pronostic. Avec seulement six gènes, la signature issue de CoxBoost prédit le statut métastatique à quatre ans avec 93 % de sensibilité dans le jeu de Desmedt. Ainsi, la sélection future de gènes liés à des ontologies différentes de la prolifération cellulaire pourrait éventuellement améliorer les performances en termes de sensibilité globale.
Ce travail a été soumis pour publication au journal Cancer Informatics le 2 décembre 2014 et a été financé par l’IRESP (AAR 2013–14).
Le texte complet de cet article est disponible en PDF.Mots clés : Cancer du sein, Génomique, MFS, Boosting, Cross-validation
Plan
Vol 63 - N° S2
P. S54 - mai 2015 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?