S'abonner

Prédiction de la survie sans métastase dans le cancer du sein primaire à partir de modèles de Cox de grande dimension - 25/04/15

Doi : 10.1016/j.respe.2015.03.039 
C. Zemmour a, , F. Bertucci a, P. Finetti a, B. Chetrit a, D. Birnbaum a, T. Filleron b, J.-M. Boher a
a IPC, Marseille, France 
b Claudius-Regaud, Toulouse, France 

Auteur correspondant.

Résumé

Introduction

L’étude de données d’expression issues des puces à ADN a permis d’identifier des signatures prédictives de la rechute métastatique dans le cancer du sein primaire. En général, les procédures de sélection appliquées en vue de réduire le nombre de gènes liés à la prédiction ne prennent pas en compte les corrélations. Dans le cadre de ce travail, nous proposons d’étudier les performances de méthodes de régression de grande dimension – CoxBoost, LASSO et Elastic net – dans l’identification de signatures pronostiques du statut métastatique de patientes atteintes d’un cancer du sein primaire.

Méthodes

L’analyse a été menée sur trois jeux de données publiques et rétrospectives, correspondant à un total de 384 patientes atteintes d’un cancer du sein sans envahissement ganglionnaire. Le jeu d’apprentissage original de van’t Veer et al. (2002) a été utilisé pour déterminer les sets optimaux de gènes à partir d’une procédure automatique de sélection basée sur la cross-validation. Les classificateurs ont été construits à partir de seuils sur les prédicteurs linéaires issus des modèles sélectionnés correspondant à un taux de mal classés inférieur à 10 % dans le groupe de mauvais pronostic (pas de métastase dans les cinq premières années de suivi). La validation s’est faite sur les sets de van de Vijver et al. (2002) et de Desmedt et al. (2007), et les performances des classificateurs comparées à celles de la signature d’Amsterdam à 70 gènes.

Résultats

La procédure de sélection a permis l’identification de sets de gènes prédictifs plus parcimonieux, jusqu’à six gènes seulement. Sur les deux jeux de validation, Elastic net, LASSO et CoxBoost ont conduit à la définition de signatures génomiques prédictives du statut métastatique à cinq ans avec des performances comparables. Sur la population de Desmedt, elles présentent des résultats respectifs de 59 %, 56 % et 54 % en précision globale, de 83 %, 75 % et 83 % en sensibilité, et de 53 %, 52 % et 48 % en spécificité. En comparaison, la signature d’Amsterdam a 45 % en précision globale, 97 % en sensibilité et 34 % en spécificité. Le recoupement des listes de gènes et les concordances de classifications entre les trois méthodes sont élevés. Toutes apportent une information pronostique significative en analyse multivariée avec les facteurs classiques (âge, diamètre tumoral, grade SBR, statuts ER et HER2). Les ontologies associées aux gènes surexprimés dans le groupe prédit de mauvais pronostic sont concordantes entre elles et sont majoritairement liées à la prolifération cellulaire. Les signatures rapportent également une très bonne sensibilité pour prédire le statut métastatique jusqu’à quatre ans de suivi.

Conclusion

Puisqu’elles permettent la détection de sets de gènes relativement restreints et ainsi de faciliter leur application dans les essais cliniques, les méthodes de régression à grande dimension sont attrayantes et renforcent la robustesse des modèles sélectionnés en limitant le nombre de gènes prédisant à tort un mauvais pronostic. Avec seulement six gènes, la signature issue de CoxBoost prédit le statut métastatique à quatre ans avec 93 % de sensibilité dans le jeu de Desmedt. Ainsi, la sélection future de gènes liés à des ontologies différentes de la prolifération cellulaire pourrait éventuellement améliorer les performances en termes de sensibilité globale.

Ce travail a été soumis pour publication au journal Cancer Informatics le 2 décembre 2014 et a été financé par l’IRESP (AAR 2013–14).

Le texte complet de cet article est disponible en PDF.

Mots clés : Cancer du sein, Génomique, MFS, Boosting, Cross-validation


Plan


© 2015  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 63 - N° S2

P. S54 - mai 2015 Retour au numéro
Article précédent Article précédent
  • Variations géographiques du taux d’hospitalisations potentiellement évitables
  • G. Mercier, V. Georgescu, J. Bousquet
| Article suivant Article suivant
  • Méthodologie pour identifier la structure hiérarchique des données : application aux grandes bases de données
  • P. Reynier, A. Soto, S. Boudjema, P. Brouqui, R. Giorgi, J.-C. Dufour

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.