Hierarchical clustering based upon contextual alignment of proteins: a different way to approach phylogeny - 01/01/04
pages | 12 |
Iconographies | 3 |
Vidéos | 0 |
Autres | 0 |
Abstract |
We perform a computational study using a new approach to the analysis of protein sequences. The contextual alignment model, proposed recently by Gambin et al. (2002), is based on the assumption that, while constructing an alignment, the score of a substitution of one residue by another depends on the surrounding residues. The contextual alignment scores calculated in this model were used to hierarchical clustering of several protein families from the database of Clusters of Orthologous Groups (COG). The clustering has been also constructed based on the standard approach. The comparative analysis shows that the contextual model results in more consistent clustering trees. The difference, although small, is with no exception in favour of the contextual model. The consistency of the family of trees is measured by several consensus and agreement methods, as well as by the inter-tree distance approach. To cite this article: A. Gambin, P.P. Slonimski, C. R. Biologies 328 (2005).
Le texte complet de cet article est disponible en PDF.Résumé |
Nous avons utilisé dans notre étude un nouveau modèle dʼalignement des séquences protéiques, le modèle contextuel proposé par Gambin et al. (2002). Il postule que, lors de la construction dʼalignements, la substitution dʼun résidu par un autre dépend de la nature des résidus adjacents. Plusieurs familles protéiques de la base de données COG ont été examinées selon ce nouveau procédé. Il en résulte une classification hiérarchique des taxa microbiens. Les arbres phylogénétiques ainsi obtenus ont été comparés à ceux dérivés de procédés standards. Nous montrons que le modèle contextuel conduit à des hiérarchies qui sont plus cohérentes entre elles et plus conformes à la phylogénie. La différence, bien que petite, est systématique : le modèle contextuel, sans exception, améliore la cohérence entre les arbres phylogénétiques. Pour citer cet article : A. Gambin, P.P. Slonimski, C. R. Biologies 328 (2005).
Le texte complet de cet article est disponible en PDF.Keywords : Contextual sequence alignment, Hierarchical clustering, Phylogenetic tree, Consensus measures
Mots-clés : Alignement contextuel des séquences, Clustering hiérarchique, Arbre phylogénétique, Mesures consensuelles
Plan
Vol 328 - N° 1
P. 11-22 - janvier 2005 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?