Numéro |
Biologie Aujourd'hui
Volume 211, Numéro 3, 2017
|
|
---|---|---|
Page(s) | 239 - 244 | |
Section | La biologie computationnelle parle à la biologie expérimentale | |
DOI | https://doi.org/10.1051/jbio/2017030 | |
Publié en ligne | 7 février 2018 |
Article
De la variabilité des séquences à la prédiction structurale et fonctionnelle : modélisation de familles de protéines homologues
From sequence variability to structural and functional prediction: modeling of homologous protein families
Sorbonne Universités, UPMC Université Paris 06, CNRS, Biologie Computationnelle et Quantitative, Institut de Biologie Paris Seine,
75005
Paris, France
* Auteur correspondant : martin.weigt@upmc.fr
Reçu :
20
Novembre
2017
Grâce au séquençage de nouvelle génération, le nombre de génomes séquencés augmente rapidement, fournissant notamment de nombreux exemples de la variabilité des séquences de protéines homologues. Cet article traite de modèles probabilistes fondés sur les données pour les séquences protéiques, qui sont capables d'extraire une multitude d'informations à partir de données séquentielles, dont (i) des caractéristiques structurelles telles que les contacts inter-résidus formés dans la protéine repliée, (ii) les interfaces d'interaction et (iii) les effets phénotypiques des substitutions d'acides aminés dans les protéines.
Abstract
Thanks to next-generation sequencing, the number of sequenced genomes grows rapidly, providing in particular ample examples for the sequence variability between homologous proteins. This article discusses data-driven probabilistic sequence models, which are able to extract a multitude of information from sequence data alone, including (i) structural features like residue-residue contacts, which are formed in the folded protein, (ii) protein-protein interaction interfaces and (iii) phenotypic effects of amino-acid substitutions in proteins.
Mots clés : analyse de séquences de protéines / co-évolution / familles de protéines homologues / modélisation statistique de séquences protéiques
Key words: protein sequence analysis / coevolution / homologous protein families / data-driven probabilistic protein sequences
© Société de Biologie, 2018
Les statistiques affichées correspondent au cumul d'une part des vues des résumés de l'article et d'autre part des vues et téléchargements de l'article plein-texte (PDF, Full-HTML, ePub... selon les formats disponibles) sur la platefome Vision4Press.
Les statistiques sont disponibles avec un délai de 48 à 96 heures et sont mises à jour quotidiennement en semaine.
Le chargement des statistiques peut être long.