| Titre : |
Concepts et méthodes en phylogénie moléculaire |
| Type de document : |
texte imprimé |
| Auteurs : |
Guy PERRIERE, Auteur ; Céline BROCHIER-ARMANET, Auteur |
| Editeur : |
Springer |
| Année de publication : |
2010 |
| Collection : |
IRIS |
| Importance : |
250 p. |
| Format : |
25 cm. |
| ISBN/ISSN/EAN : |
978-2-287-99047-2 |
| Note générale : |
index |
| Langues : |
Français (fre) |
| Catégories : |
BIOLOGIE:biologie cellulaire et moléculaire
|
| Index. décimale : |
20-03 Biologie cellulaire et moléculaire |
| Résumé : |
Sommaire:
1 Notions élémentaires, définitions 1
1.1 Les données . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Séquences biologiques . . . . . . . . . . . . . . . . . 1
1.1.2 Séquences homologues . . . . . . . . . . . . . . . . . 5
1.2 Alignement de séquences . . . . . . . . . . . . . . . . . . . 8
1.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.2 Alignement de deux séquences . . . . . . . . . . . . 9
1.2.3 Alignements multiples . . . . . . . . . . . . . . . . . 13
1.2.4 Choix des sites . . . . . . . . . . . . . . . . . . . . . 15
1.3 Arbres phylogénétiques . . . . . . . . . . . . . . . . . . . . 16
1.3.1 Définition et structure . . . . . . . . . . . . . . . . . 16
1.3.2 L’arbre caché dans la forêt . . . . . . . . . . . . . . 17
1.3.3 Longueur des branches . . . . . . . . . . . . . . . . . 19
1.3.4 Codage informatique . . . . . . . . . . . . . . . . . . 19
1.3.5 Enracinement . . . . . . . . . . . . . . . . . . . . . . 20
1.3.6 Distance topologique . . . . . . . . . . . . . . . . . . 22
1.3.7 Vocabulaire spécifique . . . . . . . . . . . . . . . . . 24
2 Modèles d’évolution moléculaire 27
2.1 Divergence observée . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Séquences nucléotidiques . . . . . . . . . . . . . . . . . . . 29
2.2.1 Modélisation markovienne de l’évolution . . . . . . . 29
2.2.2 Modèle de Jukes et Cantor . . . . . . . . . . . . . . 36
2.2.3 Modèle de Kimura à deux paramètres . . . . . . . . 38
2.2.4 Autres modèles courants . . . . . . . . . . . . . . . . 42
2.3 Distances synonymes et non synonymes . . . . . . . . . . . 48
2.3.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.2 Méthode de Nei et Gojobori . . . . . . . . . . . . . . 50
2.3.3 Méthode de Nei et Gojobori modifiée . . . . . . . . 53
2.3.4 Méthode de Li, Wu et Luo . . . . . . . . . . . . . . 55
2.4 Séquences protéiques . . . . . . . . . . . . . . . . . . . . . 61
2.4.1 Modèle de Poisson . . . . . . . . . . . . . . . . . . . 61
2.4.2 Modèle PAM et assimilés . . . . . . . . . . . . . . . 62
2.4.3 Modèle WAG et assimilés . . . . . . . . . . . . . . . 68
2.5 Corrections pour les différences de vitesse d’évolution . . . 69
2.6 Choix d’un modèle . . . . . . . . . . . . . . . . . . . . . . . 72
3 Maximum de parcimonie 77
3.1 Parcimonie non pondérée . . . . . . . . . . . . . . . . . . . 77
3.1.1 Nombre minimum de substitutions . . . . . . . . . . 77
3.1.2 Sites informatifs . . . . . . . . . . . . . . . . . . . . 79
3.1.3 Mesure de l’homoplasie . . . . . . . . . . . . . . . . 81
3.1.4 Reconstruction de séquences ancestrales . . . . . . . 82
3.1.5 Longueur des branches . . . . . . . . . . . . . . . . . 84
3.1.6 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 84
3.2 Parcimonie pondérée . . . . . . . . . . . . . . . . . . . . . 85
3.2.1 Algorithme de Sankoff . . . . . . . . . . . . . . . . . 86
3.2.2 Reconstruction des séquences ancestrales . . . . . . 88
3.2.3 Pondération dynamique . . . . . . . . . . . . . . . . 89
3.2.4 Le cas des séquences protéiques . . . . . . . . . . . . 89
3.3 Exploration des topologies . . . . . . . . . . . . . . . . . . 90
3.3.1 Choix de l’arbre de départ . . . . . . . . . . . . . . . 90
3.3.2 Branch-and-bound . . . . . . . . . . . . . . . . . . . 92
3.3.3 Heuristiques . . . . . . . . . . . . . . . . . . . . . . . 94
3.3.4 Arbres consensus . . . . . . . . . . . . . . . . . . . . 97
3.4 Consistance et parcimonie . . . . . . . . . . . . . . . . . . 99
3.4.1 Fréquence observée des motifs . . . . . . . . . . . . . 99
3.4.2 Fréquence attendue des motifs . . . . . . . . . . . . 100
3.4.3 Zone de Felsenstein . . . . . . . . . . . . . . . . . . . 102
3.4.4 Attraction des longues branches . . . . . . . . . . . . 103
4 Méthodes de distances 105
4.1 Classification ascendante hiérarchique . . . . . . . . . . . . 106
4.1.1 Algorithme . . . . . . . . . . . . . . . . . . . . . . . 106
4.1.2 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 107
4.1.3 Avantages et limitations . . . . . . . . . . . . . . . . 108
4.2 Moindres carrés . . . . . . . . . . . . . . . . . . . . . . . . 110
4.2.1 Principe général . . . . . . . . . . . . . . . . . . . . 110
4.2.2 Méthode de Fitch et Margoliash . . . . . . . . . . . 110
4.2.3 Moindres carrés standard . . . . . . . . . . . . . . . 113
4.2.4 Moindres carrés généralisés . . . . . . . . . . . . . . 117
4.2.5 Avantages et limitations . . . . . . . . . . . . . . . . 118
4.3 Minimum d’évolution . . . . . . . . . . . . . . . . . . . . . 118
4.3.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.3.2 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 119
4.3.3 Avantages et limitations . . . . . . . . . . . . . . . . 120
4.4 Neighbor-joining . . . . . . . . . . . . . . . . . . . . . . . . 121
4.4.1 Principe général . . . . . . . . . . . . . . . . . . . . 121
4.4.2 Algorithme . . . . . . . . . . . . . . . . . . . . . . . 121
4.4.3 Variantes du NJ . . . . . . . . . . . . . . . . . . . . 125
4.4.4 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 128
4.4.5 Avantages et limitations . . . . . . . . . . . . . . . . 129
5 Maximum de vraisemblance 131
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.1.1 Exemple simple . . . . . . . . . . . . . . . . . . . . . 131
5.1.2 Généralisation . . . . . . . . . . . . . . . . . . . . . 133
5.1.3 Application à la phylogénie . . . . . . . . . . . . . . 134
5.2 Vraisemblance d’un ensemble d’hypothèses . . . . . . . . . 135
5.2.1 Vraisemblance à un site . . . . . . . . . . . . . . . . 136
5.2.2 Algorithme d’élagage . . . . . . . . . . . . . . . . . . 139
5.2.3 Hétérogénéité des vitesses d’évolution . . . . . . . . 142
5.2.4 Influence de la position de la racine . . . . . . . . . 148
5.2.5 Application numérique . . . . . . . . . . . . . . . . . 149
5.3 Intervalles de confiance et tests . . . . . . . . . . . . . . . . 152
5.3.1 Intervalles de confiance . . . . . . . . . . . . . . . . 153
5.3.2 Tests de vraisemblance . . . . . . . . . . . . . . . . . 157
5.4 Recherche de l’arbre le plus vraisemblable . . . . . . . . . . 162
5.4.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . 162
5.4.2 Exemple d’application . . . . . . . . . . . . . . . . . 165
6 Approche bayésienne 167
6.1 Le théorème de Bayes . . . . . . . . . . . . . . . . . . . . . 167
6.1.1 Formulation . . . . . . . . . . . . . . . . . . . . . . . 167
6.1.2 Exemple de calcul . . . . . . . . . . . . . . . . . . . 168
6.1.3 Notation en statistiques . . . . . . . . . . . . . . . . 169
6.2 Chaînes de Markov avec technique de Monte Carlo . . . . . 170
6.2.1 L’exemple du randonneur . . . . . . . . . . . . . . . 170
6.2.2 L’algorithme de Metropolis-Hastings . . . . . . . . . 172
6.2.3 Couplage de Metropolis des MCMC . . . . . . . . . 173
6.2.4 Analyse des résultats . . . . . . . . . . . . . . . . . . 175
6.2.5 Application numérique . . . . . . . . . . . . . . . . . 177
6.3 L’inférence bayésienne en phylogénie . . . . . . . . . . . . . 180
6.3.1 Cadre général . . . . . . . . . . . . . . . . . . . . . . 180
6.3.2 Choix des probabilités a priori . . . . . . . . . . . . 181
6.3.3 Choix d’un modèle . . . . . . . . . . . . . . . . . . . 182
xiv Concepts et méthodes en phylogénie moléculaire
6.3.4 Choix et évaluation des arbres . . . . . . . . . . . . 185
6.3.5 Reconstruction de séquences ancestrales . . . . . . . 186
6.3.6 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 190
6.4 Avantages et limitations . . . . . . . . . . . . . . . . . . . . 192
6.4.1 Temps de calcul . . . . . . . . . . . . . . . . . . . . 193
6.4.2 Probabilités a priori . . . . . . . . . . . . . . . . . . 193
6.4.3 Probabilités postérieures . . . . . . . . . . . . . . . . 194
7 Évaluation et robustesse des phylogénies 197
7.1 Bootstrap et jackknife . . . . . . . . . . . . . . . . . . . . . 197
7.1.1 Bootstrap non-paramétrique . . . . . . . . . . . . . . 198
7.1.2 Bootstrap paramétrique . . . . . . . . . . . . . . . . 201
7.1.3 Jackknife . . . . . . . . . . . . . . . . . . . . . . . . 202
7.1.4 Critiques et problèmes . . . . . . . . . . . . . . . . . 202
7.2 Tests de permutations . . . . . . . . . . . . . . . . . . . . . 205
7.2.1 Principe général . . . . . . . . . . . . . . . . . . . . 205
7.2.2 Permutation de taxons . . . . . . . . . . . . . . . . . 206
7.2.3 Permutation de caractères . . . . . . . . . . . . . . . 208
7.3 Tests de vraisemblance . . . . . . . . . . . . . . . . . . . . 209
7.3.1 Le test de Kishino et Hasegawa . . . . . . . . . . . . 210
7.3.2 Le test de Shimodaira et Hasegawa . . . . . . . . . . 217
7.3.3 Le test approximativement non biaisé . . . . . . . . 221
7.3.4 Exemple d’application . . . . . . . . . . . . . . . . . 223
Bibliographie 225
Index 247 |
Concepts et méthodes en phylogénie moléculaire [texte imprimé] / Guy PERRIERE, Auteur ; Céline BROCHIER-ARMANET, Auteur . - Springer, 2010 . - 250 p. ; 25 cm.. - ( IRIS) . ISBN : 978-2-287-99047-2 index Langues : Français ( fre)
| Catégories : |
BIOLOGIE:biologie cellulaire et moléculaire
|
| Index. décimale : |
20-03 Biologie cellulaire et moléculaire |
| Résumé : |
Sommaire:
1 Notions élémentaires, définitions 1
1.1 Les données . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Séquences biologiques . . . . . . . . . . . . . . . . . 1
1.1.2 Séquences homologues . . . . . . . . . . . . . . . . . 5
1.2 Alignement de séquences . . . . . . . . . . . . . . . . . . . 8
1.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.2 Alignement de deux séquences . . . . . . . . . . . . 9
1.2.3 Alignements multiples . . . . . . . . . . . . . . . . . 13
1.2.4 Choix des sites . . . . . . . . . . . . . . . . . . . . . 15
1.3 Arbres phylogénétiques . . . . . . . . . . . . . . . . . . . . 16
1.3.1 Définition et structure . . . . . . . . . . . . . . . . . 16
1.3.2 L’arbre caché dans la forêt . . . . . . . . . . . . . . 17
1.3.3 Longueur des branches . . . . . . . . . . . . . . . . . 19
1.3.4 Codage informatique . . . . . . . . . . . . . . . . . . 19
1.3.5 Enracinement . . . . . . . . . . . . . . . . . . . . . . 20
1.3.6 Distance topologique . . . . . . . . . . . . . . . . . . 22
1.3.7 Vocabulaire spécifique . . . . . . . . . . . . . . . . . 24
2 Modèles d’évolution moléculaire 27
2.1 Divergence observée . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Séquences nucléotidiques . . . . . . . . . . . . . . . . . . . 29
2.2.1 Modélisation markovienne de l’évolution . . . . . . . 29
2.2.2 Modèle de Jukes et Cantor . . . . . . . . . . . . . . 36
2.2.3 Modèle de Kimura à deux paramètres . . . . . . . . 38
2.2.4 Autres modèles courants . . . . . . . . . . . . . . . . 42
2.3 Distances synonymes et non synonymes . . . . . . . . . . . 48
2.3.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.2 Méthode de Nei et Gojobori . . . . . . . . . . . . . . 50
2.3.3 Méthode de Nei et Gojobori modifiée . . . . . . . . 53
2.3.4 Méthode de Li, Wu et Luo . . . . . . . . . . . . . . 55
2.4 Séquences protéiques . . . . . . . . . . . . . . . . . . . . . 61
2.4.1 Modèle de Poisson . . . . . . . . . . . . . . . . . . . 61
2.4.2 Modèle PAM et assimilés . . . . . . . . . . . . . . . 62
2.4.3 Modèle WAG et assimilés . . . . . . . . . . . . . . . 68
2.5 Corrections pour les différences de vitesse d’évolution . . . 69
2.6 Choix d’un modèle . . . . . . . . . . . . . . . . . . . . . . . 72
3 Maximum de parcimonie 77
3.1 Parcimonie non pondérée . . . . . . . . . . . . . . . . . . . 77
3.1.1 Nombre minimum de substitutions . . . . . . . . . . 77
3.1.2 Sites informatifs . . . . . . . . . . . . . . . . . . . . 79
3.1.3 Mesure de l’homoplasie . . . . . . . . . . . . . . . . 81
3.1.4 Reconstruction de séquences ancestrales . . . . . . . 82
3.1.5 Longueur des branches . . . . . . . . . . . . . . . . . 84
3.1.6 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 84
3.2 Parcimonie pondérée . . . . . . . . . . . . . . . . . . . . . 85
3.2.1 Algorithme de Sankoff . . . . . . . . . . . . . . . . . 86
3.2.2 Reconstruction des séquences ancestrales . . . . . . 88
3.2.3 Pondération dynamique . . . . . . . . . . . . . . . . 89
3.2.4 Le cas des séquences protéiques . . . . . . . . . . . . 89
3.3 Exploration des topologies . . . . . . . . . . . . . . . . . . 90
3.3.1 Choix de l’arbre de départ . . . . . . . . . . . . . . . 90
3.3.2 Branch-and-bound . . . . . . . . . . . . . . . . . . . 92
3.3.3 Heuristiques . . . . . . . . . . . . . . . . . . . . . . . 94
3.3.4 Arbres consensus . . . . . . . . . . . . . . . . . . . . 97
3.4 Consistance et parcimonie . . . . . . . . . . . . . . . . . . 99
3.4.1 Fréquence observée des motifs . . . . . . . . . . . . . 99
3.4.2 Fréquence attendue des motifs . . . . . . . . . . . . 100
3.4.3 Zone de Felsenstein . . . . . . . . . . . . . . . . . . . 102
3.4.4 Attraction des longues branches . . . . . . . . . . . . 103
4 Méthodes de distances 105
4.1 Classification ascendante hiérarchique . . . . . . . . . . . . 106
4.1.1 Algorithme . . . . . . . . . . . . . . . . . . . . . . . 106
4.1.2 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 107
4.1.3 Avantages et limitations . . . . . . . . . . . . . . . . 108
4.2 Moindres carrés . . . . . . . . . . . . . . . . . . . . . . . . 110
4.2.1 Principe général . . . . . . . . . . . . . . . . . . . . 110
4.2.2 Méthode de Fitch et Margoliash . . . . . . . . . . . 110
4.2.3 Moindres carrés standard . . . . . . . . . . . . . . . 113
4.2.4 Moindres carrés généralisés . . . . . . . . . . . . . . 117
4.2.5 Avantages et limitations . . . . . . . . . . . . . . . . 118
4.3 Minimum d’évolution . . . . . . . . . . . . . . . . . . . . . 118
4.3.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.3.2 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 119
4.3.3 Avantages et limitations . . . . . . . . . . . . . . . . 120
4.4 Neighbor-joining . . . . . . . . . . . . . . . . . . . . . . . . 121
4.4.1 Principe général . . . . . . . . . . . . . . . . . . . . 121
4.4.2 Algorithme . . . . . . . . . . . . . . . . . . . . . . . 121
4.4.3 Variantes du NJ . . . . . . . . . . . . . . . . . . . . 125
4.4.4 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 128
4.4.5 Avantages et limitations . . . . . . . . . . . . . . . . 129
5 Maximum de vraisemblance 131
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . 131
5.1.1 Exemple simple . . . . . . . . . . . . . . . . . . . . . 131
5.1.2 Généralisation . . . . . . . . . . . . . . . . . . . . . 133
5.1.3 Application à la phylogénie . . . . . . . . . . . . . . 134
5.2 Vraisemblance d’un ensemble d’hypothèses . . . . . . . . . 135
5.2.1 Vraisemblance à un site . . . . . . . . . . . . . . . . 136
5.2.2 Algorithme d’élagage . . . . . . . . . . . . . . . . . . 139
5.2.3 Hétérogénéité des vitesses d’évolution . . . . . . . . 142
5.2.4 Influence de la position de la racine . . . . . . . . . 148
5.2.5 Application numérique . . . . . . . . . . . . . . . . . 149
5.3 Intervalles de confiance et tests . . . . . . . . . . . . . . . . 152
5.3.1 Intervalles de confiance . . . . . . . . . . . . . . . . 153
5.3.2 Tests de vraisemblance . . . . . . . . . . . . . . . . . 157
5.4 Recherche de l’arbre le plus vraisemblable . . . . . . . . . . 162
5.4.1 Principe . . . . . . . . . . . . . . . . . . . . . . . . . 162
5.4.2 Exemple d’application . . . . . . . . . . . . . . . . . 165
6 Approche bayésienne 167
6.1 Le théorème de Bayes . . . . . . . . . . . . . . . . . . . . . 167
6.1.1 Formulation . . . . . . . . . . . . . . . . . . . . . . . 167
6.1.2 Exemple de calcul . . . . . . . . . . . . . . . . . . . 168
6.1.3 Notation en statistiques . . . . . . . . . . . . . . . . 169
6.2 Chaînes de Markov avec technique de Monte Carlo . . . . . 170
6.2.1 L’exemple du randonneur . . . . . . . . . . . . . . . 170
6.2.2 L’algorithme de Metropolis-Hastings . . . . . . . . . 172
6.2.3 Couplage de Metropolis des MCMC . . . . . . . . . 173
6.2.4 Analyse des résultats . . . . . . . . . . . . . . . . . . 175
6.2.5 Application numérique . . . . . . . . . . . . . . . . . 177
6.3 L’inférence bayésienne en phylogénie . . . . . . . . . . . . . 180
6.3.1 Cadre général . . . . . . . . . . . . . . . . . . . . . . 180
6.3.2 Choix des probabilités a priori . . . . . . . . . . . . 181
6.3.3 Choix d’un modèle . . . . . . . . . . . . . . . . . . . 182
xiv Concepts et méthodes en phylogénie moléculaire
6.3.4 Choix et évaluation des arbres . . . . . . . . . . . . 185
6.3.5 Reconstruction de séquences ancestrales . . . . . . . 186
6.3.6 Exemple d’utilisation . . . . . . . . . . . . . . . . . . 190
6.4 Avantages et limitations . . . . . . . . . . . . . . . . . . . . 192
6.4.1 Temps de calcul . . . . . . . . . . . . . . . . . . . . 193
6.4.2 Probabilités a priori . . . . . . . . . . . . . . . . . . 193
6.4.3 Probabilités postérieures . . . . . . . . . . . . . . . . 194
7 Évaluation et robustesse des phylogénies 197
7.1 Bootstrap et jackknife . . . . . . . . . . . . . . . . . . . . . 197
7.1.1 Bootstrap non-paramétrique . . . . . . . . . . . . . . 198
7.1.2 Bootstrap paramétrique . . . . . . . . . . . . . . . . 201
7.1.3 Jackknife . . . . . . . . . . . . . . . . . . . . . . . . 202
7.1.4 Critiques et problèmes . . . . . . . . . . . . . . . . . 202
7.2 Tests de permutations . . . . . . . . . . . . . . . . . . . . . 205
7.2.1 Principe général . . . . . . . . . . . . . . . . . . . . 205
7.2.2 Permutation de taxons . . . . . . . . . . . . . . . . . 206
7.2.3 Permutation de caractères . . . . . . . . . . . . . . . 208
7.3 Tests de vraisemblance . . . . . . . . . . . . . . . . . . . . 209
7.3.1 Le test de Kishino et Hasegawa . . . . . . . . . . . . 210
7.3.2 Le test de Shimodaira et Hasegawa . . . . . . . . . . 217
7.3.3 Le test approximativement non biaisé . . . . . . . . 221
7.3.4 Exemple d’application . . . . . . . . . . . . . . . . . 223
Bibliographie 225
Index 247 |
|  |