Formation de structures secondaires |
Tweet |
a. La taille et la forme des chaînes latérales des acides aminés jouent un rôle dans leur capacité à former une hélice α. Par exemple, les résidus Val, Ile et Thr sont plus souvent présents dans des feuillets β que dans des hélices α. Pourquoi ces résidus, quand ils sont nombreux dans une protéine, s'opposent-ils à la formation d'une hélice α ? b. Quelle est la structure régulière répétitive la plus probable pour les 2 polypeptides suivants : poly-[Gly - Ala - Gly - Thr] / poly-[Glu - Ala - Leu - His] c. Prédire si les polypeptides suivants forment une hélice α ou un feuillet β:
d. Quelle partie de l'hélice α formée par le peptide L - K - K - G - H - H - E - A - E - L - K - P - L - A est la plus stable La moins stable ? e. Le poly-Asp forme une hélice α à pH < 3. Il adopte une structure en "pelote" ("random coil") à pH 5. Pourquoi ? A quel pH le poly-Arg forme-t-il une hélice α ? |
Voir le cours sur les acides aminés. | Voir le cours sur les structures secondaires. |
Rappels sur les structures secondaires 1. Hélice α Quasiment toutes sont droites du fait de la configuration absolue des acides aminés (L). En effet, l'hélice gauche (qui existe dans quelques rares cas) est déstabilisée par une interférence stérique des oxygènes carbonyle avec les chaînes latérales. Chaque résidu incrémente l'hélice α (c'est-à-dire qu'il l'allonge le long de son axe) de 0,15 nm. Le nombre de résidu pour ajouter un tour de spire est compris entre 3,5 et 3,7. Le pas de l'hélice est donc de 0,54 nm (0,15 x 3,6). Chaque oxygène carbonyle établit une liaison H avec l'hydrogène de l'amide appartenant au 4ème résidu du côté C-terminal. On peut considérer la suite d'atomes entourant la liaison H comme une structure cyclique formée de 13 atomes (O carbonyle, 11 atomes du squelette et l'H amide). L'hélice α est donc un dipôle dont l'extrémité aminée est positive et l'extrémité carboxyle est négative. Certaines protéines globulaires contiennent des hélices3:10, moins stables : elles sont de pas droit, mais la structure est plus serrée (10 atomes au lieu de 13). Elles ont 3 résidus par tour et un pas plus long (0,60 nm). |
éléments favorables |
éléments défavorables |
|
|
2. Feuillet β |
éléments favorables |
éléments défavorables |
|
Asp / Glu / Pro |
3a. Les boucles Ce sont des suites de 2 à 16 résidus, le plus souvent hydrophiles puisque à la surface des protéines (exemple : les épitopes). La boucle serrée qui unit 2 brins β antiparallèles est souvent appelée boucle en épingle à cheveux. 3b. Les coudes (ou courbures ou "turn") Les coudes sont les boucles formées d'un petit nombre de résidus. Ils sont divisés en plusieurs groupes (α, β, γ, δ et π-turns) en fonction du nombre résidus d'acides aminés. Les coudes de type I et de type II (ou coude glycine) sont appelés courbures β contiennent 4 résidus d'acides aminés.
Voir les définitions de toutes les structures secondaires recencées : base de données CATH (glossaire). Application : visualisation du lysozyme Aller au site dédié à de nombreux motifs protéiques : "Motivated Proteins - A Facility for Studying Small Hydrogen-Bonded Motifs" Choisir "Sequence Patterns" puis entrer la séquence "G - D - R - G" puis "run". Cliquer sur "153L", l'applet "Jmol" est lancée. En sélectionnant "Individual motifs" , on retrouve les caractéristiques du motif "Beta turn" sur la base du glossaire. |
4. Les méthodes de prédiction de structures secondaires La première d'entre elles, la méthode de prédiction de Chou et Fasman (1974 - 1978) est une méthode statistique. Des tables d'occurence des acides aminés dans les différents états structuraux ont été établies. Chou et Fasman ont analysé les 29 structures 3D connues en 1974 et ils ont affecté chaque acide aminé à un état structural : hélice, brin, apériodique ou coude. Remarque : on dénombre plus de 148.000 structures 3D en 2019 dans la base de données PDB. |
Acide aminé | Nombre | hélice | feuillet | apériodique | coude |
Arg | 142 | 53 | 26 | 63 | 40 |
Cys | 94 | 25 | 22 | 47 | 33 |
Gln | 162 | 68 | 35 | 59 | 47 |
Tyr | 184 | 48 | 53 | 83 | 62 |
Val | 357 | 144 | 119 | 94 | 53 |
Total | 4741 | 1798 | 930 | 2013 | 1400 |
Sur la base de cette table, Chou et Fasman ont établit la table des paramètres conformationnels P(α), P(β) et P(coude) en calculant les rapports des fréquences. Exemple pour Tyr : P(β) (Tyr) = [(53 / 184) / (930 / 4741)] = 147. Source : L'algorithme est décrit à la base de données PROWL. |
Nom P(α) P(β) P(turn) Alanine 142 83 66 Arginine 98 93 95 Aspartic Acid 101 54 146 Asparagine 67 89 156 Cysteine 70 119 119 Glutamic Acid 151 037 74 Glutamine 111 110 98 Glycine 57 75 156 Histidine 100 87 95 Isoleucine 108 160 47 Leucine 121 130 59 Lysine 114 74 101 Methionine 145 105 60 Phenylalanine 113 138 60 Proline 57 55 152 Serine 77 75 143 Threonine 83 119 96 Tryptophan 108 137 96 Tyrosine 69 147 114 Valine 106 170 50 |
Références bibliographiques
|
Il existe maintenant un trés grand nombre de méthodes de prédiction dont la plupart sont répertoriés à EXPASY ("ExPASy Proteomics tools"). Il existe aussi de très nombreux programmes en ligne via des intrefaces WEB pour la prédiction de structures secondaires :
Dodd & Egan (1990) "Improved detection of helix-turn-helix DNA-binding motifs in protein sequences" Nucleic Acids Res 18, 5019 - 5026 Pellegrini-Calace & Thornton (2005) "Detecting DNA-binding helix-turn-helix structural motifs using sequence and structure information" Nucleic Acids Res 33, 2129 - 2140 |
Il existe des calculateurs (prédicteurs) des propriétés physico-chimiques des protéines. Ils s'appuient sur des masses de données colossales ce qui confère une bonne signification statistique aux résultats. Exemple : "Composition Profiler" Vacic et al. (2007) "Composition Profiler: A tool for discovery and visualization of amino acid composition differences" BMC Bioinformatics 8, 211 Residue SwissProt PDB S25 Surface DisProt Ala (A) 7.89 ± 0.05 7.70 ± 0.08 6.03 ± 0.13 8.10 ± 0.35 Arg (R) 5.40 ± 0.04 4.93 ± 0.06 6.56 ± 0.13 4.82 ± 0.23 Asn (N) 4.13 ± 0.04 4.58 ± 0.06 6.23 ± 0.15 3.82 ± 0.27 Asp (D) 5.35 ± 0.03 5.83 ± 0.05 8.18 ± 0.10 5.80 ± 0.30 Cys (C) 1.50 ± 0.02 1.74 ± 0.05 0.78 ± 0.04 0.80 ± 0.08 Gln (Q) 3.95 ± 0.03 3.95 ± 0.05 5.21 ± 0.09 5.27 ± 0.37 Glu (E) 6.67 ± 0.04 6.65 ± 0.07 8.70 ± 0.17 9.89 ± 0.61 Gly (G) 6.96 ± 0.04 7.16 ± 0.07 7.06 ± 0.11 7.41 ± 0.40 His (H) 2.29 ± 0.02 2.41 ± 0.04 2.60 ± 0.06 1.93 ± 0.11 Ile (I) 5.90 ± 0.04 5.61 ± 0.06 2.77 ± 0.07 3.24 ± 0.13 Leu (L) 9.65 ± 0.04 8.68 ± 0.08 5.11 ± 0.08 6.22 ± 0.25 Lys (K) 5.92 ± 0.05 6.37 ± 0.08 9.75 ± 0.16 7.85 ± 0.45 Met (M) 2.38 ± 0.02 2.22 ± 0.04 1.13 ± 0.04 1.87 ± 0.10 Phe (F) 3.96 ± 0.03 3.98 ± 0.04 2.38 ± 0.05 2.44 ± 0.13 Pro (P) 4.83 ± 0.03 4.57 ± 0.05 5.63 ± 0.10 8.11 ± 0.63 Ser (S) 6.83 ± 0.04 6.19 ± 0.06 6.87 ± 0.13 8.65 ± 0.43 Thr (T) 5.41 ± 0.02 5.63 ± 0.05 6.08 ± 0.11 5.56 ± 0.24 Trp (W) 1.13 ± 0.01 1.44 ± 0.03 1.33 ± 0.05 0.67 ± 0.06 Tyr (Y) 3.03 ± 0.02 3.50 ± 0.04 3.58 ± 0.08 2.13 ± 0.15 Val (V) 6.73 ± 0.03 6.72 ± 0.06 4.01 ± 0.06 5.41 ± 0.44 Sources :
"DisProt" est une base de données dédiée aux protéines intrinsèquement non structurées. Application Comparer les pourcentages des acides aminés - valeurs ci-dessus :
Voir les données statistiques (tout en bas de la page) : UniProtKB/TrEMBL |
Abréviations utilisées dans la suite de l'exercice | |||||
H | h | I | i | b | B |
formeur FORT | formeur | indifférent FAIBLE | indifférent | casseur | casseur FORT |
Réponse question a Pourquoi Val, Ile et Thr, quand ils sont nombreux dans une protéine, s'opposent-ils à la formation d'une hélice α ? Car ce sont 3 résidus d'acide aminé dont la chaîne latérale est β-branchée. Le tableau ci-dessous indique qu'ils sont plus formeurs de feuillet β que d'hélice α. |
Structure II | Paramètre | Val | Ile | Thr |
Hélice α | Pα | 1,06 | 1,08 | 0,83 |
classification | formeur faible hα | formeur faible hα | indifférent iα | |
Feuillet β | Pβ | 1,70 | 1,60 | 1,19 |
classification | formeur FORT Hβ | formeur FORT Hβ | formeur hβ |
Réponse question b Quelle est la structure régulière répétitive la plus probable du poly-[Gly - Ala - Gly - Thr] ? La somme la plus forte est en faveur d'une structure en feuillet β. De plus, Gly est défavorable à la formation d'une hélice α à cause de la liberté de rotation et Thr parce qu'il est β-branché. |
Structure II | Paramètre | Gly | Ala | Gly | Thr | polypeptide |
Hélice α | Pα | 0,57 | 1,42 | 0,57 | 0,83 | Σ = 3,39 |
classification | casseur FORT | formeur FORT | casseur FORT | indifférent | B-H-B-i | |
Feuillet β | Pβ | 0,75 | 0,83 | 0,75 | 1,19 | Σ = 3,52 |
classification | casseur | indifférent | casseur | formeur | b-i-b-h |
Quelle est la structure régulière répétitive la plus probable du poly-[Glu - Ala - Leu - His] ? La somme la plus forte est en faveur d'une structure en hélice α. Ceci s'explique par la présence de Glu, Ala et Leu qui sont favorables à ce type de structure II. |
Structure II | Paramètre | Glu | Ala | Leu | His | polypeptide |
Hélice α | Pα | 1,51 | 1,42 | 1,21 | 1,00 | Σ = 5,14 |
classification | formeur FORT | formeur FORT | formeur FORT | indifférent FAIBLE | H-H-H-I | |
Feuillet β | Pβ | 0,37 | 0,83 | 1,30 | 0,87 | Σ = 3,37 |
classification | casseur FORT | indifférent | formeur | formeur | B-i-h-h |
Réponse question c Structure probable du poly-Leu et du poly-Val La somme la plus forte est en faveur d'une structure en feuillet β. De plus, Gly est défavorable à la formation d'une hélice α à cause de la liberté de rotation et Thr parce qu'il est β-branché. |
Structure II | Paramètre | poly-Leu | poly-Val |
Hélice α | Pα | 1,21 | 1,06 |
classification | formeur FORT - H | formeur - h | |
Feuillet β | Pβ | 1,30 | 1,70 |
classification | formeur - h | formeur FORT - H | |
structure du polypeptide | Hα > hβ donc hélice α | Hβ > hα et β-branché donc feuillet β |
Structure probable du polypeptide : Pro - Glu - Met - Val - Phe - Asp - Ile
|
Structure II | paramètre | Pro | Glu | Met | Val | Phe | Asp | Ile | polypeptide |
Hélice α | Pα | 0,57 | 1,51 | 1,45 | 1,06 | 1,13 | 1,01 | 1,08 | Σ = 7,81 |
classification | B | H | H | h | h | I | h | BHHhhIh | |
Feuillet β | Pβ | 0,55 | 0,37 | 1,05 | 1,70 | 1,38 | 0,54 | 1,60 | Σ = 7,19 |
classification | B | B | h | H | h | B | H | BBhHhBH | |
La somme et l'encombrement stérique des chaînes latérales (longues) sont en faveur d'une hélice α. |
Structure probable du polypeptide : Pro - Glu - Ala - Leu - Phe - Ala - Ala
|
Structure II | paramètre | Pro | Glu | Ala | Leu | Phe | Ala | Ala | polypeptide |
Hélice α | Pα | 0,57 | 1,51 | 1,42 | 1,21 | 1,13 | 1,42 | 1,42 | Σ = 8,68 |
classification | B | H | H | H | h | H | H | BHHHhHH | |
Feuillet β | Pβ | 0,55 | 0,37 | 0,83 | 1,30 | 1,38 | 0,83 | 0,83 | Σ = 6,09 |
classification | B | B | i | h | h | i | i | BBihhii | |
La somme est en faveur d'une hélice α. |
Réponse question d Quelle partie de l'hélice α formée par le polypeptide L - K - K - G - H - H - E - A - E - L - K - P - L - A est la plus stable ? La moins stable ? |
L | K | K | G | H | H | E | A | E | L | K | P | L | A |
H | h | h | B | I | I | H | H | H | H | h | B | H | H |
Gly casseur d'hélice α Mais comme il y a 3 AA formeurs, cette partie de la chaîne peut aussi adopter cette structure | <--- Partie centrale la plus stable pour former une hélice α ---> | Pro casseur => pas d'hélice α car malgré les 2 AA formeur , il en faut 4 pour un tour d'hélice |
Réponse question e |
Le poly-Asp forme une hélice α à pH < 3. Pourquoi-t-il une structure en "pelote" ("random coil") à pH 5 ? |
pKa chaîne latérale Asp = 3,9 |
pH < 3 : chaîne latérale = X-COOH => hélice α |
pH > 5 : chaîne latérale = X-COO-. Les charges négatives se repoussent => déstructuration de l'hélice α => pelote |
A quel pH le poly-Arg forme-t-il une hélice α ? |
pKa chaîne latérale Arg = 12 |
pH < 11 : chaîne latérale = X-NH3+. Les charges positives se repoussent => déstructuration de l'hélice α => pelote |
pH > 13 : chaîne latérale = X-NH2 => hélice α |
Liens Internet et références bibliographiques |
"Structural Classification of Proteins" | SCOP |
Class Architecture Topology Homologous" | CATH |
"Database of protein families and HMM" | Pfam |
"Integrated resource for protein families" | InterPro |
"Protein domain families automatically generated from the UniProt Knowledge Database" | ProDom |
"Protein Data Bank" | PDB |
"ExPASy Proteomics tools" | EXPASY |
"Late Embryogenesis Abundant database" | LEAPdb |
Motivated Proteins - A Facility for Studying Small Hydrogen-Bonded Motifs |