Structure secondaire helice feuillet macromolecule Texte corrige travaux diriges Enseignement et recherche Biochimie Emmanuel Jaspard Universite Angers biochimej

Formation de structures secondaires

a. La taille et la forme des chaînes latérales des acides aminés jouent un rôle dans leur capacité à former une hélice α. Par exemple, les résidus Val, Ile et Thr sont plus souvent présents dans des feuillets β que dans des hélices α.

Pourquoi ces résidus, quand ils sont nombreux dans une protéine, s'opposent-ils à la formation d'une hélice α ?

b. Quelle est la structure régulière répétitive la plus probable pour les 2 polypeptides suivants : poly-[Gly - Ala - Gly - Thr] / poly-[Glu - Ala - Leu - His]

c. Prédire si les polypeptides suivants forment une hélice α ou un feuillet β:

poly-Leu
poly-Val
Pro - Glu - Met - Val - Phe - Asp - Ile
Pro - Glu - Ala - Leu - Phe - Ala - Ala

d. Quelle partie de l'hélice α formée par le peptide L - K - K - G - H - H - E - A - E - L - K - P - L - A est la plus stable La moins stable ?

e. Le poly-Asp forme une hélice α à pH < 3. Il adopte une structure en "pelote" ("random coil") à pH 5. Pourquoi ?

A quel pH le poly-Arg forme-t-il une hélice α ?

Voir le cours sur les acides aminés.

Voir le cours sur les structures secondaires.

Rappels sur les structures secondaires

1. Hélice α

Quasiment toutes sont droites du fait de la configuration absolue des acides aminés (L).

En effet, l'hélice gauche (qui existe dans quelques rares cas) est déstabilisée par une interférence stérique des oxygènes carbonyle avec les chaînes latérales.

Chaque résidu incrémente l'hélice α (c'est-à-dire qu'il l'allonge le long de son axe) de 0,15 nm.

Le nombre de résidu pour ajouter un tour de spire est compris entre 3,5 et 3,7. Le pas de l'hélice est donc de 0,54 nm (0,15 x 3,6).

Chaque oxygène carbonyle établit une liaison H avec l'hydrogène de l'amide appartenant au 4ème résidu du côté C-terminal.

On peut considérer la suite d'atomes entourant la liaison H comme une structure cyclique formée de 13 atomes (O carbonyle, 11 atomes du squelette et l'H amide).

L'hélice α est donc un dipôle dont l'extrémité aminée est positive et l'extrémité carboxyle est négative.

Certaines protéines globulaires contiennent des hélices_3:10, moins stables : elles sont de pas droit, mais la structure est plus serrée (10 atomes au lieu de 13). Elles ont 3 résidus par tour et un pas plus long (0,60 nm).

éléments favorables

éléments défavorables

Ala : petite chaîne latérale non chargée
Glu : petite chaîne latérale (H) qui peut s'insinuer dans les espaces interhélicaux
Leu / Met

Gly : la liberté de rotation de l'H de la chaîne latérale autour du carbone a est trop importante. Ce résidu est donc trouvé plus fréquemment aux extrémités
Pro : sa chaîne latérale cyclique occupe l'espace d'un résidu adjacent de l'hélice. Pro incurve ou démembre l'hélice et est donc plus fréquemment trouvé aux extrémités
au moins 2 résidus consécutifs dont la chaîne latérale est β-branchée (Val, Ile, Thr)
au moins 2 résidus consécutifs dont les chaînes latérales s'ionisent avec une charge de même signe.

2. Feuillet β

éléments favorables	éléments défavorables
Tyr / Val / Ile Séquences répétées d'acides aminés dont la chaîne latérale est compacte. Exemple : le motif (Gly-Ser-Gly-Ala-Gly-Ala)_n de la fibroïne (protéine de la soie) : les H des Gly sont tous groupés sur une face du feuillet les groupements méthyle et hydroxyméthyle des Ala et des Ser : face opposée il en résulte un empilement compact des feuillets	Asp / Glu / Pro

3a. Les boucles

Ce sont des suites de 2 à 16 résidus, le plus souvent hydrophiles puisque à la surface des protéines (exemple : les épitopes). La boucle serrée qui unit 2 brins β antiparallèles est souvent appelée boucle en épingle à cheveux.

3b. Les coudes (ou courbures ou "turn")

Les coudes sont les boucles formées d'un petit nombre de résidus. Ils sont divisés en plusieurs groupes (α, β, γ, δ et π-turns) en fonction du nombre résidus d'acides aminés.

Les coudes de type I et de type II (ou coude glycine) sont appelés courbures β contiennent 4 résidus d'acides aminés.

La distance entre le premier et le dernier doit être inférieure à 7 Å.
Dans les 2 types, le 2ème résidu est souvent une proline.
Dans le type II, le 3ème résidu est une glycine.

Voir les définitions de toutes les structures secondaires recencées : base de données CATH (glossaire).

Application : visualisation du lysozyme

Aller au site dédié à de nombreux motifs protéiques : "Motivated Proteins - A Facility for Studying Small Hydrogen-Bonded Motifs"

Choisir "Sequence Patterns" puis entrer la séquence "G - D - R - G" puis "run". Cliquer sur "153L", l'applet "Jmol" est lancée.

En sélectionnant "Individual motifs" , on retrouve les caractéristiques du motif "Beta turn" sur la base du glossaire.

4. Les méthodes de prédiction de structures secondaires

La première d'entre elles, la méthode de prédiction de Chou et Fasman (1974 - 1978) est une méthode statistique.

Des tables d'occurence des acides aminés dans les différents états structuraux ont été établies. Chou et Fasman ont analysé les 29 structures 3D connues en 1974 et ils ont affecté chaque acide aminé à un état structural : hélice, brin, apériodique ou coude.

Remarque : on dénombre plus de 148.000 structures 3D en 2019 dans la base de données PDB.

Acide aminé	Nombre	hélice	feuillet	apériodique	coude
Arg	142	53	26	63	40
Cys	94	25	22	47	33
Gln	162	68	35	59	47
Tyr	184	48	53	83	62
Val	357	144	119	94	53
Total	4741	1798	930	2013	1400

Sur la base de cette table, Chou et Fasman ont établit la table des paramètres conformationnels P(α), P(β) et P(coude) en calculant les rapports des fréquences.

Exemple pour Tyr : P(β) (Tyr) = [(53 / 184) / (930 / 4741)] = 147.

Source : L'algorithme est décrit à la base de données PROWL.

Nom            P(α)   P(β)   P(turn)
Alanine        142     83       66 
Arginine        98     93       95 
Aspartic Acid  101     54      146 
Asparagine      67     89      156 
Cysteine        70    119      119 
Glutamic Acid  151    037       74 
Glutamine      111    110       98 
Glycine         57     75      156 
Histidine      100     87       95 
Isoleucine     108    160       47 
Leucine        121    130       59 
Lysine         114     74      101 
Methionine     145    105       60 
Phenylalanine  113    138       60 
Proline         57     55      152 
Serine          77     75      143 
Threonine       83    119       96 
Tryptophan     108    137       96 
Tyrosine        69    147      114 
Valine         106    170       50

Références bibliographiques

Chou & Fasman (1974) "Conformational parameters for amino acids in helical, beta-sheet, and random coil regions calculated from proteins" Biochemistry 13, 211 - 222
Chou & Fasman (1978) "Prediction of the secondary structure of proteins from their amino acid sequence" Adv. Enzymol. Relat. Areas Mol. Biol. 47, 45 - 147
Garnier et al. (1996) "GOR method for predicting protein secondary structure from amino acid sequence" Methods Enzymol R.F. Doolittle Ed., vol 266, 540 - 553
Chen et al. (2006) "Improved Chou-Fasman method for protein secondary structure prediction" BMC Bioinformatics 7, S14
Zheng & Lukasz (2008) "Prediction of beta-turns at over 80% accuracy based on an ensemble of predicted secondary structures and multiple alignments" BMC Bioinformatics 9, 430

Il existe maintenant un trés grand nombre de méthodes de prédiction dont la plupart sont répertoriés à EXPASY ("ExPASy Proteomics tools").

Il existe aussi de très nombreux programmes en ligne via des intrefaces WEB pour la prédiction de structures secondaires :

GOR
Jpred
PSIPRED ("Protein Structure Prediction Server")
Scratch Protein Predictor

Dodd & Egan (1990) "Improved detection of helix-turn-helix DNA-binding motifs in protein sequences" Nucleic Acids Res 18, 5019 - 5026

Pellegrini-Calace & Thornton (2005) "Detecting DNA-binding helix-turn-helix structural motifs using sequence and structure information" Nucleic Acids Res 33, 2129 - 2140

Il existe des calculateurs (prédicteurs) des propriétés physico-chimiques des protéines. Ils s'appuient sur des masses de données colossales ce qui confère une bonne signification statistique aux résultats.

Exemple : "Composition Profiler"

Vacic et al. (2007) "Composition Profiler: A tool for discovery and visualization of amino acid composition differences" BMC Bioinformatics 8, 211

Residue     SwissProt       PDB S25        Surface        DisProt
Ala (A)    7.89 ± 0.05    7.70 ± 0.08    6.03 ± 0.13    8.10 ± 0.35
Arg (R)    5.40 ± 0.04    4.93 ± 0.06    6.56 ± 0.13    4.82 ± 0.23
Asn (N)    4.13 ± 0.04    4.58 ± 0.06    6.23 ± 0.15    3.82 ± 0.27
Asp (D)    5.35 ± 0.03    5.83 ± 0.05    8.18 ± 0.10    5.80 ± 0.30
Cys (C)    1.50 ± 0.02    1.74 ± 0.05    0.78 ± 0.04    0.80 ± 0.08
Gln (Q)    3.95 ± 0.03    3.95 ± 0.05    5.21 ± 0.09    5.27 ± 0.37
Glu (E)    6.67 ± 0.04    6.65 ± 0.07    8.70 ± 0.17    9.89 ± 0.61
Gly (G)    6.96 ± 0.04    7.16 ± 0.07    7.06 ± 0.11    7.41 ± 0.40
His (H)    2.29 ± 0.02    2.41 ± 0.04    2.60 ± 0.06    1.93 ± 0.11
Ile (I)    5.90 ± 0.04    5.61 ± 0.06    2.77 ± 0.07    3.24 ± 0.13
Leu (L)    9.65 ± 0.04    8.68 ± 0.08    5.11 ± 0.08    6.22 ± 0.25
Lys (K)    5.92 ± 0.05    6.37 ± 0.08    9.75 ± 0.16    7.85 ± 0.45
Met (M)    2.38 ± 0.02    2.22 ± 0.04    1.13 ± 0.04    1.87 ± 0.10
Phe (F)    3.96 ± 0.03    3.98 ± 0.04    2.38 ± 0.05    2.44 ± 0.13
Pro (P)    4.83 ± 0.03    4.57 ± 0.05    5.63 ± 0.10    8.11 ± 0.63
Ser (S)    6.83 ± 0.04    6.19 ± 0.06    6.87 ± 0.13    8.65 ± 0.43
Thr (T)    5.41 ± 0.02    5.63 ± 0.05    6.08 ± 0.11    5.56 ± 0.24
Trp (W)    1.13 ± 0.01    1.44 ± 0.03    1.33 ± 0.05    0.67 ± 0.06
Tyr (Y)    3.03 ± 0.02    3.50 ± 0.04    3.58 ± 0.08    2.13 ± 0.15
Val (V)    6.73 ± 0.03    6.72 ± 0.06    4.01 ± 0.06    5.41 ± 0.44

Sources :

SwissProt 51 (Bairoch et al., 2005) : closest to the distribution of amino acids in nature among the four datasets
PDB Select 25 (Berman et al, 2000) : a subset of structures from the Protein Data Bank with less than 25% sequence identity, biased towards the composition of proteins amenable to crystallization studies
Surface residues : determined by the Molecular Surface Package over a sample of PDB structures of monomeric proteins, suitable for analyzing phenomena on protein surfaces, such as binding
DisProt 3.4 : comprised of a set of consensus sequences of experimentally determined disordered regions (Sickmeier et al., 2007)

"DisProt" est une base de données dédiée aux protéines intrinsèquement non structurées.

Application

Comparer les pourcentages des acides aminés - valeurs ci-dessus :

constitutifs des protéines dont on a déterminé la structure 3D : "PDB S25"
constitutifs des protéines désordonnées : "DisProt 3.4"
constitutifs de l'ensemble de toutes les protéines connues à ce jour : "SwissProt"

Voir les données statistiques (tout en bas de la page) : UniProtKB/TrEMBL

Abréviations utilisées dans la suite de l'exercice
H	h	I	i	b	B
formeur FORT	formeur	indifférent FAIBLE	indifférent	casseur	casseur FORT

Réponse question a

Pourquoi Val, Ile et Thr, quand ils sont nombreux dans une protéine, s'opposent-ils à la formation d'une hélice α ?

Car ce sont 3 résidus d'acide aminé dont la chaîne latérale est β-branchée. Le tableau ci-dessous indique qu'ils sont plus formeurs de feuillet β que d'hélice α.

Structure II	Paramètre	Val	Ile	Thr
Hélice α	Pα	1,06	1,08	0,83
Hélice α	classification	formeur faible hα	formeur faible hα	indifférent iα
Feuillet β	Pβ	1,70	1,60	1,19
Feuillet β	classification	formeur FORT Hβ	formeur FORT Hβ	formeur hβ

Réponse question b

Quelle est la structure régulière répétitive la plus probable du poly-[Gly - Ala - Gly - Thr] ?

La somme la plus forte est en faveur d'une structure en feuillet β. De plus, Gly est défavorable à la formation d'une hélice α à cause de la liberté de rotation et Thr parce qu'il est β-branché.

Structure II	Paramètre	Gly	Ala	Gly	Thr	polypeptide
Hélice α	Pα	0,57	1,42	0,57	0,83	Σ = 3,39
Hélice α	classification	casseur FORT	formeur FORT	casseur FORT	indifférent	B-H-B-i
Feuillet β	Pβ	0,75	0,83	0,75	1,19	Σ = 3,52
Feuillet β	classification	casseur	indifférent	casseur	formeur	b-i-b-h

Quelle est la structure régulière répétitive la plus probable du poly-[Glu - Ala - Leu - His] ?

La somme la plus forte est en faveur d'une structure en hélice α. Ceci s'explique par la présence de Glu, Ala et Leu qui sont favorables à ce type de structure II.

Structure II	Paramètre	Glu	Ala	Leu	His	polypeptide
Hélice α	Pα	1,51	1,42	1,21	1,00	Σ = 5,14
Hélice α	classification	formeur FORT	formeur FORT	formeur FORT	indifférent FAIBLE	H-H-H-I
Feuillet β	Pβ	0,37	0,83	1,30	0,87	Σ = 3,37
Feuillet β	classification	casseur FORT	indifférent	formeur	formeur	B-i-h-h

Réponse question c

Structure probable du poly-Leu et du poly-Val

Structure II	Paramètre	poly-Leu	poly-Val
Hélice α	Pα	1,21	1,06
Hélice α	classification	formeur FORT - H	formeur - h
Feuillet β	Pβ	1,30	1,70
Feuillet β	classification	formeur - h	formeur FORT - H
structure du polypeptide		Hα > hβ donc hélice α	Hβ > hα et β-branché donc feuillet β

Structure probable du polypeptide : Pro - Glu - Met - Val - Phe - Asp - Ile

Glu & Met : favorisent hélice α
Val, Ile & Phe : favorisent feuillet β
Pro & Asp : formation de coudes

Structure II	paramètre	Pro	Glu	Met	Val	Phe	Asp	Ile	polypeptide
Hélice α	Pα	0,57	1,51	1,45	1,06	1,13	1,01	1,08	Σ = 7,81
Hélice α	classification	B	H	H	h	h	I	h	BHHhhIh
Feuillet β	Pβ	0,55	0,37	1,05	1,70	1,38	0,54	1,60	Σ = 7,19
Feuillet β	classification	B	B	h	H	h	B	H	BBhHhBH
La somme et l'encombrement stérique des chaînes latérales (longues) sont en faveur d'une hélice α.

Structure probable du polypeptide : Pro - Glu - Ala - Leu - Phe - Ala - Ala

Ala, Glu & Leu : favorisent hélice α
Phe : favorisent feuillet β
Pro : formation de coudes

Structure II	paramètre	Pro	Glu	Ala	Leu	Phe	Ala	Ala	polypeptide
Hélice α	Pα	0,57	1,51	1,42	1,21	1,13	1,42	1,42	Σ = 8,68
Hélice α	classification	B	H	H	H	h	H	H	BHHHhHH
Feuillet β	Pβ	0,55	0,37	0,83	1,30	1,38	0,83	0,83	Σ = 6,09
Feuillet β	classification	B	B	i	h	h	i	i	BBihhii
La somme est en faveur d'une hélice α.

Réponse question d

Quelle partie de l'hélice α formée par le polypeptide L - K - K - G - H - H - E - A - E - L - K - P - L - A est la plus stable ? La moins stable ?

Gly casseur d'hélice α Mais comme il y a 3 AA formeurs, cette partie de la chaîne peut aussi adopter cette structure

<--- Partie centrale la plus stable pour former une hélice α --->

Pro casseur => pas d'hélice α car malgré les 2 AA formeur , il en faut 4 pour un tour d'hélice

Réponse question e

Le poly-Asp forme une hélice α à pH < 3. Pourquoi-t-il une structure en "pelote" ("random coil") à pH 5 ?	pKa chaîne latérale Asp = 3,9	pH < 3 : chaîne latérale = X-COOH => hélice α	pH > 5 : chaîne latérale = X-COO^-. Les charges négatives se repoussent => déstructuration de l'hélice α => pelote
A quel pH le poly-Arg forme-t-il une hélice α ?	pKa chaîne latérale Arg = 12	pH < 11 : chaîne latérale = X-NH₃⁺. Les charges positives se repoussent => déstructuration de l'hélice α => pelote	pH > 13 : chaîne latérale = X-NH₂ => hélice α

Liens Internet et références bibliographiques

"Structural Classification of Proteins"	SCOP
Class Architecture Topology Homologous"	CATH
"Database of protein families and HMM"	Pfam
"Integrated resource for protein families"	InterPro
"Protein domain families automatically generated from the UniProt Knowledge Database"	ProDom
"Protein Data Bank"	PDB
"ExPASy Proteomics tools"	EXPASY
"Late Embryogenesis Abundant database"	LEAPdb
Motivated Proteins - A Facility for Studying Small Hydrogen-Bonded Motifs