Formation de structures secondaires

Relation structure - fonction des protéines

a. La taille et la forme des chaînes latérales des acides aminés jouent un rôle dans leur capacité à former une hélice α. Par exemple, les résidus Val, Ile et Thr sont plus souvent présents dans des feuillets β que dans des hélices α.

Pourquoi ces résidus, quand ils sont nombreux dans une protéine, s'opposent-ils à la formation d'une hélice α ?

b. Quelle est la structure régulière répétitive la plus probable pour les polypeptides suivants :

  • poly-[Gly - Ala - Gly - Thr]
  • poly-[Glu - Ala - Leu - His]

c. Prédire si les polypeptides suivants forment une hélice α ou un feuillet β:

  • poly-Leu
  • poly-Val
  • Pro - Glu - Met - Val - Phe - Asp - Ile
  • Pro - Glu - Ala - Leu - Phe - Ala - Ala

d. Quelle partie de l'hélice α formée par le suivant sont les plus stables ? Les moins stables ?

L - K - K - G - H - H - E - A - E - L - K - P - L - A

e. Le poly-Asp forme une hélice α à pH < 3. Il adopte une structure en "pelote" ("random coil") à pH 5. Pourquoi ?

A quel pH le poly-Arg forme-t-il une hélice α ?


Voir le cours sur les acides aminés. Voir le cours sur les structures secondaires.

Rappels sur les structures secondaires

1. Hélice α

Quasiment toutes sont droites du fait de la configuration absolue des acides aminés (L).

En effet, l'hélice gauche (qui existe dans quelques rares cas) est déstabilisée par une interférence stérique des oxygènes carbonyle avec les chaînes latérales.

Chaque résidu incrémente l'hélice α (c'est-à-dire qu'il l'allonge le long de son axe) de 0,15 nm.

Le nombre de résidu pour ajouter un tour de spire est compris entre 3,5 et 3,7. Le pas de l'hélice est donc de 0,54 nm (0,15 x 3,6).

Chaque oxygène carbonyle établit une liaison H avec l'hydrogène de l'amide appartenant au 4ème résidu du côté C-terminal.

On peut considérer la suite d'atomes entourant la liaison H comme une structure cyclique formée de 13 atomes (O carbonyle, 11 atomes du squelette et l'H amide).

L'hélice α est donc un dipôle dont l'extrémité aminée est positive et l'extrémité carboxyle est négative.

Certaines protéines globulaires contiennent des hélices3:10, moins stables : elles sont de pas droit, mais la structure est plus serrée (10 atomes au lieu de 13). Elles ont 3 résidus par tour et un pas plus long (0,60 nm).


éléments favorables

éléments Défavorables

  • Ala : petite chaîne latérale non chargée
  • Glu : petite chaîne latérale (H) qui peut s'insinuer dans les espaces interhélicaux
  • Leu / Met
  • Gly : la liberté de rotation de l'H de la chaîne latérale autour du carbone a est trop importante. Ce résidu est donc trouvé plus fréquemment aux extrémités
  • Pro : sa chaîne latérale cyclique occupe l'espace d'un résidu adjacent de l'hélice. Pro incurve ou démembre l'hélice et est donc plus fréquemment trouvé aux extrémités
  • au moins 2 résidus consécutifs dont la chaîne latérale est β-branchée (Val, Ile, Thr)
  • au moins 2 résidus consécutifs dont les chaînes latérales s'ionisent avec une charge de même signe.

2. Feuillet β

éléments favorables

éléments Défavorables

  • Tyr / Val / Ile
  • Séquences répétées d'acides aminés dont la chaîne latérale est compacte.

Exemple : le motif (Gly-Ser-Gly-Ala-Gly-Ala)n de la fibroïne (protéine de la soie) :

  • les H des Gly sont tous groupés sur une face du feuillet
  • les groupements méthyle et hydroxyméthyle des Ala et des Ser : face opposée
  • il en résulte un empilement compact des feuillets

Asp / Glu / Pro


3a. Les boucles

Ce sont des suites de 2 à 16 résidus, le plus souvent hydrophiles puisque à la surface des protéines (exemple : les épitopes).

La boucle serrée qui unit 2 brins β antiparallèles est souvent appelé boucle en épingle à cheveux.

3b. Les coudes (ou courbures ou "turn")

Les coudes sont les boucles formées d'un petit nombre de résidus. Ils sont divisés en plusieurs groupes (α, β, γ, δ et π-turns) en fonction du nombre résidus d'acides aminés.

Les coudes de type I et de type II (ou coude glycine) sont appelés courbures β contiennent 4 résidus d'acides aminés.

La distance entre le premier et le dernier doit être inférieure à 7 Å.

Dans les 2 types, le 2ème résidu est souvent une proline. Dans le type II, le 3ème résidu est une glycine.

Voir les définitions de toutes les structures secondaires recencées : base de données CATH (glossaire)
Application : visualisation du lysozyme

Aller au site dédié à de nombreux motifs protéiques : "Motivated Proteins - A Facility for Studying Small Hydrogen-Bonded Motifs"

Choisir "Sequence Patterns" puis entrer la séquence "G - D - R - G" puis "run".

Cliquer sur "153L", l'applet "Jmol" est lancée.

Observer la protéine. Un menu apparaît en cliquant sur le lien "Jmol" dans la fenêtre de visualisation.

Sélectionner "single motifs" et retrouver les caractéristiques du motif "Beta turn" sur la base du glossaire.

Retour haut de page

 

4. Les méthodes de prédiction de structures secondaires

La première d'entre elles, la méthode de prédiction de Chou et Fasman (1974 - 1978) est une méthode statistique.

Des tables d'occurence des acides aminés dans les différents états structuraux ont été établies.

Chou et Fasman ont observé les 29 structures 3D connues en 1974 et ils ont affecté chaque acide aminé à un état structural : hélice, brin, apériodique ou coude.

Remarque : on dénombre plus de 117.000 structures 3D en 2016.

Nom Nombre hélice feuillet apériodique coude
Arg 142 53 26 63 40
Cys 94 25 22 47 33
Gln 162 68 35 59 47
Tyr 184 48 53 83 62
Val 357 144 119 94 53
Total 4741 1798 930 2013 1400
Nom           P(α)   P(β)   P(turn)
Alanine        142     83       66 
Arginine        98     93       95 
Aspartic Acid  101     54      146 
Asparagine      67     89      156 
Cysteine        70    119      119 
Glutamic Acid  151    037       74 
Glutamine      111    110       98 
Glycine         57     75      156 
Histidine      100     87       95 
Isoleucine     108    160       47 
Leucine        121    130       59 
Lysine         114     74      101 
Methionine     145    105       60 
Phenylalanine  113    138       60 
Proline         57     55      152 
Serine          77     75      143 
Threonine       83    119       96 
Tryptophan     108    137       96 
Tyrosine        69    147      114 
Valine         106    170       50 

Sur la base de cette table, Chou et Fasman ont établit la table des paramètres conformationnels P(α), P(β) et P(coude) en calculant les rapports des fréquences.

Exemple pour Tyr : P(β) (Tyr) = [(53 / 184) / (930 / 4741)] = 147.

Source : L'algorithme est décrit à la base de données PROWL.

Chou & Fasman (1974) "Conformational parameters for amino acids in helical, beta-sheet, and random coil regions calculated from proteins" Biochemistry 13, 211 - 222

Chou & Fasman (1978) "Prediction of the secondary structure of proteins from their amino acid sequence" Adv. Enzymol. Relat. Areas Mol. Biol. 47, 45 - 147

Garnier et al. (1996) "GOR method for predicting protein secondary structure from amino acid sequence" Methods Enzymol R.F. Doolittle Ed., vol 266, 540 - 553

Chen et al. (2006) "Improved Chou-Fasman method for protein secondary structure prediction" BMC Bioinformatics 7, S14

Zheng & Lukasz (2008) "Prediction of beta-turns at over 80% accuracy based on an ensemble of predicted secondary structures and multiple alignments" BMC Bioinformatics 9, 430

Application

Il existe maintenant un trés grand nombre de méthodes de prédiction dont la plupart sont répertoriés à EXPASY ("ExPASy Proteomics tools").

A partir d'outils de prédiction, s'exercer à la prédiction de structures secondaires avec la séquence de la protéine LEA ("Late Embryogenesis Abundant") de Arabidopsis thaliana :

>1YYCA
ghhhhhhleasadekvveekasvisslldkakgffaeklaniptpeatvddvdfkgvtrdgvdyhakvsv
knpysqsipicqisyilksatrtiasgtipdpgslvgsgttvldvpvkvaysiavslmkdmctdwdidyq
ldigltfdipvvgditipvstqgeiklpslrdff

Quelques sites WEB pour la prédiction de structures secondaires :

Voir la structure 3D de cette protéine (activer "Jmol") - N° accession PDB : 1YYC

Application

Aller au site :  "FirstGlance in Jmol".

Dans la fenêtre, taper 1d66 puis "Submit".

Cette figure permet de visualiser le motif dit en "doigt de zinc" à 6 cystéines ("C6 zinc finger") : CX2CX6CX5-6CX2CX6C.

L'archétype est le facteur de transcription GAL4 de la levure qui forme un dimère lors de son interaction avec l'ADN via son domaine N-terminal (figure ci-contre).

GAL4 active la transcription des gènes nécessaires à l'utilisation du galactose par la levure (UASG "upstream activated sequence for the yeast Gal genes").

facteur de transcription GAL4 de la levure

Source : EMBO J

Dodd & Egan (1990) "Improved detection of helix-turn-helix DNA-binding motifs in protein sequences" Nucleic Acids Res 18, 5019 - 5026

Pellegrini-Calace & Thornton (2005) "Detecting DNA-binding helix-turn-helix structural motifs using sequence and structure information" Nucleic Acids Res 33, 2129 - 2140

Il existe des calculateurs (prédicteurs) des propriétés physico-chimiques des protéines. Ils s'appuient sur des masses de données colossales ce qui confère une bonne signification statistique aux résultats.

Exemple : "Composition Profiler"

Vacic et al. (2007) "Composition Profiler: A tool for discovery and visualization of amino acid composition differences" BMC Bioinformatics 8, 211


Residue     SwissProt       PDB S25        Surface        DisProt
Ala (A)    7.89 ± 0.05    7.70 ± 0.08    6.03 ± 0.13    8.10 ± 0.35
Arg (R)    5.40 ± 0.04    4.93 ± 0.06    6.56 ± 0.13    4.82 ± 0.23
Asn (N)    4.13 ± 0.04    4.58 ± 0.06    6.23 ± 0.15    3.82 ± 0.27
Asp (D)    5.35 ± 0.03    5.83 ± 0.05    8.18 ± 0.10    5.80 ± 0.30
Cys (C)    1.50 ± 0.02    1.74 ± 0.05    0.78 ± 0.04    0.80 ± 0.08
Gln (Q)    3.95 ± 0.03    3.95 ± 0.05    5.21 ± 0.09    5.27 ± 0.37
Glu (E)    6.67 ± 0.04    6.65 ± 0.07    8.70 ± 0.17    9.89 ± 0.61
Gly (G)    6.96 ± 0.04    7.16 ± 0.07    7.06 ± 0.11    7.41 ± 0.40
His (H)    2.29 ± 0.02    2.41 ± 0.04    2.60 ± 0.06    1.93 ± 0.11
Ile (I)    5.90 ± 0.04    5.61 ± 0.06    2.77 ± 0.07    3.24 ± 0.13
Leu (L)    9.65 ± 0.04    8.68 ± 0.08    5.11 ± 0.08    6.22 ± 0.25
Lys (K)    5.92 ± 0.05    6.37 ± 0.08    9.75 ± 0.16    7.85 ± 0.45
Met (M)    2.38 ± 0.02    2.22 ± 0.04    1.13 ± 0.04    1.87 ± 0.10
Phe (F)    3.96 ± 0.03    3.98 ± 0.04    2.38 ± 0.05    2.44 ± 0.13
Pro (P)    4.83 ± 0.03    4.57 ± 0.05    5.63 ± 0.10    8.11 ± 0.63
Ser (S)    6.83 ± 0.04    6.19 ± 0.06    6.87 ± 0.13    8.65 ± 0.43
Thr (T)    5.41 ± 0.02    5.63 ± 0.05    6.08 ± 0.11    5.56 ± 0.24
Trp (W)    1.13 ± 0.01    1.44 ± 0.03    1.33 ± 0.05    0.67 ± 0.06
Tyr (Y)    3.03 ± 0.02    3.50 ± 0.04    3.58 ± 0.08    2.13 ± 0.15
Val (V)    6.73 ± 0.03    6.72 ± 0.06    4.01 ± 0.06    5.41 ± 0.44

Sources :

  • SwissProt 51 (Bairoch et al., 2005) : closest to the distribution of amino acids in nature among the four datasets
  • PDB Select 25 (Berman et al, 2000) : a subset of structures from the Protein Data Bank with less than 25% sequence identity, biased towards the composition of proteins amenable to crystallization studies
  • Surface residues : determined by the Molecular Surface Package over a sample of PDB structures of monomeric proteins, suitable for analyzing phenomena on protein surfaces, such as binding
  • DisProt 3.4 : comprised of a set of consensus sequences of experimentally determined disordered regions (Sickmeier et al., 2007)

"DisProt" est une base de données dédiée aux protéines intrinsèquement non structurées.

Application

Comparer les pourcentages des acides aminés - valeurs ci-dessus :

  • constitutifs des protéines dont on a déterminé la structure 3D : "PDB S25"
  • constitutifs des protéines désordonnées : "DisProt 3.4"
  • constitutifs de l'ensemble de toutes les protéines connues à ce jour : "SwissProt"

Voir les données statistiques (tout en bas de la page) : UniProtKB/TrEMBL

Retour haut de page

 

Abréviations utilisées dans la suite de l'exercice
H h I i b B
formeur FORT formeur indifférent FAIBLE indifférent casseur casseur FORT

Réponse question a

Pourquoi Val, Ile et Thr, quand ils sont nombreux dans une protéine, s'opposent-ils à la formation d'une hélice α ?

Car ce sont 3 résidus d'acide aminé dont la chaîne latérale est β-branchée.

Le tableau ci-contre indique qu'ils sont plus formeurs de feuillet β que d'hélice α.

Structure II Paramètre Val Ile Thr
Hélice α Pα 1,06 1,08 0,83
classification formeur faible hα formeur faible hα indifférent iα
Feuillet β Pβ 1,70 1,60 1,19
classification formeur FORT Hβ formeur FORT Hβ formeur hβ

Réponse question b

Quelle est la structure régulière répétitive la plus probable du poly-[Gly - Ala - Gly - Thr] ?

La somme la plus forte est en faveur d'une structure en feuillet β.

De plus, Gly est défavorable à la formation d'une hélice α à cause de la liberté de rotation et Thr parce qu'il est β-branché.

Structure II Paramètre Gly Ala Gly Thr polypeptide
Hélice α Pα 0,57 1,42 0,57 0,83 Σ = 3,39
classification casseur FORT formeur FORT casseur FORT indifférent B-H-B-i
Feuillet β Pβ 0,75 0,83 0,75 1,19 Σ = 3,52
classification casseur indifférent casseur formeur b-i-b-h

Quelle est la structure régulière répétitive la plus probable du poly-[Glu - Ala - Leu - His] ?

La somme la plus forte est en faveur d'une structure en hélice α.

Ceci s'explique par la présence de Glu, Ala et Leu qui sont favorables à ce type de structure II.

Structure II Paramètre Glu Ala Leu His polypeptide
Hélice α Pα 1,51 1,42 1,21 1,00 Σ = 5,14
classification formeur FORT formeur FORT formeur FORT indifférent FAIBLE H-H-H-I
Feuillet β Pβ 0,37 0,83 1,30 0,87 Σ = 3,37
classification casseur FORT indifférent formeur formeur B-i-h-h

Réponse question c

Structure probable du poly-Leu et du poly-Val

La somme la plus forte est en faveur d'une structure en feuillet β.

De plus, Gly est défavorable à la formation d'une hélice α à cause de la liberté de rotation et Thr parce qu'il est β-branché.

Structure II Paramètre poly-Leu poly-Val
Hélice α Pα 1,21 1,06
classification formeur FORT - H formeur - h
Feuillet β Pβ 1,30 1,70
classification formeur - h formeur FORT - H
structure du polypeptide Hα > hβ donc hélice α Hβ > hα et β-branché donc feuillet β

Structure probable du polypeptide : Pro - Glu - Met - Val - Phe - Asp - Ile

  • Glu & Met : favorisent hélice α
  • Val, Ile & Phe : favorisent feuillet β
  • Pro & Asp : formation de coudes
Structure II paramètre Pro Glu Met Val Phe Asp Ile polypeptide
Hélice α Pα 0,57 1,51 1,45 1,06 1,13 1,01 1,08 Σ = 7,81
classification B H H h h I h BHHhhIh
Feuillet β Pβ 0,55 0,37 1,05 1,70 1,38 0,54 1,60 Σ = 7,19
classification B B h H h B H BBhHhBH
La somme et l'encombrement stérique des chaînes latérales (longues) est en faveur d'une hélice α.

Structure probable du polypeptide : Pro - Glu - Ala - Leu - Phe - Ala - Ala

  • Ala, Glu & Leu : favorisent hélice α
  • Phe : favorisent feuillet β
  • Pro : formation de coudes
Structure II paramètre Pro Glu Ala Leu Phe Ala Ala polypeptide
Hélice α Pα 0,57 1,51 1,42 1,21 1,13 1,42 1,42 Σ = 8,68
classification B H H H h H H BHHHhHH
Feuillet β Pβ 0,55 0,37 0,83 1,30 1,38 0,83 0,83 Σ = 6,09
classification B B i h h i i BBihhii
La somme est en faveur d'une hélice α.

Réponse question d

Quelle partie de l'hélice a formée par le polypeptide suivant sont les plus stables ? Les moins stables ?

L - K - K - G - H - H - E - A - E - L - K - P - L - A

L K K G H H E A E L K P L A
H h h B I I H H H H h B H H
Gly casseur d'hélice α Mais comme il y a 3 AA formeurs, cette partie de la chaîne peut aussi adopter cette structure <---------- Partie la plus stable pour former une hélice α ------> Pro casseur => pas d'hélice α car malgré les 2 AA formeur , il en faut 4 pour un tour d'hélice

Réponse question e

Le poly-Asp forme une hélice α à pH < 3.
Il adopte une structure en "pelote" ("random coil") à pH 5.
Pourquoi ?

pKa chaîne latérale
Asp = 3,9

pH < 3 : chaîne latérale = X-COOH
==> hélice α

pH > 5 : chaîne latérale = X-COO-
Les charges négatives se repoussent
déstructuration de l'hélice α ==> pelote

A quel pH le poly-Arg forme-t-il une hélice α ?

pKa chaîne latérale
Arg = 12

pH < 11 : chaîne latérale = X-NH3+
Les charges positives se repoussent
déstructuration de l'hélice α ==> pelote

pH > 13 : chaîne latérale = X-NH2
==> hélice α

 

Liens Internet
"Structural Classification of Proteins" SCOP
Class Architecture Topology Homologous" CATH
"Database of protein families and HMM" Pfam
"Integrated resource for protein families" InterPro
"Protein domain families automatically generated from the UniProt Knowledge Database" ProDom
"Protein Data Bank" PDB
"ExPASy Proteomics tools" EXPASY
"Late Embryogenesis Abundant database" LEAPdb
Motivated Proteins - A Facility for Studying Small Hydrogen-Bonded Motifs

 

Valid XHTML 1.0 Transitional         Flux RSS Retour haut de page