La synthèse des protéines |
1. Présentation générale a. Schéma des étapes de la synthèse des protéines chez les eucaryotes 2. La transcription a. La transcription chez Escherichia coli (procaryotes) 3. Les ARN de transfert (ARNt) a. Synthèse et maturation des ARNt |
4. Le noyau et les pores nucléaires 5. Les ribosomes a. Généralités 6. La traduction
7. Le réticulum endoplasmique 8. Le canal de translocation des protéines ou translocon 9. Quelques notions sur le code génétique et les codons 10. La dégradation des protéines : l'ubiquitine et le protéasome 11. Les protéines mal repliées : "Unfolded Protein Response" - UPR 12. Liens Internet et références bibliographiques |
1. Présentation générale a. Schéma des étapes de la synthèse des protéines chez les eucaryotes 1ère étape : la transcription des gènes de l'ADN en ARN prémessager a lieu dans le noyau. Pour chaque gène, un seul brin de l'ADN est transcrit mais ce brin varie selon les gènes. La synthèse de l'ARN est catalysée par l'ARN polymérase, une enzyme oligomérique. Il en existe 3 types chez les eucaryotes. La transcription s'effectue de l'extrémité 5' vers l'extrémité 3' des gènes. 2ème étape : la maturation de l'ARN prémessager a lieu dans le noyau
Ces modifications protégent l'ARN messager d'une dégradation trop rapide dans le cytoplasme.
L'ARN pré-messager ainsi mature devient l'ARN messager (ARNm). L'ARNm est ensuite exporté vers le cytoplasme via les pores nucléaires. 3ème étape : la traduction de l'ARNm en protéine a lieu dans le cytoplasme au niveau des ribosomes et nécessite la présence d'ARN de transfert (ARNt) chargés avec les acides aminés correspondants et d'énergie sous forme de GTP. Les ARNt sont synthétisés dans le noyau. La synthèse peptidique s'effectue de l'extrémité N-terminale de la protéine vers l'extrémité C-terminale. 4ème étape (protéines glycosylées et/ou sécrétées) : les modifications co-traductionnelles ou post-traductionnelles comme la glycosylation (liaison covalente d'oses aux protéines) ont lieu dans le réticulum endoplasmique et/ou dans l'appareil de Golgi. Chez les procaryotes, la transcription et la traduction ont lieu dans le cytoplasme et peuvent être simultanées. |
b. Rappels sur les bases azotées, les nucléosides et les nucléotides (et leurs pendants désoxy-) Voir un cours sur la synthèse des bases puriques et pyrimidiques. |
Les bases azotées constitutives des acides nucléiques | |
purine | pyrimidine |
adénine (A) - ADN & ARN | cytosine (C) - ADN & ARN |
guanine (G) - ADN & ARN | thymine (T) - ADN |
hypoxanthine - ARN | uracile (U) - ARN |
Voir ci-dessous la structure de ces bases azotées. Remarque : la xanthine, la caféine, la théobromine, l'acide urique sont aussi des purines (mais qui n'interviennent pas dans la structure des acides nucléiques). |
Un nucléoside est une glycosylamine : une base azotée dont un groupement amine est lié à un carbohydrate (ribofuranose) par une liaison β-N-osidique. Un désoxynucléoside utilise le 2-désoxyribofuranose. Un nucléotide résulte de la phosphorylation d'un groupement -OH du ribose du nucléoside. C'est un ester-phosphate de nucléoside. Les nucléosides diphosphates (NDP) ou les nucléosides triphosphate (NTP) sont des polyacides forts qui peuvent libérer 3 ou 4 protons (acides polyprotiques). L'ATP (adénosine 5'-triphosphate) est un NTP particulier puisque c'est la molécule réservoir énergétique de la cellule (le GTP l'est aussi mais il est moins fréquemment utilisé). |
c. Représentations schématiques des chaînes d'acides ribonucléiques ou d'acides désoxyribonucléiques Le ribofuranose (ARN) ou le 2-désoxyribofuranose (ADN) sont les oses constitutifs des acides nucléiques.
Voir un cours sur les glucides.
|
Articles clés sur la structure de l'ADN
De gauche à droite ci-dessus : structures
tridimensionnelles de l'ADN A, B et Z. |
Différents types de visualisation de l'ADN double brin
|
L'ADN est employé comme molécule de stockage robuste et non modifiable (hormis les mutations) de l'information génétique. La structure en double hélice de l'ADN, son empaquetage très dense dans le noyau et son association étroite aux histones sont des éléments supplémentaires de stabilité. Pour que l'information passe de l'ADN aux protéines, la cellule utilise diverses classes de molécules d'acides ribonucléiques ou ARN.
Source : Amin et al. (2019) Le groupement OH porté par le carbone 2 du ribofuranose rend les ARN plus sensibles à l'hydrolyse de la liaison phosphodiester.
|
Codage de l'information numérique dans de l'ADN La production de ressources numériques, la transmission de données et leur stockage ont révolutionné notre vie moderne. Cependant, de manière parallèle, les tâches d'archivage actif et d'entretien en continu des médias numériques sont de plus en plus complexes. La molécule d'ADN s'avère un support particulièrement attractif pour le stockage de l'information. C'est, peut-être, le support de l'avenir, du fait notamment de ses capacités d'encodage à haute densité de l'information et de sa longévité dans des conditions de conservation faciles à mettre en oeuvre. En 2013, cinq formats de fichiers courants en informatique ont été codés sous la forme d'ADN (Goldman et al., 2013) :
Soit un total de codage dans une molécule d'ADN de l'équivalent de 739 kilo-octets de stockage sur un disque dur avec un taux estimé d'informations de Shannon de 5.2 106 bits. L'ADN a été synthétisé, puis séquencé et les fichiers d'origine ont été reconstruits avec une précision de 100% ! L'analyse théorique indique que le stockage dans de l'ADN est : (i) une technologie d'archivage numérique à long terme réaliste; (ii) applicable à une échelle bien au-delà des volumes actuels de stockage de l'information |
2. La transcription C'est la polymérisation de ribonucléosides triphosphates (NTP) catalysée par une ARN polymérase : ARNn-OH + NTP -> ARNn+1-OH + pyrophosphate inorganique (PPi) L'hydrolyse ultèrieure du pyrophosphate inorganique (PPi) rend la réaction exergonique : ΔG°' = - 2,2 kcal.mol-1. a. La transcription chez Escherichia coli (procaryote) Chez Escherichia coli, l'ARN polymérase est une protéine oligomérique constituée de 6 sous-unités. Cinq d'entre elles s'associent de manière stoechiomètrique : α2ββ'σ70 pour constituer l'holoenzyme (figure ci-dessous). Source : 3D structures - Darst Lab Elle est de forme irrégulière et l'un des bords est creusé d'un sillon assez long pour adapter un ADN bicaténaire de 16 paires de bases.
|
Chez les procaryotes, la transcription a lieu dans le cytoplasme. L'initiation de la transcription nécessite que la sous-unité σ de l'ARN polymérase se fixe sur l'oligomère α2ββ' (appelé "core-enzyme") pour former l'holoenzyme α2ββ'σ. Ce complexe se fixe de manière non-spécifique à l'ADN, via la sous-unité σ, et se déplace jusqu'au promoteur situé en amont de la séquence codante entre deux types de séquences appelées respectivement région -35 et "Pribnow box" ou "TATA box" ou région -10. Voir les articles de D. Pribnow (1975) et de Schaller et al. (1975). Source : M. Hunter (2009) Ces séquences sont dites consensus car elles reflètent l'emploi le plus fréquent de certains nucléotides à des positions précises par le plus grand nombre d'organismes pour lesquels on a ce type de données. Exemples de séquences consensus : région -35 = TTGACAT; région -10 = TATAAT Source : "Biochemistry" - Garret & Grisham σ70 est l'élément le plus fréquement trouvé chez Escherichia coli. Mais il existe d'autres types de facteurs σ ce qui permet de réguler la transcription de différents gènes : σ28 reconnaît les promoteurs des gènes de motilité et de chimiotaxie, σ32 ceux des gènes induits par le choc thermique, σ38 ceux des gènes de la phase stationnaire et de réponse au stress, σ54 ceux des gènes du métabolisme azoté. La sous unité σ se détache et la sous unité β' assure la liaison avec l'ADN pour former le complexe fermé. L'ADN est déroulé sur environ 17 paires de bases par l'ARN polymérase : c'est le complexe ouvert. La phase de terminaison Rho-dépendante commence en remplaçant la sous unité σ par un facteur de transcription appelé NusA. NusA fait partie d'une famille de facteurs d'élongation trés conservés. Chez Escherichia coli c'est une protéine de 495 acides aminés (55 kDa) constituée de 6 domaines. Le domaine N-terminal (1 à 137) interagit avec l'ARN polymérase. Ce complexe enzymatique synthétise le brin d'ARN complémentaire du brin d'ADN matrice. Figure ci-dessous : les différents complexes d'élongation au cours d'un cycle de transcription chez Escherichia coli. Source : Burmann & Rösch (2011) - RNAP : ARN polymérase - NusB, NusG et NusE : autres facteurs de transcription Au cours de l'élongation, l'ARN polymérase ouvre une "bulle de transcription" de 12 -13 paires de bases ouvertes. L'ARN polymérase apparie les ribonucléotides avec les désoxyribonucléotides de l'ADN matrice et elle établit les liaisons phosphodiester entre les ribonucléotides. Le brin d'ARN en cours de biosynthèse reste apparié à l'ADN puis il y a désappariement. |
La terminaison de la transcription se fait de 2 manières (50% pour chacune d'entre elles environ chez Escherichia coli). α. La terminaison de la transcription Rho-dépendante Une courte séquence d'ADN, riches en paires G-C (3 liaisons hydrogènes donc plus fortement liées) suivie de plusieurs U, est transcrite en "épingle à cheveux" ce qui stoppe la progression de l'ARN polymérase. Source : Pearson Education, Inc. (2009) Une protéine de terminaison appelée Rho (une hélicase ARN-ADN / ATP-dépendante sous forme d'homohexamère) se fixe sur l'ARN et le complexe d'élongation est dissocié. Le brin d'ARN néo-synthétisé est libéré du brin d'ADN matrice. Le site d'enroulement de l'ARN autour de Rho est une région d'environ 70 nucléotides (jusqu'à 100 nucléotides), riche en cytosine et pauvre en guanine, appelée "rho utilization site" située en amont de la séquence appelée "terminateur". β. La terminaison de la transcription Rho-indépendante (ou terminaison intrinsèque) Elle a lieu au niveau d'une séquence répétée inversée (également riche en paires G-C) suivie de 6 A, située après la séquence codante. La transcription de cette séquence inversée aboutit à la formation d'une structure en "épingle à cheveux" dans l'ARN en cours de biosynthèse qui bloque le complexe de transcription.
Source : Freeman & Co. (2005) Les liaisons H entre la séquence poly A et le brin complémentaire poly-U néo-synthétisé sont rompues et le brin d'ARN est dissocié du brin d'ADN matrice. L'ARNm synthétisé peut être directement traduit. La transcription et la traduction se déroulant dans le même compartiment, des ribosomes peuvent même commencer à traduire un ARN messager avant que sa transcription ne soit finie. Ce mécanisme de terminaison est en relation avec l'activité d'éléments régulateurs de l'ARN qui agissent en cis comme les riboswitches. Figure ci-dessous : une unité de gène ribosomal en action (Chrironumus pallidivitatus). De nombreuses molécules d'ARN polymérase I (ARN Pol I) sont en train de transcrire le gène car l'initiation est trés fréquente. Plus on s'approche de l'extrémité 5', plus les transcrits (ARNr) sont longs. Figure adaptée de Hans-Heinrich Trepte |
b. La transcription chez les eucaryotes Chez les eucaryotes, à chaque type d'ARN correspond une ARN polymérase. |
ARN polymérase | ARN transcrits | Caractéristiques |
type I : Pol I |
ARN ribosomiques 5,8S, 18S et 28S | La structure de Pol I de l'homme en cours de processus d'élongation révèle qu'elle est constituée de 13 sous-unités. Pour que la transcription ait lieu, Pol I doit former un complexe de pré-initiation avec la séquence ADN du promoteur : Pol I lié à RRN3 (facteur d'initiation de la transcription spécifique de Pol I) s'associe aux 5 sous-unités du facteur de sélectivité 1 ("Selectivity Factor 1") qui contient la protéine de liaison à la "TATA-box" ("TATA-box Binding Protein") qui est activée par le facteur de liaison en amont ("Upstream Binding Factor") pour déclencher l'initiation de la transcription des ARN ribosomiques. Tous les composants du complexe de pré-initiation de l'homme sont régulés par des modifications post-traductionnelles pour ajuster le taux de synthèse d'ARN ribosomiques en réponse au cycle cellulaire, aux facteurs de croissance, à la disponibilité des nutriments et au stress. |
type II : Pol II |
ARN messagers et petits ARN nucléaires | Pol II est un énorme complexe protéique d'environ 550 kDa constitué de 12 sous-unités (figures ci-dessous : structure à une résolution de 2,8 Å).
|
type III : Pol III |
ARN de transfert, ARN ribosomique 5S et petits ARN nucléaires | Ce n'est qu' en 2007 que sa structure tridimensionnelle a été obtenue par cryo-microscopie électronique. L'échantillon et l'intérieur du microscope sont refroidis à -180° Celsius afin d'éviter l'évaporation de l'eau contenue dans la structure de l'enzyme. Cela permet de figer l'enzyme dans son état natif. Source : G. Schoehn - CNRS 2007 Cette structure a permis de localiser 5 sous-unités supplémentaires impliquées dans les phases initiale et finale de la transcription. Ces sous-unités permettent de reconnaître l'ADN et de fixer différents facteurs de transcription. |
des organites | ARN mitochondriaux et chloroplastiques | ----- |
L'initiation de la transcription chez les eucaryotes Elle est plus complexe chez les eucaryotes car les ARN polymérases ne reconnaissent pas directement leurs séquences promotrices : 5 facteurs de transcription généraux ("Transcription Factor" : TFII-B, TFII-D, TFII-E, TFII-F et TFII-H) doivent d'abord médier la fixation des ARN polymérases et l'initiation de la transcription. Le complexe complet [ARN polymérase - facteurs de transcription - séquence ADN du promoteur] est appelé complexe de pré-initiation de la transcription. Ce complexe assure :
Cependant, certains mécanismes moléculaires et certaines fonctions de ce complexe sont encore inconnus, notamment par manque d'informations structuralles en raison de la taille gigantesque du complexe de pré-initiation (2 millions Da). Voir un cours sur les facteurs de transcription. En 2013, un système a été reconstitué in vitro pour étudier, par cryo-microscopie électronique, l'assemblage progressif de TBP ("TATA-Binding Protein"), Pol II et des facteurs de transcription généraux (TFIIA, TFIIB, TFIIF, TFIIE et TFIIH) sur un promoteur. Stratégie de reconstruction du complexe de pré-initiation humain par assemblage séquentiel. Source : He et al. (2013) (a) : schéma de l'ADN mentionnant les positions relatives des éléments fondamentaux du promoteur utilisé et du site de restriction SalI. (b) à (e) : intermédiaires de l'assemblage du complexe de pré-initiation [TBP - TFIIA - TFIIB - ADN - Pol II] (b) puis addition de TFIIF (c) puis addition de TFIIE (d) puis addition de TFIIH (e). Les modèles obtenus à différentes étapes de l'initiation de la transcription décrivent les interactions entre les molécules de ce complexe :
Voir une vidéo du processus d'assemblage. Structures cristallines : complexe [TBP - TFIIA - ADN] : 1NVP; complexe [TBP - TFIIB - ADN] : 1C9B; complexe [Pol II - TFIIB] : 4BBR ; domaine de dimérisation RAP30/74 : 1F3U. |
Visualisation du complexe [TFIIA/TBP/ADN] de Homo sapiens Code PDB : 1NVP.pdb |
Le médiateur Le médiateur ("mediator") est un complexe protéique constitué de plusieurs dizaines de sous-unités qui agit en tant que co-activateur en se fixant au complexe de préinitiation de la transcription. Il régule ainsi l'activité de Pol II en communiquant les signaux de régulation des divers facteurs de transcription liés à l'ADN à Pol II. Le médiateur est impliqué dans la régulation de nombreux autres processus fondamentaux de la transcription (l'initiation, l'allongement, l'architecture de la chromatine et la formation de la boucle promoteur-activateur). Source : Nozawa et al. (2017) Le médiateur est composé de 31 sous-unités chez l'homme (21 sous-unités chez la levure). Les sous-unités forment au moins trois modules distincts sur le plan structural. Les modules appelés "tête" et "milieu / intermédiaire" interagissent directement avec Pol II, et le module appelés "queue" interagit avec les protéines régulatrices. Certaines sous-unités du médiateur sont caractérisées par une grande flexibilité structurale car elles contiennent beaucoup de régions intrinsèquement non structurées. La terminaison de la transcription chez les eucaryotes Elle s'effectue selon différents processus, qui dépendent de la polymérase employée.
|
Certains ARN des cellules eucaryotes, en particulier les ARN dits pré-messagers, subissent des modifications post-transcriptionnelles, catalysées par plusieurs enzymes localisées dans le noyau.
c. Addition de la coiffe des ARN C'est l'addition d'une 7-méthylguanosine (N7) sur le premier nucléotide de l'ARN, par une liaison 5'-5' triphosphate (notation : 7mGpppN). Cette modification est appelée la coiffe (ou "5'-cap"). Les ribofuranoses des deux premiers nucléotides de l'ARNm transcrit peuvent aussi être méthylés en position 2'. La coiffe :
Les enzymes ("mRNA-capping enzyme catalytic subunit") qui catalysent l'addition de la coiffe sont : a. Une polynucléotide 5'-phosphatase (EC 3.1.3.33) qui libère le 5' diphosphate : 5'-phospho-polynucléotide + H2O <=> polynucléotide + phosphate inorganique. b. Une ARNm guanylyl-transférase (EC 2.7.7.50) qui forme la liaison 5'-5' triphosphate avec le GTP en tant que donneur de liaison à haut potentiel énergétique : GTP + (5')pp-Pur-ARNm <=> G(5')ppp-Pur-ARNm + pyrophosphate inorganique. c. Une ARNm [guanine-N(7)-]-méthyl-transférase (EC 2.1.1.56) qui ajoute les groupements méthyle sur l'atome N7 de la guanosine et les deux nucléotides suivants. Le donneur de méthyle est la S-adénosylméthionine. Voir la "molécule du mois" - Janvier 2012 : "Messenger RNA Capping" / PDB 3KYH - PDB 1RI1. Le système multi-enzymatique complexe qui dégrade les ARN qui ne sont plus utiles s'appelle l'exosome - PDB 2NN6 (système qui est le pendant des protéasomes dans le cas des protéines). Coiffe des ARN des bactéries
Source : Hofer & Jaschke (2016) |
d. La poly-adénylation des ARN messagers Figure ci-dessous : schéma simplifié d'un gène Eucaryote et d'un transcrit issu de ce gène.
Voir un cours sur les facteurs de transcription et les éléments de régulation de la transcription. Hormis les ARN messagers (ARNm) codant les histones, l’extrémité 3’ des ARNm des eucaryotes comporte une série de 50 à 200 résidus adényliques qui constitue la queue "polyA".
L'étude des transcrits de 10 chromosomes humains a montré que prés de la moitié des transcrits sont non polyadénylés [écrit poly(A)-] (Cheng et al., 2005) : 19,4% sont poly(A)+; 43,7% sont poly(A)-, c'est-à-dire non polyadénylés; 36,/9% sont poly(A)+ et poly(A)-. La polyadénylation alternative génère différents transcrits à partir d'un même gène (schéma ci-dessous). Source : D. Gautheret - INSERM ERM206 |
e. Les rôles et la structure de la queue poly(A) des ARN messagers Rôles de la queue poly(A) des ARNm Dans le noyau, les pré-ARNm sont transcrits par l'ARN polymérase II (Pol II) et traités : addition de la coiffe en 5', épissage, clivage en 3' et polyadénylation en 3'. Chez les eucaryotes, les queues poly(A) sont présentes sur presque tous les ARNm :
Source : Passmore & Coller (2021) La protéine de liaison au polyadénylate cytoplasmique ("cytoplasmic PolyAdenylate-Binding Protein" - PABPC) se fixe à la queue poly(A) de l'ARNm (y compris à celle de son propre transcrit) : elle régule le métabolisme de l'ARNm (par exemple, l'épissage du pré-ARNm et la stabilité de l'ARNm) et favorise la traduction par le ribosome 80S.
Désadénylation et dégradation de l'ARNm chez les eucaryotes Dans le modèle général de dégradation de l'ARNm, les évènements sont les suivants :
Structure de l'ARN poly(A) Le queue poly(A) possède des propriétés structurales uniques parmi les polyribonucléotides : l'ARN poly(A) forme une hélice de type A monocaténaire dans laquelle les bases sont empilées les unes sur les autres :
Méthode de séquençage des queues poly(A)
|
Les génes sont transcrits sous forme d'ARN messagers pré-matures (synonymes : transcrits primaires - pré-ARNm) qui contiennent des introns (séquences de l'ARN non retenues dans la séquence finale qui code la protéine ou l'ARN) et des exons qui sont assemblés selon différentes combinaisons (épissage alternatif). Les introns ont des tailles extrêmement variables : de plusieurs centaines de nucléotides à plusieurs centaines de milliers de nucléotides. L'épissage alternatif est le processus qui permet à un même gène de générer différents transcrits selon la combinaison des exons qui formeront l'ARN messager mature. L'épissage est effectué par deux réactions de trans-estérification au sein de complexes appelés spliceosomes formés, entre autres, de 5 particules ribonucléoprotéiques appelées SnRNP ("Small nuclear RiboNucleoProtein"). Ce sont des protéines associées à des petits ARN nucléaires ("small nuclear RNA" - snRNA) riches en uracile (U1, U2, U4, U5 et U6). Voir un cours sur l'épissage alternatif et le spliceosome. Figure ci-dessous : Les 5 types d'épissage alternatif 1 : site d'épissage alternatif 5' / 2 : site d'épissage alternatif 3' / 3 : rétention d'intron / 4 : exclusion mutuelle d'introns / 5 : exclusion - inclusion d'exon Les répercutions de l'épissage sur les marqueurs de séquence exprimée ou " EST " ("expressed sequence tags") que l'on peut obtenir sont les suivantes :
|
Les granules de dégradation des ARN ("Processing bodies" ou "P-bodies") sont des structures granulaires localisées dans le cytoplasme des cellules eucaryotes. Elles contiennent un très grand nombre de protéines et de nucléases impliquées dans la dégradation des ARNm, la répression traductionnelle, le "contrôle qualité" des ARNm, la dégradation des fragments d'ARN (introns - interférence ARN). Désadénylation : complexe PAN2 - PAN3 ou complexe CCR4-NOT. Enlèvement de la coiffe en 5' :
Digestion exo-nucléolytique de l'extrémité 3' :
Digestion exo-nucléolytique de l'extrémité 5' : XRN1 : 5'-3' exo-ribonucléase 1 (dégradation dans le sens 5' -> 3' des ARN en 5'-mononucléotides). Stimulée par Dcs1/Dcs2. Exemples de quelques autres protéines et enzymes constitutives des granules de dégradation des ARN chez l'homme : facteur d'initiation de la traduction eIF4E et de la répression de la traduction eIF4E-T, enzymes de dégradation d'ARNm non sens, protéine Argonaute, désoxy-cytidine désaminase, protéine FAST ("Fas-Activated Ser/Thr phosphoprotein"), ... |
3. Les ARN de transfert (ARNt) a. Synthèse et maturation des ARNt Les ARNt sont des petits ARN de 75 à 95 nucléotides. L'ARN polymérase Pol III transcrit les gènes codants les 32 ARNt. Les gènes codant les ARNt et les ARN ribosomiques (ARNr) sont fortement transcrits : environ 3 millions d'ARNt et 300.000 ribosomes par génération chez la levure (et environ 60.000 ARNm). Cela nécessite une grande coordination des activités de Pol III et de Pol I (pour les ARNr) et l'existence de nombreux processus de signalisation pour adapter la biosynthèse de ces ARN à la disponibilité des nutriments cellulaires et aux conditions environnementales. Pol III est régulée négativement (répression) par la protéine Maf1 (forme déphosphorylée) : elle inhibe le ré-assemblage du facteur de transcription général TFIII-B avec l'ADN. La biosynthèse des ARNt implique :
Les ARNm et les ARNr subissent des modifications qui semblent essentiellement co-transcriptionnelles (exception faite de la maturation du pré-ARNr 20S en ARNr 18S). A l'inverse, la transcription et les modification post-transcriptionnelles des ARNt se produisent dans différents compartiments sub-cellulaires, y compris le nucléole, le nucléoplasme, la membrane nucléaire interne (INM), le cytoplasme et la surface cytoplasmique des mitochondries. Les pré-ARNt contenant des introns sont exportés vers le cytoplasme via l'exportine Los1 et au moins une voie inconnue. Après l'épissage du pré-ARNt à la surface cytoplasmique des mitochondries, les modifications supplémentaires dans le cytoplasme et l'aminoacylation, l'ARNt chargé mature participe à la synthèse des protéines.
Source : Phizicky & Hopper (2010) Légende de la figure ci-dessus :
|
b. Bases modifiées dans les ARNt Figure ci-dessous : exemples de bases azotées modifiées dans les ARNt. La pseudouridine (Ψ) résulte d'une modification post-transcriptionnelle de l'uridine (isomérisation par rotation de 180° du cycle pyrimidine). C'est la modification la plus fréquente des bases des ARN et elle contribue à la stabilisation de la structure 3D des ARNt. La boucle TΨC comporte une pseudouridine. La ribothymidine (5-méthyluridine) est trouvée essentiellement dans la boucle T des ARNt à laquelle elle donne son nom. Lors de la transcription, une uridine est incorporée en position 54 dans le précurseur de l'ARNt puis cette uridine est modifiée par l'ARNt (uracile(54)-C(5))-méthyltransférase (EC 2.1.1.35) en ribothymidine. Elle joue un role important dans la stabilisation de la structure 3D des ARNt. La 5,6-dihydrouridine (boucle D) est non-plane. Elle perturbe les interactions d'empilement des bases dans les hélices et déstabilise la structure des ARN. Cette particularité est utilisée par certains organismes qui se développent à des températures trés basses et qui ont des ARNt riches en 5,6-dihydrouridine. Leurs ARNt restent ainsi localement flexibles à ces températures. L'inosine contient une purine particulière : l'hypoxanthine. L'inosine peut former des appariements de type wobble ("appariement bancal") I-U, I-A et I-C. Ainsi, l'inosine est fréquemment en première position de l'anti-codon des ARNt, permettant au même ARNt de s'apparier à plusieurs codons synonymes. L'inosine résulte de la désamination de l'adénine par l'adénine désaminase (EC 3.5.4.2). On trouve également : la 1-méthyladénosine, la 1-méthylguanosine, la 5-méthylcytidine, ... |
c. Structure tridimensionnelle des ARNt Les ARNt jouent un rôle capital dans la traduction. ils adoptent une structure repliée dans l'espace (figure ci-dessous) caractéristique d'un grand nombre de liaisons hydrogène établies entre bases distantes. Adapté de "Transfer RNA" (Wikipedia) L'extrémité 3' est appelée bras accepteur ("acceptor stem") : c'est là que se fixe l'acide aminé. Elle a la séquence CCA. Les autres parties des ARNt sont : T : boucle TΨC; A : boucle qui porte l'anti-codon; D : boucle D Les ARN de transfert portent, à l'extrémité 3' (bras accepteur), l'un des 20 acides aminés fixé par une liaison ester en 3'-OH ou en 2'-OH du ribofuranose de l'adénosine. Les ARN de transfert contiennent une séquence particulière de 3 nucléotides, appelée anticodon, qui est complémentaire des codons constitutifs de l'ARN messager. Source : Structure des acides nucléiques Les modifications post-transcriptionnelles (décrites ci-dessus) des ARNt jouent un rôle important dans l'appariement codon - anticodon. Par exemple, la transformation de l'adénosine (en position 37 - adjacente à l'extrémité 3' de l'anticodon) en 2-méthylthio-N6-threonyl carbamoyl adénosine (ms2t6A) est essentielle pour une traduction efficace par les ribosomes. Ces modifications post-transcriptionnelles jouent également un rôle important dans l'interaction de l'ARNt avec son aminoacyl-ARNt synthétase, l'enzyme qui lie spécifiquement un acide aminé. En apportant les 2 informations (anticodon et acide aminé) aux ribosomes, les ARNt établissent ainsi le lien entre l'information contenue par l'ARN messager (l'information génétique portée par leurs codons) et les acides aminés qui constituent la (ou les) protéine(s) codée(s) par cet ARN messager. Figure ci-dessous : ARNt-Gln à gauche de la figure (la glutamine est indiquée par la flèche rouge) fixé à la glutaminyl-ARNt synthétase (en marron - transparent à droite de la figure). |
d. Les aminoacyl-ARNt synthétases ("ligases forming aminoacyl-tRNA" ou "Aminoacyl-tRNA synthetase" - EC 6.1.1.-) Elles constituent une famille d'enzymes qui activent les acides aminés et les transfèrent aux ARNt spécifiques. Elles appartiennent à la classe 6 des ligases.
La réaction générale qu'elles catalysent est : ATP + L-acide aminé + tRNAAA → AMP + diphosphate + L-acide aminé-tRNAAA Réaction qui se décompose en :
Chez les procaryotes, il existe au moins 20 types d'aminoacyl-ARNt synthétases : 1 pour chaque acide aminé. Chez les eucaryotes, il existe en général 2 aminoacyl-ARNt synthétases pour chaque acide aminé : une forme cytosolique et une forme mitochondriale. Bien que ces aminoacyl-ARNt synthétases aient des fonctions identiques, elles sont très différentes tant en terme de taille de leurs sous-unités que de nombre (structure quaternaire). Quand plusieurs codons traduisent le même acide aminé (le code génétique est dit "dégénéré"), plusieurs ARNt (chacun avec un anticodon différent) portent le même acide aminé. Il n'existe que 20 aminoacyl-ARNt synthétases (pour les 20 acides aminés les plus fréquemment trouvés dans les séquences polypeptidiques), donc plusieurs ARNt interagissent avec la même aminoacyl-ARNt synthétase. |
Différences entre les 2 classes d'aminoacyl-ARNt synthétases | |
Classe I | Classe II |
Acides aminés fixés : Arg - Cys - Glu - Gln - Leu - Ile - Met - Tyr - Trp - Val | Acides aminés fixés : His - Pro - Ser - Phe - Thr - Asp - Asn - Lys - Gly - Ala |
Le site actif est constitué d'environ 170 acides aminés et n'inclue pas le domaine de fixation de l'extrémité 3' de l'ARNt (bras accepteur CCA) | Le site actif est constitué d'environ 250 acides aminés et inclue le domaine de fixation de l'extrémité 3' de l'ARNt (bras accepteur CCA) |
Le site actif est localisé dans la partie N-terminale de ces enzymes | Le site actif est localisé dans la partie C-terminale de ces enzymes |
Le site actif est formé par 5 ou 6 feuillets β parallèles entourés d'hélices α | Le site actif est formé par 1 feuillet β parallèle et 6 feuillets β anti-parallèles entourés d'hélices α |
Le site actif est un repliement basé sur un pli Rossmann. Elles possèdent les séquences consensus HIGH (début du site actif - 3 feuillets) et KMSKS (fin du site actif - feuillet E) Remarque : seules la première His et Gly sont totalement conservées / seule la seconde Lys est totalement conservée |
Le site actif est constitué de 3 motifs :
|
Ces enzymes fixent les acides aminés volumineux et encombrants : poche du site de fixation ouverte et accessible | Ces enzymes fixent les petits acides aminés : poche du site de fixation profondément enfouie |
Ces enzymes fixent le bras accepteur CCA via le petit sillon ("minor groove") de l'ARNt | Ces enzymes fixent le bras accepteur CCA via le grand sillon ("major groove") de l'ARNt |
La structure du bras accepteur CCA est déformée lors de la fixation de l'acide aminé | La structure du bras accepteur CCA reste sous forme d'hélice lors de la fixation de l'acide aminé |
Elles attachent l'acide aminé au groupement 2'-hydroxyle de l'adénosine (dernier nucléotide de l'ARNt - figures ci-dessus) | Elles attachent l'acide aminé au groupement 3'-hydroxyle de l'adénosine |
f. Activité d'édition de certaines aminoacyl-ARNt synthétases Les aminoacyl-ARNt synthétases doivent faire le minimum d'erreur dans le choix de l'acide aminé qu'elles fixent à l'ARNt correspondant. La conséquence serait des protéines non fonctionnelles. Les propriétés physico-chimiques des chaînes latérales des acides aminés sont suffisamment différentes pour que les aminoacyl-ARNt synthétases n'aient pas de difficulté à reconnaître l'acide aminé correct. De plus, différentes parties de chaque ARNt sont utilisées pour optimiser la reconnaissance. En moyenne, elles font 1 erreur sur 10.000. Cependant, pour certains acides aminés, cette reconnaissance peut -être difficile. C'est le cas en particulier de l'isoleucine. Elle est reconnue par une poche située dans la structure de l'isoleucyl-ARNt synthétase qui a une forme complémentaire de celle de l'isoleucine. Cette poche est :
Mais la valine, acide aminé légèrement plus petit que l'isoleucine (il n'en diffère que par 1 groupe méthyle), se fixe bien dans cette poche : 1 valine se fixe de manière erronée pour 150 isoleucines, taux d'erreur qui est bien trop élevé. Il existe donc une étape correctrice ("proofreading step"): l'isoleucyl-ARNt synthétase possède un second site actif qui catalyse une réaction d'édition de l'acide aminé fixé. En effet, l'isoleucine ne peut pas se fixer sur ce second site mais en revanche la valine peut s'y fixer : la liaison valine-ARNt est hydrolysée et la valine est éliminée. Cette étape correctrice diminue le taux d'erreur d'un facteur 3.000. |
La pyrrolysine et la pyrrolysyl-ARNt synthétase En 2002, on a découvert que le codon UAG (qui est usuellement un codon stop "ambre") présent dans le gène de la monométhylamine méthyltransferase de Methanosarcina barkeri (une archée méthanogènique) code pour un acide aminé modifié : la pyrrolysine (Pyl - O pour le code à 1 lettre). La pyrrolysine est le 22ème acide aminé protéinogènique (c'est-à-dire qui entre dans la composition des protéines). La pyrrolysine se comporte comme un acide aminé "classique" et est chargée directement sur son ARNt (ARNtPyl) par sa propre aminoacyl-ARNt synthétase : la pyrrolysyl-ARNt synthétase. Le 21ème acide aminé protéinogènique est la sélénocystéine (Sec - U pour le code à 1 lettre - codon UGA usuellement codon stop "opale"). La spécificité de reconnaissance de l'acide aminé correct par chaque ARNt est déterminée par un ensemble de caractéristiques structurales ("identity set"), composé d'un nombre limité de nucléotides, par exemple ceux de l'anticodon et du bras accepteur. Dans le cas de l'ARNt-Ala de Escherichia coli, cette spécificité de reconnaissance est liée uniquement à la seule paire de base G3-U70 située au milieu du bras accepteur. Source : Naganuma et al. (2014) Deux structures cristallines de l'alanyl-ARNt synthétase (de l'archée Archaeoglobus fulgidus) ont été obtenues en 2014 :
Au sein de la paire G3-U70, G3 est décalée vers le petit sillon et les deux bases subissent une légère rotation par rapport à la géométrie de type Watson-Crick de A3-U70. Source : Naganuma et al. (2014) Le domaine de reconnaissance de l'ARNt de l'alanyl-ARNt synthétase élargit le grand sillon et entre ainsi en contact avec les deux sillons (petit et grand) du bras accepteur. La comparaison des structures [alanyl-ARNt synthétase - ARNt-Ala/G3-U70] et [alanyl-ARNt synthétase - ARNt-Ala/A3-U70] montre que la différence locale de géométrie entre G3-U70 et A3-U70 induit une orientation radicalement différente de la région CCA76, de sorte que l'extrémité 3' de A76 de l'ARNt-Ala/A3-U70 est maintenue éloignée (20 Å) du site actif où a lieu l'aminoacylation. Ce mécanisme explique comment une différence mineure dans la séquence (G3 vs. A3) est responsable de la sélection spécifique de l'ARNt-Ala : la différence de fixation du subtrat n'est que d'un facteur 2 alors que la différence de la constante catalytique (kcat) est d'un facteur 100. |
4. Le noyau et les pores nucléaires Le noyau est séparé du cytoplasme par une double membrane (externe et interne, espacées de 30 nm). Le contenu du noyau communique avec le cytosol via des pores nucléaires. Adapté de "Biologie moléculaire de la cellule" Alberts et al. (1983) Tout l'ADN chromosomique est contenu dans le noyau. L'ADN est super-enroulé et enveloppé dans des fibres de chromatine associées à des protéines histones. La synthèse des ARN ribosomiques a lieu dans le nucléole qui est une structure nucléaire distincte au sein du noyau. Il est dépourvu de membrane et on peut en trouver plusieurs dans un même noyau.
L'enveloppe nucléaire ne peut être franchie qu'au niveau des pores nucléaires (2000 à 4000 par noyau). Les pores contrôlent l'état des ARN qui sortent du noyau. Les pores ne laissent entrer dans le nucléoplasme que les protéines qui possèdent une séquence signal qui les adresse au noyau ("nuclear localisation signal" - NLS). Ce filtrage des protéines est capitale pour la régulation de la transcription et la régulation de la réplication de l'ADN. Cette séquence signal est constituée d'acides aminés basiques qui forment des motifs du type FKKKRKV ou KRFAATKKAGQAKKKK, reconnus par une protéine adaptatrice, l'importine α qui interagit ensuite avec son récepteur, l'importine β. Le pore nucléaire est un complexe protéique (une particule) de 1,2 108 Da : il est constitué de : 2 anneaux / 1 réseau central / 8 rayons / 8 filaments coté cytoplasme /8 filaments coté nucléoplasme qui adoptent une disposition en panier ("basket") /1 anneau distal. Les protéines et les ARN qui traversent le pore nucléaire se fixent aux filaments. L'essentiel des protéines qui constituent le pore nucléaire sont des nucléoporines. Voir un cours sur la composition et la structure des membranes. |
5. Les ribosomes Les ribosomes sont des complexes ribonucléoprotéiques universels : ils sont présents dans les cellules des eucaryotes et des procaryotes. Ils ont été découverts en 1955 par George Palade (Prix Nobel en 1974). Ils sont localisés dans le cytoplasme. Ches les eucaryotes, ils sont libres ou associés à la membrane nucléaire ou à la membrane du réticulum endoplasmique. Le génome de l'homme contient environ 200 gènes (sur 5 chromosomes) codant les ARN ribosomiques. Trois des ARN ribosomiques sont transcrits dans les zones fibrillaires du nucléole par l'ARN polymérase I sous la forme d'un précurseur 35S d'environ 14.000 nucléotides. La séquence de ce précurseur est hydrolysée en ARN ribosomique 5,8 S, 18 S et 28 S. Le 4ème ARN ribosomique 5S (codé par un gène différent) est transcrit par l'ARN polymérase III dans le nucléoplasme. Les ARN ribosomiques s'associent à des protéines importées dans le nucléole et forment les deux types de sous unités (petite et grande) des ribosomes. Les ribosomes sont donc des complexes ribonucléoprotéiques colossaux (300.000 atomes). |
Organisme ou organite | Caractéristiques | Petite sous-unité | Grande sous-unité | ||||
|
70 S |
30 S | 1 ARN ribosomique 16 S (1540 nucléotides) | 21 protéines | 50 S |
|
34 protéines |
eucaryotes (ribosome cytoplasmique) |
80 S Ø 275 Å |
40 S 1,4 106 Da |
1 ARN ribosomique 18 S (1869 nucléotides) | 33 protéines |
60 S 2,8 106 Da |
|
49 protéines |
S est le symbole du Svedberg, unité de mesure du taux de sédimentation (en l'honneur de T. Svedberg, prix Nobel de chimie en 1926). "The Rfam database" : base de données des familles d'ARN |
b. La biosynthèse et la maturation des ARN ribosomiques La biosynthèse puis le processus d'assemblage des ribosomes impliquent plus de 200 facteurs protéiques non ribosomiques appartenant à différentes familles d'enzymes qui utilisent de l'énergie :
Environ 75 petits ARN nucléolaires ("small nucleolar RNAs" - snoRNAs) sont également requis pour les modifications chimiques des ARN ribosomiques : 2'O-ribose-méthylation par les "C/D box snoRNAs" et la pseudo-uridylation par les "H/ACA box snoRNAs". Le précurseur des sous-unités est un complexe appelé "Small SubUnit processome" ou "SSU processome" ou pré-ribosome 90S (complexe ribonucléoprotéique de 2.2 106 Da chez les eucaryotes) qui contient, entre autres, plus de 20 facteurs protéiques non ribosomiques, la particule sno-RNP ("sno-RiboNucléoProteic particle") U3 et le pré-ARNr 35S. La biosynthèse des ARN des deux sous-unités ribosomiques débute dans le nucléole, par la transcription par l'ARN polymérase I du précurseur commun : le pré-ARNr 35S. Ce précurseur contient les séquences des ARNr mature 18S, 5,8S et 25S :
Figure ci-dessus : maturation du pré-ARNr 35S chez la levure (eucaryotes) Sous-unité 40S
Sous-unité 60S
|
|
Source figures : "Principes de Biochimie" Horton et al. (1994) |
Figure ci-dessous : modèle de l'ARN de la grande sous-unité du ribosome. Source : Armache et al. (2010) Ce modèle est basé sur la carte électronique obtenue par cryomicroscopie électronique (à une résolution de 5.5 Å) du ribosome 80S de Triticum aestivum en cours de traduction. Voir 2 articles capitaux qui ont décrit la structure 3D des ribosomes et leur mode de fonctionnement : Ban et al. (2000); Nissen et al. (2000). Ensuite, les ribosomes sont :
La fonction des ribosomes est de synthétiser les protéines en décodant l'information contenue dans les ARN messagers : c'est la traduction. La petite sous-unité fixe l'ARN messager et la grande sous-unité fixe les ARN de transfert. Quand la traduction est terminée, les deux sous-unités se dissocient. Plusieurs ribosomes peuvent être associés à un même ARNm et chacun de ces ribosomes synthètise une chaîne polypeptidique (photographie ci-dessous). Ces groupes de ribosomes sont appelés polyribosomes. Source : "Role of the Ribosome" University of Texas Voir une trés belle animation du processus. (Source : Alberts et al., "Essential Cell Biology" (Second Edition) - Ed. Garland Science Publishing) |
La traduction suit un ordre précis d'événements : initiation, élongation et terminaison de la traduction. La traduction est un processus cyclique au cours duquel la terminaison suit l'élongation qui elle-même suit l'initiation et ainsi de suite. Les sous-unités du ribosome sont dissociées à la fin de la terminaison avant qu'un nouveau cycle ait lieu. Ces événements requièrent un très grand nombre de protéines appelés facteurs. La synthèse peptidique s'effectue de l'extrémité N-terminale vers l'extrémité C-terminale de la chaîne polypeptidique : l'élongation s'effectue par addition séquentielle d'un acide aminé à l'extrémité C-terminale de la chaîne polypeptidique liée au ribosome. Figure ci-dessous : ensemble des processus de synthèse, de maturation et de dégradation des ARNm chez Saccharomyces cerevisiae. Cette vision d'ensemble résulte de l'analyse par apprentissage profond ("deep-learning") de plus de 100.000 séquences de gènes et des produits de transcription de plus de 20.000 expériences RNA-seq de 7 organismes modèles (dont Homo sapiens et Saccharomyces cerevisiae). UTR : "UnTranslated Regions" - région non traduite; ORF : "Open Reading Frame" - phase de lecture ouverte; CDS : "CoDing Sequence" - séquence codante; TFBS : "Transcription Factor Binding sites" - site de fixation du facteur de transcription. Source : Zrimec et al. (2020) |
a. Initiation de la traduction L'initiation de la traduction chez les procaryotes et les eucaryotes requiert un ARNt initiateur particulier : le Met-ARNtiMet utilisé pour incorporer le résidu méthionine initial de toutes les protéines. Chez Escherichia coli, une forme spécifique de Met-ARNtiMet est nécessaire pour l'initiation : le N-formylméthionine-ARNtifmet (fMet-ARNtifMet). La formylation s'effectue après que la méthionine soit attachée à l'ARNt. Elle est catalysée par la methionyl-ARNt formyltransférase (E.C. 2.1.2.9): 10-formyltétrahydrofolate + Met-ARNtifMet => tétrahydrofolate + fMet-ARNtifMet Le Met-ARNtiMet et le fMet-ARNtifMet reconnaissent le même codon d'initiation : 5'-AUG-3'. Dans les ARN polycistroniques des procaryotes, le codon AUG est adjacent à un élément Shine-Dalgarno. Cet élément est reconnu par complémentarité de séquences dans l'ARNr 16S de la petite sous-unité. |
Facteurs d'initiation de la traduction chez les eucaryotes et leurs fonctions | |
eIF-1 |
|
eIF-2 (protéine G) |
|
eIF-2B ou GEF ("Guanine Nucleotide Exchange Factor") : 5 sous-unités (α à ε) | Echange GTP/GDP pendant le recylcage de eIF-2 |
eIF-3 (13 sous-unités : eIF-3A à eIF-3M / chez l'homme : p170, p116, p110, ...) | Empêche l'association des sous-unités du ribosome en se fixant à la sous-unité 40S |
eIF-4F : complexe d'initiation composé de 3 sous-unités (eIF-4E, eIF-4A et eIF-4G) et d'au moins 2 facteurs additionnels (PABP, Mnk1 ou Mnk2) |
|
PABP ("PolyA-Binding Protein") | Se fixe à la queue poly-A des ARNm et fournit un site de fixation à eIF-4G |
Mnk1 et Mnk2 : eIF-4E kinases | MAP-kinases : phosphorylent eIF-4E ce qui accroit son association avec la coiffe |
eIF-4A | Hélicase d'ARN ATPase-dépendante - "DEAD box helicase family" |
eIF-4E |
|
eIF4E-BP1 (ou 4E-BP ou PHAS-I), eIF4E-BP2 et eIF4E-BP3 |
|
eIF-4G |
|
eIF-4B |
|
eIF-5 (GTPase) |
|
eIF-6 | Se fixe à la sous-unité 60S et empêche son association avec la sous-unités 40S du ribosome (le complexe d'initiation 80S n'est pas formé) |
Figure ci-dessous : les toutes premières étapes de l'initiation de la traduction. S'ensuivent :
Pour plus de détails, voir la figure 1 de la revue Jackson et al. (2010). Figure ci-dessous : modèle d'une sous-unité 40S avec eIF-3 (magenta) fixé sur sa surface exposée au solvant et eIF-4G (pourpre) attaché à eIF-3 près du site E. L'ARNm est en rouge et eIF-1 est en vert. 5'm7G : reconnaissance de l'extrémité m7GpppG-5' de la coiffe. Source : Jackson et al. (2010) Le site A ou Aminoacyl est le site du ribosome le plus fréquemment occupé par l'aminoacyl-ARNt. Dans le site A, l'aminoacyl-ARNt fonctionne comme accepteur lors de la formation de la liaison peptidique. Le site P ou Peptidyl est le site du ribosome le plus fréquemment occupé par le peptidyl-ARNt, c'est-à-dire l'ARNt qui porte la chaîne polypeptidique en croissance. Le site P est aussi appelé le site sensible à la puromycine, un antibiotique qui a des similitudes structurales avec une partie de l'aminoacyl-ARNt. Quand la puromycine se trouve au site A, elle peut former une liaison peptidique avec la chaîne polypeptidique en croissance. Le site E ou Exit est le site du ribosome occupé par l'ARNt qui part du ribosome. |
b. Elongation de la traduction L'élongation nécessitent des facteurs d'élongation :
EF-Tu et EF2 sont des petites protéines fixant le GTP ("small GTP-binding proteins"). Etape 1 : décodage EF-Tu-GTP se fixe et délivre un aminoacyl-ARNt au site A du ribosome. EF-Tu reconnaît et fixe tous les aminoacyl-ARNt avec à peu près la même affinité (quand chaque ARNt est lié à l'acide aminé correct). L'ARNt doit avoir l'anticodon correct pour interagir avec le codon de l'ARNm positionné sur le site A pour établir une paire de bases avec la bonne géométrie. Les bases universellement conservées de l'ARNr 16S (chez les procaryotes) interagissent avec et imprime la configuration du petit sillon ("minor groove") de la courte portion de double hélice formée par les 2 premières paires de bases du complexe [codon/anticodon]. Une conformation particulière du ribosome est stabilisée par cette interaction, ce qui fournit un mécanisme pour détecter si l'ARNt lié est correct. La relecture - correction (activité "proofreading") implique en partie la libération de l'aminoacyl-ARNt avant la formation de la liaison peptidique, si la conformation du ribosome générée par cette interaction n'est pas correcte. Le changement de conformation du ribosome qui résulte de la formation du complexe [codon-anticodon] correct entraîne un changement de conformation du site actif de EF-Tu fixé ce qui induit l'apparition de son activité GTPase. Quand EF-Tu délivre l'aminoacyl-ARNt au ribosome, l'ARNt possède initialement une conformation déformée. Quand le GTP fixé sur EF-Tu est hydrolysé en [GDP + Pi], EF-Tu subit un grand changement de conformation et se dissocie du complexe. La conformation de l'ARNt se relâche et le bras accepteur est repositionnée pour favoriser la formation de la liaison peptidique. Ce processus s'appelle l'accomodation. L'accomodation inclue la rotation de l'extrémité 3' simple brin du bras accepteur de l'ARNt au site A autour d'un axe qui traverse le centre peptidyl transférase de la grande sous-unité du ribosome. Ceci positionne l'extrémité 3' avec son acide aminé attaché dans le site actif près de l'extrémité 3' de l'ARNt au site P, et près de l'embouchure du tunnel par lequel le polypeptide naissant quitte le ribosome. Voir un site extrêmement détaillé sur ce processus. L'interaction de EF-Ts avec EF-Tu libère le GDP de EF-Tu. Après dissociation de EF-Ts, EF-Tu fixe de nouveau le GTP présent dans le cytosol à une concentration plus élevée que le GDP. Etape 2 : formation de la liaison peptidique La transpeptidation ou formation de la liaison peptidique implique une attaque nucléophile du groupement aminé de l'acide aminé lié au groupement hydroxyle en 3' de l'adénosine terminale de l'ARNt au site A sur le groupement carbonyle de l'acide aminé (auquel est attaché le polypeptide naissant) lié par une liaison ester à l'ARNt au site P. La formation de la liaison peptidique est catalysée par le ribosome lui-même : elle est favorisée par la géométrie du "site actif" de l'ARNr 23S (chez les procaryotes) de la grande sous-unité ribosomique. L'ARNr 23S peut être considéré comme un ribozyme à activité peptidyl transférase. Etape 3 : translocation Le ribosome déplace un codon vers l'avant sur l'ARNm. Le codon suivant de l'ARNm est disponible pour l'interaction avec un nouvel aminaoacyl-ARNt au site A. Simultanément, l'ARNt "vide" est décalé du site P vers le site E et le peptidyl-ARNt est transloqué du site A au site P. Le processus est facilité par le facteur d'élongation EF2 et le GTP. La wybutosine :
c. Terminaison de la traduction Ces étapes sont répétées jusqu'à ce que le ribosome rencontre un codon STOP dans le cadre de lecture: UAG, UAA ou UGA. La traduction se termine quand l'un de ces codons occupe le site A. Les codons STOP n'ont aucun ARNt correspondant. Au lieu de cela, les codons STOP sont reconnus par la protéine RF1 ("Releasing Factor 1" - facteur de libération 1) ou eRF chez les eucaryotes (il y a 2 facteurs de terminaison chez les procaryotes et un seul chez les eucaryotes). L'activité de RF1 est stimulée par RF3 (une protéine fixant le GTP). Le complexe [RF1 / RF3] se lie aux ribosomes qui ont un codon STOP au site A : il stimule le clivage de la liaison ester entre le peptide et le peptidyl-ARNt, libérant ainsi la nouvelle protéine du ribosome. Les facteurs sont libérés du ribosome après hydrolyse du GTP. Le ribosome commence un nouveau cycle de traduction sur le même ARNm dans la plupart des cas. |
Quelques antibiotiques et toxines inhibiteurs de la traduction | |
Chloramphénicol | Inhibe l'activité peptidyl transférase chez les procaryotes |
Cycloheximide | Inhibe l'activité peptidyl transférase chez les eucaryotes |
Streptomycine / Néomycine | Inhibent l'initiation de la chaîne peptidique chez les procaryotes et induisent des erreurs de lecture des ARNm |
Tétracycline | Inhibe la liaison de l'aminoacyl-ARNt à la petite sous-unité du ribosome |
Erythromycine | Inhibe la translocation via la grande sous-unité du ribosome chez les procaryotes |
Acide fusidique | Similaire à l'érythromycine en empêchant la dissociation de EFG de la grande sous-unité du ribosome |
Puromycine | Ressemble à un aminoacyl-ARNt : elle interfère avec le transfert de peptide entraînant une interruption prématurée de la terminaison chez les procaryotes et les eucaryotes |
Ricine (trouvée dans les graines de ricin) | Catalyse le clivage des ARNr de la grande sous-unité du ribosome chez les eucaryotes |
Toxine diphthérique | Cette toxine est une protéine de Corynebacterium diphtheriae qui provoque la diphtérie : elle catalyse l'ADP-ribosylation et l'inactivation du facteur d'élongation eEF2. La diphtamide stabilise le complexe codon-anticodon lors de la transition du site A vers le site P : eEF2 interagit avec le codon de l'ARNm exclusivement via la diphtamide, qui fait saillie dans une fente formée par l'ARNm, l'ARNt dans l'étét ap/P et l'ARNr. |
Voir un cours sur les métabolites secondaires. |
Au moins 16 structures cristallographiques de ribosomes 80S de Saccharomyces cerevisiae, complexés avec 12 inhibiteurs spécifiques des eucaryotes et 4 inhibiteurs à large spectre, ont été déterminées.
Le schéma ci-dessous montre les étapes de la synthèse des protéines chez les Eukaryotes inhibées par les petits inhibiteurs. Source : Garreau de Loubresse et al. (2014) |
7. Le réticulum endoplasmique (RE) C'est une extension de la membrane du noyau. Le RE est divisé en RE lisse et RE rugueux (sa surface est couverte de ribosomes), en fonction de son apparence au microscope.
Source : "L'organisation structurale de la cellule" Lors de leur biosynthèse, environ un tiers des protéines d'une cellule sont dirigées vers le RE pour y être repliées, y subir un contrôle de leur repliement correct et des maturations diverses. Voir la réponse au stress lié à l'accumulation de protéines mal repliées dans le réticulum endoplasmique : "Unfolded protein response" (UPR). Voici quelques exemples de protéines acheminées vers le RE :
|
8. Le canal de translocation des protéines ou translocon Voir un cours sur la biogénèse des protéines membranaires intégrales. Le transit des protéines dans le réticulum endoplasmique s'effectue via un transporteur, situé dans la membrane du RE, appelé canal de translocation des protéines ("Protein Conducting Channel" - PCC) ou translocon (eucaryotes). Source : Rapoport T.A. (2007) Figure ci-dessus : structure 3D de SecYEG (PDB 2AKI) Il est constitué de plusieurs protéines qui forment un pore (d'environ 4 nm de diamètre) qui permet le passage de la chaîne polypeptidique en cours de biosynthèse, du ribosome vers la lumière du RE. Le canal de translocation est constitué de SecY ou Sec61α (selon le règne) qui est la sous-unité principale avec 10 domaines transmembranaires et de plus petites sous-unités localisées en périphérie de ce canal.
Les nomenclatures des sous-unités sont les suivantes :
Figure ci-dessous : reconstruction du complexe [ribosome - chaîne polypeptidique en cours de biosynthèse - translocon]. Les données structurales ont été obtenue par cryo-microscopie électronique. Source : Equipe Schaffitzel - EMBL
|
Visualisation du canal de translocation des protéines de Escherichia coli obtenue par cryo-microscopie électronique à une résolution de 14,9 Å (2005) Code PDB : 2AKI
|
Certaines chaînes polypeptidiques commencent par une séquence appelée peptide signal qui indique à la cellule le compartiment vers lequel les adresser. Chez les eucaryotes, un complexe ribonucléoprotéique [ARN 7S / 6 polypeptides] appelé "particule de reconnaissance du signal" ("signal recognition particle" - SRP) se fixe au peptide signal qui émerge du ribosome.
La chaîne polypeptidique en cours d'élongation emprunte le canal pour passer entièrement dans la lumière du RE (dans le cas d'une protéine sécrétée, dirigée vers l'appareil de Golgi) ou pour être intégrée à la membrane (dans le cas d'une protéine membranaire). Il s'agit donc d'un transport co-traductionnel puisque l'élongation de la chaîne polypeptidique continue pendant le passage dans le RE. Le cycle SRP est un processus dont l'énergie est fournie par l'hydrolyse du GTP : le SRP et le récepteur du SRP possèdent une acticité GTPase. La chaîne polypeptidique transportée doit contenir au moins 70 acides aminés pour entrer : 40 acides aminés se trouvent au niveau du ribosome et 30 acides aminés sont dans le canal de translocation. Ce pore fonctionne dans l'autre sens pour éliminer les protéines mal repliées : c'est le transport rétrograde. Voir un cours sur la biogénèse des protéines membranaires intégrales. |
9. Quelques notions sur le code génétique et les codons Le code génétique a été élucidé au cours des années 1960-1965. Le code génétique est universel :
Il correspond à un ensemble d'entités structurales nucléotidiques appelés codons. Le codon génétique correspond à l'enchaînement ordonné de 3 bases nucléotidiques (ou triplet) permettant de définir le code d'un acide aminé. Il existe 4 nucléotides dans l'ARN messager : U, C, A et G. Il y a donc 43 = 64 codons différents pour définir l'ensemble des 20 acides aminés utilisés dans la synthèse des protéines. Le code génétique est dit redondant ou dégénéré. Le codon AUG code une méthionine : ce codon initie la traduction de toutes les chaînes polypeptidiques. Il code aussi toute méthionine interne à la chaîne polypeptidique. Trois codons (UAA, UAG, UGA) sont des codons qui ne peuvent pas être traduits en acides aminés : ce sont des codons appelés non sens ou STOP. Leur rôle est d'arrêter la traduction. |
nombre de codons | 1 | 2 | 3 | 4 | 6 |
acide aminé | Met & initiation - Trp | Lys - Asn - Gln - His - Glu - Asp - Tyr - Cys - Phe | Ile - STOP | Thr - Pro - Ala - Gly - Val | Arg - Ser - Leu |
1ère position | 2ème position | 3ème position | |||||||
U | C | A | G | ||||||
U | UUU | phenylalanine | UCU | sérine | UAU | tyrosine | UGU | cystéine | U |
UUC | UCC | UAC | UGC | C | |||||
UUA | leucine | UCA | UAA | STOP | UGA | STOP | A | ||
UUG | UCG | UAG | UGG | tryptophane | G | ||||
C | CUU | CCU | proline | CAU | histidine | CGU | arginine | U | |
CUC | CCC | CAC | CGC | C | |||||
CUA | CCA | CAA | glutamine | CGA | A | ||||
CUG | CCG | CAG | CGG | G | |||||
A | AUU | isoleucine | ACU | thréonine | AAU | asparagine | AGU | sérine | U |
AUC | ACC | AAC | AGC | C | |||||
AUA | ACA | AAA | lysine | AGA | arginine | A | |||
AUG | méthionine codon initiation |
ACG | AAG | AGG | G | ||||
G | GUU | valine | GCU | alanine | GAU | aspartate | GGU | glycine | U |
GUC | GCC | GAC | GGC | C | |||||
GUA | GCA | GAA | glutamate | GGA | A | ||||
GUG | GCG | GAG | GGG | G |
Résultats du séquençage du génome humain Pour chacun des 64 codons, sont montrés sur la figure ci-dessous : Source : Lander et al. (2001)
Exemple de la phénylalanine (Phe)
Voir un cours sur les méthodes de séquençage de l'ADN et de l'ARN. |
12. Liens Internet et références bibliographiques |
"Principes de Biochimie" Horton, Moran, Ochs, Rawn et Scrimgeour (1994) - Ed. DeBoeck Universités - ISBN : 2-8041-1578-X |
|
Roger D. Kornberg - "The Molecular Basis of Eukaryotic Transcription" - Nobel Lecture (2006) - Cell Death & Differentiation 14, 1989 - 1997 Roger D. Kornberg - Prix Nobel de chimie 2006 Wang et al. (1979) "Molecular structure of a left-handed double helical DNA fragment at atomic resolution" Nature 282, 680 - 686 He et al. (2013) "Structural visualization of key steps in human transcription initiation" Nature 495, 481 - 486 |
|
Schaller et al. (1975) "Nucleotide sequence of an RNA polymerase binding site from the DNA of bacteriophage fd" PNAS 72, 737 - 741 Pribnow D. (1975) "Nucleotide sequence of an RNA polymerase binding site at an early T7 promoter" PNAS 72, 784 - 788 Burmann & Rösch (2011) "The role of E. coli Nus-factors in transcription regulation and transcription:translation coupling. From structure to mechanism" Transcription 2, 130 - 134 |
|
Sarkar N. (1997) "Polyadenylation of mRNA in prokaryotes" Annual Rev. Biochem. 66, 173-197 Cheng et al. (2005) "Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution" Science 308, 1149 - 1154 Phizicky & Hopper (2010) "tRNA biology charges to the front" Genes Dev. 24, 1832 - 1860 Goldman et al. (2013) "Towards practical, high-capacity, low-maintenance information storage in synthesized DNA" Nature 494, 77 - 80 |
|
Bashkirov et al. (1997) "A mouse cytoplasmic exoribonuclease (mXRN1p) with preference for G4 tetraplex substrates" J. Cell Biol. 136, 761 - 773 Eulalio et al. (2007) "P bodies: at the crossroads of post-transcriptional pathways" Nature Rev. Mol. Cell Biol. 8, 9 - 22 Parker, R. (2012) "RNA Degradation in Saccharomyces cerevisae" Genetics 191, 671 - 702 |
|
"Ribosome - Reference pathway" : document interactif qui décrit l'ensemble des ARN et des protéines ribosomales eucaryotes et procaryotes. "EMDataBank : The Unified Data Resource for 3-Dimensional Electron Microscopy" "Overview and Structure of Aminoacyl-tRNA Synthetases" "tRNA & Ribosomes" Fekner & Chan (2011) "The pyrrolysine translational machinery as a genetic-code expansion tool" Curr. Opin. Chem. Biol. 15, 387 - 391 |
|
Un excellent descriptif des pores nucléaires et des complexes nucléoporines : "The nuclear pore complex becomes alive: new insights into its dynamics and involvement in different cellular processes" Alves & Doye (2003) "Assemblage des pores nucléaires en fin de mitose" M/S : médecine sciences 19, 1193 - 1194 |
|
Ban et al. (2000) "The Complete Atomic Structure of the Large Ribosomal Subunit at 2.4 Å Resolution" Science 289, 905 -920 Nissen et al. (2000) "The Structural Basis of Ribosome Activity in Peptide Bond Synthesis" Science 289, 920 -930 Rapoport T.A. (2007) "Protein translocation across the eukaryotic endoplasmic reticulum and bacterial plasma membranes" Nature 450, 663 - 669 Armache et al. (2010) "Localization of eukaryote-specific ribosomal proteins in a 5.5-Å cryo-EM map of the 80S eukaryotic ribosome" PNAS 107, 19754 - 19759 |
|
Lander et al. (2001) "Initial sequencing and analysis of the human genome" Nature 409, 860 - 921 Jackson et al. (2010) "The mechanism of eukaryotic translation initiation and principles of its regulation" Nat. Rev. Mol. Cell Biol. 11, 113 - 127 Garreau de Loubresse et al. (2014) "Structural basis for the inhibition of the eukaryotic ribosome" Nature 513, 517 - 522 Hofer & Jaschke (2016) "Molecular biology: A surprise beginning for RNA" Nature 535, 359 - 360 |
|
Kelleher et al. (1990) "A novel mediator between activator proteins and the RNA polymerase II transcription apparatus" Cell 29, 1209 - 1215 Allen & Taatjes (2015) "The Mediator complex: a central integrator of transcription" Nat. Rev. Mol. Cell Biol. 16, 155 - 166 Nozawa et al. (2017) "Core Mediator structure at 3.4 Å extends model of transcription initiation complex" Nature doi:10.1038/nature22328 |
|
Kim et al. (2018) "Integrative Structure and Functional Anatomy of a Nuclear Pore Complex" Nature 555, 475 - 482 Amin et al. (2019) "Evaluation of deep learning in non-coding RNA classification" Nat. Machine Intell. 1 246 - 256 Diemer et al. (2020) "A cysteine selenosulfide redox switch for protein chemical synthesis" Nat. Commun. 11, 2558 Zrimec et al. (2020) "Deep learning suggests that gene expression is encoded in all parts of a co-evolving interacting gene regulatory structure" Nat. Commun. 11, 6141 |
|
Passmore & Coller (2021) "Roles of mRNA poly(A) tails in regulation of eukaryotic gene expression" Nat. Rev. Mol. Cell Biol. doi: 10.1038/s41580-021-00417-y Misiaszek et al. (2021) "Cryo-EM structures of human RNA polymerase I" Nat. Struct. Mol. Biol. 28, 997 - 1008 Djumagulov et al. (2021) "Accuracy mechanism of eukaryotic ribosome translocation" Nature 600, 543 - 546 |
|
Chen et al. (2023) "Engineering circular RNA for enhanced protein production" Nat. Biotechnol. 41, 262 - 272 |