Quelques notions sur le code génétique et les codons |
Le code génétique a été élucidé au cours des années 1960-1965. Le code génétique est universel : il est le même dans tous les organismes aussi bien chez les eucaryotes que chez les procaryotes. Il existe des exceptions en particulier en ce qui concerne l'ADN des mitochondries humaines. Il correspond à un ensemble d'entités structurales nucléotidiques appelés codons. Le codon génétique correspond à l'enchaînement ordonné de 3 bases nucléotidiques (ou triplet) permettant de définir le code d'un acide aminé. |
Il existe 4 nucléotides dans l'ARN messager : U, C, A et G. Il y a donc 43 = 64 codons différents pour définir l'ensemble des 20 acides aminés utilisés dans la synthèse des protéines. Le code génétique est dit redondant ou dégénéré. Le codon AUG code pour une méthionine : ce codon initie la traduction de toutes les chaînes polypeptidiques. Il code aussi toute méthionine interne à la chaîne polypeptidique. Trois codons (UAA, UAG, UGA) sont des codons qui ne peuvent pas être traduits en acides aminés : ce sont des codons appelés non sens ou STOP. Leur rôle est d'arrêter la traduction. |
|
nombre de codons | 1 | 2 | 3 | 4 | 6 |
acide aminé | Met & initiation - Trp | Lys - Asn - Gln - His - Glu - Asp - Tyr - Cys - Phe | Ile - STOP | Thr - Pro - Ala - Gly - Val | Arg - Ser - Leu |
Résultats du séquençage du génome humain. Voir un cours sur le séquençage. Pour chacun des 64 codons, sont montrés sur la figure ci-contre :
|
Exemple de la phénylalanine :
|
1ère position | 2ème position | 3ème position | |||||||
U | C | A | G | ||||||
U | UUU | phenylalanine | UCU | sérine | UAU | tyrosine | UGU | cystéine | U |
UUC | UCC | UAC | UGC | C | |||||
UUA | leucine | UCA | UAA |
STOP |
UGA |
STOP |
A | ||
UUG | UCG | UAG | UGG | tryptophane | G | ||||
C | CUU | CCU | proline | CAU | histidine | CGU | arginine | U | |
CUC | CCC | CAC | CGC | C | |||||
CUA | CCA | CAA | glutamine | CGA | A | ||||
CUG | CCG | CAG | CGG | G | |||||
A | AUU | isoleucine | ACU | thréonine | AAU | asparagine | AGU | sérine | U |
AUC | ACC | AAC | AGC | C | |||||
AUA | ACA | AAA | lysine | AGA | arginine | A | |||
AUG |
méthionine codon initiation |
ACG | AAG | AGG | G | ||||
G | GUU | valine | GCU | alanine | GAU | aspartate | GGU | glycine | U |
GUC | GCC | GAC | GGC | C | |||||
GUA | GCA | GAA | glutamate | GGA | A | ||||
GUG | GCG | GAG | GGG | G |
La phase ouverte de lecture ou cadre ouvert de lecture ("Open Reading Frame - ORF") est une séquence du brin d'ADN transcrit en ARN qui :
La séquence du brin de l'ADN transcrit en ARN étant lue par triplets, il y a 3 phases de lecture possibles, avec un décalage de 1 nucléotide pour passer d'une phase à une autre. |