Les microprotéines ou micropeptides biologiquement actifs |
Tweet |
1. Introduction 2. Origine génomique des microprotéines et micropeptides a. Les "small Open Reading Frames" ou smORF 3. Techniques d'isolement et d'analyse des ARN traduits |
4. Exemples de microprotéines ou micropeptides et de leurs diverses fonctions biologiques 5. Rôles de microprotéines ou micropeptides bien caractérisés 6. Illustration de la microprotéine PIGBOS 7. Communication intracellulaire de la mitochondrie 8. Liens Internet et références bibliographiques |
1. Introduction L'analyse des génomes, des transcriptomes et des protéomes révèle l'existence de milliers de courts cadres de lecture ouverts (smORF - "small Open Reading Frame", parfois sORF - "short Open Reading Frame") qui sont traduits mais non annotés comme tel. La découverte de ces smORF et des microprotéines ou micropeptides pour lesquels ils codent ("smORF-Encoded Polypeptide", SEP) :
Bien qu'il n'y ait pas de bornes "officielles", on considère généralement :
Avant la découverte des smORF et des microprotéines ou micropeptides, on considérait que la plupart des peptides et des petites protéines avaient pour origine la maturation de la chaîne polypeptidique de longs précurseurs par hydrolyse (protéolyse). Par exemple, le glucagon est une hormone de 29 acides aminés produite par le pancréas quand le taux de glucose sanguin baisse. Le glucagon est synthétisé sous forme d'un précurseur : le proglucagon qui est hydrolysé en 8 chaînes polypeptidiques. Source : Drucker D.J. (2005)
Exemple 1
Exemple 2
Exemple 3 La comparaison de la distribution de la longueur des peptides de Saccharomyces cerevisiae (souche S288C) à partir des annotations en 1997 et en 2015 révèle que les changements les plus prononcés sont associés aux produits de la traduction des smORF. Chaque barre des histogrammes représente 50 résidus d'acides aminés. Source : Erpf & Fraser (2018) Voir une liste des smORF prédites à partir des génomes entiers et des régions intergéniques de plusieurs génomes de champignons. |
2. Origine génomique des microprotéines et micropeptides a. Les "small Open Reading Frames" ou smORF Les transcrits ARN messagers contiennent plusieurs cadres de lecture ouverts (ORF) de longueurs variables (flèches grises) : Source : Makarewich & Olson (2017)
La plupart des ORF des génomes animaux sont des smORF dans des régions non transcrites (ORF intergéniques en bleu clair) et sont considérées comme non fonctionnelles. Les ORF de 101 codons ou plus (ORF canoniques en violet) sont généralement traduites en protéines annotées avec des fonctions prédites. Source : Couso & Patraquim (2017) Les smORF de 10 à 100 codons (codant des microprotéines potentiellement fonctionnelles) peuvent être classées selon le type de transcrit pour lequel elles codent :
Source : Couso & Patraquim (2017) Exemples d'outils bioinformatiques pour la recherche de ces types d'ORF
|
b. Pri-miARN et micropeptides Les miARN sont synthétisés dans le noyau sous forme de pri-miARN ("primary-miRNA") à partir des gènes (poly-cistrons) miRNA transcrits par l'ARN polymérase II ou III. Certains pri-miARN contiendraient des smORF codant des micropeptides.
Source : Wang et al. (2019) Exemples chez les plantes :
Chez l'homme, les pri-miR200a et pri-miR200b codent respectivement les micropeptides miPEP200a (187 acides aminés) et miPEP200b (54 acides aminés) qui inhibent la progression du cancer. |
3. Techniques d'isolement et d'analyse des ARN traduits Le translatome correspond à toutes les entités biologiques directement impliquées dans la traduction : les ARN messagers en cours de traduction (appelés "Ribosome Nascent-chain Complex messenger RNA", RNC-mRNA), les ribosomes, les ARN de transfert, certains ARN régulateurs (miRNA, lncRNA, ...). Le domaine en omique est la translatomique. Les techniques les plus utilisées pour l'étudier sont :
Le profil polysomique et le profil ribosomique d'une part, ou la purification par affinité et le profil ribosomique d'autre part, peuvent être combinés en utilisant l'une de ces méthodes pour enrichir l'échantillon en ribosomes avant d'isoler les fragments protégés par ces ribosomes. Source : King & Gerber (2016) Les extraits cellulaires sont généralement préparés en présence de cycloheximide, un antifongique, puissant inhibiteur de l'allongement de la traduction. Profil polysomique ("polysomal profiling")
Purification par affinité ("Translating Ribosome Affinity Purification" - TRAP)
Profil ribosomique ("ribosomal profiling" ou "deep sequencing of ribosome-protected RNA fragments")
Source : Makarewich & Olson (2017) Exemples d'outils bioinformatiques pour l'analyse des smORF révélés par les profils ribosomiques
|
Aspects techniques | Profil polysomique | ARN messagers pleine longueur en cours de traduction (RNC-seq) |
Profil ribosomique (Ribo-seq) | Purification par affinité (TRAP-seq) |
ARN messagers récupérés à partir de RNC-mRNA | Pleine longueur | Fragments d'ARN protégés par les ribosomes | Pleine longueur | |
Récupération des ARN messagers en cours de traduction | Difficile | Facile | Difficile | Facile |
Méthode d'analyse des ARN messagers associée | Puce à ADN, séquençage à très haut débit | Séquençage à très haut débit | Puce à ADN, séquençage à très haut débit | |
Exigence de débit | Faible | Elevée | Faible | |
Longueur des fragments séquencés | Toute longueur | 22 - 35 nucléotides | Toute longueur | |
Détection de variations de séquences | Simple | Difficile | Simple | |
Analyse des UTR | Oui | Non | Oui | |
Détermination de la position des ribosomes, des densités, des ORF et des uORF | Non | Oui | Non | |
Technique spécifique du tissu | Non | Oui | ||
Conditions physiologiques | Oui | Non | ||
Etapes expérimentales | Simple | Complexe | ||
Source : Zhao et al. (2019) |
4. Exemples de microprotéines ou micropeptides et de leurs diverses fonctions biologiques La première microprotéine identifiée est la protéine "Inhibitor of DNA-binding" (ID) qui interagit et inhibe les facteurs de transcription de type hélice-boucle-hélice (Benezra et al., 1990). Les premières microprotéines végétales découvertes sont les protéines "Little zipper" (ZPR) qui contiennent un seul domaine fermeture éclair à leucine (Wenkel et al., 2007). Elles interagissent avec les protéines à homéodomaine fermeture éclair à leucine de classe III et l'hétérodimère résultant est incapable d'interagir avec l'ADN. |
Organisme | Microprotéine (lien vers Uniprot) | Organisme | Méthode d'identification | Fonction | Acides aminés |
Plantes | Early nodulin 40 (Enod 40) => 4 peptides | Plantes | Traduction in vitro - Western blot | Organogénèse des nodules - Fixation à la sucrose synthase | 12, 13, 24, 27 |
Brick1 (Brk) | Arabidopsis thaliana, Zea mays | Analyse de mutants | Morphogénèse foliaire Régulation de l'organisation de l'actine et des microtubules |
85, 76 | |
POLARIS (PLS) | Arabidopsis thaliana | Analyse de la transcription des gènes par "piégeage du promoteur" - analyse de mutants | 36 | ||
ROTUNDIFOLIA (ROT4) | Analyse de mutants d'Arabidopsis thaliana | 53 | |||
ROT18/DLV1 | Gain de criblage fonctionnel des gènes responsables de la croissance et du développement des fruits |
Organogénèse des plantes | 51 | ||
Kiss of death (KOD) | Analyse de la transcription des gènes par "piégeage du promoteur" | Régulation de la mort cellulaire programmée | 25 | ||
Zm401p10 et Zm908p11 | Poaceae | Analyses bioinformatiques | Développement du pollen | 89 et 97 | |
Animaux | Polished rice (Pri) | Drosophila melanogaster | Analyse de mutants | Embryogénèse de la drosophile | 49 |
Hemotin | Criblage de gènes codant des smORF et analyse fonctionnelle | Régulation négative de la maturation des endosomes en réprimant l'activité de 14-3-3 ζ donc celle de la phosphoinositide 3 kinase | 88 | ||
Toddler | Vertébrés | Recherche par ribo-seq de peptides de signalisation | Favorise la migration cellulaire | 58 | |
AGD3 | Mammifères | Analyse de séquences | Impliqué dans la différenciation des cellules souches | 63 | |
Myoregulin (MLN) | Approches bioinformatiques - caractérisation basée sur l'homologie | Homéostasie du calcium Inhibe l'activité de l'ATPase SERCA1 - Régulateur clé de l'activité des muscles squelettiques |
46 | ||
Cyren => 4 peptides dont MRI-2 | Criblage par spectromètrie de masse en tandem/HPLC combinée au RNAseq - caractérisé par protéomique fonctionnelle | Processus de réparation de l'ADN | 69, 102, 128, 157 | ||
NoBody | Criblage par spectromètrie de masse en tandem/HPLC combinée au RNAseq - caractérisé par protéomique fonctionnelle | Recyclage des ARN messagers ("mRNA decapping proteins") | 68 | ||
Myomixer Minion |
Analyse RNAseq des muscles non blessés et en régénération Criblage par CRISPR-cas9 de la perte de fonction des gènes nécessaires à la fusion des myoblastes |
Formation des muscles - Contrôle des performances musculaires | 84 | ||
SPAR ("Small regulatory polypeptide of amino acid response") Codé par LINC00961 |
Homme et souris | Lors d'une lésion musculaire, la régulation négative de SPAR favorise l'activation de mTORC1 et la régénération musculaire Source : Matsumoto et al. (2017) |
90 | ||
Humanin | Différentes espèces | Criblage par expression de la fonction - Structure : 1Y32 | Impliqué dans la mort cellulaire programmée | 24 | |
MOTS-c | Recherche in silico de sORF potentiels dans l'ARNr 12S de l'homme | Homéostasie du métabolisme | 16 | ||
DWORF ("DWarf Open Reading Frame") | Homme, lamproie | Recherche par PhyloCSF - gain et perte de fonction | Amélioration des performances musculaires (régulation de l'ATPase SERCA) | 34 | |
Brick1 (Brk) | Cytosquelette | ----- | Régulation de l'actine et de l'organisation des microtubules (membre du complexe WAVE qui active le complexe Arp2/3) | 76 | |
HOXB-AS3 | Primates | Profil ribosomique | Arrêt de la croissance du cancer du colon | 53 | |
PIGBOS | Mitochondrie | Analyse protéomique (peptide tryptique MQLVQESEEK) | Régulation de la réponse au stress dans le réticulum endoplasmique | 54 | |
MPM | Analyse du transcriptome - Gain et perte de fonction | Améliore l'activité respiratoire mitochondriale - Favorise la différenciation myogénique | 56 | ||
(Mtln - LINC00116) |
Son absence diminue l'activité du complexe I de la chaîne respiratoire Source : Stein et al. (2018) |
56 |
5. Rôles de microprotéines ou micropeptides bien caractérisés Les microprotéines sont des modulateurs importants et puissants des processus biologiques. En effet :
L'analyse des interactions des microprotéines avec d'autres protéines permet d'étudier leur fonction dans la cellule. On peut, par exemple, étiqueter la microprotéine d'intérêt avec un peptide tel que FLAG ou APEX2, puis l'isoler avec ses partenaires en interaction à l'aide d'anticorps qui se lient à cette étiquette. Exemples de fonctions biologiques très diverses de microprotéines ou micropeptides MOTS-c et l'humanine sont des micropeptides codés par des smORF du génome mitochondrial :
Le micropeptide MRI-2 améliore la jonction des extrémités non-homologues ("Non-Homologous End Joining", NHEJ) des cassures d'ADN double brin ("Double-Strand DNA Breaks", DSB) en s'associant aux protéines Ku, protéines de liaison des extrémités de l'ADN. Source : Yeasmin et al. (2018) Les micropeptides myomixer et minion stimulent la fusion du myoblaste au cours de la formation de la myofibre musculaire en association avec la protéine myomaker. Le micropeptide SPAR est localisé dans le lysosome où il interagit avec le complexe v-ATPase et régule l'activation de la protéine mTORC1 au cours de la cascade de signalisation liée au stress. NoBody est un micropeptide qui dissocie les granules de dégradation des ARN ("Processing bodies" ou "P-bodies") en interagissant avec le complexe d'enlèvement de la coiffe des ARN messagers. La myoréguline (MLN, 46 acides aminés), le phospholambane (PLN, 52 acides aminés), la sarcolipine (SLN, 31 acides aminés) et une autre réguline (ALN) sont des microprotéines qui interagissent avec les enzymes SERCA (pompes ATPase calciques) dans le réticulum sarcoplasmique et le réticulum endoplasmique (S/ER) et contribuent à l'homéostasie du calcium cellulaire. Ces microprotéines sont des protéines transmembranaires intégrales. Source : Anderson et al. (2016) MiPepid: outil d'identification de micropeptides par l'apprentissage automatique. |
6. Illustration de la microprotéine PIGBOS Le gène PIGBOS (OS pour "Opposite Strand") se trouve sur le brin opposé du gène de "PhosphatidylInositol Glycan anchor biosynthesis class B" ou PIGB. Le gène codant PIGBOS contient 2 exons, le second contenant la smORF PIGBOS entière. Le transcrit PIGBOS génère 3 isoformes issues de l'épissage. Les données de RNA-seq et de profil ribosomique prouvent la transcription et la traduction de PIGBOS dans 3 lignées cellulaires humaines différentes.
Source : Chu et al. (2019) |
7. Communication intracellulaire de la mitochondrie Les mitochondries communiquent avec le reste des composants cellulaires via de multiples molécules de natures très diverses comme des fragments d'ADN mitochondrial, des lipides mitochondriaux (par exemple, la cardiolipine), des métabolites et des petits peptides. Ces mécanismes de communication ne sont pas forcément liés à un dysfonctionnement mitochondrial, mais utilisés comme informations sur la base de divers indices (par exemple, le flux de nutriments ou les états rédox). Les peptides dérivés des mitochondries ("Mitochondrial Derived Peptides", MDP) sont des micropeptides de signalisation codés par des smORF du génome mitochondrial.
Source : Valera-Alberni & Canto (2018)
Les mitochondries sont des plateformes de signalisation anti-virale et, en raison de leur origine bactérienne, l'ADN mitochondrial et d'autres composants mitochondriaux déclenchent des réponses immunitaires innées et une pathologie inflammatoire. La libération dans le cytoplasme d'ADN mitochondrial active la voie cGAS ("Cyclic GMP-AMP synthase") - STING - TBK1 qui active la transcription du gène stimulé par l'interféron qui favorise l'immunité antivirale.
|
8. Liens Internet et références bibliographiques |
sORFs.org : base de données pour les sORF ("short open reading frames") identifiées par profil ribosomique miPFinder : programme pour identifier les microprotéines dans un génome sur le point d'être complètement séquencé The human cardiac translatome A repository of putative sORF-encoded peptides in Arabidopsis thaliana OpenProt : base de données qui applique un modèle polycistronique d'annotations de génomes eucaryotes (annotation de protéines connues, de nouvelles isoformes et de nouvelles protéines) |
|
Benezra et al. (1990) "The protein Id: a negative regulator of helix-loop-helix DNA binding proteins" Cell 61, 49 - 59 Drucker D.J. (2005) "Biologic actions and therapeutic potential of the proglucagon-derived peptides" Nat. Clin. Pract. Endocrinol. Metab. 1, 22 - 31 Wenkel et al. (2007) "A feedback regulatory module formed by LITTLE ZIPPER and HD-ZIPIII genes" Plant Cell 19, 3379 - 3390 |
|
Saghatelian & Couso (2015) "Discovery and characterization of smORF-encoded bioactive polypeptides" Nat. Chem. Biol. 11, 909 - 916 Lauressergues et al. (2015) "Primary transcripts of microRNAs encode regulatory peptides" Nature 520, 90 - 93 King & Gerber (2016) "Translatome profiling: methods for genome-scale analysis of mRNA translation" Brief. Funct. Genomics 15, 22 - 31 Anderson et al. (2016) "Widespread control of calcium signaling by a family of SERCA-inhibiting micropeptides" Sci. Signal. 9, ra119 |
|
Couso & Patraquim (2017) "Classification and function of small open reading frames" Nat. Rev. Mol. Cell. Biol. 18, 575 - 589 Makarewich & Olson (2017) "Mining for micropeptides" Trends Cell Biol. 27, 685 - 696 Zhang et al. (2017) "The microprotein Minion controls cell fusion and muscle formation" Nat. Commun. 8, 15664 Matsumoto et al. (2017) "mTORC1 and muscle regeneration are regulated by the LINC00961-encoded SPAR polypeptide" Nature 541, 228 - 232 Plaza et al. (2017) "In Search of Lost Small Peptides" Annu. Rev. Cell Dev. Biol. 33, 391 - 416 |
|
Yeasmin et al. (2018) "Micropeptides Encoded in Transcripts Previously Identified as Long Noncoding RNAs: A New Chapter in Transcriptomics and Proteomics" Front. Genet. 9, 144 Valera-Alberni & Canto (2018) "Mitochondrial stress management: a dynamic journey" Cell Stress 2, 253 - 274 Stein et al. (2018) "Mitoregulin: A lncRNA-Encoded Microprotein that Supports Mitochondrial Supercomplexes and Respiratory Efficiency" Cell Rep. 23, 3710 - 3720 Erpf & Fraser (2018) "The Long History of the Diverse Roles of Short ORFs: sPEPs in Fungi" Proteomics 18, e1700219 |
|
Chugunova et al. (2019) "LINC00116 codes for a mitochondrial peptide linking respiration and lipid metabolism" Proc. Natl. Acad. Sci. 116, 4940 - 4945 Khitun et al. (2019) "Small open reading frames and cellular stress responses" Mol. Omics 15, 108 - 116 Chu et al. (2019) "Regulation of the ER stress response by a mitochondrial microprotein" Nat. Commun. 10, 4883 Lin et al. (2019) "A novel mitochondrial micropeptide MPM enhances mitochondrial respiratory activity and promotes myogenic differentiation" Cell Death Dis. 10, 528 |
|
Lu et al. (2019) "A hidden human proteome encoded by "non-coding" genes" Nucleic Acids Res. 47, 8111 - 8125 van Heesch et al. (2019) "The Translational Landscape of the Human Heart" Cell 178, 242 - 260 Zhao et al. (2019) "Translatomics: The Global View of Translation" Int. J. Mol. Sci. 20, 212 Wang et al. (2019) "Peptides encoded by noncoding genes: challenges and perspectives" Signal Transduct. Target Ther. 4, 57 Wang et al. (2019) "ncRNA-Encoded Peptides or Proteins and Cancer" Mol. Ther. 27, 1718 - 1725 |