Déshydrogénases et pli Rossmann / calmoduline et motif "EF-hand" / récepteur de l'insuline / siRNA |
Tweet |
![]() |
A. Etude du pli Rossmann des déshydrogénase à NAD(P)+ |
1. Aller au NCBI. Rechercher les séquences protéiques de la lactate déshydrogénase. Attention : anglais, abréviation, emploi des opérateurs logiques (Booléens) : "AND", "OR" et "NOT". Avec l'option "Advanced" (lien en haut de la page), affiner la recherche avec EC 1.1.1.27 et Arabidopsis thaliana dans les résultats précédents : "#1 AND in builder" puis taper "1.1.1.27" avec le champs "EC/RN Number" du menu déroulant. Enregistrer la séquence au format FASTA du fichier AAC02678. |
≈ 131.000 résultats
1 séquence : AAC02678 |
Comment sait-on qu'il s'agit d'une enzyme ? Quelle réaction catalyse-t-elle ? Dans quelle voie métabolique ? |
|
Remarques
|
|
En quoi le fichier de numéro d'accession AAN87112 est-il "abusif" ? En quoi n'est-il cependant pas "erroné" ? |
|
2. Ouvrir le fichier GenPept AAC02678. Examiner les informations des différents champs. Ouvrir l'onglet "Graphics" (en haut). Examiner la partie "site Features - CDD"
Que remarque-ton ? Pourquoi les acides aminés de chacun de ces sites ne sont-ils pas contigus dans la séquence ? |
Acides aminés du site de fixation du NAD+ :
Acides aminés du site de fixation du substrat :
On remarque que les acides aminés N158, H213 et T268 sont communs aux 2 sites de fixation : ils établissent donc des liaisons avec la molécule de coenzyme et la molécule de substrat. Chacun des sites de fixation résultent du regroupement d'acides aminés dans l'espace via le repliement de la chaîne polypeptidique et la formation de domaines indépendants. |
3. Cliquer sur le lien suivant : /db_xref="CDD:133429.
|
|
Examiner l'alignement automatique généré en bas de la page "Conserved Protein Domain Family - LDH_1". Repérer un motif GXGXXG dans la partie N-terminale des séquences. |
|
Quelles sont les particularités physico-chimiques de la glycine ? |
Ces caractéristiques permettent une certaine fléxibilité de la chaîne polypeptidique : la glycine est souvent dans des portions de séquence d'acides aminés qui forment des boucles. |
Aller à Interpro. Rechercher "lactate dehydrogenase nad+ Arabidopsis". Pourquoi obtient-on autant de résultats ? |
Il n'y a pas de résultats que pour la lactate déshydrogénase. A certaines des bases de données constitutives du consortium Interpro. |
4. Rechercher dans la base de données Uniprot le fichier correspondant au fichier GenPept obtenu au NCBI.
|
Numéro d'accession : O49191 (O49191_ARATH) Un trés grand nombre d'informations supplémentaires. Notamment :
|
A quelle protéine correspond le fichier GenPept ABI54333 ? Vérifier avec le programme d'alignement de séquences MULTALIN si les séquences des fichiers AAC02678, O49191 et ABI54333 sont identiques (dans ce cas les valeurs du paramètre "check" au dessus de l'alignement obtenu sont identiques). Pourquoi le fichier ABI54333 n'est-il pas renvoyé dans la requête d'origine au NCBI ? |
ABI54333 : lactate déshydrogénase de Arabidopsis thaliana.
Le champs "DEFINITION" du fichier GenPept ABI54333 contient "At4g17260 [Arabidopsis thaliana]" et non "lactate dehydrogenase". |
5. Aller à ScanProsite. Entrer la séquence FASTA de la lactate déshydrogénase AAC02678 et lancer le scan. Dans la page de résultat, trouver le lien vers le motif consensus ("consensus pattern") du site actif des lactate déshydrogénases. |
Lien vers le motif : PS00064 [LIVMA]-G-[EQ]-H-G-[DN]-[ST] |
6. Aller à PHI-BLAST au NCBI.
Récupérez les séquences FASTA de 10 à 20 résultats caractérisés par des E-value faibles mais sensiblement différentes les unes des autres : menu déroulant "Download" (au dessus de la liste des résultats), sélectionner "FASTA (complete sequence)" => un fichier texte est créé. Voir un descriptif de BLAST. |
7. Avec MULTALIN, alignez la séquence de la lactate déshydrogénase de Arabidopsis thaliana avec les séquences FASTA de Homo sapiens issues de PHI-BLAST.
|
8. Illustration : structure du domaine liant le NAD(P)+ - le pli Rossmann
Voir les spécificités du pli rossmann des déshydrogénases à NAD(P)+ pour la suite. |
a. Visualisation de la lactate déshydrogénase de Squalus acanthias à une résolution de 3 Å Code PDB : 3LDH Le pli Rossmann ("Rossmann fold" - en hommage à Michael Rossmann) est une structure super-secondaire (assemblage de plusieurs types de structures secondaires) composée de 3 feuillets β liés à 2 hélices α de manière alternée (β-α-β-α-β). Un pli Rossmann peut fixer 1 nucléotide. Donc le domaine de fixation d'un dinucléotides (tel que NAD+ ou NADP+) contient 2 plis Rossmann appariés, chacun d'eux fixant l'un des nucléotides du co-facteur. |
b. Prédiction de la structure secondaire Le motif consensus GXGXXG riche en glycine forme une boucle ("glycine-rich P-loop motif") qui effectue un tour serré entre la fin du premier feuillet β (β7) et le début de l'hélice de fixation du dinucléotide (α6) au sein du pli Rossmann. Effectuer une prédiction de la structure secondaire de la séquence de lactate déshydrogénase de Arabidopsis thaliana. Repérer les acides aminés du Pli Rossmann :
|
a. Prédiction de la structure secondaire avec HHpred. b. Exemples d'autres logiciels : Jpred - CFSSP - GOR (Etre patient pour les résultats). |
9. Recherche d'annotation de fonctions de la lactate déshydrogénase via l'ontologie Rappels
La principale base de données mondiale est la base de données Gene Ontology (GO). Les termes GO sont les noeuds de l'ontologie :
Voir un cours sur l'annotation et l'ontologie. |
Aller à "Gene Ontology" (GO). Rechercher "lactate dehydrogenase arabidopsis" dans le champs "Search GO terms or Gene Product in Amigo ...".
Ouvrir l'onglet : "Inferred Tree View".
Ouvrir l'onglet "Graph View" et examiner :
Interpréter les liens relationnels. |
B. Etude des sites de fixation du calcium de la calmoduline (CaM) |
1. Exemple de motif dans la syntaxe PROSITE : <A-x-[ST](2)-x(0,1)-{V} |
Ce motif se lit : "Ala en position N-terminale puis n'importe quel acide aminé puis 2 fois (Ser ou Thr) puis aucun acide aminé ou n'importe quel acide aminé puis n'importe quel acide aminé sauf Val." |
Ecrire le motif suivant dans la syntaxe PROSITE : "4 Ser puis (Asp ou Ser) puis n'importe quel acide aminé puis (Asp ou Glu) puis (Glu ou Gly ou Val) puis 1 à 7 fois n'importe quel acide aminé puis (Glu ou Gly) puis 1 à 2 fois n'importe quel acide aminé puis 4 fois (Arg ou Lys)." |
S(4)-[DS]-x-[DE]-[EGV]-x(1,7)-[EG]-x(1,2)-[KR](4) Exemple : SSSSSDDEEEEKRKR |
Le motif de fixation du calcium de la calmoduline s'appelle motif "EF-hand" composé d'environ 30 acides aminés :
La calmoduline fixe 4 atomes de calcium :
|
Source : PFAM (PF00036) |
Quelles sont les propriétés physico-chimiques des acides aminés de ce motif consensus ? Pourquoi ? |
Ces propriétés physico-chimiques permettent la fixation de Ca2+ (cation divalent). |
2. Aller au NCBI. Effectuer une recherche des séquences de la calmoduline de Homo sapiens. | Outil "Advanced", requête : (calmodulin[Protein Name]) AND homo sapiens[Organism] => 8 fichiers. |
Ouvrir le fichier GenPept CAA36839. Ouvrir l'onglet "Graphics". Ligne "site Features - CDD" - "Ca2+ binding site" :
|
Acides aminés des motifs EFh :
Acides aminés du 1er motif EFh qui fixent le Ca2+ :
La séquence FD21KD23GD25G ... KE32 répond à l'expression régulière du motif PROSITE. |
Visualisation de la calmoduline de l'homme (non complexée au calcium) à une résolution de 1,7 Å Code PDB : 1CLL Coordination et acides aminés du motif "EF - hand" EF1 : X = D21; Y = D23; Z = D25; -X = H2O; -Y = T27; -Z1 = E3; -Z2 = E32 |
3. Aller à ScanProsite.
Analyser le résultat (exemples : "polymerase processivity factor component A20", "Calcium-binding allergen Bet v3", "Calbindin", ...) Repérer le résultat P0DP23 (CALM1_HUMAN) : retrouve-t-on le motif recherché ? |
Consulter le fichier PROSITE du motif "EF-hand" : PS00018
Pourquoi le résultat est-il étonnant ? |
Motif complet : D-{W}-[DNS]-{ILVFYW}-[DENSTG]-[DNQGHRK]-{GP}-[LIVMC]-[DENQSTAGC]-x(2)-[DE]-[LIVMFYW] Résultat : de très nombreuses protéines / enzymes qui ne fixent pas le calcium ont une séquence qui répond à ce motif PROSITE. |
4. Emettre une hypothèse pour expliquer que la calmoduline reconnait autant de cibles distinctes bien qu’il y ait une très forte homologie de séquence en acides aminés entre les calmodulines. |
C. Etude du récepteur de l'insuline |
a. Aller au NCBI. Effectuer une recherche de récepteur de l'insuline de l'homme.
|
Exemple : (insulin receptor[Protein Name]) AND Homo sapiens[Organism] On obtient beaucoup de fichiers correspondant :
|
Avec les fonctionalités de "Advanced", récupérer le sous-ensemble de fichiers qui ne contiennent pas le mot "partial". Combien de fichier(s) obtient-on ? Le fichier AAA59452 est intéressant.
Réfléchir à la requête la plus exacte (si il y en a une) pour n'obtenir que des fichiers de séquences complètes du récepteur de l'insuline de l'homme. |
1 fichier est renvoyé : AAI17173.
Il n'y a pas de requête évidente à moins de consulter un grand nombre fichiers GenPept pour noter les mots à ne pas utiliser dans le filtre pour éviter d'éliminer des fichiers intéressants. |
b. Récupérer la séquence FASTA du fichier AAA59452 et effectuer une recherche de séquences homologues avec BLAST. |
|
Une nouvelle page s'ouvre. Comparer cette figure à celle du cours sur le récepteur de l'insuline. |
Ce récepteur est constituée d'un grand nombre de domaines. Un domaine est une région de la chaîne polypeptidique :
|
Cliquer sur le signe "+" de la fenêtre "List of domain hits" : on obtient la séquence des différents domaines. |
Le domaine PTKc_InsR. Domaine catalytique à activité protéine tyrosine kinase. |
Dans la figure du haut de la page, cliquer sur l'un quelconque des triangles oranges de la ligne intitulée "ATP binding site".
|
"Catalytic domain of the Protein Tyrosine Kinase, Insulin Receptor" "PTKs catalyze the transfer of the gamma-phosphoryl group from ATP to tyrosine (tyr) residues in protein substrates" Oui, dans la partie N-terminale des séquences. |
D. Interférence ARN Voir le cours sur l'interférence ARN. L'introduction d'ADN double brin ("double-strand DNA" - dsRNA) de plus de 30 nucléotides dans des cellules de mammifères induit la réponse interféron (activation de la protéine kinase R ("interferon-induced, double-stranded RNA-activated protein kinase") et de la 2',5'-oligoadénylate synthétase). Cette réponse entraîne la dégradation non spécifique des ARN messagers et une diminution du taux de traduction. La conception de siRNA ("design" / "screening") nécessite que les ARN synthétisés contiennent moins de 30 nucléotides. Les siRNA avec un débordement en 3’ constitué du dinucléotide UU sont les plus puissants. |
Les règles de conception d’un siRNA à partir d’une séquence d’ARM messager sont :
EMBOSS Seqret : logiciel de conversion de formats de fichiers. |
Trouver la séquence d’un siRNA dans la séquence de l’ARN messager (GenBank NM_003380) codant la vimentine de l’homme : Uniprot : Homo sapiens vimentin mRNA |
>NM_003380.3 Homo sapiens vimentin mRNA CCCCGCGCCAGAGACGCAGCCGCGCTCCCACCACCCACACCCACCGCGCCCTCGTTCGCC TCTTCTCCGGGAGCCAGTCCGCGCCACCGCCGCCGCCCAGGCCATCGCCACCCTCCGCAG CCATGTCCACCAGGTCCGTGTCCTCGTCCTCCTACCGCAGGATGTTCGGCGGCCCGGGCA CCGCGAGCCGGCCGAGCTCCAGCCGGAGCTACGTGACTACGTCCACCCGCACCTACAGCC TGGGCAGCGCGCTGCGCCCCAGCACCAGCCGCAGCCTCTACGCCTCGTCCCCGGGCGGCG TGTATGCCACGCGCTCCTCTGCCGTGCGCCTGCGGAGCAGCGTGCCCGGGGTGCGGCTCC TGCAGGACTCGGTGGACTTCTCGCTGGCCGACGCCATCAACACCGAGTTCAAGAACACCC GCACCAACGAGAAGGTGGAGCTGCAGGAGCTGAATGACCGCTTCGCCAACTACATCGACA AGGTGCGCTTCCTGGAGCAGCAGAATAAGATCCTGCTGGCCGAGCTCGAGCAGCTCAAGG GCCAAGGCAAGTCGCGCCTGGGGGACCTCTACGAGGAGGAGATGCGGGAGCTGCGCCGGC AGGTGGACCAGCTAACCAACGACAAAGCCCGCGTCGAGGTGGAGCGCGACAACCTGGCCG |
Il faut trouver une séquence de 21 nucléotides dans l’ARNm cible qui commence par un dinucléotide AA. On cherche le codon d'initiation de la transcription (AUG) : toutes séquences commençant par AA (et les 19 nucléotides suivants) constituent un site cible potentiel pour les siRNA. |
Résultat pour la vimentine | |
séquence ciblée - ADNc ("targeted region") | 5' AACTACATCGACAAGGTGCGCTT |
siRNA sens | 5' CUACAUCGACAAGGUGCGCdTdT |
siRNA antisens | 5' GCGCACCUUGUCGAUGUAGdTdT |
Autres exemples | ||
Lamine A/C SC : 5'AACTGGACTTCCAGAAGAACATC sens : 5'CUGGACUUCCAGAAGAACAdTdT antisens : 5'UGUUCUUCUGGAAGUCCAGdTdT |
Lamine B1 SC : 5'AACGCGCTTGGTAGAGGTGGATT sens : 5'CGCGCUUGGUAGAGGUGGAdTdT antisens : 5'UCCACCUCUACCAAGCGCGdTdT |
GL2 Luciferase SC : 5'AACGTACGCGGAATACTTCGATT sens : 5'CGUACGCGGAAUACUUCGAdTdT antisens : 5'UCGAAGUAUUCCGCGUACGdTdT |
Source : Elbashir et al. (2001) |
Exemples de programmes IDT - "Custom Dicer-Substrate siRNA (DsiRNA)"
|