Etude de toxines - Cystéines impliquées dans des ponts disulfure |
Tweet |
Il est préférable d'utiliser Chrome. |
Figure ci-contre : représentation schématique du processus de transcription puis de traduction et de la structure des molécules issues de ces processus. Cette étude bioinformatique des toxines de serpents parcourt ces protéines jusqu'à la structure 3D en focalisant sur les cystéines impliquées dans des ponts disulfure. ExPASy : ensemble d'applications pour l'analyse de séquences peptidiques => sélectionner "Proteins & Proteomes" dans le menu de gauche. EMBOSS seqret : application pour la conversion de formats de fichiers. |
1. Analyse du gène et de l'ARNm de la kappa-bungarotoxine de Bungarus multicinctus |
Aller au NCBI. |
Combien de fichiers de nucléotides et de protéines obtient-on ? | nucléotides : 3 / protéines : 2 |
Cliquer sur le lien « Nucleotide » puis ouvrir le fichier correspondant à la séquence d’ADN codant la bungarotoxine. | |
A quoi correspond "Y11768". Quelle est la longueur en nucléotides de la séquence codante ("CDS") ? Quel codon stop est employé ? Quelle est la vraie séquence "TATA" ? |
Y11768 : numéro d'accession du fichier Genbank du gène de cette toxine Somme des longueurs des 3 exons constitutifs de la phase de lecture ouverte, soit : (332 - 277) + (1496 - 1397) + (2143 - 2033) = 264 nucléotides Cliquer sur le lien interne "CDS" pour surligner les exons dans la séquence globale (en bas de la page) : dernier codon du 3è exon => TAA Cliquer sur le lien interne "regulatory" pour surligner : TATAAA |
Pour combien d’acides aminés code la séquence codante ? Pour combien d’acides aminés code la séquence du peptide signal ? |
Le dernier codon est le codon STOP => 261 nucléotides = 87 codons => 87 acides aminés Peptide signal (lien interne "sig_peptide") : 54 nucléotides = 18 codons => 18 acides aminés |
Faire un schéma du gène ("TATA box", peptide signal, introns et exons avec leurs positions) sur la base des données de ce fichier. |
|
Quels sont les mots clés de l'ontologie associés à cette molécule ? |
Dans la partie "CDS", cliquer sur le lien interne "/db_xref="GOA:P01398" |
Revenir à la page de résultats de "Nucleotide" et cliquer sur le lien "Y08721". Cliquer sur le lien "FASTA" (en haut à gauche). | |
De quoi s'agit-il ? |
FASTA : format de fichier de séquences |
Enregistrer la séquence "FASTA" dans un éditeur de texte. | 1mRNA |
Aller au site "ExPASy". Trouver le programme "Translate". Cliquer sur la fenêtre "Browse the resource website". Coller la séquence FASTA dans la fenêtre et lancer l'application (bouton "TRANSLATE!"). Attention : si les traductions semblent peu plausibles, revenir à la fenêtre de soumission, supprimer tout le texte qui n'est pas la séquence proprement dite (">gi|1620372|emb|...") et refaire la traduction. |
|
Que fait ce programme et que signifient "5'3' Frame 1", "5'3' Frame 2", ... ? Quelle traduction vous semble correcte ? |
Traduction d'une séquence nucléotidique sur 6 phases de lecture : 3 sur le brin transcrit. La traduction a priori correcte (tout du moins plausible) est celle qui contient 87 acides aminés (voir ci-dessus). |
Refaire la même opération de traduction in silico avec la séquence FASTA du gène codant la bungarotoxine (fichier Y11768). Obtient-on un résultat équivalent ? Si non, pourquoi ? |
La séquence du gène contient presque 2300 nucléotides qui englobent les séquences signal, les introns et les exons (séquence codante) : le résultat de la traduction n'a donc aucun sens. On remarque cependant que 3 segments de traduction correspondent aux 3 exons. |
2. Structure de la bungarotoxine de Bungarus multicinctus |
Aller au NCBI. Rechercher les données pour "2NBT" dans "All databases". Quel type de données supplémentaires obtient-on ? | Données de structure |
Cliquer sur le lien "Structure" (dans la fenêtre "Proteins"). A quelle sous-partie du NCBI accède-t-on ? | MMDB : "Molecular modeling Database" |
Dans le cadre sous "Molecular Components in 2NBT", cliquer sur la barre orange intitulée "snake_toxin superfamily". A quelle sous-partie du NCBI accède-t-on ? |
CDD ("Conserved Domain Database") Page dédiée à la superfamille des toxines de serpents ("cl11586: snake_toxin Superfamily") |
Décrire avec quelques mots-clés le mode d'action des toxines de serpents. Décrire les particularités du domaine structural caractéristique de ces toxines. |
"binding to the nicotinic acetylcholine receptors in the postsynaptic membrane" - "preventing the binding of acetylcholine" - "blocking the excitation of muscles" Domaine : 60 - 75 acides aminés / structure stabilisée par 4 - 5 ponts disulfure / presque complètement sous forme de feuillets β / soit monomère, soit dimère |
Cliquer sur le cadre bleu "cd00206: snake_toxin". Un alignement de séquences peptidiques apparaît en bas de la nouvelle page :
|
|
Ecrire un motif consensus simple au format PROSITE qui mette en évidence certains acides aminés conservés, notamment les cystéines. |
Exemple de motif : C-x(9,15)-C-x(0,2)-G-x(3)-C-x(14,18)-G-C-x(1,3)-C-P-x(9,10)-C-C-x(4,5)-[DE]-[KLNV]-C-N |
3. Cystéines et ponts disulfures de la bungarotoxine de Bungarus multicinctus |
Revenir à la page "Neuronal Bungarotoxin, NMR, 10 Structures". Cliquer sur le lien "2NBT" en vis-à-vis de "PDB ID:" en haut de la page à droite. A quelle base de données accède-t-on ? |
PDB : "Protein DataBank" Résonance magnétique nucléaire Publié dans le journal scientifique "Biochemistry" en 1992 |
Ouvrir le menu déroulant "Display file" en haut de la page à droite. Choisir "PDB Format". Une page Web s'ouvre. | |
|
1 CYS A 3 CYS A 21 2 CYS A 14 CYS A 42 3 CYS A 27 CYS A 31 4 CYS A 46 CYS A 58 5 CYS A 59 CYS A 64 5 ponts pour la chaîne A => Idem pour la chaîne B |
S'agit-il d'un monomère, d'un homodimère ou d'un hétrodimère ? |
La cystéine est l'acide aminé le moins utilisé dans les chaînes polypeptidiques. |
4. Recherche de motif signature des toxines |
Revenir au NCBI. Récupérer la séquence au format FASTA de la protéine dont le N° d'accession est P01398. |
|
Aller à ScanProsite (Expasy). Quelle option choisir ? |
Option 1 : soumission d'une séquence pour rechercher dans la collection de motifs. ScanProsite recherche, dans la séquence soumise, les correspondances avec les motifs signatures des séquences de protéines de la base de données InterPro. |
Examiner la page de résultats. |
|
Quel est le motif signature des toxines de serpents ? Enregistrer le motif obtenu. Quel acide aminé particulier en fait partie ? Pourquoi ? |
SNAKE_TOXIN, PS00272; Snake toxins signature La cystéine puisque les ponts disulfures, et la structure 3D qui en découle, sont la signature de ce type de toxine. |
5. Analyse du motif signature des toxines
|
Aller à BLAST : cliquer sur la cadre de droite "Protein BLAST".
|
|
Qu'effectue le programme PHI-BLAST ? |
Ce programme prend en entrée une séquence requête protéique et un motif défini par une expression régulière. PHI-BLAST est donc un algorithme adapté à la recherche de séquences protéiques contenant un motif particulier ET similaires à la séquence requête, dans le voisinage proche du motif. |
Dans la page des résultats, ouvrir l'onglet "Graphic summary" et cliquer sur la figure du dessus (2 bandes orange - marron).
|
|
Ces résultats sont-ils en accord avec ceux obtenus dans la partie "2. Structure de la bungarotoxine" (ci-dessus) ? A quelle famille de protéine appartiennent les toxines de serpents ? |
Résultats confirmés. pfam00087 : Toxin_TOLIP / Snake toxin and toxin-like protein |
Qu'est-ce que Pfam ? |
6. Visualisation de la bungarotoxine |
On compare la structure 1LSI de la neurotoxine LSIII du venin du serpent de mer Laticauda semifasciata avec la structure 2NBT (Bungarotoxine). Aller à la page du calcul du RMSD ("Root Mean Square Deviation") entre 2 structures de protéines.
|
|
Une seule chaîne de chaque protéine est représentée. Que traduit le RMSD et que conclure de la valeur calculée ? |
Superposition des carbones α des 2 structures. RMSD = 7.64 Å. Plus la valeur RMSD est faible, meilleure est la superposition des structures, plus elles sont similaires. |
Quelles sont les parties des 2 chaînes polypeptidiques qui ne se superposent le moins bien ? Pourquoi ? |
Les boucles qui relient les brins des feuillets β. Les boucles sont très flexibles - mobiles : elles sont donc mal résolues dans la structure obtenue par RMN en solution. En d'autres termes, il existe plusieurs positions possibles pour les acides aminés de ces boucles : la structure finale tient compte d'une position moyenne. |
Le pourcentage d'identité des acides aminés des 2 protéines est seulement de 8,8 % (valeur faible). Les 2 structures se superposent cependant remarquablement : qu'en conclure ? |
Les structures des protéines sont plus conservées que les séquences en acides aminés. |
Visualisation de la bungarotoxine de Bungarus multicinctus (homodimère) - RMN - 10 structures Code PDB : 2NBT |
7. Peptide signal de la bungarotoxine de Bungarus multicinctus |
Aller au "SignalP 6.0 Server". Coller la séquence FASTA du précurseur de la bungarotoxine (P01398). |
|
Que recherche ce programme ? Interpréter les informations dans la figure de prédiction du site de coupure (page de résultats). |
|
Refaire cette recherche avec le programme "Signal-BLAST". Le résultat est-il identique ? Pourquoi ? |
Le résultat est identique.
|
8. Toxines d'autres organismes Ouvrir ce fichier.
|
Fichiers avec toutes les séquences résultats |