Etude de toxines - Cystéines impliquées dans des ponts disulfure
Flux RSS

 

Il est préférable d'utiliser Chrome.

Figure ci-contre : représentation schématique du processus de transcription puis de traduction et de la structure des molécules issues de ces processus.

Cette étude bioinformatique de la toxine parcourt ces protéines jusqu'à la structure 3D en focalisant sur les cystéines impliquées dans des ponts disulfure.

ExPASy : ensemble d'applications pour l'analyse de séquences peptidiques => sélectionner "Proteins & Proteomes" dans le menu de gauche.

EMBOSS seqret : application pour la conversion de formats de fichiers.

protein structure JSmol pont disulfure disulfide bridge fasta clustalw toxin BLAST alignment biochimej

Retour haut de page

1. Analyse du gène et de l'ARNm de la kappa - bungarotoxine de Bungarus multicinctus

Aller au NCBI.
Rechercher les données pour "multicinctus mRNA kappa-bungarotoxin" (fenêtre du haut) en sélectionnant "All databases" dans le menu déroulant.

Combien de fichiers de nucléotides et de protéines obtient-on ? nucléotides : 3 / protéines : 2
Cliquer sur le lien « Nucleotide » puis ouvrir le fichier correspondant à la séquence d’ADN codant la bungarotoxine.

A quoi correspond "Y11768".

Quelle est la longueur en nucléotides de la séquence codante ("CDS") ?

Quel codon stop est employé ?

Quelle est la vraie séquence "TATA" ?

Y11768 : numéro d'accession du fichier Genbank du gène de cette toxine

Somme des longueurs des 3 exons constitutifs de la phase de lecture ouverte, soit : (332 - 277) + (1496 - 1397) + (2143 - 2033) = 264 nucléotides

Cliquer sur le lien interne "CDS" pour surligner les exons dans la séquence globale (en bas de la page) : dernier codon du 3è exon => TAA

Cliquer sur le lien interne "regulatory" pour surligner : TATAAA

Pour combien d’acides aminés code la séquence codante ?

Pour combien d’acides aminés code la séquence du peptide signal ?

Le dernier codon est le codon STOP => 261 nucléotides = 87 codons => 87 acides aminés

Peptide signal (lien interne "sig_peptide") : 54 nucléotides = 18 codons => 18 acides aminés
Voir un cours sur les peptides signaux

Faire un schéma du gène ("TATA box", peptide signal, introns et exons avec leurs positions) sur la base des données de ce fichier.

Quels sont les mots clés de l'ontologie associés à cette molécule ?

Voir le schéma

Dans la partie "CDS", cliquer sur le lien interne "/db_xref="GOA:P01398"
Termes de l'ontologie en bas de la page : extracellular region - modulation of process of other organisms - pathogenesis - toxin activity
Voir QuickGO

Voir un rappel sur l'ontologie.

Retour haut de page

Revenir à la page de résultats de "Nucleotide" et cliquer sur le lien "Y08721". Cliquer sur le lien "FASTA" (en haut à gauche).

De quoi s'agit-il ?

A quoi d'autre correspond "FASTA" ?

FASTA : format de fichier de séquences

FASTA : programme d'alignement

Enregistrer la séquence "FASTA" dans un éditeur de texte. 1mRNA

Aller au site "ExPASy". Trouver le programme "Translate" (presque tout en bas de la page /utiliser Ctrl-F). Cliquer sur la fenêtre "Browse the resource website".

Coller la séquence FASTA dans la fenêtre et lancer l'application (bouton "TRANSLATE!").

Attention : si les traductions semblent peu plausibles, revenir à la fenêtre de soumission, supprimer tout le texte qui n'est pas la séquence proprement dite (">gi|1620372|emb|...") et refaire la traduction.

Que fait ce programme et que signifient "5'3' Frame 1", "5'3' Frame 2", ... ?

Quelle traduction vous semble correcte ?

Traduction d'une séquence nucléotidique sur 6 phases de lecture : 3 sur le brin transcrit.

La traduction a priori correcte (tout du moins plausible) est celle qui contient 87 acides aminés (voir ci-dessus).

Refaire la même opération de traduction in silico avec la séquence FASTA du gène codant la bungarotoxine (fichier Y11768).

Obtient-on un résultat équivalent ? Si non, pourquoi ?

La séquence du gène contient presque 2300 nucléotides qui englobent les séquences signal, les introns et les exons (séquence codante) : le résultat de la traduction n'a donc aucun sens.

On remarque cependant que 3 segments de traduction correspondent aux 3 exons.

Retour haut de page

2. Structure de la bungarotoxine de Bungarus multicinctus

Aller au NCBI. Rechercher les données pour "2NBT" dans "All databases". Quel type de données supplémentaires obtient-on ? Données de structure
Cliquer sur le lien "Structure" (dans la fenêtre "Proteins"). A quelle sous-partie du NCBI accède-t-on ? MMDB : "Molecular modeling Database"

Dans le cadre sous "Molecular Components in 2NBT", cliquer sur la barre orange intitulée "snake_toxin superfamily".
A quelle sous-partie du NCBI accède-t-on ?

CDD ("Conserved Domain Database")
Page dédiée à la superfamille des toxines de serpents ("cl11586: snake_toxin Superfamily")

Décrire avec quelques mots-clés le mode d'action des toxines de serpents.

Décrire les particularités du domaine structural caractéristique de ces toxines.

"binding to the nicotinic acetylcholine receptors in the postsynaptic membrane" - "preventing the binding of acetylcholine" - "blocking the excitation of muscles"

Domaine : 60 - 75 acides aminés / structure stabilisée par 4 - 5 ponts disulfure / presque complètement sous forme de feuillets β / soit monomère, soit dimère


Cliquer sur le cadre bleu "cd00206: snake_toxin". Un alignement de séquences peptidiques apparaît en bas de la nouvelle page :

  • Cet alignement utilise le code à 1 lettre des acides aminés.
  • L'apparence de cet alignement peut-être modifié avec les différents menus ("Row Display", "Color Bits", ..., valider avec "Reformat").
  • Interpréter le code couleur des lettres et minuscules/majuscules dans cet alignement.
  • Repérer les acides aminés conservés dans cet alignement.
  • Lire la syntaxe PROSITE des expressions régulières pour PHI-BLAST.

Ecrire un motif consensus au format PROSITE qui mette en évidence les acides aminés conservés, notamment les cystéines.

Exemple de motif :

C-x(9,15)-C-x(0,2)-G-x(3)-C-x(14,18)-G-C-x(1,3)-C-P-x(9,10)-C-C-x(4,5)-[DE]-[KLNV]-C-N

Retour haut de page

3. Cystéines et ponts disulfures de la bungarotoxine de Bungarus multicinctus

Revenir à la page "Neuronal Bungarotoxin, NMR, 10 Structures". Cliquer sur le lien "2NBT" en vis-à-vis de "PDB ID:" en haut de la page à droite.

A quelle base de données accède-t-on ?
Par quelle méthode cette structure de toxine a-t-elle été résolue ?
Dans quel journal scientifique et en quelle année ce résultat a-t-il été publié ?

PDB : "Protein DataBank"

Résonance magnétique nucléaire

Publié dans "Biochemistry" en 1992

Ouvrir le menu déroulant "Display file" en haut de la page à droite. Choisir "PDB Format". Une page Web s'ouvre.
  • Rechercher les lignes qui décrivent les ponts disulfures ("SSBOND").
  • Interpréter la syntaxe de ces lignes : nombre de ponts disulfure, positions des cystéines impliquées dans ces ponts disulfure et chaînes polypeptidiques auxquelles ces cystéines appartiennent.
1 CYS A    3    CYS A   21
2 CYS A   14    CYS A   42
3 CYS A   27    CYS A   31
4 CYS A   46    CYS A   58
5 CYS A   59    CYS A   64

5 ponts pour la chaîne A => Idem pour la chaîne B

protein structure cystein pont disulfure disulfide bridge fasta alignement sequence alignment toxin BLAST alignment biochimej

S'agit-il d'un monomère, d'un homodimère ou d'un hétrodimère ?
Pourquoi ?

La cystéine est l'acide aminé le moins utilisé dans les chaînes polypeptidiques.
La probabilité que 2 chaînes polypeptidiques contenant 10 cystéines (sur 87 acides aminés) aux mêmes positions soient différentes est quasiment nulle.
Il s'agit d'un homodimère.

Revenir à la page précédente.

Onglet "Annotations" en haut de la page : quels sont les termes de l'ontologie associés à cette protéine ?

GO Terms

  • Molecular Function : toxin activity
  • Biological Process : pathogenesis - biological process involved in interspecies interaction between organisms
  • Cellular Component : extracellular region - cellular anatomical entity

Retour haut de page

4. Visualisation de la bungarotoxine

On compare la structure 1LSI de la neurotoxine LSIII du venin du serpent de mer Laticauda semifasciata avec la structure 2NBT (Bungarotoxine).

Aller à la page du calcul du RMSD ("Root Mean Square Deviation") entre 2 structures de protéines.

  • Entrer les codes PDB : 2NBT et 1LSI.
  • Entrer les positions : 1 et 67 (premier et dernier acides aminés superposés).
  • Remarque : la bungarotoxine mature (sans le peptide signal) est de 66 acides aminés.

Une seule chaîne de chaque protéine est représentée.

Que traduit le RMSD et que conclure de la valeur calculée ?

Superposition des carbones α des 2 structures.

RMSD = 7.64 Å. Plus la valeur RMSD est faible, meilleure est la superposition des structures, plus elles sont similaires.

Quelles sont les parties des 2 chaînes polypeptidiques qui ne se superposent le moins bien ?

Pourquoi ?

Les boucles qui relient les brins des feuillets β.

Les boucles sont très flexibles - mobiles : elles sont donc mal résolues dans la structure obtenue par RMN en solution. En d'autres termes, il existe plusieurs positions possibles pour les acides aminés de ces boucles : la structure finale tient compte d'une position moyenne.

Le pourcentage d'identité des acides aminés des 2 protéines est seulement de 8,8 % (valeur faible). Les 2 structures se superposent cependant remarquablement : qu'en conclure ?

Les structures des protéines sont plus conservées que les séquences en acides aminés.

Visualisation de la bungarotoxine de Bungarus multicinctus (homodimère) - RMN - 10 structures

Code PDB : 2NBT

Retour haut de page

5. Peptide signal de la bungarotoxine de Bungarus multicinctus

Voir un cours sur les peptides signaux.

Revenir au NCBI. Récupérer la séquence au format FASTA de la protéine dont le N° d'accession est P01398.
Quelle est cette protéine ?

C'est le précurseur de la bungarotoxine : la séquence en acides aminés contient le peptide signal N-terminal.

Aller au "SignalP 5.0 Server". Coller la séquence FASTA, choisir les paramètres corrects, lancer le programme.

Que recherche ce programme ?

Lire les informations "Output format".
Quelles sont la séquence et la position les plus probables du site de coupure ?

Recherche de site potentiel de coupure d'un petide signal. Il s'agit d'une prédiction basée sur un algorithme et une base de données de séquences de références.

Site de coupure prédit : GYT21-R22T

Refaire cette recherche avec le programme "Signal-BLAST".

Le résultat est-il identique ? Pourquoi ?

Résultat identique.

  • Les deux algorithmes doivent suivre une logique proche.
  • Les jeux de données de séquences de référence pour lesquelles on a une preuve expérimentale du site de clivage sont suffisamment vastes pour qu'ils soient probablement comparables.

Retour haut de page

6. Recherche de motif signature des toxines

Aller à ScanProsite (Expasy).

Quelle option choisir ?
Etape 1 : coller la séquence (au format FASTA) du précurseur de la toxine dans la fenêtre.
Suivre les étapes 2 et 3 (notamment le format de sortie dans le menu déroulant).
Lancer l'application. Que recherche-t-elle ?

Option 1 : soumission d'une séquence pour rechercher dans la collection de motifs.

ScanProsite recherche, dans la séquence soumise, les correspondances avec les motifs signatures des séquences de protéines de la base de données InterPro.
Cette recherche s'effectue avec le programme InterProScan.

Voir un cours sur les motifs et InterPro

Examiner la page de résultats.

  • Si "Graphical view" a été choisi dans le menu déroulant de l'étape 3, cliquer sur le carré vert ou sur le lien "PS00272" (SNAKE_TOXIN Snake toxins signature).
  • Autre possibilité : aller à "PDOC00245".

Quel est le motif signature des toxines de serpents ?

Enregistrer le motif obtenu.

Quel acide aminé particulier en fait partie ? Pourquoi ?

SNAKE_TOXIN, PS00272; Snake toxins signature
Consensus pattern:
G-C-x(1,3)-C-P-x(8,10)-C-C-x(2)-[PDEN]

La cystéine puisque les ponts disulfures, et la structure 3D qui en découle, sont la signature de ce type de toxine.

Retour haut de page

7. Analyse du motif signature des toxines

Voir une description des programmes d'alignement BLAST.

Voir la signification des paramètres "E-value" et "P-value".


Aller à BLAST : cliquer sur la cadre de droite "Protein BLAST".

  • Coller la séquence du précurseur de la toxine dans la fenêtre "Enter accession number, gi, or FASTA sequence".
  • Dans la partie "Program Selection", choisir "PHI-BLAST (Pattern Hit Initiated BLAST)"
  • Une fenêtre s'ouvre : coller le motif des toxines de serpent (syntaxe PROSITE) précédemment enregistré.
  • Choisir la base de données dans laquelle la recherche va être effectuée.
  • Eventuellement, modifier les paramètres (taille du mot, "expect treshold", matrice, pénalités des gaps, ...) de l'algorithme en ouvrant le menu "Algorithm parameters".
  • Cocher la case "Show results in a new window".
  • Lancer BLAST.

Qu'effectue le programme PHI-BLAST ?

Ce programme prend en entrée une séquence requête protéique et un motif défini par une expression régulière.
La syntaxe du motif est décrite à : "Rules for pattern syntax for PHI-BLAST".

PHI-BLAST est donc un algorithme adapté à la recherche de séquences protéiques contenant un motif particulier ET similaires à la séquence requête, dans le voisinage proche du motif.


Dans la page des résultats :

  • Cliquer sur l'un des triangles rouges (ou sur le lien "snake_toxin", on obtient un grand nombre d'information).
  • Développer ([+]) les menus "List of domain hits" - lien "Snake_toxin".

Ces résultats sont-ils en accord avec ceux obtenus dans la partie "2. Structure de la bungarotoxine" (ci-dessus) ?

A quelle famille de protéine appartiennent les toxines de serpents ?

Résultats confirmés.

pfam00087 : Toxin_TOLIP / Snake toxin and toxin-like protein

Qu'est-ce que Pfam ?

Voir un cours sur Pfam

Script Python pour la recherche d'un profil HMM d'une famille PFAM

Retour haut de page

8. Optionnel

Ouvrir ce fichier. Déterminer la nature de chaque protéine.

Faire le meilleur alignement possible avec "P01398" et mettre en évidence un acide aminé particulier probablement important pour la structure.

Chercher quelques séquences de toxines de plantes : crambine (Crambe hispanica) / thionine (Arabidopsis thaliana). Retrouve-t-on le même genre de résultats ?


Fichiers aide avec toutes les séquences résultats

Retour haut de page

Valid XHTML 1.0 Transitional