Etude de toxines - ponts disulfure
Flux RSS

 

ExPASy Proteomics tools : ensemble d'applications pour l'analyse de séquences peptidiques.

Readseq - biosequence conversion tool : application pour la conversion de formats de fichiers.


1. Analyse de la kappa - bungarotoxine de Bungarus multicinctus

Aller au NCBI. Rechercher les données pour "multicinctus mRNA kappa-bungarotoxin" dans "All databases".

Combien de fichiers de nucléotides et de protéines obtient-on ?

nucléotides : 3 / protéines : 2

Choisir "Nucleotide" puis "Y11768".

Quelle est la longueur en nucléotides de la séquence codante ("CDS") ?

Quel codon stop est employé ?

Faire un schéma du gène ("TATA box", peptide signal, introns et exons avec leurs positions) sur la base des données de ce fichier.

Quelle est la vraie séquence "TATA" ?

Quels sont les mots clés de l'ontologie associés à cette molécule ?

(332 - 277) + (1496 - 1397) + (2143 - 2033) = 264 nucléotides

TAA

schéma

TATAAA

ontologie : modification morphology physiology - acétylcholine - extracellular region - postsynaptic membrane
Voir QuickGO

Voir un rappel sur l'ontologie.

Revenir à la page de résultats de "Nucleotide"et cliquer sur le lien "Y08721".

Cliquer sur le lien "FASTA". De quoi s'agit-il ?
A quoi d'autre correspond "FASTA" ?

FASTA : format de fichier

FASTA : programme d'alignement

Enregistrer la séquence "FASTA" dans un éditeur de texte. 1mRNA

Aller au site "ExPASy Proteomics". Trouver le programme "Translate".

Coller la séquence FASTA dans la fenêtre et lancer l'application (bouton "Translate sequence").

  • Que fait ce programme ?
  • Que signifient "5'3' Frame 1", "5'3' Frame 2", ... ?
  • Quelle traduction vous semble correcte ?

Attention : si les traductions semblent peu plausibles, revenir à la fenêtre de soumission, supprimer tout le texte qui n'est pas la séquence proprement dite (">gi|1620372|emb|...") et refaire la traduction.

Retour haut de page

 

Aller au NCBI. Rechercher les données pour "2NBT" dans "All databases". Quel type de donnée supplémentaire obtient-on ?

Données structurales

Cliquer sur le lien "Structure". A quelle sous-partie de la base de données accède-t-on ?

MMDB : "Molecular modeling Database"

Dans le cadre "Molecules and interactions", cliquer sur "Show annotation". Cliquer sur la barre rouge qui apparaît intitulée "snake_toxin".

A quelle sous-partie de la base de données accède-t-on ?
Décrire avec quelques mots-clés le mode d'action de ce genre de toxine.
Décrire les particularités structurales du domaine.

CDD : "Conserved Domain Database"

"binding to the nicotinic acetylcholine receptors in the postsynaptic membrane" - "preventing the binding of acetylcholine" - "blocking the excitation of muscles"

domaine : 60 - 75 acides aminés / stabilisé par 4 - 5 ponts disulfure / presque complètement sous forme de feuillets β / soit monomère, soit dimère

  • Repérer les acides aminés conservés dans l'alignement proposé.
  • Lire attentivement la syntaxe PROSITE pour PHI-BLAST.

Ecrire un motif consensus au format PROSITE.

C1-x(9,15)-C2-x(0,2)-G-x(3)-C3-x(14,18)-G-C4-x(1,3)-C5-P-x(9,10)-C6-C7-x(4,5)-C8-N

Retour haut de page

 

Revenir à la page "Neuronal Bungarotoxin, NMR, 10 Structures". Cliquer sur le lien "2NBT" dans le petit cadre "PDB ID:" en haut à droite.

A quelle base de données accède-t-on ?
Par quelle méthode et en quelle année cette structure de la toxine a-t-elle été résolue ?

PDB : "Protein DataBank"

Résonance magnétique nucléaire en 1992

Dans le menu déroulant "Display file" en haut à droite à côté de "2NBT", ouvrir le fichier "PDB file". Rechercher la position des cystéines impliquées dans un pont disulfure ("SSBOND").

Noter les positions des ponts disulfure et les chaînes impliquées.

S'agit-il d'un monomère, d'un homodimère ou d'un hétrodimère ?

  • 1 CYS A 3 CYS A 21
  • 2 CYS A 14 CYS A 42
  • 3 CYS A 27 CYS A 31
  • 4 CYS A 46 CYS A 58
  • 5 CYS A 59 CYS A 64

Idem pour la chaîne B ===> homodimère

Revenir à la page précédente.

Onglet "Annotations" (en haut de la page) : quels sont les termes de l'ontologie associés à cette protéine ?
Onglet "3D View" : visualiser la molécule.

GO Terms

Onglet "Seq. Similarity". Choisir 40% dans la liste de gauche "Cluster Sequence Similarity Cutoff" : Cluster 40%

A quoi correspond ce pourcentage ?
Combien y a-t-il de séquences dans le "cluster 40%" ?

40 % de similarité entre les acides aminés des séquences de l'ensemble sélectionné

118 séquences (novembre 2016)

Sélectionner les boutons radio 1TGX (GAMMA-CARDIOTOXIN) et 2NBT (NEURONAL BUNGAROTOXIN).

Menu déroulant en haut "Select Comparison method" : choisir la méthode de comparaison "jFATCAT - rigid" qui lance l'applet "Jmol".

Quel est le pourcentage d'identité entre les 2 séquences choisies ?

Quelles sont les parties des 2 chaînes polypeptidiques qui ne se superposent pas bien ?

Pourquoi ?

%Id: 26.2%

Les boucles qui relient les feuillets β

Les boucles sont très flexibles / mobiles donc mal résolues par RMN (plusieurs positions pour les acides aminés : la structure tient compte d'une position moyenne)

Retour haut de page

 

Revenir au NCBI. Récupérer la séquence au format FASTA de la chaîne A "2NBT_A".

Revenir à la page d'accueil du NCBI.

Choisir une recherche d'homologie de séquences avec "protein blast". Onglet "Algorithm parameters" (en bas de la page), demander 100 résultats ("Max target sequences").

Lancer le programme.

Choisir (en cochant les boutons radio) une dizaine de protéines avec des "E-value" les plus différentes possibles (évitez les fichiers annotés "putative" ou "probable") : de 2 e-40 à 9 e-11 environ.

Récupérer les séquences FASTA : menu déroulant "Download" (icône disquette) de la fenêtre en cliquant sur "Sequences producing significant alignments".

Allez à Multalin. Collez les séquences et lancer le programme.

Indiquer les acides aminés de la séquence consensus communs avec celle décrite ci-dessus ?


Voir une description des programmes d'alignement BLAST

Voir la signification des paramètres : "E-value" et "P-value"

2. Visualisation de la bungarotoxine (homodimère) - RMN - 10 structures

Code PDB : 2NBT

Retour haut de page

 

3. Analyse du précurseur de la bungarotoxine de Bungarus multicinctus

Aller à BLAST proposé par EBI.

Coller la séquence "Chain A, Neuronal Bungarotoxin, Nmr, 10 Structures" (appelée aussi "2NBTA") dans la fenêtre et lancer BLAST avec les autres valeurs par défaut.

  • Interpréter les premières lignes du tableau de résultats : "SP:NXL1_BUNMU... 5.0e-35"
  • Visualiser l'alignement en cliquant sur le bouton "Show Alignments".
  • Le choix de la matrice vous semble-t-il judicieux ?
  • La "E-value" est-elle modifiée avec la matrive PAM70 ?
Cliquer sur le lien "SP:NXL1_BUNMU".
  • Quelle est cette protéine ?
  • A quoi correspondent les 21 premiers acides aminés N-terminaux ?
  • Quelle est le contenu en structures secondaires ?
  • Y a-t-il des ponts disulfures ? Si oui, quelles sont les positions des Cys impliquées ?

Revenir au NCBI. Récupérer la séquence au format FASTA de P01398.

Aller au "SignalP 3.0 Server". Coller la séquence, choisir les paramètres corrects, lancer l'application.

Que recherche l'application "SignalP 3.0 Server" ?
Lire les informations "Output format".
Quelle est la séquence et la position la plus probable du site de coupure ?

Recherche de site de coupure d'un petide signal.

Site de coupure : TRT23-C24L

Refaire cette recherche avec l'application "Signal-BLAST".

Les résultats son-ils semblables ?
Pourquoi ?

Refaire cette recherche avec l'application "PeptideCutter".

Analyser les résultats.
Que recherche ce programme ?


4. Recherche de motif spécifique des toxines

Aller à InterProScan sequence search. Coller la séquence du précurseur de la toxine dans la fenêtre et lancer l'application.

Que recherche cette application ?
Un motif des toxines de serpent ressort-il ?

Aller à : "PDOC00245". Quel est le motif "signature" des toxines de serpents ?

Enregistrer le motif obtenu.

Snake toxins signature : G-C-x(1,3)-C-P-x(8,10)-C-C-x(2)-[PDEN]
Quel acide aminé particulier en fait partie ?
Pourquoi ?


Aller à PHI-Blast ("Pattern Hit Initiated BLAST").

Ce programme prend en entrée une séquence requête protéique et un motif défini par une expression régulière. La syntaxe du motif est décrite à : "Rules for pattern syntax for PHI-BLAST".

PHI-Blast est adapté à la recherche de séquences protéiques qui contiennent un motif spécifié par l'utilisateur (fenêtre "PHI pattern" de la section "Algorithm") ET sont similaires à la séquence requête (fenêtre "Search") dans le voisinage proche du motif.

  • Coller la séquence du précurseur de la toxine dans la fenêtre "Enter accession number, gi, or FASTA sequence".
  • Dans la partie "Program Selection", choisir "PHI-BLAST (Pattern Hit Initiated BLAST)" et coller le motif détecté pour les toxines de serpent selon la syntaxe de PROSITE.
  • Eventuellement, modifier les parmètres de l'algorithme "Algorithm parameters".
  • Lancer BLAST.

Dans la page des résultats :

Cliquer sur l'un des triangles rouges (ou sur le lien "snake_toxin", on obtient un grand nombre d'information).

Développer ([+]) les menus "List of domain hits" - lien "Snake_toxin".


Ouvrir ce fichier. Déterminer la nature de chaque protéine.

Faire le meilleur alignement possible avec "P01398" et mettre en évidence un acide aminé particulier probablement important pour la structure.

Chercher quelques séquences de toxines de plantes : crambine (Crambe hispanica) / thionine (Arabidopsis thaliana)

Retrouve-t-on le même genre de résultats ?


Fichiers aide avec toutes les séquences résultats

Toutes les Séquences

ToxinPlant

Retour haut de page