La bioinformation : molécules support, types et obtention

1. Deux types de molécules support de la bioinformation : les acides nucléiques et les protéines

2. Deux types de bioinformation : la séquence des nucléotides et la séquence des acides aminés

3. L'obtention des séquences

 

1. Deux types de molécules support de la bioinformation : les acides nucléiques et les protéines

ADN : Acide DésoxyriboNucléique

  • macromolécule : chaîne nucléotidique
  • constituée par un enchaînement d'unités élémentaires : les désoxyribonucléotides
  • forme de stockage de l'information génétique. Cette information est représentée par une suite linéaire de gènes
  • formée de deux brins complémentaires enroulés en double hélice ce qui lui permet de se dupliquer en deux molécules identiques entre elles et identiques à la molécule mère

On distingue :

  • l'ADN du génome du noyau
  • l'ADN du génome mitochondrial
  • l'ADN du génome chloroplastique

 

 

ARN : Acide RiboNucléique

  • macromolécule : chaîne nucléotidique
  • constitué par un enchaînement d'unités élémentaires : les ribonucléotides
  • forme qui permet de transférer et de traiter l'information dans la cellule
  • le plus souvent formé d'un simple brin

On distingue :

  • les ARN messagers ou ARNm : ils sont transcrits à partir d'un gène (ADN). Ils sont ensuite traduits en protéines.
  • les ARN de transfert
  • les ARN ribosomaux
  • les ARN nucléaires
  • les ARN cytoplasmiques
 

Protéine

  • macromolécule : chaîne polypeptidique
  • constitué par un enchaînement d'unités élémentaires : les acides aminés
  • l'ensemble des protéines assurent les principales fonctions cellulaires
  • se replie sur elle-même et adopte une conformation ou structure particulière dans l'espace. Cette structure tridimensionnelle est à l'origine de la fonction de la protéine et de la spécificité de cette fonction.

 

2. Deux types de bioinformation : la séquence des nucléotides et la séquence des acides aminés

Les chaînes nucléotidiques (ADN, ARN) et les chaînes polypeptidiques (protéines) sont des polymères d'unités élémentaires :

  • ADN : 4 désoxyribonucléotides = dCMP, dGMP, dAMP, dTMP
  • ARN : 4 ribonucléotides = CMP, GMP, AMP, UMP
  • protéines : (essentiellement) 20 acides aminés = Ala (A), Cys (C), Asp (D), Glu (E), Phe (F), Gly (G), His (H), Ile (I), Lys (K), Leu (L), Met (M), Asn (N), Pro (P), Gln (Q), Arg (R), Ser (S), Thr (T), Val (V), Trp (W), Tyr (Y)

Elles possèdent 2 extrémités distinctes et sont donc orientées :

  • de l'extrémité dite 5' vers l'extrémité dite 3' pour les chaînes nucléotidiques
  • de l'extrémité dite N-terminale vers l'extrémité dite C-terminale pour les chaînes polypeptidiques

En conséquence :

  • les chaînes nucléotidiques et polypeptidiques sont une succession ordonnée et orientée d'unités élémentaires
  • les séquences sont leur transcription sous forme d'une succession ordonnée et orientée de lettres qui correspondent à ces unités élémentaires

Exemple de séquence nucléotidique

 

Exemple de séquence polypeptidique

AATTCCGGCA TAGAAACTCA AATCAAAGAG GAAGAAACAC CGATTCTCCT TTTCTCTCTC TAAACAACTA GATCAGATCT CTGAGTTTAA GGAAGCTTTC AGCCTATTCG ATAAGGATGG CGATGGTTGC ATCACAACCA AGGAGCTTGG AACTGTTATG CGATCATTGG GACAAAACCC AACTGAAGCA  

MADQLTDDQI SEFKEAFSLF DKDGDGCITT KELGTVMRSL GQNPTEAELQ DMINEVDADG NGTIDFPEFL NLMARKMKDT DSEEELKEAF RVFDKDQNGF ISAAELRHVM TNLGEKLTDE EVDEMIREAD VDGDGQINYE EFVKVMMAK

Les séquences constituent l'un des principaux types de bioinformation qu'analyse la bioinformatique.

Exemples d'autres types de bioinformation (directe ou obtenue "in silico")
Les structures tridimensionnelles des protéines et aussi, malgré leur nombre plus restreint, des acides nucléiques (en particulier les ARN de transfert). Protein Data Bank
Les données obtenues en protéomique (gels d'électrophorèse bidimensionnel). SWISS-2DPAGE
Le changement d'un nucléotide dans un gène quelconque ("Single Nucleotide Polymorphism"). SNP
La taxonomie (classification) des organismes. Taxonomy
Les réseaux d'interactions qu'établissent les molécules biologiques. BioCarta
Les voies métaboliques KEGG
L'ontologie : l'organisation hiérarchique de la connaissance sur un ensemble d'objets par leur regroupement en sous-catégories suivant leurs caractéristiques essentielles. GO
Les données bibliographiques (diffusion des résultats de la recherche par les articles). PubMed

3. L'obtention des séquences

Séquence des nucléotides

  • par la méthode de F. Sanger (1977) au départ
  • puis par des techniques de plus en plus sophistiquées, automatisées et de masse
 

Séquence des acides aminés

  • par la méthode de P. Edman (1950) au départ
  • puis par traduction "in silico" des séquences nucléotidiques

 

Valid XHTML 1.0 Transitional         Flux RSS Retour haut de page