La bioinformation : molécules support, types et obtention
biochimej Flux RSS

1. Deux types de molécules support de la bioinformation : les acides nucléiques et les protéines

2. Deux types de bioinformation : la séquence des nucléotides et la séquence des acides aminés

3. L'obtention des séquences

 

Voir un ensemble de cours sur la bioinformatique.


1. Deux types de molécules support de la bioinformation : les acides nucléiques et les protéines

ADN : Acide DésoxyriboNucléique

  • macromolécule : chaîne nucléotidique
  • constituée par un enchaînement d'unités élémentaires : les désoxyribonucléotides
  • forme de stockage de l'information génétique. Cette information est représentée par une suite linéaire de gènes
  • formée de deux brins complémentaires enroulés en double hélice ce qui lui permet de se dupliquer en deux molécules identiques entre elles et identiques à la molécule mère

On distingue :

 

 

ARN : Acide RiboNucléique

  • macromolécule : chaîne nucléotidique
  • constitué par un enchaînement d'unités élémentaires : les ribonucléotides
  • forme qui permet de transférer et de traiter l'information dans la cellule
  • le plus souvent formé d'un simple brin

On distingue :

  • les ARN messagers ou ARNm : ils sont transcrits à partir d'un gène (ADN). Ils sont ensuite traduits en protéines.
  • les ARN de transfert
  • les ARN ribosomaux
  • les ARN nucléaires
  • les ARN cytoplasmiques
  • les miARN
  • ...
 

Protéine

  • macromolécule : chaîne polypeptidique
  • constitué par un enchaînement d'unités élémentaires : les acides aminés
  • l'ensemble des protéines assurent les principales fonctions cellulaires
  • la chaîne polypeptidique se replie sur elle-même et adopte une conformation ou structure particulière dans l'espace.
  • vette structure tridimensionnelle est à l'origine de la fonction de la protéine et de la spécificité de cette fonction.

 

2. Deux types de bioinformation : la séquence des nucléotides et la séquence des acides aminés

Les chaînes nucléotidiques (ADN, ARN) et les chaînes polypeptidiques (protéines) sont des polymères d'unités élémentaires :

  • ADN : 4 désoxyribonucléotides = dCMP, dGMP, dAMP, dTMP
  • ARN : 4 ribonucléotides = CMP, GMP, AMP, UMP
  • protéines : (essentiellement) 20 acides aminés = Ala (A), Cys (C), Asp (D), Glu (E), Phe (F), Gly (G), His (H), Ile (I), Lys (K), Leu (L), Met (M), Asn (N), Pro (P), Gln (Q), Arg (R), Ser (S), Thr (T), Val (V), Trp (W), Tyr (Y)

Elles possèdent 2 extrémités distinctes et sont donc orientées :

  • de l'extrémité dite 5' vers l'extrémité dite 3' pour les chaînes nucléotidiques
  • de l'extrémité dite N-terminale vers l'extrémité dite C-terminale pour les chaînes polypeptidiques

En conséquence :

  • les chaînes nucléotidiques et polypeptidiques sont une succession ordonnée et orientée d'unités élémentaires
  • les séquences sont leur transcription sous forme d'une succession ordonnée et orientée de lettres qui correspondent à ces unités élémentaires

Les séquences constituent l'un des principaux types de bioinformation qu'analyse la bioinformatique.

Exemples d'autres types de bioinformation (directe ou obtenue "in silico")
Les structures tridimensionnelles des protéines et aussi, malgré leur nombre plus restreint, des acides nucléiques (en particulier les ARN de transfert). Protein Data Bank
Les données obtenues en protéomique (gels d'électrophorèse bidimensionnel). SWISS-2DPAGE
Le changement d'un nucléotide dans un gène quelconque ("Single Nucleotide Polymorphism"). SNP
La taxonomie (classification) des organismes. Taxonomy
Les réseaux d'interactions qu'établissent les molécules biologiques. BioCarta
Les voies métaboliques. KEGG
L'ontologie : l'organisation hiérarchique de la connaissance sur un ensemble d'objets par leur regroupement en sous-catégories suivant leurs caractéristiques essentielles. GO
Les données bibliographiques (diffusion des résultats de la recherche par les articles). PubMed

 

3. L'obtention des séquences

Séquence des nucléotides par la méthode de F. Sanger (1977) au départ puis par des techniques de plus en plus sophistiquées, automatisées et de masse.

Séquence des acides aminés par la méthode de P. Edman (1950) au départ puis par traduction "in silico" des séquences nucléotidiques puis par spectromètrie de masse.

Valid XHTML 1.0 Transitional