Module bioinformatique bioinformation support obtention Enseignement et recherche Biochimie - Universite Angers Emmanuel Jaspard biochimej

La bioinformation : molécules support, types et obtention

1. Deux types de molécules support de la bioinformation : les acides nucléiques et les protéines

2. Deux types de bioinformation : la séquence des nucléotides et la séquence des acides aminés

3. L'obtention des séquences

Voir un ensemble de cours sur la bioinformatique.

1. Deux types de molécules support de la bioinformation : les acides nucléiques et les protéines

ADN : Acide DésoxyriboNucléique

macromolécule : chaîne nucléotidique
constituée par un enchaînement d'unités élémentaires : les désoxyribonucléotides
forme de stockage de l'information génétique. Cette information est représentée par une suite linéaire de gènes
formée de deux brins complémentaires enroulés en double hélice ce qui lui permet de se dupliquer en deux molécules identiques entre elles et identiques à la molécule mère

On distingue :

l'ADN du génome du noyau
l'ADN du génome mitochondrial
l'ADN du génome chloroplastique

ARN : Acide RiboNucléique

macromolécule : chaîne nucléotidique
constitué par un enchaînement d'unités élémentaires : les ribonucléotides
forme qui permet de transférer et de traiter l'information dans la cellule
le plus souvent formé d'un simple brin

On distingue :

les ARN messagers ou ARNm : ils sont transcrits à partir d'un gène (ADN). Ils sont ensuite traduits en protéines.
les ARN de transfert
les ARN ribosomaux
les ARN nucléaires
les ARN cytoplasmiques
les miARN
...

Protéine

macromolécule : chaîne polypeptidique
constitué par un enchaînement d'unités élémentaires : les acides aminés
l'ensemble des protéines assurent les principales fonctions cellulaires
la chaîne polypeptidique se replie sur elle-même et adopte une conformation ou structure particulière dans l'espace.
vette structure tridimensionnelle est à l'origine de la fonction de la protéine et de la spécificité de cette fonction.

2. Deux types de bioinformation : la séquence des nucléotides et la séquence des acides aminés

Les chaînes nucléotidiques (ADN, ARN) et les chaînes polypeptidiques (protéines) sont des polymères d'unités élémentaires :

ADN : 4 désoxyribonucléotides = dCMP, dGMP, dAMP, dTMP
ARN : 4 ribonucléotides = CMP, GMP, AMP, UMP
protéines : (essentiellement) 20 acides aminés = Ala (A), Cys (C), Asp (D), Glu (E), Phe (F), Gly (G), His (H), Ile (I), Lys (K), Leu (L), Met (M), Asn (N), Pro (P), Gln (Q), Arg (R), Ser (S), Thr (T), Val (V), Trp (W), Tyr (Y)

Elles possèdent 2 extrémités distinctes et sont donc orientées :

de l'extrémité dite 5' vers l'extrémité dite 3' pour les chaînes nucléotidiques
de l'extrémité dite N-terminale vers l'extrémité dite C-terminale pour les chaînes polypeptidiques

En conséquence :

les chaînes nucléotidiques et polypeptidiques sont une succession ordonnée et orientée d'unités élémentaires
les séquences sont leur transcription sous forme d'une succession ordonnée et orientée de lettres qui correspondent à ces unités élémentaires

Les séquences constituent l'un des principaux types de bioinformation qu'analyse la bioinformatique.

Exemples d'autres types de bioinformation (directe ou obtenue "in silico")
Les structures tridimensionnelles des protéines et aussi, malgré leur nombre plus restreint, des acides nucléiques (en particulier les ARN de transfert).	Protein Data Bank
Les données obtenues en protéomique (gels d'électrophorèse bidimensionnel).	SWISS-2DPAGE
Le changement d'un nucléotide dans un gène quelconque ("Single Nucleotide Polymorphism").	SNP
La taxonomie (classification) des organismes.	Taxonomy
Les réseaux d'interactions qu'établissent les molécules biologiques.	BioCarta
Les voies métaboliques.	KEGG
L'ontologie : l'organisation hiérarchique de la connaissance sur un ensemble d'objets par leur regroupement en sous-catégories suivant leurs caractéristiques essentielles.	GO
Les données bibliographiques (diffusion des résultats de la recherche par les articles).	PubMed

3. L'obtention des séquences

Séquence des nucléotides par la méthode de F. Sanger (1977) au départ puis par des techniques de plus en plus sophistiquées, automatisées et de masse.

Séquence des acides aminés par la méthode de P. Edman (1950) au départ puis par traduction "in silico" des séquences nucléotidiques puis par spectromètrie de masse.