Présentation du module de bioinformatique
Claudine Landes -------
Gilles Hunault (Biostatistiques) Site Web
Emmanuel Jaspard (Biochimie) Site Web

 

Le but de ce module est d'initier les étudiants à la bioinformatique en leur faisant découvrir les connaissances, les techniques et les outils utilisés dans cette discipline.

C'est un bon complément des notions abordées dans le module "Génomique fonctionnelle et protéomique".

 

La bioinformatique est une discipline à part entière qui utilise un ensemble de techniques et d'outils issus des mathématiques, de la physique et de l'informatique dans le but d'analyser des données biologiques.

Ces données biologiques concernent essentiellement deux types de macromolécules : les acides nucléiques et les protéines.

Des données d'autres types sont maintenant générées, en particulier les données textuelles (ontologie - annotation) ou des mélange de très grands jeux de données (métabolomique).

Les énormes volumes de données biologiques ne peuvent évidemment pas être traités manuellement. Ils nécessitent l'utilisation de l'ordinateur pour le traitement automatique de l'information. Les données biologiques sont regroupées dans un grand nombre de bases de données (généralistes ou spécialisées), utilisables via Internet et le Web.

Les récents progrès des programmes de séquençage des génomes ont ouvert des voies dans les domaines de la biologie, de la santé et de l'agronomie.

La génomique s'intéresse à l'étude exhaustive des génomes : elle en analyse la structure afin d'identifier les gènes et les régions qui régulent l'expression de ces gènes. Cette régulation est assurée par la fixation de facteurs de transcription sur des régions particulières des gènes. Il en résulte un très grand nombre d'interactions protéine/ADN et protéine/protéine.

La transcriptomique s'intéresse à l'étude exhaustive des transcrits (ARN messagers et ARN non codanst). Elle s'appuie très largement sur les nouvelles technologies de séquençage à trés haut débit, en particulier la technique RNAseq, les méthodes SAGE, les puces à ADN.

La protéomique étudie l'ensemble des protéines contenues dans une cellule (le protéome). Elle s'articule autour de trois thèmes majeurs : la prédiction de structures, la relation structure-fonction et la phylogénie.

D'autres voies sont en pleine expansion :

  • l'étude des réseaux d'interactions entre molécules (protéine/ADN, protéine/protéine, protéines/substrats, protéines/effecteurs ). Le but est de décrire le fonctionnement global d'une cellule dans un environnement donné.
  • la modélisation moléculaire pour la conception de médicaments et l'étude de l'interaction entre macromolécules.

En conclusion :

  • La bioinformatique permet au biochimiste d'exploiter le formidable potentiel de connaissances contenues dans les banques de données et de les analyser.
  • Elle permet à l'informaticien de mettre en œuvre ses compétences en algorithmique et en programmation, en développement d'interface et de bases de données.
  • Enfin, si l'informatique permet d'accéder aux données, les statistiques permettent d'en analyser le contenu.

Contenu des enseignements - salles informatique

1. Claudine LANDES - 8 H [CM / TD]

  • Phylogènie.
  • Bases théoriques de l'alignement. Alignement multiple.

2. Statistiques appliquées à la bioinformatique - Gilles HUNAULT - 8 H [CM / TD]

  • Etude de QT (moyennes, corrélations...) ; application aux longueurs de protéines, aux valeurs d'hydropathie.
  • Etude de QL (comptages, chi-deux...) ; application aux propriétés (présence de pont disulfure, classes d'hydrophobicité...).
  • Tests classique dont anova (études par groupe) ; application à LEAPDB et DBDB.
  • Analyse des données (AFC, ACP, CAH) ; application aux données RNAseq.

Logiciel utilisé : R

On apprendra aux étudiant(e)s à accorder une attention toute particulière à la rédaction et au choix des graphiques associés aux calculs en fonction du public concerné par l'étude statistique.

3. Bioinformatique appliquée - Emmanuel JASPARD - 12 H [CM / TD]

  • Description des bases de données et des données dans les bases de données (Fichiers GenPept / format Fasta, ...)
  • Recherche de fichiers de protéines - rapatriement de séquences - modification des formats pour l'utilisation de logiciels bioinformatiques
  • Utilisations de programmes d'alignement (Multalin, ClustalW, MAFT, Muscle, ...) - Alignements locaux, globaux - paramétrage des programmes d'alignement
  • Recherche de motifs : peptide signal, signature, famille de protéines, ...
  • Approche bioinformatique en protéomique
  • Théories sous-jacentes aux divers aspects abordés

D'autres ressources utiles sont consultables sur le site Web de Jean-Michel Richer (Informatique).

 

Valid XHTML 1.0 Transitional         Flux RSS Retour haut de page