Le séquençage du génome humain

biochimej biochimej Flux RSS

 

Préambule

Le premier "brouillon" ("draft") du génome humain a été publié en 2001, autant dire il y a "très longtemps" en regard de l'extrême rapidité des avancées tant conceptuelles que technologiques (les premières étant bien souvent le résultat des secondes).

Ce cours est davantage la mémoire d'un évènement capital pour l'homme. Les conclusions, les descriptions sont principalement celles de l'époque. Il a pour but d'illustrer la démarche en biologie sur la base d'une avancée scientifique dont la portée est universelle.

Voir un ensemble de cours en génomique et en transcriptomique.

biochimej biochimej Retour haut de page

1. Déroulement du programme de séquançage du génome humain

La molécule d'ADN est le support biologique de l'information héréditaire. Cette information est transmise par la copie conforme de cette molécule.

C'est une macromolécule formée par l'enchaînement de milliers, de millions ou de milliards (dans le cas de l'homme) de nucléotides. L'extension complète de l'ADN humain formerait un fil de plus d'1,2 m.

Ci-dessous : une molécule d'ADN (long brin jaune) d'une bactérie Escherichia coli éclatée par un choc osmotique. Echelle : un fragment de la molécule d'ADN d'environ la moitié de la longueur de la bactérie correspond à environ 5000 paires de bases.

sequencage genome humain code genetique codon gene ARN messager ADN biochimej

Source : "L'information biologique"

biochimej biochimej Retour haut de page

Ci-dessous, un aperçu du déroulement du séquençage du génome humain.

sequencage genome humain code genetique codon gene ARN messager ADN biochimej

Source : Nature 409, 860 - 921 - International Human Genome Sequencing Consortium

1984 à 1990 Les pré-projets.
  • L'Initiative du Génome Humain est annoncée et quelques projets technologiques commencent.
  • Création de la fondation HUGO ("Human Genome Organization") pour coordonner le séquençage au niveau mondial (éviter les doublons). Echec du projet (coût trop élevé).
1990

Le NIH ("National Institute of Health" - USA) et le DOE ("Department of Energy Office of science"- USA) présentent au Congrès américain le projet "Génome Humain" ("Human Genome Project" - HGP). HGP est un consortium regroupant des laboratoires de différents pays (Etats-Unis, Royaume-Uni, Japon, Allemagne, Chine et France - Génoscope).

Il est financé par des fonds publiques et caritatifs. Pour éviter les problèmes liés au dépôt de brevet, les résultats du séquençage sont accessibles à tous sur internet dans les 24 heures.

Les objectifs du HGP étaient de :
  • séquencer les 3 milliards de paires de bases du génome humain avec un taux d'erreur minimal
  • identifier tous les gènes.
  • développer des méthodes plus rapides et efficaces pour le séquençage de l'ADN et l'analyse des séquences
  • transférer ces technologies à l'industrie
Le Consortium public n'a pas accordé d'importance au choix des multiples donneurs d'ADN.
1992 Première phase du projet : première carte physique génétique complète (basse résolution).
1993 Le Généthon fournit des mega-YACs au HGP. Le YAC ("Yeast Artificial Chromosome") est un vecteur utilisé pour cloner des fragments d'ADN jusqu'à une taille de 400 kb. Le BAC ("Bacterial Artificial Chromosome") est aussi un vecteur utilisé pour cloner des fragments d'ADN jusqu'à une taille de 300 kb.
1997 Séquençage complet du génome de la bactérie Escherichia Coli. Publication de cartes physiques génétiques à haute résolution des chromosomes humains 7 et X.

Le décryptage du génome pose la question de la brevetabilité du vivant, l'UNESCO le 11 novembre 1997 à déclaré que le génome humain est un patrimoine de l'humanité, or un patrimoine de l'humanité ne peut pas être la propriété d'un individu.

Donc, une séquence d'ADN ne peut pas être brevetée.

1998 Création de la société "Celera Genomics" (USA) par Craig Venter dans le but de séquencer le génome humain en compétition avec l'HGP. Cette société a fait le choix de séquencer l'ADN de cinq personnes d'origine : africaine, asiatique, caucasienne et latino-américaine. Une vraie course au séquençage est lancée : l'enjeu est la propriété publique ou privée du génome humain dans le but d'une exploitation commerciale des tests et des médicaments (brevets).
1999 Première séquence complète du chromosome 22 établie par HGP.
2000

HGP annonce 90 % du séquençage du génome humain. "Celera Genomics" propose les premiers résultats du séquençage total du génome d'une personne.

  • Publication du génome du chromosome 21.
  • Publication du génome complet de la mouche Drosophila melanogaster.

Communiqué commun de Tony Blair et Bill Clinton (14 mai 2000) qui annoncent leur souhait que les résultats du séquençage soient en accès libre et que les brevets soient limités à leur exploitation industrielle et commerciale.

L'entreprise "Celera Genomics" va donc devoir rendre ses résultats publics de manière trimestrielle.

Février 2001 La même semaine, publication du brouillon initial des travaux de séquençage du génome humain complet par :

Le génome humain contient 3,2 milliards de nucléotides et il contiendrait environ 30.000 à 40.000 gènes (chiffre nettement inférieur à ce qui était prévu). Cependant, la structure des gènes est trés complexe (introns, exons, épissage alternatif) : un même gène peut coder différentes protéines.

On ignore le nombre total de protéines différentes que peut fabriquer l'organisme humain. Pour le moment, on estime ce nombre entre 50 000 et 150 000.

1. L'ADN humain est extrêmement hétérogène. Les gènes ne sont pas répartis uniformément sur le génome. Il existe des zones qui n'en contiennent aucun, mais possèdent des séquences répétitives. On ne connait pas encore les fonctions de ces parties de l'ADN.

2. Les résultats de la société "Celera Genomics" montrent qu'il y a plus de différences entre l'ADN des deux Caucasiens qu'entre celui d'un Africain et d'un Caucasien. Tous les êtres humains sont différents et cette différence résulte des variations entre l'ADN des individus. Ces variations correspondent au changement d'un nucléotide dans un gène quelconque que l'on appelle un "Single Nucleotide Polymorphism" (SNP). Les SNPs représentent 0,1% de différence entre deux génomes (plus de 1,4 millions de SNP ont été identifiés). Ils sont particulièrement intéressants pour la médecine et l'industrie pharmaceutique (détermination de l'origine de nombreuses maladies, développement de tests de prédisposition aux maladies, synthèse de médicaments en fonction de la sensibilité génétique).

3. Le gène ZNF217 est identifié dans le chromosome 20. Ce gène apparaît en nombre croissant de copies dans beaucoup de tumeurs. Il jouerait un rôle dans le cancer du sein.

biochimej biochimej Retour haut de page

Evolution du nombre de génes estimés dans le génome humain
Technique Date Nombre de gènes estimés Hypothèses et commentaires
"Calcul" initial 1990 100 000 Avec l'hypothèse que la taille moyenne d'un gène = 30 kb
Ebauche de séquençage du génome 1994 71 000 Résultat biaisé par les régions riches en gènes ?
Ilôts CpG   80 000 Avec l'hypothèse que 66% des gènes humains ont de tels "ilôts"
Analyse des EST 1994 64 000 Gènes ayant un homologue dans GenBank - Redondance des EST de 50%
Chromosome 22 1999 45 000 Correction liée à la haute densité en gène de ce chromosome
Technique "Exofish" ("Exon Finding by Sequences Homology") 2000 28 000 - 34 000

Avec l'hypothèse que les régions codantes sont plus conservées que les non-codantes. Comparaison des génomes homme - poisson ("Tetraodon nigroviridis")

EST 2000

35 000

120 000

Nombre de gènes

Nombre de transcrits

Premier "brouillon" du génome 2001 30 000 - 40 000 Gènes connus + prédictions
Comparaison avec le génome de la souris 2002 30 000 Gènes connus + prédictions
Génome abouti 2004 20 000 - 25 000 Gènes connus + prédictions
Génome abouti 2007 20 000 Annotation des gènes améliorée
Source : Duret L. (2011) - "Bioinformatique: Annotation des génomes eucaryotes"

sequencage sequencing genome humain human code genetique codon gene chromosome ARN messager ADN DNA biochimej

Source : NCBI

sequencage sequencing genome humain human code genetique codon gene chromosome ARN messager ADN DNA biochimej

Source : NCBI

GOLD ("Genomes Online Database") : base de données de l'ensemble des génomes séquencés.

biochimej biochimej Retour haut de page

2. Société : champs d'application de la bioinformatique et des domaines affèrant

Santé (source : Rapport sénatorial sur "Génomique et informatique" - 1999)

La génomique devrait permettre une évolution fondamentale de notre approche en soins de santé, beaucoup plus axée sur la prévention que sur le traitement.

Le diagnostic moléculaire (tests ciblant le patrimoine génétique).

Tests de dépistage de maladies.

Diagnostic de maladies infectieuses et génétiques (connaissances des prédispositions génétiques).

On peut supposer qu'il sera possible de déceler et de diagnostiquer les maladies beaucoup plus tôt, des années souvent avant l'apparition de symptômes. D'où des traitements précoces donc plus efficace et à moindre coût.

La pharmacogénomique : adaptation des traitements aux malades en fonction de leur profil génétique.

La séquence d'ADN d'un individu pourrait devenir un élément fondement de son traitement.

Les patients pourront subir un test et voir si un médicament leur convient.

Détection de cibles d'intérêt pour la mise au point de nouveaux médicaments.

Maîtrise de la toxicité des médicaments.

La génomique jouera un rôle primordial dans la mise au point des médicaments.

En utilisant la génomique pour présélectionner les sujets, les fabricants de médicaments pourront cibler leurs essais.

Thérapie génique : réparation d'un gène ou apport in situ d'un gène fonctionnel

Utilisation de gènes normaux pour remplacer un gène défectueux, y suppléer ou stimuler une résistance totale à une maladie.

Elle pourrait permettre de soigner (voire de guérir) des maladies génétiques et acquises.

Mise au point de nouveaux vaccins. Vaccins à base d'ADN et vaccins "traditionnels" découverts grâce à la connaissance du génome des bactéries.
Les protéines thérapeutiques. L'utilisation des techniques du génie génétique pour la production de protéines par des bactéries ou des levures et, plus récemment par des animaux génétiquement modifiés.

Agro-alimentaire
  • Plantes résistantes aux pesticides, aux pathogènes, aux insectes, à la sécheresse permettant de nourrir les populations.
  • Tolérance au stress environnementaux.
  • Rendements et qualité.
Environnement
  • Lutte contre les pollutions chimiques ou biologiques (traitements de l'eau, des sols, des déchets)
  • Dégradation de pesticides par les bactéries
  • Préservation de la biodiversité
  • Gestion du milieu marin : étude de la structure et du fonctionnement des écosystèmes marins et apport des modèles marins à la compréhension de l'évolution des fonctions biologiques
  • Nouvelles sources d'énergie.
    1. Dans un avenir immédiat, la génomique peut servir à mieux comprendre comment les plantes peuvent retirer plus de carbone de l'atmosphère et en retenir davantage lorsqu'elles meurent et se décomposent.
    2. Des solutions biotechnologiques au problème du changement climatique seront envisageables quand la biologie moléculaire des plantes et des micro-organismes comme les bactéries et les algues sera élucidée.
    3. Par exemple, les cyanobactéries transforment le CO2 de l'atmosphère en composés organiques, sans produire de gaz à effet de serre. L'environnement peut tirer profit de la pleine compréhension du mode de fonctionnement de tels organismes via la génomique.

biochimej biochimej Retour haut de page

Valid XHTML 1.0 Transitional