Les immunoglobulines et la recombinaison V(D)J
biochimej biochimej Flux RSS

 

1. Introduction

2. Structure des immunoglobulines

3. Les classes ou isotypes d'immunoglobulines

4. Organisation et réarrangement des segments des gènes des immunoglobulines

5. La recombinaison V(D)J RSS et les protéines du complexe recombinase V(D)J

a. La séquence signal RSS

 

b. Mécanisme de la recombinaison V(D)J

c. Les protéines RAG-1 et RAG-2

6. Le domaine d'interaction avec l'antigène

a. Structure des domaines V des chaînes L et H

b. Nombre restreint des conformations des CDR - conception d'anticorps artificiels

7. Liens Internet et références bibliographiques

 

1. Introduction

a. Les immunoglobulines

Elles sont sécrétées par les plasmocytes (stade final de la différenciation des lymphocytes B).

Elles constituent une super-famille de glycoprotéines solubles impliquées dans la reconnaissance et la fixation d'une substance étrangère appelée antigène ("antigen" est la contraction de "Antisomatogen + Immunkörperbildner") ou dans l'adhésion entre cellules.

Quelques dates clés :

  • En 1890, Emil von Behring et Kitasato Kitasato ont découvert des substances dans le sérum qui neutralisent les toxines diphtériques (antitoxines). Emil von Behring : premier Prix Nobel de physiologie ou médecine en 1901 pour ses travaux sur la thérapie sérique en particulier concernant la diphtérie.
  • L'hypothèse de la formation d'anticorps est dûe à Paul Ehrlich en 1900. Paul Ehrlich et Ilya Mechnikov : Prix Nobel en 1908 pour leurs travaux sur l'immunité.
  • 1938 : hypothèse de la fixation d'un anticorps à un antigène est dûe à John Marrack.
  • 1948 : découverte de la production des anticorps par les lymphocytes B.
  • Gerald Edelman et Rodney Porter : Prix Nobel en 1972 pour leurs travaux sur la structure chimique des anticorps.
  • Niels Jerne, Georges Köhler et César Milstein : Prix Nobel en 1984 pour leurs travaux sur les anticorps monoclonaux.

Retour haut de page

b. Les anticorps monoclonaux thérapeutiques

Les termes anticorps et immunoglobuline sont souvent employés comme synonymes. Cependant, le terme anticorps est davantage réservé à la forme sécrétée et soluble des immunoglobulines car un anticorps ne possède pas de domaine trans-membrane plasmique.

Les anticorps constituent donc le principal type d'immunoglobulines dans le sang. Ce sont des glycoprotéines synthétisées par le système immunitaire en présence d'un antigène.

  • En 1986, le médicament appelé "Muromonab-CD3" ("T-cell surface glycoprotein Cluster of Differentiation 3") a obtenu la première approbation comme anticorps monoclonal thérapeutique par l'agence américaine "US Food and drug Administration" (FDA).
  • La FDA n'a approuvé le second qu'en 1994.
  • Puis les approbations ont graduellement augmenté : la FDA a approuvé le 50ème en 2015 et le 100ème anticorps monoclonal thérapeutique en avril 2021.
  • Désormais, l'approbation d'anticorps monoclonaux représentent chaque année environ 1/5ème des approbations de nouveaux médicaments par la FDA.
  • En 2019, les anticorps représentaient 9 des 20 principaux produits thérapeutiques en termes de ventes : ces 9 anticorps ont généré 75 milliards de dollars cette année-là.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies

Source : Mullard A. (2021)

Les types d'anticorps monoclonaux thérapeutiques sont :

  • la forme dite "canonique"
  • les conjugués anticorps - médicament ("antibody–drug conjugates")
  • les anticorps bi-spécifiques
  • les fragments d'anticorps
    1. les fragments de liaison à l'antigène ("antigen-binding fragments" - Fab)
    2. les constructions de région variable à chaîne unique ("single-chain variable region" - scFv)
    3. les domaines d'anticorps
  • les anticorps radiomarqués et les anticorps - immunotoxines

L'apparition de la COVID-19 se traduit par le développement de dizaines de médicaments ciblant le SRAS-CoV-2 et la protéine de pointe du virus est désormais l'une des dix premières cibles. Plusieurs produits ont obtenu une autorisation par la FDA pour une utilisation d'urgence, mais pas une approbation complète.

Retour haut de page

2. Structure des immunoglobulines

Les immunoglobulines sont parmi les protéines dont on connaît le mieux la structure (des centaines de structure tridimensionnelles ont été déterminées). Voir "Antibody - Proteopedia".

Cependant, ce sont des protéines très flexibles et la plupart des structures qui ont été obtenues concernent des fragments d'immunoglobulines. Exemples de structures d'immunoglobulines entières : 1IGT - 1IGY - 1HZH.

a. Les chaînes des immunoglobulines

Les immunoglobulines sont des protéines "tout-β" composées de :

  • 2 chaînes polypeptidiques dites légères ou L ("Light") identiques. Il existe 2 types de chaînes L : κ ou λ (environ 60% et 40%, respectivement, sur l'ensemble des immunoglobulines chez l'homme).
  • 2 chaînes polypeptidiques dites lourdes ou H ("Heavy") identiques.
  • Les chaînes polypeptidiques L et H sont reliées par des ponts disulfure intra-chaînes et inter-chaînes et sont chacune codées par une famille multigénique distincte.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies

Source : Schroeder & Cavacini (2010)

Retour haut de page

b. Les régions des immunoglobulines

Les chaînes polypeptidiques L et H possèdent :

  • Des régions N-terminales (environ 100 - 130 acides aminés) variables (V) ou Fab ("fragment, antibody binding") qui reconnaissent l'antigène.
  • Des régions (environ 100 - 130 acides aminés) constantes (C) ou Fc ("fragment, crystalline") qui interagissent avec les récepteurs à la surface des cellules.

Les régions V et C sont codées par des éléments indépendants : les segments de gènes V(D)J pour la région V et des exons pour les régions C.

La séquence primaire de la région V est fonctionnellement divisée :

  • En 3 séquences hypervariables, appelés régions déterminant la complémentarité ("Complementarity Determining Regions" - CDR) : c'est la région principale qui contient les acides aminés qui fixent l'antigène (paratope). Les CDR forment des structures en boucle.
  • Les CDR sont elles-mêmes situées entre 4 régions de séquence stable appelé cadres ("FRameworks " - FR).

c. Les domaines des immunoglobulines

Les chaînes L (κ ou λ) possèdent 2 domaines :

  • Les séquences en acides aminés du premier domaine sont très variables : elles définissent le domaine variable des chaînes L (VL).
  • Le domaine dont la séquence en acides aminés est conservée est appelé domaine constant des chaînes L (CL).

Les chaînes H possèdent 4 ou 5 domaines :

  • Les séquences en acides aminés du premier domaine sont très variables : elles définissent le domaine variable des chaînes H (VH).
  • Les domaines constants des chaînes H sont numérotés de l'acide aminé N-terminal vers l'acide aminé C-terminal : CH1, CH2, CH3 (et CH4 pour les IgM et IgE).
  • Les gènes codant les IgG, les IgA et les IgD possèdent un exon codant pour une séquence en acides aminés située entre les domaines CH1 et CH2. Cette séquence est riche en cystéine et en proline assurant une grande flexibilité entre les deux branches de l'anticorps (pour une fixation optimale de l'antigène) : c'est la région appelée charnière ("Hinge"), très sensible à l'hydrolyse par les protéases.

d. Paratopes, épitopes et idiotypes

Les interactions immunoglobuline - antigène s'établissent entre :

  • Le paratope : le site de l'immunoglobuline sur lequel l'antigène se fixe. Le paratope est formé, en particulier, par les séquences hypervariables des CDR des chaînes L et H.
  • Et l'épitope : le site de l'antigène qui est fixé.

L'immunisation d'espèces hétérologues avec des anticorps monoclonaux a permis d'identifier les déterminants antigéniques individuels des immunoglobulines appelés idiotypes, qui sont contenus dans les régions V.

e. La superfamille des immunoglobulines

Les vertébrés et les invertébrés possèdent un grand nombre de protéines à la surface des cellules. Ces protéines sont étroitement apparentées et semblent avoir évolué à partir des séquences de gènes communs.

Ces protéines forment la superfamille des immunoglobulines (qui incluent les récepteurs de surface et les molécules d'adhésion). Ces protéines contiennent toutes des domaines immunoglobulines (forte homologie de séquence en acides aminés et de structure tridimensionnelle avec des ponts disulfures intracaténaires).

f. Les nano-anticorps ("nanobodies")

Un sous-ensemble d'anticorps chez une minorité d'espèces [par exemple, les camélidés ou le requin nourrice] ne possèdent pas de chaînes L et n'ont que les chaînes H pour la liaison à l'antigène.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies

Source : Nanobody-aided crystallography

Ces variants n'existent pas chez l'homme et il y a des tentatives pour "humaniser" ce type d'anticorps à des fins thérapeutiques et diagnostiques.

Il s'agit des anticorps simple domaine ("single-domain antibody" ou "nanobody") qui correspondent seulement au domaine variable d'une chaîne H (VH).

Ils ont une taille qui est environ 1/10ème de celle des immunoglobulines et une masse molaire de 12 à 15 kDa (environ 110 acides aminés), bien moindre que celle des anticorps communs (voir tableau ci-dessus).

Récemment, l'équipe de Brian Kobilka (Prix Nobel de Chimie 2012) a conçu un fragment d'anticorps de haute affinité qui stabilise la conformation active de β2AR (β2-adrénocepteur). Les structures de β2AR lié à 3 agonistes chimiquement distincts ont ainsi été déterminées.

Retour haut de page

3. Les classes ou isotypes d'immunoglobulines

Les régions constantes des chaînes polypeptidiques H possèdent une séquence d'acides aminés qui leur sont caractéristiques et qui permettent de définir 5 classes d'immunoglobulines (Ig) ou isotypes : IgM, IgD, IgG, IgE et IgA.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies

Source : J. Actor (2013)

Il existe 4 sous-classes de l'isotype IgG : IgG1, IgG2, IgG3 et IgG4.

Il existe 2 sous-classes de l'isotype IgA : IgA1 et IgA2.


Paramètre Classe d'immunoglobuline (Ig)
Isotype IgM IgD IgG IgE IgA
Structure quaternaire
(H = "heavy" - L = "light")
Pentamère
H10L10J
Monomère
H2L2
Monomère
H2L2
Monomère
H2L2
Monomère ou dimère
H2L2
H4L4JSC
Appellation de la chaîne lourde (masse molaire - kDa) μ (65) δ (70) γ (53) ε (73) α (55)
Masse molaire (kDa)a 900 - 970 180 - 185 146 - 165 188 160 - 395
Localisation Lymphocyte B Lymphocyte B Sang Basophiles - mastocytes Muqueuses - sécrétions
Concentration dans le sérum (mg/mL)a 0,5 - 2 0 - 0,4 0,5 - 16,0 < 0,0001 0,5 - 4,0
Proportion (%) 10 < 1 70 - 75 < 1 15 - 20
Temps de demie-vie dans le sérum (jours) 5 - 10 3 7 - 23 2,5 6
chaîne J Oui Non Non Non Oui
Taux de glycosylation (% en poids) 12 13 3 12 10
Activation du complément Fort Non Oui (sauf IgG4) Non Non
Neutralisation de toxines bactériennes Oui Non Oui Non Oui
Activité anti-virale Non Non Oui Non Oui
Fixation aux mastocytes ("mast cells") et aux basophiles Non Non Non Oui Non
Autres propriétés Anticorps intravasculaire produit très tôt dans la réponse immunitaire.
Du fait de son haut degré oligomèrique, il est très efficace comme agglutinateur des bactéries et des antigènes particulaires.
Efficace pour l'opsonisation des bactéries.
Trouvées à la surface des lymphocytes B matures.
Elles fonctionnent avec les IgM.
Anticorps dépendant de la cytotoxicité de la cellule.
Immunoglobulines les plus abondantes dans les fluides extravasculaires.
Elles neutralisent les toxines et les micro-organismes en activant le système du complément et en facilitant la liaison des cellules phagocytaires.
Responsables des symptômes d'allergie atopique comme l'eczéma et l'asthme.
Efficace contre les vers parasites.
Elles se lient aux mastocytes et, au contact de l'antigène, recrutent des agents antimicrobiens via la dégranulation des mastocytes et la libération de médiateurs inflammatoires.
Sous forme de monomère dans les sécrétions et de dimère à la surface épithéliale.
aLes chiffres varient d'une source à l'autre.
L'opsonisation est la fonction du système immunitaire qui tapisse par l'opsonine la membrane externe des cellules qui doivent être détruites.

Paramètre IgG1 IgG2 IgG3 IgG4
% des IgG totales 70 20 7 3
Temps de demie-vie (jours) 23 23 7 23
Fixation au complément + + Fort Non
Passage dans le placenta ++ ± ++ ++
Fixation au monocytes Fort + Fort ±

Retour haut de page

4. Organisation et réarrangement des segments des gènes des immunoglobulines

a. Origine de la diversité des immunoglobulines

Les immunoglobulines doivent reconnaître spécifiquement un nombre extrêmement élevé de peptides antigèniques.

Un mécanisme, appelé recombinaison V(D)J, permet d'obtenir cette diversité des immunoglobulines. Cette recombinaison est catalysée par un complexe protéique appelé recombinase V(D)J.

La recombinaison V(D)J s'effectue pour les gènes codant la région V des chaînes L et les gènes codant la région V des chaînes H qui sont organisés en segments distincts dénommés :

  • V ("Variable") qui code les 95 premiers acides aminés
  • D ("Diversity") qui code environ 5 acides aminés
  • J ("Joining") qui code les 10 - 15 derniers acides aminés

Chaque segment de gène V contient généralement :

  • son propre promoteur
  • 1 exon "leader"
  • 1 intron
  • 1 exon qui code les 3 premiers cadres (FR1, FR2 et FR3), les séquences hypervariables CDR1 et CDR2 dans leur intégralité et la partie N-terminale de CDR3
  • 1 séquence signal de recombinaison ("Recombination Signal Sequence " - RSS) - voir "La séquence signal RSS".

Chaque segment de gène J contient généralement :

  • sa propre RSS
  • 1 exon qui code la partie C-terminale de CDR3 et FR4 dans son intégralité

Nombre de segments de gènes V, D et J et d'exons C fonctionnels dans les loci immunoglobulines chez l'homme
Les chiffres varient selon l'haplotype de l'individu.
 

Chaînes L

Chaîne H
Segment ou exon Chaîne κ
locus IGK - chromosome 2 homme
(2p11.2)
Chaîne λ
locus IGL - chromosome 22 homme
(22q11.2)
locus IGH - chromosome 14 homme
(14q32.33 )
Variable (V) 40 - 75 Vκ : 30 sont fonctionnels 30 - 36 Vλ environ 80 VH : 39 sont fonctionnels
Diversity (D) 0 Dκ 0 Dλ 27 DH
Joining (J) 5 Jκ 4 Jλ 6 JH
exon (C) 1 Cκ 4 Cλ 9 CH : 1 µ (IgM), 1 δ (IgD), 4 γ (IgG)
1 ε (IgE), 2 α (IgA)

  • Nombre de combinaisons V(D)J de chaînes L(κ) : 30 x 5 = 150
  • Nombre de combinaisons V(D)J de chaînes L(λ) : 36 x 4 = 144
  • Nombre de combinaisons V(D)J de chaînes H : 39 x 27 x 6 = 6318

Nombre minimal théorique d'immunoglobulines
(combinaisons chaînes L + chaînes H) :
(150 + 144) x 6318 > 1,86 106


Figure ci-dessous : réarrangement des segments de gènes codant les chaînes H des immunoglobulines.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Le processus est le même pour les chaînes L.

Le complexe protéique recombinase V(D)J catalyse la jonction de différents segments de gènes VH, DH et JH (étapes de recombinaison somatique).

Puis l'épissage alternatif joint les séquences V(D)J réarrangées à des exons codant la région CH. Puis l'isotype d'immunoglobuline est synthétisé.

Voir "Mécanisme du réarrangement".

b. Réarrangement du locus de la chaîne L

Chez l'homme (et la plupart des autres mammifères), il y a 2 loci de chaîne L (κ ou λ) situés sur les chromosomes 2 et 22, respectivement.

Le réarrangement des gènes codant les chaînes L des immunoglobulines est semblable à celui du locus de la chaîne H, mais il n'y a pas de segment de gène D.

De plus, il n'y a qu'1 région constante pour le locus κ, tandis que le locus λ possède plusieurs régions constantes, chacune avec son propre segment de gène J.

Figure ci-dessous : réarrangements génétiques et maturation du transcrit débouchant sur la synthèse de la chaîne L (κ) mature chez l'homme.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Schroeder & Cavacini (2010)

Retour haut de page

5. La recombinaison V(D)J RSS et les protéines du complexe recombinase V(D)J

a. La séquence signal RSS ("Recombination Signal Sequence ")

La recombinaison V(D)J est dirigée par les séquences RSS. Les séquences RSS sont situées juste après chaque segment de gène du récepteur de l'antigène.

Chaque séquence RSS est constituée (figure ci-dessous) :

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

  • d'une séquence très conservée de 7 paires de bases (5'CACAGTG3')
  • d'une séquence moins conservée de 9 paires de bases (5'ACAAAACCC3')
  • ces deux séquences sont séparées par une séquence espaceur moins conservée de 12 ou 23 paires de bases (12RSS ou 23RSS)

Ces espaceurs placent les séquences heptamère et nonamère du même côté de la molécule d'ADN, séparées par 1 ou 2 tours d'hélice de l'ADN : un 12RSS à 1 tour d'hélice reconnaîtra préférentiellement (d'un facteur 30) un 23RSS à 2 tours d'hélice, évitant ainsi des réarrangements inutiles de type [V-V] ou [J-J] (règle dite "12 - 23").

b. Mécanisme de la recombinaison V(D)J

La recombinase V(D)J est un complexe protéique dont les principales protéines sont :

  • le complexe [RAG-1 / RAG-2]
  • le complexe [protéine Artémis / protéine kinase ADN-dépendante]
  • la transférase terminale de désoxynucléotides

Figure ci-dessous : schéma synthétique de la recombinaison V(D)J.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Retour haut de page

α. Phase de reconnaissance des RSS et de coupure de l'ADN

  • RAG-1 reconnaît l'espaceur 12RSS. RAG-2 s'associe à RAG-1 et à la séquence heptamère pour former un complexe appelé synaptique. Le complexe [RAG-1 / RAG-2] coupe un brin de l'ADN.
  • Un autre complexe [RAG-1 / RAG-2] reconnaît l'espaceur 23RSS à 2 tours d'hélice et coupe un brin de l'ADN.
  • Les 2 complexes synaptiques interagissent et forment un complexe appelé apparié.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Ce processus est facilité par l'action des protéines HMGB1 ("High-Mobility Group protein B1") et HMGB2 qui courbent l'ADN et contribuent au rapprochement des 2 RSS.

La coupure de l'ADN par le complexe [RAG-1 / RAG-2] (voir le mécanisme) génère :

  • de nouvelles extrémités du segment de gène codant en épingle à cheveux
  • de nouvelles extrémités des 2 RSS

Les extrémités en épingle à cheveux sont de nouveau coupées, ce qui crée une extrémité 3′ débordante qui est complétée par l'ADN polymérase ou clivée ou modifiée par addition de nucléotides, pendant la phase de réparation.

β. Phase de réparation

Les extrémités coupées du segment de gène codant sont réparées par un ensemble de protéines impliquées dans le processus de réparation de l'ADN de type "NonHomologous End-Joining" (NHEJ).

Ces protéines sont (entre autres) :

  • Ku70 (hélicase et lyase) et Ku80 (hélicase - EC 3.6.4.12) qui forment un hétérodimère : (i) il s'associe aux cassures d'ADN double brin pour protéger les extrémités d'une dégradation; (ii) il juxtapose les extrémités pour faciliter la ligation des extrémités du segment codant; (iii) il recrute les autres protéines du complexe de réparation.
  • L'endonucléase Artémis coupe l'ADN près de l'extrémité en épingle à cheveux à des positions variables.

  • La protéine kinase ADN-dépendante ("DNA-dependent Protein Kinase" ou DNA-PK - EC 2.7.11.1) complexée à la protéine Artémis. DNA-PK est une [sérine/thréonine] protéine kinase qui induit l'activité endonucléase de la protéine Artémis.

Par ailleurs, avant que les segments V et D ne soient joints pour restaurer l'intégrité du chromosome, les extrémités 3' contiennent une séquence palindrome ajoutée à la séquence du segment et qui résulte de la coupure par RAG-1 : ces quelques nucléotides sont appelés P-nucléotides (pour "Palindromic sequences").

  • ces séquences palindrome peuvent alors subir une délétion de nucléotides par diverses exonucléases.
  • ou, au contraire, elles peuvent subir une addition de 9 à 15 nucléotides (appelés N-nucléotides pour "Nontemplate-encoded") par une ADN polymérase spécialisée, la transférase terminale de désoxynucléotides ("Terminal deoxynucleotidyl Transferase" - TdT - EC 2.7.7.31), qui n'est exprimée que dans cellules lymphoïdes immatures pré-B et pré-T.

Ces délétions ou additions de nucléotides contribuent à l'hypervariabilité des séquences CDR3.

Retour haut de page

γ. Mécanisme de clivage de l'ADN par RAG-1

Le complexe [RAG-1 / RAG-2] coupe un brin de l'ADN immédiatement en amont de la séquence heptamère, ce qui génère un groupe hydroxyle en 3'.

Ce groupe attaque la liaison phosphodiester sur l'autre brin par une réaction de trans-estérification directe.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Ce processus génère 2 types d'extrémités de l'ADN :

  • les extrémités du segment codant qui forment une boucle en épingle à cheveux ("hairpin sealed coding ends")
  • les extrémités du RSS phosphorylées ("phosphorylated blunt signal ends")

δ. Diversité des immunoglobulines

Il est maintenant évident que, malgré la règle "12 - 23", des jonctions [D-D] se produisent chez la plupart des espèces (5% des anticorps chez l'homme). C'est même le mécanisme à l'origine des boucles CDR3 inhabituellement longues de certaines chaînes H.

Ces CDR3 extra-longues et les combinaisons inhabituelles d'acides aminés qui en résultent contribuent à la diversité du répertoire des anticorps.

Par ailleurs, la combinaison :

  • du nombre de combinaisons de segments VH, DH et JH des chaînes L et H (> 1,86 106 - voir tableau ci-dessus)
  • de la variabilité de la position du site de clivage par l'endonucléase Artémis
  • de la [délétion/addition] aléatoire de nucléotides de part et d'autre du segment de gène D
  • des différentes associations [chaîne L - chaîne H] dans l'immunoglobuline complète

confère une diversité extrême des séquences des gènes codant les anticorps des lymphocytes B et les récepteurs des lymphocytes T qui en résultent.

Ainsi, on estime le nombre d'immunoglobulines à 1011 - 1012 et des chiffres tels que 1013 - 1016 sont mentionnés dans la littérature. Cette stupéfiante diversité des séquences des gènes permet au système immunitaire d'apporter une réponse contre pratiquement n'importe quel antigène étranger.

Retour haut de page

c. Les protéines RAG-1 et RAG-2

RAG1 ("V(D)J recombination-activating protein 1") est le composant catalytique du complexe [RAG-1 / RAG-2] qui coupe l'ADN au cours de la recombinaison V(D)J.

Cette enzyme possède :

  • une activité enzymatique "E3 ubiquitin-protein ligase" (EC 6.3.2 - domaine N-terminal (1 - 383) de type "RING-type zinc finger")
  • une activité enzymatique endonucléase (EC 3.1 - domaine de fixation à l'ADN)

Le site actif de RAG-1 (384 - 1008) contient 3 acides aminés acides (D600, D708 et E962 - motif DDE) essentiels pour la coupure du brin d'ADN et pour la formation de la structure en épingle à cheveux.

RAG-1 forme un homodimère symétrique lié à 2 molécules d'ADN : chaque sous-unité du dimère interagit avec les deux molécules d'ADN. Les hélices 2 (426 - 441) et 3 (444 - 454) des NBD des deux monomères forment un faisceau de 4 hélices qui constitue l'interface du dimère.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Schatz & Ji (2011)

  • Les acides aminés 389 - 464 forment le domaine de liaison à l'ADN ("Nonamer BinDing" - NBD) qui se fixe sur la séquence nonamère des RSS.
  • Le domaine central (528 - 760) se fixe sur la séquence heptamère des RSS. Il contient également le site de fixation à RAG-2.

Les interactions [RAG-1 - ADN] s'établissent essentiellement avec la séquence nonamère et l'espaceur et impliquent de nombreux contacts avec le squelette phosphodiester :

  • Le motif GGRPR à l'extrémité N-terminale de NBD fixe le sillon mineur de la séquence nonamère : R391 établit des contacts avec les bases de T5 et T6 et R393 établit des contacts avec le squelette phosphodiester de T5.
  • Les acides aminés [R401, R402, K405, R407, R409, K412, N443, H445] établissent des contacts ou s'approchent des groupements phosphate situés à l'extrémité 3′ de l'espaceur.

Visualisation du complexe entre le domaine de fixation de la séquence nonamère de RAG-1 de Mus musculus et l'ADN.

Les acides aminés 389-456 de NBD sont représentés.

Code PDB : 3GNA

RAG-2 ("V(D)J recombination-activating protein 2") n'est pas un composant catalytique mais il est nécessaire pour l'activité catalytique : il augmente l'affinité du domaine NBD de RAG-1 pour les séquences reconnues et c'est un cofacteur essentiel pour le clivage de l'ADN.

biochimej Immunoglobulin anticorps antibody variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Schatz & Ji (2011)

La structure de la chromatine joue un rôle essentiel dans la recombinaison V(D)J.

En effet, le domaine C-terminal de RAG-2 (acides aminés 384 à 527) contient un motif "plant homeodomain (PHD) finger" qui se fixe spécifiquement sur l'histone H3 triméthylée sur Lys4 (H3K4me3), ce qui stimule l'activité catalytique du complexe [RAG-1 / RAG-2] et guide RAG-2 vers les régions actives de la chromatine.

Retour haut de page

6. Le domaine d'interaction avec l'antigène

a. Structure des domaines V des chaînes L et H

Les domaines V et C ont une structure semblable et adoptent un repliement typique de la superfamille des immunoglobulines ("Ig fold") : 2 feuillets β (chacun étant constitués de brins β anti-parallèles) compactés ensemble (repliement de type "sandwich β").

biochimej Immunoglobulin anticorps antibody CDR FR hypervariable interaction binding paratope epitope beta sheet strand variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Finlay & Almagro (2012)

  • A gauche : les feuillets des domaines V possèdent respectivement 4 brins (A à D) et 3 brins (C à G). Le domaine V possède 2 brins β supplémentaires (C' et C'' insérés entre les brins C et D).
  • A droite : les feuillets du domaine C ont respectivement 4 brins (A à D) et 3 brins (C à G).

Les domaines V et C sont tout deux stabilisés par un pont disulfure intra-domaine (Cys βB - Cys βF).

Le domaine V est cependant moins compact que le domaine C car il possède 3 boucles (qui relient les brins des feuillets β) plus longues (donc plus flexibles) dont les séquences sont hypervariables.

Ces boucles, appelés régions déterminant la complémentarité ("Complementarity Determining Regions" - CDR), constituent la région principale du site de fixation de l'antigène (ou paratope).

biochimej Immunoglobulin anticorps antibody CDR FR hypervariable interaction binding paratope epitope beta sheet strand variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Finlay & Almagro (2012)

Chaque domaine V apporte 3 CDR au site de fixation de l'antigène :

  • CDR-L1, CDR-L2 et CDR-L3 du domaine V de la chaîne L
  • CDR-H1, CDR-H2 et CDR-H3 du domaine V de la chaîne H

Rappel :

  • le segment de gène VL code CDR-L1 et CDR-L2 et le produit de la recombinaison des segments de gène VL et JL code CDR-L3
  • le produit de la recombinaison des segments de gène VH, DH et JH code CDR-H3

Modèles de numérotation standardisée des CDR :

  • méthode de Kabat et al. sur la base d'alignement des parties hypervariables des séquences ("Kabat numbering")
  • méthode de Chothia & Lesk sur la base des structures 3D des anticorps ("Chothia numbering")
  • méthode de Lefranc et al. ("IMGT numbering scheme")
  • méthode de Honegger & Pluckthun ("Aho numbering" et base de données AAAAA)
  • méthode "Paratome"

Retour haut de page

b. Nombre restreint des conformations des CDR - conception d'anticorps artificiels

Paradoxalement, bien que reconnaissant un nombre colossal de structures d'antigènes, 5 CDR [CDR-L1, CDR-L2, CDR-L3, CDR-H1 et CDR-H2] adoptent un nombre très restreint de conformations (appelées "structures canoniques") qui sont déterminées par la longueur des boucles hypervariables et les acides aminés conservés dans les CDR (mais aussi les FR).

Le nombre de conformations est plus grand pour la chaîne L(λ) que la chaîne L(κ).

Par exemple :

  • CDR-L1 de la chaîne L(κ) adopte une conformation étendue entre les acides aminés 26 et 29 et une conformation en épingle à cheveux incluant les acides aminés 30 à 32 avec un maximum de 7 insertions.
  • CDR-L2 et CDR-L3 de la chaîne L(κ) adoptent une conformation unique.
  • CDR-L1 de la chaîne L(λ) adopte une structure en hélice avec 8 conformations.
  • CDR-H1 adopte une conformation étendue qui relient certains brins β des 2 feuillets. Elle adopte un nombre plus restreint de conformations que son équivalent CDR-L1.
  • CDR-H2 adopte 6 conformations.
  • La boucle CDR-H3, localisée au coeur du site de fixation de l'antigène, est la plus variable en longueur et en séquence : en effet, elle est le site de la recombinaison V(D)J. La boucle CDR-H3 a une longueur moyenne de 15 ± 4 acides aminés (distribution Gaussienne des longueurs de 1 à 35 acides aminés).

Une telle variabilité de composition et de longueur (donc de flexibilité) rend difficile la modélisation de la boucle CDR-H3. Cependant, la bioinformatique, la mécanique moléculaire et la détermination d'un nombre croissant de structures tri-dimensionnelles permettent d'établir des règles pour la prédiction des CDR (voir aussi : "H3-rule").

biochimej Immunoglobulin anticorps antibody CDR FR hypervariable interaction binding paratope epitope beta sheet strand variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Kuroda et al. (2012)

Il est donc capital de :

  • connaître les règles qui régissent les conformations des CDR et en particulier celles de la boucle CDR-H3
  • décrypter l'interface entre le domaine V de la chaîne L et le domaine V de la chaîne H, notamment l'orientation de ces deux domaines l'un par rapport à l'autre (figure de gauche - ci-dessous)
  • déterminer la nature des acides aminés à des positions clés (figure de droite - ci-dessous)

pour la conception d'anticorps artificiels par modélisation moléculaire ("computational methods", "in silico antibody designs - drug discovery").

biochimej Immunoglobulin anticorps antibody CDR FR hypervariable interaction binding paratope epitope beta sheet strand variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Kuroda et al. (2012) - Remarque : L signifie chaîne L (et non pas leucine) / H signifie chaîne H (et non pas histidine).

Retour haut de page

Le nombre restreint de conformations adoptées par les CDR résulte du petit nombre d'acides aminés différents à des positions clés dans les CDR et les FR.

biochimej Immunoglobulin anticorps antibody CDR FR hypervariable interaction binding paratope epitope beta sheet strand variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : SAbDab

Une étude des contacts au sein de complexes [anticorps - antigène] à partir des données structurales (environ 1800 structures d'anticorps dans la PDB en 2014 - figure ci-dessus) a montré que :

  • 4 acides aminés représentent 55 % des acides aminés des CDR : Tyr (24 %), Ser (12 %), Asn (10 %) et Trp (9 %).
  • 2 acides aminés sont présents dans toutes les CDRs : Trp et Tyr.
  • presque tous les acides aminés sont sous-représentées dans les CDR.
  • 10 acides aminés représentent moins de 10% des CDR (C, M, Q, K, A, P, V, E, H, L).
  • Gly, His et Asp sont différemment présents dans les CDR des chaînes L et dans les CDR des chaînes H : par exemple, Asp est nettement sous-représenté dans tous les CDR des chaînes L et sur-représenté dans tous les CDR des chaînes H.
  • Phe est sous-représentée dans les CDR1 et les CDR2 des deux types de chaînes et sur-représentée dans les CDR3 des deux types de chaînes.
  • C'est l'inverse pour Arg.

biochimej Immunoglobulin anticorps antibody CDR FR hypervariable interaction binding paratope epitope beta sheet strand variable constant IgG IgA IgM nanobody nanobodies recombinaison VDJ somatique somatic

Source : Ofran et al. (2008)

La figure ci-dessus montre la sous-représentation et la sur-représentation des acides aminés dans les CDR (par rapport à leur fréquence dans toutes les protéines).

Caractéristiques des épitopes des lymphocytes B :

  • les acides aminés aliphatiques (A, I, L, V) et Y sont fortement sous-représentés.
  • G, C, M, P, W, Y sont sur-représentés.

 

7. Liens Internet et références bibliographiques

"Animation Quiz 2 - Antibody Diversity"

"Immunobiology: The Immune System in Health and Disease - 5th ed."

"IMGT : the international ImMunoGeneTics information system"

Aller au site

NCBI

Aller au site

Schroeder & Cavacini (2010) "Structure and function of immunoglobulins" J. Allergy Clin. Immunol. 125, S41 - S52

Schatz & Ji (2011) "Recombination centres and the orchestration of V(D)J recombination" Nat. Rev. Immunol. 11, 251-263

Article

Article

J. Actor (2013) "Antibody Structure and Function" Elsevier's Integrated Review: Immunology and Microbiology 2nd Ed.

Pantazes & Maranas (2013) "MAPs: a database of modular antibody parts for predicting tertiary structures and designing affinity matured antibodies" BMC Bioinformatics 14, 168

Article

Article

Schatz & Swanson (2011) "V(D)J recombination: mechanisms of initiation" Annu. Rev. Genet. 45, 167 - 202

Nishana & Raghavan (2012) "Role of recombination activating genes in the generation of antigen receptor diversity and beyond" Immunology 137, 271 - 281

Coussens et al. (2013) "Acidic Hinge Restricts Repair-Pathway Choice and Promotes Genomic Stability" Cell Reports 4, 870 - 878

Article

Article

Article

Ofran et al. (2008) "Automated identification of complementarity determining regions (CDRs) reveals peculiar characteristics of CDRs and B cell epitopes" J. Immunol. 181, 6230 - 6235

Finlay & Almagro (2012) "Natural and man-made V-gene repertoires for antibody discovery" Front. Immunol. 3, 342

Article

Article

Kuroda et al. (2008) "Structural classification of CDR-H3 revisited: a lesson in antibody modeling" Proteins 73, 608 - 620

Chailyan et al. (2011) "Structural repertoire of immunoglobulin λ light chains" Proteins 79, 1513 - 1524

Kuroda et al. (2012) "Computer-aided antibody design" Protein Eng. Des. Sel. 25, 507 - 522

Article

Article

Article

Kabat et al. (1983) "Sequence of Proteins of Immunological Interest" Bethesda: National Institute of Health

Al-Lazikani et al. (1997) "Standard conformations for the canonical structures of immunoglobulins" J. Mol. Biol. 273, 927 - 48

Lefranc et al. (2003) "IMGT unique numbering for immunoglobulin and T cell receptor variable domains and Ig superfamily V-like domains" Dev. Comp. Immunol. 27, 55 - 77

"SAbDab : The Structural Antibody Database"

"The AAAAA aims to become the ultimate tool for antibody structural analysis, modelling and engineering"

"Abysis : The Abysis database integrates sequence data from Kabat, IMGT and the PDB with structural data from the PDB"

SAbDab

AAAAA

Abysis

Zhang et al. (2019) "The fundamental role of chromatin loop extrusion in physiological V(D)J recombination" Nature 573, 600 - 604

Zhang et al. (2019) "Fundamental roles of chromatin loop extrusion in antibody class switching" Nature doi:10.1038/s41586-019-1723-0

Mullard A. (2021) "FDA approves 100th monoclonal antibody product" Nat. Rev. Drug Discov. 20, 491 - 495

Article

Article

Article

Retour haut de page

biochimej Valid XHTML 1.0 Transitional