Quelques méthodes d'études des interactions protéine-protéine ("Protein-Protein Interaction" - PPI)

1. La relation structure - fonction des macromolécules biologiques

2. Quantification de l'interaction entre macromolécules biologiques (KA et KD)

3. Notions élémentaires de protéomique

a. Caractéristiques générales des protéomes
b. Principe de la spectrométrie de masse

4. Caractéristiques des méthodes pour détecter et prouver les PPI

a. Comparaison de diverses méthodes pour l'étude des PPI
b. Critères de choix d'une technique pour mesurer les PPI
c. Aperçu des méthodes biologiques (complémentation) & biochimiques
d. Aperçu des méthodes physiques et bioinformatiques

5. Quelques méthodes de pointe pour l'analyse des PPI

a. La méthode ascorbate peroxidase (APEX)
b. La fluorescence par complémentation bimoléculaire (BiFC)
 
c. La résonance plasmonique de surface (SPR)
d. L'interférométrie de biocouches (BLI)
e. Le marquage de l'ADN au DAPI

6. Titrage calorimétrique isotherme (ITC)

a. Principe de l'ITC
b. Fonctionnement du calorimètre
c. Acquisition des données
d. Grandeurs déterminées à partir de l'isotherme de fixation

7. La photométrie de masse ("Mass photometry")

a. Principe
b. Avantages

8. Notion de proximité induite chimiquement

9. La prédiction des interactions protéine-protéine par apprentissage profond

10. Liens Internet et références bibliographiques

 

1. La relation structure - fonction des macromolécules biologiques

a. Les différents types de ligands

La molécule qui se fixe sur une autre macromolécule biologique est appelée ligand de manière générique.

Un ligand peut être n'importe quel type de molécule biologique :

Retour haut de page

b. Propriétés physico-chimiques des macromolécules biologiques qui modulent et contrôlent leurs interactions

Les interactions physiques entre les molécules d'une cellule ou d'un compartiment sub-cellulaire traduisent, entre autre, l'aptitude structurale de ces molécules à se reconnaître.

  • La structure tridimensionnelle génère des conformations spatiales locales uniques aux propriétés physiques spécifiques (polarité, hydrophobicité, encombrement stérique, accessibilité au solvant, …) : ces conformations spatiales constituent les sites de fixation (ou de liaison, selon la terminologie).
  • La complémentarité des structures tridimensionnelles est ainsi l'élément clé de la reconnaissance entre deux ou plusieurs molécules biologiques.

Exemples :

  • Le site actif des enzymes : il est lui-même constitué du site de fixation des substrat(s), inhibiteur(s), effecteur(s) et du site catalytique où se déroule la réaction enzymatique.
  • La reconnaissance hautement spécifique entre un anticorps et l'épitope porté par son antigène.
  • La reconnaissance entre un facteur de transcription (protéine) et l'élément de réponse d'un gène (ADN) dont il est spécifique et dont il contrôle la transcription.

Retour haut de page

c. Forces de liaison qui maintiennent la structure des macromolécules

Ces forces sont non covalentes ou covalentes (ponts disulfures dans le cas des protéines) et très variées en nombre et du point de vue énergétique.

Elles sont intimement liées aux propriétés physico-chimiques des résidus d'acides aminés donc liées aux conditions cellulaires (pH, température, viscosité, pression).

Tous ces paramètres sont maintenus relativement constants dans la cellule.

  • L'ensemble de ces paramètres physico-chimiques dictent l'acquisition de la structure tridimensionnelle qui confère sa fonction à une macromolécule biologique.
  • La structure tridimensionnelle des macromolécules biologiques, notamment les protéines, résulte d'un grand nombre de conformations proches qui sont en équilibre.

Ces paramètres physico-chimiques contrôlent ces équilibres, donc la flexibilité ou dynamique conformationnelle de toutes les molécules biologiques.

  • Ce processus extrêmement fin permet à toutes les molécules d'adapter leurs structures les unes aux autres (exemple de l'ajustement induit du complexe enzyme-substrat).
  • Cette propriété est essentielle à la modulation (dans certains cas, la réversibilité) de la fonction des molécules dans la cellule.

Retour haut de page

d. La notion d'affinité entre macromolécules biologiques

C'est la caractéristique qui traduit la propension, dans un environnement et des conditions cellulaires donnés, de 2 (ou plus) macromolécules biologiques à se reconnaître et à interagir de manière réversible.

Outre la complémentarité de structure, le paramètre clé de l'interaction entre molécules est leur concentration respective.

  • L'affinité de liaison est quantifiable via la constante macroscopique de l'équilibre d'association (KA) ou de l'équilibre de dissociation (KD) des molécules qui interagissent.
  • Plus la valeur de la constante KD est petite, plus l'affinité de liaison du ligand pour son site de fixation est grande.

L'affinité de liaison est influencée par les paramètres physico-chimiques qui influencent la structure des macromolécules biologiques qui interagissent :

  • L'ensemble des interactions intermoléculaires non covalentes (liaison hydrogène, interactions électrostatiques, forces de Van der Waals et interactions hydrophobes).
  • La présence d'autres molécules effectrices qui modulent l'interaction.

Retour haut de page

2. Quantification de l'interaction entre macromolécules biologiques (KA et KD)

Toute réaction d'association (inversement de dissociation) entre 2 (ou plus) molécules M1 et M2 peut s'écrire : M1 + M2 <=> M1-M2

Cette réaction d'association est régie par une constante d'association KA (inversement de dissociation KD) quantifiable si on dispose d'une méthode ou d'une technique permettant :

  • De mettre en évidence l'association entre M1 et M2.
  • De mesurer la concentration respective (ou tout autre signal dont la valeur est proportionnelle à cette concentration) de M1, M2 et du complexe M1-M2.

L'équilibre de fixation d'un ligand L sur une protéine P correspond à la réaction :     Equilibre fixation proteine ligand binding equilibrium biochimej

Vitesse d'association : vaka . [P].[L]       -     Vitesse de dissociation : vdkd . [PL]

  • ka et kd sont des constantes microscopiques.
  • [L] = concentration du ligand libre; [PL] = concentration du ligand lié.

A l'équilibre, les vitesses sont égales :

enzyme demonstration representation Scatchard constante equilibre fixation site protein ligand binding equilibrium association dissociaton biochimej

  • Ka = constante d'équilibre d'association; Kd = constante d'équilibre de dissociation. Ce sont des constantes macroscopiques.
  • Ka = 1 / Kd
  • Plus KD est faible, plus l'affinité entre le ligand et la protéine est élevée.

interactome interactomique PPI proteome spectrometrie masse spectrometry tandem protein sequence domaine omics biochimej

Source : Xing et al. (2016)
Dans cette figure, deux protéines (dénotées A et B) interagissent avec une constante de dissociation KD.

Voir un développement important : équilibre de fixation d'un ligand sur une protéine et représentation de Scatchard.

Retour haut de page

3. Notions élémentaires de protéomique

a. Caractéristiques générales des protéomes

La protéomique a pour but d'identifier (et de quantifier) l'ensemble des protéines synthétisées ou protéome, à un moment donné et dans des conditions données au sein d'un tissu, d'une cellule ou d'un compartiment cellulaire.

Le protéome est extrêmement complexe à plusieurs titres :

  • Compte-tenu de l'épissage alternatif des transcrits primaires (plusieurs ARN messagers pour un gène) et compte-tenu des modifications post-traductionnelles des protéines, on peut estimer à plusieurs dizaines de milliers les formes des protéines synthétisées dans les différents tissus humains par exemple.
  • Pour chaque condition environnementale (condition physiologique normale vs. conditions de stress) une cellule est caractérisée par un protéome adapté à cette condition alors qu'elle a toujours le même génome. Le cas des plantes est un exemple flagrant compte-tenu de leur nécessité de s'adapter tant aux variations de la lumière qu'aux effets de stress biotiques ou abiotiques.
  • Outre les modifications post-traductionnelles, les protéines subissent des transformations une fois synthétisées : clivage du peptide signal d'adressage, activation de la forme native à partir d'un précurseur (zymogène), assemblage en complexes oligomèriques, association à des cofacteurs.
  • Il existe une grande dynamique de la synthèse des protéines : le rapport entre les protéines les moins abondantes et les plus abondantes dans une cellule dépasse 106 pour atteindre 1012 dans le sérum.
  • Les protéines ont des demi-vies trés variables : ornithine décarboxylase 11 min - tryptophane oxygénase 2 h - myosine 30 j.

Retour haut de page

b. Principe de la spectrométrie de masse

L'ionisation électronique (souvent appelée impact électronique) et l'ionisation chimique sont les principales méthodes d'ionisation.

Dans le cas de l'ionisation électronique, l'échantillon est introduit dans une enceinte sous vide, il y est vaporisé puis soumis au bombardement d'un canon à électrons de grande énergie.

Un électron est arraché aux molécules et on obtient une espèce qui est à la fois un cation (ion positif) et un radical libre (nombre impair d'électrons), que l'on appelle ion moléculaire M+. :

M + e- (énergie 70 eV) <=> M+. + 2 e-

L'énergie du faisceau ionisant fragmente l'ion moléculaire par rupture des liaisons les plus faibles avant les liaisons les plus fortes et donne naissance à des ions positifs de masses plus faibles, qui pourront être fragmentés à nouveau (exemple : spectrométrie de masse dite en tandem - MS/MS).

Ces ions sont ensuite accélérés dans un champ électrique et/ou magnétique, puis dirigés entre les pôles d'un aimant selon une trajectoire circulaire qui dépend de leur rapport masse/charge [m/z]. En faisant varier le champ électrique, on fait varier la vitesse des ions moléculaires et on peut les faire ainsi parvenir au détecteur par ordre croissant de rapport [m/z].

Le tri des ions s'effectue :

  • Soit par temps de vol : les ions arrivent à des temps différents en fonction de [m/z].
  • Soit par courbure de trajectoire : le point d'impact des ions dépend de [m/z].

On obtient un grand nombre de pics, tous de masse inférieure à celle de l'ion moléculaire. Cet ensemble constitue un diagramme de fragmentation. Les groupements fonctionnels possèdent un diagramme de fragmentation qui leur sont propres.

analyse proteome spectrometrie masse spectrometry tandem protein sequence domaine omics biochimej

Dans un spectre de masse, la hauteur relative des pics indique l'abondance relative des espèces.

Voir un développement de la protéomique.

Voir des travaux dirigés en ligne : "Applications et résultats de la protéomique : exemple de la RuBisCO"

Retour haut de page

4. Caractéristiques des méthodes pour détecter et prouver les interactions protéine-protéine

a. Comparaison de diverses méthodes pour l'étude des interactions protéine-protéine

La figure suivanre compare des méthodes optiques dites "sans marquage" : SPR "Surface Plasmon Resonance", BLI ("Biolayer Interferometry"), commutation dynamique des couches d'ADN ("dynamic switching of DNA layers"), CE, AUC, SEC-MALS, CG-MALS et photométrie de masse.

  • Ces méthodes sont classées en 3 catégories : basées sur la surface, basées sur la séparation et basées sur une solution.
  • Chaque rayon du diagramme représente une méthode et il est divisé selon divers critères :
    • méthode sans immobilisation
    • méthode qui permet de mesurer l'affinité de fixation, la cinétique de fixation ou la stoechiométrie de fixation
    • méthode qui nécessite une quantité < 1 pmole d'échantillon
    • méthode qui permet de mesurer des interactions protéine-protéine entre molécules de faibles masses molaires.
  • Le code couleur indique dans quelle mesure une méthode répond à un critère : vert = adapté; jaune = possible; orange = difficile.

Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR electron onde angle refraction biochimej

Source : Soltermann et al. (2021)

CG-MALS : "Composition-gradient multi-angle light scattering"; AUC : "Analytical ultracentrifugation"
SEC-MALS : "Size-exclusion chromatography multi-angle light scattering"; BLI : "Bio-layer interferometry"; CE : "Capillary electrophoresis"

Retour haut de page

b. Critères de choix d'une technique pour mesurer les interactions protéine-protéine

Les techniques sans marquage ou sans immobilisation sont employées autant que possible car :

  • Elles nécessitent une étape supplémentaire (parfois complexe) dans la procédure expérimentale.
  • Le marquage ou l'immobilisation des molécules (ligands) peuvent modifier la nature et/ou la force des interactions

L'aptitude d'une technique à étudier une large gamme de concentrations permet de mesurer une large gamme de valeurs de KD.

  • Les interactions faibles :
    • Nécessitent des concentrations élevées de molécules en interaction pour générer une quantité de complexe suffisante pour être détectée.
    • Sont généralement caractérisées par des constantes de vitesse de dissociation élevées, ce qui les rend difficiles à analyser pour des concentrations inférieures à KD.
  • Les interactions fortes (< μM) nécessitent :
    • Une technique caractérisée par une sensibilité élevée pour quantifier les faibles concentrations de molécules non liées.
    • Des mesures de concentrations des molécules d'au moins un ordre de grandeur autour de la valeur de KD : en d'autres termes des concentrations qui peuvent être de l'ordre du nM (voire inférieures).

Retour haut de page

Les techniques qui mesurent la cinétique d'atteinte d'un équilibre de fixation entre molécules permettent de déterminer la valeur de KD et celles des constantes de vitesse d'association (ka) et de dissociation (kd).

Ces techniques impliquent de quantifier la concentration des molécules non liées et liées (complexe) à différents temps jusqu'à atteindre l'équilibre. Il existe 2 procédures :

  • 2 molécules sont mélangées et on effectue des mesures qui reflètent la formation du complexe.
  • un mélange pré-équilibré des 2 molécules est dilué et on effectue des mesures de dissociation du complexe.

Les valeurs de ka et kd peuvent s'échelonner de quelques millisecondes à des heures : le suivi de la cinétique de réactions avec une sensibilité élevée sur de longues périodes exige une correction permanente des lignes de bases et du bruit expérimental.

Les derniers critères de choix, et non les moindres, sont :

  • La quantité de molécules étudiées dont on dispose (teneur naturelle dans la cellule ou efficacité du système d'expression) et la facilité à les obtenir (rendement des procédures de pruification).
  • Le coût des appareils et des produits pour effectuer les expériences.
  • Les compétences des expérimentateurs pour obtenir et analyser les données avec des méthodes souvent sophistiquées et complexes.

Voir un cours détaillé sur l'interactomique.

Retour haut de page

c. Aperçu des méthodes biologiques (complémentation) & biochimiques

  • La construction génétique appelée double-hybride dans la levure ("Yeast Two-Hybrid system", "Two-hybrid screening" ou "Yeast two-Hybrid" - Y2H). C'est une technique à très haut débit.
  • La technique "Phage display" :
    • Un gène codant une protéine d'intérêt est associé au gène codant une protéine d'enveloppe d'un phage (à l'origine le bactériophage filamenteux M13). Il y a alors synthèse d'une protéine de fusion qui se retrouve à la surface du phage : le phage affiche ("displays") la protéine d'intérêt.
    • C'est une technique à haut débit.
  • La fluorescence par complémentation bimoléculaire ("Bimolecular Fluorescence Complementation" - BiFC) :
    • Deux protéines d'intérêt sont fusionnées à un fragment N- ou C-terminal non fluorescent d'une protéine fluorescente puis traduites dans une cellule. Si une interaction a lieu entre les deux protéines d'intérêt, il y a reconstitution de la protéine fluorescente (formation d'un complexe fluorescent).
    • Le signal est ainsi visualisé par microscopie de fluorescence ou par cytométrie en flux.
  • La technique "Strep - Protein INteraction Experiment" (SPINE) :
    • Combinaison d'une réticulation in vivo par le formaldéhyde (agent de réticulation réversible) et d'une purification par affinité d'une protéine membranaire "appât" marquée par Strep (un octapeptide synthétique).
    • Les protéines "proies" réticulées sont co-purifiées avec la protéine "appât" puis séparées par ébullition.
  • La technique "Far-Western Blotting" : démarche similaire au "Western blot" avec une différence, la sonde anticorps est substituée par une sonde protéine "appât" marquée.

Techniques d'immunoprécipitation

  • L'immunoprécipitation de la chromatine ("Chromatin immunoprecipitation") pour identifier et étudier les protéines qui interagissent avec l'ADN (facteurs de transcription, histones) et pour l'étude des processus épigénétiques.
  • La purification par immunoprécipitation ("Tandem Affinity Purification") : billes enrobées d'un anticorps et synthèse d'une protéine de fusion.
  • La co-immunoprécipitation ou immunoprécipitation d'un complexe de protéines ("Co-Immunoprecipitation" - Co-IP).
  • L'analyse "pull-down" ("pull-down assays") utilise une protéine "appât" immobilisée ("immobilized bait protein") qui se fixe et retient une protéine "proie" ("prey protein"). La technique d'origine utilisait une protéine de fusion appât glutathion-S-transférase immobilisée sur un support glutathion-agarose et une protéine proie radiomarquée : les 2 protéines étaient analysées par électrophorèse sur gel SDS-PAGE et quantifiées par autoradiographie (Smith & Johnson, 1988).

Retour haut de page

d. Aperçu des méthodes physiques

  • La technique "Membrane-Strep-tagged Protein INteraction Experiment" (Membrane-SPINE) :
    • Combinaison de la purification spécifique d'une protéine membranaire marquée par Strep avec la fixation réversible de complexes protéiques par réticulation avec le formaldéhyde. Analyse finale par spectrométrie de masse.
    • Strep-tag II est un peptide synthétique composé de 8 acides aminés (WSHPQFEK) qui a une affinité intrinsèque envers la Strep-Tactine (une streptavidine recombinante spécialement conçue) et peut être fusionnée en position N- ou C-terminale à une protéine recombinante.

Cette interaction hautement spécifique permet d'isoler les protéines marquées par Strep en une étape à partir de lysats cellulaires bruts. De plus, les conditions d'élution de Strep-tag sont "douces" : ce marquage permet d'isoler des protéines fonctionnelles.

  • Méthodes qui utilisent la fluorescence
    • Le transfert d'énergie par résonance de fluorescence ("Fluorescence resonance energy transfer" - FRET) : transfert d'énergie sans émission de lumière résultant d'une interaction entre deux molécules (donneur et accepteur d'énergie respectivement).
    • La spectroscopie de corrélation de fluorescence ("Fluorescence Correlation Spectroscopy" - FCS).
  • Méthodes d'interférométrie
    • L'interférométrie de biocouches ("Bio-Layer Interferometry" - BLI) : technique optique sans marquage fluorescent qui analyse le profil d'interférence de la lumière blanche réfléchie par 2 surfaces. Ce profil permet de déterminer des valeurs de constantes de vitesse et d'autres données cinétiques.
    • L'interférométrie par double polarisation ("Dual Polarisation Interferometry" - DPI) : elle permet d'obtenir des mesures très précises de la taille, de la densité et de la masse des molécules. Lumière d'un faisceau laser.

Retour haut de page

e. Méthodes bioinformatiques

  • La compaction / l'empilement / les contacts protéine-protéine ("protein - protein docking") sont analysés par des méthodes bioinformatique de prédiction des interactions protéine-protéine basées sur :
    • Les données de structure tridimensionnelle (contraintes stériques, chimiques, géomètriques, ...).
    • Le principe de co-évolution des résidus d'acides aminés des chaînes polypeptidiques.
    • La stabilité optimale des molécules (minimisation d'énergie).
  • L'avènement des algorithmes d'apprentissage profond et des méthodes d'apprentissage s'appuyant sur le langage naturel et des corpus de connaissances gigantesques révolutionnent la découverte d'interactions entre biomolécules et accélèrent ces découvertes.

Retour haut de page

5. Quelques méthodes de pointe pour analyser les interactions protéine-protéine

a. La méthode ascorbate peroxidase (APEX)

La plupart des protéines sont localisées au sein d'organites entourés de membrane(s). Cette localisation subcellulaire des protéines est un élément clé de leur spécificité de fonction(s).

Une méthode de marquage par la biotine, basée sur l'ascorbate peroxidase (APEX) modifiée par ingénierie ("engineered ascorbate peroxidase (APEX)-based proteins proximity labeling") permet de localiser et d'identifier des protéines situées à proximité les unes des autres dans la cellule, et donc d'identifier leurs interactions.

L'ascorbate peroxidase (APX1 - E.C. 1.11.1.11) est une oxydoréductase qui catalyse la réaction : L-ascorbate + H2O2 <=> déshydro-ascorbate + 2 H2O

L'APEX est un monomère d'environ 28 kDa sans pont disulfure ni site de fixation du calcium.

Principe de la méthode in vivo

L'APEX est active dans tous les compartiments cellulaires.

  • En présence de peroxyde d'hydrogène (H2O2), l'APEX modifiée oxyde la biotine-phénol en radical libre biotine-phénoxyl de demi-vie courte (< 1 à 2,5 ms).
  • Du fait de sa haute réactivité, ce radical se fixe de manière covalente à certains résidus d'acides aminés riches en électrons (W, Y, H et C).

Cette réaction permet de biotinyler les protéines adjacentes (dans une sphère de rayon ≈ 20 nm) à l'APEX exprimée localement.

  • Les cellules sont ensuite lysées et les protéines biotinylées sont récupérées avec des billes sur lesquelles est fixée la streptavidine (chromatographie d'affinité).
  • La liaison [biotine - streptavidine 1:1] est caractérisée par une constante de dissociation KD ≈ 10-15 M (ou KA ≈ 1015 M-1) : c'est l'une des interactions biologiques les plus fortes connues.

Les protéines sont ensuite éluées, séparées sur gel et identifiées par spectromètrie de masse.

proteome matrice mitochondriale inner outer matrix mitochondria biotin biochimej

Source : Rhee et al. (2013) - B = biotine

Remarque : l'APEX a une sensibilité limitée qui exclut les applications nécessitant un faible taux d'APEX : pour cette raison, une enzyme appelée APEX2 a été développée par ingéniérie et elle a une activité plus importante dans les cellules.

Retour haut de page

Illustration de l'identification d'interactions entre protéines avec l'APEX

Une étude a utilisé un marquage spécifique des protéines de la matrice de la mitochondrie par la biotine dans des cellules vivantes : l'ensemble des membranes et des complexes protéiques étaient donc intacts et ainsi les relations spatiales (les interactions) entre les protéines ont été préservées.

  • L'APEX utilisée dans cette étude est spécifiquement adressée à la matrice mitochondriale par fusion à un peptide d'adressage de 24 acides aminés.
  • Une fois dans la matrice mitochondriale, l'APEX marque par biotinylation (liaison covalente) les protéines voisines (dans une sphère d'un certain rayon) dans les cellules vivantes.
  • Les radicaux phénoxyl générés par l'APEX ont une propriété capitale : ils ne traversent pas la membrane mitochondriale. Ils ne marquent donc que les protéines de la matrice mitochondriale ou les régions exposées vers la matrice des protéines de la membrane interne.

Cette étude a permis :

  • D'identifier 495 protéines de la matrice mitochondriale dont 464 étaient déjà annotées "mitochondrie". Ainsi 31 protéines qui n'étaient pas annotées sont désormais associées à la mitochondrie ou à la matrice mitochondriale.
  • D'améliorer l'annotation de 240 protéines en spécifiant leur localisation sub-mitochondriale matricielle.
  • D'associer à la matrice mitochondriale 6 protéines dont on pensait qu'elles étaient localisées dans la membrane externe ou dans l'espace intermembranaire.

proteome matrice mitochondriale inner outer matrix mitochondria biotin biochimej

Source : Rhee et al. (2013)

Retour haut de page

b. La fluorescence par complémentation bimoléculaire (BiFC)

Une protéine de fusion est une combinaison de différentes protéines ou régions de protéines. Elle est synthétisée par une construction d'ADN contenant les cadres de lecture ouverts ("Open Reading Frame" ou ORF) codant les protéines ou régions de protéines concernées.

  • Les protéines de fusion servent notamment à localiser des protéines dans la cellule (et/ou ou dans les compartiments sub-cellulaires) en utilisant la protéine étudiée fusionnée à une protéine fluorescente afin de les visualiser avec une technique de microscopie adaptée.
  • La localisation des protéines est capitale pour en décrypter le rôle et les partenaires.

La fluorescence par complémentation bimoléculaire ("Bimolecular fluorescence complementation" - BiFC) permet de visualiser une interaction protéine-protéine dans les cellules sans traitement particulier de ces cellules.

  • La technique BiFC est basée sur la complémentation de fragments d'une protéine fluorescente in vivo (par exemple, les fragments N- et C-terminaux de la "Green Fluoresent Protein" - GFP).
  • La protéine fluorescente rapporteur est tronquée puis fusionnée aux 2 protéines dont on veut étudier l'interaction: si celles-ci interagissent, les fragments complémentaires de la protéine fluorescente se replient et s'assemblent, régénèrant ainsi sa fluorescence.
  • L'intensité de la fluorescence émise est proportionnelle à la force de l'interaction.

Source : Kodama & Hu (2012)

  • Figure A ci-dessus : Structure tridimensionnelle de la protéine fluorescente jaune Venus ("Venus yellow fluorescent protein" (PDB 1MYW). Deux sites de protéolyse (brins β 7 & 8 et brins β 8 & 9, indiqués par des ciseaux) sont utilisés pour le test de complémentation BiFC.
  • Figure B : Topologie du repliement de la protéine fluorescente (brins β en vert et hélices α en orange).
    • Les deux points noirs indiquent les 2 sites de protéolyse.
    • La flèche noire indique un autre site de protéolyse entre les brins β 10 & 11.
    • L'étoile indique la position du chromophore.
  • Figure C : Illustration de la complémentation BiFC
    • La structure de gauche représente le fragment N-terminal de la protéine fluorescente (le chromophore est en jaune) fusionné à l'hélice α du domaine bZIP de bJun.
    • La structure au centre représente le fragment C-terminal fusionné à à l'hélice α du domaine bZIP de bFos.
    • La structure de droite montre la protéine fluorescente reconstituée qui fluoresce après formation du complexe des 2 protéines en interaction (dimère bJun/bFos).

Voir un vecteur d'expression pour l'obtention d'une protéine de fusion avec le fragment C-terminal de la protéine fluorescente jaune Venus.

Diverses variantes de la méthode BiFC ont été développées :

  • La colocalisation de différentes paires d'interaction protéine-proéine ("co-localization BiFC" - coBiFC).
  • L'étude de la compétition de formation de deux complexes protéiques (mcBiFC).
  • L'étude de la formation de complexes protéiques ternaires (mesure du BRET ou BiFC basé sur le FRET).
  • L'étude de la formation de complexes protéiques quaternaires en combinant BiFC et BiLC ("Bioluminiscence complementation" avec la luciférase).

Retour haut de page

c. Le phénomène de résonance de plasmons de surface (SPR)

α. Les plasmons de surface

Les plasmons sont des oscillations collectives d'électrons libres, qui existent dans la masse ou à la surface d'un métal ou au voisinage de nanoparticules : les plasmons peuvent ainsi être classés en plasmons de masse, plasmons de surface et plasmons de surface localisée (nanoparticules).

La résonance de plasmons de surface ("Surface Plasmon Resonance" - SPR) se produit :

  • Quand les électrons d'une couche mince d'un métal (exemples : l'or, l'argent, ...) sont excités par une lumière dirigée vers ce métal avec un angle d'incidence spécifique;
  • puis quand ces électrons se déplacent (des deux côtés de l'interface) parallèlement à cette couche.

Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR electron onde angle refraction biochimej

Source : Wikipédia

  • L'angle d'incidence qui déclenche le phénomène SPR est lié à l'indice de réfraction du matériau.
  • Toute variation de cet indice de réfraction permet ainsi d'observer ou non le phénomène SPR.

Exemple de système très utilisée en biologie : le système BIACORE®.

Retour haut de page

β. Principe de la SPR appliquée aux molécules biologiques

La SPR est donc une méthode optique qui mesure l'indice de réfraction à la surface d'un biocapteur.

  • La SPR utilise la réflexion de la lumière à l'interface [surface métalique - milieu biologique] pour générer une onde qui s'étend sur une courte distance (jusqu'à 300 nm) dans le milieu biologique.
  • Cette technique n'utilise aucun marquage (technique sans étiquette).

Une protéine est immobilisée sur une surface métallique (le biocapteur) et une solution du ligand est injectée sur cette surface.

  • La fixation du ligand modifie l'indice de réfraction de la surface du biocapteur en raison de la variation de masse lors de la formation du complexe [protéine immobilisée - ligand] : cela se traduit par une augmentation du signal exprimé en unité de résonance ou de réponse ("Resonance or response Unit" - RU).
  • A l'inverse, la dissociation du complexe entraîne une diminution de la valeur RU.
  • Le sensorgramme enregistré décrit la cinétique d'association (constante de vitesse kon) et la cinétique de dissociation (constante de vitesse koff) en temps réel.

La SPR nécessite une concentration très faible de matériau (de l'ordre du nM) mais implique l'immobilisation de l'un des partenaires de liaison.

[Remarque quant à la terminologie : dans de nombreuses publications et figures, le ligand est dénommé "analyte" et la protéine qui le fixe est dénommée "ligand".]

Retour haut de page

γ. Description du système physique de la SPR

La surface est un mince film d'or sur un support en verre qui forme le fond d'une cellule d'analyse de très petit volume (moins de 100 nl) à travers laquelle une solution aqueuse contenant le ligand (le milieu biologique) passe en continu ("flow-cell").

La lumière polarisée monochromatique provenant d'une source laser est dirigée à travers un prisme vers la surface inférieure du film d'or où des plasmons de surface sont générés uniquement sous un angle critique de cette lumière incidente.

Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR biochimej

Source : Patching S.G. (2014)

  • L'angle critique dépend de l'indice de réfraction du milieu : cet angle critique est donc modifié quand les molécules de ligand se fixent aux molécules de protéine immobilisées (formation du complexe).
  • 1 RU ("Resonance or response Unit") équivaut à un décalage de l'angle critique de 10-4 degrés.

Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR biochimej

Source : Patching S.G. (2014)

Retour haut de page

δ. Interprétation d'un sensorgramme SPR

  • A t = 0, aucune molécule de protéine immobilisée n'a fixé de molécule de ligand : la valeur RU correspond à un angle critique de départ (a).
  • Puis le ligand est injecté : quand il se fixe aux molécules de protéine immobilisées, la formation du complexe modifie l'indice de réfraction à la surface de la couche d'or et la valeur RU augmente.
  • La forme de l'enregistrement appelé sensorgramme permet de mesurer le taux d'association (constante de vitesse kon).
    • A l'équilibre (P + L <=> PL), la valeur RU correspond à un angle critique final différent (b).
    • Cette valeur maximale de RU est proportionnelle à la concentration du complexe [protéine immobilisée - ligand].
  • Quand on arrête d'injecter le ligand, il y a dissociation du complexe : la forme de l'enregistrement permet de mesurer la valeur de la constante de vitesse koff.
  • On détermine ainsi la constante de dissociation KD.
  • Enfin, la surface est régénérée donc ramenée à l'angle critique initial (a) et on peut effectuer une nouvelle mesure.

Interaction interactome interactomique interactomics PPI plasmon resonance plasmonique surface site fixation liaison molecule SPR angle critique association sensorgramme biochimej

Source : Patching S.G. (2014)

Rappel de l'équilibre de fixation d'un ligand L sur une protéine P

                        Equilibre fixation proteine ligand binding equilibrium biochimej

La vitesse d'association s'écrit : vaka . [P].[L]       -     La vitesse de dissociation s'écrit : vdkd . [PL]

  • ka : constante de vitesse microscopique du second ordre (réaction bimoléculaire). Unités : mol-1.L.s-1 ou M-1.s-1
  • kd : constante de vitesse microscopique du premier ordre (réaction monomoléculaire). Unités : s-1
  • [L] = concentration du ligand libre; [PL] = concentration du ligand lié.

Quand le système est à l'équilibre, les vitesses d'association et de dissociation sont égales :

enzyme demonstration representation Scatchard constante equilibre fixation site protein ligand binding equilibrium association dissociaton biochimej

  • Ka = 1 / Kd
  • Ka et Kd sont des constantes d'équilibre macroscopiques

Retour haut de page

La réponse optimale Rmax (en RU)

traduit la capacité de liaison maximale du ligand par la protéine immobilisée :

Rmax = (MMligand/MMprotéine) × Rprotéine × nprotéine

  • MMligand et MMprotéine sont respectivement la masse molaire du ligand et de la protéine immobilisée.
  • Rprotéine est la réponse mesurée pour la protéine immobilisée.
  • nprotéine est le nombre de site de fixation du ligand par la protéine immobilisée (compte-tenu de la stoechiométrie de l'association).

SPRD ("Surface Plasmon Resonance Database") : base de données pour optimiser des expériences de SPR.

Retour haut de page

d. L'interférométrie de biocouches

La technique d'interférométrie de biocouches ("Biolayer Interferometry" - BLI) permet de mesurer la cinétique des interactions moléculaires et l'affinité entre biomolécules en analysant le modèle d'interférence de la lumière blanche réfléchie par la pointe d'un biocapteur ("biosensor tip"), fréquemment une fibre optique.

  • Une protéine est d'abord immobilisée (jusqu'à 109 sites de fixation) sur la pointe (600 µm de diamètre) d'un biocapteur à fibre optique.
    • L'immobilisation de la protéine est effectuée par exemple avec le système [biotine - streptavidine] ou par couplage via un groupement amine.
  • Le ligand circule ensuite dans une solution en contact avec ce biocapteur.

La technique BLI analyse les modèles d'interférence de la lumière réfléchie par 2 couches optiques :

  • Une couche de référence située à l'intérieur de la pointe ("optical layer" - figure ci-dessous).
  • Une biocouche située à l'interface [pointe - liquide circulant contenant le ligand].

Au fur et à mesure que le ligand se fixe sur la protéine immobilisée, la biocouche est caractérisée par 2 surfaces distinctes : la protéine immobilisée seule et le complexe [protéine immobilisée - ligand].

Interaction interactome interactomique interactomics PPI interferometre biocouche biolayer interferometry BLI onde lumiere biochimej     Interaction interactome interactomique interactomics PPI interferometre biocouche biolayer interferometry BLI onde lumiere biochimej

Source : 2bind Technologies

Une lumière blanche ("white light") est projetée sur la pointe du biocapteur et elle est réfléchie par la couche de référence et par la biocouche :

  • Chacune de ces couches génère un modèle de réflexion d'onde qui lui est propre et d'une intensité donnée.
  • Le décalage de longueur d'onde (Δλ) entre le modèle de réflexion (constant) de la couche de référence et celui (variable) de la biocouche génère un modèle d'interférence.
  • Δλ traduit l'épaisseur de la biocouche et cette épaisseur traduit le nombre de molécules de ligand fixées sur la protéine immobilisée.

Caractéristiques importantes de la technique BLI

  • Les molécules de ligand non liées, les variations de l'indice de réfraction du milieu circulant ou son débit n'affectent pas le modèle d'interférence.
  • La BLI nécessite une concentration de matériau de l'ordre du μM et l'immobilisation de l'un des partenaires de liaison.
  • Exemple de gamme de concentrations étudiées par BLI: anticorps IgG de l'homme 50 10-9 g/mL à 2 10-3 g/mL.
  • Gamme de valeurs déterminables de constante de dissociation KD : 10-3 à 10-11 M.

biochimej Retour haut de page

Principe des mesures d'interférométrie de biocouches

La mesure du modèle d'interférence enregistre donc en temps réel (cinétique) les interactions entre molécules.

Les capteurs sont déplacés d'un puits d'une microplaque à un autre pour changer le type de solution :

  • "Baseline" : La pointe du biocapteur est plongée dans un tampon pour ajuster la ligne de base ("baseline") du signal enregistré.
  • "Loading" : le premier partenaire d'interaction (par exemple, un anticorps primaire - points rouges) se fixe sur la surface de la pointe du biocapteur.
  • "Baseline" : L'excès de ligand est éliminé par lavage avec le tampon.

Interaction interactome interactomique interactomics PPI interferometre biocouche biolayer interferometry BLI onde lumiere biochimej

Source : 2bind Molecular interactions

  • "Association" :
    • La pointe du biocapteur chargée est plongée dans une solution contenant le deuxième partenaire d'interaction (par exemple un anticorps secondaire - arcs de cercle bleus).
    • Détermination de la constante de vitesse kon.
  • "Dissociation" :
    • La pointe du biocapteur est plongée dans un tampon pour la dissociation.
    • Détermination de la constante de vitesse koff.

biochimej Retour haut de page

Enregistrement des mesures d'interférométrie de biocouches

La technique BLI analyse le modèle d'interférence de la lumière blanche lié au changement de la couche externe de la pointe résultant de la fixation du ligand (ou de sa dissociation) : modèle a -> modèle b dans la figure ci-dessous.

Interaction interactome interactomique interactomics PPI interferometre biocouche biolayer interferometry BLI onde lumiere biochimej

Source : CMI - Harvard

  • Il en résulte un décalage de longueur d'onde Δλ (nm) du spectre d'interférence mesuré en temps réel ("time").
  • Δλ positif correspond à une augmentation de l'épaisseur de la biocouche donc à l'association entre molécules.
  • Δλ négatif correspond à une diminution de l'épaisseur de la biocouche donc à la dissociation des molécules.

Les mesures de ce changement résolues en temps permettent de déterminer les constantes de vitesse d'association et de dissociation (kon et koff) du ligand avec/de la protéine immobilisée sur la surface de la pointe.

Gamme de valeurs déterminables de constante de dissociation KD : 10-3 à 10-11 M.

biochimej Retour haut de page

6. Titrage calorimétrique isotherme ("Isothermal Titration Calorimetry" - ITC)

a. Principe de l'ITC

L'ITC est une méthode qui permet de mesurer, en théorie, les valeurs quantitatives des grandeurs thermodynamiques liées à l'interaction entre molécules dans leur état natif.

  • Elle mesure l'équilibre de fixation en déterminant la chaleur dégagée lors de l'association d'un ligand avec son partenaire.
  • Les mesures du transfert thermique sont effectuées avec un microcalorimètre qui détecte la différence de température entre une cellule de référence et une cellule contenant l’échantillon.
  • L’ITC a un temps de réponse de l’ordre de la seconde et une limite de détection de l’ordre du dixième de microcalorie.s-1.

En une seule expérience :

  • Les valeurs de la constante de dissociation (KD), de la stoechiométrie (n) et de l'enthalpie de la réaction de fixation (ΔHréaction) peuvent être déterminées, en théorie.
  • L'énergie libre de Gibbs (ΔG) et l'entropie (ΔS) de fixation sont ensuite calculées : ΔG = - R.T Ln(KD) et ΔG = ΔH - TΔS

L'ITC est une technique assez complexe qui nécessite une concentration de matériau de l'ordre du μM.

biochimej Retour haut de page

b. Fonctionnement du calorimètre

Le calorimètre pour un titrage isotherme est composé de 2 cellules identiques : une cellule de référence ("Reference cell") et une cellule contenant l'échantillon (la protéine par exemple, "Sample cell").

Ces cellules :

  • Ont le même volume effectif V0.
  • Sont thermiquement conductrices et chimiquement inertes (exemple : Hastelloy, alliages de nickel résistant à la corrosion).
  • Sont entourées d'une enveloppe adiabatique ("Adiabatic shield") : il n'y a pas de transfert thermique entre les cellules et le milieu extérieur.

interactome interactomique interactomics PPI interaction protein titrage calorimetrique isotherme isothermal titration calorimetry ITC calorimetrie isotherme chaleur reaction enthalpie enthalpy adiabatic biochimej

Source : Song et al. (2015)

Une seringue ("Stirring syringe") est insérée dans la cellule contenant la protéine :

  • Une série d'injections du ligand dont on veut étudier la fixation est effectuée.
  • Les volumes injectés sont très petits par rapport à V0 afin de minimiser le plus possible la dilution de la protéine.

A chaque injection, la réaction protéine + ligand <=> [protéine-ligand] se traduit par une variation d'enthalpie (ΔHréaction) qui s'accompagne d'un dégagement (ou d'une absorption) de chaleur ("heat").

  • Le circuit [thermopile – thermocouple] du calorimètre mesure la différence de température (ΔT) entre la cellule de référence et la cellule contenant la protéine où a lieu cette réaction.
  • Le circuit fournit alors la puissance de rétroaction ("Feedback power") nécessaire au maintien de la condition isotherme en augmentant (ou en diminuant) la température de la cellule contenant la protéine.

biochimej Retour haut de page

c. Acquisition des données

Au fur et à mesure que les injections du ligand s'accumulent, le rapport molaire [ligand / protéine] augmente et la protéine est progressivement saturée.

Bien que minime, puisque les volumes injectés sont très petits, on doit cependant tenir compte de la dilution progressive de la protéine.

interactome interactomique interactomics PPI interaction protein injection protein ligand reaction titrage calorimetrique isotherme isothermal titration calorimetry ITC calorimetrie isotherme chaleur enthalpie heat enthalpy biochimej

Source : Paketuryte et al. (2019)

Au fur et à mesure que la protéine est saturée par le ligand, l'amplitude des pics diminue car elle est proportionnelle au nombre de liaisons qui s'établissent.

  • La chaleur à chaque injection est obtenue en calculant la surface de chaque pic.
  • La puissance thermique Ptherm (µJ.s-1) consommée (ou libérée) à chaque injection est intégrée par rapport au temps : ΔHréaction = ∫t (Ptherm . dt)

interactome interactomique interactomics PPI interaction protein peak area power titrage calorimetrique isotherme isothermal titration calorimetry ITC calorimetrie isotherme chaleur enthalpie heat enthalpy biochimej

Source : Paketuryte et al. (2019)

Quand on a un excès de ligand par rapport à la protéine, la limite inférieure de l'amplitude des pics ne reflète plus que la dilution de la protéine et les effets mécaniques lors d'une nième injection : l'isotherme de fixation est une courbe sigmoïde (voir ci-dessous).

Le contenu thermique total dans le volume V0 de la cellule contenant la protéine est : Q = n.[P]0.V0.ΔHréaction

  • n = nombre de site(s) de fixation par monomère de protéine
  • [P]0 = concentration initiale de la protéine
  • Θ = fraction de sites occupés par le ligand
  • Voir un développement.

biochimej Retour haut de page

d. Grandeurs déterminées à partir de l'isotherme de fixation

Soit l'équilibre de fixation d'un ligand L sur une protéine P contenant n sites de fixation :

          Kd
P + n L <=====> PLn
      

On peut déterminer graphiquement les différents paramètres à partir de de l’isotherme de fixation (ci-dessous) :

interactome interactomique interactomics PPI interaction protein isotherme sigmoide titrage calorimetrique isothermal titration calorimetry ITC calorimetrie isotherme chaleur enthalpie heat enthalpy binding site fixation ligand protein biochimej

  • ΔHréaction : amplitude de l’isotherme de fixation (ci-dessous)
  • n : valeur du rapport des concentrations molaires au centre de l’isotherme de fixation.
  • Kassociation = 1/Kdissociation : pente de l’isotherme de fixation.

Les valeurs de c et ΔH déterminent les caractéristiques géométriques de l'isotherme de fixation :

  • La déviation globale de cet isotherme (différence entre le point d'intersection avec l'axe des y et la chaleur observée à forte saturation) est égale à c / (c+1).ΔH.
  • La pente de cet isotherme pour un rapport molaire = 1 est approximativement égale à (-0,25 c0,5.ΔH).

Retour haut de page

7. La photométrie de masse ("Mass photometry")

a. Principe

La photométrie de masse est basée sur les principes de la microscopie à diffusion interférométrique ("interferometric SCATtering microscopy"- iSCAT, Young et al., 2018). C'est est une technique de plus en plus employée pour l'étude des interactions protéine-protéine, les mécanismes d'oligomérisation des protéines et le stabilité des protéines.

Une biomolécule (cylindre bleu cyan - figure ci-dessous) éclairée par une lumière (jaune) et placée dans un photomètre de masse génère un signal de diffusion de cette lumière (cercle gris sous la biomolécule). L'intensité du signal est corrélée à la masse de la molécule (gris de plus en plus prononcé).

interactome interactomique interactomics PPI interaction protein photometrie mass photometry lumiere reflechie diffusion reflected scattered light contrast biochimejinteractome interactomique interactomics PPI interaction protein photometrie mass photometry lumiere reflechie diffusion reflected scattered light contrast biochimej

Source : REFEYN

Lors d'une mesure de photométrie de masse, une protéine en contact avec une surface de mesure est donc éclairée par un faisceau lumineux ("incident light") dans le photomètre de masse (figure ci-dessous).

  • Une partie de la lumière est réfléchie ("Reflected light ") par la surface de mesure.
  • Une autre partie de la lumière est diffusée ("Scattered light ") par les molécules en contact avec la surface de mesure.

La photométrie de masse mesure l'interférence entre la lumière réfléchie et la lumière diffusée.

L'intensité du signal d'interférence, appelé contraste de photométrie de masse (ou contraste interférométrique), est proportionnelle à la masse molaire des molécules (actuellement jusqu'à 30 KDa, pour une taille inférieure à 100 nm).

interactome interactomique interactomics PPI interaction protein photometrie mass photometry lumiere reflechie diffusion reflected scattered light contrast biochimej

Source : Soltermann et al. (2020)

Retour haut de page

b. Avantages de la photométrie de masse

En utilisant un étalon de masse connue et de la même classe de biomolécules que les échantillons analysés, la photométrie de masse permet de déterminer la masse moléculaire de chaque molécule analysée.

  • Le résultat est un histogramme montrant la distribution de masse de l'ensemble des molécules de l'échantillon, y compris les populations de faible abondance.
  • Toutes les espèces moléculaires présentes dans l'échantillon sont ainsi détectées (protéines individuelles, complexes de différentes stœchiométries, agrégats ...).

Avantages

  • Mesure de la masse molaire réelle (gamme de masses de 30 kDa à 5 MDa) des molécules.
  • Description de l'hétérogénéité moléculaire.
  • Mesure de la distribution de masses des molécules qui permet de quantifier la concentration relative des partenaires en interaction.
  • Mesure de KD.
  • Mesures effectuées en solution (eau et une large gamme de tampons).
  • Nécessite de très faibles volumes (de l'ordre de 10 µL) et de très faibles quantités d'échantillon (de 0,1 nmM à 100 nM).
  • Aucune modification de l'échantillon (aucun étiquetage des molécules étudiées).
  • Résultats obtenus très rapidement (préparation et mesure en quelques minutes).
  • Mesures cinétiques permettant l'analyse de la dynamique des molécules :
    • étude de la perturbation d'équilibres
    • étude de l'[assemblage/désassemblage] de complexes moléculaires
    • étude de l'existence d'intermédiaires structuraux transitoires
    • étude d'étapes de la formation d'oligomères ...

Retour haut de page

8. Notion de proximité induite chimiquement "Chemically Induced Proximity"

a. Modélisation des cinétiques de réactions associées aux mécanismes de proximité induite

L'augmentation effective de la concentration en présence d'un inducteur chimique de proximité (ICP) sur un site de recrutement peut être décrite en assimilant la dimérisation à une réaction ayant lieu dans un système [réaction-diffusion] (figure A ci-dessous) car les modèles d'équilibre ne peuvent pas décrire des gradients de concentration abrupts.

  • Lors d'une fixation impliquant un ICP, la molécule A diffuse librement et la molécule B est localisée en un site précis (par exemple, sur la membrane cellulaire, sur la chromatine, …).
  • L'addition d'une molécule de dimérisation chimique (les hexagones - figures C & D) crée un gradient de concentration du complexe [AB*] avec une concentration maximale au niveau du site de recrutement (figure A).

Interaction interactome interactomique interactomics PPI proximite chimiquement induite dimerisation chemically induced proximity regulation processus cellulaire biochimej

Source : Stanton et al. (2018)
Les complexes [protéine-molécule de dimérisation chimique] sont désignés par le symbole *.

Figures A et B : la variation des concentrations des monomères et des complexes [AB] ou [AB*] dépend du taux de diffusion des molécules et de la vitesse de fixation de la molécule de dimérisation chimique.

Ces 2 paramètres dépendent notamment de la distance au site de recrutement (reportée en abscisse sur les graphiques).

  • Graphique de gauche : sans dimérisation induite chimiquement ou dans le cas d'une constante de dissociation KD élevée, la formation des complexes ternaires est déterminée par le taux de diffusion quand la vitesse de fixation de la molécule tend vers zéro.
  • Graphique au centre : avec une dimérisation induite chimiquement et KD faible, la formation d'un complexe ternaire [AB*] dépend quasi exclusivement de la vitesse de fixation de la molécule de dimérisation chimique (très supérieure à la vitesse de diffusion).
  • Graphique de droite : les protéines de fusion sont localisées directement sur le site de recrutement.

Figure C : la minimisation de l'entropie de translation et de rotation sont les principales contributions thermodynamiques à la dimérisation induite chimiquement.

Retour haut de page

b. Exemples de l'implication de la proximité induite chimiquement dans la régulation de processus cellulaires

Voir une application in vivo de l'ICP mandipropamide.

  • L'addition de l'ICP mandipropamide induit rapidement une proximité entre protéines : les images obtenues par microscopie confocale démontrent une colocalisation du domaine récepteur PYR (marqué par mCherry) et du domaine récepteur ABI cytosolique (marqué par eGFP).
  • PYR1 & ABI : récepteurs de l'acide abscissique (ABA) de plantes. La pyrabactine est un sulfamide synthétique qui imite l'ABA.

Autres exemples d'utilisation d'ICP pour l'étude de processus biologiques :

  • L'activation (VP16) et la répression (KRAB ou HP1) de la transcription.
  • Certaines cascades de signalisation (apoptose, ...).
  • La dynamique structurale de la chromatine :
    • Induction rapide d'états activés par le recrutement de complexes de remodelage dépendants de l'ATP.
    • Induction d'états répressifs par la formation d'hétérochromatine médiée par HP1.
  • La dégradation des protéines par les systèmes protéasome : recrutement médié par des molécules bifonctionnelles du complexe ubiquitine-ligase E3.
  • La localisation sub-cellulaire de certaines protéines (import-export de protéines du noyau, des vésicules synaptiques et des mitochondries.

Retour haut de page

9. La prédiction des interactions protéine-protéine par apprentissage profond

a. Description des méthodes et des outils informatiques nécessaires

Ces méthodes de prédiction sont exclusivement informatiques avec l'utilisation de langages spécifiques du domaine de l'intelligence artificielle. Notamment :

  • PyTorch : bibliothèque logicielle Python d'apprentissage machine (Google).
  • TensorFlow : outil d'apprentissage automatique (Meta).

Leurs outils d'apprentissage sont, en particulier, des modèles de langage pré-entraînés pour le traitement du langage naturel ("Natural Language Processing"). Par exemple :

  • La famille des transformateurs génératifs pré-entraînés ("Generative Pre-trained Transformer" - GPT).
  • Les représentations d'encodeurs bidirectionnels à partir de transformateurs ("Bidirectional Encoder Representations from Transformers" - BERT).
  • Le grand modèle de langage basé sur un transformateur ("BigScience Large Open-science Open-access Multilingual Language Model" - BLOOM).
  • Voir une liste de de grands modèles de langage ("Large Language Models" - LLM).

Ces méthodes s'appuient sur des modèles mathématiques sophistiqués.

Retour haut de page

Enfin, ces méthodes utilisent des jeux d'entraînement gigantesques (de tailles exponentiellement croissantes) puisés :

  • Dans les bases de données de séquences en acides aminés (exemple : Uniprot) et de structures des protéines, complété par des annotations issues de l'ontologie.
  • Dans les immenses corpus de connaissances tels que les pages de Wikipedia, les scripts de GitHub, les milliards de phrases de centaines de milliers de livres (exemple : BookCorpus), ...

Les informations structurales et fonctionnelles des protéines au sein des séquences d'acides aminés sont ainsi apprises automatiquement par des modèles d'apprentissage profond.

Interaction interactome interactomique interactomics PPI apprentissage profond deep learning supervised training algorithm model language reseau biochimej

Source : Unsal et al. (2022)

Ilustration de l'utilisation de grands modèles de langage ("Large Language Models" - LLM)

Requêtes (traduites) dans les invites pour GPT-3 (API), GPT-3.5 (ChatGPT) et GPT-4 (ChatGPT) :

  • "Recherchez toutes les interactions protéine-protéine possibles à partir des phrases données et fournissez le résultat sous forme de tableau avec les colonnes "ID de phrase | Protéine 1 | Protéine 2 | Interaction protéine-protéine" pour la paire de protéines en interaction identifiée.
  • Assurez-vous que chaque ligne contiendra une paire d'interactions protéine-protéine, même si plusieurs paires sont identifiées à partir d'une seule phrase. N'oubliez pas que les protéines et les gènes sont les mêmes choses."
  • Source : Rehana et al. (2023)

Remarque : la dernière phrase de cette requête est étonnante !

Exemples de méthodes basées sur l'analyse des séquences d'acides aminés pour prédire les interactions protéine-protéine Exemples d'algorithmes & programmes de prédiction des interactions protéine-protéine
  • Machine à vecteurs de support avec auto-corrélation ("support vector machine with auto-correlation").
  • Méthode des k-voisins les plus proches avec description locale ("k-nearest neighbor with local description")
  • Vecteur de support machine avec autocovariance conventionnelle ou description locale ("support vector machine with conventional auto covariance or local description")
  • Réseau neuronal profond avec descripteur amphiphile de composition de pseudo-acides aminés ("deep neural network with amphiphilic pseudo amino acid composition descriptor")
  • S-VGAE ("Signed Variational Graph Auto-Encoder")
Voir un cours sur l'apprentissage profond (intelligence artificielle).  

Retour haut de page

b. Illustration de la méthode "DeepFE-PPI"

La longueur de toutes les séquences en acides aminés (composées de D résidus différents) est uniformisée à une valeur fixe m :

  • Chaque séquence est donc représentée par un vecteur de taille [D.m].
  • Si une séquence a une longueur inférieure à m, la valeur "zéro" est ajouté au vecteur précédent afin que toutes les séquences aient le même formalisme de représentation.
  • Ces deux vecteurs constituent les données d'entrée du modèle d'apprentissage profond.

Ce modèle est composé de :

  • Deux réseaux neuronaux distincts qui extraient les fonctionnalités cachées dans les vecteurs d'entrée.
    • Ces deux réseaux sont configurés avec le même nombre de couches et d'unités cachées.
    • Le nombre de couches entièrement connectées est fixé à 4 et les unités correspondantes dans chaque couche sont respectivement 2048, 2014, 512 et 128.
  • Un réseau neuronal commun qui intègre les derniers vecteurs cachés concaténés des deux réseaux précédents via 2 couches cachées entièrement connectées. Il a plusieurs rôles :
    • Extraire les fonctionnalités dites de haut niveau.
    • Eliminer le bruit et réduire la dimension des données.
    • Classer chaque paire de protéines en entrée dans la catégorie "interaction" ou dans la catégorie "pas d'interaction".
  • Une couche de sortie qui utilise une fonction "softmax" pour prédire la probabilité qu'une paire de protéines interagisse ou non.
  • Une couche de normalisation et une couche d'abandon sont ajoutées à chaque couche entièrement connectée, à l'exception de la couche de sortie.

Interaction interactome interactomique interactomics PPI apprentissage profond deep learning supervised training algorithm model language reseau neurone biochimej

Source : Yao et al. (2019)

Les autres caractéristiques de ce modèle d'apprentissage profond sont :

  • La fonction d'activation "Rectified Linear Unit" (ReLU) est utilisée pour toutes les couches à l'exception de la couche finale.
  • Pendant la phase d'entraînement, les modèles sont optimisés avec l'algorithme de descente du gradient ("Stochastic Gradient Descent").
  • Le terme de régularisation L2 est ajouté à la fonction de perte, en ajoutant la somme des carrés de tous les poids du réseau neuronal.

Retour haut de page

Exemples d'autres ressources de prédiction des interactions protéine - protéine

DeepPPAPred : outil de prédiction d'affinité de liaison pour les protéines basé sur l'apprentissage profond.

DDMut-PPI : serveur Web qui prédit par une méthode d'apprentissage profond les effets de mutations ponctuelles sur les interactions protéine-protéine.

 

10. Liens Internet et références bibliographiques

Cours en ligne "Protein-protein interactions"

Pathway Figure OCR : extraction d'informations publiées dans la littérature.

Pathway Commons

Ensemble d'articles scientifiques récents utilisant la méthode SPR pour diverses protéines

EMBL-EBI Training

OCR

Pathway Commons

Aller au site

PPI-MASS: An Interactive Web Server to Identify Protein-Protein Interactions From Mass Spectrometry-Based Proteomics Data

The working principle of isothermal titration calorimetry

SPRD : base de données pour optimiser des expériences de SPR.

Photométrie de masse

PPI-MASS

Aller au site

SPRD

RE.FEYN

Smith & Johnson (1988) "Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase" Gene 67, 31 - 40

Fields  & Song (1989) "A novel genetic system to detect protein-protein interactions" Nature 340, 245 - 246

Guan & Dixon (1991) "Eukaryotic proteins expressed in Escherichia coli: an improved thrombin cleavage and purification procedure of fusion proteins with glutathione S-transferase" Anal. Biochem. 192, 262 - 267

Pierce et al. (1999) "Isothermal titration calorimetry of protein-protein interactions" Methods 19, 213 - 221

Article

Article

Article

Article

Zhu et al. (2001) "Global analysis of protein activities using proteome chips" Science 293, 2101 – 2105

Turnbull et al. (2003) "On the value of c: can low affinity systems be studied by isothermal titration calorimetry ?" J. Am. Chem. Soc. 125, 14859 - 14866

Chatr-aryamontri et al. (2007) "MINT: the Molecular INTeraction database" Nucleic Acids Res. 35, D572 - D574

Article

Article

Article

Reynolds et al. (2012) "Multivalent gold glycoclusters: high affinity molecular recognition by bacterial lectin PA-IL" Chemistry 18, 4264 - 4273

Kodama & Hu (2012) "Bimolecular fluorescence complementation (BiFC): a 5-year update and future perspectives" Biotechniques 53, 285 - 298

Rhee et al. (2013) "Proteomic Mapping of Mitochondria in Living Cells via Spatially-Restricted Enzymatic Tagging" Science 339, 1328 - 1331

Patching S.G. (2014) "Surface plasmon resonance spectroscopy for characterisation of membrane protein-ligand interactions and its potential for drug discovery" Biochim. Biophys. Acta. 1838, 43 - 55

Song et al. (2015) "Choosing a suitable method for the identification of replication origins in microbial genomes" Front. Microbiol. 6, 1049

Mehla et al. (2015) "The yeast two-hybrid system: a tool for mapping protein-protein interactions" Cold Spring Harb. Protoc. (5), 425 - 430

Article

Article

Article

Article

Article

Article

Xing et al. (2016) "Techniques for the analysis of protein-protein interactions in vivo" Plant Physiol. 171, 727 - 758

Fernandes et al. (2016) "Systematic analysis of the gerontome reveals links between aging and age-related diseases" Hum. Mol. Genet. 25, 4804 - 4818

Hu et al. (2017) "Functional Analysis of Human Hub Proteins and Their Interactors Involved in the Intrinsic Disorder-Enriched Interactions" Int. J. Mol. Sci. 18, 2761

Di Silvestre et al. (2018) "Large Scale Proteomic Data and Network-Based Systems Biology Approaches to Explore the Plant World" Proteomes 6, 27

Stanton et al. (2018) "Chemically induced proximity in biology and medicine" Science 359, eaao5902

Article

Article

Article

Article

Article

Ivarsson & Jemth (2019) "Affinity and specificity of motif-based protein-protein interactions" Curr. Opin. Struct. Biol. 54, 26 - 33

Paketuryte et al. (2019) "Inhibitor Binding to Carbonic Anhydrases by Isothermal Titration Calorimetry" dans "Carbonic Anhydrase as Drug Target" pages 79 - 95, Springer

Yao et al. (2019) "An integration of deep learning with feature embedding for protein–protein interaction prediction" PeerJ. 7, e7126

Soltermann et al. (2020) "Quantifying Protein–Protein Interactions by Molecular Counting with Mass Photometry" Angew. Chem. Int. Ed. Engl. 59, 10774 - 10779

Soltermann et al. (2021) "Label-free methods for optical in vitro characterization of protein–protein interactions" Phys. Chem. Chem. Phys. 23, 16488 - 16500

Olerinyova et al. (2021) "Mass Photometry of Membrane Proteins" Chem. 7, 224 - 236

Article

Chapitre

Article

Article

Article

Article

Unsal et al. (2022) "Learning functional properties of proteins with language models" Nat. Mach. Intell. 4, 227 - 245

Lee M. (2023) "Recent Advances in Deep Learning for Protein-Protein Interaction Analysis: A Comprehensive Review" Molecules 28, 5169

Rehana et al. (2023) "Evaluation of GPT and BERT-based models on identifying protein-protein interactions in biomedical text" arXiv:2303.17728

Article

Article

Article

Newcombe et al. (2024) "Stereochemistry in the disorder–order continuum of protein interactions" Nature 636, 762 - 768

Ren et al. (2024) "Comprehensive Review on Bimolecular Fluorescence Complementation and Its Application in Deciphering Protein–Protein Interactions in Cell Signaling Pathways" Biomolecules 14, 859

Zhou et al. (2024) "DDMut-PPI: predicting effects of mutations on protein-protein interactions using graph-based deep learning" Nucleic Acids Res. 52(W1), W207 - W214

Nikam et al. (2024) "DeepPPAPredMut: deep ensemble method for predicting the binding affinity change in protein–protein complexes upon mutation" Bioinformatics 40, btae309

Article

Article

Article

Article

Retour haut de page

Valid XHTML 1.0 Transitional