Interactions entre proteines PPI Interactome et interactomique Enseignement recherche biochimie enzymologie bioinformatique Emmanuel Jaspard Universite Angers biochimej

Quelques méthodes d'études des interactions protéine-protéine ("Protein-Protein Interaction" - PPI)

1. La relation structure - fonction des macromolécules biologiques

2. Quantification de l'interaction entre macromolécules biologiques (K_A et K_D)

3. Notions élémentaires de protéomique

a. Caractéristiques générales des protéomes
b. Principe de la spectrométrie de masse

4. Caractéristiques des méthodes pour détecter et prouver les PPI

a. Comparaison de diverses méthodes pour l'étude des PPI
b. Critères de choix d'une technique pour mesurer les PPI
c. Aperçu des méthodes biologiques (complémentation) & biochimiques
d. Aperçu des méthodes physiques et bioinformatiques

5. Quelques méthodes de pointe pour l'analyse des PPI

a. La méthode ascorbate peroxidase (APEX)
b. La fluorescence par complémentation bimoléculaire (BiFC)
c. Alternatives au marquage fluorescent par de grosses protéines de fusion

d. La résonance plasmonique de surface (SPR)
e. L'interférométrie de biocouches (BLI)
f. Le marquage de l'ADN au DAPI

6. Titrage calorimétrique isotherme (ITC)

a. Principe de l'ITC
b. Fonctionnement du calorimètre
c. Acquisition des données
d. Grandeurs déterminées à partir de l'isotherme de fixation

7. La photométrie de masse ("Mass photometry")

a. Principe
b. Avantages

8. Notion de proximité induite chimiquement

9. La prédiction des interactions protéine-protéine par apprentissage profond

10. Liens Internet et références bibliographiques

1. La relation structure - fonction des macromolécules biologiques

a. Les différents types de ligands

La molécule qui se fixe sur une autre macromolécule biologique est appelée ligand de manière générique.

Un ligand peut être n'importe quel type de molécule biologique :

une protéine (on parle d'interactions protéine-protéine)
un substrat ou un inhibiteur pour une enzyme
une molécule reconnue par un récepteur membranaire ou un messager secondaire d'une voie de signalisation
un soluté reconnu par un transporteur membranaire
une séquence d'ADN sur laquelle se fixe une protéine de régulation de la transcription
Il peut également s'agir de n'importe quel types de métabolites (oses, lipides, intermédiaires de voies métaboliques, ...).

b. Propriétés physico-chimiques des macromolécules biologiques qui modulent et contrôlent leurs interactions

Les interactions physiques entre les molécules d'une cellule ou d'un compartiment sub-cellulaire traduisent, entre autre, l'aptitude structurale de ces molécules à se reconnaître.

La structure tridimensionnelle génère des conformations spatiales locales uniques aux propriétés physiques spécifiques (polarité, hydrophobicité, encombrement stérique, accessibilité au solvant, …) : ces conformations spatiales constituent les sites de fixation (ou de liaison, selon la terminologie).
La complémentarité des structures tridimensionnelles est ainsi l'élément clé de la reconnaissance entre deux ou plusieurs molécules biologiques.

Exemples :

Le site actif des enzymes : il est lui-même constitué du site de fixation des substrat(s), inhibiteur(s), effecteur(s) et du site catalytique où se déroule la réaction enzymatique.
La reconnaissance hautement spécifique entre un anticorps et l'épitope porté par son antigène.
La reconnaissance entre un facteur de transcription (protéine) et l'élément de réponse d'un gène (ADN) dont il est spécifique et dont il contrôle la transcription.

c. Forces de liaison qui maintiennent la structure des macromolécules

Ces forces sont non covalentes ou covalentes (ponts disulfures dans le cas des protéines) et très variées en nombre et du point de vue énergétique.

Elles sont intimement liées aux propriétés physico-chimiques des résidus d'acides aminés donc liées aux conditions cellulaires (pH, température, viscosité, pression).

Tous ces paramètres sont maintenus relativement constants dans la cellule.

L'ensemble de ces paramètres physico-chimiques dictent l'acquisition de la structure tridimensionnelle qui confère sa fonction à une macromolécule biologique.
La structure tridimensionnelle des macromolécules biologiques, notamment les protéines, résulte d'un grand nombre de conformations proches qui sont en équilibre.

Ces paramètres physico-chimiques contrôlent ces équilibres, donc la flexibilité ou dynamique conformationnelle de toutes les molécules biologiques.

Ce processus extrêmement fin permet à toutes les molécules d'adapter leurs structures les unes aux autres (exemple de l'ajustement induit du complexe enzyme-substrat).
Cette propriété est essentielle à la modulation (dans certains cas, la réversibilité) de la fonction des molécules dans la cellule.

d. La notion d'affinité entre macromolécules biologiques

C'est la caractéristique qui traduit la propension, dans un environnement et des conditions cellulaires donnés, de 2 (ou plus) macromolécules biologiques à se reconnaître et à interagir de manière réversible.

Outre la complémentarité de structure, le paramètre clé de l'interaction entre molécules est leur concentration respective.

L'affinité de liaison est quantifiable via la constante macroscopique de l'équilibre d'association (K_A) ou de l'équilibre de dissociation (K_D) des molécules qui interagissent.
Plus la valeur de la constante K_D est petite, plus l'affinité de liaison du ligand pour son site de fixation est grande.

L'affinité de liaison est influencée par les paramètres physico-chimiques qui influencent la structure des macromolécules biologiques qui interagissent :

L'ensemble des interactions intermoléculaires non covalentes (liaison hydrogène, interactions électrostatiques, forces de Van der Waals et interactions hydrophobes).
La présence d'autres molécules effectrices qui modulent l'interaction.

2. Quantification de l'interaction entre macromolécules biologiques (K_A et K_D)

Toute réaction d'association (inversement de dissociation) entre 2 (ou plus) molécules M1 et M2 peut s'écrire : M1 + M2 <=> M1-M2

Cette réaction d'association est régie par une constante d'association K_A (inversement de dissociation K_D) quantifiable si on dispose d'une méthode ou d'une technique permettant :

De mettre en évidence l'association entre M1 et M2.
De mesurer la concentration respective (ou tout autre signal dont la valeur est proportionnelle à cette concentration) de M1, M2 et du complexe M1-M2.

L'équilibre de fixation d'un ligand L sur une protéine P correspond à la réaction : Equilibre fixation proteine ligand binding equilibrium biochimej

Vitesse d'association : v_a = k_a . [P].[L] - Vitesse de dissociation : v_d = k_d . [PL]

k_a et k_d sont des constantes microscopiques.
[L] = concentration du ligand libre; [PL] = concentration du ligand lié.

A l'équilibre, les vitesses sont égales :

enzyme demonstration representation Scatchard constante equilibre fixation site protein ligand binding equilibrium association dissociaton biochimej

K_a = constante d'équilibre d'association; K_d = constante d'équilibre de dissociation. Ce sont des constantes macroscopiques.
K_a = 1 / K_d

Plus K_D est faible, plus l'affinité entre le ligand et la protéine est élevée.

interactome interactomique PPI proteome spectrometrie masse spectrometry tandem protein sequence domaine omics biochimej

Source : Xing et al. (2016)
Dans cette figure, deux protéines (dénotées A et B) interagissent avec une constante de dissociation K_D.

Voir un développement important : équilibre de fixation d'un ligand sur une protéine et représentation de Scatchard.

3. Notions élémentaires de protéomique

a. Caractéristiques générales des protéomes

La protéomique a pour but d'identifier (et de quantifier) l'ensemble des protéines synthétisées ou protéome, à un moment donné et dans des conditions données au sein d'un tissu, d'une cellule ou d'un compartiment cellulaire.

Le protéome est extrêmement complexe à plusieurs titres :

Compte-tenu de l'épissage alternatif des transcrits primaires (plusieurs ARN messagers pour un gène) et compte-tenu des modifications post-traductionnelles des protéines, on peut estimer à plusieurs dizaines de milliers les formes des protéines synthétisées dans les différents tissus humains par exemple.

Pour chaque condition environnementale (condition physiologique normale vs. conditions de stress) une cellule est caractérisée par un protéome adapté à cette condition alors qu'elle a toujours le même génome. Le cas des plantes est un exemple flagrant compte-tenu de leur nécessité de s'adapter tant aux variations de la lumière qu'aux effets de stress biotiques ou abiotiques.

Outre les modifications post-traductionnelles, les protéines subissent des transformations une fois synthétisées : clivage du peptide signal d'adressage, activation de la forme native à partir d'un précurseur (zymogène), assemblage en complexes oligomèriques, association à des cofacteurs.

Il existe une grande dynamique de la synthèse des protéines : le rapport entre les protéines les moins abondantes et les plus abondantes dans une cellule dépasse 10⁶ pour atteindre 10¹² dans le sérum.

Les protéines ont des demi-vies trés variables : ornithine décarboxylase 11 min - tryptophane oxygénase 2 h - myosine 30 j.

b. Principe de la spectrométrie de masse

L'ionisation électronique (souvent appelée impact électronique) et l'ionisation chimique sont les principales méthodes d'ionisation.

Dans le cas de l'ionisation électronique, l'échantillon est introduit dans une enceinte sous vide, il y est vaporisé puis soumis au bombardement d'un canon à électrons de grande énergie.

Un électron est arraché aux molécules et on obtient une espèce qui est à la fois un cation (ion positif) et un radical libre (nombre impair d'électrons), que l'on appelle ion moléculaire M^+. :

M + e- (énergie 70 eV) <=> M^+. + 2 e-

L'énergie du faisceau ionisant fragmente l'ion moléculaire par rupture des liaisons les plus faibles avant les liaisons les plus fortes et donne naissance à des ions positifs de masses plus faibles, qui pourront être fragmentés à nouveau (exemple : spectrométrie de masse dite en tandem - MS/MS).

Ces ions sont ensuite accélérés dans un champ électrique et/ou magnétique, puis dirigés entre les pôles d'un aimant selon une trajectoire circulaire qui dépend de leur rapport masse/charge [m/z]. En faisant varier le champ électrique, on fait varier la vitesse des ions moléculaires et on peut les faire ainsi parvenir au détecteur par ordre croissant de rapport [m/z].

Le tri des ions s'effectue :

Soit par temps de vol : les ions arrivent à des temps différents en fonction de [m/z].
Soit par courbure de trajectoire : le point d'impact des ions dépend de [m/z].

On obtient un grand nombre de pics, tous de masse inférieure à celle de l'ion moléculaire. Cet ensemble constitue un diagramme de fragmentation. Les groupements fonctionnels possèdent un diagramme de fragmentation qui leur sont propres.

analyse proteome spectrometrie masse spectrometry tandem protein sequence domaine omics biochimej

Dans un spectre de masse, la hauteur relative des pics indique l'abondance relative des espèces.

Voir un développement de la protéomique.

Voir des travaux dirigés en ligne : "Applications et résultats de la protéomique : exemple de la RuBisCO"

4. Caractéristiques des méthodes pour détecter et prouver les interactions protéine-protéine

a. Comparaison de diverses méthodes pour l'étude des interactions protéine-protéine

La figure suivanre compare des méthodes optiques dites "sans marquage" : SPR "Surface Plasmon Resonance", BLI ("Biolayer Interferometry"), commutation dynamique des couches d'ADN ("dynamic switching of DNA layers"), CE, AUC, SEC-MALS, CG-MALS et photométrie de masse.

Ces méthodes sont classées en 3 catégories : basées sur la surface, basées sur la séparation et basées sur une solution.

Chaque rayon du diagramme représente une méthode et il est divisé selon divers critères :
- méthode sans immobilisation
- méthode qui permet de mesurer l'affinité de fixation, la cinétique de fixation ou la stoechiométrie de fixation
- méthode qui nécessite une quantité < 1 pmole d'échantillon
- méthode qui permet de mesurer des interactions protéine-protéine entre molécules de faibles masses molaires.

Le code couleur indique dans quelle mesure une méthode répond à un critère : vert = adapté; jaune = possible; orange = difficile.

$Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR electron onde angle refraction biochimej$

Source : Soltermann et al. (2021)

CG-MALS : "Composition-gradient multi-angle light scattering"; AUC : "Analytical ultracentrifugation"
SEC-MALS : "Size-exclusion chromatography multi-angle light scattering"; BLI : "Bio-layer interferometry"; CE : "Capillary electrophoresis"

b. Critères de choix d'une technique pour mesurer les interactions protéine-protéine

Les techniques sans marquage ou sans immobilisation sont employées autant que possible car :

Elles nécessitent une étape supplémentaire (parfois complexe) dans la procédure expérimentale.
Le marquage ou l'immobilisation des molécules (ligands) peuvent modifier la nature et/ou la force des interactions

L'aptitude d'une technique à étudier une large gamme de concentrations permet de mesurer une large gamme de valeurs de K_D.

Les interactions faibles :
- Nécessitent des concentrations élevées de molécules en interaction pour générer une quantité de complexe suffisante pour être détectée.
- Sont généralement caractérisées par des constantes de vitesse de dissociation élevées, ce qui les rend difficiles à analyser pour des concentrations inférieures à K_D.

Les interactions fortes (< μM) nécessitent :
- Une technique caractérisée par une sensibilité élevée pour quantifier les faibles concentrations de molécules non liées.
- Des mesures de concentrations des molécules d'au moins un ordre de grandeur autour de la valeur de K_D : en d'autres termes des concentrations qui peuvent être de l'ordre du nM (voire inférieures).

Les techniques qui mesurent la cinétique d'atteinte d'un équilibre de fixation entre molécules permettent de déterminer la valeur de K_D et celles des constantes de vitesse d'association (k_a) et de dissociation (k_d).

Ces techniques impliquent de quantifier la concentration des molécules non liées et liées (complexe) à différents temps jusqu'à atteindre l'équilibre. Il existe 2 procédures :

2 molécules sont mélangées et on effectue des mesures qui reflètent la formation du complexe.
un mélange pré-équilibré des 2 molécules est dilué et on effectue des mesures de dissociation du complexe.

Les valeurs de k_a et k_d peuvent s'échelonner de quelques millisecondes à des heures : le suivi de la cinétique de réactions avec une sensibilité élevée sur de longues périodes exige une correction permanente des lignes de bases et du bruit expérimental.

Les derniers critères de choix, et non les moindres, sont :

La quantité de molécules étudiées dont on dispose (teneur naturelle dans la cellule ou efficacité du système d'expression) et la facilité à les obtenir (rendement des procédures de pruification).
Le coût des appareils et des produits pour effectuer les expériences.
Les compétences des expérimentateurs pour obtenir et analyser les données avec des méthodes souvent sophistiquées et complexes.

Voir un cours détaillé sur l'interactomique.

c. Aperçu des méthodes biologiques (complémentation) & biochimiques

La construction génétique appelée double-hybride dans la levure ("Yeast Two-Hybrid system", "Two-hybrid screening" ou "Yeast two-Hybrid" - Y2H). C'est une technique à très haut débit.

La technique "Phage display" :
- Un gène codant une protéine d'intérêt est associé au gène codant une protéine d'enveloppe d'un phage (à l'origine le bactériophage filamenteux M13). Il y a alors synthèse d'une protéine de fusion qui se retrouve à la surface du phage : le phage affiche ("displays") la protéine d'intérêt.
- C'est une technique à haut débit.

La fluorescence par complémentation bimoléculaire ("Bimolecular Fluorescence Complementation" - BiFC) :
- Deux protéines d'intérêt sont fusionnées à un fragment N- ou C-terminal non fluorescent d'une protéine fluorescente puis traduites dans une cellule. Si une interaction a lieu entre les deux protéines d'intérêt, il y a reconstitution de la protéine fluorescente (formation d'un complexe fluorescent).
- Le signal est ainsi visualisé par microscopie de fluorescence ou par cytométrie en flux.

La technique "Strep - Protein INteraction Experiment" (SPINE) :
- Combinaison d'une réticulation in vivo par le formaldéhyde (agent de réticulation réversible) et d'une purification par affinité d'une protéine membranaire "appât" marquée par Strep (un octapeptide synthétique).
- Les protéines "proies" réticulées sont co-purifiées avec la protéine "appât" puis séparées par ébullition.

La technique "Far-Western Blotting" : démarche similaire au "Western blot" avec une différence, la sonde anticorps est substituée par une sonde protéine "appât" marquée.

Techniques d'immunoprécipitation

L'immunoprécipitation de la chromatine ("Chromatin immunoprecipitation") pour identifier et étudier les protéines qui interagissent avec l'ADN (facteurs de transcription, histones) et pour l'étude des processus épigénétiques.

La purification par immunoprécipitation ("Tandem Affinity Purification") : billes enrobées d'un anticorps et synthèse d'une protéine de fusion.

La co-immunoprécipitation ou immunoprécipitation d'un complexe de protéines ("Co-Immunoprecipitation" - Co-IP).

L'analyse "pull-down" ("pull-down assays") utilise une protéine "appât" immobilisée ("immobilized bait protein") qui se fixe et retient une protéine "proie" ("prey protein"). La technique d'origine utilisait une protéine de fusion appât glutathion-S-transférase immobilisée sur un support glutathion-agarose et une protéine proie radiomarquée : les 2 protéines étaient analysées par électrophorèse sur gel SDS-PAGE et quantifiées par autoradiographie (Smith & Johnson, 1988).

d. Aperçu des méthodes physiques

La purification par chromatographie d'affinité couplée à la spectromètrie de masse ("Affinity-purification coupled to Mass Spectrometry" - AP-MS). C'est une technique très haut débit.

La technique "Membrane-Strep-tagged Protein INteraction Experiment" (Membrane-SPINE) :
- Combinaison de la purification spécifique d'une protéine membranaire marquée par Strep avec la fixation réversible de complexes protéiques par réticulation avec le formaldéhyde. Analyse finale par spectrométrie de masse.
- Strep-tag II est un peptide synthétique composé de 8 acides aminés (WSHPQFEK) qui a une affinité intrinsèque envers la Strep-Tactine (une streptavidine recombinante spécialement conçue) et peut être fusionnée en position N- ou C-terminale à une protéine recombinante.

Cette interaction hautement spécifique permet d'isoler les protéines marquées par Strep en une étape à partir de lysats cellulaires bruts. De plus, les conditions d'élution de Strep-tag sont "douces" : ce marquage permet d'isoler des protéines fonctionnelles.

La titration calorimétrique isotherme ("Isothermal Titration Calorimetry" - ITC) : voir un développement de cette technique.

La résonance des plasmons de surface ("Surface Plasmon Resonance" - SPR).

Méthodes qui utilisent la fluorescence
- Le transfert d'énergie par résonance de fluorescence ("Fluorescence resonance energy transfer" - FRET) : transfert d'énergie sans émission de lumière résultant d'une interaction entre deux molécules (donneur et accepteur d'énergie respectivement).
- La spectroscopie de corrélation de fluorescence ("Fluorescence Correlation Spectroscopy" - FCS).

Méthodes d'interférométrie
- L'interférométrie de biocouches ("Bio-Layer Interferometry" - BLI) : technique optique sans marquage fluorescent qui analyse le profil d'interférence de la lumière blanche réfléchie par 2 surfaces. Ce profil permet de déterminer des valeurs de constantes de vitesse et d'autres données cinétiques.
- L'interférométrie par double polarisation ("Dual Polarisation Interferometry" - DPI) : elle permet d'obtenir des mesures très précises de la taille, de la densité et de la masse des molécules. Lumière d'un faisceau laser.

e. Méthodes bioinformatiques

La fouille de données bibliographiques ("Text mining"), les expressions régulières, l'analyse du langage naturel.

La compaction / l'empilement / les contacts protéine-protéine ("protein - protein docking") sont analysés par des méthodes bioinformatique de prédiction des interactions protéine-protéine basées sur :
- Les données de structure tridimensionnelle (contraintes stériques, chimiques, géomètriques, ...).
- Le principe de co-évolution des résidus d'acides aminés des chaînes polypeptidiques.
- La stabilité optimale des molécules (minimisation d'énergie).

L'avènement des algorithmes d'apprentissage profond et des méthodes d'apprentissage s'appuyant sur le langage naturel et des corpus de connaissances gigantesques révolutionnent la découverte d'interactions entre biomolécules et accélèrent ces découvertes.

5. Quelques méthodes de pointe pour analyser les interactions protéine-protéine

a. La méthode ascorbate peroxidase (APEX)

La plupart des protéines sont localisées au sein d'organites entourés de membrane(s). Cette localisation subcellulaire des protéines est un élément clé de leur spécificité de fonction(s).

Une méthode de marquage par la biotine, basée sur l'ascorbate peroxidase (APEX) modifiée par ingénierie ("engineered ascorbate peroxidase (APEX)-based proteins proximity labeling") permet de localiser et d'identifier des protéines situées à proximité les unes des autres dans la cellule, et donc d'identifier leurs interactions.

L'ascorbate peroxidase (APX1 - E.C. 1.11.1.11) est une oxydoréductase qui catalyse la réaction : L-ascorbate + H₂O₂ <=> déshydro-ascorbate + 2 H₂O

L'APEX est un monomère d'environ 28 kDa sans pont disulfure ni site de fixation du calcium.

α. Principe de la méthode

L'APEX est active dans tous les compartiments cellulaires.

En présence de peroxyde d'hydrogène (H₂O₂), l'APEX modifiée oxyde la biotine-phénol en radical libre biotine-phénoxyl de demi-vie courte (< 1 à 2,5 ms).
Du fait de sa haute réactivité, ce radical se fixe de manière covalente à certains résidus d'acides aminés riches en électrons (W, Y, H et C).

Cette réaction permet de biotinyler les protéines adjacentes (dans une sphère de rayon ≈ 20 nm) à l'APEX exprimée localement.

Les cellules sont ensuite lysées et les protéines biotinylées sont récupérées avec des billes sur lesquelles est fixée la streptavidine (chromatographie d'affinité).
La liaison [biotine - streptavidine 1:1] est caractérisée par une constante de dissociation K_D ≈ 10^-15 M (ou K_A ≈ 10¹⁵ M^-1) : c'est l'une des interactions biologiques les plus fortes connues.

Les protéines sont ensuite éluées, séparées sur gel et identifiées par spectromètrie de masse.

interaction proteine interactomique interactomics proteome matrice mitochondriale inner outer matrix mitochondria biotin biochimej

Source : Rhee et al. (2013) - B = biotine

Remarque : l'APEX a une sensibilité limitée qui exclut les applications nécessitant un faible taux d'APEX : pour cette raison, une enzyme appelée APEX2 a été développée par ingéniérie et elle a une activité plus importante dans les cellules.

β. Illustration de l'identification d'interactions entre protéines avec l'APEX

Une étude a utilisé un marquage spécifique des protéines de la matrice de la mitochondrie par la biotine dans des cellules vivantes : l'ensemble des membranes et des complexes protéiques étaient donc intacts et ainsi les relations spatiales (les interactions) entre les protéines ont été préservées.

L'APEX utilisée dans cette étude est spécifiquement adressée à la matrice mitochondriale par fusion à un peptide d'adressage de 24 acides aminés.

Une fois dans la matrice mitochondriale, l'APEX marque par biotinylation (liaison covalente) les protéines voisines (dans une sphère d'un certain rayon) dans les cellules vivantes.

Les radicaux phénoxyl générés par l'APEX ont une propriété capitale : ils ne traversent pas la membrane mitochondriale. Ils ne marquent donc que les protéines de la matrice mitochondriale ou les régions exposées vers la matrice des protéines de la membrane interne.

Cette étude a permis :

D'identifier 495 protéines de la matrice mitochondriale dont 464 étaient déjà annotées "mitochondrie". Ainsi 31 protéines qui n'étaient pas annotées sont désormais associées à la mitochondrie ou à la matrice mitochondriale.

D'améliorer l'annotation de 240 protéines en spécifiant leur localisation sub-mitochondriale matricielle.

D'associer à la matrice mitochondriale 6 protéines dont on pensait qu'elles étaient localisées dans la membrane externe ou dans l'espace intermembranaire.

interaction proteine interactomique interactomics proteome matrice mitochondriale inner outer matrix mitochondria biotin biochimej

Source : Rhee et al. (2013)

b. La fluorescence par complémentation bimoléculaire (BiFC)

Une protéine de fusion est une combinaison de différentes protéines ou régions de protéines.

Elle est synthétisée par une construction d'ADN contenant les cadres de lecture ouverts ("Open Reading Frame" ou ORF) codant les protéines ou régions de protéines concernées.

Les protéines de fusion servent notamment à localiser des protéines dans la cellule (et/ou ou dans les compartiments sub-cellulaires) en utilisant la protéine étudiée fusionnée à une protéine fluorescente afin de les visualiser avec une technique de microscopie adaptée.
La localisation des protéines est capitale pour en décrypter le rôle et les partenaires.

α. Principe de la méthode

La fluorescence par complémentation bimoléculaire ("Bimolecular fluorescence complementation" - BiFC) permet de visualiser une interaction protéine-protéine dans les cellules sans traitement particulier de ces cellules.

La technique BiFC est basée sur la complémentation de fragments d'une protéine fluorescente in vivo (par exemple, les fragments N- et C-terminaux de la "Green Fluoresent Protein" - GFP).

La protéine fluorescente rapporteur est tronquée puis fusionnée aux 2 protéines dont on veut étudier l'interaction: si celles-ci interagissent, les fragments complémentaires de la protéine fluorescente se replient et s'assemblent, régénèrant ainsi sa fluorescence.

L'intensité de la fluorescence émise est proportionnelle à la force de l'interaction.

β. Illustration

Figure A ci-dessous : Structure tridimensionnelle de la protéine fluorescente jaune Venus ("Venus yellow fluorescent protein" (PDB 1MYW). Deux sites de protéolyse (brins β 7 & 8 et brins β 8 & 9, indiqués par des ciseaux) sont utilisés pour le test de complémentation BiFC.

Figure B : Topologie du repliement de la protéine fluorescente (brins β en vert et hélices α en orange).
- Les deux points noirs indiquent les 2 sites de protéolyse.
- La flèche noire indique un autre site de protéolyse entre les brins β 10 & 11.
- L'étoile indique la position du chromophore.

interaction proteine interactomique interactomics complementation bimoleculaire BiFC biochimej

Source : Kodama & Hu (2012)

Figure C : complémentation BiFC
- La structure de gauche représente le fragment N-terminal de la protéine fluorescente (le chromophore est en jaune) fusionné à l'hélice α du domaine bZIP de bJun.
- La structure au centre représente le fragment C-terminal fusionné à à l'hélice α du domaine bZIP de bFos.
- La structure de droite montre la protéine fluorescente reconstituée qui fluoresce après formation du complexe des 2 protéines en interaction (dimère bJun/bFos).

Voir un vecteur d'expression pour l'obtention d'une protéine de fusion avec le fragment C-terminal de la protéine fluorescente jaune Venus.

Diverses variantes de la méthode BiFC ont été développées :

La colocalisation de différentes paires d'interaction protéine-proéine ("co-localization BiFC" - coBiFC).
L'étude de la compétition de formation de deux complexes protéiques (mcBiFC).
L'étude de la formation de complexes protéiques ternaires (mesure du BRET ou BiFC basé sur le FRET).
L'étude de la formation de complexes protéiques quaternaires en combinant BiFC et BiLC ("Bioluminiscence complementation" avec la luciférase).

c. Alternatives au marquage fluorescent par de grosses protéines de fusion

Diverses stratégies sont développées pour marquer les protéines d'intérêt ("Protein Of Interest" - POI) dans les cellules vivantes.

Elles ont pour but d'accroître l'efficacité du marquage, de minimiser (voire abolir) l'incidence de la taille de la molécule fluorescente ajoutée et, dans certains cas, coder génétiquement l'incorporation d'acides aminés non naturel réactifs dans la séquence d'une protéine d'intérêt.

α. Fixation de petits colorants organiques fluorescents

Ils sont 20 fois plus petits (environ 0,5 à 2 kDa) donc moins encombrants que la protéine fluorescente verte (environ 25 kDa).
Avec des propriétés photophysiques supérieures, notamment une fluorescence accrue.
Avec des spectres d'absorption plus larges que les protéines fluorescentes.

Exemple : le petit ligand FlAsH ("Fluoroscein Arsenical Hairpin", < 700 Da) composé d'une molécule de fluorescéine et de 2 atomes d'arsenic (As).

Le motif tétracystéine CCXXCC peut être fusionné à l'extrémité N- ou C-terminale d'une protéine d'intérêt ou à des structures en hélice α.
Ce motif est rare dans les protéines car la séquence peptidique doit adopter le plus souvent une conformation en hélice α afin que les groupes thiols forment 2 paires se liant aux atomes d'arsenic du ligand.

interaction proteine interactomique interactomics omics omique protein enzyme binding site fixation ligand constante equilibre equilibrium emission fluorescence

Source : de Luis et al. (2025)

Les membranes sont perméables au ligand FlAsH ce qui le rend adapté à l'imagerie en temps réel.
La petite taille du motif CCXXCC permet d'ajouter plusieurs molécules de FlAsH à la protéine d'intérêt, augmentant ainsi l'intensité de fluorescence.

β. Etiquettes peptidiques pour remplacer les protéines fluorescentes volumineuses

De manière équivalente aux protéines fluorescentes de fusion codées génétiquement, ces étiquettes nécessitent la biosynthèse de chaînes polypeptidiques de fusion qui, du fait de leur taille, peuvent altérer la fonction de la protéine d'intérêt.

Ces étiquettes peptidiques sont utilisées dans des applications FRET.

Étiquette Halo

HaloTag est une étiquette de 297 résidus d'acides aminés pouvant être fusionnée à l'extrémité N- ou C-terminale d'une protéine d'intérêt.
Elle est dérivée de l'haloalcane déshalogénase bactérienne, une enzyme qui clive les liaisons carbone-halogène des haloalcanes.
Dans l'étiquette Halo-tag, une histidine du site actif de l'enzyme bactérienne d'origine est remplacée par une phénylalanine catalytiquement inactive.

Étiquette SNAP

SNAP-tag (dérivée de l'O6-alkylguanine ADN alkyltransférase de l'homme est une étiquette de 182 résidus d'acides aminés pouvant être fusionnée à l'extrémité N- ou C-terminale d'une protéine d'intérêt notamment dans les mitochondries, le noyau et le réticulum endoplasmique.
L'O6-benzylguanine (BG) est le ligand privilégié de l'étiquette SNAP-tag : BG est non toxique et peut être modifiée par des fluorophores et est donc adaptée à la détection de protéines in vivo.

Étiquette CLIP

CLIP-tag est une étiquette dérivée de SNAP-tag (aux propriétés similaires) avec 8 résidus d'acides aminés mutés. Elle se lie à la O6-benzylcytosine.
La haute spécificité de ces deux étiquettes pour leurs ligands respectifs permet leur utilisation simultanée dans des cellules vivantes pour marquer plusieurs protéines d'intérêt avec une faible réactivité croisée.

interaction proteine interactomique interactomics omics omique protein enzyme binding site fixation ligand halotag snaptag avitag faptag emission fluorescence

Source : de Luis et al. (2025)

Étiquette Avi

AviTag est une étiquette de 15 résidus d'acides aminés généralement fixée à l'extrémité N- ou C-terminale d'une protéine d'intérêt mais elle peut également être intégrée dans des boucles.
L'enzyme "Bifunctional ligase/repressor BirA" de E. coli biotinyle AviTag en facilitant la formation d'une liaison amide entre une molécule de biotine et une lysine de cette étiquette.
Une molécule de streptavidine modifiée par un fluorophore est ajoutée : elle se lie très fortement à la biotine et permet ainsi de visualiser la protéine d'intérêt avec l'AviTag.

Étiquette FAP

Les étiquettes protéiques activant les fluorogènes ("Fluorogen-Activating Protein tag" - FAP-tag) sont des étiquettes de 200 résidus d'acides aminés dérivées de scFv humains ("human single-chain antibodies").
Différents variants de scFv ont une affinité pour divers fluorophores tels que le vert malachite, l'orange thiazole et le rouge diméthylindole :
- Ces fluorophores ont un faible niveau de fluorescence quand ils sont non liés à une étiquette FAP.
- En revanche, une fois liés, ils peuvent être excités et émettre une fluorescence à leur longueur d'onde respective.

γ. Acides aminés non naturels, chimie "click" et chimie "bio-orthogonale"

Le marquage site-spécifique par des acides aminés non naturels (AANN) appelés aussi non canoniques ("Unnatural or non-canonical Amino Acid" - UAA).

La chimie dite "click".

La chimie dite "bio-orthogonale" : elle introduit des groupements chimiques réactifs qui, bien que n'existant pas dans la nature, ne réagissent pas avec les molécules biologiques des cellules.

Prix Nobel de Chimie 2022 "for the development of click chemistry and bioorthogonal chemistry".

Leur réactivité extrêmement élevée et leur compatibilité avec les cellules vivantes rend ces méthodes idéales pour le marquage rapide, spécifique et efficace des molécules biologiques.

Pour accroître ces avantages dans les cellules, on incorpore aux protéines d'intérêt des AANN "cliquables" portant des groupements réactifs dans leurs chaînes latérales.

Exemples de réactions qui ajoutent des groupements réactifs aux AANN "cliquables" :

La cycloaddition de Diels-Alder entre un alcène/alcyne contraint et une tétrazine.
La cycloaddition 1,3-dipolaire entre les azides et les cyclo-octynes (également appelée "chimie click sans cuivre" - "copper-free click chemistry") et entre les nitrones et les cyclo-octynes.
La formation d'oximes/hydrazones à partir d'aldéhydes et de cétones.
La ligation de quadricyclane.
La réaction click à base d'isocyanure.

δ. Codage génétique de l'incorporation d'AANN réactifs par expansion du code génétique

Le développement par ingénierie des protéines de paires [ARNt / aminoacyl-ARNt synthétase modifiée] orthogonales et la modification de l'expression d'un codon STOP dirigent l'incorporation co-traductionnelle et site-spécifique d'AANN réactifs dans la séquence d'une protéine d'intérêt.

Voir des exemples de paires [ARNt / aminoacyl-ARNt synthétase modifiée] orthogonales.

Exemple de l'incorporation de la pyrrolysine

Les systèmes qui s'appuient sur la modification de l'expression du codon STOP ambre (UAG) permettent d'incorporer une pyrrolysine grâce :

A l'ARNt^Pyl, suppresseur naturel du codon STOP ambre (UAG) spécifique de la pyrrolysine (Pyl).
A la pyrrolysine aminoacyl-ARNt synthétase apparentée dont le site de liaison est modifié pour accueillir les chaînes latérales des AANN réactifs.

La pyrrolysine (Pyl) est donc intégrée dans une séquence peptidique : ARNt^Pyl + L-pyrrolysine + ATP -> L-pyrrolysyl-ARNt^Pyl + AMP + diphosphate

La pyrrolysine (dérivé N-acylé de la lysine) est le 22e acide aminé protéinogène naturel, présent uniquement dans les protéines de certaines archées et bactéries anaérobies (par exemple, Methanosarcina barkeri et Methanosarcina mazei).
Voir un développement sur la pyrrolysine aminoacyl-ARNt synthétase.
La sélénocystéine (Sec) est le 21e acide aminé protéinogène naturel, codé par le codon STOP opale (TGA).

ε. Illustration de ces systèmes

Des cellules sont transfectées avec :

Un plasmide contenant la séquence codant l'aminoacyl-ARNt synthétase.
Un plasmide contenant la séquence codant la protéine d'intérêt (POI) avec le codon STOP inséré.
L'AANN portant un groupe trans-cyclooctene (TCO) dans cet exemple.

L'AANN réactif est ainsi incorporé dans la séquence de la protéine d'intérêt.

interaction proteine interactomique interactomics omics omique protein enzyme binding site fixation ligand halotag snaptag avitag faptag emission fluorescence

Source : Laxman et al. (2021)

Puis une petite molécule fluorescente (portant un groupe tétrazine dans l'exemple) est ajouté à l'AANN incorporé par une réaction chimique "click".

La protéine possède dès lors des propriétés de fluorescence qui permettent de la localiser, d'en étudier les interactions protéine-protéine et d'autres processus.

d. Le phénomène de résonance de plasmons de surface (SPR)

α. Les plasmons de surface

Les plasmons sont des oscillations collectives d'électrons libres, qui existent dans la masse ou à la surface d'un métal ou au voisinage de nanoparticules : les plasmons peuvent ainsi être classés en plasmons de masse, plasmons de surface et plasmons de surface localisée (nanoparticules).

La résonance de plasmons de surface ("Surface Plasmon Resonance" - SPR) se produit :

Quand les électrons d'une couche mince d'un métal (exemples : l'or, l'argent, ...) sont excités par une lumière dirigée vers ce métal avec un angle d'incidence spécifique;
puis quand ces électrons se déplacent (des deux côtés de l'interface) parallèlement à cette couche.

$Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR electron onde angle refraction biochimej$

Source : Wikipédia

L'angle d'incidence qui déclenche le phénomène SPR est lié à l'indice de réfraction du matériau.
Toute variation de cet indice de réfraction permet ainsi d'observer ou non le phénomène SPR.

Exemple de système très utilisée en biologie : le système BIACORE®.

β. Principe de la SPR appliquée aux molécules biologiques

La SPR est donc une méthode optique qui mesure l'indice de réfraction à la surface d'un biocapteur.

La SPR utilise la réflexion de la lumière à l'interface [surface métalique - milieu biologique] pour générer une onde qui s'étend sur une courte distance (jusqu'à 300 nm) dans le milieu biologique.
Cette technique n'utilise aucun marquage (technique sans étiquette).

Une protéine est immobilisée sur une surface métallique (le biocapteur) et une solution du ligand est injectée sur cette surface.

La fixation du ligand modifie l'indice de réfraction de la surface du biocapteur en raison de la variation de masse lors de la formation du complexe [protéine immobilisée - ligand] : cela se traduit par une augmentation du signal exprimé en unité de résonance ou de réponse ("Resonance or response Unit" - RU).
A l'inverse, la dissociation du complexe entraîne une diminution de la valeur RU.
Le sensorgramme enregistré décrit la cinétique d'association (constante de vitesse k_on) et la cinétique de dissociation (constante de vitesse k_off) en temps réel.

La SPR nécessite une concentration très faible de matériau (de l'ordre du nM) mais implique l'immobilisation de l'un des partenaires de liaison.

[Remarque quant à la terminologie : dans de nombreuses publications et figures, le ligand est dénommé "analyte" et la protéine qui le fixe est dénommée "ligand".]

γ. Description du système physique de la SPR

La surface est un mince film d'or sur un support en verre qui forme le fond d'une cellule d'analyse de très petit volume (moins de 100 nl) à travers laquelle une solution aqueuse contenant le ligand (le milieu biologique) passe en continu ("flow-cell").

La lumière polarisée monochromatique provenant d'une source laser est dirigée à travers un prisme vers la surface inférieure du film d'or où des plasmons de surface sont générés uniquement sous un angle critique de cette lumière incidente.

Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR biochimej

Source : Patching S.G. (2014)

L'angle critique dépend de l'indice de réfraction du milieu : cet angle critique est donc modifié quand les molécules de ligand se fixent aux molécules de protéine immobilisées (formation du complexe).
1 RU ("Resonance or response Unit") équivaut à un décalage de l'angle critique de 10^-4 degrés.

Interaction interactome interactomique interactomics plasmon resonance plasmonique surface site fixation liaison molecule SPR biochimej

Source : Patching S.G. (2014)

δ. Interprétation d'un sensorgramme SPR

A t = 0, aucune molécule de protéine immobilisée n'a fixé de molécule de ligand : la valeur RU correspond à un angle critique de départ (a).
Puis le ligand est injecté : quand il se fixe aux molécules de protéine immobilisées, la formation du complexe modifie l'indice de réfraction à la surface de la couche d'or et la valeur RU augmente.
La forme de l'enregistrement appelé sensorgramme permet de mesurer le taux d'association (constante de vitesse k_on).
- A l'équilibre (P + L <=> PL), la valeur RU correspond à un angle critique final différent (b).
- Cette valeur maximale de RU est proportionnelle à la concentration du complexe [protéine immobilisée - ligand].
Quand on arrête d'injecter le ligand, il y a dissociation du complexe : la forme de l'enregistrement permet de mesurer la valeur de la constante de vitesse k_off.
On détermine ainsi la constante de dissociation K_D.
Enfin, la surface est régénérée donc ramenée à l'angle critique initial (a) et on peut effectuer une nouvelle mesure.

Interaction interactome interactomique interactomics PPI plasmon resonance plasmonique surface site fixation liaison molecule SPR angle critique association sensorgramme biochimej

Source : Patching S.G. (2014)

Rappel de l'équilibre de fixation d'un ligand L sur une protéine P

Equilibre fixation proteine ligand binding equilibrium biochimej

La vitesse d'association s'écrit : v_a = k_a . [P].[L] - La vitesse de dissociation s'écrit : v_d = k_d . [PL]

k_a : constante de vitesse microscopique du second ordre (réaction bimoléculaire). Unités : mol^-1.L.s^-1 ou M^-1.s^-1
k_d : constante de vitesse microscopique du premier ordre (réaction monomoléculaire). Unités : s^-1
[L] = concentration du ligand libre; [PL] = concentration du ligand lié.

Quand le système est à l'équilibre, les vitesses d'association et de dissociation sont égales :

enzyme demonstration representation Scatchard constante equilibre fixation site protein ligand binding equilibrium association dissociaton biochimej

K_a = 1 / K_d
K_a et K_d sont des constantes d'équilibre macroscopiques

ε. La réponse optimale R_max (en RU)

Elle traduit la capacité de liaison maximale du ligand par la protéine immobilisée :

R_max = (MM_ligand/MM_protéine) × R_protéine × n_protéine

MM_ligand et MM_protéine sont respectivement la masse molaire du ligand et de la protéine immobilisée.
R_protéine est la réponse mesurée pour la protéine immobilisée.
n_protéine est le nombre de site de fixation du ligand par la protéine immobilisée (compte-tenu de la stoechiométrie de l'association).

SPRD ("Surface Plasmon Resonance Database") : base de données pour optimiser des expériences de SPR.

e. L'interférométrie de biocouches

α. Principe de la méthode

La technique d'interférométrie de biocouches ("Biolayer Interferometry" - BLI) permet de mesurer la cinétique des interactions moléculaires et l'affinité entre biomolécules en analysant le modèle d'interférence de la lumière blanche réfléchie par la pointe d'un biocapteur ("biosensor tip"), fréquemment une fibre optique.

Une protéine est d'abord immobilisée (jusqu'à 10⁹ sites de fixation) sur la pointe (600 µm de diamètre) d'un biocapteur à fibre optique.
- L'immobilisation de la protéine est effectuée par exemple avec le système [biotine - streptavidine] ou par couplage via un groupement amine.
Le ligand circule ensuite dans une solution en contact avec ce biocapteur.

La technique BLI analyse les modèles d'interférence de la lumière réfléchie par 2 couches optiques :

Une couche de référence située à l'intérieur de la pointe ("optical layer" - figure ci-dessous).
Une biocouche située à l'interface [pointe - liquide circulant contenant le ligand].

Au fur et à mesure que le ligand se fixe sur la protéine immobilisée, la biocouche est caractérisée par 2 surfaces distinctes : la protéine immobilisée seule et le complexe [protéine immobilisée - ligand].

Interaction interactome interactomique interactomics PPI interferometre biocouche biolayer interferometry BLI onde lumiere biochimej

Source : 2bind Technologies

Une lumière blanche ("white light") est projetée sur la pointe du biocapteur et elle est réfléchie par la couche de référence et par la biocouche :

Chacune de ces couches génère un modèle de réflexion d'onde qui lui est propre et d'une intensité donnée.
Le décalage de longueur d'onde (Δλ) entre le modèle de réflexion (constant) de la couche de référence et celui (variable) de la biocouche génère un modèle d'interférence.
Δλ traduit l'épaisseur de la biocouche et cette épaisseur traduit le nombre de molécules de ligand fixées sur la protéine immobilisée.

γ. Modèles d'interférence

La technique BLI analyse le modèle d'interférence de la lumière blanche lié au changement de la couche externe de la pointe résultant de la fixation du ligand (ou de sa dissociation) : modèle a -> modèle b dans la figure ci-dessous.

Interaction interactome interactomique interactomics PPI interferometre biocouche biolayer interferometry BLI onde lumiere biochimej

Source : CMI - Harvard

Il en résulte un décalage de longueur d'onde Δλ (nm) du spectre d'interférence mesuré en temps réel ("time").
Δλ positif correspond à une augmentation de l'épaisseur de la biocouche donc à l'association entre molécules.
Δλ négatif correspond à une diminution de l'épaisseur de la biocouche donc à la dissociation des molécules.

Les mesures de ce changement résolues en temps permettent de déterminer les constantes de vitesse d'association et de dissociation (k_on et k_off) du ligand avec/de la protéine immobilisée sur la surface de la pointe.

β. Caractéristiques importantes de la technique BLI

Les molécules de ligand non liées, les variations de l'indice de réfraction du milieu circulant ou son débit n'affectent pas le modèle d'interférence.
La BLI nécessite une concentration de matériau de l'ordre du μM et l'immobilisation de l'un des partenaires de liaison.
Exemple de gamme de concentrations étudiées par BLI: anticorps IgG de l'homme 50 10^-9 g/mL à 2 10^-3 g/mL.
Gamme de valeurs déterminables de constante de dissociation K_D : 10^-3 à 10^-11 M.

δ. Enregistrement des données d'interférométrie de biocouches

La mesure du modèle d'interférence enregistre donc en temps réel (cinétique) les interactions entre molécules.

Les capteurs sont déplacés d'un puits d'une microplaque à un autre pour changer le type de solution :

"Baseline" : La pointe du biocapteur est plongée dans un tampon pour ajuster la ligne de base ("baseline") du signal enregistré.

"Loading" : le premier partenaire d'interaction (par exemple, un anticorps primaire - points rouges) se fixe sur la surface de la pointe du biocapteur.

"Baseline" : L'excès de ligand est éliminé par lavage avec le tampon.

Interaction interactome interactomique interactomics PPI interferometre biocouche biolayer interferometry BLI onde lumiere biochimej

Source : 2bind Molecular interactions

"Association" :
- La pointe du biocapteur chargée est plongée dans une solution contenant le deuxième partenaire d'interaction (par exemple un anticorps secondaire - arcs de cercle bleus).
- Détermination de la constante de vitesse k_on.

"Dissociation" :
- La pointe du biocapteur est plongée dans un tampon pour la dissociation.
- Détermination de la constante de vitesse k_off.

6. Titrage calorimétrique isotherme ("Isothermal Titration Calorimetry" - ITC)

a. Principe de l'ITC

L'ITC est une méthode qui permet de mesurer, en théorie, les valeurs quantitatives des grandeurs thermodynamiques liées à l'interaction entre molécules dans leur état natif.

Elle mesure l'équilibre de fixation en déterminant la chaleur dégagée lors de l'association d'un ligand avec son partenaire.
Les mesures du transfert thermique sont effectuées avec un microcalorimètre qui détecte la différence de température entre une cellule de référence et une cellule contenant l’échantillon.
L’ITC a un temps de réponse de l’ordre de la seconde et une limite de détection de l’ordre du dixième de microcalorie.s^-1.

En une seule expérience :

Les valeurs de la constante de dissociation (K_D), de la stoechiométrie (n) et de l'enthalpie de la réaction de fixation (ΔH_réaction) peuvent être déterminées, en théorie.
L'énergie libre de Gibbs (ΔG) et l'entropie (ΔS) de fixation sont ensuite calculées : ΔG = - R.T Ln(K_D) et ΔG = ΔH - TΔS

L'ITC est une technique assez complexe qui nécessite une concentration de matériau de l'ordre du μM.

b. Fonctionnement du calorimètre

Le calorimètre pour un titrage isotherme est composé de 2 cellules identiques : une cellule de référence ("Reference cell") et une cellule contenant l'échantillon (la protéine par exemple, "Sample cell").

Ces cellules :

Ont le même volume effectif V₀.
Sont thermiquement conductrices et chimiquement inertes (exemple : Hastelloy, alliages de nickel résistant à la corrosion).
Sont entourées d'une enveloppe adiabatique ("Adiabatic shield") : il n'y a pas de transfert thermique entre les cellules et le milieu extérieur.

interactome interactomique interactomics PPI interaction protein titrage calorimetrique isotherme isothermal titration calorimetry ITC calorimetrie isotherme chaleur reaction enthalpie enthalpy adiabatic biochimej

Source : Song et al. (2015)

Une seringue ("Stirring syringe") est insérée dans la cellule contenant la protéine :

Une série d'injections du ligand dont on veut étudier la fixation est effectuée.
Les volumes injectés sont très petits par rapport à V₀ afin de minimiser le plus possible la dilution de la protéine.

A chaque injection, la réaction protéine + ligand <=> [protéine-ligand] se traduit par une variation d'enthalpie (ΔH_réaction) qui s'accompagne d'un dégagement (ou d'une absorption) de chaleur ("heat").

Le circuit [thermopile – thermocouple] du calorimètre mesure la différence de température (ΔT) entre la cellule de référence et la cellule contenant la protéine où a lieu cette réaction.
Le circuit fournit alors la puissance de rétroaction ("Feedback power") nécessaire au maintien de la condition isotherme en augmentant (ou en diminuant) la température de la cellule contenant la protéine.

c. Acquisition des données

Au fur et à mesure que les injections du ligand s'accumulent, le rapport molaire [ligand / protéine] augmente et la protéine est progressivement saturée.

Bien que minime, puisque les volumes injectés sont très petits, on doit cependant tenir compte de la dilution progressive de la protéine.

interactome interactomique interactomics PPI interaction protein injection protein ligand reaction titrage calorimetrique isotherme isothermal titration calorimetry ITC calorimetrie isotherme chaleur enthalpie heat enthalpy biochimej

Source : Paketuryte et al. (2019)

Au fur et à mesure que la protéine est saturée par le ligand, l'amplitude des pics diminue car elle est proportionnelle au nombre de liaisons qui s'établissent.

La chaleur à chaque injection est obtenue en calculant la surface de chaque pic.
La puissance thermique P_therm (µJ.s^-1) consommée (ou libérée) à chaque injection est intégrée par rapport au temps : ΔH_réaction = ∫_t (P_therm . dt)

interactome interactomique interactomics PPI interaction protein peak area power titrage calorimetrique isotherme isothermal titration calorimetry ITC calorimetrie isotherme chaleur enthalpie heat enthalpy biochimej

Source : Paketuryte et al. (2019)

Quand on a un excès de ligand par rapport à la protéine, la limite inférieure de l'amplitude des pics ne reflète plus que la dilution de la protéine et les effets mécaniques lors d'une nième injection : l'isotherme de fixation est une courbe sigmoïde (voir ci-dessous).

Le contenu thermique total dans le volume V₀ de la cellule contenant la protéine est : Q = n.[P]₀.V₀.ΔH_réaction.Θ

n = nombre de site(s) de fixation par monomère de protéine
[P]₀ = concentration initiale de la protéine
Θ = fraction de sites occupés par le ligand
Voir un développement.

d. Grandeurs déterminées à partir de l'isotherme de fixation

Soit l'équilibre de fixation d'un ligand L sur une protéine P contenant n sites de fixation :

          K_d
P + n L <=====> PL_n

On peut déterminer graphiquement les différents paramètres à partir de de l’isotherme de fixation (ci-dessous) :

interactome interactomique interactomics PPI interaction protein isotherme sigmoide titrage calorimetrique isothermal titration calorimetry ITC calorimetrie isotherme chaleur enthalpie heat enthalpy binding site fixation ligand protein biochimej

ΔH_réaction : amplitude de l’isotherme de fixation (ci-dessous)
n : valeur du rapport des concentrations molaires au centre de l’isotherme de fixation.
K_association = 1/K_dissociation : pente de l’isotherme de fixation.

Les valeurs de c et ΔH déterminent les caractéristiques géométriques de l'isotherme de fixation :

La déviation globale de cet isotherme (différence entre le point d'intersection avec l'axe des y et la chaleur observée à forte saturation) est égale à c / (c+1).ΔH.
La pente de cet isotherme pour un rapport molaire = 1 est approximativement égale à (-0,25 c^0,5.ΔH).

7. La photométrie de masse ("Mass photometry")

a. Principe

La photométrie de masse est basée sur les principes de la microscopie à diffusion interférométrique ("interferometric SCATtering microscopy"- iSCAT, Young et al., 2018).

C'est est une technique de plus en plus employée pour l'étude des interactions protéine-protéine, les mécanismes d'oligomérisation des protéines et le stabilité des protéines.

Une biomolécule (cylindre bleu cyan - figure ci-dessous) éclairée par une lumière (jaune) et placée dans un photomètre de masse génère un signal de diffusion de cette lumière (cercle gris sous la biomolécule).
L'intensité du signal est corrélée à la masse de la molécule (tache grise de plus en plus prononcée).

interactome interactomique interactomics PPI interaction protein photometrie mass photometry lumiere reflechie diffusion reflected scattered light contrast biochimejinteractome interactomique interactomics PPI interaction protein photometrie mass photometry lumiere reflechie diffusion reflected scattered light contrast biochimej

Source : REFEYN

Lors d'une mesure de photométrie de masse, une protéine en contact avec une surface de mesure est donc éclairée par un faisceau lumineux ("incident light") dans le photomètre de masse (figure ci-dessous).

interactome interactomique interactomics PPI interaction protein photometrie mass photometry lumiere reflechie diffusion reflected scattered light contrast biochimej

Source : Soltermann et al. (2020)

Une partie de la lumière est réfléchie ("Reflected light ") par la surface de mesure.
Une autre partie de la lumière est diffusée ("Scattered light ") par les molécules en contact avec la surface de mesure.
La photométrie de masse mesure l'interférence entre la lumière réfléchie et la lumière diffusée.

L'intensité du signal d'interférence, appelé contraste de photométrie de masse (ou contraste interférométrique), est proportionnelle à la masse molaire des molécules (actuellement jusqu'à 30 KDa, pour une taille inférieure à 100 nm).

b. Avantages de la photométrie de masse

En utilisant un étalon de masse connue et de la même classe de biomolécules que les échantillons analysés, la photométrie de masse permet de déterminer la masse moléculaire de chaque molécule analysée.

Le résultat est un histogramme montrant la distribution de masse de l'ensemble des molécules de l'échantillon (figure de droite ci-dessus), y compris les populations de faible abondance.
Toutes les espèces moléculaires présentes dans l'échantillon sont ainsi détectées (protéines individuelles, complexes de différentes stœchiométries, agrégats ...).

Avantages

Mesure de la masse molaire réelle (gamme de masses de 30 kDa à 6 MDa) des molécules.
Description de l'hétérogénéité moléculaire.
Mesure de la distribution de masses des molécules qui permet de quantifier la concentration relative des partenaires en interaction.
Mesure de K_D.
Mesures effectuées en solution (eau et une large gamme de tampons).
Nécessite de très faibles volumes (de l'ordre de 10 µL) et de très faibles quantités d'échantillon (de 100pM à 100 nM).
Aucune modification de l'échantillon (aucun étiquetage des molécules étudiées).
Résultats obtenus très rapidement (préparation et mesure en quelques minutes).
Mesures cinétiques permettant l'analyse de la dynamique des molécules :
- étude de la perturbation d'équilibres
- étude de l'[assemblage/désassemblage] de complexes moléculaires
- étude de l'existence d'intermédiaires structuraux transitoires
- étude d'étapes de la formation d'oligomères ...

8. Notion de proximité induite chimiquement "Chemically Induced Proximity"

a. Modélisation des cinétiques de réactions associées aux mécanismes de proximité induite

L'augmentation effective de la concentration en présence d'un inducteur chimique de proximité ("Chemically Induced Proximity" - ICP) sur un site de recrutement peut être décrite en assimilant la dimérisation à une réaction ayant lieu dans un système [réaction-diffusion] (figure A ci-dessous) car les modèles d'équilibre ne peuvent pas décrire des gradients de concentration abrupts.

Lors d'une fixation impliquant un ICP, la molécule A diffuse librement et la molécule B est localisée en un site précis (par exemple, sur la membrane cellulaire, sur la chromatine, …).
L'addition d'une molécule de dimérisation chimique (les hexagones - figures C & D) crée un gradient de concentration du complexe [AB*] avec une concentration maximale au niveau du site de recrutement (figure A).

Interaction interactome interactomique interactomics PPI proximite chimiquement induite dimerisation chemically induced proximity regulation processus cellulaire biochimej

Source : Stanton et al. (2018)
Les complexes [protéine-molécule de dimérisation chimique] sont désignés par le symbole *.

Figures A et B : la variation des concentrations des monomères et des complexes [AB] ou [AB*] dépend du taux de diffusion des molécules et de la vitesse de fixation de la molécule de dimérisation chimique.

Ces 2 paramètres dépendent notamment de la distance au site de recrutement (reportée en abscisse sur les graphiques).

Graphique de gauche : sans dimérisation induite chimiquement ou dans le cas d'une constante de dissociation K_D élevée, la formation des complexes ternaires est déterminée par le taux de diffusion quand la vitesse de fixation de la molécule tend vers zéro.
Graphique au centre : avec une dimérisation induite chimiquement et K_D faible, la formation d'un complexe ternaire [AB*] dépend quasi exclusivement de la vitesse de fixation de la molécule de dimérisation chimique (très supérieure à la vitesse de diffusion).
Graphique de droite : les protéines de fusion sont localisées directement sur le site de recrutement.

Figure C : la minimisation de l'entropie de translation et de rotation sont les principales contributions thermodynamiques à la dimérisation induite chimiquement.

b. Découverte et développement de petites molécules appelées colles moléculaires

Les cibles non "médicamenteuses" ("undruggable targets") désignent des cibles thérapeutiques difficiles à traiter par les approches "traditionnelles".

Elles sont caractérisées, par exemple, par l'absence de poches de liaison à des ligands définis, par des modes d'interaction protéine-protéine non catalytiques ou bien encore par des structures 3D peu ou pas résolues.

Les travaux pionniers de S. Schreiber et collaborateurs ont permis de développer de nombreuses petites molécules permettant l'interactions entre protéines.

De nouvelles technologies pour la découverte de médicaments permettent le développement de petites molécules inspirées de colles moléculaires naturelles ("natural molecular glues" ).
Ces petites molécules de nouvelle génération établissent des interactions avec ces cibles "non médicamenteuses".

Interaction interactome interactomique interactomics PPI proximite chimiquement induite dimerisation chemically induced proximity colle moleculaire biochimej

Source : Cully M. (2025)

Parmi ces colles moléculaires issues de la recherche, on peut citer les médicaments imides immunomodulateurs ("ImmunoModulatory imide Drugs" - IMiDs) tels que la thalidomide (et ses analogues) qui génèrent des complexes ternaires avec la ligase E3 Cereblon qui entraîne la dégradation spécifique des protéines ciblées par le protéasome.

La nature suit le concept de colle moléculaire en utilisant des produits naturels qui génèrent tous des complexes ternaires entre protéines cibles fondamentalement différentes. En voici quelques exemples :
La rapamycine dans le complexe [FKBP12 / rapamycine / FRB]	L'antibiotique macrolide rapamycine forme un complexe avec la protéine cytosolique FKBP12 ("FK506-Binding Protein 12") qui inhibe spécifiquement le complexe TORC1, entraînant un arrêt de la croissance.	Aucune interaction directe entre FKBP12 et FRB ("FKBP12-Rapamycin-Binding domain of FRAP") n'est détectée en absence de rapamycine. [FRAP : "FKBP12-Rapamycin Associated Protein"] La rapamycine seule se lie à FRB avec une affinité modérée (K_dissociation = 26 ± 0,8 μM). Le complexe [FKBP12 / rapamycine] se lie à FRB avec une affinité 2000 fois plus élevée (K_dissociation = 12 ± 0,8 nM).
FK506 dans le complexe [FKBP12 / FK506 / calcineurine].	FK506 est un immunosuppresseur de la cyclosporine A et la calcineurine joue un rôle important dans la virulence fongique et constitue donc une cible antifongique potentielle.
Le produit naturel WDB002 (de la famille FK506 - rapamycine) dans le complexe [FKBP12 / WDB002 / centrosomal protein 250].
Autres exemples La cyclophiline A dans le complexe [cyclophiline A / cyclosporine A / calcineurine]. La sangliéhrine A dans le complexe [cyclophiline A / sangliéhrine A / IMPDH2]. L'antascomicine B dans le complexe [FKBP51 / AntaB / Akt1]. La fusicoccine A dans le complexe [protéine H⁺-ATPase / fusicoccine A / protéines 14-3-3].

c. Exemples de l'implication de la proximité induite chimiquement dans la régulation de processus cellulaires

Voir une application in vivo de l'inducteur de proximité chimique mandipropamide ("Mandi").

L'addition de mandipropamide induit rapidement une proximité entre protéines : les images obtenues par microscopie confocale démontrent une colocalisation du domaine récepteur PYR (marqué par mCherry) et du domaine récepteur ABI cytosolique (marqué par eGFP).
PYR1 & ABI : récepteurs de l'acide abscissique (ABA) de plantes. La pyrabactine est un sulfamide synthétique qui imite l'ABA.

Autres exemples d'utilisation d'inducteurs de proximité chimique pour l'étude de processus biologiques :

L'activation (VP16) et la répression (KRAB ou HP1) de la transcription.
Certaines cascades de signalisation (apoptose, ...).
La dynamique structurale de la chromatine :
- Induction rapide d'états activés par le recrutement de complexes de remodelage dépendants de l'ATP.
- Induction d'états répressifs par la formation d'hétérochromatine médiée par HP1.
La dégradation des protéines par les systèmes protéasome : recrutement médié par des molécules bifonctionnelles du complexe ubiquitine-ligase E3.
La localisation sub-cellulaire de certaines protéines (import-export de protéines du noyau, des vésicules synaptiques et des mitochondries.

9. La prédiction des interactions protéine-protéine par apprentissage profond

a. Description des méthodes et des outils informatiques nécessaires

Ces méthodes de prédiction sont exclusivement informatiques avec l'utilisation de langages spécifiques du domaine de l'intelligence artificielle. Notamment :

PyTorch : bibliothèque logicielle Python d'apprentissage machine (Google).
TensorFlow : outil d'apprentissage automatique (Meta).

Leurs outils d'apprentissage sont, en particulier, des modèles de langage pré-entraînés pour le traitement du langage naturel ("Natural Language Processing"). Par exemple :

La famille des transformateurs génératifs pré-entraînés ("Generative Pre-trained Transformer" - GPT).
Les représentations d'encodeurs bidirectionnels à partir de transformateurs ("Bidirectional Encoder Representations from Transformers" - BERT).
Le grand modèle de langage basé sur un transformateur ("BigScience Large Open-science Open-access Multilingual Language Model" - BLOOM).
Voir une liste de de grands modèles de langage ("Large Language Models" - LLM).

Ces méthodes s'appuient sur des modèles mathématiques sophistiqués.

Enfin, ces méthodes utilisent des jeux d'entraînement gigantesques (de tailles exponentiellement croissantes) puisés :

Dans les bases de données de séquences en acides aminés (exemple : Uniprot) et de structures des protéines, complété par des annotations issues de l'ontologie.
Dans les immenses corpus de connaissances tels que les pages de Wikipedia, les scripts de GitHub, les milliards de phrases de centaines de milliers de livres (exemple : BookCorpus), ...

Les informations structurales et fonctionnelles des protéines au sein des séquences d'acides aminés sont ainsi apprises automatiquement par des modèles d'apprentissage profond.

Interaction interactome interactomique interactomics PPI apprentissage profond deep learning supervised training algorithm model language reseau biochimej

Source : Unsal et al. (2022)

Ilustration de l'utilisation de grands modèles de langage ("Large Language Models" - LLM)

Requêtes (traduites) dans les invites pour GPT-3 (API), GPT-3.5 (ChatGPT) et GPT-4 (ChatGPT) :

"Recherchez toutes les interactions protéine-protéine possibles à partir des phrases données et fournissez le résultat sous forme de tableau avec les colonnes "ID de phrase | Protéine 1 | Protéine 2 | Interaction protéine-protéine" pour la paire de protéines en interaction identifiée.
Assurez-vous que chaque ligne contiendra une paire d'interactions protéine-protéine, même si plusieurs paires sont identifiées à partir d'une seule phrase. N'oubliez pas que les protéines et les gènes sont les mêmes choses."
Source : Rehana et al. (2023)

Remarque : la dernière phrase de cette requête est étonnante !

Exemples de méthodes basées sur l'analyse des séquences d'acides aminés pour prédire les interactions protéine-protéine

Exemples d'algorithmes & programmes de prédiction des interactions protéine-protéine

Machine à vecteurs de support avec auto-corrélation ("support vector machine with auto-correlation").
Méthode des k-voisins les plus proches avec description locale ("k-nearest neighbor with local description")
Vecteur de support machine avec autocovariance conventionnelle ou description locale ("support vector machine with conventional auto covariance or local description")
Réseau neuronal profond avec descripteur amphiphile de composition de pseudo-acides aminés ("deep neural network with amphiphilic pseudo amino acid composition descriptor")

Graph-BERT model

S-VGAE ("Signed Variational Graph Auto-Encoder")

DeepPPI

Voir un cours sur l'apprentissage profond (intelligence artificielle).

Voir un cours sur le traitement du langage appliqué aux séquences de protéines.

b. Illustration de la méthode "DeepFE-PPI"

La longueur de toutes les séquences en acides aminés (composées de D résidus différents) est uniformisée à une valeur fixe m :

Chaque séquence est donc représentée par un vecteur de taille [D x m] (cette représenattion vectorielle est appellée "plongement").
Si une séquence a une longueur inférieure à m, la valeur "zéro" est ajouté au vecteur précédent afin que toutes les séquences aient le même formalisme de représentation.
Ces deux vecteurs constituent les données d'entrée du modèle d'apprentissage profond.

Ce modèle est composé de :

2 réseaux de neurones distincts qui extraient les fonctionnalités cachées dans les vecteurs d'entrée.
- Ces deux réseaux sont configurés avec le même nombre de couches et d'unités cachées.
- Le nombre de couches entièrement connectées est fixé à 4 et les unités correspondantes dans chaque couche sont respectivement 2048, 2014, 512 et 128.

1 réseau de neurones commun qui intègre les derniers vecteurs cachés concaténés des deux réseaux précédents via 2 couches cachées entièrement connectées. Ce réseau commun a plusieurs rôles :
- Extraire les fonctionnalités dites de haut niveau.
- Eliminer le bruit et réduire la dimension des données.
- Classer chaque paire de protéines en entrée dans la catégorie "interaction" ou dans la catégorie "pas d'interaction".

Interaction interactome interactomique interactomics PPI apprentissage profond deep learning supervised training algorithm model language reseau neurone biochimej

Source : Yao et al. (2019)

Une couche de sortie qui utilise une fonction d'activation "softmax" pour prédire la probabilité qu'une paire de protéines interagisse ou non.
Une couche de normalisation et une couche d'abandon sont ajoutées à chaque couche entièrement connectée, à l'exception de la couche de sortie.

Les autres caractéristiques de ce modèle d'apprentissage profond sont :

La fonction d'activation "Rectified Linear Unit" (ReLU) est utilisée pour toutes les couches à l'exception de la couche finale.
Pendant la phase d'entraînement, les modèles sont optimisés avec l'algorithme de descente du gradient ("Stochastic Gradient Descent").
Le terme de régularisation L2 est ajouté à la fonction de perte, en ajoutant la somme des carrés de tous les poids du réseau neuronal.

Exemples d'autres ressources de prédiction des interactions protéine - protéine

DeepPPAPred : outil de prédiction d'affinité de liaison pour les protéines basé sur l'apprentissage profond.

DDMut-PPI : serveur Web qui prédit par une méthode d'apprentissage profond les effets de mutations ponctuelles sur les interactions protéine-protéine.

10. Liens Internet et références bibliographiques

Cours en ligne "Protein-protein interactions"

Pathway Figure OCR : extraction d'informations publiées dans la littérature.

Pathway Commons

Ensemble d'articles scientifiques récents utilisant la méthode SPR pour diverses protéines

PPI-MASS: An Interactive Web Server to Identify Protein-Protein Interactions From Mass Spectrometry-Based Proteomics Data

The working principle of isothermal titration calorimetry

SPRD : base de données pour optimiser des expériences de SPR.

Photométrie de masse

Site "Molecular glues tackle undruggable targets"

Smith & Johnson (1988) "Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase" Gene 67, 31 - 40

Fields & Song (1989) "A novel genetic system to detect protein-protein interactions" Nature 340, 245 - 246

Guan & Dixon (1991) "Eukaryotic proteins expressed in Escherichia coli: an improved thrombin cleavage and purification procedure of fusion proteins with glutathione S-transferase" Anal. Biochem. 192, 262 - 267

Spencer et al. (1993) "Controlling signal transduction with synthetic ligands" Science 262, 1019 - 1024

Pierce et al. (1999) "Isothermal titration calorimetry of protein-protein interactions" Methods 19, 213 - 221

Article

Zhu et al. (2001) "Global analysis of protein activities using proteome chips" Science 293, 2101 – 2105

Turnbull et al. (2003) "On the value of c: can low affinity systems be studied by isothermal titration calorimetry ?" J. Am. Chem. Soc. 125, 14859 - 14866

Chatr-aryamontri et al. (2007) "MINT: the Molecular INTeraction database" Nucleic Acids Res. 35, D572 - D574

Article

Reynolds et al. (2012) "Multivalent gold glycoclusters: high affinity molecular recognition by bacterial lectin PA-IL" Chemistry 18, 4264 - 4273

Kodama & Hu (2012) "Bimolecular fluorescence complementation (BiFC): a 5-year update and future perspectives" Biotechniques 53, 285 - 298

Rhee et al. (2013) "Proteomic Mapping of Mitochondria in Living Cells via Spatially-Restricted Enzymatic Tagging" Science 339, 1328 - 1331

Patching S.G. (2014) "Surface plasmon resonance spectroscopy for characterisation of membrane protein-ligand interactions and its potential for drug discovery" Biochim. Biophys. Acta. 1838, 43 - 55

Kohl et al. (2014) "Ultrafast tissue staining with chemical tags" Proc. Natl. Acad. Sci. USA 111, E3805 - E3814

Song et al. (2015) "Choosing a suitable method for the identification of replication origins in microbial genomes" Front. Microbiol. 6, 1049

Mehla et al. (2015) "The yeast two-hybrid system: a tool for mapping protein-protein interactions" Cold Spring Harb. Protoc. (5), 425 - 430

Article

Xing et al. (2016) "Techniques for the analysis of protein-protein interactions in vivo" Plant Physiol. 171, 727 - 758

Fernandes et al. (2016) "Systematic analysis of the gerontome reveals links between aging and age-related diseases" Hum. Mol. Genet. 25, 4804 - 4818

Hu et al. (2017) "Functional Analysis of Human Hub Proteins and Their Interactors Involved in the Intrinsic Disorder-Enriched Interactions" Int. J. Mol. Sci. 18, 2761

Di Silvestre et al. (2018) "Large Scale Proteomic Data and Network-Based Systems Biology Approaches to Explore the Plant World" Proteomes 6, 27

Stanton et al. (2018) "Chemically induced proximity in biology and medicine" Science 359, eaao5902

Article

Ivarsson & Jemth (2019) "Affinity and specificity of motif-based protein-protein interactions" Curr. Opin. Struct. Biol. 54, 26 - 33

Paketuryte et al. (2019) "Inhibitor Binding to Carbonic Anhydrases by Isothermal Titration Calorimetry" dans "Carbonic Anhydrase as Drug Target" pages 79 - 95, Springer

Yao et al. (2019) "An integration of deep learning with feature embedding for protein–protein interaction prediction" PeerJ. 7, e7126

Lee et al. (2019) "Site-specific labeling of proteins using unnatural amino acids" Mol. Cells 42, 386 - 396

Soltermann et al. (2020) "Quantifying Protein–Protein Interactions by Molecular Counting with Mass Photometry" Angew. Chem. Int. Ed. Engl. 59, 10774 - 10779

Article

Chapitre

Article

Soltermann et al. (2021) "Label-free methods for optical in vitro characterization of protein–protein interactions" Phys. Chem. Chem. Phys. 23, 16488 - 16500

Olerinyova et al. (2021) "Mass Photometry of Membrane Proteins" Chem. 7, 224 - 236

Shandell et al. (2021) "Genetic code expansion: a brief history and perspective" Biochemistry 60, 3455 - 3469

Laxman et al. (2021) "The benefits of unnatural amino acid incorporation as protein labels for single molecule localization microscopy" Front. Chem. 9, 641355

Article

Unsal et al. (2022) "Learning functional properties of proteins with language models" Nat. Mach. Intell. 4, 227 - 245

Lee M. (2023) "Recent Advances in Deep Learning for Protein-Protein Interaction Analysis: A Comprehensive Review" Molecules 28, 5169

Rehana et al. (2023) "Evaluation of GPT and BERT-based models on identifying protein-protein interactions in biomedical text" arXiv:2303.17728

Rui et al. (2023) "Protein–protein interfaces in molecular glue-induced ternary complexes : classification, characterization, and prediction" RSC Chem. Biol. 4, 192 - 215

Article

Newcombe et al. (2024) "Stereochemistry in the disorder–order continuum of protein interactions" Nature 636, 762 - 768

Ren et al. (2024) "Comprehensive Review on Bimolecular Fluorescence Complementation and Its Application in Deciphering Protein–Protein Interactions in Cell Signaling Pathways" Biomolecules 14, 859

Zhou et al. (2024) "DDMut-PPI: predicting effects of mutations on protein-protein interactions using graph-based deep learning" Nucleic Acids Res. 52(W1), W207 - W214

Nikam et al. (2024) "DeepPPAPredMut: deep ensemble method for predicting the binding affinity change in protein–protein complexes upon mutation" Bioinformatics 40, btae309

Budiarta et al. (2024) "Site-specific protein labeling strategies for super-resolution microscopy" Curr. Opin. Chem. Biol. 80, 102445

Article

Cully M. (2025) "Natural molecular glues spur next-gen small molecules for 'undruggable' targets" Nat. Biotechnol. 43, 1212 - 1214

Repity et al. (2025) "Nondegradative Synthetic Molecular Glues Enter the Clinic" ChemMedChem 20, e202500048

Chen et al. (2025) "Target sequence-conditioned design of peptide binders using masked language modeling" Nat. Biotechnol. doi: 10.1038/s41587-025-02761-2

de Luis et al. (2025) "Fluorescent labeling of proteins in vitro and in vivo using encoded peptide tags" J. Biol. Chem. 301, 110229

Dakhnevich et al. (2025) "Pyrrolysine aminoacyl-tRNA synthetase as a tool for expanding the genetic code" Int. J. Mol. Sci. 26, 539

Article