Quelques méthodes d'études des interactions protéine-protéine ("Protein-Protein Interaction" - PPI) |
1. La relation structure - fonction des macromolécules biologiques 2. Quantification de l'interaction entre macromolécules biologiques (KA ou KD) 3. Caractéristiques des méthodes pour détecter et prouver les PPI a. Comparaison de diverses méthodes pour l'étude des PPI 4. Quelques méthodes de pointe pour l'analyse des PPI a. La méthode ascorbate peroxidase (APEX) |
5. Titrage calorimétrique isotherme (ITC) a. Principe de l'ITC 6. Notion de proximité induite chimiquement 7. La prédiction des interactions protéine-protéine par apprentissage profond 8. Notions élémentaires de protéomique a. Description générale 9. Liens Internet et références bibliographiques |
1. La relation structure - fonction des macromolécules biologiques a. Les différents types de ligands La molécule qui se fixe sur une autre macromolécule biologique est appelée ligand de manière générique. Un ligand peut être n'importe quel type de molécule biologique :
b. Propriétés physico-chimiques des macromolécules biologiques qui modulent et contrôlent leurs interactions Les interactions physiques entre les molécules d'une cellule ou d'un compartiment sub-cellulaire traduisent, entre autre, l'aptitude structurale de ces molécules à se reconnaître.
Exemples :
|
c. Forces de liaison qui maintiennent la structure des macromolécules Ces forces sont non covalentes ou covalentes (ponts disulfures dans le cas des protéines) et très variées en nombre et du point de vue énergétique. Elles sont intimement liées aux propriétés physico-chimiques des résidus d'acides aminés donc liées aux conditions cellulaires (pH, température, viscosité, pression). Tous ces paramètres sont maintenus relativement constants dans la cellule.
Ces paramètres physico-chimiques contrôlent ces équilibres, donc la flexibilité ou dynamique conformationnelle de toutes les molécules biologiques.
d. La notion d'affinité entre macromolécules biologiques C'est la caractéristique qui traduit la propension, dans un environnement et des conditions cellulaires donnés, de 2 (ou plus) macromolécules biologiques à se reconnaître et à interagir de manière réversible. Outre la complémentarité de structure, le paramètre clé de l'interaction entre molécules est leur concentration respective.
L'affinité de liaison est influencée par les paramètres physico-chimiques qui influencent la structure des macromolécules biologiques qui interagissent :
|
2. Quantification de l'interaction entre macromolécules biologiques (KA ou KD) Toute réaction d'association (inversement de dissociation) entre 2 (ou plus) molécules M1 et M2 peut s'écrire : M1 + M2 <=> M1-M2 Cette réaction d'association est régie par une constante d'association KA (inversement de dissociation KD) quantifiable si on dispose d'une méthode ou d'une technique permettant :
L'équilibre de fixation d'un ligand L sur une protéine P correspond à la réaction : Vitesse d'association : va = ka . [P].[L] - Vitesse de dissociation : vd = kd . [PL]
A l'équilibre, les vitesses sont égales :
Source : Xing et al. (2016) Plus KD est faible, plus l'affinité entre le ligand et la protéine est élevée. Voir un développement important : équilibre de fixation d'un ligand sur une protéine et représentation de Scatchard. |
3. Caractéristiques des méthodes pour détecter et prouver les interactions protéine-protéine a. Comparaison de diverses méthodes pour l'étude des interactions protéine-protéine La figure suivanre compare des méthodes optiques dites "sans marquage" : SPR "Surface Plasmon Resonance", BLI ("Biolayer Interferometry"), commutation dynamique des couches d'ADN ("dynamic switching of DNA layers"), CE, AUC, SEC-MALS, CG-MALS et photométrie de masse.
Source : Soltermann et al. (2021) CG-MALS : "Composition-gradient multi-angle light scattering"; AUC : "Analytical ultracentrifugation" |
b. Critères de choix d'une technique pour mesurer les interactions protéine-protéine Les techniques sans marquage ou sans immobilisation sont employées autant que possible car :
L'aptitude d'une technique à étudier une large gamme de concentrations permet de mesurer une large gamme de valeurs de KD.
Les techniques qui mesurent la cinétique d'atteinte d'un équilibre de fixation entre molécules permettent de déterminer la valeur de KD et celles des constantes de vitesse d'association (ka) et de dissociation (kd). Ces techniques impliquent de quantifier la concentration des molécules non liées et liées (complexe) à différents temps jusqu'à atteindre l'équilibre. Il existe 2 procédures :
Les valeurs de ka) et kd peuvent s'échelonner de quelques millisecondes à des heures : le suivi de la cinétique de réactions avec une sensibilité élevée sur de longues périodes exige une correction permanente des lignes de bases et du bruit expérimental. Les derniers critères de choix, et non les moindres, sont :
|
c. Aperçu des méthodes biologiques (complémentation) & biochimiques
Techniques d'immunoprécipitation
|
d. Aperçu des méthodes physiques
c. Méthodes bioinformatiques
|
4. Quelques méthodes de pointe pour analyser les interactions protéine-protéine a. La méthode ascorbate peroxidase (APEX) Elle utilise un marquage spécifique des protéines de la matrice de la mitochondrie par la biotine, tandis que la cellule est vivante, avec toutes ses membranes et ses complexes protéiques intacts et que les relations spatiales entre les protéines sont préservées. La méthode utilise une enzyme, l'ascorbate peroxidase (APEX), modifiée par ingénierie :
L'APEX est active dans tous les compartiments cellulaires et elle oxyde de nombreux dérivés du phénol en radicaux phénoxyl. Ces radicaux :
Le marquage covalent est fait par l'addition de [biotine (B) - phénol] et de H2O2. Les cellules sont ensuite lysées et les protéines biotinylées sont récupérées avec des billes sur lesquelles est fixée la streptavidine. Les protéines sont ensuite éluées, séparées sur gel et identifiées par spectromètrie de masse. Source : Rhee et al. (2013) Cette étude a permis :
Source : Rhee et al. (2013) L'ascorbate peroxidase (APX1 - E.C. 1.11.1.11) est une oxydoréductase qui catalyse la réaction : L-ascorbate + H2O2 <=> déshydro-ascorbate + 2 H2O L'APEX est un monomère d'environ 28 kDa sans pont disulfure ni site de fixation du calcium. APEX a une sensibilité limitée qui exclut les applications nécessitant un faible taux d'APEX : une enzyme appelée APEX2 a été développée par ingéniérie et elle a une activité plus importante dans les cellules. La liaison [biotine - streptavidine] est caractérisée par une constante de dissociation KD ≈ 10-15 M (ou KA ≈ 1015 M-1) : c'est l'une des interactions biologiques les plus fortes connues. |
b. La fluorescence par complémentation bimoléculaire (BiFC) Une protéine de fusion est une combinaison de différentes protéines ou régions de protéines. Elle est synthétisée par une construction d'ADN contenant les cadres de lecture ouverts ("Open Reading Frame" ou ORF) codant les protéines ou régions de protéines concernées.
La fluorescence par complémentation bimoléculaire ("Bimolecular fluorescence complementation" - BiFC) permet de visualiser une interaction protéine-protéine dans les cellules sans traitement particulier de ces cellules.
Source : Kodama & Hu (2012)
Voir un vecteur d'expression pour l'obtention d'une protéine de fusion avec le fragment C-terminal de la protéine fluorescente jaune Venus. Diverses variantes de la méthode BiFC ont été développées :
|
c. Le phénomène de résonance de plasmons de surface (SPR) α. Les plasmons de surface Les plasmons sont des oscillations collectives d'électrons libres, qui existent dans la masse ou à la surface d'un métal ou au voisinage de nanoparticules : les plasmons peuvent ainsi être classés en plasmons de masse, plasmons de surface et plasmons de surface localisée (nanoparticules). La résonance de plasmons de surface ("Surface Plasmon Resonance" - SPR) se produit :
Source : Wikipédia
|
β. Principe de la SPR appliquée aux molécules biologiques La SPR est donc une méthode optique qui mesure l'indice de réfraction à la surface d'un biocapteur.
Une protéine est immobilisée sur une surface métallique (le biocapteur) et une solution du ligand est injectée sur cette surface.
Exemple de système très utilisée en biologie : le système BIACORE®. [Remarque quant à la terminologie : dans de nombreuses publications et figures, le ligand est dénommé "analyte" et la protéine qui le fixe est dénommée "ligand".] |
γ. Description du système physique de la SPR La surface est un mince film d'or sur un support en verre qui forme le fond d'une cellule d'analyse de très petit volume (moins de 100 nl) à travers laquelle une solution aqueuse contenant le ligand (le milieu biologique) passe en continu ("flow-cell"). La lumière polarisée monochromatique provenant d'une source laser est dirigée à travers un prisme vers la surface inférieure du film d'or où des plasmons de surface sont générés uniquement sous un angle critique de cette lumière incidente. Source : Patching S.G. (2014)
Source : Patching S.G. (2014) |
δ. Interprétation d'un sensorgramme SPR
Source : Patching S.G. (2014) La réponse optimale Rmax (en RU) traduit la capacité de liaison maximale du ligand par la protéine immobilisée : Rmax = (MMligand/MMprotéine) × Rprotéine × nprotéine
SPRD : base de données pour optimiser des expériences de SPR. |
d. L'interférométrie de biocouches La technique d'interférométrie de biocouches ("Biolayer Interferometry" - BLI) permet de mesurer la cinétique des interactions moléculaires et l'affinité entre biomolécules en analysant le modèle d'interférence de la lumière blanche réfléchie par la pointe d'un biocapteur ("biosensor tip"), fréquemment une fibre optique.
Source : Creative Biomart
|
Principe des mesures d'interférométrie de biocouches Les capteurs sont déplacés d'un puits d'une microplaque à un autre pour changer le type de solution : (i) tampon pour ajuster la ligne de base ("baseline") du signal enregistré; (ii) solution d'échantillon de charge ; (iii) solution de ligand (association / constante de vitesse kon); (iv) tampon pour la dissociation (constante de vitesse koff). Source : 2bind Molecular interactions La technique BLI analyse le modèle d'interférence de la lumière blanche réfléchie par 2 couches optiques d'une pointe très petite (600 µM de diamètre) :
Chaque réflexion de la lumière génère des interférences constructives ou destructives qui varient avec la longueur d'onde :
Source : CMI - Harvard
|
5. Titrage calorimétrique isotherme ("Isothermal Titration Calorimetry" - ITC) L'ITC est une méthode qui permet de mesurer, en théorie, les valeurs quantitatives des grandeurs thermodynamiques liées à l'interaction entre molécules dans leur état natif.
En une seule expérience :
|
b. Fonctionnement du calorimètre Le calorimètre pour un titrage isotherme est composé de 2 cellules identiques : une cellule de référence ("Reference cell") et une cellule contenant l'échantillon (la protéine par exemple, "Sample cell"). Ces cellules :
Source : Song et al. (2015) Une seringue ("Stirring syringe") est insérée dans la cellule contenant la protéine :
A chaque injection, la réaction protéine + ligand <=> [protéine-ligand] se traduit par une variation d'enthalpie (ΔHréaction) qui s'accompagne d'un dégagement (ou d'une absorption) de chaleur ("heat").
|
Au fur et à mesure que les injections du ligand s'accumulent, le rapport molaire [ligand / protéine] augmente et la protéine est progressivement saturée. Bien que minime, puisque les volumes injectés sont très petits, on doit cependant tenir compte de la dilution progressive de la protéine. Source : Paketuryte et al. (2019) Au fur et à mesure que la protéine est saturée par le ligand, l'amplitude des pics diminue car elle est proportionnelle au nombre de liaisons qui s'établissent.
Source : Paketuryte et al. (2019) Quand on a un excès de ligand par rapport à la protéine, la limite inférieure de l'amplitude des pics ne reflète plus que la dilution de la protéine et les effets mécaniques lors d'une nième injection : l'isotherme de fixation est une courbe sigmoïde (voir ci-dessous). Le contenu thermique total dans le volume V0 de la cellule contenant la protéine est : Q = n.[P]0.V0.ΔHréaction.Θ
|
6. Notion de proximité induite chimiquement "Chemically Induced Proximity" a. Modélisation des cinétiques de réactions associées aux mécanismes de proximité induite L'augmentation effective de la concentration en pr?sence d'un inducteur chimique de proximité (ICP) sur un site de recrutement peut être décrite en assimilant la dimérisation à une réaction ayant lieu dans un système [réaction-diffusion] (figure A ci-dessous) car les modèles d'équilibre ne peuvent pas décrire des gradients de concentration abrupts.
Source : Stanton et al. (2018) Figures A et B : la variation des concentrations des monomères et des complexes [AB] ou [AB*] dépend du taux de diffusion des molécules et de la vitesse de fixation de la molécule de dimérisation chimique. Ces 2 paramètres dépendent notamment de la distance au site de recrutement (reportée en abscisse sur les graphiques).
Figure C : la minimisation de l'entropie de translation et de rotation sont les principales contributions thermodynamiques à la dimérisation induite chimiquement. b. Exemples de l'implication de la proximité induite chimiquement dans la régulation de processus cellulaires Voir une application in vivo de l'ICP mandipropamide.
Autres exemples d'utilisation d'ICP pour l'étude de processus biologiques :
|
7. La prédiction des interactions protéine-protéine par apprentissage profond a. Description des méthodes et des outils informatiques nécessaires Ces méthodes de prédiction sont exclusivement informatiques avec l'utilisation de langages spécifiques du domaine de l'intelligence artificielle. Notamment :
Leurs outils d'apprentissage sont, en particulier, des modèles de langage pré-entraînés pour le traitement du langage naturel ("Natural Language Processing"). Par exemple :
Ces méthodes s'appuient sur des modèles mathématiques sophistiqués. Enfin, ces méthodes utilisent des jeux d'entraînement gigantesques (de tailles exponentiellement croissantes) puisés :
Les informations structurales et fonctionnelles des protéines au sein des séquences d'acides aminés sont ainsi apprises automatiquement par des modèles d'apprentissage profond. Source : Unsal et al. (2022) Ilustration de l'utilisation de grands modèles de langage ("Large Language Models" - LLM) Requêtes (traduites) dans les invites pour GPT-3 (API), GPT-3.5 (ChatGPT) et GPT-4 (ChatGPT) :
Remarque : la dernière phrase de cette requête est étonnante ! |
Exemples de méthodes basées sur l'analyse des séquences d'acides aminés pour prédire les interactions protéine-protéine | Exemples d'algorithmes & programmes de prédiction des interactions protéine-protéine |
|
|
Voir un cours sur l'apprentissage profond (intelligence artificielle). |
b. Illustration de la méthode "DeepFE-PPI" La longueur de toutes les séquences en acides aminés (composées de D résidus différents) est uniformisée à une valeur fixe m :
Ce modèle est composé de :
Source : Yao et al. (2019) Les autres caractéristiques de ce modèle d'apprentissage profond sont :
|
8. Notions élémentaires de protéomique La protéomique a pour but d'identifier (et de quantifier) l'ensemble des protéines synthétisées ou protéome, à un moment donné et dans des conditions données au sein d'un tissu, d'une cellule ou d'un compartiment cellulaire. Le protéome est extrêmement complexe à plusieurs titres :
La protéomique apporte des réponses auxquelles la transcriptomique ne peut répondre. Les études de protéomique sont de plus en plus spécialisées :
|
Génome et protéome de l'homme | ||
Analyse aboutie du génome de l'homme | 2012 | "The ENCODE Project Consortium" :
20 687 gènes codant des protéines Nature 489, 57-74 (2012) |
Protéome de l'homme | 2014 | Kim et al. (2014) "A draft map of the human proteome" Nature 509, 575-581 Bases de données : Human Proteome Map et ProteomicsDB |
Analyse conjointe du génome et du protéome (5 niveaux d'évidence d'existence des protéines) de l'homme | 2018 - 2020 | 19 823 gènes codant des protéines 20 399 protéines |
Voir la liste des protéomes (en particulier les protéomes de référence) dans la base de données UNIPROT. |
b. Principe de la spectrométrie de masse L'ionisation électronique (souvent appelée impact électronique) et l'ionisation chimique sont les principales méthodes d'ionisation. Dans le cas de l'ionisation électronique, l'échantillon est introduit dans une enceinte sous vide, il y est vaporisé puis soumis au bombardement d'un canon à électrons de grande énergie. Un électron est arraché aux molécules et on obtient une espèce qui est à la fois un cation (ion positif) et un radical libre (nombre impair d'électrons), que l'on appelle ion moléculaire M+. : M + e- (énergie 70 eV) <=> M+. + 2 e- L'énergie du faisceau ionisant fragmente l'ion moléculaire par rupture des liaisons les plus faibles avant les liaisons les plus fortes et donne naissance à des ions positifs de masses plus faibles, qui pourront être fragmentés à nouveau (exemple : spectrométrie de masse dite en tandem - MS/MS). Ces ions sont ensuite accélérés dans un champ électrique et/ou magnétique, puis dirigés entre les pôles d'un aimant selon une trajectoire circulaire qui dépend de leur rapport masse/charge [m/z]. En faisant varier le champ électrique, on fait varier la vitesse des ions moléculaires et on peut les faire ainsi parvenir au détecteur par ordre croissant de rapport [m/z]. Le tri des ions s'effectue :
On obtient un grand nombre de pics, tous de masse inférieure à celle de l'ion moléculaire. Cet ensemble constitue un diagramme de fragmentation. Les groupements fonctionnels possèdent un diagramme de fragmentation qui leur sont propres. Dans un spectre de masse, la hauteur relative des pics indique l'abondance relative des espèces. |
Voir un cours complet sur la protéomique. Voir des travaux dirigés en ligne : "Applications et résultats de la protéomique : exemple de la RuBisCO" |
9. Liens Internet et références bibliographiques | |
Cours en ligne "Protein-protein interactions" Pathway Figure OCR : extraction d'informations publiées dans la littérature. Pathway Commons Ensemble d'articles scientifiques récents utilisant la méthode SPR pour diverses protéines |
|
PPI-MASS: An Interactive Web Server to Identify Protein-Protein Interactions From Mass Spectrometry-Based Proteomics Data The working principle of isothermal titration calorimetry |
|
Smith & Johnson (1988) "Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase" Gene 67, 31 - 40 Fields & Song (1989) "A novel genetic system to detect protein-protein interactions" Nature 340, 245 - 246 Guan & Dixon (1991) "Eukaryotic proteins expressed in Escherichia coli: an improved thrombin cleavage and purification procedure of fusion proteins with glutathione S-transferase" Anal. Biochem. 192, 262 - 267 Pierce et al. (1999) "Isothermal titration calorimetry of protein-protein interactions" Methods 19, 213 - 221 |
|
Zhu et al. (2001) "Global analysis of protein activities using proteome chips" Science 293, 2101 – 2105 Turnbull et al. (2003) "On the value of c: can low affinity systems be studied by isothermal titration calorimetry ?" J. Am. Chem. Soc. 125, 14859 - 14866 Chatr-aryamontri et al. (2007) "MINT: the Molecular INTeraction database" Nucleic Acids Res. 35, D572 - D574 |
|
Reynolds et al. (2012) "Multivalent gold glycoclusters: high affinity molecular recognition by bacterial lectin PA-IL" Chemistry 18, 4264 - 4273 Kodama & Hu (2012) "Bimolecular fluorescence complementation (BiFC): a 5-year update and future perspectives" Biotechniques 53, 285 - 298 Rhee et al. (2013) "Proteomic Mapping of Mitochondria in Living Cells via Spatially-Restricted Enzymatic Tagging" Science 339, 1328 - 1331 Patching S.G. (2014) "Surface plasmon resonance spectroscopy for characterisation of membrane protein-ligand interactions and its potential for drug discovery" Biochim. Biophys. Acta. 1838, 43 - 55 Song et al. (2015) "Choosing a suitable method for the identification of replication origins in microbial genomes" Front. Microbiol. 6, 1049 Mehla et al. (2015) "The yeast two-hybrid system: a tool for mapping protein-protein interactions" Cold Spring Harb. Protoc. (5), 425 - 430 |
|
Xing et al. (2016) "Techniques for the analysis of protein-protein interactions in vivo" Plant Physiol. 171, 727 - 758 Fernandes et al. (2016) "Systematic analysis of the gerontome reveals links between aging and age-related diseases" Hum. Mol. Genet. 25, 4804 - 4818 Hu et al. (2017) "Functional Analysis of Human Hub Proteins and Their Interactors Involved in the Intrinsic Disorder-Enriched Interactions" Int. J. Mol. Sci. 18, 2761 Di Silvestre et al. (2018) "Large Scale Proteomic Data and Network-Based Systems Biology Approaches to Explore the Plant World" Proteomes 6, 27 Stanton et al. (2018) "Chemically induced proximity in biology and medicine" Science 359, eaao5902 |
|
Ivarsson & Jemth (2019) "Affinity and specificity of motif-based protein-protein interactions" Curr. Opin. Struct. Biol. 54, 26 - 33 Paketuryte et al. (2019) "Inhibitor Binding to Carbonic Anhydrases by Isothermal Titration Calorimetry" dans "Carbonic Anhydrase as Drug Target" pages 79 - 95, Springer Yao et al. (2019) "An integration of deep learning with feature embedding for protein–protein interaction prediction" PeerJ. 7, e7126 Soltermann et al. (2021) "Label-free methods for optical in vitro characterization of protein–protein interactions" Phys. Chem. Chem. Phys. 23, 16488 - 16500 Unsal et al. (2022) "Learning functional properties of proteins with language models" Nat. Mach. Intell. 4, 227 - 245 |
|
Lee M. (2023) "Recent Advances in Deep Learning for Protein-Protein Interaction Analysis: A Comprehensive Review" Molecules 28, 5169 Rehana et al. (2023) "Evaluation of GPT and BERT-based models on identifying protein-protein interactions in biomedical text" arXiv:2303.17728 |