| Interactions protéine-protéine : interactomique et interactome |
|
1. Les domaines en omique 2. Présentation de l'interactomique a. Caractéristiques physico-chimiques et biologiques des interactions entre molécules biologiques 3. Présentation des interactomes a. Généralité 4. Différents types de bases de données d'interactions moléculaires |
5. Démarche pour la construction de réseaux d'interactions a. Principe 6. Différents types de graphes pour représenter les interactions 7. Quelques ressources pour utiliser le logiciel CYTOSCAPE 8. Outils d'analyse et de visualisation des réseaux d'interactions 9. Liens Internet et références bibliographiques |
|
1. Les domaines en omique Il existe de nombreux sous-domaines scientifiques biologiques dont le nom a été créé avec le suffixe "omique". En voici les principaux exemples : génomique - métagénomique - épigénomique - transcriptomique - épitranscriptomique - translatomique - protéomique - métabolomique - interactomique - connectomique - fluxomique - integromique - glycomique - glycoprotéomique - lipidomique - pharmacogénomique, ...
Les figures ci-dessous montrent la répartition des publications (articles) scientifiques dans la base de données bibliographique PubMed qui mentionnent un ou plusieurs domaine(s) en "omique" :
Source : Noor et al. (2019)
Tous ces domaines évoluent très rapidement. Ils sont de plus en plus intégrés : on peut émettre l'hypothèse qu'ils se fondront en une discipline générale peut-être gérée par une intelligence artificielle. |
2. Présentation de l'interactomique a. Caractéristiques physico-chimiques et biologiques des interactions entre molécules biologiques Les interactions qu'établissent les milliards de molécules au sein d'une cellule et avec l'extérieur sont l'élément clé de tous les processus biologiques, donc du fonctionnement cellulaire, donc de la vie.
|
|
L'interactomique est un domaine en omique récent qui s'appuie sur les données :
Enfin, les techniques de multi-omiques spatiales appliquées aux cellules individualisées ("single-cell spatial multi-omics approaches") permettent d’établir un panorama dans l'espace d’une précision inégalée de la répartition, de l’abondance et du temps de demi-vie des protéines (en particulier), des ARN de divers types et du taux de transcription des gènes (en général). |
|
3. Présentation des interactomes Un interactome est l'ensemble des interactions physiques entre les molécules d'une cellule ou d'un compartiment sub-cellulaire. Exemples :
L’un des paramètres clé des interactions protéines-protéines est l'abondance et la localisation des protéines qui interagissent : les concentrations des protéines varient selon le type de cellules, le compartiment sub-cellulaire et l’état cellulaire. Un interactome est de taille plus réduite que la somme de toutes les interactions possibles impliquant les protéines concernées. En effet, si un grand nombre de protéines peuvent s'associer de diverses manières avec de multiples partenaires, seul un sous-ensemble de ces interactions ont un rôle biologique. |
b. Types d'interactions protéine-protéine La dynamique d'un interactome est plus complexe que le nombre d'interactions qui le composent. En effet :
|
| Les interactions protéine-protéine obligatoires | Les interactions protéine-protéine non obligatoires |
Elles caractérisent les sous-unités protéiques constitutives d'un complexe (homo-oligomères ou hétéro-oligomères) qui n'adoptent pas une structure stable individuellement. Elles permettent la stabilisation de complexes protéiques impliqués, par exemple, dans les voies de signalisation (ou d'autres processus cellulaires) qui nécessitent une interaction protéine-protéine permanente. |
Elles caractérisent les protomères qui adoptent une structure stable indépendamment les uns des autres. Elles contribuent à la modulation des processus cellulaires (par exemple, la régulation ou la réponse à des stimuli) au cours desquels les protéines interagissent de manière temporaire. |
Exemples :
|
Exemples :
|
| Les interactions protéine-protéine non obligatoires peuvent être classées selon la stabilité du complexe formé. | |
Les interactions non obligatoires permanentes (KD de l'ordre du nM). Exemples :
|
Les interactions non obligatoires transitoires (KD de l'ordre du µM).
Exemples :
|
| Les interactions non obligatoires transitoires sont elles-mêmes classées. | |
Les interactions faibles caractérisées par une affinité de liaison faible et une spécificité élevée. Exemple : les protéines impliquées dans la transduction des signaux. |
Les interactions fortes avec une affinité de liaison élevée et une spécificité élevée. Exemple : les complexes antigène - anticorps. |
| Interactions entre domaines structuraux |
La plupart des protéines sont des assemblages de domaines structuraux (l'unité structurale de base des protéines) selon diverses combinaisons.
|
c. Démarche générale pour l'identification des interactions protéine-protéine et leur représentation (A) Exemples de méthodes biologiques, biophysiques ou associées à la spectromètrie de masse, pour identifier des PPI.
Source : Di Silvestre et al. (2018) (C) Exemple d'un graphe [non orienté / non pondéré] et d'un graphe [orienté / pondéré]. |
Complément des définitions d'interactions et d'interactome
Cette distinction est capitale car elle explique :
Exemples de critères de preuves des PPI
|
Estimation du nombre d'interactions protéine-protéine binaires dans les interactomes Le mot clé est "estimation" car :
Certaines protéines établissent des dizaines de PPI, constituant ainsi des noeuds centraux de réseaux d'interactions ("hub protein") et cette caractéristique est souvent associée à leur taux de désordre intrinsèque (voir Hu et al., 2017). |
d. Exemples du portail d'interactions protéine-protéine au sein de la levure : Yeast Interactome Browser
L'interactome de la levure révèle que la grande majorité des protéines de cet organisme sont hautement connectées : 16 interactants en moyenne par protéine et une distance moyenne minimale entre protéines de 4 interactions. Le couplage des données à l'algorithme d'apprentissage profond pour la prédiction de contacts entre structures 3D des protéines "AlphaFold-Multimer" fournit des informations sur les fonctions de protéines au sein de complexes. Figure ci-dessous : partie de la carte d'interactions au sein de la levure qui indiquent les regroupements ("clusters") par des cercles et la localisation cellulaire par le terme d'ontologie le plus fréquent au sein d'un regroupement.
Source : Yeast Interactome Browser Menu déroulant de la renêtre "Sub-Networks" de l'interface : RSC2 ("Chromatin structure-remodeling complex subunit") :
|
4. Différents types de bases de données d'interactions moléculaires Il existe trois catégories de bases de données d'interactions moléculaires selon leurs politiques d'acquisition des données :
Figure : Bajpai et al. (2020). Illustration
|
Quelques bases de données d'interactions protéines-protéines
Autres types de bases de données de PPI
|
5. Démarche pour la construction de réseaux d'interactions La première étape consiste, bien évidemment, à obtenir des données d'interactions entre biomolécules (si possible prouvées / avérées) avec une très large panoplie de méthodes biochimiques, physiques ou bioinformatiques (fouille de données textuelles et autres). Ces données sont regroupées dans des bases de données spécialisées. Exemples :
Ces bases de données permettent d'établir des listes d'identifiants de gènes ou de protéines :
Figure adaptée de : "Network analysis of protein interaction data" - EBI Illustration d'un graphe orienté : voir la figure 6 - Srivastava et al. (2022) |
b. Quelques caractéristiques importantes d'un réseau d'interactions Les statistiques de topologie du réseau ("network topology statistics") : degré de nœud, distribution des degrés, centralité, coefficient de regroupement, chemins les plus courts, robustesse du réseau à la suppression aléatoire de nœuds uniques. La centralité de degré ("degree centrality") correspond au nombre de liens vers un noeud donné. Dans les réseaux PPI, les noeuds ayant un degré plus élevé sont considérés comme des hubs et sont généralement situés au centre du réseau.
La centralité intermédiaire ("betweenness centrality") mesure la centralité d'un sommet d'un graphe, c'est-à-dire qu'elle permet d'en évaluer l'importance. La centralité de proximité ("closeness centrality") d'un noeud une mesure sa centralité dans un réseau. Plus un noeud est central, plus il est proche de tous les autres noeuds. La modularité ("modularity") : identification de sous-réseaux de nœuds interconnectés représentant des molécules physiquement ou fonctionnellement liées, qui fonctionnent de manière coordonnée pour assurer une fonction spécifique. L'analyse de motif ("motif analysis") : identification de petits modèles d'un réseau d'interactions surreprésentés par rapport à une version aléatoire du même réseau. Les éléments de régulation sont souvent composés de tels motifs. Les outils d'alignement et de comparaison de réseaux d'interactions ("network alignment and comparison tools") permettent d'identifier les similitudes entre réseaux. Ils sont utiles pour étudier les relations évolutives entre les réseaux protéiques. |
c. Illustration : réseau d'interactions des protéines du SARS-CoV-2 avec des protéines de l'homme Les gènes codants 26 des 29 protéines du virus SARS-CoV-2 ont été clonés dans des cellules humaines (cellules épithéliales de rein HEK293T). Les 26 protéines virales ont été synthétisées dans ces cellules et les protéines de l'homme physiquement associées à chacune d'elles ont été identifiées par chromatographie d'affinité couplée à la spectrométrie de masse (voir un développement de l'AP-MS). Les résultats ont révélé de nombreuses interactions (voir le réseau en ligne) avec des protéines de l'homme impliquées dans un grand nombre de processus cellulaires :
Les résultats ont permis d'identifier :
Le criblage d'un sous-ensemble de ces médicaments a identifié des agents antiviraux : des inhibiteurs de la traduction des ARN messagers et des régulateurs des récepteurs Sigma1 et Sigma2.
Source : Gordon et al. (2020) - Losanges rouges : protéine du virus SARS-CoV-2 / Cercles : protéines de l'homme (cercles oranges : cibles de médicaments). Voir un développement de ces notions et des résultats de cette étude. |
6. Différents types de graphes pour représenter les interactions protéine-protéine Un interactome peut décrire des dizaines de milliers d'interactions qui forment un réseau biologique généralement représenté par un graphe qui peut être défini comme une paire (V,E) :
Exemple ci-dessous : une partie du réseau d'interactions établies par Dnm1, protéine clé de la fission des mitochondries.
Source : STRING α. Graphe unique non orienté ("undirected single graph") Les modèles d'interactions physiques utilisent fréquemment des arêtes non orientées :
Une connexion à tronçons multiples se compose d'au moins 2 tronçons ayant les mêmes extrémités : chaque connexion indique un type d'information différent. Cette caractéristique est importante car, au sein des les réseaux d'interactions protéine-protéine, deux protéines peuvent être : (i) liées sur le plan évolutif; (ii) co-citées dans la littérature; (iii) co-exprimées dans certaines expériences.
|
β. Graphe orienté ("directed graph") Les techniques expérimentales peuvent se traduire par une "asymétrie" :
Un graphe orienté est défini comme un triplet ordonné G = (V,E,f), où f est une fonction qui associe chaque élément de E à une paire ordonnée de sommets dans V. Les paires ordonnées de sommets sont appelées arêtes orientées ou flèches : une arête E = (i,j) est orientée de i vers j.
δ. Graphique pondéré ("weighted graph") Un graphe pondéré est défini comme un graphe G = (V,E) où V est un ensemble de sommets et E un ensemble d'arêtes entre ces sommets lui associant une fonction de poids (w : E->R, R est l'ensemble des nombres réels). Les graphes pondérés sont les réseaux les plus utilisés en bioinformatique.
γ. Graphe bipartie ("bipartite graph") Un graphe bipartie (ou bigraphe ou réseau à 2 modes) est un graphe non orienté G = (V, E) dans lequel V peut être partitionné en 2 ensembles V1 et V2 tels que (u,v) ∈ E implique soit (u ∈ V1 et v ∈ V2) OU (v ∈ V1 et u ∈ V2).
|
V est un ensemble de sommets représentant les noeuds. Dans un réseau d'interactions protéine-protéine, les noeuds représentent les protéines. E est un ensemble d'arêtes (ou arcs) représentant les interactions entre les noeuds (protéines). Figure ci-contre :
Source : Pavlopoulos et al. (2011) |
|
7. Quelques ressources pour utiliser le logiciel CYTOSCAPE
Publications scientifiques qui ont utilisé Cytoscape : de superbes figures qui illustrent toutes les facettes de représentation des graphes de réseaux d'interactions. |
| Quelques éléments concernant le logiciel Cytoscape | |
| Caractéristiques du réseau d'interactions |
|
|
Types de dispositions ("layout")
Source des images : Cytoscape Tutorials |
L'algorithme pour effectuer la disposition des interactions est choisi dans le menu "Layout -> Settings". La disposition par défaut de Cytoscape est "Prefuse Force-directed Layout".
|
| Import des données de réseaux ("network data") PPI (ou autres) contenues dans des fichiers ou des bases de données | Import des données de réseau d'interactions dans de très nombreux formats. Par exemple :
|
| Import de réseaux d'interactions depuis les bases de données | En implémentant des applications additionnelles ("apps"), le logiciel Cytoscape peut importer des données de réseaux d'interactions depuis de nombreuses bases de données ("public repositories"). En voici quelques exemples :
Automatisation des taches avec des scripts (ligne de commande / CyREST via R / Python / ...). |
8. Outils d'analyse et de visualisation en ligne des réseaux de PPI
|
| 9. Liens Internet et références bibliographiques | |
Cours en ligne "Protein-protein interactions" Pathway Figure OCR : extraction d'informations publiées dans la littérature. Pathway Commons Cytoscape User Manual Figures d'articles scientifiques créées avec Cytoscape |
|
Human Reference Interactions 3D SARS-CoV-2-Human Interactome Browser |
|
Hart et al. (2006) "How complete are current yeast and human protein-interaction networks ?" Genome Biol. 7, 120 Chatr-aryamontri et al. (2007) "MINT: the Molecular INTeraction database" Nucleic Acids Res. 35, D572 - D574 Venkatesan et al. (2009) "An empirical framework for binary interactome mapping" Nat. Methods 6, 83 - 90 Pavlopoulos et al. (2011) "Using graph theory to analyze biological networks" BioData Min. 4, 10 Szklarczyk et al. (2011) "The STRING database in 2011: functional interaction networks of proteins, globally integrated and scored" Nucleic Acids Res. 39, D561 - D568 Kerrien et al. (2012) "The IntAct molecular interaction database in 2012" Nucleic Acids Res. 04, D841- D846 |
|
|
Fernandes et al. (2016) "Systematic analysis of the gerontome reveals links between aging and age-related diseases" Hum. Mol. Genet. 25, 4804 - 4818 Hu et al. (2017) "Functional Analysis of Human Hub Proteins and Their Interactors Involved in the Intrinsic Disorder-Enriched Interactions" Int. J. Mol. Sci. 18, 2761 |
|
|
Noor et al. (2019) "Biological insights through omics data integration" Curr. Opin. Sys. Biol. 15, 39 - 47 Ivarsson & Jemth (2019) "Affinity and specificity of motif-based protein-protein interactions" Curr. Opin. Struct. Biol. 54, 26 - 33 Gordon et al. (2020) "A SARS-CoV-2 protein interaction map reveals targets for drug repurposing" Nature 583, 459 - 468 Gogl et al. (2020) "Dual Specificity PDZ- and 14-3-3-Binding Motifs: A Structural and Interactomics Study" Structure 28, 747 - 759 Bajpai et al. (2020) "Systematic comparison of the protein-protein interaction databases from a user's perspective" J. Biomed. Inform. 103, 103380 Luck et al. (2020) "A reference map of the human binary protein interactome" Nature 580, 402 - 408 |
|
|
Karatzas et al. (2022) "The network makeup artist (NORMA-2.0): distinguishing annotated groups in a network using innovative layout strategies" Bioinform. Adv. 2, vbac036 Srivastava et al. (2022) "Protein prediction models support widespread post-transcriptional regulation of protein abundance by interacting partners" PLoS Comput. Biol. 18, e1010702 Ghadie & Xia (2022) "Are transient protein-protein interactions more dispensable ?" PLoS Comput. Biol. 18, e1010013 Kim et al. (2023) "A proteome-scale map of the SARS-CoV-2-human contactome" Nat. Biotechnol. 41, 140 - 149 Szklarczyk et al. (2023) "The STRING database in 2023: protein-protein association networks and functional enrichment analyses for any sequenced genome of interest Nucleic Acids Res. 51, D638 - D646 |
|
|
Kurbatov et al. (2023) "The Knowns and Unknowns in Protein–Metabolite Interactions" Int. J. Mol. Sci. 24, 4155 Teulière et al. (2023) "Interactomics: Dozens of Viruses, Co-evolving With Humans, Including the Influenza A Virus, may Actively Distort Human Aging" Mol. Biol. Evol. 40, msad012 Michaelis et al. (2023) "The social and structural architecture of the yeast protein interactome" Nature 624, 192 - 200 Kosoglu et al. (2024) "Structural coverage of the human interactome" Brief. Bioinform. 25, bbad496 Arteaga & Poptsova (2025) "Prediction of protein-protein interactions using point transformer and spherical Convex Hull graphs" Comput. Struct. Biotechnol. J. 31, 82 - 93 |
|