Interactions protéine-protéine : interactomique et interactome |
1. Les domaines en omique 2. Présentation de l'interactomique et des interactomes a. Interactions entre molécules biologiques 3. Différents types de bases de données d'interactions moléculaires |
4. Démarche pour la construction de réseaux d'interactions a. Principe 5. Différents types de graphes pour représenter les interactions 6. Quelques ressources pour utiliser CYTOSCAPE 7. Outils d'analyse et de visualisation des réseaux d'interactions 8. Liens Internet et références bibliographiques |
1. Les domaines en omique Il existe de nombreux sous-domaines scientifiques biologiques dont le nom a été créé avec le suffixe "omique". En voici les principaux exemples : génomique - métagénomique - épigénomique - transcriptomique - épitranscriptomique - translatomique - protéomique - métabolomique - interactomique - connectomique - fluxomique - integromique - glycomique - glycoprotéomique - lipidomique - pharmacogénomique, ...
Les figures ci-dessous montrent la répartition des publications (articles) scientifiques dans la base de données bibliographique PubMed qui mentionnent un ou plusieurs domaine(s) en "omique" : Source : Noor et al. (2019)
Tous ces domaines évoluent très rapidement. Ils sont de plus en plus intégrés : on peut émettre l'hypothèse qu'ils se fondront en une discipline générale peut-être gérée par une intelligence artificielle. |
2. Présentation de l'interactomique et des interactomes a. Interactions entre molécules biologiques Les interactions qu'établissent les milliards de molécules au sein d'une cellule et avec l'extérieur sont l'élément clé de tous les processus biologiques, donc du fonctionnement cellulaire, donc de la vie.
|
b. L'interactomique et les interactomes L'interactomique est un domaine en omique assez récent qui s'appuie sur les données :
|
Un interactome est l'ensemble des interactions physiques entre les molécules d'une cellule ou d'un compartiment sub-cellulaire. Exemples :
L’un des paramètres clé des interactions protéines-protéines est l'abondance des protéines qui interagissent : les concentrations des protéines varient selon le type de cellules, le compartiment sub-cellulaire et l’état cellulaire. Les techniques de multi-omiques spatiales appliquées aux cellules individualisées ("single-cell spatial multi-omics approaches") permettent d’établir un panorama complet d’une précision inégalée de la répartition, de l’abondance et du temps de demi-vie des protéines (en particulier), des ARN de divers types et du taux de transcription des gènes (en général). Nombre de PPI estimées de différents interactomes Le mot important est "estimation" car :
Certaines protéines établissent des dizaines de PPI, constituant ainsi des noeuds centraux de réseaux d'interactions ("hub protein") et cette caractéristique est souvent associée à leur taux de désordre intrinsèque (voir Hu et al., 2017). |
Point capital dans la définition d'interactions et d'interactome
Cette distinction est capitale car elle explique :
|
c. Exemples du portail d'interactions protéine-protéine au sein de la levure : Yeast Interactome Browser
L'interactome révèle que la grande majorité des protéines de levure sont hautement connectées : 16 interactants en moyenne par protéine et une distance moyenne minimale entre protéines de 4 interactions. Le couplage des données à l'algorithme d'apprentissage profond pour la prédiction de contacts entre structures 3D des protéines "AlphaFold-Multimer" fournit des informations sur les fonctions de protéines au sein de complexes. Figure ci-dessous : partie de la carte d'interactions au sein de la levure qui indiquent les regroupements ("clusters") par des cercles et la localisation cellulaire par le terme d'ontologie le plus fréquent au sein d'un regroupement. Source : Yeast Interactome Browser |
3. Différents types de bases de données d'interactions moléculaires Il existe trois catégories de bases de données d'interactions moléculaires selon leurs politiques d'acquisition des données :
Figure : Bajpai et al. (2020). Illustration
Quelques bases de données d'interactions protéines-protéines
Autres types de bases de données de PPI
|
4. Démarche pour la construction de réseaux d'interactions La première étape consiste, bien évidemment, à obtenir des données d'interactions entre biomolécules (si possible prouvées / avérées) avec une très large panoplie de méthodes biochimiques, physiques ou bioinformatiques (fouille de données textuelles et autres). Ces données sont regroupées dans des bases de données spécialisées. Exemples :
Ces bases de données permettent d'établir des listes d'identifiants de gènes ou de protéines :
Figure adaptée de : "Network analysis of protein interaction data" - EBI |
Caractéristiques importantes d'un réseau d'interactions |
Les statistiques de topologie du réseau ("network topology statistics") : degré de nœud, distribution des degrés, centralité, coefficient de regroupement, chemins les plus courts, robustesse du réseau à la suppression aléatoire de nœuds uniques. La modularité ("modularity") : identification de sous-réseaux de nœuds interconnectés représentant des molécules physiquement ou fonctionnellement liées, qui fonctionnent de manière coordonnée pour assurer une fonction spécifique. L'analyse de motif ("motif analysis") : identification de petits modèles d'un réseau d'interactions surreprésentés par rapport à une version aléatoire du même réseau. Les éléments de régulation sont souvent composés de tels motifs. Les outils d'alignement et de comparaison de réseaux d'interactions ("network alignment and comparison tools") : ils permettent d'identifient les similitudes entre réseaux. Utiles pour étudier les relations évolutives entre les réseaux protéiques. |
b. Illustration : réseau d'interactions des protéines du SARS-CoV-2 avec des protéines de l'homme Les gènes codants 26 des 29 protéines du virus SARS-CoV-2 ont été clonés dans des cellules humaines (cellules épithéliales de rein HEK293T). Les 26 protéines virales ont été synthétisées dans ces cellules et les protéines de l'homme physiquement associées à chacune d'elles ont été identifiées par chromatographie d'affinité couplée à la spectrométrie de masse (AP-MS). Les résultats ont révélé de nombreuses interactions (voir le réseau en ligne) avec des protéines de l'homme impliquées dans un grand nombre de processus cellulaires : protéines de la réplication de l'ADN, régulateurs épigénétiques et régulateurs de l'expression génique, protéines du trafic vésiculaire, protéines de modification des lipides, protéines de traitement et de régulation des ARN, protéines de la machinerie de transport nucléaire, protéines de voies de signalisation de l'immunité innée (voie IFN et voie NF-κB) … Les résultats ont permis d'identifier :
Le criblage d'un sous-ensemble de ces médicaments a identifié des agents antiviraux : des inhibiteurs de la traduction des ARN messagers et des régulateurs des récepteurs Sigma1 et Sigma2. Source : Gordon et al. (2020)
|
5. Différents types de graphes pour représenter les interactions Un interactome peut décrire des dizaines de milliers d'interactions qui forment un réseau biologique généralement représenté par un graphe qui peut être défini comme une paire (V,E) :
Exemple ci-dessous : une partie du réseau d'interactions établies par Dnm1, protéine clé de la fission des mitochondries. Source : STRING α. Graphe unique non orienté ("undirected single graph") Les modèles d'interactions physiques utilisent fréquemment des arêtes non orientées :
Une connexion à tronçons multiples se compose d'au moins 2 tronçons ayant les mêmes extrémités : chaque connexion indique un type d'information différent. Cette caractéristique est importante car, au sein des les réseaux d'interactions protéine-protéine, deux protéines peuvent :
STRING est une base de données PPI construite sur ces 3 types d'interactions entre protéines. β. Graphe orienté ("directed graph") Les techniques expérimentales peuvent se traduire par une "asymétrie" :
Un graphe orienté est défini comme un triplet ordonné G = (V,E,f), où f est une fonction qui associe chaque élément de E à une paire ordonnée de sommets dans V. Les paires ordonnées de sommets sont appelées arêtes orientées ou flèches : une arête E = (i,j) est orientée de i vers j.
δ. Graphique pondéré ("weighted graph") Un graphe pondéré est défini comme un graphe G = (V,E) où V est un ensemble de sommets et E un ensemble d'arêtes entre ces sommets lui associant une fonction de poids (w : E->R, R est l'ensemble des nombres réels). Les graphes pondérés sont les réseaux les plus utilisés en bioinformatique.
γ. Graphe bipartie ("bipartite graph") Un graphe bipartie (ou bigraphe ou réseau à 2 modes) est un graphe non orienté G = (V, E) dans lequel V peut être partitionné en 2 ensembles V1 et V2 tels que (u,v) ∈ E implique soit (u ∈ V1 et v ∈ V2) OU (v ∈ V1 et u ∈ V2) : en d'autres termes, chaque arête (E) relie un sommet de V1 à un sommet de V2. Ce type de graphe est adapté à la représentation des liens [enzyme - réaction] dans les voies métaboliques et à l'annotation sur la base d'une ontologie. |
Figure ci-contre :
|
Source : Pavlopoulos et al. (2011) |
6. Quelques ressources pour utiliser CYTOSCAPE
Publications scientifiques qui ont utilisé Cytoscape : de superbes figures qui illustrent toutes les facettes de représentation des graphes de réseaux d'interactions. |
Quelques éléments concernant le programme Cytoscape | |
Caractéristiques du réseau d'interactions |
|
Types de dispositions ("layout")
Source des images : Cytoscape Tutorials |
L'algorithme pour effectuer la disposition des interactions est choisi dans le menu "Layout -> Settings". La disposition par défaut de Cytoscape est "Prefuse Force-directed Layout".
|
Import des données de réseau ("network data") PPI (ou autres) contenues dans des fichiers ou des bases de données | Import des données de réseau d'interactions dans de très nombreux formats. Par exemple :
|
Import depuis les bases de données | Cytoscape peut importer des données de réseau d'interactions depuis de nombreuses bases de données ("public repositories") :
Automatisation des taches avec des scripts (ligne de commande / CyREST via R / Python / ...). |
7. Outils d'analyse et de visualisation en ligne des réseaux de PPI
Outils en ligne de visualisation des interactomes du SARS-CoV-2 : |
8. Liens Internet et références bibliographiques | |
Cours en ligne "Protein-protein interactions" Pathway Figure OCR : extraction d'informations publiées dans la littérature. Pathway Commons Cytoscape User Manual Figures d'articles scientifiques créées avec Cytoscape |
|
3D SARS-CoV-2-Human Interactome Browser SARS-CoV-2 Interactome 3D |
|
Chatr-aryamontri et al. (2007) "MINT: the Molecular INTeraction database" Nucleic Acids Res. 35, D572 - D574 Pavlopoulos et al. (2011) "Using graph theory to analyze biological networks" BioData Min. 4, 10 Szklarczyk et al. (2011) "The STRING database in 2011: functional interaction networks of proteins, globally integrated and scored" Nucleic Acids Res. 39, D561 - D568 Kerrien et al. (2012) "The IntAct molecular interaction database in 2012" Nucleic Acids Res. 04, D841- D846 |
|
Fernandes et al. (2016) "Systematic analysis of the gerontome reveals links between aging and age-related diseases" Hum. Mol. Genet. 25, 4804 - 4818 Hu et al. (2017) "Functional Analysis of Human Hub Proteins and Their Interactors Involved in the Intrinsic Disorder-Enriched Interactions" Int. J. Mol. Sci. 18, 2761 |
|
Noor et al. (2019) "Biological insights through omics data integration" Curr. Opin. Sys. Biol. 15, 39 - 47 Ivarsson & Jemth (2019) "Affinity and specificity of motif-based protein-protein interactions" Curr. Opin. Struct. Biol. 54, 26 - 33 Gordon et al. (2020) "A SARS-CoV-2 protein interaction map reveals targets for drug repurposing" Nature 583, 459 - 468 Gogl et al. (2020) "Dual Specificity PDZ- and 14-3-3-Binding Motifs: A Structural and Interactomics Study" Structure 28, 747 - 759 Bajpai et al. (2020) "Systematic comparison of the protein-protein interaction databases from a user's perspective" J. Biomed. Inform. 103, 103380 |
|
Karatzas et al. (2022) "The network makeup artist (NORMA-2.0): distinguishing annotated groups in a network using innovative layout strategies" Bioinform. Adv. 2, vbac036 Kim et al. (2023) "A proteome-scale map of the SARS-CoV-2-human contactome" Nat. Biotechnol. 41, 140 - 149 Szklarczyk et al. (2023) "The STRING database in 2023: protein-protein association networks and functional enrichment analyses for any sequenced genome of interest Nucleic Acids Res. 51, D638 - D646 |
|
Kurbatov et al. (2023) "The Knowns and Unknowns in Protein–Metabolite Interactions" Int. J. Mol. Sci. 24, 4155 Teulière et al. (2023) "Interactomics: Dozens of Viruses, Co-evolving With Humans, Including the Influenza A Virus, may Actively Distort Human Aging" Mol. Biol. Evol. 40, msad012 Michaelis et al. (2023) "The social and structural architecture of the yeast protein interactome" Nature 624, 192 - 200 |