Quelques domaines en "omique" ("omics") |
1. Introduction a. Les domaines en omique 2. La génomique a. Introduction 3. La transcriptomique |
4. La protéomique a. Etapes de la protéomique 5. L'interactomique : les interactions entre les molécules biologiques 6. La métabolomique et les modèles de reconstruction métabolique à l'échelle d'un génome a. Le métabolome et la métabolomique 7. Liens Internet et références bibliographiques |
1. Introduction a. Les domaines en omiques Il existe de nombreux sous-domaines scientifiques biologiques dont le nom a été créé avec le suffixe "omique". En voici les principaux exemples : génomique - métagénomique - épigénomique - transcriptomique - épitranscriptomique - translatomique - protéomique - métabolomique - interactomique - connectomique - fluxomique - integromique - glycomique - glycoprotéomique - lipidomique - pharmacogénomique, ...
Les figures ci-dessous montrent la répartition des publications (articles) scientifiques dans la base de données bibliographique PubMed qui mentionnent un ou plusieurs domaine(s) en "omique" : Source : Noor et al. (2019)
Tous ces domaines évoluent très rapidement. Ils sont de plus en plus en "interaction" : on peu émettre l'hypothèse qu'ils se fondront en une discipline générale peut-être gérée par une intelligence artificielle. |
b. Méthodes omiques multimodales pour l'analyse de cellules individualisées ("single-cell multimodal omics methods"). Les méthodes omiques développées jusqu'en 2010 (environ) ont permis d'analyser :
Cette ségrégation résultait de contraintes méthodologiques et, bien que très riche en informations diverses, elle limitait la description des relations entre les macromolécules biologiques dans des cellules individualisées. Décrire les interactions et les variations inter-individuelles est essentiel pour comprendre l'état cellulaire réel. Les avancées en biologie moléculaire, en microfluidique (figure ci-dessous) et en nanotechnologies ont donné naissance aux méthodes omiques multimodales unicellulaires ("single-cell multimodal omics methods"). Source : Klein et al. (2015) Ces méthodes :
Les méthodes évoluent très rapidement et le nombre de cellules étudiées ne cessent de croître :
Source : Stuart & Satija (2019) |
Quelques méthodes qui caractérisent la lignée cellulaire ("cell lineage") |
|
Quelques méthodes qui caractérisent l'état actuel d'une cellule ("current state of the cell") |
|
Quelques méthodes bioinformatiques qui ordonnent les cellules le long d'une trajectoire pseudotemporelle ("trajectory") |
L'inférence de trajectoire ou l'ordre pseudotemporel est utilisée en transcriptomique de cellules individualisées pour (i) décrire la dynamique d'un processus qui se déroule dans les cellules étudiées, puis (ii) pour classer ces cellules en fonction de leur évolution au cours de ce processus.
|
Exemples d'autres méthodes d'analyse de cellules individualisées |
|
Complément sur les méthodes d'inférence de trajectoires unicellulaires Les données en omique issues de cellules individualisées permettent l'étude de processus cellulaires dynamiques tels que le cycle cellulaire, la différenciation cellulaire et l'activation cellulaire. De tels processus dynamiques peuvent être modélisés par des moyens informatiques avec des méthodes d'inférence de trajectoire (ou analyse pseudotemporelles) qui ordonnent les cellules le long d'une trajectoire en fonction des similitudes de leurs modèles d'expression. Plusieurs dizaines d'outils logiciels bioinformatiques ont été développés pour ces types d'analyse des trajectoires. Les trajectoires résultantes sont le plus souvent linéaires, bifurquantes ou arborescentes. Des méthodes récentes permettent de décrire des trajectoires plus complexes comme les graphes cycliques ou déconnectés. La figure ci-dessous illustre quelques méthodes appliquées à un ensemble de données contenant (a) une trajectoire linéaire de cellules dendritiques de différenciation et (b) une trajectoire bifurquante de fibroblastes reprogrammés. Source : Saelens et al. (2019) |
c. Deux types de molécules support de la bioinformation : les acides nucléiques et les protéines Le "matériau de base" de la génomique, de la transcriptomique et de la protéomique est la séquence : l'enchaînement ordonné et orienté de nucléotides (acides nucléiques) ou d'acides aminés (protéines). |
ADN : Acide DésoxyriboNucléique
On distingue :
|
ARN : Acide RiboNucléiques
On distingue :
|
Protéines
|
d. Un biais à effacer : le manque d'information sur le sexe des individus à l'origine des données Les différences entre sexes en biologie moléculaire, biologie cellulaire et biologie de l'organisme s'accumulent dès la fécondation et influencent largement le développement de l'individu. Historiquement, les individus mâles ont été sur-représentés en recherche animale et humaine en raison de l'inquiétude que la variabilité hormonale des individus femelles ait une influence sur les résultats : le "sexe chromosomique" des lignées cellulaires a été ignoré. Dès lors, sans justification, les résultats de ces études à prédominance masculine ou asexuées ont été supposés s'appliquer de manière équivalente aux deux sexes. L'étude d'ensembles de données fusionnées [femmes - hommes] peut masquer des différences qui ne sont révélées que lorsque chaque sexe est considéré individuellement. Ainsi, lorsque l'on compare des données féminines ou mixtes à celles d'une cohorte masculine, des faux négatifs sont mis en évidence ou les résultats peuvent être interprétés de manière erronée. |
Exemples de bases de données qui n'annotent pas ou peu les termes en fonction du sexe | ||
Base de données | Nombre de termes | Outils bioinformatiques liés à la base de données |
Gene Ontology (GO) | 45000 | DAVID ("Database for Annotation, Visualization and Integrated Discovery"), PANTHER, WebGestalt, ClueGO, g:Profiler |
KEGG | 24000 | DAVID, WebGestalt, ClueGO (plug-in du logiciel Cytoscape), g:Profiler |
Reactome | 21000 | Reactome, PANTHER, WebGestalt, ClueGO, g:Profiler |
WikiPathways | 3000 | WebGestalt ("WEB-based GEne SeT AnaLysis Toolkit") |
PANTHER | 180 | PANTHER, WebGestalt |
Source : Bond et al. (2021) |
2. La génomique a. Introduction On peut considérer que l'ère des domaines en "omique" a commencé avec la génomique. Elle a débuté avec les premiers grands projets de séquençage qui ont utilisé la méthode de Fréderick Sanger : |
|
|
|
Voir les bases de données : | "Genomes OnLine Database" - GOLD |
NCBI - Genome sequencing projects statistics | |
"Phytozome" a tool for green plant comparative genomics. |
Janvier 2022
Des biologistes et des informaticiens prévoient que les ressources informatiques nécessaires pour traiter les données liées aux génomes dépasseront à terme celles nécessaires aux données de Twitter et de YouTube. On estime qu'en 2025, de 100 millions à 2 milliards de génomes humains auront été séquencés. A lui seul, le stockage de ces données pourrait nécessiter 2 à 40 exaoctets (1 exaoctet = 1018 octets) car les données stockées pour un génome sont 30 fois plus grandes que la taille du génome lui-même (données brutes, erreurs, analyse préliminaire, …). Le stockage des données ne sera qu'une petite partie du problème : les besoins pour l'acquisition, la distribution et l'analyse des données de génomique seront bien supérieurs (notion de "big data" et de méthodes d'apprentissage profond). |
Les technologies de séquençage à trés haut débit ("next-generation high-throughput DNA sequencing technologies" - NGS) permettent de séquencer des milliards de nucléotides en une expérience. En conséquence, de plus en plus de génomes sont séquencés ou en cours de séquençage. L'ensemble des données de séquençage est implémenté en temps réel dans des bases de données pour leur analyse. Les NGS permettent d'aborder (liste non-exhaustive) :
|
b. Caractéristiques élémentaires des NGS ("Next-Generation high-throughput DNA Sequencing technologies")
Le séquençage de novo est le séquençage d'un génome pour la première fois. Ce type de séquençage nécessite :
Définitions importantes
Le séquençage complet d'un génome avec les NGS conduit à un nombre colossal de petits fragments séquencés (un grand nombre de petites séquences ou lectures) que l'on essaye ensuite d'assembler en contigs. La qualité de couverture du séquençage et donc liée à celle des contigs (leur longueur et leur continuité) et donc au nombre de gaps. L'un des inconvénients des NGS est la petite taille des fragments séquencés (actuellement) d'où un nombre élevé de gaps, en particulier pour les régions de faible complexité. a. Pour pallier cette difficulté, on peut séquencer les fragments :
b. Un autre moyen est de construire des banques avec des inserts de petites tailles (0,2 - 0,8 kpb) et des banques avec des inserts de grandes tailles (2 - 40 kpb). On obtient ainsi des fragments séquencés de tailles variables ("short-insert paired end reads" et "long-insert paired end reads" ou "mate paired") qui aboutissent à un meilleur assemblage du fait de contigs plus longs. L'acquisition et la compilation d'une masse de données de plus en plus astronomique d'une part et l'analyse des résultats des NGS nécessitent le développement d'outils bioinformatiques de plus en plus spécialisés (exemple : Allpaths-LG propose un assembleur pour grands génomes). |
Voir un cours sur le séquençage des acides nucléiques. |
c. Exemples de technologies de séquençage dites de 3ème génération α. Séquençage avec des nanopores (Minion & PromethION - Oxford Nanopore Technologies) L'ADN est initialement hydrolysé en longs fragments de 8 à 10 kilo paires de bases. Deux adaptateurs différents ("leader" et "hairpin") sont attachés à l'une ou l'autre des extrémités de l'ADN. L'adaptateur "leader" est double-brin. Il contient :
Sans l'adaptateur "leader", les interactions de l'ADN avec le pore dans lequel l'ADN passe (voir ci-dessous) sont minimes, ce qui empêche tout fragment dont la conformation est "hairpin-hairpin" d'être séquencé.
Dans la conformation "leader-hairpin", la séquence "leader" dirige le fragment d'ADN à séquencer au travers d'un pore.
Source : Goodwin et al. (2016)
Quand arrive l'extrémité "hairpin", c'est le brin complémentaire de l'ADN qui continue à être transloqué au travers l'adaptateur du pore : ainsi, les deux brins sont séquencés pour obtenir une séquence consensus dite "lecture 2D". Les dernières avancées Les technologies avec des nanopores sont de plus en plus performantes. En 2018, le séquençage et l'assemblage de novo d'un génome humain se sont appuyés sur un protocole :
La technologie Minion est utilisée de longue date dans la station spatiale internationale ("International Space Station", ISS). Elle a été testée avec succès dans des conditions de gravité comparables à celles qui règnent sur Mars (G = 0,378), sur la lune (G = 0,166) et sur Europa (satellite de Jupiter - G = 0,134). Voir : Carr et al. (2020). Le séquençage en routine du génome humain est devenu possible avec le séquenceur PromethION (Oxford Nanopore Technologies) qui possède 3000 capteurs et 12.000 pores : ils génèrent en moyenne 70 Go de données permettant une couverture 20X du génome humain. Enfin, la précision des logiciel d'appel de base est sensiblement améliorée par des algorithmes basés sur des modèles de Markov cachés ou des réseaux de neurones. |
β. Séquençage d'une molécule en temps réel ("Single-Molecule Real-Time sequencing" - SMRT - Pacific Biosciences).
Source : Goodwin et al. (2016) Cette banque d'ADN est ensuite déposée dans les puits de la cellule SMRT de guide d'ondes en mode zéro (« Zero-Mode Waveguide SMRT cell » - SMRT/ZMW cell), dans lesquelles a lieu le séquençage. Pour visualiser le séquençage, un mélange de nucléotides marqués par des fluorophores est ajouté. Au cours de l'incorporation, le nucléotide incorporé interrompt momentanément l'activité de la polymérase en bas de la ZMW : cette interruption de signal est enregistré par une caméra. Longueur moyenne des lectures ("reads") : 104 paires de base avec des lectures à 6 104. "Zero-Mode Waveguides" (ZMW)
|
La transcriptomique analyse l'ensemble des transcrits ou transcriptome : produits de la transcription des gènes. Les principales méthodes d'étude du transcriptome sont :
Comparaison des puces à ADN et de la technique de séquençage "RNA-seq" a. Les puces à ADN et la technique RNA-seq ont toutes deux une haute reproductibilité de résultats avec des réplicats biologiques. b. Les puces à ADN permettent difficilement de distinguer le cas "pas de transcription" du cas "très faible transcription". c. En raison de la différence de transcription des gènes et/ou du nombre de gènes codant un même type d'ARN messager, il n'existe dans une cellule que quelques copies de certains ARN messagers et des dizaines de milliers de copies d'autres ARN messagers :
d. De multiples transcrits sont générés à partir de certains gènes par épissage alternatif. L'un des avantages de la technique RNA-Seq est sa capacité à détecter ces isoformes différentiellement transcrites :
e. Les puces à ADN sont sujettes à une saturation d'hybridation en ce qui concerne les transcrits très abondants. Elles ne peuvent pas fournir des mesures quantitatives fiables des changements subtils de la transcription de gènes abondants. f. La technique RNA-Seq permet d'identifier des variants d'un seul nucléotide ("single nucleotide polymorphism" - SNP). La technique RNA-Seq présente deux avantages dans la détection de variants génétiques :
g. La technique RNA-Seq permet :
Pour l'instant la technique RNA-seq présente deux inconvénients :
Par ailleurs, l'un des atouts actuels (mais qui ne peut que diminuer avec le temps) des puces à ADN est l'acquis des dizaines de milliers d'expériences qui ont été menées avec cette technique et les différentes annotations des transcriptomes issues de toutes ces expériences. L'un des atouts de la technique RNA-seq (ou d'une autre technologie à venir) est l'évolution très rapide des technologies de séquençage à très haut débit : le développement des méthodes avec multiplexage par répartition codes barres, des lectures ("reads") plus longues et un plus grand nombre de lectures appariées ("paired end reads"). Pour l'instant les puces à ADN et la technique RNA-seq restent donc complémentaires et peuvent même être combinées avec des résultats très importants. |
Les méthodes RNA-seq de 3è génération a. Le séquençage des ARN de cellules individuelles ("Single-cell transcriptome sequencing" - scRNA-seq) Cette méthode permet d'obtenir les profils des transcrits de cellules individuelles et elle est considérée comme la référence pour définir les états cellulaires et les phénotypes. Il n'est pas toujours possible d'obtenir des informations complètes sur chaque type d'ARN transcrit dans chaque type de cellule en raison de la très faible quantité de certains ARN. Dans ce cas, les modèles de transcription des gènes peuvent être décrits par des analyses de regroupement de gènes ("gene clustering analyses"). Cela permet de révéler l'existence de types de cellules rares au sein d'une population de cellules. b. La transcriptomique résolue spatialement ("spatial transcriptomics") C'est une méthode récente utilisée pour analyser les données de RNA-seq en 3 dimensions au sein d'une [superposition / juxtaposition] de cellules de divers types dans des coupes de tissus.
Source : Stahl et al. (2016) La revue scientifique "Nature Methods" a couronné la méthode de transcriptomique résolue spatialement en 2020. c. Analyse combinée du génome et du transcriptome : technique "Simul-seq". Source : Reuter et al. (2016) |
La protéomique a pour but d'identifier (et de quantifier) l'ensemble des protéines synthétisées ou protéome, à un moment donné et dans des conditions données au sein d'un tissu, d'une cellule ou d'un compartiment cellulaire. Le protéome est extrêmement complexe à plusieurs titres :
La protéomique apporte des réponses auxquelles la transcriptomique ne peut répondre. Les études de protéomique sont de plus en plus spécialisées :
|
Génome et protéome de l'homme | ||
Analyse aboutie du génome de l'homme | 2012 | "The ENCODE Project Consortium" :
20 687 gènes codant des protéines Nature 489, 57-74 (2012) |
Protéome de l'homme | 2014 | Kim et al. (2014) "A draft map of the human proteome" Nature 509, 575-581 Bases de données : Human Proteome Map et ProteomicsDB |
Analyse conjointe du génome et du protéome (5 niveaux d'évidence d'existence des protéines) de l'homme | 2018 - 2020 | 19 823 gènes codant des protéines 20 399 protéines |
Voir la liste des protéomes (en particulier les protéomes de référence) dans la base de données UNIPROT. |
a. Etapes de la protéomique
Figure adaptée de Peng & Gygi (2001)
Source : Vandenbrouck et al. (2005) |
b. Principe de la spectrométrie de masse L'ionisation électronique (souvent appelée impact électronique) et l'ionisation chimique sont les principales méthodes d'ionisation. Dans le cas de l'ionisation électronique, l'échantillon est introduit dans une enceinte sous vide, il y est vaporisé puis soumis au bombardement d'un canon à électrons de grande énergie. Un électron est arraché aux molécules et on obtient une espèce qui est à la fois un cation (ion positif) et un radical libre (nombre impair d'électrons), que l'on appelle ion moléculaire M+. : M + e- (énergie 70 eV) <=> M+. + 2 e- L'énergie du faisceau ionisant fragmente l'ion moléculaire par rupture des liaisons les plus faibles avant les liaisons les plus fortes et donne naissance à des ions positifs de masses plus faibles, qui pourront être fragmentés à nouveau (exemple : spectrométrie de masse dite en tandem - MS/MS). Ces ions sont ensuite accélérés dans un champ électrique et/ou magnétique, puis dirigés entre les pôles d'un aimant selon une trajectoire circulaire qui dépend de leur rapport masse/charge [m/z]. En faisant varier le champ électrique, on fait varier la vitesse des ions moléculaires et on peut les faire ainsi parvenir au détecteur par ordre croissant de rapport [m/z]. Le tri des ions s'effectue :
On obtient un grand nombre de pics, tous de masse inférieure à celle de l'ion moléculaire. Cet ensemble constitue un diagramme de fragmentation. Les groupements fonctionnels possèdent un diagramme de fragmentation qui leur sont propres. Dans un spectre de masse, la hauteur relative des pics indique l'abondance relative des espèces. |
Voir un cours sur la protéomique. Voir une application de la protéomique : étude de la RuBisCO. |
5. L'interactomique : les interactions entre les molécules biologiques L'interactomique est un domaine en "omique" plus récent. Un interactome est l'ensemble des interactions physiques entre les molécules d'une cellule ou d'un compartiment sub-cellulaire :
Source : Xing et al. (2016)
Analyse et visualisation des réseaux d'interactions Un interactome peut décrire des dizaines de milliers d'interactions qui forment un réseau. Exemple ci-dessous : une partie du réseau d'interactions établies par Dnm1, protéine clé de la fission des mitochondries. Source : STRING Un réseau d'interactions est généralement représenté sous la forme d'un graphe :
Les modèles d'interactions physiques utilisent fréquemment des arêtes non orientées : si la protéine A interagit avec la protéine B, alors B interagit avec A. L'interaction est établie dans les deux sens (relation symétrique) : le graphe est dit non orienté. Cependant les données expérimentales révèlent souvent une asymétrie :
Il existe des logiciels d'analyse et de visualisation des réseaux d'interactions, en particulier :
|
Quelques méthodes pour l'identification des interactions Méthodes biologiques
Méthodes physiques
Méthodes bioinformatiques
|
Quelques bases de données d'interactions protéines - protéines
Ensemble de bases de données "Interactome Projects at CCSB". Quelques bases de données spécifiques des mitochondries : MitoCarta; Mitominer; IMPI. |
6. La métabolomique et les modèles de reconstruction métabolique à l'échelle d'un génome a. Le métabolome et la métabolomique La métabolomique est définie actuellement comme l'analyse (identification, quantification, classification, découverte, ...) des petites molécules (masse molaire < 1000 - 1500 Da) constitutives d'une cellule, d'un tissu ou d'un fluide biologique. Ces molécules sont appelées métabolites :
L'ensemble des métabolites constitue le métabolome :
La démarche "métabolomique" est récente car elle est la conséquence logique de tous les domaines antérieurs en "omique". |
b. Les modèles de reconstruction du métabolisme à l'échelle d'un génome Ils établissent le pont entre les informations issues du séquençage de ce génome (et des analyses subséquentes de ce génome), les données biochimiques et métaboliques et les phénotypes liés à ce métabolisme. L'accroissement du nombre de modèles du métabolisme à l'échelle d'un génome Pour l'homme :
La figure ci-dessous montre le nombre croissant de modèles de reconstruction métabolique à l'échelle d'un génome. En orange : eukaryotes; en bleu : prokaryotes; en vert : archaea. Source : Kim et al. (2012) Le nombre de modèles croit exponentiellement : 30% des modèles ont été construits depuis 2010. Un nombre croissant de modèles d'Eucaryotes (beaucoup plus complexes) sont construits. Parmi eux, on notera 3 plantes : AraGEM : modèle pour Arabidopsis thaliana; C4GEM : modèle pour les plantes à métabolisme en C4; un modèle pour le maïs : Zea mays iRS1563. |
Ainsi, la reconstruction du métabolisme à l'échelle d'un génome intègre l'ensemble des données issues (liste non exhaustive) :
La reconstruction du métabolisme à l'échelle d'un génome nécessite donc des méthodes bioinformatiques pour fouiller une quantité colossale de données ("data mining") et, bien souvent, pour les nettoyer (les "curer" - rôle critique des curateurs). Ce travail méticuleux, extrêmement gourmand en temps est laborieux et systématique. Les nouvelles données attendues sont une "sur-information" déduite de l'analyse de l'ensemble de ces informations de base.
|
c. Démarche de la reconstruction métabolique à l'échelle d'un génome Cette démarche est itérative : la comparaison avec la réalité biologique permet d'ajuster le modèle et de le re-confronter aux données réelles et ainsi de suite, afin de l'améliorer (voir la figure 1 de Balagurunathan et al., 2012).
|
Le processus de reconstruction recommence. Source : Lewis et al. (2012) |
La reconstruction du métabolisme à l'échelle d'un génome s'appuie massivement sur des méthodes bioinformatiques : elle est donc trés largement prédictive. Mais elle permet d'orienter de futures expériences dans des voies prometteuses et épargne un temps précieux de recherche au hasard. Bien évidemment, il existe une étape clé: la confrontation de ces modèles avec la réalité biologique. Cette étape est d'autant plus importante que les modèles peuvent être modifiés, améliorés comme tout système d'apprentissage. Illustration de l'élaboration d'un modèle de reconstruction métabolique Figure A (ci-dessous) : le 1er modèle dit "à plat"
Source : Gomes de Oliveira Dal'Molin & Nielsen (2013) Figure B : amélioration du 1er modèle
|
7. Liens Internet et références bibliographiques | |
A workflow for omic data analysis 10X Genomics |
|
O'Kane & Gehring (1987) "Detection in situ of genomic regulatory elements in Drosophila" Proc. Natl Acad. Sci. USA 84, 9123 - 9127 Cet article est l'un des tous premiers à décrire l'expression des gènes dans l'espace ("spatial transcriptomics"). |
|
Tang et al. (2009) "mRNA-Seq whole-transcriptome analysis of a single cell" Nat. Methods. 6, 377 - 382 Balagurunathan et al. (2012) "Reconstruction and analysis of a genome-scale metabolic model for Scheffersomyces stipitis" Microb. Cell Fact. 11, 27 Thiele et al. (2013) "A community-driven global reconstruction of human metabolism" Nat. Biotechnol. 31, 10.1038 Gomes de Oliveira Dal'Molin & Nielsen (2013) "Plant genome-scale metabolic reconstruction and modelling" Curr. Opin. Biotechnol. 24, 271 - 277 |
|
Boja et al. (2014) "Integration of omics sciences to advance biology and medicine" Clin. Proteomics 11, 45 Klein et al. (2015) "Droplet barcoding for single-cell transcriptomics applied to embryonic stem cells" Cell 161, 1187 - 1201 Goodwin et al. (2016) "Coming of age: ten years of next-generation sequencing technologies" Nat. Rev. Genetics 17, 333–351 Xing et al. (2016) "Techniques for the Analysis of Protein-Protein Interactions in Vivo" Plant Physiol. 171, 727 - 758 |
|
Van Emon J.M. (2016) "The Omics Revolution in Agricultural Research" J. Agric. Food. Chem. 13, 36 - 44 Reuter et al. (2016) "Simul-seq: combined DNA and RNA sequencing for whole-genome and transcriptome profiling" Nat. Methods 13, 953 - 958 Goodwin et al. (2016) "Coming of age: ten years of next-generation sequencing technologies" Nat. Rev. Genetics 17, 333–351 Stahl et al. (2016) "Visualization and analysis of gene expression in tissue sections by spatial transcriptomics" Science 353, 78 - 82 |
|
Prakadan et al. (2017) "Scaling by shrinking: empowering single-cell 'omics' with microfluidic devices" Nat. Rev. Genet. 18, 345 - 361 Jain et al. (2018) "Nanopore sequencing and assembly of a human genome with ultra-long reads" Nat. Biotechnol. 36, 338 - 345 |
|
Noor et al. (2019) "Biological insights through omics data integration" Curr. Opin. Sys. Biol. 15, 39 - 47 Stuart & Satija (2019) "Integrative single-cell analysis" Nat. Rev. Genet. 20, 257 - 272 Saelens et al. (2019) "A comparison of single-cell trajectory inference methods" Nat. Biotech. 37, 547 - 554 |
|
Carr et al. (2020) "Nanopore Sequencing at Mars, Europa and Microgravity Conditions" NPJ Microgravity 6, 24 Riley et al. (2020) "Optimal Dissociation Methods Differ for N- and O-Glycopeptides" J. Proteome Res. 19, 3286 - 3301 Wilbrey-Clark et al. (2020) "Cell Atlas technologies and insights into tissue architecture" Biochem. J. 477, 1427 - 1442 |
|
Bond et al. (2021) "Molecular omics resources should require sex annotation: a call for action" Nat. Methods 18, 585 - 588 Moses & Pachter (2022) "Museum of spatial transcriptomics" Nat. Methods |