次世代シーケンス (NGS)、プラットフォーム (~0.5–2.0%) の高い誤り率によって制限されるゲノム解析の強力なツールです。NGS のエラーレートを未然に防ぐし、バリアント アレル分 0.0001 のようにまれに突然変異を検出するエラー修正のシーケンスの我々 の方法をについて説明します。
従来の次世代シーケンシング技術 (NGS) は、10 年以上の巨大なゲノム解析を許可しています。具体的には、NGS は悪性腫瘍にクローン変異のスペクトルを分析するために使用されています。従来サンガー、NGS 闘争その高い誤り率 ~0.5–2.0% によるまれなクローンと subclonal 突然変異を識別するよりもはるかに効率的です。したがってがある突然変異の検出限界を持つ標準的な NGS > 0.02 バリアント アレル分数 (エン)。患者のまれな突然変異の臨床的意義、知られている病気は、明白でなく残ることがなく白血病の治療を受けた患者が大幅に向上成果残存病変が < フローサイトメトリーによる 0.0001。NGS のこの artefactual 背景を軽減するために多くの方法が開発されています。ここでエラー修正 DNA および RNA シーケンス (ECS)、エラー訂正のため 16 bp ランダム インデックスと多重化のための 8 bp 患者固有のインデックスの個々 の分子のタグ付けを含むため手法について述べる。本手法は検出し、バリアント アレル分数 (VAFs) 2 桁の NGS の検出限界よりも低く、0.0001 エンのようにまれにクローン変異を追跡できます。
我々 として年齢、変異原性物質と細胞分裂結果、ゲノム、これで身体異常の蓄積で中確率のエラーへの暴露の基となる悪性転化の根本的な病因神経疾患、小児障害と正常な老化1,2。病気運転可能性と体細胞突然変異は、早期発見とリスク管理3,4、5の重要な診断と予後バイオ マーカーです。生理学的な clonogenesis が理解するために臨床通知し、意思決定、定量の正確さおよびこれらの突然変異の特性を研究する重要です。次世代シーケンス (NGS) は、異種の DNA サンプルにクローン変異の研究に現在使用されてただし、NGS は突然変異を識別する制限 > 0.02 バリアント アレル分数 (エン)-0.5-2.0 の固有の誤り率のためシーケンス プラットフォーム6,7,8%。その結果、診断と予後追跡低いエンで重要な体の亜種では得られない標準 NGS。
近年、様々 なメソッドは、NGS8,9,10,11のエラー率を回避するために開発されています。これらのメソッドは、シーケンス処理の後のエラー訂正を可能分子タギングを利用します。各分子やゲノム断片配列ライブラリでは付くと、ランダムなユニークな分子識別子 (UMI) その分子に固有です。行政は、無作為化ヌクレオチド (8-16 N) の文字列の順列を構築されています。2 番目サンプル固有のバーコードも、ワークフロー実行同じ NGS シーケンスに複数のサンプルを多重伝送が可能に統合されます。Pcr は分子タグ ライブラリで実行され、シーケンス処理用ライブラリを送信するその後。ライブラリの準備中、エラーでがゲノム フラグメントを pcr とシーケンス8中にランダムに導入されることが期待されます。ランダムなシーケンス エラーを削除するには、生配列読み取りが UMI に従ってグループ化されます。シーケンスからの人工物は真のバリアントが忠実に増幅し、同じ海を共有すべての読み取りでシーケンスに対し導入の確率論的性質同じゲノムの位置に同じ海ですべての読み取りに存在することは行われません。成果物が削除されます bioinformatically です。ここでは、3 つのメソッドのエラー修正のシーケンス (ECS) 研究所単一のヌクレオチドの亜種 (SNVs) と小さな挿入削除 (オクターリピート) を識別するために DNA および RNA 遺伝子発現下の定量化を容易にするための最適化について述べる、NGS のエラーのしきい値。
最初の方法では、研究者によって設計された遺伝子特異的プライマーを用いた珍しい体イベントを探す方法について説明します。ライブラリの準備の前に研究者は興味のかけらをターゲットにプライマーを設計する必要があります。Web アプリ Primer3 を使いました (http://bioinfo.ut.ee/primer3-0.4.0/)。200-250 bp の産物は、これらは、行政が組み込まれて一度ポリメラーゼの連鎖反応 (PCR) に最適、ペアエンド リード 150 bp ペアエンド リードでの重複を生成します。使用する最適なプライマー設計条件: 最小プライマー サイズ = 19;最適なプライマー サイズ = 25;最大プライマー サイズ = 30;最小 Tm = 64 ° C;最適な Tm = 70 ° C;最大 Tm = 74 ° C;Tm 差の最大値 = 5 ° C;GC の最小の内容 = 45;最大 GC コンテンツ = 80。返される数 = 20;最大 3′ 端安定性 = 100。
方法 2 のクローン SNVs と小さなオクターリピート 0.0001 エン amplicons の数百を含む市販遺伝子パネルを使用してのようにまれにイルミナ化学と ECS DNA のプロトコルを組み合わせる手法について述べる.TruSight 骨髄性シーケンス パネル (イルミナ) を実験に使用し、小児の骨髄性疾患のための興味の遺伝子を含むように拡張されたパネルを設計しました。これらのパネルがこれらのパネルに独自のアダプターの戦略を追加しましたので、エラー訂正を促進するようなユニークな分子識別子 (Umi) を提供していません。ECS が動作するはずです同様に他のさまざまな病気と関連付けられる遺伝子の豊かに設計のパネルのいずれかで。次の DNA の隔離および組織または目的の標本から後続の定量化、それは少なくとも 500 に勧め株 DNA 試料当りの ng。我々 は日常的に 250 を使用して単一配列ライブラリを作る ng の下流をできるだけ多くユニークなゲノム フラグメントとしてキャプチャするために DNA の重複とエン計算を読み取ります。残りの 250 とオプションの複製シーケンス ライブラリを作ることができる DNA の ng。標本あたり 2 つのライブラリのレプリケートを常に確認、真陽性として両方の複製で独立して検出されたイベントのみを考えます。4,13を呼び出すバリエーションの精度を高めるためのゲノム位置特異的二項エラー モデルを実施します。
最後に、ECS を市販の QIAseq ターゲット RNA パネル (Qiagen) を使用して転写定量化のための RNA シーケンスに結合手法について述べる。重複除外に必要な行政とエラー訂正は、キットに盛り込まれているし、研究者は、ライブラリの製造元の推奨事項に従います。Bioinformatically、研究者は、ECS-DNA のプロトコル セクションで詳細に説明するために概説パイプラインを従うことができます。
ここでは、さまざまな病気で低 VAFs と突然変異を研究する簡単に実装することができますシーケンスのエラー修正プロトコルのスイートを紹介します。最も重要な彼らは raw 読み取りのエラー訂正を有効にすると各分子シーケンスの前に行政の混入であります。ここで説明する方法は、市販遺伝子パネルおよび自己設計されていた遺伝子特定 oligos の両方にカスタマイズされた行政を組み込む研究者を許可します。
NGS の標準プロトコル シーケンス エラー率 2% 以下エンと遺伝子変異の検出を排除する、これは稀な変形の検出は重要な研究の NGS のアプリケーションを制限します。標準の NGS 誤り率を回避、ECS これら生の変異体の高感度検出できます。例えば、これらの突然変異は最初 (したがって、低エン) 起こるとき病原性の変異の検出は病気14,15の早期介入を通知することが不可欠。白血病研究、最小残差の検出の病 (治療後残存白血病細胞) がリスク層別化を通知し、バイナリ流れフローサイトメトリー評価できない方法で治療の選択肢が通知される可能性があります。さらに、ECS は循環腫瘍核酸を検出し、プライマリの特性は、特定の突然変異のバリアントの負担と同様に有無を評価することによって固形腫瘍患者における転移能を評価する適切です腫瘍16。
表 1に示されているように、バリアントを呼び出す位置固有のエラーの二項分布に基づくモデルを使用しての力はエラー モデルの構築に使用されるシーケンスの深さと同様に、シーケンスされたライブラリの数に大きく依存します。エラー モデルのロバスト性のサンプルと詳細シーケンス数の増加とともに増加します。各サンプルのエラー プロファイルを構築するサンプルあたり 3000 x のエラー修正リード カバレッジの平均で少なくとも 10 シーケンスされたサンプルを使用することをお勧めします。位置特定方法と同じです、MAGERI がすべての六つの異なる置換タイプの集計エラー率を使用しての代わり (A > C/T > G、A > G/T > C、A > T/T >、C > A/G > T、C > G > C、C > T/G > A)13, 我々 はすべての位置で独立して各置換モデルします。例えば、C のエラー発生率 > 所定ゲノムの位置に T は別の位置から異なる。我々 のアプローチも考慮シーケンス バッチ効果シーケンス実行の 1 つにみられる塩基置換率は別の実行から異なる場合があります。したがって異なるシーケンスの実行からのサンプルはモデルの構築にプールされる場合は特にすべての置換型のそれぞれの位置をモデル化することが重要です。
ECS 実験を設計するときの重要な考慮事項は、所望の検出のしきい値です。NGS 研究の美しさは遺伝子/ターゲットの興味、(配列の深さによって決定)、検出しきい値および照会個体数の面で、簡単に縮小できます。たとえば、研究者が 0.0001 の検出閾値を持つ 2 つの産物のまれな突然変異を見つけるに興味があるなら、MiSeq V2 化学まで 1500 万読み取りを出力を使用して実行、単一シーケンスで最大限に 75 検体をプールできる (2 amplicons * 10,000分子 * 10 読み取りエラー補正 * 75 検体 = 1500 万配列読み取り)。研究者は分子シーケンスまたは検出しきい値を調整するために実行する単一シーケンスでプールされたサンプルの数に入るの数を変更できます。私たちの研究で検出しきい値を持つ 0.0001 エン (1:10, 000) の突然変異を見つけることを目指しましたイルミナ遺伝子パネルを使用します。我々 は日常的に 250 を使用して十分な分子が前述の検出閾値を達成するためにキャプチャされるように DNA の開始の ng。研究者は、DNA の低量の開始する選ぶことができます (50 ng をお勧めします) 目的の検出限界がある場合 > 0.001 エン。
行政は、i5 のインデックスに追加されます、シーケンス設定はそれに応じて改正されるあります。たとえば、16 の N 行政を使いました、シーケンス設定された 2 x 144 対最後の読み取り、インデックス 1 の 8 サイクル、インデックス 2 の通常 8 サイクルではなくインデックス 2 の 16 のサイクル。インデックス 2 サイクルの増加は、読み取りに割り当てられた合計回数の減少によって補償されています。研究者は 12 n Umi10,17を使用することを選ぶ、設定はインデックス 2 の 12 のサイクルを変更する必要があります。
この海ベースのシーケンスのメソッドは、シーケンス エラーの修正に最適です。すべて増幅方式のための問題である PCR 表示をあつかう上で最適ではないままです。ポスト シーケンスと ddPCR を使用してポスト バイオインフォマティクス検証のラウンドを行い、我々 はほとんど PCR 表示による任意の偽陽性を検出します。それにもかかわらず、研究者が低増幅エラー高忠実度ポリメラーゼを用いた実験を行うことをお勧めします。
The authors have nothing to disclose.
我々 は腫瘍グループ AAML1531 子どもと看護師の保健研究患者サンプルの形で彼らの貢献のために参加者に感謝します。この仕事、国立衛生研究所 (UM1 CA186107、RO1 CA49449 RO1 CA149445)、子供の発見研究所のワシントン大学とセントルイス子供病院 (MC-II-2015-461) とイーライ セス ・ マシューズ白血病財団によって資金を供給されました。
Q5 High Fidelity Hot Start Master Mix | New England BioLabs | M0492S | |
Agencourt AMPure XP | Beckman Coulter | A63880 | |
Qubit dsDNA HS Assay Kit | Thermo Fisher Scientific | Q32854 | |
SYBR Safe DNA Gel Stain | Thermo Fisher Scientific | S33102 | |
Truseq Custom Amplicon Index Kit | Illumina | FC-130-1003 | |
UMI i5 adapter sequences | Integrated DNA Technologies | – | |
NEBNext Ultra End Repair/dA-Tailing Module | New England BioLabs | E7442S | |
NEBNext Ultra II Ligation Module | New England BioLabs | E7595S | |
QX200 ddPCR EvaGreen Supermix | Bio-Rad | 1864034 | |
QX200 Droplet Generation Oil for EvaGreen | Bio-Rad | 1864005 | |
QX200 Droplet Digital PCR System | Bio-Rad | 1864001 | |
ddPCR 96-Well Plates | Bio-Rad | 12001925 | |
DG8 Cartridges for QX200/QX100 Droplet Generator | Bio-Rad | 1864008 | |
DG8 Gaskets for QX200/QX100 Droplet Generator | Bio-Rad | 1863009 | |
Bioanalyzer | Agilent Genomics | G2939BA | |
TapeStation | Agilent Genomics | G2991AA | |
TruSight Myeloid Sequencing Panel | Illumina | FC-130-1010 | |
Bowtie 2 | Johns Hopkins University | – | |
Customized QIAseq Targeted RNA Panel | Qiagen | – | |
Rneasy Plus Mini Kit (50) | Qiagen | 74134 |