プールされたDNAシーケンシングは、大規模コホートで複雑な表現型に関連付けられている稀な亜種を検出するための迅速かつ費用対効果の高い戦略である。ここでは、スプリンターソフトウェアパッケージを使用して、32のがん関連遺伝子のプールされた、次世代シーケンシングの計算分析を記述します。このメソッドは、スケーラブルで、目的の任意の表現型にも適用可能である。
DNAシーケンシング技術は著しく、近年2に進んでいるとして、それは任意の2つの個体間の遺伝的変異の量が以前に3を考えられていたよりも大きいことがますます明らかになった。対照的に、アレイ·ベースのタイピングは4,5共通の疾患の表現型の変動に共通の配列変異体の重要な貢献を識別するために失敗しました。まとめると、これらの観察は、一般的な、複雑な表現型の"失われた遺伝"の大半は、代わりに稀なまたはプライベートDNA変異体の個々の個人プロファイル6-8によるものであることを示唆している一般的な病気/まれな変異仮説の進化につながっている。しかし、まれな変異は、複雑な表現型をどのように影響するかを特徴付けることは、多くの遺伝子座で多くの影響を受ける個人の分析を必要とし、理想的に影響を受けないコホートで同様の調査と比較されます。今日のプラットフォームによって提供される電源シーケンシングにもかかわらず、多くの遺伝子座、必要に応じ、その後の計算機解析の人口ベースの調査では、多くの研究者のために法外なままである。
このニーズに応えるために、我々は、プールされたシーケンシングアプローチ1,9、得られたデータから高精度のまれな変異検出のための新しいソフトウェアパッケージ1を開発しました。影響を受ける個人や調査、単一のシーケンスのライブラリ内の複数の対象地域における遺伝的変異の程度の全体の集団からプールのゲノムへの能力は、従来の単一サンプルのシーケンシング手法に優れたコストと時間の節約を提供しています。 25倍の対立遺伝子あたりの平均シーケンスカバレッジで、我々のカスタムアルゴリズム、スプリンターは、最大のプールから1までの高感度と特異性で長さの4つの塩基対に挿入、欠失および置換を呼び出すために内部バリアントの呼び出し制御方式を使用しています500人の変異対立遺伝子。ここでは、プールされたのを調製するための方法を説明しますプールされたシーケンシングの解析(詳細はスプリンターパッケージを使用する方法についてステップバイステップの手順に続いて、ライブラリをequencing http://www.ibridgenetwork.org/wustl/splinter )。また、一人当たりのシーケンスの20キロバイト以上でゲノムワイドアレイを受けたすべての人の947人のプールされたシーケンスとの比較を示しています。タグ付きのタイピングとプールしたサンプルで呼び出され、新規の変異体との間の一致は良好であった。このメソッドは、容易にゲノム遺伝子座と個人の任意の数の任意の数にスケールアップすることができます。検討されて人口を模倣比で内部の正と負のアンプリコンのコントロールを組み込むことによって、アルゴリズムは、最適なパフォーマンスを得るために校正することができます。この戦略はまた、ハイブリダイゼーションのキャプチャまたは個々の固有のバーコードで使用するために変更することができ、例えば、腫瘍DNAなどの自然に異種のサンプルのシーケンスに適用することができます。
肥満など8、高コレステロール血症4、高血圧7と他のような一般的な、複雑な表現型や疾患の発症と治療反応は珍しいバリエーションの個人プロファイルによってモデレートされることが増加の証拠がある。影響を受けた集団におけるこれらの変異体の集合体は深い診断および治療に影響を持っていますが、別々に影響を受ける個人を分析する時間とコストが法外なことができる遺伝子と経路を識別します。人口ベースの分析では、複数の遺伝子座に遺伝的変異を調査するためのより効率的な方法を提供しています。
私たちは、集団間の遺伝的変異のこのタイプを識別するために設計されたスプリンターソフトウェアパッケージとペアになって小説をプール-DNAシーケンシングプロトコルを提示します。我々であったまれな変異体を含む、947人の大規模なプールされた集団内でマイナーアレルを識別し、定量化に、このメソッドの精度を実証するプールされたシーケンスからのde novoと呼ばれ、個々のパイロシーケンシングによって検証されています。当社の戦略は、主に正の取り込み、すべての実験内の負の制御により、他のプロトコルとは異なります。これはスプリンターは、他のアプローチは1に比べてはるかに高い精度と消費電力を達成することができます。 25倍あたりの対立遺伝子の最適なカバレッジは、プールサイズに比例し、この要件として実現可能な大規模なプールの分析のみスケールを作り、独立してプールのサイズの固定されています。我々のアプローチは非常に柔軟性があり、関心の任意の表現型にもこのような混合細胞集団、腫瘍生検などの自然に不均一である試料に適用することができます。そのようなexomeやゲノムなどの大きなターゲット領域からプールされたシーケンスでますます関心があることを考慮すると、我々のライブラリの準備とSPLINTER分析では、カスタムキャプチャと全体exomeシーケンシングと互換性がありますが、スプリンターパッケージの配置ユーティリティはのために設計されていません大参照配列である。したがって、我々は、正常にプールしたサンプルからの呼び出しバリアント(ラモスら 、投稿中)、続いてゲノムワイドなアラインメントのために、Novoalign、動的プログラミングアライナーを利用しています。したがって、我々のプールされたシーケンシング戦略は、標的配列の増加量でより大きなプールに正常に拡張することができます。
The authors have nothing to disclose.
この作品は子供ディスカバリー研究所助成MC-II-2006-1(RDMとTED)は、NIHロードマップのエピジェネティクスの助成金[1R01DA025744-01と3R01DA025744-02S1](RDMとFLMV)、U01AG023746(SC)、Saighによってサポートされていました財団(FLMVとTED)、1K08CA140720-01A1とアレックスのレモネード "は、"賞のサポート(TED)スタンド。我々は、ゲノム解析のヘルプは医学のワシントン大学で遺伝学部門のゲノムテクノロジー·アクセス·センターに感謝します。センターは、部分的に研究資源のためにNationalCenter(NCRR)、健康(NIH)の国立研究所のコンポーネントから#UL1RR024992 NCIがんセンターサポート助成サイトマンがんセンターへ#P30 CA91842によっておよびICTS / CTSAグラントによってサポートされており、医学研究のためのNIHロードマップ。このマニュアルでは、もっぱら著者の責任であり、必ずしもNCRRまたはNIHの公式見解を表すものではありません。
Reagent Name | Company | Catalogue Number | Section |
PfuUltra High-Fidelity | Agilent | 600384 | 1.4 |
Betaine | SIGMA | B2629 | 1.4 |
M13mp18 ssDNA vector | NEB | N4040S | 1.5 |
pGEM-T Easy | Promega | A1360 | 1.5 |
T4 Polynucleotide Kinase | NEB | M0201S | 2.2 |
T4 Ligase | NEB | M0202S | 2.2 |
Polyethylene Glycol 8000 MW | SIGMA | P5413 | 2.2 |
Bioruptor sonicator | Diagenode | UCD-200-TS | 2.3 |