本手法はホルマリン固定パラフィン埋め込み(FFPE)RNAサンプルから得ることができる配列データの質と量を改善するステップを説明する。我々は、FFPE-RNAサンプルの品質をより正確に評価し、シーケンシングライブラリを準備し、FFPE-RNAサンプルからのデータを分析するための方法論を説明する。
RNAシーケンシング(RNA-seq)による遺伝子発現解析により、臨床サンプルに対する独自の洞察が可能となり、さまざまな疾患の基礎や抵抗性や感受性のメカニズムを機械化的に理解する可能性があります。しかし、臨床検体における組織形態を保存する最も一般的な方法を表すFFPE組織は、遺伝子発現プロファイリング分析の最良の情報源ではありません。このようなサンプルから得られたRNAは、しばしば分解され、断片化され、化学的に修飾され、最適ではないシーケンシングライブラリにつながります。さらに、これらは、遺伝子発現解析や変異発見に信頼性がない可能性のある低品質のシーケンスデータを生成します。FFPEサンプルを最大限に活用し、低品質のサンプルから可能な限り最良のデータを得るためには、実験計画、シーケンスライブラリの準備、データ分析中に、一定の予防措置を講じる必要があります。これには、正確なサンプル品質管理(QC)、シーケンスライブラリ生成中のさまざまなステップに最適な方法の特定、および慎重なライブラリQCのための適切なメトリックの使用が含まれます。さらに、RNA-seqデータのアーチファクトを特定し、汚染や低品質の読み取り、遺伝子被覆の均一性を評価し、生物学的複製物間で遺伝子発現プロファイルの再現性を測定するためには、正しいソフトウェアツールと配列データ解析パラメータを適用することが重要です。これらのステップは非常に異質なRNAサンプルのプロファイリングのための高精度および再現性を保障できる。ここでは、サンプルQC、ライブラリ調製およびQC、シーケンシング、およびFFPE-RNA組織から得られるような低品質RNAから得られる有用なデータの量を増加させるデータ分析のための様々なステップを説明します。
次世代シーケンシングアプローチを利用することで、さまざまな種類のサンプルから豊富な情報を収集することができました。ただし、古くて保存が不十分なサンプルは、一般的に使用されるシーケンスデータの生成方法では動作しないため、確立されたプロトコルを変更する必要が生じることが多い。FFPE,組織は、臨床検体1、2、32に広く利用されてきたこのようなサンプル型を表す。13FFPE保存は組織形態を維持するが、FFPE組織の核酸は通常、広範囲の損傷および分解を示し、様々な障害の根底にある分子メカニズムに関する重要な洞察につながる可能性のあるゲノム情報を取り出すことを困難にする。
RNAシーケンシングによって生成される遺伝子発現データは、疾患や抵抗のメカニズムの研究に役立ち、DNA変異解析を補完することがよくあります。しかし、RNAは分解の影響を受けやすく、FFPE組織から正確な遺伝子発現データを生成することがより困難になります。さらに、シーケンシングの幅広い可用性と手頃な価格が比較的最近であるため、古い標本はRNAの完全性を維持するために必要な条件で保存されなかったことが多かった。FFPEサンプルの問題のいくつかは、パラフィンに埋め込むことによるRNAの分解、シーケンシングに必要な酵素プロセスに対する断片化または屈折性につながるRNAの化学修飾、およびポリA尾の喪失、逆転写酵素4のプライマーとしてのオリゴ-dTの適用性を制限する。もう一つの課題は、最適でない条件下でのFFPEサンプルの取り扱い/保存であり、組織5におけるRNAなどの不安定分子のさらなる分解につながる可能性がある。これは、RNAシーケンシングによる遺伝子発現解析がサンプルに対して予想されていなかった時期に収集された可能性のある古いサンプルに特に関連しています。これらのすべては、有用な配列データを生成するために利用可能な抽出されたRNAの品質と量の減少につながります。成功の可能性が低く、シーケンシングのコストが高いと相まって、多くの研究者が潜在的に有用なFFPEサンプルから遺伝子発現データを生成して分析しようとすることを妨げている。近年のいくつかの研究では、遺伝子発現解析,,2、6、7、8、96に対2するFFPE組織の使用可能性が実証されていますが、最近のサンプルの数が少ない、および/またはより最近のサンプルの場合はあります。,789
実現可能性調査として、我々は、3つの残留組織リポジトリから得られたFFPE腫瘍組織標本から抽出されたRNAを使用して、監視、疫学、および末期結果(SEER)癌登録をRNAシーケンシングおよび遺伝子発現解析10に用いた。臨床病理ラボから調達した、高等度卵巣漿液腺癌からのFFPE組織は、RNA抽出前に様々な条件下で7〜32年保存された。ほとんどの場合、これらのブロックは、将来的に敏感な遺伝子解析を期待することなく、何年も異なる場所に保存されていたので、核酸を保存するためにあまり注意が払われていなかった。したがって、サンプルのほとんどは、細菌で汚染されたサンプルの大部分を有する、質の悪いRNAを示した。それにもかかわらず、遺伝子定量を行い、遺伝子被覆の均一性と連続性を測定し、生物学的複製物間でピアソン相関解析を行い、再現性を測定することができました。主要な遺伝子パネルのセットに基づいて、我々は研究のサンプルを癌ゲノムアトラス(TCGA)データと比較し、サンプルの約60%が同等の遺伝子発現プロファイル11を有することを確認した。各種QC結果とサンプルメタデータとの相関関係に基づいて、我々は、使用可能なシーケンスデータ11を生成する可能性が高いサンプルを同定するための良好な予測値を有する主要なQC指標を同定した。
ここでは、FFPE-RNAの品質評価に用いる方法論、抽出されたRNAサンプルから始まるシーケンシングライブラリの生成、シーケンシングデータのバイオインフォマティクス解析について説明します。
ここで説明する方法は、FFPE-RNAサンプルから良好な配列データを得るために必要な主なステップを概説する。この方法で考慮すべき主なポイントは、(1)サンプルの取り扱いおよび凍結および解凍のサイクルを最小限に抑えることによって、抽出後にRNAを可能な限り保存することを確認することです。別々のQCアリコートは非常に便利です。(2) 所定のサンプル・セットに最適な QC メトリックを?…
The authors have nothing to disclose.
ダニエル・キャリック博士(国立がん研究所がん対策人口科学部門)は、特にこの研究を始め、サンプルを提供し、データ分析中に役立つ提案をしてくれたことに感謝しています。フレデリック国立がん研究研究所のCCRシーケンシング施設のメンバー全員が、サンプル調製とシーケンシング中の支援、特にサンプルQC、オクサナドイツ語の図書館QC、テクサイダーを運営するためのタチアナ・スミルノワの支援に心から感謝します。また、シーケンシング・ファシリティ・バイオインフォマティクス・グループのツァイ・ウェイ・シェンとアシュリー・ウォルトンが、データ分析とRNA-seqパイプラインの実装を支援してくれたことに感謝します。また、RNaseq分析パイプラインおよびベストプラクティス開発に関する支援に対するCCBRおよびNCBRに感謝します。
2100 Bioanalyzer | Agilent | G2939BA | |
Agilent DNA 7500 Kit | Agilent | 5067-1506 | |
Agilent High Sensitivity DNA Kit | Agilent | 5067-4626 | |
Agilent RNA 6000 Nano Kit | Agilent | 5067-1511 | |
AllPrep DNA/RNA FFPE Kit | Qiagen | 80234 | |
CFX96 Touch System | Bio-Rad | 1855195 | |
Library Quantification kit v2-Illumina | KapaBiosystems | KK4824 | |
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina | New England Biolabs | E7765S | https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit |
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) | New England Biolabs | E6310L | |
NextSeq 500 Sequencing System | Illumina | SY-415-1001 | NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf |
NextSeq PhiX Control Kit | Illumina | FC-110-3002 | |
NSQ 500/550 Hi Output KT v2.5 (150 CYS) | Illumina | 20024907 | |
10X Genomics Magnetic Separator | 10X Genomics | 120250 | |
Rotator Multimixer | VWR | 13916-822 | |
C1000 Touch Thermal Cycler | Bio-Rad | 1851197 | |
Sequencing reagent kit | Illumina | 20024907 | |
Flow cell package | Illumina | 20024907 | |
Buffer cartridge and the reagent cartridge | Illumina | 20024907 | |
Sodium hydroxide solution (0.2N) | Millipore Sigma | SX0607D-6 | |
TRIS-HCL Buffer 1.0M, pH 7.0 | Fisher Scientific | 50-151-871 |