Summary

分解されたFFPE-RNAサンプルのシーケンシングと分析の最適化

Published: June 08, 2020
doi:

Summary

本手法はホルマリン固定パラフィン埋め込み(FFPE)RNAサンプルから得ることができる配列データの質と量を改善するステップを説明する。我々は、FFPE-RNAサンプルの品質をより正確に評価し、シーケンシングライブラリを準備し、FFPE-RNAサンプルからのデータを分析するための方法論を説明する。

Abstract

RNAシーケンシング(RNA-seq)による遺伝子発現解析により、臨床サンプルに対する独自の洞察が可能となり、さまざまな疾患の基礎や抵抗性や感受性のメカニズムを機械化的に理解する可能性があります。しかし、臨床検体における組織形態を保存する最も一般的な方法を表すFFPE組織は、遺伝子発現プロファイリング分析の最良の情報源ではありません。このようなサンプルから得られたRNAは、しばしば分解され、断片化され、化学的に修飾され、最適ではないシーケンシングライブラリにつながります。さらに、これらは、遺伝子発現解析や変異発見に信頼性がない可能性のある低品質のシーケンスデータを生成します。FFPEサンプルを最大限に活用し、低品質のサンプルから可能な限り最良のデータを得るためには、実験計画、シーケンスライブラリの準備、データ分析中に、一定の予防措置を講じる必要があります。これには、正確なサンプル品質管理(QC)、シーケンスライブラリ生成中のさまざまなステップに最適な方法の特定、および慎重なライブラリQCのための適切なメトリックの使用が含まれます。さらに、RNA-seqデータのアーチファクトを特定し、汚染や低品質の読み取り、遺伝子被覆の均一性を評価し、生物学的複製物間で遺伝子発現プロファイルの再現性を測定するためには、正しいソフトウェアツールと配列データ解析パラメータを適用することが重要です。これらのステップは非常に異質なRNAサンプルのプロファイリングのための高精度および再現性を保障できる。ここでは、サンプルQC、ライブラリ調製およびQC、シーケンシング、およびFFPE-RNA組織から得られるような低品質RNAから得られる有用なデータの量を増加させるデータ分析のための様々なステップを説明します。

Introduction

次世代シーケンシングアプローチを利用することで、さまざまな種類のサンプルから豊富な情報を収集することができました。ただし、古くて保存が不十分なサンプルは、一般的に使用されるシーケンスデータの生成方法では動作しないため、確立されたプロトコルを変更する必要が生じることが多い。FFPE,組織は、臨床検体1、2、32に広く利用されてきたこのようなサンプル型を表す。13FFPE保存は組織形態を維持するが、FFPE組織の核酸は通常、広範囲の損傷および分解を示し、様々な障害の根底にある分子メカニズムに関する重要な洞察につながる可能性のあるゲノム情報を取り出すことを困難にする。

RNAシーケンシングによって生成される遺伝子発現データは、疾患や抵抗のメカニズムの研究に役立ち、DNA変異解析を補完することがよくあります。しかし、RNAは分解の影響を受けやすく、FFPE組織から正確な遺伝子発現データを生成することがより困難になります。さらに、シーケンシングの幅広い可用性と手頃な価格が比較的最近であるため、古い標本はRNAの完全性を維持するために必要な条件で保存されなかったことが多かった。FFPEサンプルの問題のいくつかは、パラフィンに埋め込むことによるRNAの分解、シーケンシングに必要な酵素プロセスに対する断片化または屈折性につながるRNAの化学修飾、およびポリA尾の喪失、逆転写酵素4のプライマーとしてのオリゴ-dTの適用性を制限する。もう一つの課題は、最適でない条件下でのFFPEサンプルの取り扱い/保存であり、組織5におけるRNAなどの不安定分子のさらなる分解につながる可能性がある。これは、RNAシーケンシングによる遺伝子発現解析がサンプルに対して予想されていなかった時期に収集された可能性のある古いサンプルに特に関連しています。これらのすべては、有用な配列データを生成するために利用可能な抽出されたRNAの品質と量の減少につながります。成功の可能性が低く、シーケンシングのコストが高いと相まって、多くの研究者が潜在的に有用なFFPEサンプルから遺伝子発現データを生成して分析しようとすることを妨げている。近年のいくつかの研究では、遺伝子発現解析,,2、6、7、8、96に対2するFFPE組織の使用可能性が実証されていますが、最近のサンプルの数が少ない、および/またはより最近のサンプルの場合はあります。,789

実現可能性調査として、我々は、3つの残留組織リポジトリから得られたFFPE腫瘍組織標本から抽出されたRNAを使用して、監視、疫学、および末期結果(SEER)癌登録をRNAシーケンシングおよび遺伝子発現解析10に用いた。臨床病理ラボから調達した、高等度卵巣漿液腺癌からのFFPE組織は、RNA抽出前に様々な条件下で7〜32年保存された。ほとんどの場合、これらのブロックは、将来的に敏感な遺伝子解析を期待することなく、何年も異なる場所に保存されていたので、核酸を保存するためにあまり注意が払われていなかった。したがって、サンプルのほとんどは、細菌で汚染されたサンプルの大部分を有する、質の悪いRNAを示した。それにもかかわらず、遺伝子定量を行い、遺伝子被覆の均一性と連続性を測定し、生物学的複製物間でピアソン相関解析を行い、再現性を測定することができました。主要な遺伝子パネルのセットに基づいて、我々は研究のサンプルを癌ゲノムアトラス(TCGA)データと比較し、サンプルの約60%が同等の遺伝子発現プロファイル11を有することを確認した。各種QC結果とサンプルメタデータとの相関関係に基づいて、我々は、使用可能なシーケンスデータ11を生成する可能性が高いサンプルを同定するための良好な予測値を有する主要なQC指標を同定した。

ここでは、FFPE-RNAの品質評価に用いる方法論、抽出されたRNAサンプルから始まるシーケンシングライブラリの生成、シーケンシングデータのバイオインフォマティクス解析について説明します。

Protocol

1. RNA量と品質評価 事前定義された基準に従ってFFPEサンプルを選択し、適切な方法(例えば、FFPE-核酸抽出キット、材料表)を用いてRNAを抽出する。注:FFPE-RNA抽出には、非常に少ない組織で動作し、良質のRNA12、13、14を抽出できる新しいマイクロディスセクション法を含む、13,14いくつかの異なる方法が…

Representative Results

上記の方法論は、7~32年間のさまざまな条件下で保存されていた67個のFFPEサンプルに適用されました(サンプル保存時間の中央値は17.5年でした)。ここで示したデータセットと解析結果は、Zhaoら11で既に説明および公開されています。先に説明したサンプル品質(例えば図2のトレース)をチェックする上で、DV100は、高分解RNAサンプルに対する小さ?…

Discussion

ここで説明する方法は、FFPE-RNAサンプルから良好な配列データを得るために必要な主なステップを概説する。この方法で考慮すべき主なポイントは、(1)サンプルの取り扱いおよび凍結および解凍のサイクルを最小限に抑えることによって、抽出後にRNAを可能な限り保存することを確認することです。別々のQCアリコートは非常に便利です。(2) 所定のサンプル・セットに最適な QC メトリックを?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

ダニエル・キャリック博士(国立がん研究所がん対策人口科学部門)は、特にこの研究を始め、サンプルを提供し、データ分析中に役立つ提案をしてくれたことに感謝しています。フレデリック国立がん研究研究所のCCRシーケンシング施設のメンバー全員が、サンプル調製とシーケンシング中の支援、特にサンプルQC、オクサナドイツ語の図書館QC、テクサイダーを運営するためのタチアナ・スミルノワの支援に心から感謝します。また、シーケンシング・ファシリティ・バイオインフォマティクス・グループのツァイ・ウェイ・シェンとアシュリー・ウォルトンが、データ分析とRNA-seqパイプラインの実装を支援してくれたことに感謝します。また、RNaseq分析パイプラインおよびベストプラクティス開発に関する支援に対するCCBRおよびNCBRに感謝します。

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video