Summary

降解FFPE-RNA样品测序与分析优化

Published: June 08, 2020
doi:

Summary

该方法描述了提高从正式固定石蜡嵌入(FFPE)RNA样品中获得的序列数据的质量和数量的步骤。我们描述了更准确地评估FFPE-RNA样品质量、准备测序库和分析FFPE-RNA样品数据的方法。

Abstract

RNA测序(RNA-seq)的基因表达分析能够对临床样本进行独特的洞察,从而潜在地了解各种疾病的基础以及抗药性和/或易感性机制。然而,FFPE组织是临床标本中保存组织形态的最常见方法,它不是基因表达分析的最佳来源。从这些样本中获得的RNA通常退化、碎片和化学修饰,从而导致测序库不理想。反过来,这些生成质量较差的序列数据,对于基因表达分析和突变发现可能不可靠。为了充分利用FFPE样品,并从低质量样品中获取最佳数据,在规划实验设计、准备测序库和数据分析过程中采取某些预防措施非常重要。这包括使用适当的指标进行精确的样品质量控制 (QC),确定测序库生成期间各种步骤的最佳方法,以及仔细的库 QC。此外,应用正确的软件工具和参数进行序列数据分析对于识别RNA-seq数据中的伪影、过滤污染和低质量读取、评估基因覆盖率的均匀性以及测量生物复制中基因表达特征的可重复性至关重要。这些步骤可确保对非常异构RNA样品进行分析的高精度和可重复性。在这里,我们描述了样品QC,库制备和质量控制,测序和数据分析的各种步骤,可以帮助增加从低质量RNA获得的有用数据的数量,例如从FFPE-RNA组织获得的数据。

Introduction

使用下一代测序方法使我们能够从各种类型的样品中收集大量信息。但是,对于常用的生成序列数据的方法,旧样本和保存不良的样本仍然不起作用,并且通常需要对成熟的协议进行修改。FFPE组织代表这种样本类型,已广泛用于临床标本11,2,3。2,3虽然FFPE保存维持组织形态,但FFPE组织中的核酸通常表现出广泛的损伤和降解,使得很难检索基因组信息,这些信息可能导致对各种疾病背后的分子机制有重要的见解。

RNA测序产生的基因表达数据通常有助于研究疾病和抗药性机制,并补充DNA突变分析。然而,RNA更容易降解,使得从FFPE组织生成准确的基因表达数据更具挑战性。此外,由于测序的广泛可用性和可负担性是较新的,较老的标本往往没有储存在保持RNA完整性所需的条件下。FFPE样品的一些问题包括:由于嵌入石蜡而导致RNA降解,RNA的化学改性导致测序所需的酶过程的分裂或折射性,以及多A尾部的丢失,限制了寡聚-dT作为反向转录酶的引物的适用性。另一个挑战是在次优条件下处理/储存FFPE样品,这可能导致组织5中的RNA等实验室分子进一步降解。这尤其与在预计对样本进行RNA测序的基因表达分析时可能收集的较老样本特别相关。所有这些都导致提取的RNA的质量和数量下降,可用于生成有用的序列数据。成功概率低,加上测序成本高,使许多研究人员无法尝试从可能有用的FFPE样本中生成和分析基因表达数据。近年来的一些研究表明,FFPE组织在基因表达分析22、6、7、8、96,7,方面的可用性,尽管样本较少和/或较新。8,9

作为可行性研究,我们使用从从监测、流行病学和最终结果(SEER)癌症登记册中提取的FFPE肿瘤组织标本中提取的RNA,用于RNA测序和基因表达分析10。从临床病理实验室采购,来自高级卵巢血清腺癌的FFPE组织在RNA提取前的不同条件下储存7-32年。因为在大多数情况下,这些块储存在不同的地点多年,没有期望将来有任何敏感的基因分析,没有采取任何谨慎保存核酸。因此,大多数样品的RNA质量较差,大部分样品被细菌污染。然而,我们能够执行基因定量,测量基因覆盖的均匀性和连续性,并在生物复制中执行Pearson相关分析,以测量可重复性。基于一组关键特征基因面板,我们将研究中的样本与癌症基因组图谱(TCGA)数据进行了比较,确认约60%的样本具有可比的基因表达特征11。根据各种QC结果和样本元数据之间的相关性,我们确定了关键QC指标,这些指标具有良好的预测价值,可用于识别更有可能生成可用序列数据11的样本。

在这里,我们描述了用于FFPE-RNA质量评估的方法,从提取的RNA样本开始的测序库的生成,以及测序数据的生物信息分析。

Protocol

1. RNA数量和质量评估 根据预定义的标准选择FFPE样品,并使用适当的方法(例如,FFPE-核酸萃取试剂盒、材料表)提取RNA。注:有几种不同的方法可用于FFPE-RNA提取,包括较新的微解剖方法,可以工作很少的组织,并提取高质量的RNA12,13,14。12,13,14 应尽最大努力在所有阶段保持RNA的完整性。这包?…

Representative Results

上述方法适用于67个FFPE样品,这些样品在各种不同条件下储存了7~32年(样本储存中值为17.5年)。此处介绍的数据集和分析结果此前在赵等11年进行了描述和发布。在检查样品质量时,如前面所述(即图2中的示例痕迹),DV100被认为比 DV200更有用处,因为准确测量高降解 RNA 样品较小片段大小的比例更为敏感。 在给定的?…

Discussion

此处描述的方法概述了从 FFPE-RNA 样品获取良好序列数据所需的主要步骤。使用这种方法需要考虑的要点是:(1) 通过最小化样品处理和冷冻和解冻周期,确保提取后尽可能保存RNA。单独的 QC 等号是非常有帮助的。(2) 使用最适合给定样本集的质量控制指标。RIN 值和 DV200通常对降级样本没有用处,DV100可能是评估给定样本集中质量的首选指标。(3) 对于更退化的样品,最好使?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

我们感谢Danielle Carrick博士(国家癌症研究所癌症控制和人口科学司)的持续帮助,特别是为发起这项研究、向我们提供样本以及数据分析过程中的有益建议。我们衷心感谢弗雷德里克国家癌症研究实验室CCR测序基金的所有成员在样品制备和测序方面给予的帮助,特别是布伦达·霍在样品QC、奥克萨纳德语图书馆QC、塔蒂亚娜·斯米尔诺娃(Tatyana Smirnova)操作测序器方面给予的帮助。我们还要感谢测序设施生物信息学集团的沈蔡伟和阿什利·沃尔顿帮助数据分析和RNA-seq管道实施。我们还感谢 CCBR 和 NCBR 在 RNaseq 分析管道和最佳实践开发方面提供的援助。

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video