该方法描述了提高从正式固定石蜡嵌入(FFPE)RNA样品中获得的序列数据的质量和数量的步骤。我们描述了更准确地评估FFPE-RNA样品质量、准备测序库和分析FFPE-RNA样品数据的方法。
RNA测序(RNA-seq)的基因表达分析能够对临床样本进行独特的洞察,从而潜在地了解各种疾病的基础以及抗药性和/或易感性机制。然而,FFPE组织是临床标本中保存组织形态的最常见方法,它不是基因表达分析的最佳来源。从这些样本中获得的RNA通常退化、碎片和化学修饰,从而导致测序库不理想。反过来,这些生成质量较差的序列数据,对于基因表达分析和突变发现可能不可靠。为了充分利用FFPE样品,并从低质量样品中获取最佳数据,在规划实验设计、准备测序库和数据分析过程中采取某些预防措施非常重要。这包括使用适当的指标进行精确的样品质量控制 (QC),确定测序库生成期间各种步骤的最佳方法,以及仔细的库 QC。此外,应用正确的软件工具和参数进行序列数据分析对于识别RNA-seq数据中的伪影、过滤污染和低质量读取、评估基因覆盖率的均匀性以及测量生物复制中基因表达特征的可重复性至关重要。这些步骤可确保对非常异构RNA样品进行分析的高精度和可重复性。在这里,我们描述了样品QC,库制备和质量控制,测序和数据分析的各种步骤,可以帮助增加从低质量RNA获得的有用数据的数量,例如从FFPE-RNA组织获得的数据。
使用下一代测序方法使我们能够从各种类型的样品中收集大量信息。但是,对于常用的生成序列数据的方法,旧样本和保存不良的样本仍然不起作用,并且通常需要对成熟的协议进行修改。FFPE组织代表这种样本类型,已广泛用于临床标本11,2,3。2,3虽然FFPE保存维持组织形态,但FFPE组织中的核酸通常表现出广泛的损伤和降解,使得很难检索基因组信息,这些信息可能导致对各种疾病背后的分子机制有重要的见解。
RNA测序产生的基因表达数据通常有助于研究疾病和抗药性机制,并补充DNA突变分析。然而,RNA更容易降解,使得从FFPE组织生成准确的基因表达数据更具挑战性。此外,由于测序的广泛可用性和可负担性是较新的,较老的标本往往没有储存在保持RNA完整性所需的条件下。FFPE样品的一些问题包括:由于嵌入石蜡而导致RNA降解,RNA的化学改性导致测序所需的酶过程的分裂或折射性,以及多A尾部的丢失,限制了寡聚-dT作为反向转录酶的引物的适用性。另一个挑战是在次优条件下处理/储存FFPE样品,这可能导致组织5中的RNA等实验室分子进一步降解。这尤其与在预计对样本进行RNA测序的基因表达分析时可能收集的较老样本特别相关。所有这些都导致提取的RNA的质量和数量下降,可用于生成有用的序列数据。成功概率低,加上测序成本高,使许多研究人员无法尝试从可能有用的FFPE样本中生成和分析基因表达数据。近年来的一些研究表明,FFPE组织在基因表达分析22、6、7、8、96,7,方面的可用性,尽管样本较少和/或较新。8,9
作为可行性研究,我们使用从从监测、流行病学和最终结果(SEER)癌症登记册中提取的FFPE肿瘤组织标本中提取的RNA,用于RNA测序和基因表达分析10。从临床病理实验室采购,来自高级卵巢血清腺癌的FFPE组织在RNA提取前的不同条件下储存7-32年。因为在大多数情况下,这些块储存在不同的地点多年,没有期望将来有任何敏感的基因分析,没有采取任何谨慎保存核酸。因此,大多数样品的RNA质量较差,大部分样品被细菌污染。然而,我们能够执行基因定量,测量基因覆盖的均匀性和连续性,并在生物复制中执行Pearson相关分析,以测量可重复性。基于一组关键特征基因面板,我们将研究中的样本与癌症基因组图谱(TCGA)数据进行了比较,确认约60%的样本具有可比的基因表达特征11。根据各种QC结果和样本元数据之间的相关性,我们确定了关键QC指标,这些指标具有良好的预测价值,可用于识别更有可能生成可用序列数据11的样本。
在这里,我们描述了用于FFPE-RNA质量评估的方法,从提取的RNA样本开始的测序库的生成,以及测序数据的生物信息分析。
此处描述的方法概述了从 FFPE-RNA 样品获取良好序列数据所需的主要步骤。使用这种方法需要考虑的要点是:(1) 通过最小化样品处理和冷冻和解冻周期,确保提取后尽可能保存RNA。单独的 QC 等号是非常有帮助的。(2) 使用最适合给定样本集的质量控制指标。RIN 值和 DV200通常对降级样本没有用处,DV100可能是评估给定样本集中质量的首选指标。(3) 对于更退化的样品,最好使?…
The authors have nothing to disclose.
我们感谢Danielle Carrick博士(国家癌症研究所癌症控制和人口科学司)的持续帮助,特别是为发起这项研究、向我们提供样本以及数据分析过程中的有益建议。我们衷心感谢弗雷德里克国家癌症研究实验室CCR测序基金的所有成员在样品制备和测序方面给予的帮助,特别是布伦达·霍在样品QC、奥克萨纳德语图书馆QC、塔蒂亚娜·斯米尔诺娃(Tatyana Smirnova)操作测序器方面给予的帮助。我们还要感谢测序设施生物信息学集团的沈蔡伟和阿什利·沃尔顿帮助数据分析和RNA-seq管道实施。我们还感谢 CCBR 和 NCBR 在 RNaseq 分析管道和最佳实践开发方面提供的援助。
2100 Bioanalyzer | Agilent | G2939BA | |
Agilent DNA 7500 Kit | Agilent | 5067-1506 | |
Agilent High Sensitivity DNA Kit | Agilent | 5067-4626 | |
Agilent RNA 6000 Nano Kit | Agilent | 5067-1511 | |
AllPrep DNA/RNA FFPE Kit | Qiagen | 80234 | |
CFX96 Touch System | Bio-Rad | 1855195 | |
Library Quantification kit v2-Illumina | KapaBiosystems | KK4824 | |
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina | New England Biolabs | E7765S | https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit |
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) | New England Biolabs | E6310L | |
NextSeq 500 Sequencing System | Illumina | SY-415-1001 | NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf |
NextSeq PhiX Control Kit | Illumina | FC-110-3002 | |
NSQ 500/550 Hi Output KT v2.5 (150 CYS) | Illumina | 20024907 | |
10X Genomics Magnetic Separator | 10X Genomics | 120250 | |
Rotator Multimixer | VWR | 13916-822 | |
C1000 Touch Thermal Cycler | Bio-Rad | 1851197 | |
Sequencing reagent kit | Illumina | 20024907 | |
Flow cell package | Illumina | 20024907 | |
Buffer cartridge and the reagent cartridge | Illumina | 20024907 | |
Sodium hydroxide solution (0.2N) | Millipore Sigma | SX0607D-6 | |
TRIS-HCL Buffer 1.0M, pH 7.0 | Fisher Scientific | 50-151-871 |