Summary

저하된 FFPE-RNA 시료의 시퀀싱 및 분석을 위한 최적화

Published: June 08, 2020
doi:

Summary

이 방법은 포르말린 고정 파라핀 임베디드(FFPE) RNA 샘플로부터 얻을 수 있는 서열 데이터의 질 및 양을 개선하는 단계를 설명한다. 우리는 FFPE-RNA 샘플의 품질을 보다 정확하게 평가하고, 시퀀싱 라이브러리를 준비하고, FFPE-RNA 샘플의 데이터를 분석하는 방법론을 설명합니다.

Abstract

RNA 시퀀싱(RNA-seq)에 의한 유전자 발현 분석은 잠재적으로 저항 및/또는 감수성 메커니즘뿐만 아니라 다양한 질병의 기초에 대한 기계적 이해로 이어질 수 있는 임상 샘플에 대한 고유한 통찰력을 가능하게 합니다. 그러나, 임상 견본에 있는 조직 형태를 보존하기 위한 일반적인 방법을 나타내는 FFPE 조직은, 유전자 발현 프로파일링 분석을 위한 제일 근원이 아닙니다. 이러한 샘플에서 얻은 RNA는 종종 분해, 단편화 및 화학적으로 변형되어 최적이 아닌 시퀀싱 라이브러리로 이어집니다. 차례로, 이들은 유전자 발현 분석 및 돌연변이 발견을 위해 믿을 수 없을 지도 모르다 나쁜 질 순서 데이터를 생성합니다. FFPE 샘플을 최대한 활용하고 품질이 낮은 샘플에서 최상의 데이터를 얻으려면 실험 설계를 계획하고 시퀀싱 라이브러리를 준비하며 데이터 분석 중에 특정 예방 조치를 취하는 것이 중요합니다. 여기에는 정밀한 시료 품질 관리(QC)에 적합한 메트릭의 사용, 시퀀싱 라이브러리 생성 동안 다양한 단계에 가장 적합한 방법 식별, 신중한 라이브러리 QC 등이 포함됩니다. 또한 RNA-seq 데이터에서 아티팩트를 식별하고, 오염 및 낮은 품질 판독을 필터링하고, 유전자 커버리지의 균일성을 평가하고, 생물학적 복제물 중 유전자 발현 프로필의 재현성을 측정하기 위해서는 서열 데이터 분석을 위한 올바른 소프트웨어 도구 및 매개 변수를 적용하는 것이 중요합니다. 이러한 단계는 매우 이질적인 RNA 샘플의 프로파일링을 위한 높은 정확도와 재현성을 보장할 수 있습니다. 여기에서 우리는 FFPE RNA 조직에서 얻은 것과 같은 낮은 품질의 RNA로부터 얻은 유용한 데이터의 양을 증가시키는 데 도움이 될 수 있는 샘플 QC, 라이브러리 준비 및 QC, 시퀀싱 및 데이터 분석을 위한 다양한 단계를 설명합니다.

Introduction

차세대 염기서열 분석 방식을 사용하여 다양한 유형의 샘플에서 풍부한 정보를 얻을 수 있었습니다. 그러나 오래되고 잘 보존되지 않은 샘플은 시퀀스 데이터를 생성하는 일반적으로 사용되는 방법에 대해 작동하지 않으며 종종 잘 설정된 프로토콜을 수정해야 합니다. FFPE 조직은 임상 시편1,2,3에,3널리 활용되어 온 이러한 샘플 유형을 나타낸다. FFPE 보존은 조직 형태를 유지하는 동안, FFPE 조직에 있는 핵산은 일반적으로 각종 무질서의 밑에 분자 기계장치에 관하여 중요한 통찰력으로 이끌어 낼 수 있는 게놈 정보를 검색하는 것을 어렵게 만드는 손상 및 분해의 넓은 범위를 전시합니다.

RNA 염기서열 분석에 의해 생성된 유전자 발현 데이터는 종종 질병 및 저항 메커니즘을 연구하는 데 중요한 역할을 하며 DNA 돌연변이 분석을 보완합니다. 그러나, RNA는 FFPE 조직에서 정확한 유전자 발현 데이터를 생성하는 것이 더 도전적이기 때문에 분해에 더 취약합니다. 더욱이, 시퀀싱의 광범위한 가용성 및 경제성이 비교적 최근이기 때문에, 오래된 표본은 종종 RNA 무결성을 보존하는 데 필요한 조건에서 저장되지 않았다. FFPE 견본을 위한 문제점의 몇몇은 파라핀에 포함하기 때문에 RNA의 분해, 시퀀싱에 요구되는 효소 프로세스에 단편화 또는 불응성으로 이끌어 내는 RNA의 화학적 수정, 및 폴리 A 꼬리의 손실을 포함합니다, 역전사제4를위한 프라이머로 올리고-dT의 적용성을 제한하는. 또 다른 과제는 조직에 있는 RNA와 같은 불안정한 분자의 추가 저하로 이끌어 낼 수 있는 최적이 아닌 조건의 FFPE 견본의 취급/저장입니다5. 이것은 RNA 염기서열 분석에 의한 유전자 발현 분석이 견본을 위해 예상되지 않았을 때 한 번에 집합되었을 수 있는 오래된 견본을 위해 특히 관련이 있습니다. 이러한 모든 경우 유용한 서열 데이터를 생성하는데 사용할 수 있는 추출된 RNA의 품질 및 양이 감소합니다. 성공 확률이 낮고, 시퀀싱 비용이 높기 때문에 많은 연구자들이 잠재적으로 유용한 FFPE 샘플에서 유전자 발현 데이터를 생성하고 분석하지 못하게 되었습니다. 최근 몇 년 동안 의 몇몇 연구 결과는 더 적은 및/또는 더 최근 견본을 위한 이기는 하지만 유전자 발현 분석2,,6,,7,,8,,9를위한 FFPE 조직의 유용성을 설명했습니다.

타당성 조사로서, 우리는 RNA 시퀀싱 및 유전자 발현 분석을 위한 감시, 역학 및 최종 결과(SEER) 암 레지스트리로부터 3개의 잔류 조직 저장소로부터 FFPE 종양 조직 표본으로부터 추출된 RNA를 사용하였다10. 임상 병리학 실험실에서 조달, 고급 난소 장액 선암에서 FFPE 조직은 RNA 추출 하기 전에 다양 한 조건 하에서 7-32 년에서 저장 되었다. 대부분의 경우에 이 블록은 미래에 어떤 민감한 유전 분석든지의 기대 없이 년 동안 다른 사이트에 저장되었기 때문에, 핵산을 보존하기 위하여 많은 주의를 취하지 않았습니다. 따라서, 대부분의 견본은 박테리아로 오염된 견본의 큰 비율로, 나쁜 질 RNA를 전시했습니다. 그럼에도 불구하고, 우리는 유전자 정량화를 수행하고, 유전자 커버리지의 균일성 및 연속성을 측정하고, 재현성을 측정하기 위해 생물학적 복제중 Pearson 상관 분석을 수행할 수 있었습니다. 주요 서명 유전자 패널의 세트에 기초하여, 우리는 암 게놈 아틀라스 (TCGA) 데이터와 우리의 연구 결과에 있는 견본을 비교하고 견본의 대략 60%가 비교한 유전자 발현 단면도11가있었다는 것을 확인했습니다. 다양한 QC 결과와 샘플 메타데이터 간의 상관관계를 바탕으로, 사용 가능한 시퀀스 데이터를 생성할 가능성이 높은 샘플을 식별하기 위한 예측 값이 좋은 주요 QC 메트릭을확인했습니다 11.

여기에서는 FFPE-RNA 품질 평가, 추출된 RNA 샘플에서 시작되는 시퀀싱 라이브러리 생성 및 시퀀싱 데이터의 생물 정보 분석에 사용되는 방법론을 설명합니다.

Protocol

1. RNA 수량 및 품질 평가 미리 정의된 기준에 따라 FFPE 샘플을 선택하고 적절한 방법(예를 들어, FFPE-핵산 추출 키트, 재료 표)을사용하여 RNA를 추출한다.참고 : FFPE-RNA 추출에 사용할 수있는 몇 가지 다른 방법이 있으며, 아주 적은 조직으로 작동하고 양질의 RNA12,13,,14를추출 할 수있는 새로운 미세 해부 방?…

Representative Results

위에서 설명한 방법론은 7-32년 동안 다양한 조건하에서 저장된 67개의 FFPE 샘플에 적용하였다(중앙값 시료 저장 시간은 17.5년이었다). 여기에 제시된 데이터 집합 및 분석 결과는 Zhao 등11에이전에 기술되고 출판되었습니다. 앞에서 설명한 바와 같이 샘플 품질을 검사할 때(즉, 도 2의예시 트레이스), DV100은 고열RNA 샘플에 대한 더 작은 단편 크기의 비…

Discussion

여기에 설명된 방법은 FFPE-RNA 샘플에서 양호한 서열 데이터를 얻는 데 필요한 주요 단계를 간략하게 설명합니다. 이 방법으로 고려해야 할 주요 사항은 다음과 같습니다: (1) 샘플 취급 및 동결 및 해동 주기를 최소화하여 추출 후 RNA가 가능한 한 잘 보존되도록 하십시오. 별도의 QC aliquots는 매우 유용합니다. (2) 지정된 샘플 세트에 가장 적합한 QC 메트릭을 사용합니다. RIN 값 및 DV200은 종종 …

Disclosures

The authors have nothing to disclose.

Acknowledgements

우리는 다니엘 캐릭 박사에게 감사드립니다 (암 통제 및 인구 과학의 부, 국립 암 연구소) 지속적인 도움, 특히이 연구를 시작하고, 샘플을 제공하고, 데이터 분석 중에 유용한 제안을 위해. 우리는 진심으로 샘플 준비 및 시퀀싱 동안 자신의 도움을 위해 암 연구를위한 프레드릭 국립 연구소의 CCR 시퀀싱 시설의 모든 구성원에게 감사드립니다, 샘플 QC에 도움을 특히 브렌다 호, 도서관 QC에 대한 옥사나 독일어, 시퀀서를 실행하기위한 타티아나 스미르노바. 우리는 또한 데이터 분석 및 RNA-seq 파이프라인 구현을 돕는 시퀀싱 시설 생물 정보학 그룹의 Tsai-wei Shen및 애슐리 월튼에게 감사드립니다. 또한 RNaseq 분석 파이프라인 및 모범 사례 개발에 대한 지원을 위해 CCBR 및 NCBR에 감사드립니다.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video