Summary

Ottimizzazione per il sequenziamento e l'analisi di campioni FFPE-RNA degradati

Published: June 08, 2020
doi:

Summary

Questo metodo descrive i passaggi per migliorare la qualità e la quantità dei dati di sequenza che possono essere ottenuti da campioni di RNA incorporati in paraffina fissata alla formalina (FFPE). Descriviamo la metodologia per valutare in modo più accurato la qualità dei campioni di FFPE-RNA, preparare le librerie di sequenziamento e analizzare i dati provenienti da campioni DI FFPE-RNA.

Abstract

L’analisi dell’espressione genica mediante il sequenziamento dell’RNA (RNA-seq) consente informazioni uniche su campioni clinici che possono potenzialmente portare a una comprensione meccanicistica della base di varie malattie, nonché ai meccanismi di resistenza e/o suscettibilità. Tuttavia, i tessuti FFPE, che rappresentano il metodo più comune per preservare la morfologia dei tessuti nei campioni clinici, non sono le migliori fonti per l’analisi della profilazione dell’espressione genica. L’RNA ottenuto da tali campioni è spesso degradato, frammentato e modificato chimicamente, il che porta a librerie di sequenziamento non ottimali. A loro volta, questi generano dati di sequenza di scarsa qualità che potrebbero non essere affidabili per l’analisi dell’espressione genica e la scoperta della mutazione. Al fine di sfruttare al meglio i campioni FFPE e ottenere i migliori dati possibili da campioni di bassa qualità, è importante prendere alcune precauzioni durante la pianificazione della progettazione sperimentale, la preparazione delle librerie di sequenziamento e durante l’analisi dei dati. Ciò include l’uso di metriche appropriate per un controllo qualità di esempio preciso (QC), l’identificazione dei metodi migliori per i vari passaggi durante la generazione della libreria di sequenziamento e un’attenta libreria QC. Inoltre, l’applicazione di strumenti software e parametri corretti per l’analisi dei dati di sequenza è fondamentale per identificare gli artefatti nei dati RNA-seq, filtrare la contaminazione e leggere di bassa qualità, valutare l’uniformità della copertura genica e misurare la riproducibilità dei profili di espressione genica tra le repliche biologiche. Questi passaggi possono garantire un’elevata precisione e riproducibilità per la profilazione di campioni di RNA molto eterogenei. Qui descriviamo i vari passaggi per il QC di esempio, la preparazione della libreria e il QC, il sequenziamento e l’analisi dei dati che possono contribuire ad aumentare la quantità di dati utili ottenuti da RNA di bassa qualità, come quello ottenuto dai tessuti FFPE-RNA.

Introduction

L’uso di approcci di sequenziamento di nuova generazione ci ha permesso di ottenere una grande quantità di informazioni da vari tipi di campioni. Tuttavia, i campioni vecchi e mal conservati rimangono inutilizzabili per i metodi comunemente utilizzati per generare dati di sequenza e spesso richiedono modifiche a protocolli consolidati. I tessuti FFPE rappresentano un tale tipo di campione che è stato ampiamente utilizzato per i campioni clinici1,2,3. Mentre la conservazione FFPE mantiene la morfologia dei tessuti, gli acidi nucleici nei tessuti FFPE di solito presentano una vasta gamma di danni e degradazione, rendendo difficile recuperare le informazioni genomiche che possono portare a importanti intuizioni sui meccanismi molecolari alla base di vari disturbi.

I dati sull’espressione genica generati dal sequenziamento dell’RNA sono spesso fondamentali per studiare i meccanismi di malattia e resistenza e integrano l’analisi della mutazione del DNA. Tuttavia, l’RNA è più suscettibile alla degradazione, il che rende più difficile generare dati accurati sull’espressione genica dai tessuti FFPE. Inoltre, poiché l’ampia disponibilità e convenienza del sequenziamento è relativamente recente, gli esemplari più vecchi spesso non sono stati immagazzinati nelle condizioni necessarie per preservare l’integrità dell’RNA. Alcuni dei problemi per i campioni di FFPE includono la degradazione dell’RNA a causa dell’incorporamento in paraffina, la modifica chimica dell’RNA che porta alla frammentazione o alla refrattanza ai processi enzimatici necessari per il sequenziamento e la perdita delle code poli-A, limitando l’applicabilità dell’oligo-dT come primer per la tranciatura inversa4. Un’altra sfida è la manipolazione/archiviazione di campioni di FFPE in condizioni non ottimali, che può portare a un’ulteriore degradazione delle molecole labili come l’RNA nei tessuti5. Ciò è particolarmente rilevante per i campioni più vecchi che potrebbero essere stati raccolti in un momento in cui l’analisi dell’espressione genica mediante il sequenziamento dell’RNA non era prevista per i campioni. Tutto ciò porta a una diminuzione della qualità e della quantità dell’RNA estratto disponibili per la generazione di dati di sequenza utili. La bassa probabilità di successo, combinata con l’alto costo del sequenziamento, ha dissuaso molti ricercatori dal cercare di generare e analizzare i dati dell’espressione genica da campioni FFPE potenzialmente utili. Alcuni studi negli ultimi anni hanno dimostrato l’usabilità dei tessuti FFPE per l’analisi dell’espressione genica2,6,7,8,9, anche se per meno campioni e/o più recenti.

Come studio di fattibilità, abbiamo utilizzato l’RNA estratto da campioni di tessuto tumorale FFPE da tre repository di tessuti residui da registri di sorveglianza, epidemiologia e risultati finali (SEER) per il sequenziamento dell’RNA e l’analisi dell’espressione genica10. Procurati da laboratori di patologia clinica, i tessuti FFPE da adenocarcinomi sigillanti ovarici di alta qualità sono stati conservati da 7 a 32 anni in condizioni variabili prima dell’estrazione dell’RNA. Poiché nella maggior parte dei casi questi blocchi erano stati immagazzinati in siti diversi per anni senza l’aspettativa di alcuna analisi genetica sensibile in futuro, non era stata prestata molta attenzione per preservare gli acidi nucleici. Così, la maggior parte dei campioni esibivano RNA di scarsa qualità, con una grande percentuale di campioni contaminati da batteri. Tuttavia, siamo stati in grado di eseguire la quantificazione genica, misurare l’uniformità e la continuità della copertura genica ed eseguire l’analisi della correlazione di Pearson tra repliche biologiche per misurare la riproducibilità. Sulla base di una serie di pannelli genetici chiave, abbiamo confrontato i campioni nel nostro studio con i dati di The Cancer Genome Atlas (TCGA) e abbiamo confermato che circa il 60% dei campioni aveva profili di espressione genica comparabili11. In base alla correlazione tra vari risultati QC e metadati di esempio, abbiamo identificato le metriche chiave di Controllo qualità che hanno un buon valore predittivo per identificare i campioni che hanno maggiori probabilità di generare dati di sequenza utilizzabili11.

Qui descriviamo la metodologia utilizzata per la valutazione della qualità FFPE-RNA, la generazione di librerie di sequenziamento a partire da campioni di RNA estratti e l’analisi bioinformatica dei dati di sequenziamento.

Protocol

1. Quantità di RNA e valutazione della qualità Selezionare i campioni FFPE in base a criteri predefiniti ed estrarre l’RNA utilizzando un metodo appropriato (ad esempio, kit di estrazione acido FFPE-nuclei, tabella dei materiali).NOTA: Ci sono diversi metodi disponibili per l’estrazione FFPE-RNA, tra cui i metodi di microdissezione più recenti che possono funzionare con pochissimi tessuti ed estrarre RNA di buona qualità12,13<su…

Representative Results

La metodologia descritta in precedenza è stata applicata a 67 campioni di FFPE che erano stati conservati in una varietà di condizioni diverse per 7-32 anni (il tempo di conservazione dei campioni mediani era di 17,5 anni). I dati del set di dati e dell’analisi qui presentati sono stati descritti in precedenza e pubblicati in. Per controllare la qualità del campione come descritto in precedenza (ad esempio, le tracce di esempio nella figura 2),DV100 è r…

Discussion

Il metodo descritto qui descrive i passaggi principali necessari per ottenere buoni dati di sequenza da campioni di FFPE-RNA. I punti principali da considerare con questo metodo sono: (1) Assicurarsi che l’RNA sia preservato al meglio dopo l’estrazione riducendo al minimo la manipolazione del campione e il congelamento e lo scongelamento dei cicli. Aliquote QC separate sono molto utili. (2) Utilizzare una metrica QC che è migliore per il set di campioni specificato. I valori RIN e DV200 spesso non sono utili …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Siamo grati alla Dott.ssa Danielle Carrick (Division of Cancer Control and Population Sciences, National Cancer Institute) per l’aiuto continuo, in particolare per l’introduzione di questo studio, fornendoci i campioni e per suggerimenti utili durante l’analisi dei dati. Ringraziamo sinceramente tutti i membri del CCR Sequencing Facility presso il Frederick National Laboratory for Cancer Research per il loro aiuto durante la preparazione del campione e il sequenziamento, in particolare Brenda Ho per l’assistenza nel campione QC, Oksana German per la biblioteca QC, Tatyana Smirnova per l’esecuzione dei sequencer. Vorremmo anche ringraziare Tsai-wei Shen e Ashley Walton presso Sequencing Facility Bioinformatics Group per aver contribuito con l’analisi dei dati e l’implementazione della pipeline RNA-seq. Ringraziamo anche CCBR e NCBR per assistenza con la pipeline di analisi RNaseq e lo sviluppo di best practice.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video