Summary

Optimalisatie voor sequencing en analyse van gedegradeerde FFPE-RNA Samples

Published: June 08, 2020
doi:

Summary

Deze methode beschrijft de stappen om de kwaliteit en kwantiteit van sequentiegegevens te verbeteren die kunnen worden verkregen uit formeel vaste paraffine-embedded (FFPE) RNA-monsters. We beschrijven de methodologie om de kwaliteit van FFPE-RNA-monsters nauwkeuriger te beoordelen, sequencingbibliotheken voor te bereiden en de gegevens van FFPE-RNA-monsters te analyseren.

Abstract

Genexpressieanalyse door RNA-sequencing (RNA-seq) maakt unieke inzichten mogelijk in klinische monsters die mogelijk kunnen leiden tot mechanistisch begrip van de basis van verschillende ziekten, resistentie en/of gevoeligheidsmechanismen. FFPE-weefsels, die de meest voorkomende methode vormen voor het behoud van weefselmorfologie in klinische specimens, zijn echter niet de beste bronnen voor genexpressieprofileringsanalyse. Het RNA verkregen uit dergelijke monsters wordt vaak afgebroken, gefragmenteerd en chemisch gewijzigd, wat leidt tot suboptimale sequencing bibliotheken. Deze genereren op hun beurt gegevens van slechte kwaliteit sequentie die mogelijk niet betrouwbaar zijn voor genexpressieanalyse en mutatiedetectie. Om optimaal gebruik te maken van FFPE-monsters en de best mogelijke gegevens te verkrijgen uit monsters van lage kwaliteit, is het belangrijk om bepaalde voorzorgsmaatregelen te nemen tijdens het plannen van experimenteel ontwerp, het voorbereiden van sequencing bibliotheken en tijdens data-analyse. Dit omvat het gebruik van geschikte statistieken voor nauwkeurige steekproefkwaliteitscontrole (QC), het identificeren van de beste methoden voor verschillende stappen tijdens het genereren van sequencing-bibliotheek en zorgvuldige bibliotheek QC. Daarnaast is het toepassen van de juiste softwaretools en parameters voor sequentiegegevensanalyse van cruciaal belang om artefacten in RNA-seq-gegevens te identificeren, besmetting en lage kwaliteit te lezen, uniformiteit van gendekking te beoordelen en de reproduceerbaarheid van genexpressieprofielen onder biologische replicaties te meten. Deze stappen kunnen zorgen voor een hoge nauwkeurigheid en reproduceerbaarheid voor profilering van zeer heterogene RNA-monsters. Hier beschrijven we de verschillende stappen voor voorbeeld QC, bibliotheekvoorbereiding en QC, sequencing en gegevensanalyse die kunnen helpen om de hoeveelheid nuttige gegevens verkregen uit RNA van lage kwaliteit te verhogen, zoals die verkregen uit FFPE-RNA-weefsels.

Introduction

Het gebruik van de volgende generatie sequencing benaderingen heeft ons in staat gesteld om een schat aan informatie uit verschillende soorten monsters te verzamelen. Oude en slecht bewaarde monsters blijven echter onwerkbaar voor de veelgebruikte methoden voor het genereren van sequentiegegevens en vereisen vaak wijzigingen in gevestigde protocollen. FFPE-weefsels vertegenwoordigen een dergelijk monstertype dat op grote schaal is gebruikt voor klinische specimens1,2,3. Terwijl FFPE behoud onderhoudt weefselmorfologie, de nucleïnezuren in FFPE weefsels vertonen meestal een breed scala van schade en afbraak, waardoor het moeilijk is om de genomische informatie die kan leiden tot belangrijke inzichten over moleculaire mechanismen die ten grondslag liggen aan verschillende aandoeningen op te halen.

Genexpressiegegevens gegenereerd door RNA-sequencing zijn vaak instrumenteel bij het bestuderen van ziekte- en resistentiemechanismen en vormen een aanvulling op de dna-mutatieanalyse. RNA is echter gevoeliger voor afbraak, waardoor het moeilijker wordt om nauwkeurige genexpressiegegevens uit FFPE-weefsels te genereren. Bovendien, omdat de brede beschikbaarheid en betaalbaarheid van sequencing relatief recent is, werden oudere exemplaren vaak niet opgeslagen in omstandigheden die nodig zijn om de RNA-integriteit te behouden. Enkele van de problemen voor FFPE monsters omvatten afbraak van RNA als gevolg van inbedding in paraffine, chemische modificatie van RNA leidt tot fragmentatie of refractoriness tot enzymatische processen die nodig zijn voor sequencing, en verlies van de poly-A staarten, het beperken van de toepasbaarheid van oligo-dT als een inleiding voor reverse transcripte4. Een andere uitdaging is de behandeling/opslag van FFPE-monsters onder suboptimale omstandigheden, wat kan leiden tot verdere afbraak van labiele moleculen zoals RNA in de weefsels5. Dit is vooral relevant voor oudere monsters die kunnen zijn verzameld op een moment dat genexpressie analyse door RNA sequencing niet werd verwacht voor de monsters. Al deze leiden tot verminderde kwaliteit en kwantiteit van het geëxtraheerde RNA beschikbaar voor het genereren van nuttige sequentiegegevens. De lage kans op succes, gecombineerd met de hoge kosten van sequencing, heeft veel onderzoekers ervan weerhouden om genexpressiegegevens te genereren en te analyseren uit potentieel nuttige FFPE-monsters. Sommige studies in de afgelopen jaren hebben aangetoond dat de bruikbaarheid van FFPE weefsels voor genexpressie analyse2,6,7,8,9, zij het voor minder en / of meer recente monsters.

Als haalbaarheidsstudie gebruikten we RNA uit FFPE-tumorweefselmonsters uit drie Residual Tissue Repositories van Surveillance, Epidemiologie en End Results (SEER) kankerregisters voor RNA-sequencing en genexpressieanalyse10. De FFPE-weefsels van hoogwaardige eierstokkanker werden van 7-32 jaar onder wisselende omstandigheden opgeslagen voor RNA-extractie. Omdat in de meeste gevallen deze blokken jarenlang op verschillende locaties waren opgeslagen zonder de verwachting van een gevoelige genetische analyse in de toekomst, was er niet veel zorg genomen om de nucleïnezuren te behouden. Zo, de meeste van de monsters tentoongesteld slechte kwaliteit RNA, met een groot deel van de monsters besmet met bacteriën. Niettemin waren we in staat om genkwantificering uit te voeren, de uniformiteit en continuïteit van gendekking te meten en de Pearson correlatieanalyse uit te voeren tussen biologische replica’s om reproduceerbaarheid te meten. Op basis van een set van de belangrijkste handtekening genpaneel, vergeleken we de monsters in onze studie met The Cancer Genome Atlas (TCGA) gegevens en bevestigd dat ongeveer 60% van de monsters had vergelijkbare genexpressie profielen11. Op basis van de correlatie tussen verschillende QC-resultaten en voorbeeldmetadata, hebben we belangrijke QC-statistieken geïdentificeerd die een goede voorspellende waarde hebben voor het identificeren van monsters die eerder bruikbare sequentiegegevens genereren11.

Hier beschrijven we de methodologie die wordt gebruikt voor ffpe-RNA kwaliteitsbeoordeling, het genereren van sequencing bibliotheken vanaf geëxtraheerde RNA monsters, en bio-informatica analyse van de sequencing gegevens.

Protocol

1. RNA-kwantiteit en kwaliteitsbeoordeling Selecteer de FFPE-monsters op basis van vooraf gedefinieerde criteria en extraheer RNA met behulp van een geschikte methode (bijvoorbeeld FFPE-nuclei zuur extractiekit, tabel van materialen).OPMERKING: Er zijn verschillende methoden beschikbaar voor FFPE-RNA extractie, waaronder de nieuwere microdissection methoden die kunnen werken met zeer weinig weefsel en extract goede kwaliteit RNA12,13</sup…

Representative Results

De hierboven beschreven methode werd toegepast op 67 FFPE-monsters die gedurende 7-32 jaar onder verschillende omstandigheden waren opgeslagen (de mediane opslagtijd van monsters was 17,5 jaar). De hier gepresenteerde dataset- en analyseresultaten werden eerder beschreven en gepubliceerd in Zhao et al.11. Bij het controleren van de monsterkwaliteit zoals eerder beschreven (d.w.z. voorbeeldsporen in figuur 2)bleek DV100 nuttiger te zijn dan DV200 …

Discussion

De hier beschreven methode schetst de belangrijkste stappen die nodig zijn om goede sequentiegegevens te verkrijgen van FFPE-RNA-monsters. De belangrijkste punten om met deze methode rekening mee te houden zijn: (1) Zorg ervoor dat het RNA na extractie zo goed mogelijk wordt bewaard door de behandeling van het monster en het bevriezen en ontdooien van cycli te minimaliseren. Aparte QC aliquots zijn zeer nuttig. (2) Gebruik een QC-statistiek die het beste is voor de gegeven sampleset. RIN-waarden en DV200 zijn …

Disclosures

The authors have nothing to disclose.

Acknowledgements

We zijn dr. Danielle Carrick (Division of Cancer Control and Population Sciences, National Cancer Institute) dankbaar voor voortdurende hulp, vooral voor het initiëren van deze studie, ons te voorzien van de monsters, en voor nuttige suggesties tijdens data-analyse. Wij danken alle leden van de CCR Sequencing Facility van het Frederick National Laboratory for Cancer Research voor hun hulp tijdens de voorbereiding van de steekproef en sequencing, vooral Brenda Ho voor hulp in monster QC, Oksana Duits voor bibliotheek QC, Tatyana Smirnova voor het runnen van de sequencers. We willen ook Tsai-wei Shen en Ashley Walton van Sequencing Facility Bioinformatics Group bedanken voor hun hulp bij data-analyse en RNA-seq pipeline implementation. We danken ccbr en NCBR ook voor hulp bij de analysepijplijn van RNaseq en de ontwikkeling van best practices.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video