Summary

Optimierung zur Sequenzierung und Analyse degradierter FFPE-RNA-Proben

Published: June 08, 2020
doi:

Summary

Diese Methode beschreibt die Schritte zur Verbesserung der Qualität und Quantität der Sequenzdaten, die aus formal in-fixierten Paraffin-eingebetteten (FFPE) RNA-Proben gewonnen werden können. Wir beschreiben die Methodik zur genaueren Bewertung der Qualität von FFPE-RNA-Proben, bereiten Sequenzierungsbibliotheken vor und analysieren die Daten aus FFPE-RNA-Proben.

Abstract

Die Genexpressionsanalyse durch RNA-Sequenzierung (RNA-Seq) ermöglicht einzigartige Einblicke in klinische Proben, die potenziell zu einem mechanistischen Verständnis der Grundlagen verschiedener Krankheiten sowie Resistenz- und/oder Anfälligkeitsmechanismen führen können. FFPE-Gewebe, die die häufigste Methode zur Erhaltung der Gewebemorphologie in klinischen Proben darstellen, sind jedoch nicht die besten Quellen für die Genexpressionsprofilanalyse. Die aus solchen Proben gewonnene RNA wird oft abgebaut, fragmentiert und chemisch modifiziert, was zu suboptimalen Sequenzierungsbibliotheken führt. Diese wiederum erzeugen Sequenzdaten schlechter Qualität, die für die Genexpressionsanalyse und Mutationsermittlung möglicherweise nicht zuverlässig sind. Um das Beste aus FFPE-Proben zu machen und die bestmöglichen Daten aus minderwertigen Proben zu erhalten, ist es wichtig, bestimmte Vorsichtsmaßnahmen zu treffen, während der Planung des experimentellen Entwurfs, der Vorbereitung von Sequenzierungsbibliotheken und bei der Datenanalyse. Dazu gehören die Verwendung geeigneter Metriken für die präzise Stichprobenqualitätskontrolle (QC), die Ermittlung der besten Methoden für verschiedene Schritte während der Generierung der Sequenzierungsbibliothek und die sorgfältige Bibliothek QC. Darüber hinaus ist die Anwendung korrekter Software-Tools und Parameter für die Sequenzdatenanalyse von entscheidender Bedeutung, um Artefakte in RNA-seq-Daten zu identifizieren, Kontaminationen und Lesewerte niedriger Qualität herauszufiltern, die Homogenität der Genabdeckung zu bewerten und die Reproduzierbarkeit von Genexpressionsprofilen zwischen biologischen Replikationen zu messen. Diese Schritte können eine hohe Genauigkeit und Reproduzierbarkeit für die Profilierung sehr heterogener RNA-Proben gewährleisten. Hier beschreiben wir die verschiedenen Schritte für Die Probe QC, Bibliotheksvorbereitung und QC, Sequenzierung und Datenanalyse, die dazu beitragen können, die Menge an nützlichen Daten aus minderwertiger RNA zu erhöhen, wie die aus FFPE-RNA-Geweben.

Introduction

Die Verwendung von Sequenzierungsansätzen der nächsten Generation hat es uns ermöglicht, eine Fülle von Informationen aus verschiedenen Arten von Stichproben zu erhalten. Alte und schlecht erhaltene Beispiele sind jedoch für die häufig verwendeten Methoden zur Generierung von Sequenzdaten nach wie vor nicht praktikabel und erfordern häufig Änderungen an etablierten Protokollen. FFPE-Gewebe stellen einen solchen Probentyp dar, der für klinische Proben1,2,3weit verbreitet ist. Während die FFPE-Konservierung die Gewebemorphologie aufrechterhält, weisen die Nukleinsäuren in FFPE-Geweben in der Regel eine breite Palette von Schäden und Abbau auf, was es schwierig macht, die genomischen Informationen abzurufen, die zu wichtigen Erkenntnissen über molekulare Mechanismen führen können, die verschiedenen Störungen zugrunde liegen.

Genexpressionsdaten, die durch RNA-Sequenzierung generiert werden, sind oft entscheidend für die Untersuchung von Krankheits- und Resistenzmechanismen und ergänzen die DNA-Mutationsanalyse. Die RNA ist jedoch anfälliger für Degradation, was es schwieriger macht, genaue Genexpressionsdaten aus FFPE-Geweben zu generieren. Da die große Verfügbarkeit und Erschwinglichkeit der Sequenzierung relativ jung ist, wurden ältere Proben oft nicht unter Bedingungen gelagert, die zur Erhaltung der RNA-Integrität erforderlich sind. Einige der Probleme für FFPE-Proben sind der Abbau der RNA durch einbetten in Paraffin, die chemische Modifikation von RNA, die zu Fragmentierung oder Refraktorik zu enzymatischen Prozessen führt, die für die Sequenzierung erforderlich sind, und der Verlust der Poly-A-Schwänze, wodurch die Anwendbarkeit von Oligo-dT als Primer für die Reverse-Transkriptase4begrenzt wird. Eine weitere Herausforderung ist die Handhabung/Lagerung von FFPE-Proben unter suboptimalen Bedingungen, was zu einem weiteren Abbau von labilen Molekülen wie RNA in den Geweben führen kann5. Dies ist besonders relevant für ältere Proben, die zu einer Zeit gesammelt wurden, als eine Genexpressionsanalyse durch RNA-Sequenzierung für die Proben nicht erwartet wurde. All dies führt zu einer verminderten Qualität und Quantität der extrahierten RNA, die für die Generierung nützlicher Sequenzdaten zur Verfügung steht. Die geringe Erfolgswahrscheinlichkeit in Verbindung mit den hohen Kosten der Sequenzierung hat viele Forscher davon abgebracht, Genexpressionsdaten aus potenziell nützlichen FFPE-Proben zu generieren und zu analysieren. Einige Studien in den letzten Jahren haben die Nutzbarkeit von FFPE-Geweben für die Genexpressionsanalyse2,6,7,8,9, wenn auch für weniger und/oder neuere Proben gezeigt.

Als Machbarkeitsstudie verwendeten wir RNA, die aus FFPE-Tumorgewebeproben aus drei Residual Tissue Repositories aus Surveillance, Epidemiology, and End Results (SEER) Krebsregisterfürarbeitung für RNA-Sequenzierung und Genexpressionsanalyse extrahiert wurde10. Die FFPE-Gewebe aus hochgradigen ovarischen serösen Adenokarzinomen wurden von 7 bis 32 Jahren unter unterschiedlichen Bedingungen vor der RNA-Extraktion gelagert. Da diese Blöcke in den meisten Fällen jahrelang an verschiedenen Stellen gelagert worden waren, ohne dass in Zukunft eine sensible genetische Analyse erwartet wurde, wurde nicht viel darauf geachtet, die Nukleinsäuren zu erhalten. So zeigten die meisten Proben eine qualitativ minderwertige RNA, wobei ein großer Teil der Proben mit Bakterien kontaminiert war. Nichtsdestotrotz konnten wir genquantifiziert, die Homogenität und Kontinuität der Genabdeckung messen und die Pearson-Korrelationsanalyse zwischen biologischen Replikationen durchführen, um die Reproduzierbarkeit zu messen. Basierend auf einer Reihe von Schlüssel-Signatur-Gen-Panel, verglichen wir die Proben in unserer Studie mit The Cancer Genome Atlas (TCGA) Daten und bestätigte, dass etwa 60% der Proben hatten vergleichbare Genexpressionsprofile11. Basierend auf der Korrelation zwischen verschiedenen QC-Ergebnissen und Beispielmetadaten identifizierten wir wichtige QC-Metriken, die einen guten Vorhersagewert für die Identifizierung von Stichproben haben, die eher verwendbare Sequenzdaten generieren11.

Hier beschreiben wir die Methodik für die FFPE-RNA-Qualitätsbewertung, die Generierung von Sequenzierungsbibliotheken ausgehend von extrahierten RNA-Proben und die bioinformatische Analyse der Sequenzierungsdaten.

Protocol

1. RNA-Quantitäts- und Qualitätsbewertung Wählen Sie die FFPE-Proben nach vordefinierten Kriterien aus und extrahieren Sie RNA nach einer geeigneten Methode (z.B. FFPE-Kernsäureextraktionskit, Tabelle der Materialien).HINWEIS: Es gibt verschiedene Methoden für die FFPE-RNA-Extraktion, einschließlich der neueren Mikrodissektionsmethoden, die mit sehr wenig Gewebe arbeiten und gute RNA12,,13,,14</sup…

Representative Results

Die oben beschriebene Methode wurde auf 67 FFPE-Proben angewendet, die 7–32 Jahre lang unter verschiedenen Bedingungen gelagert worden waren (die mediane Probenlagerzeit betrug 17,5 Jahre). Die hier vorgestellten Datenundanalyseergebnisse wurden zuvor in Zhao et al.11beschrieben und veröffentlicht. Bei der Überprüfung der Probenqualität, wie sie zuvor beschrieben wurde (d. h. Beispielspuren in Abbildung 2), erwies sich DV100 als nützlicher als DV<sub…

Discussion

Die hier beschriebene Methode beschreibt die wichtigsten Schritte, die erforderlich sind, um gute Sequenzdaten aus FFPE-RNA-Proben zu erhalten. Die wichtigsten Punkte, die bei dieser Methode zu berücksichtigen sind: (1) Stellen Sie sicher, dass die RNA nach der Extraktion so gut wie möglich erhalten bleibt, indem Sie die Probenhandhabung und die Gefrier- und Auftauzyklen minimieren. Separate QC-Aliquots sind sehr hilfreich. (2) Verwenden Sie eine QC-Metrik, die für den angegebenen Stichprobensatz am besten geeignet is…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wir danken Dr. Danielle Carrick (Abteilung für Krebsbekämpfung und Bevölkerungswissenschaften, National Cancer Institute) für die weitere Hilfe, insbesondere für die Einleitung dieser Studie, die Bereitstellung der Proben und für hilfreiche Vorschläge bei der Datenanalyse. Wir danken allen Mitgliedern der CCR-Sequenzierungsanlage am Frederick National Laboratory for Cancer Research für ihre Hilfe bei der Probenvorbereitung und -sequenzierung, insbesondere Brenda Ho für die Unterstützung in der Probe QC, Oksana German für die Bibliothek QC, Tatyana Smirnova für die Durchführung der Sequenzer. Wir danken auch Tsai-wei Shen und Ashley Walton von der Sequencing Facility Bioinformatics Group für ihre Unterstützung bei der Datenanalyse und der Implementierung von RNA-seq-Pipelines. Wir danken auch CCBR und NCBR für die Unterstützung bei der RNaseq-Analysepipeline und der Entwicklung von Best Practices.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video