Summary

Оптимизация для секвенирования и анализа деградированных образцов FFPE-РНК

Published: June 08, 2020
doi:

Summary

Этот метод описывает шаги по улучшению качества и количества последовательности данных, которые могут быть получены из формалина фиксированной парафин-встроенных (FFPE) РНК образцов. Мы описываем методологию для более точной оценки качества образцов FFPE-РНК, подготовки библиотек секвенирования и анализа данных из образцов FFPE-РНК.

Abstract

Анализ экспрессии генов с помощью секвенирования РНК (РНК-сек) позволяет получить уникальную информацию о клинических образцах, которые потенциально могут привести к механистическое понимание основы различных заболеваний, а также механизмов резистентности и/или восприимчивости. Тем не менее, ткани FFPE, которые представляют собой наиболее распространенный метод сохранения морфологии тканей в клинических образцах, не являются лучшими источниками для анализа экспрессии генов. РНК, полученная из таких образцов, часто деградирует, фрагментируется и химически модифицируется, что приводит к неоптимальному секвенированию библиотек. В свою очередь, они генерируют данные о низкой последовательности качества, которые могут быть ненадежными для анализа экспрессии генов и обнаружения мутаций. Для того чтобы максимально получить максимальную отдачу от образцов FFPE и получить наилучшие данные из образцов низкого качества, важно принять определенные меры предосторожности при планировании экспериментального проектирования, подготовке библиотек секвенирования и при анализе данных. Это включает в себя использование соответствующих метрик для точного контроля качества выборки (КК), определение лучших методов для различных шагов во время генерации библиотеки последовательности, и тщательной библиотеки КК. Кроме того, применение правильных программных средств и параметров для анализа последовательности данных имеет решающее значение для выявления артефактов в данных RNA-seq, фильтрации загрязнения и низкого качества считывания, оценки единообразия генного покрытия и измерения воспроизводимости профилей экспрессии генов среди биологических репликаций. Эти шаги могут обеспечить высокую точность и воспроизводимость для профилирования очень неоднородных образцов РНК. Здесь мы описываем различные шаги для образца КК, подготовки библиотеки и КК, секвенирования и анализа данных, которые могут помочь увеличить объем полезных данных, полученных из низкокачественной РНК, таких как полученные из тканей FFPE-РНК.

Introduction

Использование подходов к секвенированию следующего поколения позволило нам получить большой объем информации из различных типов образцов. Однако старые и плохо сохранившиеся образцы остаются неработоспособными для широко используемых методов генерации данных о последовательности и часто требуют внесения изменений в устоявшиеся протоколы. Ткани FFPE представляют собой такой тип образца, который был широко использован для клинических образцов1,,2,,3. В то время как сохранение FFPE поддерживает морфологию тканей, нуклеиновые кислоты в тканях FFPE обычно обладают широким спектром повреждений и деградации, что затрудняет получение геномной информации, которая может привести к важным представлениям о молекулярных механизмах, лежащих в основе различных расстройств.

Данные экспрессии генов, генерируемые секвенированием РНК, часто играют важную роль в изучении механизмов болезни и резистентности и дополняют анализ мутаций ДНК. Тем не менее, РНК более восприимчива к деградации, что делает его более сложным для получения точных данных экспрессии генов из тканей FFPE. Кроме того, поскольку широкая доступность и доступность секвенирования относительно недавняя, старые образцы часто не хранились в условиях, необходимых для сохранения целостности РНК. Некоторые из вопросов для образцов FFPE включают деградацию РНК из-за встраивания в парафина, химическая модификация РНК, приводящая к фрагментации или огнеупорности к ферментативным процессам, необходимым для секвенирования, и потеря поли-хвостов, ограничение применимости олиго-дТ в качестве грунтовки для обратной транскриптазы4. Еще одной проблемой является обработка/хранение образцов FFPE в неоптимальных условиях, что может привести к дальнейшей деградации молекул лабиля, таких как РНК в тканях5. Это особенно актуально для старых образцов, которые, возможно, были собраны в то время, когда анализ экспрессии генов путем секвенирования РНК не ожидался для образцов. Все это приводит к снижению качества и количества извлеченной РНК, доступных для генерации полезных данных последовательности. Низкая вероятность успеха, в сочетании с высокой стоимостью секвенирования, отговорила многих исследователей от попыток генерировать и анализировать данные экспрессии генов из потенциально полезных образцов FFPE. Некоторые исследования в последние годы продемонстрировали удобство использования тканей FFPE9для анализа экспрессии генов2,,6,,77,9,хотя и для меньшего количества и/ или более поздних образцов.

В качестве технико-экономического обоснования, мы использовали РНК, извлеченные из образцов ткани опухоли FFPE из трех остаточных хранилищ ткани от наблюдения, эпидемиологии и конечных результатов (SEER) раковых регистров для секвенирования РНК и анализа экспрессиигенов 10. Закупленные в клинических патологических лабораториях, ткани FFPE из высококачественных серозных аденокарциномы яичников хранились от 7-32 лет в различных условиях до извлечения РНК. Поскольку в большинстве случаев эти блоки хранились в разных местах в течение многих лет, не ожидая какого-либо чувствительного генетического анализа в будущем, не было принято большого вуза для сохранения нуклеиновой кислоты. Таким образом, большинство образцов продемонстрировали низкое качество РНК, при этом большая доля образцов была загрязнена бактериями. Тем не менее, мы смогли выполнить генную количественную оценку, измерить единообразие и непрерывность генного покрытия, а также выполнить анализ корреляции Пирсона среди биологических репликантов для измерения воспроизводимости. Основываясь на наборе ключевой панели генов подписи, мы сравнили образцы в нашем исследовании с данными Атлас агеногов рака (TCGA) и подтвердили, что примерно 60% образцов имели сопоставимые профили экспрессии генов11. Основываясь на корреляции между различными результатами КК и метаданными выборки, мы определили ключевые метрики КК, которые имеют хорошее прогностическое значение для определения образцов, которые с большей вероятностью генерируют пригодные для использования данные последовательности11.

Здесь мы описываем методологию, используемую для оценки качества FFPE-РНК, генерацию библиотек секвенирования, начиная с извлеченных образцов РНК, и биоинформатический анализ данных секвенирования.

Protocol

1. Оценка количества и качества РНК Выберите образцы FFPE в соответствии с заранее определенными критериями и извлеките РНК с помощью соответствующего метода (например, комплект для извлечения кислоты FFPE,, Таблица материалов).ПРИМЕЧАНИЕ: Есть несколько различных методов,…

Representative Results

Упомянутая выше методология была применена к 67 пробам FFPE, которые хранились в различных условиях в течение 7–32 лет (средний срок хранения выборки составлял 17,5 лет). Данные и результаты анализа, представленные здесь, были ранее описаны и опубликованы в Чжао и др.11. При провер?…

Discussion

Описанный здесь метод определяет основные шаги, необходимые для получения хороших данных о последовательности из образцов FFPE-РНК. Основными моментами, которые следует учитывать с помощью этого метода, являются: (1) Обеспечить, чтобы РНК сохранилась как можно лучше после извлечения путе…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Мы благодарны доктору Даниэль Кэррик (Отдел по борьбе с раком и наук о народонаселении, Национальный институт рака) за постоянную помощь, особенно за инициирование этого исследования, предоставляя нам образцы, и за полезные предложения во время анализа данных. Мы искренне благодарим всех членов CCR секвенирования фонда в Фредерик Ской Национальной лаборатории онкологических исследований за их помощь во время подготовки образцов и последовательности, особенно Бренда Хо за помощь в образце КК, Оксана Герман для библиотеки КК, Татьяна Смирнова для запуска секвенсоров. Мы также хотели бы поблагодарить Цай-вэй Шэня и Эшли Уолтон из Sequencing Facility Bioinformatics Group за помощь в анализе данных и внедрении трубопровода РНК-сек. Мы также благодарим CCBR и NCBR за помощь в разработке анализа RNaseq и разработке передового опыта.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video