Summary

Otimização para Sequenciamento e Análise de Amostras de RNA FFPE-RNA degradadas

Published: June 08, 2020
doi:

Summary

Este método descreve as etapas para melhorar a qualidade e a quantidade de dados sequenciais que podem ser obtidos a partir de amostras de RNA incorporadas à parafina fixa-formalina (FFPE). Descrevemos a metodologia para avaliar com mais precisão a qualidade das amostras de FFPE-RNA, preparar bibliotecas de sequenciamento e analisar os dados das amostras de FFPE-RNA.

Abstract

A análise da expressão genética pelo sequenciamento de RNA (RNA-seq) permite insights únicos em amostras clínicas que podem potencialmente levar à compreensão mecanicista da base de várias doenças, bem como mecanismos de resistência e/ou suscetibilidade. No entanto, os tecidos FFPE, que representam o método mais comum para preservar a morfologia tecidual em amostras clínicas, não são as melhores fontes para a análise de perfil de expressão genética. O RNA obtido a partir dessas amostras é muitas vezes degradado, fragmentado e quimicamente modificado, o que leva a bibliotecas de sequenciamento subótimo. Por sua vez, estes geram dados de sequência de baixa qualidade que podem não ser confiáveis para análise de expressão genética e descoberta de mutação. Para aproveitar ao máximo as amostras de FFPE e obter os melhores dados possíveis a partir de amostras de baixa qualidade, é importante tomar certas precauções enquanto planeja o projeto experimental, preparando bibliotecas de sequenciamento e durante a análise de dados. Isso inclui o uso de métricas apropriadas para controle preciso de qualidade de amostra (QC), identificando os melhores métodos para várias etapas durante a geração da biblioteca de sequenciamento e o QC cuidadoso da biblioteca. Além disso, a aplicação de ferramentas e parâmetros de software corretos para análise de dados de sequência é fundamental para identificar artefatos em dados RNA-seq, filtrar a contaminação e leituras de baixa qualidade, avaliar a uniformidade da cobertura genética e medir a reprodutibilidade dos perfis de expressão genética entre as réplicas biológicas. Essas etapas podem garantir alta precisão e reprodutibilidade para o perfil de amostras de RNA muito heterogêneas. Aqui descrevemos as várias etapas para a amostra QC, preparação da biblioteca e QC, sequenciamento e análise de dados que podem ajudar a aumentar a quantidade de dados úteis obtidos a partir de RNA de baixa qualidade, como o obtido a partir de tecidos FFPE-RNA.

Introduction

O uso de abordagens de sequenciamento de última geração nos permitiu obter uma riqueza de informações de vários tipos de amostras. No entanto, amostras antigas e mal preservadas permanecem inviáveis para os métodos comumente utilizados de geração de dados de sequência e muitas vezes requerem modificações em protocolos bem estabelecidos. Os tecidos FFPE representam um tipo de amostra que tem sido amplamente utilizado para as amostras clínicas1,,2,3. Enquanto a preservação do FFPE mantém a morfologia tecidual, os ácidos nucleicos nos tecidos FFPE geralmente exibem uma ampla gama de danos e degradação, dificultando a recuperação das informações genômicas que podem levar a importantes insights sobre mecanismos moleculares subjacentes a vários distúrbios.

Os dados de expressão genética gerados pelo sequenciamento de RNA são frequentemente fundamentais no estudo de mecanismos de doença e resistência e complementam a análise da mutação do DNA. No entanto, o RNA é mais suscetível à degradação, tornando mais desafiador gerar dados precisos de expressão genética a partir de tecidos FFPE. Além disso, como a ampla disponibilidade e a acessibilidade do sequenciamento são relativamente recentes, os espécimes mais antigos muitas vezes não eram armazenados em condições necessárias para preservar a integridade do RNA. Algumas das questões para amostras de FFPE incluem a degradação do RNA devido à incorporação em parafina, modificação química do RNA levando à fragmentação ou refractoridade a processos enzimáticos necessários para sequenciamento, e perda das caudas poli-A, limitando a aplicabilidade do oligo-dT como uma cartilha para transcrição reversa4. Outro desafio é o manuseio/armazenamento de amostras de FFPE em condições subótimas, o que pode levar a uma maior degradação de moléculas labile, como o RNA nos tecidos5. Isso é especialmente relevante para amostras mais antigas que podem ter sido coletadas em um momento em que a análise da expressão genética pelo sequenciamento de RNA não foi antecipada para as amostras. Tudo isso leva à diminuição da qualidade e quantidade do RNA extraído disponível para gerar dados de sequência úteis. A baixa probabilidade de sucesso, combinada com o alto custo do sequenciamento, dissuadiu muitos pesquisadores de tentar gerar e analisar dados de expressão genética a partir de amostras de FFPE potencialmente úteis. Alguns estudos nos últimos anos demonstraram a usabilidade dos tecidos FFPE para análise de expressão genética2,,6,,7,,8,9, embora para amostras menores e/ou mais recentes.

Como estudo de viabilidade, utilizamos o RNA extraído de amostras de tecido tumoral FFPE de três repositórios de tecido residual de registros de câncer de Vigilância, Epidemiologia e Resultados Finais (SEER) para sequenciamento de RNA e análise de expressão genética10. Obtidos a partir de laboratórios de patologia clínica, os tecidos FFPE de adenocarcinomas sêmulas ovarianas de alto grau foram armazenados de 7 a 32 anos em condições variadas antes da extração do RNA. Como na maioria dos casos esses blocos foram armazenados em diferentes locais durante anos sem a expectativa de qualquer análise genética sensível no futuro, pouco cuidado havia sido tomado para preservar os ácidos nucleicos. Assim, a maioria das amostras apresentava RNA de má qualidade, com grande proporção de amostras contaminadas com bactérias. No entanto, conseguimos realizar quantificação genética, medir a uniformidade e a continuidade da cobertura genética e realizar a análise de correlação de Pearson entre réplicas biológicas para medir a reprodutibilidade. Com base em um conjunto de painéis genéticos de assinatura chave, comparamos as amostras em nosso estudo com os dados do Atlas do Genoma do Câncer (TCGA) e confirmamos que aproximadamente 60% das amostras tinham perfis de expressão genética comparáveis11. Com base na correlação entre vários resultados de QC e metadados amostrais, identificamos métricas-chave de QC que têm bom valor preditivo para identificar amostras mais propensas a gerar dados de sequência utilizáveis11.

Descrevemos aqui a metodologia utilizada para avaliação da qualidade ffpe-RNA, geração de bibliotecas de sequenciamento a partir de amostras de RNA extraídas e análise bioinformática dos dados de sequenciamento.

Protocol

1. Avaliação de quantidade e qualidade do RNA Selecione as amostras de FFPE de acordo com critérios predefinidos e extraia RNA utilizando um método apropriado (por exemplo, kit de extração de ácido FFPE-nuclei, Tabela de Materiais).NOTA: Existem vários métodos diferentes disponíveis para extração ffpe-RNA, incluindo os métodos mais novos de microdisseção que podem trabalhar com muito pouco tecido e extrair RNA de boa qualidade12,,<sup class=…

Representative Results

A metodologia descrita acima foi aplicada a 67 amostras de FFPE armazenadas sob uma variedade de condições diferentes durante 7-32 anos (o tempo médio de armazenamento amostral foi de 17,5 anos). Os resultados de conjunto de dados e análise aqui apresentados foram previamente descritos e publicados em Zhao et al.11. Ao verificar a qualidade da amostra descrita anteriormente (ou seja, traços de exemplo na Figura 2), o DV100 foi considerado mais útil do…

Discussion

O método descrito aqui descreve as principais etapas necessárias para obter bons dados de sequência de amostras de FFPE-RNA. Os principais pontos a serem considerados com este método são: (1) Certifique-se de que o RNA seja preservado da melhor forma possível após a extração, minimizando os ciclos de manuseio e congelamento e descongelamento da amostra. Alíquotas separadas do QC são muito úteis. (2) Use uma métrica QC que seja melhor para o conjunto amostral dado. Os valores rin e DV200 muitas vez…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Somos gratos à Dra. Danielle Carrick (Divisão de Controle do Câncer e Ciências Populacionais do Instituto Nacional de Câncer) por ajuda contínua, especialmente por iniciar este estudo, fornecendo-nos as amostras e sugestões úteis durante a análise de dados. Agradecemos sinceramente a todos os membros do Centro de Sequenciamento da CCR no Laboratório Nacional de Pesquisa do Câncer de Frederick por sua ajuda durante a preparação e sequenciamento da amostra, especialmente Brenda Ho pela assistência na amostra QC, Oksana German para a biblioteca QC, Tatyana Smirnova para executar os sequenciadores. Também gostaríamos de agradecer a Tsai-wei Shen e Ashley Walton no Sequencing Facility Bioinformatics Group por ajudar na análise de dados e na implementação do pipeline RNA-seq. Agradecemos também à CCBR e à NCBR pela assistência com o pipeline de análise da RNaseq e o desenvolvimento de melhores práticas.

Materials

2100 Bioanalyzer Agilent G2939BA
Agilent DNA 7500 Kit Agilent 5067-1506
Agilent High Sensitivity DNA Kit Agilent 5067-4626
Agilent RNA 6000 Nano Kit Agilent 5067-1511
AllPrep DNA/RNA FFPE Kit Qiagen 80234
CFX96 Touch System Bio-Rad 1855195
Library Quantification kit v2-Illumina KapaBiosystems KK4824
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina New England Biolabs E7765S https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) New England Biolabs E6310L
NextSeq 500 Sequencing System Illumina SY-415-1001 NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf
NextSeq PhiX Control Kit Illumina FC-110-3002
NSQ 500/550 Hi Output KT v2.5 (150 CYS) Illumina 20024907
10X Genomics Magnetic Separator 10X Genomics 120250
Rotator Multimixer VWR 13916-822
C1000 Touch Thermal Cycler Bio-Rad 1851197
Sequencing reagent kit Illumina 20024907
Flow cell package Illumina 20024907
Buffer cartridge and the reagent cartridge Illumina 20024907
Sodium hydroxide solution (0.2N) Millipore Sigma SX0607D-6
TRIS-HCL Buffer 1.0M, pH 7.0 Fisher Scientific 50-151-871

References

  1. Carrick, D. M., et al. Robustness of Next Generation Sequencing on Older Formalin-Fixed Paraffin-Embedded Tissue. PLoS One. 10 (7), 0127353 (2015).
  2. Hedegaard, J., et al. Next-generation sequencing of RNA and DNA isolated from paired fresh-frozen and formalin-fixed paraffin-embedded samples of human cancer and normal tissue. PLoS One. 9 (5), 98187 (2014).
  3. Zhang, P., Lehmann, B. D., Shyr, Y., Guo, Y. The Utilization of Formalin Fixed-Paraffin-Embedded Specimens in High Throughput Genomic Studies. International Journal of Genomics. 2017, 1926304 (2017).
  4. Srinivasan, M., Sedmak, D., Jewell, S. Effect of fixatives and tissue processing on the content and integrity of nucleic acids. American Journal of Pathology. 161 (6), 1961-1971 (2002).
  5. von Ahlfen, S., Missel, A., Bendrat, K., Schlumpberger, M. Determinants of RNA quality from FFPE samples. PLoS One. 2 (12), 1261 (2007).
  6. Esteve-Codina, A., et al. A Comparison of RNA-Seq Results from Paired Formalin-Fixed Paraffin-Embedded and Fresh-Frozen Glioblastoma Tissue Samples. PLoS One. 12 (1), 0170632 (2017).
  7. Vukmirovic, M., et al. Identification and validation of differentially expressed transcripts by RNA-sequencing of formalin-fixed, paraffin-embedded (FFPE) lung tissue from patients with Idiopathic Pulmonary Fibrosis. BMC Pulmonary Medicine. 17 (1), 15 (2017).
  8. Adiconis, X., et al. Comparative analysis of RNA sequencing methods for degraded or low-input samples. Nature Methods. 10 (7), 623-629 (2013).
  9. Sinicropi, D., et al. Whole transcriptome RNA-Seq analysis of breast cancer recurrence risk using formalin-fixed paraffin-embedded tumor tissue. PLoS One. 7 (7), 40092 (2012).
  10. Altekruse, S. F., et al. SEER cancer registry biospecimen research: yesterday and tomorrow. Cancer Epidemiology, Biomarkers & Prevention. 23 (12), 2681-2687 (2014).
  11. Zhao, Y., et al. Robustness of RNA sequencing on older formalin-fixed paraffin-embedded tissue from high-grade ovarian serous adenocarcinomas. PLoS One. 14 (5), 0216050 (2019).
  12. Amini, P., et al. An optimised protocol for isolation of RNA from small sections of laser-capture microdissected FFPE tissue amenable for next-generation sequencing. BMC Molecular Biology. 18 (1), 22 (2017).
  13. Amini, P., Nassiri, S., Ettlin, J., Malbon, A., Markkanen, E. Next-generation RNA sequencing of FFPE subsections reveals highly conserved stromal reprogramming between canine and human mammary carcinoma. Disease Models and Mechanisms. 12 (8), (2019).
  14. Wimmer, I., et al. Systematic evaluation of RNA quality, microarray data reliability and pathway analysis in fresh, fresh frozen and formalin-fixed paraffin-embedded tissue samples. Scientific Reports. 8 (1), 6351 (2018).
  15. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2019)
  16. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10-12 (2011).
  17. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  18. . Babraham Bioinformatics Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastq_screen/ (2019)
  19. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Genome Biology. 15 (3), 46 (2014).
  20. Dobin, A., et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 29 (1), 15-21 (2013).
  21. Wang, L., Wang, S., Li, W. RSeQC: quality control of RNA-seq experiments. Bioinformatics. 28 (16), 2184-2185 (2012).
  22. Ewels, P., Magnusson, M., Lundin, S., Kaller, M. MultiQC: summarize analysis results for multiple tools and samples in a single report. Bioinformatics. 32 (19), 3047-3048 (2016).
  23. Li, B., Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics. 12, 323 (2011).
  24. Son, K., Yu, S., Shin, W., Han, K., Kang, K. A Simple Guideline to Assess the Characteristics of RNA-Seq Data. BioMed Research International. 2018, 2906292 (2018).
  25. McCarthy, D. J., Chen, Y., Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Research. 40 (10), 4288-4297 (2012).
  26. Robinson, M. D., McCarthy, D. J., Smyth, G. K. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 26 (1), 139-140 (2010).
  27. Ritchie, M. E., et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Research. 43 (7), 47 (2015).
  28. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America U S A. 102 (43), 15545-15550 (2005).
  29. Mootha, V. K., et al. PGC-1alpha-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes. Nature Genetics. 34 (3), 267-273 (2003).
  30. Ashburner, M., et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genetics. 25 (1), 25-29 (2000).
  31. Huang da, W., Sherman, B. T., Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nature Protocols. 4 (1), 44-57 (2009).
  32. Huang da, W., Sherman, B. T., Lempicki, R. A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists. Nucleic Acids Research. 37 (1), 1-13 (2009).
  33. Evaluating RNA Quality from FFPE Samples. Illumina Available from: https://www.illumina.com/content/dam/illumina-marketing/documents/products/technotes/evaluating-rna-quality-from-ffpe-samples-technical-note-470-2014-001.pdf (2016)

Play Video

Cite This Article
Levin, Y., Talsania, K., Tran, B., Shetty, J., Zhao, Y., Mehta, M. Optimization for Sequencing and Analysis of Degraded FFPE-RNA Samples. J. Vis. Exp. (160), e61060, doi:10.3791/61060 (2020).

View Video