Este método descreve as etapas para melhorar a qualidade e a quantidade de dados sequenciais que podem ser obtidos a partir de amostras de RNA incorporadas à parafina fixa-formalina (FFPE). Descrevemos a metodologia para avaliar com mais precisão a qualidade das amostras de FFPE-RNA, preparar bibliotecas de sequenciamento e analisar os dados das amostras de FFPE-RNA.
A análise da expressão genética pelo sequenciamento de RNA (RNA-seq) permite insights únicos em amostras clínicas que podem potencialmente levar à compreensão mecanicista da base de várias doenças, bem como mecanismos de resistência e/ou suscetibilidade. No entanto, os tecidos FFPE, que representam o método mais comum para preservar a morfologia tecidual em amostras clínicas, não são as melhores fontes para a análise de perfil de expressão genética. O RNA obtido a partir dessas amostras é muitas vezes degradado, fragmentado e quimicamente modificado, o que leva a bibliotecas de sequenciamento subótimo. Por sua vez, estes geram dados de sequência de baixa qualidade que podem não ser confiáveis para análise de expressão genética e descoberta de mutação. Para aproveitar ao máximo as amostras de FFPE e obter os melhores dados possíveis a partir de amostras de baixa qualidade, é importante tomar certas precauções enquanto planeja o projeto experimental, preparando bibliotecas de sequenciamento e durante a análise de dados. Isso inclui o uso de métricas apropriadas para controle preciso de qualidade de amostra (QC), identificando os melhores métodos para várias etapas durante a geração da biblioteca de sequenciamento e o QC cuidadoso da biblioteca. Além disso, a aplicação de ferramentas e parâmetros de software corretos para análise de dados de sequência é fundamental para identificar artefatos em dados RNA-seq, filtrar a contaminação e leituras de baixa qualidade, avaliar a uniformidade da cobertura genética e medir a reprodutibilidade dos perfis de expressão genética entre as réplicas biológicas. Essas etapas podem garantir alta precisão e reprodutibilidade para o perfil de amostras de RNA muito heterogêneas. Aqui descrevemos as várias etapas para a amostra QC, preparação da biblioteca e QC, sequenciamento e análise de dados que podem ajudar a aumentar a quantidade de dados úteis obtidos a partir de RNA de baixa qualidade, como o obtido a partir de tecidos FFPE-RNA.
O uso de abordagens de sequenciamento de última geração nos permitiu obter uma riqueza de informações de vários tipos de amostras. No entanto, amostras antigas e mal preservadas permanecem inviáveis para os métodos comumente utilizados de geração de dados de sequência e muitas vezes requerem modificações em protocolos bem estabelecidos. Os tecidos FFPE representam um tipo de amostra que tem sido amplamente utilizado para as amostras clínicas1,,2,3. Enquanto a preservação do FFPE mantém a morfologia tecidual, os ácidos nucleicos nos tecidos FFPE geralmente exibem uma ampla gama de danos e degradação, dificultando a recuperação das informações genômicas que podem levar a importantes insights sobre mecanismos moleculares subjacentes a vários distúrbios.
Os dados de expressão genética gerados pelo sequenciamento de RNA são frequentemente fundamentais no estudo de mecanismos de doença e resistência e complementam a análise da mutação do DNA. No entanto, o RNA é mais suscetível à degradação, tornando mais desafiador gerar dados precisos de expressão genética a partir de tecidos FFPE. Além disso, como a ampla disponibilidade e a acessibilidade do sequenciamento são relativamente recentes, os espécimes mais antigos muitas vezes não eram armazenados em condições necessárias para preservar a integridade do RNA. Algumas das questões para amostras de FFPE incluem a degradação do RNA devido à incorporação em parafina, modificação química do RNA levando à fragmentação ou refractoridade a processos enzimáticos necessários para sequenciamento, e perda das caudas poli-A, limitando a aplicabilidade do oligo-dT como uma cartilha para transcrição reversa4. Outro desafio é o manuseio/armazenamento de amostras de FFPE em condições subótimas, o que pode levar a uma maior degradação de moléculas labile, como o RNA nos tecidos5. Isso é especialmente relevante para amostras mais antigas que podem ter sido coletadas em um momento em que a análise da expressão genética pelo sequenciamento de RNA não foi antecipada para as amostras. Tudo isso leva à diminuição da qualidade e quantidade do RNA extraído disponível para gerar dados de sequência úteis. A baixa probabilidade de sucesso, combinada com o alto custo do sequenciamento, dissuadiu muitos pesquisadores de tentar gerar e analisar dados de expressão genética a partir de amostras de FFPE potencialmente úteis. Alguns estudos nos últimos anos demonstraram a usabilidade dos tecidos FFPE para análise de expressão genética2,,6,,7,,8,9, embora para amostras menores e/ou mais recentes.
Como estudo de viabilidade, utilizamos o RNA extraído de amostras de tecido tumoral FFPE de três repositórios de tecido residual de registros de câncer de Vigilância, Epidemiologia e Resultados Finais (SEER) para sequenciamento de RNA e análise de expressão genética10. Obtidos a partir de laboratórios de patologia clínica, os tecidos FFPE de adenocarcinomas sêmulas ovarianas de alto grau foram armazenados de 7 a 32 anos em condições variadas antes da extração do RNA. Como na maioria dos casos esses blocos foram armazenados em diferentes locais durante anos sem a expectativa de qualquer análise genética sensível no futuro, pouco cuidado havia sido tomado para preservar os ácidos nucleicos. Assim, a maioria das amostras apresentava RNA de má qualidade, com grande proporção de amostras contaminadas com bactérias. No entanto, conseguimos realizar quantificação genética, medir a uniformidade e a continuidade da cobertura genética e realizar a análise de correlação de Pearson entre réplicas biológicas para medir a reprodutibilidade. Com base em um conjunto de painéis genéticos de assinatura chave, comparamos as amostras em nosso estudo com os dados do Atlas do Genoma do Câncer (TCGA) e confirmamos que aproximadamente 60% das amostras tinham perfis de expressão genética comparáveis11. Com base na correlação entre vários resultados de QC e metadados amostrais, identificamos métricas-chave de QC que têm bom valor preditivo para identificar amostras mais propensas a gerar dados de sequência utilizáveis11.
Descrevemos aqui a metodologia utilizada para avaliação da qualidade ffpe-RNA, geração de bibliotecas de sequenciamento a partir de amostras de RNA extraídas e análise bioinformática dos dados de sequenciamento.
O método descrito aqui descreve as principais etapas necessárias para obter bons dados de sequência de amostras de FFPE-RNA. Os principais pontos a serem considerados com este método são: (1) Certifique-se de que o RNA seja preservado da melhor forma possível após a extração, minimizando os ciclos de manuseio e congelamento e descongelamento da amostra. Alíquotas separadas do QC são muito úteis. (2) Use uma métrica QC que seja melhor para o conjunto amostral dado. Os valores rin e DV200 muitas vez…
The authors have nothing to disclose.
Somos gratos à Dra. Danielle Carrick (Divisão de Controle do Câncer e Ciências Populacionais do Instituto Nacional de Câncer) por ajuda contínua, especialmente por iniciar este estudo, fornecendo-nos as amostras e sugestões úteis durante a análise de dados. Agradecemos sinceramente a todos os membros do Centro de Sequenciamento da CCR no Laboratório Nacional de Pesquisa do Câncer de Frederick por sua ajuda durante a preparação e sequenciamento da amostra, especialmente Brenda Ho pela assistência na amostra QC, Oksana German para a biblioteca QC, Tatyana Smirnova para executar os sequenciadores. Também gostaríamos de agradecer a Tsai-wei Shen e Ashley Walton no Sequencing Facility Bioinformatics Group por ajudar na análise de dados e na implementação do pipeline RNA-seq. Agradecemos também à CCBR e à NCBR pela assistência com o pipeline de análise da RNaseq e o desenvolvimento de melhores práticas.
2100 Bioanalyzer | Agilent | G2939BA | |
Agilent DNA 7500 Kit | Agilent | 5067-1506 | |
Agilent High Sensitivity DNA Kit | Agilent | 5067-4626 | |
Agilent RNA 6000 Nano Kit | Agilent | 5067-1511 | |
AllPrep DNA/RNA FFPE Kit | Qiagen | 80234 | |
CFX96 Touch System | Bio-Rad | 1855195 | |
Library Quantification kit v2-Illumina | KapaBiosystems | KK4824 | |
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina | New England Biolabs | E7765S | https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit |
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) | New England Biolabs | E6310L | |
NextSeq 500 Sequencing System | Illumina | SY-415-1001 | NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf |
NextSeq PhiX Control Kit | Illumina | FC-110-3002 | |
NSQ 500/550 Hi Output KT v2.5 (150 CYS) | Illumina | 20024907 | |
10X Genomics Magnetic Separator | 10X Genomics | 120250 | |
Rotator Multimixer | VWR | 13916-822 | |
C1000 Touch Thermal Cycler | Bio-Rad | 1851197 | |
Sequencing reagent kit | Illumina | 20024907 | |
Flow cell package | Illumina | 20024907 | |
Buffer cartridge and the reagent cartridge | Illumina | 20024907 | |
Sodium hydroxide solution (0.2N) | Millipore Sigma | SX0607D-6 | |
TRIS-HCL Buffer 1.0M, pH 7.0 | Fisher Scientific | 50-151-871 |