O protocolo fornece instruções para modificar o RNA com sulfato de dimetilo para experimentos de perfil mutacional. Inclui sondagem in vitro e in vivo com dois métodos alternativos de preparação de bibliotecas.
O papel da estrutura do RNA em praticamente qualquer processo biológico tornou-se cada vez mais evidente, especialmente na última década. No entanto, as abordagens clássicas para resolver a estrutura de RNA, como a cristalografia de RNA ou a crio-EM, não conseguiram acompanhar o campo em rápida evolução e a necessidade de soluções de alto rendimento. O perfil mutacional com sequenciamento usando sulfato de dimetilo (DMS) MaPseq é uma abordagem baseada em sequenciamento para inferir a estrutura de RNA a partir da reatividade de uma base com DMS. DMS metila o nitrogênio N1 em adenosinas e o N3 em citosinas em sua face Watson-Crick quando a base é desemparelhada. A transcrição reversa do RNA modificado com a transcriptase reversa do íntron do grupo II termoestável (TGIRT-III) leva à incorporação das bases metiladas como mutações no cDNA. Ao sequenciar o cDNA resultante e mapeá-lo de volta a um transcrito de referência, as taxas de mutação relativas para cada base são indicativas do “status” da base como emparelhada ou desemparelhada. Embora as reatividades do DMS tenham uma alta relação sinal-ruído tanto in vitro quanto nas células, esse método é sensível ao viés nos procedimentos de manuseio. Para reduzir esse viés, este trabalho fornece um protocolo para o tratamento de RNA com DMS em células e com RNA transcrito in vitro .
Desde a descoberta de que o RNA tem propriedades estruturais1,2 e catalíticas3, a importância do RNA e sua função reguladora em uma infinidade de processos biológicos foram gradualmente descobertas. De fato, o efeito da estrutura do RNA na regulação gênica tem ganhado cada vez mais atenção4. Como as proteínas, o RNA tem estruturas primárias, secundárias e terciárias, referindo-se à sequência de nucleotídeos, ao mapeamento 2D das interações de emparelhamento de bases e ao dobramento 3D dessas estruturas emparelhadas de bases, respectivamente. Embora a determinação da estrutura terciária seja fundamental para a compreensão dos mecanismos exatos por trás dos processos dependentes de RNA, a estrutura secundária também é altamente informativa sobre a função do RNA e é a base para novas dobras 3D5.
No entanto, determinar a estrutura do RNA tem sido intrinsecamente desafiador com abordagens convencionais. Enquanto para proteínas, cristalografia, ressonância magnética nuclear (RMN) e microscopia eletrônica criogênica (crio-EM) tornaram possível determinar a diversidade de motivos estruturais, permitindo a predição da estrutura a partir da sequência isolada6, essas abordagens não são amplamente aplicáveis aos RNAs. De fato, os RNAs são moléculas flexíveis com blocos de construção (nucleotídeos) que têm muito mais liberdade conformacional e rotacional em comparação com suas contrapartes de aminoácidos. Além disso, as interações através do emparelhamento de bases são mais dinâmicas e versáteis do que as dos resíduos de aminoácidos. Como resultado, as abordagens clássicas têm sido bem-sucedidas apenas para RNAs relativamente pequenos com estruturas bem definidas e altamente compactas7.
Outra abordagem para determinar a estrutura do RNA é através de sondagem química combinada com sequenciamento de próxima geração (NGS). Essa estratégia gera informações sobre o status de ligação de cada base em uma sequência de RNA (ou seja, sua estrutura secundária). Em resumo, as bases em uma molécula de RNA que não estão envolvidas no emparelhamento de bases são diferencialmente modificadas por pequenos compostos químicos. A transcrição reversa desses RNAs com transcriptases reversas (RTs) especializadas incorpora as modificações no ácido desoxirribonucleico complementar (cDNA) como mutações. Essas moléculas de cDNA são então amplificadas pela reação em cadeia da polimerase (PCR) e sequenciadas. Para obter informações sobre seu “status” como ligado ou não, as frequências de mutação em cada base em um RNA de interesse são calculadas e inseridas em software de previsão de estrutura como restrições8. Com base nas regras do vizinho mais próximo9 e nos cálculos mínimos de energia livre 10, este software gera modelos de estrutura que melhor se ajustam aos dados experimentais obtidos11,12.
O DMS-MaPseq utiliza o DMS, que metila o nitrogênio N1 em adenosinas e o nitrogênio N3 em citosinas em sua face Watson-Crick de maneira altamente específica13. O uso da transcriptase reversa de íntron do grupo II termoestável (TGIRT-III) na transcrição reversa cria perfis mutacionais com relações sinal-ruído sem precedentes, permitindo até mesmo a deconvolução de perfis sobrepostos gerados por duas ou mais conformações alternativas14,15. Além disso, o DMS pode penetrar nas membranas celulares e tecidos inteiros, tornando possível a sondagem dentro de contextos fisiológicos. No entanto, a geração de dados de boa qualidade é um desafio, pois variações no procedimento de manuseio podem afetar os resultados. Portanto, fornecemos um protocolo detalhado para DMS-MaPseq in vitro e in-cell para reduzir o viés e orientar os recém-chegados ao método através das dificuldades que possam encontrar. Especialmente à luz da recente pandemia de SARS-CoV2, dados de alta qualidade sobre vírus de RNA são uma ferramenta importante para estudar a expressão gênica e encontrar possíveis terapêuticas.
O protocolo aqui descreve como investigar o RNA in vitro e em células usando experimentos de perfil mutacional DMS. Além disso, ele fornece instruções sobre como preparar bibliotecas para o sequenciamento Illumina para gerar dados específicos de genes e analisar os arquivos .fastq obtidos. Além disso, abordagens de biblioteca de todo o genoma podem ser usadas. No entanto, o RT-PCR específico do gene produz a mais alta qualidade e os dados mais robustos. Portanto, ao comparar entre as amostras, é importante garantir que elas sejam preparadas com estratégias de sequenciamento idênticas, pois a geração da biblioteca causa algum viés. A reprodutibilidade deve ser sempre medida usando replicações.
Várias precauções
O RNA é uma molécula instável que é sensível à degradação tanto através de temperaturas elevadas quanto por RNases. Portanto, medidas especiais – o uso de equipamentos de proteção individual (EPI), material livre de RNAse e inibidores de RNAse – são recomendadas. Mais importante ainda, o RNA deve ser mantido no gelo sempre que possível. Isso se aplica especialmente ao RNA metilado, que é ainda mais sensível a altas temperaturas.
É importante confirmar que a estrutura de interesse do RNA não é sensível à concentração de DMS e às condições de tampão. Buffers como 100 mM Tris, 100 mM MOPS e 100 mM HEPES em pH 7-7,5 dão um sinal alto, mas podem não ser suficientes para manter o pH durante a reação21. Como o DMS hidrolisa na água, o que diminui o pH, um tampão forte é fundamental para manter um pH neutro durante a reação de modificação. A adição de bicina demonstrou ajudar a manter o pH como ligeiramente básico21 , mas resulta em baixa modificação do DMS em Gs e Us, o que poderia ser informativo, mas deve ser analisado separadamente devido à produção de um sinal muito menor do que As e Cs e não é discutido mais adiante neste protocolo.
Na RT-PCR específica do gene, o RNA modificado é transcrito reversamente no DNA e amplificado em fragmentos por PCR. Embora o tamanho do RNA possa teoricamente ser ilimitado, esses fragmentos de PCR não devem exceder um comprimento de 400-500 pares de bases (pb) para evitar viés durante a reação de transcrição reversa. Idealmente, os fragmentos devem estar dentro do escopo da execução de sequenciamento (ou seja, se o sequenciamento for conduzido usando um programa de sequenciamento final emparelhado de 150 x 150 ciclos, um único fragmento não deve exceder 300 pb). Ao usar programas de sequenciamento com menos ciclos, os produtos de PCR podem ser fragmentados usando um dsDNase. Além disso, como as sequências dentro das sequências de iniciadores não contêm nenhuma informação estrutural, os fragmentos devem se sobrepor quando o RNA sondado compreende o fragmento >1. As reações RT podem conter vários primers RT para diferentes fragmentos (até 10 primers RT diferentes). Dependendo das sequências, o agrupamento dos primers RT pode tornar a transcrição reversa menos eficiente, mas normalmente funciona bem. Cada reação de PCR deve ser conduzida separadamente.
Ao sondar o RNA com DMS, as condições experimentais desempenham um papel adicional, pois muitos RNAs são termodinamicamente instáveis e alteram sua conformação com base em fatores ambientais, como a temperatura. Para evitar irregularidades, as condições experimentais devem ser mantidas o mais constantes possível, também no que diz respeito aos tempos de reação. As condições tampão parecem ser trocáveis até certo grau 17,20,22,23 quando as condições básicas são mantidas — a capacidade de tamponamento e a presença de íons monovalentes (Na) e divalentes (Mg) — para garantir o dobramento adequado do RNA 24.
Com relação à preparação da biblioteca de RNAs modificados, vários aspectos devem ser levados em consideração. Primeiro, como mencionado anteriormente, os RNAs modificados são menos estáveis do que suas contrapartes não modificadas, o que significa que eles podem exigir a otimização dos tempos de fragmentação para uma distribuição ideal do tamanho do fragmento. Além disso, certos kits de preparação de bibliotecas de RNA, bem como muitas outras abordagens de RNAseq, usam primers aleatórios no kit de transcrição reversa. Isso pode levar a uma menor cobertura da referência, especialmente nos 3′ de um gene, e, em última análise, a uma profundidade de cobertura insuficiente. Se a cobertura de uma determinada região for muito baixa, pode ser necessário remover essas bases da previsão da estrutura. Além dos kits RT-PCR e RNAseq de genoma completo, outras abordagens de preparação de bibliotecas podem ser usadas. Protocolos que incluem a ligadura de adaptadores de 3′ e/ou 5′ ao RNA são vantajosos quando se utilizam pequenos fragmentos de RNA ou quando a perda de informações de sondagem nas regiões do primer deve ser evitada.
Por fim, a análise dos experimentos de sondagem química deve sempre ser interpretada com cuidado. Atualmente, não há software que preveja a estrutura de RNA de qualquer RNA a partir da sequência sozinha com alta precisão. Embora as restrições de sondagem química melhorem muito a precisão, a geração de bons modelos para RNAs longos (>500 nt) ainda é um desafio. Estes modelos devem ser testados por outras abordagens e/ou mutagénese. O software de predição de RNA otimiza para o número máximo de pares de bases, penalizando significativamente as conformações abertas, que podem não representar com precisão o dobramento do RNA5. Assim, o modelo de estrutura obtido deve ser testado quantificando a concordância de predição com os dados de sondagem química subjacentes (por exemplo, por AUROC) e entre replicações (por exemplo, por mFMI), como exemplificado por Lan et al.20.
Idealmente, vários experimentos em diferentes sistemas para desafiar o modelo de estrutura obtido devem ser usados para fortalecer a hipótese. Estes podem incluir o uso de abordagens in vitro e in-cell, mutações compensatórias e diferentes linhagens celulares e espécies. Além disso, as reatividades brutas são muitas vezes tão ou mais informativas do que as previsões de estrutura, pois registram o instantâneo da “verdade do solo” do conjunto de dobragem de RNA. Como tal, as reatividades brutas são muito adequadas e informativas para comparar mudanças de estrutura entre diferentes condições. É importante ressaltar que as estruturas de energia livre mais baixas calculadas usando restrições de sondagem química com previsão computacional só devem ser usadas como uma hipótese inicial em direção a um modelo de estrutura completa.
The authors have nothing to disclose.
Nenhum
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |