O sequenciamento de RNA de quantificação absoluta (AQRNA-seq) é uma tecnologia desenvolvida para quantificar a paisagem de todos os pequenos RNAs em misturas biológicas. Aqui, as etapas de preparação da biblioteca e processamento de dados do AQRNA-seq são demonstradas, quantificando as mudanças no pool de RNA de transferência (tRNA) em Mycobacterium bovis BCG durante a dormência induzida por fome.
O AQRNA-seq fornece uma relação linear direta entre o sequenciamento de contagens de leitura e pequenos números de cópias de RNA em uma amostra biológica, permitindo assim a quantificação precisa do conjunto de pequenos RNAs. O procedimento de preparação da biblioteca AQRNA-seq descrito aqui envolve o uso de ligantes de sequenciamento personalizados e uma etapa para reduzir as modificações do RNA de metilação que bloqueiam a processividade da transcrição reversa, o que resulta em um aumento do rendimento de cDNAs de comprimento total. Além disso, é apresentada uma implementação detalhada do pipeline de bioinformática que o acompanha. Esta demonstração de AQRNA-seq foi conduzida por meio de uma análise quantitativa dos 45 tRNAs em Mycobacterium bovis BCG colhidos em 5 dias selecionados em um curso de 20 dias de privação de nutrientes e 6 dias de ressuscitação. Os esforços contínuos para melhorar a eficiência e o rigor do AQRNA-seq também serão discutidos aqui. Isso inclui explorar métodos para evitar a purificação do gel para mitigar os problemas de dímero do primer após a amplificação por PCR e aumentar a proporção de leituras completas para permitir um mapeamento de leitura mais preciso. Aprimoramentos futuros do AQRNA-seq serão focados em facilitar a automação e a implementação de alto rendimento dessa tecnologia para quantificar todas as pequenas espécies de RNA em amostras de células e tecidos de diversos organismos.
O sequenciamento de próxima geração (NGS), também conhecido como sequenciamento massivamente paralelo, é uma tecnologia de sequenciamento de DNA que envolve fragmentação de DNA, ligação de oligonucleotídeos adaptadores, amplificação baseada em reação em cadeia da polimerase (PCR), sequenciamento do DNA e remontagem das sequências de fragmentos em um genoma. A adaptação do NGS ao RNA de sequência (RNA-seq) é uma abordagem poderosa para identificar e quantificar transcritos de RNA e suas variantes1. Desenvolvimentos inovadores nos fluxos de trabalho de preparação de bibliotecas de RNA e pipelines de análise bioinformática, juntamente com avanços na instrumentação laboratorial, expandiram o repertório de aplicações de RNA-seq, progredindo além do sequenciamento do exoma para ômicas funcionais avançadas, como perfil de RNA não codificante2, análise de célula única3, transcriptômica espacial 4,5, análise de splicing alternativa6, entre outros. Esses métodos avançados de RNA-seq revelam funções complexas de RNA por meio da análise quantitativa do transcriptoma em células e tecidos normais e doentes.
Apesar desses avanços no RNA-seq, várias características técnicas importantes limitam o poder quantitativo do método. Embora a maioria dos métodos de RNA-seq permita a quantificação precisa e exata das mudanças nos níveis de RNAs entre variáveis experimentais (ou seja, amostras biológicas e/ou estados fisiológicos), eles não podem fornecer comparações quantitativas dos níveis de moléculas de RNA dentro de uma amostra. Por exemplo, a maioria dos métodos de RNA-seq não pode quantificar com precisão o número relativo de cópias de moléculas isoaceitadoras de tRNA individuais em um pool celular de tRNAs expressos. Conforme destacado na publicação complementar7, essa limitação ao RNA-seq surge de várias características da estrutura do RNA e da bioquímica da preparação da biblioteca. Por exemplo, a atividade das enzimas de ligação usadas para ligar os ligantes de sequenciamento de extremidade 3′ e 5′ às moléculas de RNA é fortemente influenciada pela identidade dos nucleotídeos terminais do RNA e dos ligantes de sequenciamento. Isso leva a grandes variações nas eficiências das ligações de ligantes e profundos aumentos artefactuais nas leituras de sequenciamento 8,9,10.
Um segundo conjunto de limitações surge das propriedades estruturais inerentes das moléculas de RNA. Especificamente, a formação da estrutura secundária do RNA e as mudanças dinâmicas nas dezenas de modificações pós-transcricionais do RNA do epitranscriptoma podem causar queda ou mutação da polimerase durante a transcrição reversa. Esses erros resultam em síntese de cDNA incompleta ou truncada ou sequência de RNA alterada. Embora ambos os fenômenos possam ser explorados para mapear estruturas secundárias ou algumas modificações, eles degradam a precisão quantitativa do RNA-seq se as etapas subsequentes de preparação da biblioteca falharem em capturar cDNAs truncados ou se o processamento de dados descartar sequências mutantes que não correspondem a um conjunto de dados de referência11 , 12 . Além disso, a imensa diversidade química, de comprimento e estrutural dos transcritos de RNA, bem como a falta de ferramentas para fragmentar uniformemente RNAs longos, diminui a aplicabilidade da maioria dos métodos de RNA-seq a todas as espécies de RNA13.
O método AQRNA-seq (sequenciamento de RNA de quantificação absoluta) foi desenvolvido para remover várias dessas restrições técnicas e biológicas que limitam a precisão quantitativa7. Ao minimizar os vieses dependentes de sequência na captura, ligação e amplificação durante a preparação da biblioteca de sequenciamento de RNA, o AQRNA-seq atinge linearidade superior em comparação com outros métodos, quantificando com precisão 75% de uma biblioteca de referência de 963 miRNAs com precisão de 2 vezes. Essa correlação linear de sequenciamento, contagem de leitura e abundância de RNA também é observada em uma análise de um conjunto de comprimentos variáveis de padrões de oligonucleotídeos de RNA e em referência a métodos ortogonais como northern blotting. Estabelecer linearidade entre a contagem de leitura de sequenciamento e a abundância de RNA permite que o AQRNA-seq alcance uma quantificação precisa e absoluta de todas as espécies de RNA em uma amostra.
Aqui está uma descrição do protocolo para o fluxo de trabalho de preparação da biblioteca AQRNA-seq e o pipeline de análise de dados downstream que o acompanha. O método foi aplicado para elucidar a dinâmica da abundância de tRNA durante a dormência induzida pela fome e subsequente ressuscitação no modelo de tuberculose Mycobacterium bovis bacilos de Calmette et Guérin (BCG). Os resultados foram apresentados para a visualização exploratória dos dados de sequenciamento, juntamente com análises subsequentes de agrupamento e expressão diferencial que revelaram padrões discerníveis na abundância de tRNA associados a vários fenótipos.
O fluxo de trabalho de preparação da biblioteca AQRNA-seq foi projetado para maximizar a captura de RNAs em uma amostra e minimizar a queda da polimerase durante a transcrição reversa7. Por meio de uma ligação de ligante em duas etapas, novos oligos de DNA (Linker 1 e Linker 2) são ligados em excesso para complementar totalmente o RNA dentro da amostra. O excesso de ligantes pode ser removido de forma eficiente com RecJf, uma exonuclease de 5′ a 3′ específica para DNAs de fita simples, dei…
The authors have nothing to disclose.
Os autores do presente trabalho agradecem aos autores do artigo original que descreve a tecnologia AQRNA-seq7. Este trabalho foi apoiado por doações dos Institutos Nacionais de Saúde (ES002109, AG063341, ES031576, ES031529, ES026856) e da Fundação Nacional de Pesquisa de Cingapura por meio da Aliança Cingapura-MIT para Pesquisa e Tecnologia Resistência Antimicrobiana IRG.
2-ketoglutarate | Sigma-Aldrich | 75890 | Prepare a working solution (1 M) and store it at -20ºC |
2100 Bioanalyzer Instrument | Agilent | G2938C | |
5'-deadenylase (50 U/μL) | New England Biolabs | M0331S (component #: M0331SVIAL) | Store at -20 °C |
Adenosine 5'-Triphosphate (ATP) | New England Biolabs | M0437M (component #: N0437AVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
AGAROSE GPG/LE | AmericanBio | AB00972-00500 | Store at ambient temperature |
Ammonium iron(II) sulfate hexahydrate | Sigma-Aldrich | F2262 | Prepare a working solution (0.25 M) and store it at -20 °C |
Bioanalyzer Small RNA Analysis | Agilent | 5067-1548 | The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation) |
Bovine Serum Albumin (BSA; 10 mg/mL) | New England Biolabs | B9000 | This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200). |
Chloroform | Macron Fine Chemicals | 4441-10 | |
Demethylase | ArrayStar | AS-FS-004 | Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004) |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447L (component #: N0447LVIAL) | This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each) |
Digital Dual Heat Block | VWR Scientific Products | 13259-052 | Heating block is used with the QIAquick Gel Extraction Kit |
DyeEx 2.0 Spin Kit | Qiagen | 63204 | Effective at removing short remnants (e.g., oligos less than 10 bp in length) |
Electrophoresis Power Supply | Bio-Rad Labrotories | PowerPac 300 | |
Eppendorf PCR Tubes (0.5 mL) | Eppendorf | 0030124537 | |
Eppendorf Safe-Lock Tubes (0.5 mL) | Eppendorf | 022363611 | |
Eppendorf Safe-Lock Tubes (1.5 mL) | Eppendorf | 022363204 | |
Eppendorf Safe-Lock Tubes (2 mL) | Eppendorf | 022363352 | |
Ethyl alcohol (Ethanol), Pure | Sigma-Aldrich | E7023 | The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research |
Gel Imaging System | Alpha Innotech | FluorChem 8900 | |
Gel Loading Dye, Purple (6X), no SDS | New England Biolabs | N0556S (component #: B7025SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
GENESYS 180 UV-Vis Spectrophotometer | Thermo Fisher Scientific | 840-309000 | The spectrophotometer is used for measuring the oligo concentrations using the Beer's law |
HEPES | Sigma-Aldrich | H4034 | Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C |
Hydrochloric acid (HCl) | VWR Scientific Products | BDH3028 | Prepare a working solution (5 M) and store it at ambient temperature |
Isopropyl Alcohol (Isopropanol), Pure | Macron Fine Chemicals | 3032-16 | Isopropanol is used with the QIAquick Gel Extraction Kit |
L-Ascorbic acid | Sigma-Aldrich | A5960 | Prepare a working solution (0.5 M) and store it at -20ºC |
Microcentrifuge | Eppendorf | 5415D | |
NanoDrop 2000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
NEBuffer 2 (10X) | New England Biolabs | M0264L (component #: B7002SVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
Nuclease-Free Water (not DEPC-Treated) | Thermo Fisher Scientific | AM9938 | |
Oligo Clean & Concentrator Kit | Zymo Research | D4061 | Store at ambient temperature |
PEG 8000 (50% solution) | New England Biolabs | M0437M (component #: B1004SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
Peltier Thermal Cycler | MJ Research | PTC-200 | |
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2 | Thermo Fisher Scientific | J62336 | |
PrimeScript Buffer (5X) | TaKaRa | 2680A | |
PrimeScript Reverse Transcriptase | TaKaRa | 2680A | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | This kit requires a heating block and isopropanol to work with |
Quick-Load Purple 100 bp DNA Ladder | New England Biolabs | N0551S (component #: N0551SVIAL) | |
Quick-Load Purple 50 bp DNA Ladder | New England Biolabs | N0556S (component #: N0556SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
RecJf (30 U/μL) | New England Biolabs | M0264L (component #: M0264LVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
RNase Inhibitor (murine; 40 U/μL) | New England Biolabs | M0314L (component #: M0314LVIAL) | Store at -20 °C |
SeqAMP DNA Polymerase | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
SeqAMP PCR Buffer (2X) | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
Shrimp Alkaline Phosphatase (1 U/μL) | New England Biolabs | M0371L (component #: M0371LVIAL) | |
Sodium hydroxide (NaOH) | Sigma-Aldrich | S5881 | Prepare a working solution (5 M) and store it at ambient temperature |
T4 DNA Ligase (400 U/μL) | New England Biolabs | M0202L (component #: M0202LVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 DNA Ligase Reaction Buffer (10X) | New England Biolabs | M0202L (component #: B0202SVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 RNA Ligase 1 (30 U/μL) | New England Biolabs | M0437M (component #: M0437MVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |
T4 RNA Ligase Reaction Buffer (10X) | New England Biolabs | M0437M (component #: B0216SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |