Summary

AQRNA-seq para quantificar RNAs pequenos

Published: February 02, 2024
doi:

Summary

O sequenciamento de RNA de quantificação absoluta (AQRNA-seq) é uma tecnologia desenvolvida para quantificar a paisagem de todos os pequenos RNAs em misturas biológicas. Aqui, as etapas de preparação da biblioteca e processamento de dados do AQRNA-seq são demonstradas, quantificando as mudanças no pool de RNA de transferência (tRNA) em Mycobacterium bovis BCG durante a dormência induzida por fome.

Abstract

O AQRNA-seq fornece uma relação linear direta entre o sequenciamento de contagens de leitura e pequenos números de cópias de RNA em uma amostra biológica, permitindo assim a quantificação precisa do conjunto de pequenos RNAs. O procedimento de preparação da biblioteca AQRNA-seq descrito aqui envolve o uso de ligantes de sequenciamento personalizados e uma etapa para reduzir as modificações do RNA de metilação que bloqueiam a processividade da transcrição reversa, o que resulta em um aumento do rendimento de cDNAs de comprimento total. Além disso, é apresentada uma implementação detalhada do pipeline de bioinformática que o acompanha. Esta demonstração de AQRNA-seq foi conduzida por meio de uma análise quantitativa dos 45 tRNAs em Mycobacterium bovis BCG colhidos em 5 dias selecionados em um curso de 20 dias de privação de nutrientes e 6 dias de ressuscitação. Os esforços contínuos para melhorar a eficiência e o rigor do AQRNA-seq também serão discutidos aqui. Isso inclui explorar métodos para evitar a purificação do gel para mitigar os problemas de dímero do primer após a amplificação por PCR e aumentar a proporção de leituras completas para permitir um mapeamento de leitura mais preciso. Aprimoramentos futuros do AQRNA-seq serão focados em facilitar a automação e a implementação de alto rendimento dessa tecnologia para quantificar todas as pequenas espécies de RNA em amostras de células e tecidos de diversos organismos.

Introduction

O sequenciamento de próxima geração (NGS), também conhecido como sequenciamento massivamente paralelo, é uma tecnologia de sequenciamento de DNA que envolve fragmentação de DNA, ligação de oligonucleotídeos adaptadores, amplificação baseada em reação em cadeia da polimerase (PCR), sequenciamento do DNA e remontagem das sequências de fragmentos em um genoma. A adaptação do NGS ao RNA de sequência (RNA-seq) é uma abordagem poderosa para identificar e quantificar transcritos de RNA e suas variantes1. Desenvolvimentos inovadores nos fluxos de trabalho de preparação de bibliotecas de RNA e pipelines de análise bioinformática, juntamente com avanços na instrumentação laboratorial, expandiram o repertório de aplicações de RNA-seq, progredindo além do sequenciamento do exoma para ômicas funcionais avançadas, como perfil de RNA não codificante2, análise de célula única3, transcriptômica espacial 4,5, análise de splicing alternativa6, entre outros. Esses métodos avançados de RNA-seq revelam funções complexas de RNA por meio da análise quantitativa do transcriptoma em células e tecidos normais e doentes.

Apesar desses avanços no RNA-seq, várias características técnicas importantes limitam o poder quantitativo do método. Embora a maioria dos métodos de RNA-seq permita a quantificação precisa e exata das mudanças nos níveis de RNAs entre variáveis experimentais (ou seja, amostras biológicas e/ou estados fisiológicos), eles não podem fornecer comparações quantitativas dos níveis de moléculas de RNA dentro de uma amostra. Por exemplo, a maioria dos métodos de RNA-seq não pode quantificar com precisão o número relativo de cópias de moléculas isoaceitadoras de tRNA individuais em um pool celular de tRNAs expressos. Conforme destacado na publicação complementar7, essa limitação ao RNA-seq surge de várias características da estrutura do RNA e da bioquímica da preparação da biblioteca. Por exemplo, a atividade das enzimas de ligação usadas para ligar os ligantes de sequenciamento de extremidade 3′ e 5′ às moléculas de RNA é fortemente influenciada pela identidade dos nucleotídeos terminais do RNA e dos ligantes de sequenciamento. Isso leva a grandes variações nas eficiências das ligações de ligantes e profundos aumentos artefactuais nas leituras de sequenciamento 8,9,10.

Um segundo conjunto de limitações surge das propriedades estruturais inerentes das moléculas de RNA. Especificamente, a formação da estrutura secundária do RNA e as mudanças dinâmicas nas dezenas de modificações pós-transcricionais do RNA do epitranscriptoma podem causar queda ou mutação da polimerase durante a transcrição reversa. Esses erros resultam em síntese de cDNA incompleta ou truncada ou sequência de RNA alterada. Embora ambos os fenômenos possam ser explorados para mapear estruturas secundárias ou algumas modificações, eles degradam a precisão quantitativa do RNA-seq se as etapas subsequentes de preparação da biblioteca falharem em capturar cDNAs truncados ou se o processamento de dados descartar sequências mutantes que não correspondem a um conjunto de dados de referência11 , 12 . Além disso, a imensa diversidade química, de comprimento e estrutural dos transcritos de RNA, bem como a falta de ferramentas para fragmentar uniformemente RNAs longos, diminui a aplicabilidade da maioria dos métodos de RNA-seq a todas as espécies de RNA13.

O método AQRNA-seq (sequenciamento de RNA de quantificação absoluta) foi desenvolvido para remover várias dessas restrições técnicas e biológicas que limitam a precisão quantitativa7. Ao minimizar os vieses dependentes de sequência na captura, ligação e amplificação durante a preparação da biblioteca de sequenciamento de RNA, o AQRNA-seq atinge linearidade superior em comparação com outros métodos, quantificando com precisão 75% de uma biblioteca de referência de 963 miRNAs com precisão de 2 vezes. Essa correlação linear de sequenciamento, contagem de leitura e abundância de RNA também é observada em uma análise de um conjunto de comprimentos variáveis de padrões de oligonucleotídeos de RNA e em referência a métodos ortogonais como northern blotting. Estabelecer linearidade entre a contagem de leitura de sequenciamento e a abundância de RNA permite que o AQRNA-seq alcance uma quantificação precisa e absoluta de todas as espécies de RNA em uma amostra.

Aqui está uma descrição do protocolo para o fluxo de trabalho de preparação da biblioteca AQRNA-seq e o pipeline de análise de dados downstream que o acompanha. O método foi aplicado para elucidar a dinâmica da abundância de tRNA durante a dormência induzida pela fome e subsequente ressuscitação no modelo de tuberculose Mycobacterium bovis bacilos de Calmette et Guérin (BCG). Os resultados foram apresentados para a visualização exploratória dos dados de sequenciamento, juntamente com análises subsequentes de agrupamento e expressão diferencial que revelaram padrões discerníveis na abundância de tRNA associados a vários fenótipos.

Protocol

NOTA: A Figura 1 fornece uma ilustração gráfica dos procedimentos envolvidos na preparação da biblioteca AQRNA-seq. Informações detalhadas sobre os reagentes, produtos químicos e colunas/kits usados no procedimento podem ser encontradas na Tabela de Materiais. Recomenda-se realizar uma avaliação abrangente da pureza, integridade e quantidade das amostras de RNA de entrada usando (i) eletroforese em gel de agarose a 3%, (ii) ferramentas de eletroforese automatizadas…

Representative Results

Mycobacterium bovis A cepa BCG (bacilos de Calmette et Guérin) 1173P2 em crescimento exponencial foi submetida a uma série temporal (0, 4, 10 e 20 dias) de falta de nutrientes, seguida por uma ressuscitação de 6 dias em meio rico em nutrientes, conforme apresentado anteriormente em Hu et al.7. Pequenos RNAs foram isolados da cultura bacteriana, com três repetições biológicas, em cada um dos cinco pontos de tempo designados. As bibliotecas Illumina foram construídas usando o fluxo…

Discussion

O fluxo de trabalho de preparação da biblioteca AQRNA-seq foi projetado para maximizar a captura de RNAs em uma amostra e minimizar a queda da polimerase durante a transcrição reversa7. Por meio de uma ligação de ligante em duas etapas, novos oligos de DNA (Linker 1 e Linker 2) são ligados em excesso para complementar totalmente o RNA dentro da amostra. O excesso de ligantes pode ser removido de forma eficiente com RecJf, uma exonuclease de 5′ a 3′ específica para DNAs de fita simples, dei…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Os autores do presente trabalho agradecem aos autores do artigo original que descreve a tecnologia AQRNA-seq7. Este trabalho foi apoiado por doações dos Institutos Nacionais de Saúde (ES002109, AG063341, ES031576, ES031529, ES026856) e da Fundação Nacional de Pesquisa de Cingapura por meio da Aliança Cingapura-MIT para Pesquisa e Tecnologia Resistência Antimicrobiana IRG.

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).
This article has been published
Video Coming Soon
Keep me updated:

.

Cite This Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video