Summary

AQRNA-seq per la quantificazione di piccoli RNA

Published: February 02, 2024
doi:

Summary

Il sequenziamento dell’RNA a quantificazione assoluta (AQRNA-seq) è una tecnologia sviluppata per quantificare il panorama di tutti i piccoli RNA nelle miscele biologiche. Qui, vengono dimostrate sia le fasi di preparazione della libreria che quelle di elaborazione dei dati di AQRNA-seq, quantificando i cambiamenti nel pool di RNA di trasferimento (tRNA) in Mycobacterium bovis BCG durante la dormienza indotta dalla fame.

Abstract

AQRNA-seq fornisce una relazione lineare diretta tra i conteggi delle letture di sequenziamento e i piccoli numeri di copie di RNA in un campione biologico, consentendo così una quantificazione accurata del pool di piccoli RNA. La procedura di preparazione della libreria AQRNA-seq qui descritta prevede l’uso di linker di sequenziamento progettati su misura e un passaggio per ridurre le modifiche dell’RNA di metilazione che bloccano la processività della trascrizione inversa, con conseguente aumento della resa di cDNA a lunghezza intera. Inoltre, viene presentata un’implementazione dettagliata della pipeline bioinformatica di accompagnamento. Questa dimostrazione di AQRNA-seq è stata condotta attraverso un’analisi quantitativa dei 45 tRNA in Mycobacterium bovis BCG raccolti in 5 giorni selezionati in un corso di 20 giorni di privazione di nutrienti e 6 giorni di rianimazione. In questa sede verranno discussi anche gli sforzi in corso per migliorare l’efficienza e il rigore di AQRNA-seq. Ciò include l’esplorazione di metodi per ovviare alla purificazione del gel per mitigare i problemi del dimero del primer dopo l’amplificazione della PCR e per aumentare la percentuale di letture a lunghezza intera per consentire una mappatura delle letture più accurata. I futuri miglioramenti di AQRNA-seq si concentreranno sulla facilitazione dell’automazione e dell’implementazione ad alto rendimento di questa tecnologia per quantificare tutte le piccole specie di RNA in campioni di cellule e tessuti provenienti da diversi organismi.

Introduction

Il sequenziamento di nuova generazione (NGS), noto anche come sequenziamento massivamente parallelo, è una tecnologia di sequenziamento del DNA che prevede la frammentazione del DNA, la legatura degli oligonucleotidi adattatori, l’amplificazione basata sulla reazione a catena della polimerasi (PCR), il sequenziamento del DNA e il riassemblaggio delle sequenze di frammenti in un genoma. L’adattamento dell’NGS all’RNA di sequenza (RNA-seq) è un approccio potente per identificare e quantificare i trascritti di RNA e le loro varianti1. Gli sviluppi innovativi nei flussi di lavoro per la preparazione delle librerie di RNA e nelle pipeline di analisi bioinformatica, insieme ai progressi nella strumentazione di laboratorio, hanno ampliato il repertorio delle applicazioni RNA-seq, progredendo oltre il sequenziamento dell’esoma verso omiche funzionali avanzate come la profilazione dell’RNA non codificante2, l’analisi di singole cellule3, la trascrittomica spaziale 4,5, l’analisi di splicing alternativo6, tra gli altri. Questi metodi avanzati di RNA-seq rivelano funzioni complesse dell’RNA attraverso l’analisi quantitativa del trascrittoma in cellule e tessuti normali e malati.

Nonostante questi progressi nell’RNA-seq, diverse caratteristiche tecniche chiave limitano la potenza quantitativa del metodo. Sebbene la maggior parte dei metodi RNA-seq consenta una quantificazione precisa e accurata dei cambiamenti nei livelli di RNA tra variabili sperimentali (ad esempio, campioni biologici e/o stati fisiologici), non possono fornire confronti quantitativi dei livelli di molecole di RNA all’interno di un campione. Ad esempio, la maggior parte dei metodi RNA-seq non è in grado di quantificare con precisione il numero relativo di copie di singole molecole isoaccettori di tRNA in un pool cellulare di tRNA espressi. Come evidenziato nella pubblicazione complementare7, questa limitazione all’RNA-seq deriva da diverse caratteristiche della struttura dell’RNA e dalla biochimica della preparazione della libreria. Ad esempio, l’attività degli enzimi di ligazione utilizzati per legare i linker di sequenziamento delle estremità 3′ e 5′ alle molecole di RNA è fortemente influenzata dall’identità dei nucleotidi terminali dell’RNA e dei linker di sequenziamento. Ciò porta a grandi variazioni nell’efficienza delle legature dei linker e a profondi aumenti artefatti nelle letture del sequenziamento 8,9,10.

Una seconda serie di limitazioni deriva dalle proprietà strutturali intrinseche delle molecole di RNA. In particolare, la formazione della struttura secondaria dell’RNA e i cambiamenti dinamici nelle dozzine di modifiche post-trascrizionali dell’RNA dell’epitrascrittoma possono causare la caduta o la mutazione della polimerasi durante la trascrizione inversa. Questi errori provocano una sintesi incompleta o troncata del cDNA o un’alterazione della sequenza dell’RNA. Sebbene entrambi questi fenomeni possano essere sfruttati per mappare strutture secondarie o alcune modifiche, degradano l’accuratezza quantitativa dell’RNA-seq se le successive fasi di preparazione della libreria non riescono a catturare cDNA troncati o se l’elaborazione dei dati elimina sequenze mutate che non corrispondono a un set di dati di riferimento11,12. Inoltre, l’immensa diversità chimica, di lunghezza e strutturale dei trascritti di RNA, così come la mancanza di strumenti per frammentare uniformemente gli RNA lunghi, diminuisce l’applicabilità della maggior parte dei metodi RNA-seq a tutte le specie di RNA13.

Il metodo AQRNA-seq (absolute quantification RNA sequencing) è stato sviluppato per rimuovere molti di questi vincoli tecnici e biologici che limitano l’accuratezza quantitativa7. Riducendo al minimo le distorsioni sequenza-dipendenti nella cattura, nella legatura e nell’amplificazione durante la preparazione della libreria di sequenziamento dell’RNA, AQRNA-seq raggiunge una linearità superiore rispetto ad altri metodi, quantificando con precisione il 75% di una libreria di riferimento di 963 miRNA con un’accuratezza di 2 volte. Questa correlazione lineare tra sequenziamento, conteggio delle letture e abbondanza di RNA è osservata anche in un’analisi di un pool di standard di oligonucleotidi di RNA a lunghezza variabile e in riferimento a metodi ortogonali come il northern blotting. Stabilire la linearità tra il conteggio delle letture di sequenziamento e l’abbondanza di RNA consente ad AQRNA-seq di ottenere una quantificazione accurata e assoluta di tutte le specie di RNA all’interno di un campione.

Di seguito è riportata una descrizione del protocollo per il flusso di lavoro di preparazione della libreria AQRNA-seq e della pipeline di analisi dei dati a valle associata. Il metodo è stato applicato per chiarire le dinamiche dell’abbondanza di tRNA durante la dormienza indotta dalla fame e la successiva rianimazione nel modello di tubercolosi Mycobacterium bovis bacilli de Calmette et Guérin (BCG). I risultati sono stati presentati per la visualizzazione esplorativa dei dati di sequenziamento, insieme alle successive analisi di clustering e di espressione differenziale che hanno svelato modelli distinguibili nell’abbondanza di tRNA associati a vari fenotipi.

Protocol

NOTA: La Figura 1 fornisce un’illustrazione grafica delle procedure coinvolte nella preparazione della libreria AQRNA-seq. Informazioni dettagliate sui reagenti, le sostanze chimiche e le colonne/kit utilizzati nella procedura sono disponibili nella Tabella dei materiali. Si raccomanda di eseguire una valutazione completa della purezza, dell’integrità e della quantità dei campioni di RNA in ingresso utilizzando (i) l’elettroforesi su gel di agarosio al 3%, (ii) strumenti d…

Representative Results

Mycobacterium bovis I BCG (bacilli di Calmette et Guérin) ceppo 1173P2 sottoposti a crescita esponenziale sono stati soggetti a una serie temporale (0, 4, 10 e 20 giorni) di carenza di nutrienti, seguita da una rianimazione di 6 giorni in un terreno ricco di sostanze nutritive, come precedentemente presentato in Hu et al.7. Piccoli RNA sono stati isolati da colture batteriche, con tre repliche biologiche, in ciascuno dei cinque punti temporali designati. Le librerie Illumina sono state c…

Discussion

Il flusso di lavoro di preparazione della libreria AQRNA-seq è progettato per massimizzare la cattura di RNA all’interno di un campione e ridurre al minimo la caduta della polimerasi durante la trascrizione inversa7. Attraverso una legatura del linker in due fasi, i nuovi oligo di DNA (Linker 1 e Linker 2) vengono legati in eccesso per completare completamente l’RNA all’interno del campione. I linker in eccesso possono essere rimossi in modo efficiente con RecJf, un’esonucleasi da 5′ a 3′ specifi…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Gli autori del presente lavoro sono grati agli autori dell’articolo originale che descrive la tecnologia AQRNA-seq7. Questo lavoro è stato sostenuto da sovvenzioni del National Institutes of Health (ES002109, AG063341, ES031576, ES031529, ES026856) e della National Research Foundation di Singapore attraverso la Singapore-MIT Alliance for Research and Technology Antimicrobial Resistance IRG.

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).

Play Video

Cite This Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video