Summary

AQRNA-seq zur Quantifizierung kleiner RNAs

Published: February 02, 2024
doi:

Summary

Die absolute Quantifizierung der RNA-Sequenzierung (AQRNA-seq) ist eine Technologie, die entwickelt wurde, um die Landschaft aller kleinen RNAs in biologischen Gemischen zu quantifizieren. Hier werden sowohl die Bibliotheksvorbereitung als auch die Datenverarbeitungsschritte von AQRNA-seq demonstriert, wobei Veränderungen im Transfer-RNA (tRNA)-Pool in Mycobacterium bovis BCG während der hungerinduzierten Dormanzphase quantifiziert werden.

Abstract

AQRNA-seq bietet eine direkte lineare Beziehung zwischen den Lesezahlen der Sequenzierung und der Anzahl kleiner RNA-Kopien in einer biologischen Probe und ermöglicht so eine genaue Quantifizierung des Pools kleiner RNAs. Das hier beschriebene Verfahren zur Vorbereitung der AQRNA-seq-Bibliothek beinhaltet die Verwendung von kundenspezifisch entwickelten Sequenzierungslinkern und einen Schritt zur Reduzierung von Methylierungs-RNA-Modifikationen, die die Prozessivität der reversen Transkription blockieren, was zu einer erhöhten Ausbeute an cDNAs in voller Länge führt. Darüber hinaus wird eine detaillierte Implementierung der begleitenden Bioinformatik-Pipeline vorgestellt. Diese Demonstration von AQRNA-seq wurde durch eine quantitative Analyse der 45 tRNAs in Mycobacterium bovis BCG durchgeführt, die an 5 ausgewählten Tagen über einen Zeitraum von 20 Tagen mit Nährstoffentzug und 6 Tagen Wiederbelebung entnommen wurden. Die laufenden Bemühungen zur Verbesserung der Effizienz und Strenge von AQRNA-seq werden hier ebenfalls erörtert. Dazu gehört die Erforschung von Methoden zur Vermeidung der Gelaufreinigung, zur Minderung von Primer-Dimer-Problemen nach der PCR-Amplifikation und zur Erhöhung des Anteils von Reads in voller Länge, um ein genaueres Read-Mapping zu ermöglichen. Zukünftige Verbesserungen von AQRNA-seq werden sich auf die Erleichterung der Automatisierung und Hochdurchsatzimplementierung dieser Technologie zur Quantifizierung aller kleinen RNA-Spezies in Zell- und Gewebeproben verschiedener Organismen konzentrieren.

Introduction

Next-Generation-Sequencing (NGS), auch bekannt als massiv parallele Sequenzierung, ist eine DNA-Sequenzierungstechnologie, die DNA-Fragmentierung, Ligation von Adapter-Oligonukleotiden, Polymerase-Kettenreaktion (PCR)-basierte Amplifikation, Sequenzierung der DNA und Reassemblierung der Fragmentsequenzen zu einem Genom umfasst. Die Anpassung von NGS an Sequenz-RNA (RNA-seq) ist ein leistungsfähiger Ansatz zur Identifizierung und Quantifizierung von RNA-Transkripten und deren Varianten1. Innovative Entwicklungen bei Arbeitsabläufen zur Vorbereitung von RNA-Bibliotheken und bioinformatischen Analysepipelines, gepaart mit Fortschritten bei Laborinstrumenten, haben das Repertoire an RNA-Seq-Anwendungen erweitert und sind über die Exomsequenzierung hinaus zu fortschrittlichen funktionellen Omics-Anwendungen wie nicht-kodierendem RNA-Profiling2, Einzelzellanalyse3, räumlicher Transkriptomik 4,5 und alternativer Spleißanalyse6 vorangeschrittenunter anderem. Diese fortschrittlichen RNA-seq-Methoden decken komplexe RNA-Funktionen durch quantitative Analyse des Transkriptoms in normalen und erkrankten Zellen und Geweben auf.

Trotz dieser Fortschritte in der RNA-seq schränken mehrere wichtige technische Merkmale die quantitative Leistungsfähigkeit der Methode ein. Während die meisten RNA-seq-Methoden eine präzise und genaue Quantifizierung von Änderungen der RNA-Spiegel zwischen experimentellen Variablen (d. h. biologischen Proben und/oder physiologischen Zuständen) ermöglichen, können sie keine quantitativen Vergleiche der Konzentrationen von RNA-Molekülen in einer Probe liefern. Zum Beispiel können die meisten RNA-seq-Methoden die relative Anzahl der Kopien einzelner tRNA-Isoakzeptormoleküle in einem zellulären Pool exprimierter tRNAs nicht genau quantifizieren. Wie in der Begleitpublikation7 hervorgehoben, ergibt sich diese Einschränkung des RNA-seq aus mehreren Merkmalen der RNA-Struktur und der Biochemie der Bibliotheksvorbereitung. Zum Beispiel wird die Aktivität der Ligationsenzyme, die zum Anhängen der 3′- und 5′-End-Sequenzierungslinker an RNA-Moleküle verwendet werden, stark von der Identität der terminalen Nukleotide der RNA und der Sequenzierungslinker beeinflusst. Dies führt zu großen Schwankungen in der Effizienz von Linker-Ligationen und zu tiefgreifenden künstlichen Steigerungen der Sequenzierungs-Reads 8,9,10.

Eine zweite Reihe von Einschränkungen ergibt sich aus den inhärenten strukturellen Eigenschaften von RNA-Molekülen. Insbesondere die Bildung der RNA-Sekundärstruktur und dynamische Veränderungen in den Dutzenden von posttranskriptionellen RNA-Modifikationen des Epitranskriptoms können zu einem Polymeraseabfall oder einer Mutation während der reversen Transkription führen. Diese Fehler führen zu einer unvollständigen oder verkürzten cDNA-Synthese oder einer veränderten RNA-Sequenz. Während diese beiden Phänomene ausgenutzt werden können, um Sekundärstrukturen oder einige Modifikationen zu kartieren, verschlechtern sie die quantitative Genauigkeit von RNA-seq, wenn nachfolgende Bibliotheksvorbereitungsschritte keine verkürzten cDNAs erfassen oder wenn die Datenverarbeitung mutierte Sequenzen auswirft, die nicht mit einem Referenzdatensatz übereinstimmen11,12. Darüber hinaus verringert die immense chemische, längen- und strukturelle Vielfalt von RNA-Transkripten sowie der Mangel an Werkzeugen zur gleichmäßigen Fragmentierung langer RNAs die Anwendbarkeit der meisten RNA-seq-Methoden auf alle RNA-Spezies13.

Die AQRNA-seq-Methode (absolute Quantifizierung RNA-Sequenzierung) wurde entwickelt, um mehrere dieser technischen und biologischen Einschränkungen zu beseitigen, die die quantitative Genauigkeit einschränken7. Durch die Minimierung sequenzabhängiger Verzerrungen bei der Erfassung, Ligation und Amplifikation während der Vorbereitung der RNA-Sequenzierungsbibliotheken erreicht AQRNA-seq eine überlegene Linearität im Vergleich zu anderen Methoden und quantifiziert 75 % einer Referenzbibliothek von 963 miRNAs mit 2-facher Genauigkeit. Diese lineare Korrelation von Sequenzierung, Lesezahl und RNA-Abundanz wird auch bei der Analyse eines Pools variabler Länge von RNA-Oligonukleotidstandards und in Bezug auf orthogonale Methoden wie Northern Blot beobachtet. Die Etablierung der Linearität zwischen der Anzahl der Sequenzierungs-Reads und der RNA-Abundanz ermöglicht AQRNA-seq eine genaue, absolute Quantifizierung aller RNA-Spezies innerhalb einer Probe.

Im Folgenden finden Sie eine Beschreibung des Protokolls für den Workflow zur Vorbereitung von AQRNA-seq-Bibliotheken und der zugehörigen nachgelagerten Datenanalyse-Pipeline. Die Methode wurde angewendet, um die Dynamik der tRNA-Abundanz während der hungerinduzierten Ruhephase und der anschließenden Wiederbelebung im Mycobacterium bovis bacilli de Calmette et Guérin (BCG) Modell der Tuberkulose aufzuklären. Die Ergebnisse wurden für die explorative Visualisierung der Sequenzierungsdaten vorgestellt, zusammen mit anschließenden Clustering- und differentiellen Expressionsanalysen, die erkennbare Muster in der tRNA-Abundanz aufdeckten, die mit verschiedenen Phänotypen assoziiert sind.

Protocol

HINWEIS: Abbildung 1 zeigt eine grafische Darstellung der Verfahren, die bei der Vorbereitung der AQRNA-seq-Bibliothek erforderlich sind. Detaillierte Informationen zu den Reagenzien, Chemikalien und Säulen/Kits, die in dem Verfahren verwendet werden, finden Sie in der Materialtabelle. Es wird empfohlen, eine umfassende Bewertung der Reinheit, Integrität und Menge der Eingabe-RNA-Proben mit (i) 3%iger Agarose-Gelelektrophorese, (ii) automatisierten Elektrophoresewerkzeugen…

Representative Results

Mycobacterium bovis BCG (bacilli de Calmette et Guérin) Stamm 1173P2, die exponentiell wuchsen, wurden einer Zeitreihe (0, 4, 10 und 20 Tage) von Nährstoffmangel unterzogen, gefolgt von einer 6-tägigen Wiederbelebung in nährstoffreichem Medium, wie zuvor in Hu et al.7 beschrieben. Kleine RNAs wurden aus Bakterienkulturen mit drei biologischen Replikaten zu jedem der fünf festgelegten Zeitpunkte isoliert. Die Illumina-Bibliotheken wurden unter Verwendung des oben beschriebenen AQRNA-s…

Discussion

Der Arbeitsablauf zur Vorbereitung der AQRNA-seq-Bibliothek wurde entwickelt, um die Erfassung von RNAs in einer Probe zu maximieren und den Polymeraseabfall während der reversen Transkriptionzu minimieren 7. Durch eine zweistufige Linker-Ligation werden neuartige DNA-Oligos (Linker 1 und Linker 2) im Überschuss ligiert, um die RNA in der Probe vollständig zu ergänzen. Überschüssige Linker können effizient mit RecJf, einer 5′- bis 3′-Exonuklease, die für einzelsträngige DNAs spezifisch is…

Divulgations

The authors have nothing to disclose.

Acknowledgements

Die Autoren der vorliegenden Arbeit danken den Autoren der ursprünglichen Arbeit, die die AQRNA-seq-Technologie7 beschreibt. Diese Arbeit wurde durch Zuschüsse der National Institutes of Health (ES002109, AG063341, ES031576, ES031529, ES026856) und der National Research Foundation of Singapore über die Singapore-MIT Alliance for Research and Technology Antimicrobial Resistance IRG unterstützt.

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).

Play Video

Citer Cet Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video