Die absolute Quantifizierung der RNA-Sequenzierung (AQRNA-seq) ist eine Technologie, die entwickelt wurde, um die Landschaft aller kleinen RNAs in biologischen Gemischen zu quantifizieren. Hier werden sowohl die Bibliotheksvorbereitung als auch die Datenverarbeitungsschritte von AQRNA-seq demonstriert, wobei Veränderungen im Transfer-RNA (tRNA)-Pool in Mycobacterium bovis BCG während der hungerinduzierten Dormanzphase quantifiziert werden.
AQRNA-seq bietet eine direkte lineare Beziehung zwischen den Lesezahlen der Sequenzierung und der Anzahl kleiner RNA-Kopien in einer biologischen Probe und ermöglicht so eine genaue Quantifizierung des Pools kleiner RNAs. Das hier beschriebene Verfahren zur Vorbereitung der AQRNA-seq-Bibliothek beinhaltet die Verwendung von kundenspezifisch entwickelten Sequenzierungslinkern und einen Schritt zur Reduzierung von Methylierungs-RNA-Modifikationen, die die Prozessivität der reversen Transkription blockieren, was zu einer erhöhten Ausbeute an cDNAs in voller Länge führt. Darüber hinaus wird eine detaillierte Implementierung der begleitenden Bioinformatik-Pipeline vorgestellt. Diese Demonstration von AQRNA-seq wurde durch eine quantitative Analyse der 45 tRNAs in Mycobacterium bovis BCG durchgeführt, die an 5 ausgewählten Tagen über einen Zeitraum von 20 Tagen mit Nährstoffentzug und 6 Tagen Wiederbelebung entnommen wurden. Die laufenden Bemühungen zur Verbesserung der Effizienz und Strenge von AQRNA-seq werden hier ebenfalls erörtert. Dazu gehört die Erforschung von Methoden zur Vermeidung der Gelaufreinigung, zur Minderung von Primer-Dimer-Problemen nach der PCR-Amplifikation und zur Erhöhung des Anteils von Reads in voller Länge, um ein genaueres Read-Mapping zu ermöglichen. Zukünftige Verbesserungen von AQRNA-seq werden sich auf die Erleichterung der Automatisierung und Hochdurchsatzimplementierung dieser Technologie zur Quantifizierung aller kleinen RNA-Spezies in Zell- und Gewebeproben verschiedener Organismen konzentrieren.
Next-Generation-Sequencing (NGS), auch bekannt als massiv parallele Sequenzierung, ist eine DNA-Sequenzierungstechnologie, die DNA-Fragmentierung, Ligation von Adapter-Oligonukleotiden, Polymerase-Kettenreaktion (PCR)-basierte Amplifikation, Sequenzierung der DNA und Reassemblierung der Fragmentsequenzen zu einem Genom umfasst. Die Anpassung von NGS an Sequenz-RNA (RNA-seq) ist ein leistungsfähiger Ansatz zur Identifizierung und Quantifizierung von RNA-Transkripten und deren Varianten1. Innovative Entwicklungen bei Arbeitsabläufen zur Vorbereitung von RNA-Bibliotheken und bioinformatischen Analysepipelines, gepaart mit Fortschritten bei Laborinstrumenten, haben das Repertoire an RNA-Seq-Anwendungen erweitert und sind über die Exomsequenzierung hinaus zu fortschrittlichen funktionellen Omics-Anwendungen wie nicht-kodierendem RNA-Profiling2, Einzelzellanalyse3, räumlicher Transkriptomik 4,5 und alternativer Spleißanalyse6 vorangeschrittenunter anderem. Diese fortschrittlichen RNA-seq-Methoden decken komplexe RNA-Funktionen durch quantitative Analyse des Transkriptoms in normalen und erkrankten Zellen und Geweben auf.
Trotz dieser Fortschritte in der RNA-seq schränken mehrere wichtige technische Merkmale die quantitative Leistungsfähigkeit der Methode ein. Während die meisten RNA-seq-Methoden eine präzise und genaue Quantifizierung von Änderungen der RNA-Spiegel zwischen experimentellen Variablen (d. h. biologischen Proben und/oder physiologischen Zuständen) ermöglichen, können sie keine quantitativen Vergleiche der Konzentrationen von RNA-Molekülen in einer Probe liefern. Zum Beispiel können die meisten RNA-seq-Methoden die relative Anzahl der Kopien einzelner tRNA-Isoakzeptormoleküle in einem zellulären Pool exprimierter tRNAs nicht genau quantifizieren. Wie in der Begleitpublikation7 hervorgehoben, ergibt sich diese Einschränkung des RNA-seq aus mehreren Merkmalen der RNA-Struktur und der Biochemie der Bibliotheksvorbereitung. Zum Beispiel wird die Aktivität der Ligationsenzyme, die zum Anhängen der 3′- und 5′-End-Sequenzierungslinker an RNA-Moleküle verwendet werden, stark von der Identität der terminalen Nukleotide der RNA und der Sequenzierungslinker beeinflusst. Dies führt zu großen Schwankungen in der Effizienz von Linker-Ligationen und zu tiefgreifenden künstlichen Steigerungen der Sequenzierungs-Reads 8,9,10.
Eine zweite Reihe von Einschränkungen ergibt sich aus den inhärenten strukturellen Eigenschaften von RNA-Molekülen. Insbesondere die Bildung der RNA-Sekundärstruktur und dynamische Veränderungen in den Dutzenden von posttranskriptionellen RNA-Modifikationen des Epitranskriptoms können zu einem Polymeraseabfall oder einer Mutation während der reversen Transkription führen. Diese Fehler führen zu einer unvollständigen oder verkürzten cDNA-Synthese oder einer veränderten RNA-Sequenz. Während diese beiden Phänomene ausgenutzt werden können, um Sekundärstrukturen oder einige Modifikationen zu kartieren, verschlechtern sie die quantitative Genauigkeit von RNA-seq, wenn nachfolgende Bibliotheksvorbereitungsschritte keine verkürzten cDNAs erfassen oder wenn die Datenverarbeitung mutierte Sequenzen auswirft, die nicht mit einem Referenzdatensatz übereinstimmen11,12. Darüber hinaus verringert die immense chemische, längen- und strukturelle Vielfalt von RNA-Transkripten sowie der Mangel an Werkzeugen zur gleichmäßigen Fragmentierung langer RNAs die Anwendbarkeit der meisten RNA-seq-Methoden auf alle RNA-Spezies13.
Die AQRNA-seq-Methode (absolute Quantifizierung RNA-Sequenzierung) wurde entwickelt, um mehrere dieser technischen und biologischen Einschränkungen zu beseitigen, die die quantitative Genauigkeit einschränken7. Durch die Minimierung sequenzabhängiger Verzerrungen bei der Erfassung, Ligation und Amplifikation während der Vorbereitung der RNA-Sequenzierungsbibliotheken erreicht AQRNA-seq eine überlegene Linearität im Vergleich zu anderen Methoden und quantifiziert 75 % einer Referenzbibliothek von 963 miRNAs mit 2-facher Genauigkeit. Diese lineare Korrelation von Sequenzierung, Lesezahl und RNA-Abundanz wird auch bei der Analyse eines Pools variabler Länge von RNA-Oligonukleotidstandards und in Bezug auf orthogonale Methoden wie Northern Blot beobachtet. Die Etablierung der Linearität zwischen der Anzahl der Sequenzierungs-Reads und der RNA-Abundanz ermöglicht AQRNA-seq eine genaue, absolute Quantifizierung aller RNA-Spezies innerhalb einer Probe.
Im Folgenden finden Sie eine Beschreibung des Protokolls für den Workflow zur Vorbereitung von AQRNA-seq-Bibliotheken und der zugehörigen nachgelagerten Datenanalyse-Pipeline. Die Methode wurde angewendet, um die Dynamik der tRNA-Abundanz während der hungerinduzierten Ruhephase und der anschließenden Wiederbelebung im Mycobacterium bovis bacilli de Calmette et Guérin (BCG) Modell der Tuberkulose aufzuklären. Die Ergebnisse wurden für die explorative Visualisierung der Sequenzierungsdaten vorgestellt, zusammen mit anschließenden Clustering- und differentiellen Expressionsanalysen, die erkennbare Muster in der tRNA-Abundanz aufdeckten, die mit verschiedenen Phänotypen assoziiert sind.
Der Arbeitsablauf zur Vorbereitung der AQRNA-seq-Bibliothek wurde entwickelt, um die Erfassung von RNAs in einer Probe zu maximieren und den Polymeraseabfall während der reversen Transkriptionzu minimieren 7. Durch eine zweistufige Linker-Ligation werden neuartige DNA-Oligos (Linker 1 und Linker 2) im Überschuss ligiert, um die RNA in der Probe vollständig zu ergänzen. Überschüssige Linker können effizient mit RecJf, einer 5′- bis 3′-Exonuklease, die für einzelsträngige DNAs spezifisch is…
The authors have nothing to disclose.
Die Autoren der vorliegenden Arbeit danken den Autoren der ursprünglichen Arbeit, die die AQRNA-seq-Technologie7 beschreibt. Diese Arbeit wurde durch Zuschüsse der National Institutes of Health (ES002109, AG063341, ES031576, ES031529, ES026856) und der National Research Foundation of Singapore über die Singapore-MIT Alliance for Research and Technology Antimicrobial Resistance IRG unterstützt.
2-ketoglutarate | Sigma-Aldrich | 75890 | Prepare a working solution (1 M) and store it at -20ºC |
2100 Bioanalyzer Instrument | Agilent | G2938C | |
5'-deadenylase (50 U/μL) | New England Biolabs | M0331S (component #: M0331SVIAL) | Store at -20 °C |
Adenosine 5'-Triphosphate (ATP) | New England Biolabs | M0437M (component #: N0437AVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
AGAROSE GPG/LE | AmericanBio | AB00972-00500 | Store at ambient temperature |
Ammonium iron(II) sulfate hexahydrate | Sigma-Aldrich | F2262 | Prepare a working solution (0.25 M) and store it at -20 °C |
Bioanalyzer Small RNA Analysis | Agilent | 5067-1548 | The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation) |
Bovine Serum Albumin (BSA; 10 mg/mL) | New England Biolabs | B9000 | This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200). |
Chloroform | Macron Fine Chemicals | 4441-10 | |
Demethylase | ArrayStar | AS-FS-004 | Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004) |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447L (component #: N0447LVIAL) | This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each) |
Digital Dual Heat Block | VWR Scientific Products | 13259-052 | Heating block is used with the QIAquick Gel Extraction Kit |
DyeEx 2.0 Spin Kit | Qiagen | 63204 | Effective at removing short remnants (e.g., oligos less than 10 bp in length) |
Electrophoresis Power Supply | Bio-Rad Labrotories | PowerPac 300 | |
Eppendorf PCR Tubes (0.5 mL) | Eppendorf | 0030124537 | |
Eppendorf Safe-Lock Tubes (0.5 mL) | Eppendorf | 022363611 | |
Eppendorf Safe-Lock Tubes (1.5 mL) | Eppendorf | 022363204 | |
Eppendorf Safe-Lock Tubes (2 mL) | Eppendorf | 022363352 | |
Ethyl alcohol (Ethanol), Pure | Sigma-Aldrich | E7023 | The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research |
Gel Imaging System | Alpha Innotech | FluorChem 8900 | |
Gel Loading Dye, Purple (6X), no SDS | New England Biolabs | N0556S (component #: B7025SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
GENESYS 180 UV-Vis Spectrophotometer | Thermo Fisher Scientific | 840-309000 | The spectrophotometer is used for measuring the oligo concentrations using the Beer's law |
HEPES | Sigma-Aldrich | H4034 | Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C |
Hydrochloric acid (HCl) | VWR Scientific Products | BDH3028 | Prepare a working solution (5 M) and store it at ambient temperature |
Isopropyl Alcohol (Isopropanol), Pure | Macron Fine Chemicals | 3032-16 | Isopropanol is used with the QIAquick Gel Extraction Kit |
L-Ascorbic acid | Sigma-Aldrich | A5960 | Prepare a working solution (0.5 M) and store it at -20ºC |
Microcentrifuge | Eppendorf | 5415D | |
NanoDrop 2000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
NEBuffer 2 (10X) | New England Biolabs | M0264L (component #: B7002SVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
Nuclease-Free Water (not DEPC-Treated) | Thermo Fisher Scientific | AM9938 | |
Oligo Clean & Concentrator Kit | Zymo Research | D4061 | Store at ambient temperature |
PEG 8000 (50% solution) | New England Biolabs | M0437M (component #: B1004SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
Peltier Thermal Cycler | MJ Research | PTC-200 | |
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2 | Thermo Fisher Scientific | J62336 | |
PrimeScript Buffer (5X) | TaKaRa | 2680A | |
PrimeScript Reverse Transcriptase | TaKaRa | 2680A | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | This kit requires a heating block and isopropanol to work with |
Quick-Load Purple 100 bp DNA Ladder | New England Biolabs | N0551S (component #: N0551SVIAL) | |
Quick-Load Purple 50 bp DNA Ladder | New England Biolabs | N0556S (component #: N0556SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
RecJf (30 U/μL) | New England Biolabs | M0264L (component #: M0264LVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
RNase Inhibitor (murine; 40 U/μL) | New England Biolabs | M0314L (component #: M0314LVIAL) | Store at -20 °C |
SeqAMP DNA Polymerase | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
SeqAMP PCR Buffer (2X) | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
Shrimp Alkaline Phosphatase (1 U/μL) | New England Biolabs | M0371L (component #: M0371LVIAL) | |
Sodium hydroxide (NaOH) | Sigma-Aldrich | S5881 | Prepare a working solution (5 M) and store it at ambient temperature |
T4 DNA Ligase (400 U/μL) | New England Biolabs | M0202L (component #: M0202LVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 DNA Ligase Reaction Buffer (10X) | New England Biolabs | M0202L (component #: B0202SVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 RNA Ligase 1 (30 U/μL) | New England Biolabs | M0437M (component #: M0437MVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |
T4 RNA Ligase Reaction Buffer (10X) | New England Biolabs | M0437M (component #: B0216SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |