Summary

AQRNA-seq voor het kwantificeren van kleine RNA's

Published: February 02, 2024
doi:

Summary

Absolute kwantificering RNA-sequencing (AQRNA-seq) is een technologie die is ontwikkeld om het landschap van alle kleine RNA’s in biologische mengsels te kwantificeren. Hier worden zowel de bibliotheekvoorbereidings- als de gegevensverwerkingsstappen van AQRNA-seq gedemonstreerd, waarbij veranderingen in de transfer-RNA (tRNA)-pool in Mycobacterium bovis BCG worden gekwantificeerd tijdens door uithongering veroorzaakte rustperiode.

Abstract

AQRNA-seq biedt een directe lineaire relatie tussen sequencing-leestellingen en het aantal kleine RNA-kopieën in een biologisch monster, waardoor een nauwkeurige kwantificering van de pool van kleine RNA’s mogelijk is. De hier beschreven voorbereidingsprocedure voor de AQRNA-seq-bibliotheek omvat het gebruik van op maat ontworpen sequencing-linkers en een stap voor het verminderen van methylatie-RNA-modificaties die de omgekeerde transcriptieprocesiviteit blokkeren, wat resulteert in een verhoogde opbrengst van cDNA’s van volledige lengte. Daarnaast wordt een gedetailleerde implementatie van de bijbehorende bioinformatica-pijplijn gepresenteerd. Deze demonstratie van AQRNA-seq werd uitgevoerd door middel van een kwantitatieve analyse van de 45 tRNA’s in Mycobacterium bovis BCG, geoogst op 5 geselecteerde dagen gedurende een tijdsverloop van 20 dagen van voedingsdeprivatie en 6 dagen van reanimatie. Lopende inspanningen om de efficiëntie en nauwkeurigheid van AQRNA-seq te verbeteren, zullen hier ook worden besproken. Dit omvat het onderzoeken van methoden om gelzuivering te voorkomen voor het verminderen van problemen met primerdimeer na PCR-amplificatie en om het aandeel van volledige aflezingen te vergroten om een nauwkeurigere leesmapping mogelijk te maken. Toekomstige verbeteringen aan AQRNA-seq zullen gericht zijn op het vergemakkelijken van automatisering en high-throughput implementatie van deze technologie voor het kwantificeren van alle kleine RNA-soorten in cel- en weefselmonsters van diverse organismen.

Introduction

Next-generation sequencing (NGS), ook bekend als massively parallel sequencing, is een DNA-sequencingtechnologie die DNA-fragmentatie, ligatie van adaptor-oligonucleotiden, op polymerasekettingreactie (PCR) gebaseerde amplificatie, sequentiebepaling van het DNA en herassemblage van de fragmentsequenties tot een genoom omvat. De aanpassing van NGS aan sequentie-RNA (RNA-seq) is een krachtige benadering om RNA-transcripten en hun varianten te identificeren en te kwantificeren1. Innovatieve ontwikkelingen in workflows voor de voorbereiding van RNA-bibliotheken en pijplijnen voor bio-informaticaanalyse, in combinatie met vooruitgang in laboratoriuminstrumentatie, hebben het repertoire van RNA-seq-toepassingen uitgebreid, en zijn verder gegaan dan exoomsequencing naar geavanceerde functionele omics zoals niet-coderende RNA-profilering2, analyse van één cel3, ruimtelijke transcriptomics 4,5, alternatieve splicinganalyse6onder andere. Deze geavanceerde RNA-seq-methoden onthullen complexe RNA-functies door middel van kwantitatieve analyse van het transcriptoom in normale en zieke cellen en weefsels.

Ondanks deze vooruitgang in RNA-seq, beperken verschillende belangrijke technische kenmerken de kwantitatieve kracht van de methode. Hoewel de meeste RNA-seq-methoden nauwkeurige en nauwkeurige kwantificering van veranderingen in de niveaus van RNA’s tussen experimentele variabelen (d.w.z. biologische monsters en/of fysiologische toestanden) mogelijk maken, kunnen ze geen kwantitatieve vergelijkingen maken van de niveaus van RNA-moleculen in een monster. De meeste RNA-seq-methoden kunnen bijvoorbeeld het relatieve aantal kopieën van individuele tRNA-isoacceptormoleculen in een cellulaire pool van tot expressie gebrachte tRNA’s niet nauwkeurig kwantificeren. Zoals benadrukt in de begeleidende publicatie7, komt deze beperking tot RNA-seq voort uit verschillende kenmerken van de RNA-structuur en de biochemie van bibliotheekvoorbereiding. De activiteit van de ligatie-enzymen die worden gebruikt om de 3′- en 5′-end sequencing linkers aan RNA-moleculen te hechten, wordt bijvoorbeeld sterk beïnvloed door de identiteit van de terminale nucleotiden van het RNA en de sequencing linkers. Dit leidt tot grote variaties in de efficiëntie van linkerligaties en diepgaande artefactische verhogingen in sequencing reads 8,9,10.

Een tweede reeks beperkingen vloeit voort uit de inherente structurele eigenschappen van RNA-moleculen. In het bijzonder kunnen de vorming van secundaire RNA-structuren en dynamische veranderingen in de tientallen post-transcriptionele RNA-modificaties van het epitranscriptoom polymerase-uitval of mutatie veroorzaken tijdens omgekeerde transcriptie. Deze fouten resulteren in onvolledige of afgekapte cDNA-synthese of veranderde RNA-sequentie. Hoewel beide fenomenen kunnen worden uitgebuit om secundaire structuren of sommige wijzigingen in kaart te brengen, verslechteren ze de kwantitatieve nauwkeurigheid van RNA-seq als de volgende stappen voor de voorbereiding van de bibliotheek er niet in slagen afgekapte cDNA’s vast te leggen of als gegevensverwerking gemuteerde sequenties weggooit die niet overeenkomen met een referentiedataset11,12. Bovendien vermindert de immense chemische, lengte- en structurele diversiteit van RNA-transcripten, evenals het gebrek aan hulpmiddelen om lange RNA’s uniform te fragmenteren, de toepasbaarheid van de meeste RNA-seq-methoden op alle RNA-soorten13.

De AQRNA-seq-methode (absolute kwantificering RNA-sequencing) is ontwikkeld om een aantal van deze technische en biologische beperkingen weg te nemen die de kwantitatieve nauwkeurigheid beperken7. Door sequentieafhankelijke vooroordelen bij het vastleggen, ligeren en amplificeren tijdens de voorbereiding van de RNA-sequencingbibliotheek te minimaliseren, bereikt AQRNA-seq superieure lineariteit in vergelijking met andere methoden, waarbij 75% van een referentiebibliotheek van 963 miRNA’s nauwkeurig wordt gekwantificeerd met een 2-voudige nauwkeurigheid. Deze lineaire correlatie van sequencing, leestelling en RNA-overvloed wordt ook waargenomen in een analyse van een pool van RNA-oligonucleotidestandaarden met variabele lengte en in verwijzing naar orthogonale methoden zoals northern blotting. Door lineariteit vast te stellen tussen sequencing, het aantal leessnelheden en de overvloed aan RNA kan AQRNA-seq een nauwkeurige, absolute kwantificering van alle RNA-soorten in een monster bereiken.

Hier volgt een beschrijving van het protocol voor de workflow voor de voorbereiding van de AQRNA-seq-bibliotheek en de bijbehorende downstream data-analysepijplijn. De methode werd toegepast om de dynamiek van de tRNA-overvloed tijdens door uithongering veroorzaakte rustperiode en daaropvolgende reanimatie op te helderen in het Mycobacterium bovis bacillen de Calmette et Guérin (BCG) model van tuberculose. De resultaten werden gepresenteerd voor de verkennende visualisatie van de sequentiegegevens, samen met daaropvolgende clustering- en differentiële expressieanalyses die waarneembare patronen in de overvloed aan tRNA onthulden die verband houden met verschillende fenotypes.

Protocol

OPMERKING: Figuur 1 geeft een grafische illustratie van de procedures die betrokken zijn bij de voorbereiding van de AQRNA-seq-bibliotheek. Gedetailleerde informatie over de reagentia, chemicaliën en kolommen/kits die in de procedure worden gebruikt, is te vinden in de Materiaaltabel. Het wordt aanbevolen om een uitgebreide evaluatie uit te voeren van de zuiverheid, integriteit en kwantiteit van de input-RNA-monsters met behulp van (i) 3% agarosegelelektroforese, (ii) geaut…

Representative Results

Mycobacterium bovis BCG (bacillen de Calmette et Guérin) stam 1173P2 die een exponentiële groei doormaakten, werden onderworpen aan een tijdreeks (0, 4, 10 en 20 dagen) van uithongering van voedingsstoffen, gevolgd door een 6-daagse reanimatie in een voedingsrijk medium zoals eerder gepresenteerd in Hu et al.7. Kleine RNA’s werden geïsoleerd uit een bacteriecultuur, met drie biologische replicaten, op elk van de vijf aangewezen tijdstippen. Illumina-bibliotheken werden gebouwd met behu…

Discussion

De workflow voor de voorbereiding van de AQRNA-seq-bibliotheek is ontworpen om de opname van RNA’s in een monster te maximaliseren en het afvallen van polymerase tijdens reverse transcriptiete minimaliseren 7. Door middel van een tweestaps linkerligatie worden nieuwe DNA-oligo’s (Linker 1 en Linker 2) in overmaat geligeerd om het RNA in het monster volledig aan te vullen. Overtollige linkers kunnen efficiënt worden verwijderd met RecJf, een exonuclease van 5′ tot 3′ dat specifiek is voor enkelstr…

Divulgations

The authors have nothing to disclose.

Acknowledgements

De auteurs van dit werk zijn de auteurs van het oorspronkelijke artikel waarin de AQRNA-seq-technologiewordt beschreven 7 dankbaar. Dit werk werd ondersteund door subsidies van de National Institutes of Health (ES002109, AG063341, ES031576, ES031529, ES026856) en de National Research Foundation of Singapore via de Singapore-MIT Alliance for Research and Technology Antimicrobial Resistance IRG.

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).

Play Video

Citer Cet Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video