Il sequenziamento dell’RNA a quantificazione assoluta (AQRNA-seq) è una tecnologia sviluppata per quantificare il panorama di tutti i piccoli RNA nelle miscele biologiche. Qui, vengono dimostrate sia le fasi di preparazione della libreria che quelle di elaborazione dei dati di AQRNA-seq, quantificando i cambiamenti nel pool di RNA di trasferimento (tRNA) in Mycobacterium bovis BCG durante la dormienza indotta dalla fame.
AQRNA-seq fornisce una relazione lineare diretta tra i conteggi delle letture di sequenziamento e i piccoli numeri di copie di RNA in un campione biologico, consentendo così una quantificazione accurata del pool di piccoli RNA. La procedura di preparazione della libreria AQRNA-seq qui descritta prevede l’uso di linker di sequenziamento progettati su misura e un passaggio per ridurre le modifiche dell’RNA di metilazione che bloccano la processività della trascrizione inversa, con conseguente aumento della resa di cDNA a lunghezza intera. Inoltre, viene presentata un’implementazione dettagliata della pipeline bioinformatica di accompagnamento. Questa dimostrazione di AQRNA-seq è stata condotta attraverso un’analisi quantitativa dei 45 tRNA in Mycobacterium bovis BCG raccolti in 5 giorni selezionati in un corso di 20 giorni di privazione di nutrienti e 6 giorni di rianimazione. In questa sede verranno discussi anche gli sforzi in corso per migliorare l’efficienza e il rigore di AQRNA-seq. Ciò include l’esplorazione di metodi per ovviare alla purificazione del gel per mitigare i problemi del dimero del primer dopo l’amplificazione della PCR e per aumentare la percentuale di letture a lunghezza intera per consentire una mappatura delle letture più accurata. I futuri miglioramenti di AQRNA-seq si concentreranno sulla facilitazione dell’automazione e dell’implementazione ad alto rendimento di questa tecnologia per quantificare tutte le piccole specie di RNA in campioni di cellule e tessuti provenienti da diversi organismi.
Il sequenziamento di nuova generazione (NGS), noto anche come sequenziamento massivamente parallelo, è una tecnologia di sequenziamento del DNA che prevede la frammentazione del DNA, la legatura degli oligonucleotidi adattatori, l’amplificazione basata sulla reazione a catena della polimerasi (PCR), il sequenziamento del DNA e il riassemblaggio delle sequenze di frammenti in un genoma. L’adattamento dell’NGS all’RNA di sequenza (RNA-seq) è un approccio potente per identificare e quantificare i trascritti di RNA e le loro varianti1. Gli sviluppi innovativi nei flussi di lavoro per la preparazione delle librerie di RNA e nelle pipeline di analisi bioinformatica, insieme ai progressi nella strumentazione di laboratorio, hanno ampliato il repertorio delle applicazioni RNA-seq, progredendo oltre il sequenziamento dell’esoma verso omiche funzionali avanzate come la profilazione dell’RNA non codificante2, l’analisi di singole cellule3, la trascrittomica spaziale 4,5, l’analisi di splicing alternativo6, tra gli altri. Questi metodi avanzati di RNA-seq rivelano funzioni complesse dell’RNA attraverso l’analisi quantitativa del trascrittoma in cellule e tessuti normali e malati.
Nonostante questi progressi nell’RNA-seq, diverse caratteristiche tecniche chiave limitano la potenza quantitativa del metodo. Sebbene la maggior parte dei metodi RNA-seq consenta una quantificazione precisa e accurata dei cambiamenti nei livelli di RNA tra variabili sperimentali (ad esempio, campioni biologici e/o stati fisiologici), non possono fornire confronti quantitativi dei livelli di molecole di RNA all’interno di un campione. Ad esempio, la maggior parte dei metodi RNA-seq non è in grado di quantificare con precisione il numero relativo di copie di singole molecole isoaccettori di tRNA in un pool cellulare di tRNA espressi. Come evidenziato nella pubblicazione complementare7, questa limitazione all’RNA-seq deriva da diverse caratteristiche della struttura dell’RNA e dalla biochimica della preparazione della libreria. Ad esempio, l’attività degli enzimi di ligazione utilizzati per legare i linker di sequenziamento delle estremità 3′ e 5′ alle molecole di RNA è fortemente influenzata dall’identità dei nucleotidi terminali dell’RNA e dei linker di sequenziamento. Ciò porta a grandi variazioni nell’efficienza delle legature dei linker e a profondi aumenti artefatti nelle letture del sequenziamento 8,9,10.
Una seconda serie di limitazioni deriva dalle proprietà strutturali intrinseche delle molecole di RNA. In particolare, la formazione della struttura secondaria dell’RNA e i cambiamenti dinamici nelle dozzine di modifiche post-trascrizionali dell’RNA dell’epitrascrittoma possono causare la caduta o la mutazione della polimerasi durante la trascrizione inversa. Questi errori provocano una sintesi incompleta o troncata del cDNA o un’alterazione della sequenza dell’RNA. Sebbene entrambi questi fenomeni possano essere sfruttati per mappare strutture secondarie o alcune modifiche, degradano l’accuratezza quantitativa dell’RNA-seq se le successive fasi di preparazione della libreria non riescono a catturare cDNA troncati o se l’elaborazione dei dati elimina sequenze mutate che non corrispondono a un set di dati di riferimento11,12. Inoltre, l’immensa diversità chimica, di lunghezza e strutturale dei trascritti di RNA, così come la mancanza di strumenti per frammentare uniformemente gli RNA lunghi, diminuisce l’applicabilità della maggior parte dei metodi RNA-seq a tutte le specie di RNA13.
Il metodo AQRNA-seq (absolute quantification RNA sequencing) è stato sviluppato per rimuovere molti di questi vincoli tecnici e biologici che limitano l’accuratezza quantitativa7. Riducendo al minimo le distorsioni sequenza-dipendenti nella cattura, nella legatura e nell’amplificazione durante la preparazione della libreria di sequenziamento dell’RNA, AQRNA-seq raggiunge una linearità superiore rispetto ad altri metodi, quantificando con precisione il 75% di una libreria di riferimento di 963 miRNA con un’accuratezza di 2 volte. Questa correlazione lineare tra sequenziamento, conteggio delle letture e abbondanza di RNA è osservata anche in un’analisi di un pool di standard di oligonucleotidi di RNA a lunghezza variabile e in riferimento a metodi ortogonali come il northern blotting. Stabilire la linearità tra il conteggio delle letture di sequenziamento e l’abbondanza di RNA consente ad AQRNA-seq di ottenere una quantificazione accurata e assoluta di tutte le specie di RNA all’interno di un campione.
Di seguito è riportata una descrizione del protocollo per il flusso di lavoro di preparazione della libreria AQRNA-seq e della pipeline di analisi dei dati a valle associata. Il metodo è stato applicato per chiarire le dinamiche dell’abbondanza di tRNA durante la dormienza indotta dalla fame e la successiva rianimazione nel modello di tubercolosi Mycobacterium bovis bacilli de Calmette et Guérin (BCG). I risultati sono stati presentati per la visualizzazione esplorativa dei dati di sequenziamento, insieme alle successive analisi di clustering e di espressione differenziale che hanno svelato modelli distinguibili nell’abbondanza di tRNA associati a vari fenotipi.
Il flusso di lavoro di preparazione della libreria AQRNA-seq è progettato per massimizzare la cattura di RNA all’interno di un campione e ridurre al minimo la caduta della polimerasi durante la trascrizione inversa7. Attraverso una legatura del linker in due fasi, i nuovi oligo di DNA (Linker 1 e Linker 2) vengono legati in eccesso per completare completamente l’RNA all’interno del campione. I linker in eccesso possono essere rimossi in modo efficiente con RecJf, un’esonucleasi da 5′ a 3′ specifi…
The authors have nothing to disclose.
Gli autori del presente lavoro sono grati agli autori dell’articolo originale che descrive la tecnologia AQRNA-seq7. Questo lavoro è stato sostenuto da sovvenzioni del National Institutes of Health (ES002109, AG063341, ES031576, ES031529, ES026856) e della National Research Foundation di Singapore attraverso la Singapore-MIT Alliance for Research and Technology Antimicrobial Resistance IRG.
2-ketoglutarate | Sigma-Aldrich | 75890 | Prepare a working solution (1 M) and store it at -20ºC |
2100 Bioanalyzer Instrument | Agilent | G2938C | |
5'-deadenylase (50 U/μL) | New England Biolabs | M0331S (component #: M0331SVIAL) | Store at -20 °C |
Adenosine 5'-Triphosphate (ATP) | New England Biolabs | M0437M (component #: N0437AVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
AGAROSE GPG/LE | AmericanBio | AB00972-00500 | Store at ambient temperature |
Ammonium iron(II) sulfate hexahydrate | Sigma-Aldrich | F2262 | Prepare a working solution (0.25 M) and store it at -20 °C |
Bioanalyzer Small RNA Analysis | Agilent | 5067-1548 | The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation) |
Bovine Serum Albumin (BSA; 10 mg/mL) | New England Biolabs | B9000 | This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200). |
Chloroform | Macron Fine Chemicals | 4441-10 | |
Demethylase | ArrayStar | AS-FS-004 | Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004) |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447L (component #: N0447LVIAL) | This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each) |
Digital Dual Heat Block | VWR Scientific Products | 13259-052 | Heating block is used with the QIAquick Gel Extraction Kit |
DyeEx 2.0 Spin Kit | Qiagen | 63204 | Effective at removing short remnants (e.g., oligos less than 10 bp in length) |
Electrophoresis Power Supply | Bio-Rad Labrotories | PowerPac 300 | |
Eppendorf PCR Tubes (0.5 mL) | Eppendorf | 0030124537 | |
Eppendorf Safe-Lock Tubes (0.5 mL) | Eppendorf | 022363611 | |
Eppendorf Safe-Lock Tubes (1.5 mL) | Eppendorf | 022363204 | |
Eppendorf Safe-Lock Tubes (2 mL) | Eppendorf | 022363352 | |
Ethyl alcohol (Ethanol), Pure | Sigma-Aldrich | E7023 | The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research |
Gel Imaging System | Alpha Innotech | FluorChem 8900 | |
Gel Loading Dye, Purple (6X), no SDS | New England Biolabs | N0556S (component #: B7025SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
GENESYS 180 UV-Vis Spectrophotometer | Thermo Fisher Scientific | 840-309000 | The spectrophotometer is used for measuring the oligo concentrations using the Beer's law |
HEPES | Sigma-Aldrich | H4034 | Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C |
Hydrochloric acid (HCl) | VWR Scientific Products | BDH3028 | Prepare a working solution (5 M) and store it at ambient temperature |
Isopropyl Alcohol (Isopropanol), Pure | Macron Fine Chemicals | 3032-16 | Isopropanol is used with the QIAquick Gel Extraction Kit |
L-Ascorbic acid | Sigma-Aldrich | A5960 | Prepare a working solution (0.5 M) and store it at -20ºC |
Microcentrifuge | Eppendorf | 5415D | |
NanoDrop 2000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
NEBuffer 2 (10X) | New England Biolabs | M0264L (component #: B7002SVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
Nuclease-Free Water (not DEPC-Treated) | Thermo Fisher Scientific | AM9938 | |
Oligo Clean & Concentrator Kit | Zymo Research | D4061 | Store at ambient temperature |
PEG 8000 (50% solution) | New England Biolabs | M0437M (component #: B1004SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
Peltier Thermal Cycler | MJ Research | PTC-200 | |
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2 | Thermo Fisher Scientific | J62336 | |
PrimeScript Buffer (5X) | TaKaRa | 2680A | |
PrimeScript Reverse Transcriptase | TaKaRa | 2680A | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | This kit requires a heating block and isopropanol to work with |
Quick-Load Purple 100 bp DNA Ladder | New England Biolabs | N0551S (component #: N0551SVIAL) | |
Quick-Load Purple 50 bp DNA Ladder | New England Biolabs | N0556S (component #: N0556SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
RecJf (30 U/μL) | New England Biolabs | M0264L (component #: M0264LVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
RNase Inhibitor (murine; 40 U/μL) | New England Biolabs | M0314L (component #: M0314LVIAL) | Store at -20 °C |
SeqAMP DNA Polymerase | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
SeqAMP PCR Buffer (2X) | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
Shrimp Alkaline Phosphatase (1 U/μL) | New England Biolabs | M0371L (component #: M0371LVIAL) | |
Sodium hydroxide (NaOH) | Sigma-Aldrich | S5881 | Prepare a working solution (5 M) and store it at ambient temperature |
T4 DNA Ligase (400 U/μL) | New England Biolabs | M0202L (component #: M0202LVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 DNA Ligase Reaction Buffer (10X) | New England Biolabs | M0202L (component #: B0202SVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 RNA Ligase 1 (30 U/μL) | New England Biolabs | M0437M (component #: M0437MVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |
T4 RNA Ligase Reaction Buffer (10X) | New England Biolabs | M0437M (component #: B0216SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |