Cap Analysis of Gene Expression (CAGE) è un metodo per la mappatura quantitativa a livello di genoma di mRNA 5’end per catturare i siti di inizio della trascrizione della polimerasi II dell’RNA a una risoluzione mononucleotide. Questo lavoro descrive un protocollo a basso input (SLIC-CAGE) per la generazione di librerie di alta qualità utilizzando quantità di nanogrammi di RNA totale.
L’analisi del cap dell’espressione genica (CAGE) è un metodo utilizzato per il rilevamento della risoluzione mononucleotide dei siti di avvio della trascrizione della polimerasi II (TSS) di RNA. Il rilevamento accurato dei TSS migliora l’identificazione e la scoperta dei promotori di base. Inoltre, gli esaltatori attivi possono essere rilevati attraverso le firme dell’avvio della trascrizione bidirezionale. Di seguito è descritto un protocollo per l’esecuzione di un vettore di input super-basso-CAGE (SLIC-CAGE). Questo adattamento SLIC del protocollo CAGE riduce al minimo le perdite di RNA aumentando artificialmente la quantità di RNA attraverso l’uso di un mix di portatori di RNA trascritto in vitro che viene aggiunto al campione di interesse, consentendo così la preparazione della libreria da nanogrammi-quantità di totale RNA (cioè migliaia di cellule). Il vettore imita la distribuzione della lunghezza del frammento della libreria del DNA prevista, eliminando così i pregiudizi che potrebbero essere causati dall’abbondanza di un vettore omogeneo. Nelle ultime fasi del protocollo, il vettore viene rimosso attraverso la degradazione con endonucleases homing e la libreria di destinazione viene amplificata. La libreria di campioni di destinazione è protetta dalla degradazione, poiché i siti di riconoscimento dell’endonuclealo sono lunghi (tra i 18 e i 27 bp), rendendo molto bassa la probabilità di loro esistenza nei genomi eucarioti. Il risultato finale è una libreria di DNA pronta per il sequenziamento di nuova generazione. Tutti i passaggi del protocollo, fino al sequenziamento, possono essere completati entro 6 giorni. La preparazione del trasportatore richiede una giornata lavorativa completa; tuttavia, può essere preparato in grandi quantità e tenuto congelato a -80 gradi centigradi. Una volta sequenziate, le letture possono essere elaborate per ottenere TSS a risoluzione mononucleotide a livello di genoma può essere utilizzato per la scoperta del promotore o del potenziatore del nucleo, fornendo informazioni sulla regolazione genica. Una volta aggregati ai promotori, i dati possono essere utilizzati anche per la profilatura delle espressioni incentrate su 5′.Once aggregated to promoters, the data can also be used for 5′–centric expression profiling.
L’analisi del cap dell’espressione genica (CAGE) è un metodo utilizzato per la mappatura a livello di genoma a risoluzione mononucleotide dei siti di inizio della trascrizione della polimerasi II (TSS)1. La sua natura quantitativa consente anche una profilazione dell’espressione cintesa da 5′-end. Le regioni che circondano i TSS (circa 40 bp a monte e a valle) sono promotori fondamentali e rappresentano la posizione fisica in cui l’RNA polimerasi II e i fattori di trascrizione generali si legano (rivisti in precedenza2,3). Le informazioni sulle posizioni esatte dei TSS possono essere utilizzate per la scoperta del promotore del core e per il monitoraggio delle dinamiche promotori. Inoltre, poiché gli stimolatori attivi esibiscono firme di trascrizione bidirezionale, i dati CAGE possono essere utilizzati anche per la scoperta e il monitoraggio dell’esaltatore delle dinamiche potenziatori4. La metodologia CAGE è recentemente aumentata in popolarità grazie alla sua ampia applicazione e utilizzo in progetti di ricerca di alto profilo come ENCODE5, modENCODE6e FANTOM progetti7. Inoltre, le informazioni tSS si stanno rivelando importanti per distinguere i tessuti sani e malati, in quanto gli TSS specifici della malattia possono essere utilizzati per scopi diagnostici8.
Anche se sono disponibili diversi metodi per la mappatura TSS (CAGE, RAMPAGE, STRT, nanoCAGE, nanoCAGE-XL, oligo-capping), noi e altri abbiamo recentemente dimostrato che CAGE è il metodo più imparziale per catturare i Veri TSS con il minor numero di falsi positivi9 , 10.Il recente protocollo CAGE, nAnT-iCAGE11, è il protocollo più imparziale per la profilazione TSS, in quanto evita di tagliare i frammenti a tag brevi utilizzando enzimi di restrizione e non utilizza l’amplificazione PCR. Una limitazione del protocollo nAnT-iCAGE è la necessità di una grande quantità di materiale di partenza (ad es., 5 g di RNA totale per ogni campione). Per rispondere a domande specifiche e biologicamente rilevanti, è spesso impossibile ottenere tali elevate quantità di materiale di partenza (ad esempio, per le cellule in ordine FACS o per le fasi embrionali precoci). Infine, se nAnT-iCAGE ha successo, solo 1-2 ng di materiale della libreria del DNA è disponibile da ogni campione, limitando così la profondità di sequenziamento raggiungibile.
Per consentire la profilazione TSS utilizzando solo nanogrammi di RNA totale, abbiamo recentemente sviluppato Super-low Input Carrier-CAGE10 (SLIC-CAGE, Figura 1). SLIC-CAGE richiede solo 10 ng di RNA totale per ottenere librerie ad alta complessità. Il nostro protocollo si basa sul vettore di RNA sintetico attentamente progettato aggiunto all’RNA di interesse per ottenere un totale di 5 g di materiale di RNA. Il vettore sintetico imita la libreria del DNA bersaglio nella distribuzione della lunghezza per evitare potenziali pregiudizi che potrebbero essere causati da molecole omogenee in eccesso. La sequenza del portatore si basa sulla sequenza del gene sintetasi Escherichia coli leucyl-tRNA per due motivi. In primo luogo, qualsiasi resista del vettore nella biblioteca finale, anche se sequenziato, non verrà mappato a un genoma eucariotico. In secondo luogo, poiché E. coli è una specie mesofilica, i suoi geni delle pulizie sono ottimizzati per la gamma di temperatura appropriata per SLIC-CAGE. La sequenza portante è anche integrata con siti di riconoscimento endonucleasi homing per consentire una degrado specifica del DNA derivato dalle molecole di RNA portante. La libreria di destinazione, derivata dal campione, rimane intatta, poiché i siti di riconoscimento endonuclease sono lunghi (I-CeuI – 27 bp; I-SceI 18 pb) e statisticamente improbabile nei genomi eucarioti. Dopo la degradazione specifica del vettore e la rimozione dei frammenti per esclusione di dimensioni, la libreria di destinazione è PCR amplificata e pronta per la sequenza di prossima generazione. A seconda della quantità iniziale di RNA (1-100 ng), si prevede che siano necessari tra 13-18 cicli di amplificazione PCR. La quantità finale di DNA per ogni campione varia tra 5-50 ng, producendo materiale sufficiente per il sequenziamento molto profondo. Quando si utilizza solo 1-2 ng di RNA totale, vero TSS può essere rilevato; tuttavia, si prevede che le librerie siano di minore complessità. Infine, poiché SLIC-CAGE si basa sul protocollo nAnT-iCAGE11, consente il multiplexing fino a otto campioni prima del sequenziamento.
Per una corretta preparazione della libreria SLIC-CAGE, è fondamentale utilizzare suggerimenti e tubi a bassa legatura per evitare la perdita del campione a causa dell’adsorbimento del campione. In tutte le fasi che comportail recupero del super-natante, si raccomanda di recuperare l’intero volume del campione. Poiché il protocollo prevede più passaggi, la perdita continua del campione porterà a librerie non riuscite.
Se CAGE (nAnT-iCAGE) non è stato eseguito regolarmente, è meglio testare SLIC-CAGE con quantità di ingresso diverse (10 ng, 20 ng, 50 ng, 100 ng, 200 ng) dello stesso campione totale di RNA e confrontarlo con le librerie nAnT-iCAGE preparate utilizzando 5 g di RNA totale. Se la libreria nAnT-iCAGE non riesce (meno di 0,5-1 ng della libreria di DNA ottenuta per campione), è improbabile che SLIC-CAGE funzioni e che la perdita del campione sia ridotta al minimo.
Un passo fondamentale per garantire che le librerie di alta qualità prive di RNA o rRNA degradato non consorcoperto sia l’intrappolamento del tappo descritto nella sezione 7. È molto importante che le perline di streptavidina siano completamente risospese nei tamponi di lavaggio e che i tamponi di lavaggio vengano rimossi prima di continuare alla fase di lavaggio successiva o alla elusione del cDNA.
Se i risultati del qPCR dopo il primo ciclo di degradazione del vettore non mostrano alcuna differenza tra l’uso di primer adaptor_f1 e carrier_f1, è comunque consigliabile continuare il protocollo. Se dopo il secondo ciclo di degradazione del vettore, la differenza nei valori Ct è inferiore a cinque, si consiglia un terzo ciclo di degradazione del vettore. Non abbiamo mai trovato necessario un terzo ciclo di degradazione e, se si verifica, si raccomanda di sostituire gli stock di endonucleasi homing.
Ulteriori cicli di amplificazione PCR possono essere aggiunti al protocollo se la quantità finale della libreria ottenuta non è sufficiente per la sequenza. L’amplificazione PCR può quindi essere impostata con un numero minimo di cicli di amplificazione necessari per produrre materiale sufficiente per il sequenziamento, tenendo conto della perdita del campione che non può essere evitata nella selezione delle dimensioni. La purificazione o la selezione delle dimensioni mediante perline magnetiche SPRI devono quindi essere eseguite fino a quando tutti i piccoli frammenti (<200 bp) non vengono rimossi (se necessario, utilizzano 0.6:1 perline per il rapporto campione) e la libreria deve essere quantificata utilizzando Picogreen.
Le librerie possono essere sequenziate in modalità a estremità singola o accoppiata. Utilizzando il sequenziamento a fine accoppiato, è possibile ottenere informazioni sugli isoformi di trascrizione. Inoltre, poiché la trascrizione inversa viene eseguita utilizzando un primer casuale (TCT-N6, N6 essendo un esagono casuale), le informazioni dalla sequenza 3′-end possono essere utilizzate come identificatori molecolari univoci (UMI) per comprimere i duplicati PCR. Poiché viene utilizzato un numero moderato di cicli di amplificazione PCR (fino a 18), l’uso di UMI è stato precedentemente ritenuto non necessario.
Poiché il nucleo del protocollo si basa su nAnT-iCAGE11, SLIC-CAGE utilizza otto codici a barre. Pertanto, il multiplexing più di otto campioni non è attualmente supportato. Inoltre, sia SLIC-CAGE che nAnT-iCAGE non sono adatti per l’acquisizione di RNA più brevi di 200 bp, in quanto i protocolli sono progettati per rimuovere linker e artefatti PCR tramite l’esclusione delle dimensioni con perline AMPure XP.
SLIC-CAGE è l’unico metodo imparziale di risoluzione a basso nucleotide a basso input per la mappatura dei siti di avvio della trascrizione utilizzando nanogrammi di materiale RNA totale. I metodi alternativi si basano sull’attività di commutazione del modello della trascrizione inversa all’RNA con tappo a barre anziché all’abbondanza di tappo (ad esempio, NanoCAGE15 e NanoPARE16). A causa della commutazione del modello, questi metodi presentano distorsioni specifiche della sequenza nel rilevamento dei Contenuti, portando ad un aumento del numero di TSS falsi positivi e alla diminuzione del numero di TSSreali 9,10.
The authors have nothing to disclose.
Questo lavoro è stato sostenuto dalla sovvenzione Wellcome Trust (106954) assegnata a B. L. e Medical Research Council (MRC) Core Funding (MC-A652-5QA10). N. C. è stato supportato dalla EMBO Long-Term Fellowship (EMBO ALTF 1279-2016); E. P. è stato sostenuto dal Medical Research Council UK; B. L. è stato sostenuto dal Medical Research Council UK (MC UP 1102/1).
2-propanol, Bioultra, for molecular biology, ≥99.5% | Sigma-Aldrich | 59304-100ML-F | Used in RNAclean XP purification. |
3' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 3'linkers is described in the supplementary of this protocol. | ||
5' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 5'linkers is described in the supplementary of this protocol. | ||
Agencourt AMPure XP, 60 mL | Beckman Coulter | A63881 | Purification of DNA |
Agencourt RNAClean XP Kit | Beckman Coulter | A63987 | Purification of RNA and RNA:cDNA hybrids in CAGE steps. |
Axygen 0.2 mL Polypropylene PCR Tube Strips and Domed Cap Strips | Axygen (available through Corning) | PCR-0208-CP-C | Or any 8-tube PCR strips (used only for water and mixes). |
Axygen 1 x 8 strip domed PCR caps | Axygen (available through Corning) | PCR-02CP-C | Caps for PCR plates. |
Axygen 1.5 mL Maxymum Recovery Snaplock Microcentrifuge Tube | Axygen (available through Corning) | MCT-150-L-C | Low-binding 1.5 ml tubes, used for enzyme mixes or sample concentration. |
Axygen 96 well no skirt PCR microplate | Axygen (available through Corning) | PCR-96-C | Low-binding PCR plates – have to be used for all steps in the protocol. Note that plates should be cut to contain 2 x 8 wells for easier visibility of the samples |
Bioanalyzer (or Tapestation): RNA nano and HS DNA kits | Agilent | To determine quality of RNA, efficient size selection and final quality of the library (Tapestation can also be used) | |
Biotin (Long Arm) Hydrazide | Vector laboratories | SP-1100 | Biotinylation/tagging |
Cutsmart buffer | NEB | Restriction enzyme buffer | |
Deep Vent (exo-) DNA Polymerase | NEB | M0259S | Second strand synthesis |
DNA Ligation Kit, Mighty Mix | Takara | 6023 | Used for 5' and 3'-linker ligation |
dNTP mix (10 mM each) | ThermoFisher Scientific | 18427013 | dNTP mix for production of carrier templates (or any dNTPs suitable for PCR) |
Dynabeads M-270 Streptavidin | Invitrogen | 65305 | Cap-trapping. Do not use other beads as these are optimised with the buffers used. |
DynaMag-2 Magnet | ThermoFisher Scientific | 12321D | Magnetic stand for 1.5 ml tubes – used to prepare Streptavidin beads. |
DynaMag-96 Side Skirted Magnet | ThermoFisher Scientific | 12027 | Magnetic stand for PCR plates (96 well-plates) – used with cut plates to contain 2 x 8 wells. |
Ethanol, BioUltra, for molecular biology, ≥99.8% | Sigma-Aldrich | 51976-500ML-F | Used in AMPure washes. Any molecular biology suitable ethanol can be used. |
Exonuclease I (E. coli) | NEB | M0293S | Leftover primer degradation |
Gel Loading Dye, Purple (6x), no SDS | NEB | B7025S | agarose gel loading dye |
HiScribe T7 High Yield RNA Synthesis Kit | New England Biolabs | E2040S | Kit for carrier in vitro transcription |
Horizontal electrophoresis apparatus | purification of carrier DNA templates from agarose gels | ||
I-Ceu | NEB | R0699S | Homing endonuclease used for carrier degradation. |
I-SceI | NEB | R0694S | Homing endonuclease used for carrier degradation. |
KAPA HiFi HS ReadyMix (2x) | Kapa Biosystems (Supplied by Roche) | KK2601 | PCR mix for target library amplification |
KAPA SYBR FAST qPCR kit (Universal) 2x | Kapa Biosystems (Supplied by Roche) | KK4600 | qPCR mix to assess degradation efficiency and requiered number of PCR amplification cycles |
Micropipettes and multichannel micropipettes (0.1-10 µl, 1-20 µl, 20-200 µ) | Gilson | Use of Gilson with the low-binding Sorenson tips is recommended. Other micropippetes might not be compatible.. Different brand low-binding tips may not be of equal quality and may increase sample loss. | |
Microplate reader | For Picogreen concentration measurement of the final library. Microplates are used to allow small volume measurement and reduce sample waste. | ||
nuclease free water | ThermoFisher Scientific | AM9937 | Or any nuclease (DNase and RNase) free water |
PCR thermal cycler | incubation steps and PCR amplficication | ||
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific | F530S | DNA polymerase for amplification of carrier templates (or any high fidelity polymerase) |
QIAquick Gel Extraction Kit (50) | Qiagen | 28704 | Purification of carrier PCR templates from agarose gels. |
qPCR machine | determining PCR amplification cyle number and degree of carrier degradation | ||
Quant-iT PicoGreen dsDNA Reagent | ThermoFisher Scientific | P11495 | Used to measure final library concentration – recommended as, in our hands, it is more accurate and reproducible than Qubit. |
Quick-Load Purple 100 bp DNA Ladder | NEB | N0551S | DNA ladder |
Quick-Load Purple 1 kb Plus DNA Ladder | NEB | N0550S | DNA ladder |
Ribonuclease H | Takara | 2150A | Digestion of RNA after cap-trapping. |
RNase ONE Ribonuclease | Promega | M4261 | Degradation of single stranded RNA not protected by cDNA. |
RNase-Free DNase Set | Qiagen | 79254 | Removal of carrier DNA templates after in vitro transcription. |
RNeasy Mini Kit | Qiagen | 74104 | For cleanup of carrier RNA from in vitro transcription or capping |
Sodium acetate, 1 M, aq.soln, pH 4.5 RNAse free | VWR | AAJ63669-AK | Or any nuclease (DNase and RNase) free solution |
Sodium acetate, 1 M, aq.soln, pH 6.0 RNAse free | Or any nuclease (DNase and RNase) free solution | ||
Sodium periodate | Sigma-Aldrich | 311448-100G | Oxidation of vicinal diols |
Sorenson low binding aerosol barrier tips, MicroReach Guard, volume range 10 μL, Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719390-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 1000 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719463-1000EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 20 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719412-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 200 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719447-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
SpeedVac Vacuum Concentrator | concentrating samples in various steps to lower volume | ||
SuperScript III Reverse Transcriptase | ThermoFisher Scientific | 18080044 | Used for reverse transcription (1st CAGE step) |
Trehalose/sorbitol solution | Preparation is described in Murata et al 2014. | ||
Tris-HCl, 1M aq.soln, pH 8.5 | 1 M solution, DNase and RNase free | ||
tRNA (20 mg/mL) | tRNA solution. Preparation is described in Murata et al 2014. | ||
UltraPure Low Melting Point Agarose | ThermoFisher Scientific | 16520050 | Or any suitable pure low-melt agarose. |
USB Shrimp Alkaline Phosphatase (SAP) | Applied Biosystems (Provided by ThermoFisher Scientific) | 78390500UN | |
USER Enzyme | NEB | M5505S | Degradation of 3'linker's upper strand, Uracil Specific Excision Reagent/Enzyme |
Vaccinia Capping System | NEB | M2080S | Enzymatic kit for in vitro capping of carrier molecules |
Wash buffer A | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer B | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer C | Cap trapping washes. Preparation is described in Murata et al 2014. |