Cap Analysis of Gene Expression (CAGE) ist eine Methode zur genomweiten quantitativen Kartierung von mRNA 5’ends zur Erfassung von RNA-Polymerase-II-Transkriptionsstartstellen mit einer einzigen Nukleotid-Auflösung. Diese Arbeit beschreibt ein Low-Input-Protokoll (SLIC-CAGE) zur Erzeugung hochwertiger Bibliotheken mit Nanogramm-Mengen von Gesamt-RNA.
Die Cap-Analyse der Genexpression (CAGE) ist eine Methode zum Nachweis der Single-Nukleotid-Auflösung von RNA-Polymerase-II-Transkriptionsstartstellen (TSS). Die genaue Erkennung von TSS verbessert die Identifizierung und Entdeckung von Kernpromotoren. Darüber hinaus können aktive Enhancer durch Signaturen der bidirektionalen Transkriptionsinitiierung erkannt werden. Hier wird ein Protokoll zur Durchführung von Super-Low Input Carrier-CAGE (SLIC-CAGE) beschrieben. Diese SLIC-Anpassung des CAGE-Protokolls minimiert die RNA-Verluste, indem die RNA-Menge durch den Einsatz eines in vitro transkribierten RNA-Trägermixes, der der betreffenden Probe zugesetzt wird, künstlich erhöht wird, wodurch die Bibliotheksvorbereitung aus Nanogramm-Mengen von RNA (d. h. Tausende von Zellen). Der Träger imitiert die erwartete DNA-Bibliotheksfragmentlängenverteilung und eliminiert so Verzerrungen, die durch die Fülle eines homogenen Trägers verursacht werden könnten. In den letzten Phasen des Protokolls wird der Träger durch Degradation mit homing endonucleases entfernt und die Zielbibliothek verstärkt. Die Ziel-Probenbibliothek ist vor Degradation geschützt, da die Homing-Endonuklease-Erkennungsstellen lang sind (zwischen 18 und 27 bp), was die Wahrscheinlichkeit ihrer Existenz in den eukaryotischen Genomen sehr gering macht. Das Endergebnis ist eine DNA-Bibliothek, die für die Sequenzierung der nächsten Generation bereit ist. Alle Schritte im Protokoll bis zur Sequenzierung können innerhalb von 6 Tagen abgeschlossen werden. Die Transportvorbereitung erfordert einen vollen Arbeitstag; Es kann jedoch in großen Mengen zubereitet und bei -80 °C gefroren gehalten werden. Nach der Sequenzkönnen können die Lesevorgänge verarbeitet werden, um genomweite Single-Nukleotid-Auflösungs-TSSs zu erhalten. TSS können für die Kernpromotor- oder Enhancer-Entdeckung verwendet werden, um Einblicke in die Genregulation zu geben. Nach der Aggregation zu Promotoren können die Daten auch für 5′-zentrierte Ausdrucksprofilierung verwendet werden.
Die Cap-Analyse der Genexpression (CAGE) ist eine Methode zur genomweiten Kartierung von RNA-Polymerase-II-Transkriptionsstartstellen (TSS)1. Seine quantitative Natur ermöglicht auch 5′-Ende zentrische Ausdruck Profiling. Regionen, die die TSS umgeben (ca. 40 bp vor und nachgelagert) sind Kernpromotoren und stellen den physikalischen Ort dar, an dem RNA-Polymerase II und allgemeine Transkriptionsfaktoren binden (zuvor untersucht2,3). Informationen über die genauen Standorte von TSS können für die Kern-Promoter-Entdeckung und für die Überwachung der Projektdynamik verwendet werden. Darüber hinaus können CAGE-Daten, da aktive Enhancer Signaturen der bidirektionalen Transkription aufweisen, auch zur Enhancer-Erkennung und Überwachung der Enhancer-Dynamik 4 verwendet werden. Die CAGE-Methodik hat in letzter Zeit aufgrund ihrer breiten Anwendung und Verwendung in hochkarätigen Forschungsprojekten wie ENCODE5, modENCODE6und FANTOM-Projekten7an Popularität gewonnen. Darüber hinaus erweisen sich TSS-Informationen auch als wichtig für die Unterscheidung von gesundem und krankem Gewebe, da krankheitsspezifische TSS für diagnostische Zwecke verwendet werden können8.
Obwohl mehrere Methoden für TSS-Mapping verfügbar sind (CAGE, RAMPAGE, STRT, nanoCAGE, nanoCAGE-XL, Oligo-Capping), haben wir und andere kürzlich gezeigt, dass CAGE die unvoreingenommenste Methode ist, um echte TSS mit der geringsten Anzahl falschpositiver Ergebnisse zu erfassen9 , 10. Das jüngste CAGE-Protokoll, nAnT-iCAGE11, ist das unvoreingenommeneste Protokoll für TSS-Profiling, da es verhindert, dass die Fragmente mit Restriktionsenzymen auf kurze Tags geschnitten werden und keine PCR-Verstärkung verwendet wird. Eine Einschränkung des nAnT-iCAGE-Protokolls ist die Anforderung an eine große Menge an Ausgangsmaterial (z.B. 5 g Gesamt-RNA für jede Probe). Um spezifische, biologisch relevante Fragen zu beantworten, ist es oft unmöglich, so hohe Mengen an Ausgangsmaterial zu erhalten (z.B. für FACS-sortierte Zellen oder frühe embryonale Stadien). Wenn nAnT-iCAGE erfolgreich ist, stehen von jeder Probe nur 1-2 ng DNA-Bibliotheksmaterial zur Verfügung, wodurch die erreichbare Sequenzierungstiefe begrenzt wird.
Um das TSS-Profiling mit nur Nanogramm der gesamten RNA zu ermöglichen, haben wir vor kurzem Super-low Input Carrier-CAGE10 entwickelt (SLIC-CAGE, Abbildung 1). SLIC-CAGE benötigt nur 10 ng der gesamten RNA, um Bibliotheken mit hoher Komplexität zu erhalten. Unser Protokoll stützt sich auf den sorgfältig entworfenen synthetischen RNA-Träger, der der RNA von Interesse hinzugefügt wird, um insgesamt 5 g RNA-Material zu erreichen. Der synthetische Träger imitiert die Ziel-DNA-Bibliothek in der Längenverteilung, um potenzielle Verzerrungen zu vermeiden, die durch homogene Moleküle im Überschuss verursacht werden könnten. Die Sequenz des Trägers basiert aus zwei Gründen auf der Sequenz des Escherichia coli leucyl-tRNA Synthetase-Gens (Tabelle 1). Erstens wird jedes Übrige des Trägers in der endgültigen Bibliothek, selbst wenn es sequenziert wird, nicht zu einem eukaryotischen Genom zugeordnet. Zweitens, da E. coli eine mesophile Spezies ist, sind seine Haushaltsgene für den für SLIC-CAGE geeigneten Temperaturbereich optimiert. Die Trägersequenz ist auch in homing Endonuklease-Erkennungsstellen eingebettet, um einen spezifischen Abbau der DNA zu ermöglichen, die aus den TRÄGER-RNA-Molekülen abgeleitet wurde. Die Zielbibliothek, die von Beispielen abgeleitet wurde, bleibt intakt, da die Homing-Endonuklease-Erkennungsstellen lang sind (I-CeuI = 27 bp; I-SceI = 18 bp) und statistisch unwahrscheinlich, in eukaryotischen Genomen gefunden zu werden. Nach der spezifischen Degradierung des Trägers und dem Entfernen von Fragmenten durch Größenausschluss ist die Zielbibliothek PCR verstärkt und bereit für die Sequenzierung der nächsten Generation. Je nach Start-RNA-Menge (1-100 ng) werden zwischen 13-18 PCR-Verstärkungszyklen erwartet. Die endgültige DNA-Menge pro Probe liegt zwischen 5-50 ng, was genügend Material für eine sehr tiefe Sequenzierung ergibt. Bei Verwendung von nur 1-2 ng der gesamten RNA können echte TSS s detektiert werden; Es wird jedoch erwartet, dass die Bibliotheken von geringerer Komplexität sein werden. Da SLIC-CAGE auf dem nAnT-iCAGE-Protokoll11basiert, ermöglicht es das Multiplexing von bis zu acht Samples vor der Sequenzierung.
Für erfolgreiche SLIC-CAGE-Bibliothekspräparate ist es wichtig, niedrigverbindliche Spitzen und Tuben zu verwenden, um Probenverluste durch Probenadsorption zu verhindern. In allen Schritten, die das Abrufen des Überstandes beinhalten, wird empfohlen, das gesamte Sample-Volume wiederherzustellen. Da das Protokoll mehrere Schritte hat, führt kontinuierlicher Beispielverlust zu erfolglosen Bibliotheken.
Wenn CAGE (nAnT-iCAGE) nicht routinemäßig durchgeführt wurde, ist es am besten, SLIC-CAGE mit unterschiedlichen Eingangsmengen (10 ng, 20 ng, 50 ng, 100 ng, 200 ng) der gleichen Gesamt-RNA-Probe zu testen und mit nAnT-iCAGE-Bibliotheken zu vergleichen, die mit 5 g Gesamt-RNA erstellt werden. Wenn die nAnT-iCAGE-Bibliothek nicht erfolgreich ist (weniger als 0,5-1 ng der DNA-Bibliothek pro Probe), ist es unwahrscheinlich, dass SLIC-CAGE funktioniert, und der Probenverlust muss minimiert werden.
Ein entscheidender Schritt, um qualitativ hochwertige Bibliotheken ohne ungekapselte, degradierte RNA oder rRNA zu gewährleisten, ist das in Abschnitt 7 beschriebene Cap-Trapping. Es ist sehr wichtig, dass die Streptavidinperlen gründlich in Waschpuffern resuspendiert werden und dass die Waschpuffer vor dem nächsten Waschschritt oder der Elution von cDNA entfernt werden.
Wenn die Ergebnisse der qPCR nach der ersten Runde der Trägerdegradation keinen Unterschied zwischen der Verwendung von adaptor_f1 und carrier_f1 Primern aufweisen, wird die Fortsetzung des Protokolls weiterhin empfohlen. Wenn nach der zweiten Runde des Trägerabbaus der Unterschied in den Ct-Werten weniger als fünf beträgt, wird eine dritte Runde der Trägerdegradation empfohlen. Wir haben nie eine dritte Abbaurunde für notwendig befunden, und wenn sie eintritt, wird empfohlen, die homing endonuklease-Bestände zu ersetzen.
Zusätzliche Runden der PCR-Verstärkung können dem Protokoll hinzugefügt werden, wenn der endgültige Betrag der erhaltenen Bibliothek nicht für die Sequenzierung ausreicht. Die PCR-Verstärkung kann dann mit einer minimalen Anzahl von Amplifikationszyklen eingestellt werden, die benötigt werden, um genügend Material für die Sequenzierung zu liefern, unter Berücksichtigung von Probenverlusten, die bei der Größenauswahl nicht vermieden werden können. Die Reinigung oder Größenauswahl mit SPRI-Magnetperlen sollte dann durchgeführt werden, bis alle kleinen (<200 bp) Fragmente entfernt werden (falls erforderlich, 0,6:1 Perlen zum Stichprobenverhältnis verwenden), und die Bibliothek sollte mit Picogreen quantifiziert werden.
Bibliotheken können im Single-End- oder Paired-End-Modus sequenziert werden. Mithilfe der paired-end-Sequenzierung können Informationen über Transkription-Isoformen abgerufen werden. Darüber hinaus können Informationen aus dem sequenzierten 3′-Ende als eindeutige molekulare Identifikatoren (UMI) verwendet werden, um PCR-Duplikate zu reduzieren ( TCT-N6, N6 ist ein zufälliger Hexamer). Da eine moderate Anzahl von PCR-Verstärkungszyklen verwendet wird (bis zu 18), wurde die Verwendung von UMIs bisher als unnötig befunden.
Da der Kern des Protokolls auf nAnT-iCAGE11basiert, verwendet SLIC-CAGE acht Barcodes. Daher wird das Multiplexing von mehr als acht Samples derzeit nicht unterstützt. Darüber hinaus eignen sich sowohl SLIC-CAGE als auch nAnT-iCAGE nicht für die Erfassung von RNAs kleiner als 200 bp, da die Protokolle entwickelt wurden, um Linker und PCR-Artefakte durch Größenausschluss mit AMPure XP Perlen zu entfernen.
SLIC-CAGE ist die einzige unvoreingenommene Methode zur Auflösung der Single-Nukleotid-Auflösung mit niedrigem Eindräuen zur Kartierung von Transkriptionsinittierungsstartstellen mit Nanogrammen von rna-Gesamtmaterial. Alternative Methoden basieren auf der Vorlagen-Switching-Aktivität der Reverse-Transkriptase zu Barcode-capped RNA anstelle von Cap-Trapping (z.B. NanoCAGE15 und NanoPARE16). Aufgrund des Template-Switchings weisen diese Methoden sequenzspezifische Verzerrungen bei der TSS-Erkennung auf, was zu einer erhöhten Anzahl falsch positiver TSS und einer verringerten Anzahl echter TSSs9,10führt.
The authors have nothing to disclose.
Diese Arbeit wurde durch das Wellcome Trust-Stipendium (106954) unterstützt, das B. L. und Medical Research Council (MRC) Core Funding (MC-A652-5QA10) gewährt wurde. N. C. wurde von EMBO Long-Term Fellowship (EMBO ALTF 1279-2016) unterstützt; E. P. wurde vom Medical Research Council UK unterstützt; B. L. wurde vom Medical Research Council UK unterstützt (MC UP 1102/1).
2-propanol, Bioultra, for molecular biology, ≥99.5% | Sigma-Aldrich | 59304-100ML-F | Used in RNAclean XP purification. |
3' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 3'linkers is described in the supplementary of this protocol. | ||
5' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 5'linkers is described in the supplementary of this protocol. | ||
Agencourt AMPure XP, 60 mL | Beckman Coulter | A63881 | Purification of DNA |
Agencourt RNAClean XP Kit | Beckman Coulter | A63987 | Purification of RNA and RNA:cDNA hybrids in CAGE steps. |
Axygen 0.2 mL Polypropylene PCR Tube Strips and Domed Cap Strips | Axygen (available through Corning) | PCR-0208-CP-C | Or any 8-tube PCR strips (used only for water and mixes). |
Axygen 1 x 8 strip domed PCR caps | Axygen (available through Corning) | PCR-02CP-C | Caps for PCR plates. |
Axygen 1.5 mL Maxymum Recovery Snaplock Microcentrifuge Tube | Axygen (available through Corning) | MCT-150-L-C | Low-binding 1.5 ml tubes, used for enzyme mixes or sample concentration. |
Axygen 96 well no skirt PCR microplate | Axygen (available through Corning) | PCR-96-C | Low-binding PCR plates – have to be used for all steps in the protocol. Note that plates should be cut to contain 2 x 8 wells for easier visibility of the samples |
Bioanalyzer (or Tapestation): RNA nano and HS DNA kits | Agilent | To determine quality of RNA, efficient size selection and final quality of the library (Tapestation can also be used) | |
Biotin (Long Arm) Hydrazide | Vector laboratories | SP-1100 | Biotinylation/tagging |
Cutsmart buffer | NEB | Restriction enzyme buffer | |
Deep Vent (exo-) DNA Polymerase | NEB | M0259S | Second strand synthesis |
DNA Ligation Kit, Mighty Mix | Takara | 6023 | Used for 5' and 3'-linker ligation |
dNTP mix (10 mM each) | ThermoFisher Scientific | 18427013 | dNTP mix for production of carrier templates (or any dNTPs suitable for PCR) |
Dynabeads M-270 Streptavidin | Invitrogen | 65305 | Cap-trapping. Do not use other beads as these are optimised with the buffers used. |
DynaMag-2 Magnet | ThermoFisher Scientific | 12321D | Magnetic stand for 1.5 ml tubes – used to prepare Streptavidin beads. |
DynaMag-96 Side Skirted Magnet | ThermoFisher Scientific | 12027 | Magnetic stand for PCR plates (96 well-plates) – used with cut plates to contain 2 x 8 wells. |
Ethanol, BioUltra, for molecular biology, ≥99.8% | Sigma-Aldrich | 51976-500ML-F | Used in AMPure washes. Any molecular biology suitable ethanol can be used. |
Exonuclease I (E. coli) | NEB | M0293S | Leftover primer degradation |
Gel Loading Dye, Purple (6x), no SDS | NEB | B7025S | agarose gel loading dye |
HiScribe T7 High Yield RNA Synthesis Kit | New England Biolabs | E2040S | Kit for carrier in vitro transcription |
Horizontal electrophoresis apparatus | purification of carrier DNA templates from agarose gels | ||
I-Ceu | NEB | R0699S | Homing endonuclease used for carrier degradation. |
I-SceI | NEB | R0694S | Homing endonuclease used for carrier degradation. |
KAPA HiFi HS ReadyMix (2x) | Kapa Biosystems (Supplied by Roche) | KK2601 | PCR mix for target library amplification |
KAPA SYBR FAST qPCR kit (Universal) 2x | Kapa Biosystems (Supplied by Roche) | KK4600 | qPCR mix to assess degradation efficiency and requiered number of PCR amplification cycles |
Micropipettes and multichannel micropipettes (0.1-10 µl, 1-20 µl, 20-200 µ) | Gilson | Use of Gilson with the low-binding Sorenson tips is recommended. Other micropippetes might not be compatible.. Different brand low-binding tips may not be of equal quality and may increase sample loss. | |
Microplate reader | For Picogreen concentration measurement of the final library. Microplates are used to allow small volume measurement and reduce sample waste. | ||
nuclease free water | ThermoFisher Scientific | AM9937 | Or any nuclease (DNase and RNase) free water |
PCR thermal cycler | incubation steps and PCR amplficication | ||
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific | F530S | DNA polymerase for amplification of carrier templates (or any high fidelity polymerase) |
QIAquick Gel Extraction Kit (50) | Qiagen | 28704 | Purification of carrier PCR templates from agarose gels. |
qPCR machine | determining PCR amplification cyle number and degree of carrier degradation | ||
Quant-iT PicoGreen dsDNA Reagent | ThermoFisher Scientific | P11495 | Used to measure final library concentration – recommended as, in our hands, it is more accurate and reproducible than Qubit. |
Quick-Load Purple 100 bp DNA Ladder | NEB | N0551S | DNA ladder |
Quick-Load Purple 1 kb Plus DNA Ladder | NEB | N0550S | DNA ladder |
Ribonuclease H | Takara | 2150A | Digestion of RNA after cap-trapping. |
RNase ONE Ribonuclease | Promega | M4261 | Degradation of single stranded RNA not protected by cDNA. |
RNase-Free DNase Set | Qiagen | 79254 | Removal of carrier DNA templates after in vitro transcription. |
RNeasy Mini Kit | Qiagen | 74104 | For cleanup of carrier RNA from in vitro transcription or capping |
Sodium acetate, 1 M, aq.soln, pH 4.5 RNAse free | VWR | AAJ63669-AK | Or any nuclease (DNase and RNase) free solution |
Sodium acetate, 1 M, aq.soln, pH 6.0 RNAse free | Or any nuclease (DNase and RNase) free solution | ||
Sodium periodate | Sigma-Aldrich | 311448-100G | Oxidation of vicinal diols |
Sorenson low binding aerosol barrier tips, MicroReach Guard, volume range 10 μL, Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719390-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 1000 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719463-1000EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 20 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719412-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 200 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719447-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
SpeedVac Vacuum Concentrator | concentrating samples in various steps to lower volume | ||
SuperScript III Reverse Transcriptase | ThermoFisher Scientific | 18080044 | Used for reverse transcription (1st CAGE step) |
Trehalose/sorbitol solution | Preparation is described in Murata et al 2014. | ||
Tris-HCl, 1M aq.soln, pH 8.5 | 1 M solution, DNase and RNase free | ||
tRNA (20 mg/mL) | tRNA solution. Preparation is described in Murata et al 2014. | ||
UltraPure Low Melting Point Agarose | ThermoFisher Scientific | 16520050 | Or any suitable pure low-melt agarose. |
USB Shrimp Alkaline Phosphatase (SAP) | Applied Biosystems (Provided by ThermoFisher Scientific) | 78390500UN | |
USER Enzyme | NEB | M5505S | Degradation of 3'linker's upper strand, Uracil Specific Excision Reagent/Enzyme |
Vaccinia Capping System | NEB | M2080S | Enzymatic kit for in vitro capping of carrier molecules |
Wash buffer A | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer B | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer C | Cap trapping washes. Preparation is described in Murata et al 2014. |