Dieses Protokoll beschreibt eine Methode für die Zuordnung Pre-mRNA 3′ End-Verarbeitung Websites.
Studien in den letzten zehn Jahren haben eine komplexe und dynamische Vielzahl von Pre-mRNA Spaltung und Polyadenylation Reaktionen gezeigt. mRNAs mit langen 3′ unübersetzt Regionen (wo) sind in den differenzierten Zellen generiert, während proliferierende Zellen Protokolle mit kurzen 3′ wo bevorzugt zum Ausdruck bringen. Wir beschreiben das A-Seq-Protokoll, jetzt in seiner zweiten Version, entwickelte Polyadenylation Websites genomweite abzubilden und die Regulierung der Pre-mRNA 3′ End-Verarbeitung zu studieren. Auch nutzt das aktuelle Protokoll die Polyadenylate (poly(A)) Schwänzen, die während der Biogenese der meisten Säugetiere mRNAs für fully-processed mRNAs bereichern hinzugefügt werden. Ein DNA-Adapter mit Deoxyuracil an der vierten Position ermöglicht die präzise Bearbeitung von mRNA 3′ Ende Fragmente für die Sequenzierung. Nicht einschließlich der Zellkultur und die Übernachtung grundsätzlich das Protokoll erfordert ca. 8 h Arbeitsaufwand beträgt. Zusammen mit ihm ist eine einfach zu bedienende Software-Paket für die Analyse der Sequenzierungsdaten abgeleiteten zur Verfügung gestellt. A-seq2 und der damit verbundenen Analyse-Software bieten eine effiziente und zuverlässige Lösung für die Zuordnung der Pre-mRNA 3′ endet in einer Vielzahl von Bedingungen von 106 oder weniger Zellen.
Die Erfassung und die Abfolge der mRNA 3′ Enden ermöglicht die Untersuchung von mRNA-Verarbeitung und die Quantifizierung der Genexpression. Durch ihren Schwänzen poly(A) können eukaryontischen mRNAs effizient gereinigt werden vom gesamten Zelle Lysates mit Wulst immobilisiert Oligo-Deoxythymidine (oligo(dT))-Moleküle, die auch cDNA Synthese prime kann. Dieser Ansatz hat jedoch zwei Nachteile. Erstens können Strecken von A, die intern für Abschriften sind auch cDNA-Synthese, wodurch falsche poly(A) Websites prime. Zweite, homogene poly(A) Strecken stellen besondere Herausforderungen für die Sequenzierung, abgesehen davon, dass nicht informativ für Abschrift Identifikation. Verschiedene Ansätze wurden vorgeschlagen, diese Einschränkungen, z. B. reverse Transkription durch poly(A) umgehen Schwänzen gefolgt von RNase H Verdauung (3P-Seq 1), verwenden Sie eine benutzerdefinierte Sequenzierung Grundierung endet in 20 Ts (2P-Seq 2), Vorauswahl der RNA-Fragmente mit poly(A) Schwänzen von mehr als 50 Nukleotiden Primer eine CU5T45 gefolgt von RNase H Verdauung (3′ liest 3) und die Verwendung von Oligo-dT Grundierung, die den 3′-Adapter in einer Haarnadelkurve (A-Seq 4) enthält.
Die neu entwickelte A-seq2 Methode 5 umgehen Sequenzierung durch poly(A) und gleichzeitig den Anteil der Dimere zu minimieren, die durch selbständige Ligatur der Adapter, besonders auftreten erzeugt werden soll wenn die molare Konzentration der Adapter überwiegt die einfügen-Konzentration. Dieses Problem kann beseitigt werden, wenn beide Adapter auf die gleiche Art von Polynukleotid enden wie in A-seq2 ligiert sind wo die 3′-Adapter, 5′-Ende der RNA-Fragmente und die Adapter 5′, 5′ Ende der cDNAs nach reversen Transkription ligiert werden. Die Methode ist bequemer als unsere zuvor vorgeschlagene A-Seq – in der Sequenzierung in den 5′-bis-3 wurde ‘ Richtung damit erfordern präzise gesteuert RNA Fragmentierung-, unter Beibehaltung einer hohen Genauigkeit der Poly-Website-Identifikation. Rund 80 % der sequenzierten lautet in typische Proben des Genoms eindeutig zuordnen und zur Identifizierung von mehr als 20.000 poly(A) Website Clustern, mehr als 70 % der welche Überschneidungen mit kommentierten 3’ wo führen.
In Kürze beginnt die A-seq2 Protokoll mit mRNA Fragmentierung und Ligatur der Reverse-Ergänzung 3′ Adapter an den 5′-Enden der RNA-Fragmente. Poly (A)-enthaltenden RNAs sind dann umgekehrte transkribiert mit 25 Nukleotide (nt) lang oligo(dT) Grundierung, die einen Anker Nukleotid am 3′-Ende, ein dU an Position 4 und Biotin am 5′-Ende, enthält so dass Bindung der cDNA, magnetische Streptavidin Perlen. Die meisten des Primers, einschließlich Biotin, ist aus der cDNA durch Spaltung an dU durch den Benutzer-Enzym-Mix enthält Uracil DNA Glycosylase (UDG) und der DNA-Glycosylase-Lyase Endonuklease VIII entfernt. Diese Reaktion lässt intakt endet für die Unterbindung der 5′-Adapter und drei Ts links nach Spaltung bleiben um markieren den Standort der Poly-Schwanz. Da 5′ und 3′-Adapter durch Unterbindung an Empfänger 5′ Enden verbunden sind, sind keine Adapter-Dimere generiert. Vier Nukleotid zufällige-Mers eingeführt Anfang liest ermöglicht Cluster Auflösung auf State-of-the-Art-Sequenzierung Instrumenten und kann auch als einzigartige molekulare Bezeichner (UMI) für die Erkennung und Entfernung von PCR-Amplifikation Artefakten dienen. Die Größe der UMI kann weiter erhöht werden, wie in anderen Studien 6getan. Das Protokoll liest, die Komplementäre mRNA 3′ enden, alles beginnt mit einer randomisierten Tetramer, gefolgt von 3 Ts. Verarbeitung der Lesevorgänge, die 3 diagnostische Ts an ihre 5′ Ende beginnt mit der Korrektur der PCR-Amplifikation Artefakte durch umkehren werden generiert UMIs, Entfernung von 3′ Adapter Sequenzen, Ausnutzung und reverse-Ergänzung. Lesevorgänge, die aus oligo(dT) Grundierung an interne A-reiche Standorten entstanden sein können sind auch rechnerisch ermittelt und verworfen. Die unechten Websites in der Regel fehlt eines der 18 gut charakterisierten und konservierten poly(A) Signale die sollte befindet sich ~ 21 Nukleotide stromaufwärts der scheinbare Spaltung Seite 7.
Das Protokoll erfordert ca. 8 h Handhabungszeit Zellkultur und die Übernachtung grundsätzlich nicht zu zählen. Die damit verbundene lesen Analyse-Software ermöglicht eine hochpräzise poly(A) Website Identifikation. Von der Poly-Website erstellt Cluster basierend auf 4 Proben weiter hervorgehoben, in diesem Manuskript (zwei biologische Wiederholungen der Kontrolle SiRNA und Si-HNRNPC-behandelten Zellen) 84 % Überlappung mit einem kommentierten gen und davon, 75 % Überlappung mit einem 3′ UTR und 86 % entweder mit einem 3′ UTR oder ein terminal Exon. Der Pearson-Korrelationskoeffizient des Ausdrucks von 3′ enden in den Replicate Proben ist 0.92 und Werte von über 0,9 sind in der Regel mit der Methode erhalten. A-seq2 ist somit eine bequeme Methode, die sehr reproduzierbare Ergebnisse liefert.
Die Vielzahl von Kern und zusätzliche Faktoren, die in der Pre-mRNA 3′ Ende Verarbeitung beteiligt sind spiegelt sich in einer entsprechend komplex Polyadenylation Landschaft. Darüber hinaus reagiert Polyadenylation auch zu Veränderungen in anderen Prozessen wie Transkription und Spleißen. 3′ Ende Spaltstellen in Pre-mRNAs sind in der Regel identifiziert anhand der charakteristischen poly(A) Schwänzen, die 5′-Spaltprodukte hinzugefügt werden. Die meisten Methoden verwenden oligo(dT) Primer von variabler Länge, mit denen die spezifischen Umwandlung von Poly (A)-mit mRNAs zu cDNAs in einer reversen Transkription Reaktion. Ein häufiges Problem dieses Ansatzes ist interne Grundierung auf A-reiche Sequenzen Serums Spaltstellen führt. Zwei Methoden, die darauf abzielen, dieses Artefakt in der Phase der Vorbereitung der Probe zu umgehen sind vorgeschlagen worden. In den 3P-Seq Methode 1sind Adapter speziell an den Enden von poly(A) Tails mit Hilfe einer Schiene Oligo gefolgt von teilweise RNase T1 Verdauung und reversen Transkription mit TTP in der Reaktion als die einzige Deoxynucleotide ligiert. Die daraus resultierende poly(A)-poly(dT) Heteroduplexes werden dann mit RNase H verdaut und die restlichen RNA-Fragmente isoliert, Adapter ligiert und sequenziert. Ein einfacher und eleganter Methode, 2P-Seq, die verwendet eine benutzerdefinierte Sequenzierung Grundierung überspringen die restliche Strecke der oligo(dT) in der Sequenzierung Reaktion durch die gleichen Autoren 2berichtet wurde. In einer entsprechenden Methode 3′ liest 3, eine ungewöhnlich lange Grundierung 5 uns und 45 Ts, auch mit Biotin ist geglüht, fragmentierte RNA, gefolgt von strengen Waschungen für RNA-Moleküle mit poly(A) Schwänzen von mehr als 50 Nukleotiden auswählen. Obwohl 3′ liest drastisch die Häufigkeit von internen Priming reduziert, beseitigt es nicht völlig es 3. Protokolle für die direkte RNA Sequenzierung auch vorgeschlagen worden, aber die resultierende liest sind kurz und haben eine hohe Fehlerquote und dieser Ansatz wurde nicht weiter entwickelten 18,19,20. Der PolyA-Seq und kommerzialisierten Quant Seq-Protokolle kombinieren oligo(dT) basierte Grundierung mit einem zufälligen Priming Schritt für die cDNA zweiten Strang Synthese 20. Die Verwendung der Vorlage Schalter reversen Transkription Reaktion mit Moloney Murine Leukämie Virus (MMLV) Reverse Transkriptase führt zu der Generation von cDNAs mit linker in einem einzigen Schritt und damit können keine Adapter-Dimere in der PAS-Seq und SAPAS Methoden erscheinen 21 , 22.
Die A-seq2 Methode hier vorgestellten zeichnet sich in der Nutzung eines spaltbaren Nukleotids (dU) innerhalb einer biotinylierte oligo(dT) Grundierung. Diese Modifikation verbindet das Dienstprogramm oligo(dT) hybridisiert, Polyadenylated Ziele mit der Entfernung von die meisten der Oligo (dT)25 Sequenz aus der isolierte Fragmente bevor Bibliotheken bereit sind und die Erhaltung der drei Ts zu bereichern, zeigen Sie vorherige poly(A) Schwanz. Im Gegensatz dazu lassen Sie Methoden, die RNase H um poly(A) nach dem Zufallsprinzip aus der RNA-Moleküle zu entfernen verwenden mehrere wie. Da im A-seq2, Sequenzierung von 3′ Ende der Anti-Sense-Stränge erfolgt, sind Spaltstellen vorhergesagt befindet sich nach dem NNNNTTT Motiv zu Beginn des rohen Sequenz liest. Die randomisierte Tetramers dienen nicht nur Basis, sondern auch bei der Beseitigung von PCR-Amplifikation Artefakte aufrufen lassen. Längere UMIs können auch untergebracht werden. Die Möglichkeit der internen Grundierung bleibt in A-seq2 und richtet sich rechnerisch, zuerst durch verwerfen 3′ endet mit einer genomisch kodiert, A-reiche nachgelagerten Sequenz und dann verwerfen 3′ Ende Cluster, die durch interne Priming bei erklärt werden könnte die A-reiche poly(A) Signal selbst. Eine aktuelle Analyse von poly(A) Websites abgeleitet eindeutig durch eine Vielzahl von Protokollen zeigt, dass die Websites, die für A-seq2 einzigartig sind die erwarteten Nukleotid Verteilung und Plazierung Gene, ähnlich wie bei anderen 3′ Sequenzierung Protokolle zu beenden.
Ein entscheidender Schritt in A-seq2 ist die Auswahl von Polyadenylated RNA und Entfernung der ribosomalen RNAs und verschiedenen kleinen RNAs. Dies geschieht am einfachsten durch eine mRNA-Isolierung-Kit mit Oligo (dT)25 magnetischen Kügelchen. Im Prinzip gibt total RNA isoliert mit Phenol auch Lösungen mit hochwertigen RNA, die weitere Auswahl durch die mRNA-Isolierung Kit oder Oligo (dT) Agarose unterzogen werden kann. Ein Schritt, der in A-seq2 variiert werden kann, ist die Behandlung mit alkalischen Hydrolyse, verkürzt oder verlängert um RNA-Fragmente unterschiedlicher Größe zu erhalten. Kritisch ist auch, dass Zusatz von 3′ dATP bis 3′ Ende der RNA-Fragmente von poly(A) Polymerase effizient ist. In dem hier beschriebenen Protokoll wird diese Behandlung alle RNA-Fragmente, um Concatemerization während der Ligatur Reaktion zu vermeiden. Endlich, wir beachten Sie, dass obwohl RNA Ligase 1 normalerweise als eine RNA-Ligase verwendet wird, es auch effizient single stranded DNA ligates, wie wir hier getan haben, um einen Adapter, um die 5′-Ende der DNA Moleküle verbinden.
So ist A-seq2 eine effiziente und einfach zu Protokoll für die Identifizierung der Pre-mRNA 3′ End-Verarbeitung Websites zu implementieren. Zukünftige Entwicklungen zählen weitere Reduzierung der Komplexität des Protokolls und die Menge des benötigten Materials. Der damit verbundenen Satz von computergestützte Datenanalyse-Tools weiter ermöglichen die homogene Verarbeitung von 3′ Ende Sequenzierung liest mit einer Vielzahl von Protokollen erhalten.
The authors have nothing to disclose.
Die Autoren danken Frau Béatrice Dimitriades für Hilfe bei der Zellkultur. Diese Arbeit wurde unterstützt vom Schweizerischen Nationalfonds zur Förderung Zuschüsse #31003A_170216 und 51NF40_141735 (NFS RNA & Krankheit).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |