Dit protocol beschrijft een methode voor de toewijzing pre-mRNA 3′ eind verwerking van sites.
Studies in de afgelopen tien jaar is gebleken een complex en dynamisch scala aan pre-mRNA decollete en polyadenylatie reacties. mRNAs met lang 3′ onvertaald regio’s (UTRs) worden gegenereerd in gedifferentieerde cellen overwegende dat delende cellen bij voorkeur express chat-kopieën met korte 3′ UTRs. We beschrijven het A-seq-protocol, nu bij de tweede versie, die werd ontwikkeld om de kaart van de polyadenylatie sites genoom-brede en bestuderen van de verordening van pre-mRNA 3′ eind verwerking. Ook maakt dit huidige protocol gebruik van de polyadenylate (poly(A)) staart die tijdens de biogenese van meest zoogdieren mRNAs te verrijken voor volledig verwerkte mRNAs worden toegevoegd. Een DNA-adapter met deoxyuracil op de vierde positie kan de precieze verwerking van mRNA 3′ eind fragmenten voor het rangschikken. Exclusief de celcultuur en de nachtelijke ligations, het protocol vereist ongeveer 8 h hands-on tijd. Samen met het vindt u een easy-to-use softwarepakket voor de analyse van de afgeleide sequencing-gegevens. A-seq2 en de bijbehorende analysesoftware zorgen voor een efficiënte en betrouwbare oplossing voor de toewijzing van pre-mRNA 3′ eindigt in een brede waaier van voorwaarden, van 106 of minder cellen.
De vangst en de sequencing van mRNA 3′ einden maakt de studie van mRNA verwerking en de kwantificering van de genexpressie. Als gevolg van hun poly(A) staarten, kan eukaryote mRNAs gezuiverd worden efficiënt uit de cel Totaal lysates met kraal-geïmmobiliseerd oligo-deoxythymidine (oligo(dT)) moleculen, die kan ook prime cDNA synthese. Deze benadering heeft echter twee nadelen. Eerst, kunnen stukken van de A’s die intern de uitgeschreven zijn ook prime cDNA synthese, resulterend in valse poly(A) sites. De rek van de tweede, homogene poly(A) vormen specifieke uitdagingen voor de sequencing, afgezien van niet informatief voor transcript identificatie. Verschillende benaderingen hebben voorgesteld te omzeilen deze beperkingen, zoals omgekeerde transcriptie via poly(A) staarten gevolgd door RNase H spijsvertering (3 P-seq 1), gebruik van een primer van de aangepaste volgorde die eindigt op 20 Ts (2 P-seq 2), preselectie van De fragmenten van RNA met de staart van de poly(A) van meer dan 50 nucleotiden met een CU5T45 primer gevolgd door RNase H spijsvertering (3′ leest 3), en het gebruik van een primer oligo-dT, waarin de 3′-adapter in een haarspeld (A-seq 4).
De onlangs ontwikkelde methode A-seq2- 5 wil omzeilen sequencing via poly(A) en op hetzelfde moment te minimaliseren van het aantal Dimeren die worden gegenereerd door de zelf-Afbinding van adapters, met name die zich voordoen wanneer de molaire concentratie van adapters opweegt tegen de concentratie invoegen. Dit probleem kan worden geëlimineerd wanneer beide adapters als ligatuur zijn verbonden aan het zelfde type van polynucleotide eindigt zoals A-seq2, waar de 3′-adapters als ligatuur zijn verbonden aan het einde 5′ van de fragmenten van RNA en de adapters 5′ aan 5′ einden van de cDNAs na omgekeerde transcriptie. De methode meer is handiger dan onze eerder voorgestelde A-seq – in die volgorde in de 5′-tot-3 was ‘ richting waardoor juist gecontroleerd RNA fragmentatie-, terwijl het handhaven van een hoge nauwkeurigheid van de identificatie poly(A). Ongeveer 80% van de gesequenceerd luidt in typische monsters kaart uniek aan het genoom en leiden tot identificatie van meer dan 20.000 poly(A) site clusters, meer dan 70% van die overlapping met geannoteerde 3’ UTRs.
Kortom, begint het A-seq2-protocol met mRNA fragmentatie en Afbinding van omgekeerde-aanvulling 3′ adapters aan de 5′ einden van de fragmenten van RNA. Poly (A)-met RNAs worden vervolgens reverse transcriptie met een 25 nucleotide (nt) lange oligo(dT) primer waarin een nucleotide anker aan de 3′-eind, een dU op positie 4 en een Biotine eind 5′, waardoor binding van cDNA aan magnetische daar kralen. Allermeest naar de primer, met inbegrip van de biotine, wordt verwijderd uit de cDNA door decollete in dU door de gebruiker enzym mix, met Uracil DNA glycosylase (UDG) en het DNA glycosylase-lyase Endonuclease VIII. Deze reactie laat intact uiteinden voor de afbinding van een 5′-adapter, en drie Ts links na splitsing blijven ter gelegenheid van de locatie van de poly(A) staart. Omdat zowel 5′ en 3′ adapters zijn aangesloten door afbinding aan geadresseerden 5′ einden, worden geen adapter-Dimeren gegenereerd. Vier nucleotide willekeurige-mers geïntroduceerd aan het begin van leest cluster resolutie staat op volgorde van de state-of-the-art instrumenten en kan ook dienen als moleculaire eenduidig (UMI) voor het detecteren en verwijderen van PCR versterking artefacten. De grootte van het UMI kan verder worden verhoogd, zoals in andere studies 6gedaan. Het protocol genereert leest dat complementair is aan mRNA 3′ einden, allemaal beginnen met een gerandomiseerde tetrameer gevolgd door 3 Ts. verwerking van luidt dat de 3 diagnostische Ts hebben op hun einde begint 5′ met de correctie van PCR versterking artefacten door zijn afgewikkeld exploitatie van de UMIs, verwijdering van 3′ adapter sequenties, en reverse complementatie. Leest dat hebben afkomstig van oligo(dT) priming op interne A-rijke sites is kunnen zijn ook rekenkundig geïdentificeerd en verwijderd. De valse sites ontbreken doorgaans een van de 18 goed gekarakteriseerd en geconserveerde poly(A) signalen die moeten gelegen ~ 21 nucleotiden stroomopwaarts van de schijnbare decollete site 7.
Het protocol vereist ongeveer 8 h hands-on tijd, niet tellen celkweek en de nachtelijke ligations. De bijbehorende Lees analyse software een zeer nauwkeurige poly(A) site identificatie mogelijk maakt. Vanaf de site van poly(A) clusters gemaakt op basis van 4 monsters verder benadrukt in dit manuscript (twee biologische replicatieonderzoeken van controle siRNA en si-HNRNPC-testgroep cellen) 84% overlapping met een geannoteerde gen, en daarvan 75% overlappen met een 3-‘ UTR, en 86% met ofwel een 3′ UTR of een terminal exon. De Pearson-correlatiecoëfficiënt van expressie van 3’ einden in de analysemonsters is 0.92 en waarden van meer dan 0,9 worden meestal verkregen met de methode. A-seq2 is dus een handige methode die zeer reproduceerbare resultaten geeft.
De veelheid van kern- en ondersteunende factoren die bij pre-mRNA 3′ eind verwerking betrokken zijn wordt weerspiegeld in een dienovereenkomstig complexe polyadenylatie landschap. Polyadenylatie is bovendien ook inspelen op veranderingen in andere processen zoals transcriptie, egaliseren en lamineren. 3′ eind decollete sites in pre-mRNAs worden normaal gesproken aangeduid op basis van de karakteristieke poly(A) staarten die worden toegevoegd aan de 5′-splitsingsproducten. De meeste methoden gebruiken oligo(dT) inleidingen van variabele lengte waarmee de specifieke omzetting van poly (A)-met mRNAs te cDNAs in een omgekeerde transcriptie reactie. Een gemeenschappelijk probleem van deze aanpak is interne priming aan A-rijke sequenties resulterend in artefactuele decollete sites. Twee methoden die gericht zijn op het omzeilen van dit artefact in de fase van de bereiding van de monsters zijn voorgesteld. In de 3P-seq methode 1, adapters ligatuur zijn specifiek verbonden aan de uiteinden van poly(A) staarten met hulp van een splint oligo gevolgd door gedeeltelijke RNase T1 spijsvertering en omgekeerde transcriptie met TTP in de reactie als de enige deoxynucleotide. De resulterende poly(A)-poly(dT) heteroduplexes zijn dan verteerd met RNase H en zijn de overgebleven fragmenten van RNA sequenced, geïsoleerd en afgebonden aan adapters. Een eenvoudiger en elegante methode, 2P-seq, die gebruikmaakt van een aangepaste volgorde primer overslaan het resterende traject van het oligo(dT) in de sequencing-reactie werd gemeld door de dezelfde auteurs 2. In een verwante methode, 3′ leest 3, een ongewoon lange primer van 5 ons en 45 Ts, ook met een Biotine is gegloeid te gefragmenteerde RNA, gevolgd door strenge wast om te selecteren voor de molecules van RNA met de staart van de poly(A) van meer dan 50 nucleotiden. Hoewel 3′ leest drastisch de frequentie van interne priming vermindert, doet het niet volledig elimineren het 3. Protocollen voor directe RNA sequencing hebben ook voorgesteld, maar de resulterende leest zijn kort en hebben een hoge foutenpercentage en deze aanpak is niet verder ontwikkelde 18,19,20. De PolyA-Seq en de gecommercialiseerd Quant Seq protocollen combineren oligo(dT) gebaseerd priming met een willekeurige priming stap voor de cDNA tweede onderdeel synthese 20. Het gebruik van de sjabloon switch omgekeerde transcriptie reactie met de reverse-transcriptase Moloney lymfkliertest Leukemie Virus (MMLV) leidt tot de generatie van cDNAs met de linkers in één stap en daardoor geen adapter-Dimeren kunnen worden weergegeven in de PAS-Seq en SAPAS methoden 21 , 22.
De A-seq2-methode gepresenteerd hier opvalt in het gebruik van een cleavable nucleotide (dU) binnen een biotinyleerd oligo(dT) primer. Deze wijziging combineert het nut van het verrijken van oligo(dT) gekruist, polyadenylated doelstellingen met de verwijdering van de meeste van de oligo (dT)25 sequentie van de geïsoleerde fragmenten voordat bibliotheken zijn bereid en het behoud van drie t’s, die wijzen op de voorafgaande aanwezigheid van de staart van de poly(A). Daarentegen laat methoden die gebruikmaken van RNase H Schakel poly(A) uit de RNA-moleculen willekeurig als verschillende. Aangezien A-seq2, sequencing van 3′ eind van de anti-zin-strengen gebeurt, wordt decollete sites voorspeld dat na het motief van de NNNNTTT aan het begin van ruwe volgorde leest bevinden. De gerandomiseerde tetramers dienen niet alleen om basis bellen maar ook in de eliminatie van PCR versterking artefacten. Langere UMIs kunnen ook worden ondergebracht. De mogelijkheid van interne priming blijft in A-seq2 en rekenkundig is gericht, eerst door teruggooi 3′ eindigt met een genomically-gecodeerde, A-rijke downstream volgorde, en vervolgens door het teruggooien van 3′ eind clusters die kon worden verklaard door interne priming op de A-rijke poly(A) signaal zelf. Een recente analyse van poly(A) sites uniek afgeleid door een groot aantal protocollen geeft aan dat de sites die uniek voor A-seq2 zijn de verwachte nucleotide distributie en locatie in de genen, vergelijkbaar met andere 3′ eind rangschikken protocollen.
Een cruciale stap in de A-seq2 is de selectie van polyadenylated RNA en de verwijdering van ribosomaal RNAs en diverse kleine RNAs. Dit gebeurt meest gemakkelijk door een mRNA-isolatie kit met oligo (dT)25 magnetische kralen. In principe geeft totaal RNA geïsoleerd met fenol met oplossingen ook hoge kwaliteit RNA dat kan verder worden onderworpen aan selectie door de mRNA-isolatie kit of agarose oligo (dT). Een stap die kan worden gevarieerd in A-seq2 is de behandeling met alkalische hydrolyse, die kan worden ingekort of uitgebreid tot het verkrijgen van RNA fragmenten van verschillende grootte. Kritische is ook dat de toevoeging van 3′ dATP aan 3′ einden van RNA fragmenten door de polymerase van poly(A) efficiënt is. In het protocol beschreven hier, wordt deze behandeling toegepast op alle fragmenten van RNA, om te voorkomen dat concatemerization tijdens de afbinding reactie. Tot slot, wij stellen vast dat hoewel RNA ligase 1 gewoonlijk als een RNA-ligase gebruikt wordt, ligates het ook efficiënt één gestrande DNA, zoals wij hier hebben gedaan om een adapter aan het einde 5′ van de moleculen van cDNA afbinden.
A-seq2 is dus een efficiënte en eenvoudig te implementeren protocol voor de identificatie van pre-mRNA 3′ eind verwerking van sites. Toekomstige ontwikkelingen eventueel verdere vermindering van de complexiteit van het protocol en de hoeveelheid benodigde materiaal. De bijbehorende set voor computationele gegevensanalyse verder de homogene verwerking van 3′ eind sequencing leest verkregen met een breed scala aan protocollen inschakelen.
The authors have nothing to disclose.
De auteurs bedanken mevrouw Béatrice Dimitriades voor hulp bij de cultuur van de cel. Dit werk werd gesteund door de Zwitserse National Science Foundation subsidies #31003A_170216 en 51NF40_141735 (NCCR RNA & ziekte).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |