Protokollen gir instruksjon for modifisering av RNA med dimetylsulfat for mutasjonsprofileringseksperimenter. Det inkluderer in vitro og in vivo sondering med to alternative biblioteksforberedelsesmetoder.
Rollen til RNA-struktur i nesten hvilken som helst biologisk prosess har blitt stadig tydeligere, spesielt i det siste tiåret. Imidlertid har klassiske tilnærminger til å løse RNA-struktur, som RNA-krystallografi eller kryo-EM, ikke klart å holde tritt med det raskt utviklende feltet og behovet for løsninger med høy gjennomstrømning. Mutasjonsprofilering med sekvensering ved bruk av dimetylsulfat (DMS) MaPseq er en sekvenseringsbasert tilnærming for å utlede RNA-strukturen fra en bases reaktivitet med DMS. DMS metylerer N1-nitrogenet i adenosiner og N3 i cytosiner ved Watson-Crick-ansiktet når basen er uparret. Revers-transkribering av det modifiserte RNA med termostabil gruppe II intron revers transkriptase (TGIRT-III) fører til at de metylerte basene blir innlemmet som mutasjoner i cDNA. Ved sekvensering av det resulterende cDNA og kartlegging av det tilbake til et referansetranskripsjon, er de relative mutasjonsratene for hver base indikativ for basens “status” som parret eller ikke-paret. Selv om DMS-reaktiviteter har et høyt signal-til-støy-forhold både in vitro og i celler, er denne metoden følsom for skjevheter i håndteringsprosedyrene. For å redusere denne skjevheten, gir dette papiret en protokoll for RNA-behandling med DMS i celler og med in vitro transkribert RNA.
Siden oppdagelsen av at RNA har både strukturelle1,2 og katalytiske3 egenskaper, har betydningen av RNA og dets regulatoriske funksjon i en mengde biologiske prosesser blitt gradvis avdekket. Faktisk har effekten av RNA-struktur på genregulering fått økende oppmerksomhet4. Som proteiner har RNA primære, sekundære og tertiære strukturer, med henvisning til sekvensen av nukleotider, 2D-kartleggingen av base-pairing-interaksjoner og 3D-foldingen av disse baseparrede strukturer, henholdsvis. Mens bestemmelse av tertiær struktur er nøkkelen til å forstå de eksakte mekanismene bak RNA-avhengige prosesser, er den sekundære strukturen også svært informativ om RNA-funksjon og er grunnlaget for videre 3D-folding5.
Imidlertid har det vært iboende utfordrende å bestemme RNA-strukturen med konvensjonelle tilnærminger. Mens for proteiner har krystallografi, kjernemagnetisk resonans (NMR) og kryogen elektronmikroskopi (kryo-EM) gjort det mulig å bestemme mangfoldet av strukturelle motiver, noe som muliggjør strukturprediksjon fra sekvensen alene6, er disse tilnærmingene ikke allment anvendelige for RNA. Faktisk er RNA fleksible molekyler med byggesteiner (nukleotider) som har mye mer konformasjons- og rotasjonsfrihet i forhold til deres aminosyre-kolleger. Videre er interaksjonene gjennom base-sammenkobling mer dynamiske og allsidige enn de av aminosyrerester. Som et resultat har klassiske tilnærminger bare vært vellykkede for relativt små RNA med veldefinerte, svært kompakte strukturer7.
En annen tilnærming for å bestemme RNA-strukturen er gjennom kjemisk sondering kombinert med neste generasjons sekvensering (NGS). Denne strategien genererer informasjon om bindingsstatusen til hver base i en RNA-sekvens (dvs. dens sekundære struktur). Kort sagt, basene i et RNA-molekyl som ikke engasjerer seg i baseparing, er differensielt modifisert av små kjemiske forbindelser. Revers-transkribering av disse RNA-ene med spesialiserte reverstranskriptaser (RTs) inkorporerer modifikasjonene i komplementær deoksyribonukleinsyre (cDNA) som mutasjoner. Disse cDNA-molekylene blir deretter forsterket av polymerasekjedereaksjonen (PCR) og sekvensert. For å få informasjon om deres “status” som bundet eller ubundet, beregnes mutasjonsfrekvensene ved hver base i et RNA av interesse og legges inn i strukturprediksjonsprogramvare som begrensninger8. Basert på nærmeste nabo regler9 og minimum gratis energiberegninger 10, genererer denne programvaren strukturmodeller som passer best til de oppnådde eksperimentelle dataene11,12.
DMS-MaPseq bruker DMS, som metylerer N1-nitrogenet i adenosiner og N3-nitrogen i cytosiner ved Watson-Crick-ansiktet på en svært spesifikk måte13. Bruk av termostabil gruppe II intron revers transkriptase (TGIRT-III) i revers transkripsjon skaper mutasjonsprofiler med enestående signal-til-støy-forhold, og tillater til og med dekonvolusjon av overlappende profiler generert av to eller flere alternative konformasjoner14,15. Videre kan DMS trenge inn i cellemembraner og hele vev, noe som gjør sondering innenfor fysiologiske sammenhenger mulig. Generering av data av god kvalitet er imidlertid utfordrende, da variasjoner i håndteringsprosedyren kan påvirke resultatene. Derfor gir vi en detaljert protokoll for både in vitro og in-cell DMS-MaPseq for å redusere skjevhet og veilede nykommere til metoden gjennom vanskelighetene de kan støte på. Spesielt i lys av den nylige SARS-CoV2-pandemien er data av høy kvalitet om RNA-virus et viktig verktøy for å studere genuttrykk og finne mulige terapier.
Protokollen her beskriver hvordan man kan undersøke RNA in vitro og i celler ved hjelp av DMS-mutasjonsprofileringseksperimenter. Videre gir den instruksjoner om hvordan du forbereder biblioteker for Illumina-sekvensering for å generere genspesifikke data og analysere de oppnådde .fastq-filene. I tillegg kan genom-wide bibliotek tilnærminger brukes. Genspesifikk RT-PCR produserer imidlertid den høyeste kvaliteten og mest robuste data. Derfor, hvis man sammenligner mellom prøver, er det viktig å sikre at de er forberedt med identiske sekvenseringsstrategier, da bibliotekgenereringen forårsaker en viss skjevhet. Reproduserbarheten skal alltid måles ved hjelp av replikasjoner.
Flere forholdsregler
RNA er et ustabilt molekyl som er følsomt for nedbrytning både gjennom forhøyede temperaturer og ved RNaser. Derfor anbefales spesielle tiltak – bruk av personlig verneutstyr (PPE), RNAse-fritt materiale og RNAse-hemmere. Det viktigste er at RNA holdes på is når det er mulig. Dette gjelder spesielt metylert RNA, som er enda mer følsomt for høye temperaturer.
Det er viktig å bekrefte at RNA-strukturen av interesse ikke er følsom for DMS-konsentrasjons- og bufferforholdene. Buffere som 100 mM Tris, 100 mM MOPS og 100 mM HEPES ved pH 7-7,5 gir et høyt signal, men er kanskje ikke tilstrekkelig til å opprettholde pH under reaksjonen21. Siden DMS hydrolyserer i vann, noe som reduserer pH, er en sterk buffer avgjørende for å opprettholde en nøytral pH under modifikasjonsreaksjonen. Tilsetningen av bicin har vist seg å bidra til å opprettholde pH som litt grunnleggende21 , men resulterer i lav DMS-modifikasjon på Gs og Us, som kan være informativ, men bør analyseres separat på grunn av produksjon av et mye lavere signal enn As og Cs og er ikke diskutert videre i denne protokollen.
I genspesifikk RT-PCR blir det modifiserte RNA reversert transkribert til DNA og forsterket i fragmenter ved PCR. Mens størrelsen på RNA teoretisk kan være ubegrenset, bør disse PCR-fragmentene ikke overstige en lengde på 400-500 basepar (bp) for å forhindre skjevhet under revers transkripsjonsreaksjon. Ideelt sett bør fragmentene være innenfor rammen av sekvenseringskjøringen (dvs. hvis sekvensering utføres ved hjelp av et 150 x 150 syklus sammenkoblet sekvenseringsprogram, bør et enkelt fragment ikke overstige 300 bp). Ved bruk av sekvenseringsprogrammer med færre sykluser kan PCR-produktene fragmenteres ved hjelp av en dsDNase. Videre, ettersom sekvenser i primersekvensene ikke inneholder noen strukturell informasjon, må fragmentene overlappe når det probede RNA består av >1-fragment. RT-reaksjoner kan inneholde flere RT-primere for forskjellige fragmenter (opptil 10 forskjellige RT-primere). Avhengig av sekvensene kan sammenslåing av RT-primerne gjøre revers transkripsjon mindre effektiv, men fungerer vanligvis bra. Hver PCR-reaksjon bør utføres separat.
Ved sondering av RNA med DMS spiller de eksperimentelle forholdene en ekstra rolle, da mange RNA er termodynamisk ustabile og endrer konformasjon basert på miljøfaktorer som temperatur. For å unngå uregelmessigheter, bør de eksperimentelle forholdene holdes så konstante som mulig, også med hensyn til reaksjonstider. Bufferbetingelsene ser ut til å kunne byttes til en viss grad 17,20,22,23 når de grunnleggende forholdene opprettholdes – bufferkapasiteten og tilstedeværelsen av monovalente (Na) og divalente ioner (Mg) – for å sikre riktig folding av RNA 24.
Når det gjelder bibliotekets forberedelse av modifiserte RNA, må flere aspekter tas i betraktning. For det første, som nevnt tidligere, er modifiserte RNA mindre stabile enn deres umodifiserte kolleger, noe som betyr at de kan kreve optimalisering av fragmenteringstidene for optimal fragmentstørrelsesfordeling. Videre bruker visse RNA-bibliotekforberedelsessett, så vel som mange andre RNAseq-tilnærminger, tilfeldige primere i omvendt transkripsjonssett. Dette kan føre til lavere dekning av referansen, spesielt i 3 ‘av et gen, og til slutt til utilstrekkelig dekningsdybde. Hvis dekningen av en bestemt region er for lav, kan det være nødvendig å fjerne disse basene fra strukturprediksjonen. Bortsett fra RT-PCR og hele genom RNAseq-sett, kan andre biblioteksforberedelsesmetoder brukes. Protokoller som inkluderer ligering av 3 ‘og / eller 5’ adaptere til RNA er fordelaktige ved bruk av små fragmenter av RNA eller når tap av sonderingsinformasjon i primerregionene må unngås.
Til slutt må analysen av de kjemiske sonderingsforsøkene alltid tolkes nøye. For øyeblikket er det ingen programvare som forutsier RNA-strukturen til noe RNA fra sekvensen alene med høy nøyaktighet. Selv om begrensninger i kjemisk sondering forbedrer nøyaktigheten betydelig, er det fortsatt utfordrende å generere gode modeller for lange RNA (>500 nt). Disse modellene bør testes videre ved andre tilnærminger og / eller mutagenese. RNA-prediksjonsprogramvare optimaliserer for maksimalt antall basepar, og straffer dermed åpne konformasjoner betydelig, noe som kanskje ikke nøyaktig representerer RNA-folding5. Dermed bør den oppnådde strukturmodellen testes ved å kvantifisere prediksjonsavtalen med de underliggende kjemiske sonderingsdataene (f.eks. av AUROC) og mellom replikasjoner (f.eks. ved mFMI), som eksemplifisert av Lan et al.20.
Ideelt sett bør flere eksperimenter i forskjellige systemer for å utfordre den oppnådde strukturmodellen brukes til å styrke ens hypotese. Disse kan omfatte bruk av in vitro og in-cell tilnærminger, kompenserende mutasjoner, og forskjellige cellelinjer og arter. Videre er rå reaktiviteter ofte like eller enda mer informative enn strukturforutsigelser, da de registrerer øyeblikksbildet av “bakken sannhet” av RNA-foldingsensemblet. Som sådan er rå reaktiviteter svært egnet og informativ for å sammenligne strukturendringer mellom ulike forhold. Det er viktig at de laveste frie energistrukturene beregnet ved hjelp av kjemiske sonderingsbegrensninger med beregningsprediksjon bare skal brukes som en starthypotese mot en komplett strukturmodell.
The authors have nothing to disclose.
Ingen
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |