Het protocol geeft instructies voor het modificeren van RNA met dimethylsulfaat voor mutatieprofileringsexperimenten. Het omvat in vitro en in vivo tasten met twee alternatieve bibliotheekvoorbereidingsmethoden.
De rol van RNA-structuur in vrijwel elk biologisch proces is steeds duidelijker geworden, vooral in het afgelopen decennium. Klassieke benaderingen voor het oplossen van RNA-structuur, zoals RNA-kristallografie of cryo-EM, hebben echter geen gelijke tred gehouden met het snel evoluerende veld en de behoefte aan oplossingen met hoge doorvoer. Mutatieprofilering met sequencing met behulp van dimethylsulfaat (DMS) MaPseq is een op sequencing gebaseerde benadering om de RNA-structuur af te leiden uit de reactiviteit van een base met DMS. DMS methyleert de N1-stikstof in adenosines en de N3 in cytosines aan hun Watson-Crick-gezicht wanneer de base is ongepaard. Het omgekeerd transcriberen van het gemodificeerde RNA met de thermostabiele groep II intron reverse transcriptase (TGIRT-III) leidt ertoe dat de gemethyleerde basen als mutaties in het cDNA worden opgenomen. Bij het sequentiëren van het resulterende cDNA en het in kaart brengen ervan naar een referentietranscript, zijn de relatieve mutatiesnelheden voor elke base indicatief voor de “status” van de base als gepaard of ongepaard. Hoewel DMS-reactiviteiten zowel in vitro als in cellen een hoge signaal-ruisverhouding hebben, is deze methode gevoelig voor vertekening in de behandelingsprocedures. Om deze bias te verminderen, biedt dit artikel een protocol voor RNA-behandeling met DMS in cellen en met in vitro getranscribeerd RNA.
Sinds de ontdekking dat RNA zowel structurele 1,2 als katalytische3 eigenschappen heeft, is het belang van RNA en zijn regulerende functie in een overvloed aan biologische processen geleidelijk blootgelegd. Inderdaad, het effect van RNA-structuur op genregulatie heeft steeds meer aandacht gekregen4. Net als eiwitten heeft RNA primaire, secundaire en tertiaire structuren, verwijzend naar de volgorde van nucleotiden, de 2D-mapping van base-pairing interacties en de 3D-vouwing van deze base-paired structuren, respectievelijk. Hoewel het bepalen van de tertiaire structuur de sleutel is tot het begrijpen van de exacte mechanismen achter RNA-afhankelijke processen, is de secundaire structuur ook zeer informatief over de RNA-functie en is de basis voor verdere 3D-vouwing5.
Het bepalen van de RNA-structuur is echter intrinsiek uitdagend geweest met conventionele benaderingen. Terwijl voor eiwitten kristallografie, nucleaire magnetische resonantie (NMR) en cryogene elektronenmicroscopie (cryo-EM) het mogelijk hebben gemaakt om de diversiteit van structurele motieven te bepalen, waardoor structuurvoorspelling alleen uit de sequentiemogelijk is 6, zijn deze benaderingen niet algemeen toepasbaar op RNA’s. Inderdaad, RNA’s zijn flexibele moleculen met bouwstenen (nucleotiden) die veel meer conformatie- en rotatievrijheid hebben in vergelijking met hun aminozuurtegenhangers. Bovendien zijn de interacties door base-pairing dynamischer en veelzijdiger dan die van aminozuurresiduen. Als gevolg hiervan zijn klassieke benaderingen alleen succesvol geweest voor relatief kleine RNA’s met goed gedefinieerde, zeer compacte structuren7.
Een andere benadering om de RNA-structuur te bepalen is door middel van chemisch onderzoek in combinatie met next-generation sequencing (NGS). Deze strategie genereert informatie over de bindingsstatus van elk base in een RNA-sequentie (d.w.z. de secundaire structuur). Kortom, de basen in een RNA-molecuul die zich niet bezighouden met base-pairing worden differentieel gemodificeerd door kleine chemische verbindingen. Het reverse-transcriberen van deze RNA’s met gespecialiseerde reverse transcriptases (RT’s) omvat de modificaties in complementair desoxyribonucleïnezuur (cDNA) als mutaties. Deze cDNA-moleculen worden vervolgens versterkt door de polymerasekettingreactie (PCR) en gesequenced. Om informatie te verkrijgen over hun “status” als gebonden of ongebonden, worden de mutatiefrequenties op elke base in een interessant RNA berekend en ingevoerd in structuurvoorspellingssoftware als beperkingen8. Op basis van nearest neighbor-regels9 en minimale vrije-energieberekeningen10 genereert deze software structuurmodellen die het beste passen bij de verkregen experimentele gegevens11,12.
DMS-MaPseq maakt gebruik van DMS, dat de N1-stikstof in adenosines en N3-stikstof in cytosines op hun Watson-Crick-gezicht op een zeer specifieke manier methyleert13. Het gebruik van thermostabiele groep II intron reverse transcriptase (TGIRT-III) in reverse transcriptie creëert mutatieprofielen met ongekende signaal-ruisverhoudingen, waardoor zelfs de deconvolutie van overlappende profielen gegenereerd door twee of meer alternatieve conformaties14,15 mogelijk is. Bovendien kan DMS celmembranen en hele weefsels binnendringen, waardoor tasten binnen fysiologische contexten mogelijk wordt. Het genereren van gegevens van goede kwaliteit is echter een uitdaging, omdat variaties in de verwerkingsprocedure van invloed kunnen zijn op de resultaten. Daarom bieden we een gedetailleerd protocol voor zowel in vitro als in-cell DMS-MaPseq om bias te verminderen en nieuwkomers naar de methode te begeleiden bij de moeilijkheden die ze kunnen tegenkomen. Vooral in het licht van de recente SARS-CoV2-pandemie zijn hoogwaardige gegevens over RNA-virussen een belangrijk hulpmiddel voor het bestuderen van genexpressie en het vinden van mogelijke therapieën.
Het protocol beschrijft hier hoe RNA in vitro en in cellen kan worden onderzocht met behulp van DMS-mutatieprofileringsexperimenten. Bovendien geeft het instructies over het voorbereiden van bibliotheken voor Illumina-sequencing om genspecifieke gegevens te genereren en de verkregen .fastq-bestanden te analyseren. Daarnaast kunnen genoombrede bibliotheekbenaderingen worden gebruikt. Genspecifieke RT-PCR produceert echter de hoogste kwaliteit en meest robuuste gegevens. Daarom is het belangrijk om bij het vergelijken tussen monsters ervoor te zorgen dat ze worden voorbereid met identieke sequencingstrategieën, omdat het genereren van bibliotheken enige vertekening veroorzaakt. De reproduceerbaarheid moet altijd worden gemeten met behulp van replica’s.
Verschillende voorzorgsmaatregelen
RNA is een onstabiel molecuul dat gevoelig is voor afbraak, zowel door verhoogde temperaturen als door RNases. Daarom worden speciale maatregelen — het gebruik van persoonlijke beschermingsmiddelen (PBM), RNAse-vrij materiaal en RNAse-remmers — aanbevolen. Het belangrijkste is dat RNA waar mogelijk op ijs moet worden gehouden. Dit geldt vooral voor gemethyleerd RNA, dat nog gevoeliger is voor hoge temperaturen.
Het is belangrijk om te bevestigen dat de RNA-structuur van belang niet gevoelig is voor de DMS-concentratie en buffercondities. Buffers zoals 100 mM Tris, 100 mM MOPS en 100 mM HEPES bij pH 7-7,5 geven een hoog signaal, maar zijn mogelijk niet voldoende om de pH tijdens de reactie21 te handhaven. Aangezien DMS hydrolyseert in water, waardoor de pH daalt, is een sterke buffer van cruciaal belang om een neutrale pH te behouden tijdens de modificatiereactie. Van de toevoeging van bicine is aangetoond dat het helpt om de pH als iets basaal21 te handhaven, maar resulteert in een lage DMS-modificatie op Gs en Us, wat informatief kan zijn, maar afzonderlijk moet worden geanalyseerd vanwege de productie van een veel lager signaal dan As en Cs en wordt niet verder besproken in dit protocol.
In genspecifieke RT-PCR wordt het gemodificeerde RNA omgekeerd getranscribeerd in het DNA en in fragmenten versterkt door PCR. Hoewel de grootte van het RNA theoretisch onbeperkt kan zijn, mogen deze PCR-fragmenten niet groter zijn dan een lengte van 400-500 basenparen (bp) om vertekening tijdens de reverse transcriptiereactie te voorkomen. Idealiter zouden de fragmenten binnen het bereik van de sequencingrun moeten vallen (d.w.z. als sequencing wordt uitgevoerd met behulp van een 150 x 150 cyclus gepaard-end sequencingprogramma, mag een enkel fragment niet hoger zijn dan 300 bp). Bij gebruik van sequencingprogramma’s met minder cycli kunnen de PCR-producten worden gefragmenteerd met behulp van een dsDNase. Bovendien, omdat sequenties binnen de primersequenties geen structurele informatie bevatten, moeten de fragmenten elkaar overlappen wanneer het onderzochte RNA >1 fragment omvat. RT-reacties kunnen meerdere RT-primers bevatten voor verschillende fragmenten (tot 10 verschillende RT-primers). Afhankelijk van de sequenties kan het poolen van de RT-primers de omgekeerde transcriptie minder efficiënt maken, maar werkt meestal goed. Elke PCR-reactie moet afzonderlijk worden uitgevoerd.
Bij het onderzoeken van RNA met DMS spelen de experimentele omstandigheden een extra rol, omdat veel RNA’s thermodynamisch onstabiel zijn en hun conformatie veranderen op basis van omgevingsfactoren zoals temperatuur. Om onregelmatigheden te voorkomen, moeten de experimentele omstandigheden zo constant mogelijk worden gehouden, ook met betrekking tot de reactietijden. De buffercondities lijken tot op zekere hoogte uitwisselbaar te zijn 17,20,22,23 wanneer de basisvoorwaarden worden gehandhaafd – de buffercapaciteit en aanwezigheid van monovalente (Na) en tweewaardige ionen (Mg) – om een goede vouwing van RNA24 te garanderen.
Met betrekking tot de bibliotheekvoorbereiding van gewijzigde RNA’s moet rekening worden gehouden met verschillende aspecten. Ten eerste zijn gemodificeerde RNA’s, zoals eerder vermeld, minder stabiel dan hun ongewijzigde tegenhangers, wat betekent dat ze mogelijk de optimalisatie van de fragmentatietijden vereisen voor een optimale verdeling van de fragmentgrootte. Bovendien gebruiken bepaalde RNA-bibliotheekvoorbereidingskits, evenals vele andere RNAseq-benaderingen, willekeurige primers in de reverse transcriptiekit. Dit kan leiden tot een lagere dekking van de referentie, vooral in de 3 ‘van een gen, en uiteindelijk tot onvoldoende dekkingsdiepte. Als de dekking van een bepaalde regio te laag is, kan het nodig zijn om die bases uit de structuurvoorspelling te verwijderen. Naast RT-PCR en RNAseq-kits voor het hele genoom kunnen andere bibliotheekvoorbereidingsbenaderingen worden gebruikt. Protocollen die de ligatie van 3′ en/of 5’ adapters aan het RNA omvatten, zijn voordelig bij het gebruik van kleine fragmenten RNA of wanneer het verlies van tastende informatie in de primergebieden moet worden vermeden.
Ten slotte moet de analyse van de chemische sonde-experimenten altijd zorgvuldig worden geïnterpreteerd. Momenteel is er geen software die de RNA-structuur van een RNA alleen uit de sequentie met hoge nauwkeurigheid voorspelt. Hoewel chemische tasterbeperkingen de nauwkeurigheid aanzienlijk verbeteren, is het genereren van goede modellen voor lange RNA’s (>500 nt) nog steeds een uitdaging. Deze modellen moeten verder worden getest door andere benaderingen en/of mutagenese. RNA-voorspellingssoftware optimaliseert voor het maximale aantal basenparen, waardoor open conformaties aanzienlijk worden bestraft, die mogelijk niet nauwkeurig RNA-vouw5 vertegenwoordigen. Het verkregen structuurmodel moet dus worden getest door de voorspellingsovereenkomst te kwantificeren met de onderliggende chemische tastergegevens (bijvoorbeeld door AUROC) en tussen replicaties (bijvoorbeeld door mFMI), zoals geïllustreerd door Lan et al.20.
Idealiter zouden verschillende experimenten in verschillende systemen om het verkregen structuurmodel uit te dagen, moeten worden gebruikt om iemands hypothese te versterken. Deze kunnen het gebruik van in vitro en in-cell benaderingen, compenserende mutaties en verschillende cellijnen en soorten omvatten. Bovendien zijn ruwe reactiveringen vaak net zo of zelfs informatiever dan structuurvoorspellingen, omdat ze de “grondwaarheid” -momentopname van het RNA-vouwensemble vastleggen. Als zodanig zijn ruwe reactiveringen zeer geschikt en informatief voor het vergelijken van structuurveranderingen tussen verschillende omstandigheden. Belangrijk is dat de laagste vrije energiestructuren die zijn berekend met behulp van chemische indringende beperkingen met computationele voorspelling alleen moeten worden gebruikt als een starthypothese voor een compleet structuurmodel.
The authors have nothing to disclose.
Geen
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |