该协议提供了用硫酸二甲酯修饰RNA以进行突变分析实验的说明。它包括使用两种替代文库制备方法进行的 体外 和 体内 探测。
RNA结构在几乎任何生物过程中的作用都变得越来越明显,特别是在过去十年中。然而,解决RNA结构的经典方法,如RNA晶体学或冷冻电镜,未能跟上快速发展的领域和对高通量解决方案的需求。使用硫酸二甲酯 (DMS) 进行测序的突变分析 MaPseq 是一种基于测序的方法,用于从碱基与 DMS 的反应性推断 RNA 结构。当碱基未配对时,DMS在其Watson-Crick面上甲基化腺苷中的N1氮和胞嘧啶中的N3。用热稳定的II组内含子逆转录酶(TGIRT-III)逆转录修饰的RNA导致甲基化碱基作为突变掺入cDNA。当对所得cDNA进行测序并将其映射回参考转录本时,每个碱基的相对突变率表明碱基的“状态”为配对或未配对。尽管DMS反应性在 体外 和细胞中都具有很高的信噪比,但这种方法对处理程序中的偏差很敏感。为了减少这种偏差,本文提供了一种在细胞中使用DMS和 体外 转录RNA进行RNA处理的方案。
自从发现RNA同时具有结构1,2和催化3性质以来,RNA的重要性及其在众多生物过程中的调节功能逐渐被揭示。事实上,RNA结构对基因调控的影响越来越受到关注4。与蛋白质一样,RNA具有一级,二级和三级结构,分别指核苷酸的序列,碱基配对相互作用的2D映射以及这些碱基配对结构的3D折叠。虽然确定三级结构是理解RNA依赖性过程背后的确切机制的关键,但二级结构在RNA功能方面也提供了大量信息,并且是进一步3D折叠的基础5。
然而,使用传统方法确定RNA结构具有固有的挑战性。虽然对于蛋白质,晶体学,核磁共振(NMR)和低温电子显微镜(cryo-EM)已经可以确定结构基序的多样性,允许仅从序列6进行结构预测,但这些方法并不广泛适用于RNA。事实上,RNA是具有构建块(核苷酸)的柔性分子,与氨基酸对应物相比,具有更大的构象和旋转自由度。此外,通过碱基配对的相互作用比氨基酸残基的相互作用更具动态性和多功能性。因此,经典方法仅对具有明确定义、高度紧凑结构的相对较小的RNA成功7。
确定RNA结构的另一种方法是通过化学探测结合二代测序(NGS)。该策略生成有关RNA序列中每个碱基的结合状态(即其二级结构)的信息。简而言之,RNA分子中不参与碱基配对的碱基被小化合物差异修饰。用专门的逆转录酶(RT)逆转录这些RNA将修饰作为突变整合到互补的脱氧核糖核酸(cDNA)中。然后通过聚合酶链反应(PCR)扩增这些cDNA分子并进行测序。为了获得有关其结合或未结合的“状态”的信息,计算感兴趣的RNA中每个碱基的突变频率,并将其作为约束输入结构预测软件8。基于最近邻规则9 和最小自由能计算10,该软件生成最适合所获得的实验数据11,12 的结构模型。
DMS-MaPseq使用DMS,其以高度特异性的方式甲基化沃森-克里克面腺苷中的N1氮和胞嘧啶中的N3氮13。在逆转录中使用热稳定的II组内含子逆转录酶(TGIRT-III)可创建具有前所未有的信噪比的突变谱,甚至允许对由两个或多个替代构象产生的重叠谱进行反卷积14,15。此外,DMS可以穿透细胞膜和整个组织,使得在生理环境中进行探测成为可能。然而,高质量数据的生成具有挑战性,因为处理程序的变化会影响结果。因此,我们为 体外 和细胞内DMS-MaPseq提供了详细的方案,以减少偏差并指导新人通过他们可能遇到的困难。特别是鉴于最近的SARS-CoV2大流行,RNA病毒的高质量数据是研究基因表达和寻找可能治疗方法的重要工具。
此处的协议描述了如何使用DMS突变分析实验在 体外 和细胞中探测RNA。此外,它还提供了有关如何为Illumina测序准备文库以生成基因特异性数据并分析获得的.fastq文件的说明。此外,可以使用全基因组文库方法。然而,基因特异性RT-PCR可产生最高质量和最可靠的数据。因此,如果比较样品,重要的是要确保使用相同的测序策略制备它们,因为文库生成会导致一些偏差。重现性应始终使用重复进行测量。
几点注意事项
RNA是一种不稳定的分子,对高温和RNA酶的降解都很敏感。因此,建议采取特殊措施,即使用个人防护装备(PPE)、无RNA酶材料和RNA酶抑制剂。最重要的是,RNA应尽可能保存在冰上。这尤其适用于甲基化RNA,它对高温更加敏感。
重要的是要确认目标RNA结构对DMS浓度和缓冲条件不敏感。pH 7-7.5 时的 100 mM Tris、100 mM MOPS 和 100 mM HEPES 等缓冲液可提供高信号,但可能不足以在反应过程中维持 pH值 21。由于DMS在水中水解会降低pH值,因此强缓冲液对于在改性反应过程中保持中性pH值至关重要。添加bicine已被证明有助于将pH维持为略微碱性21 ,但导致Gs和Us上的DMS修饰较低,这可能是有益的,但由于产生的信号比As和Cs低得多,因此应单独分析,并且本协议中不再进一步讨论。
在基因特异性RT-PCR中,修饰的RNA被逆转录到DNA中,并通过PCR扩增成片段。虽然RNA的大小理论上是无限的,但这些PCR片段的长度不应超过400-500个碱基对(bp),以防止逆转录反应过程中的偏差。理想情况下,片段应在测序运行范围内(即,如果使用150 x 150循环配对末端测序程序进行测序,则单个片段不应超过300 bp)。当使用循环次数较少的测序程序时,可以使用dsDNA酶对PCR产物进行片段化。此外,由于引物序列中的序列不包含任何结构信息,因此当探针的RNA包含>1片段时,片段必须重叠。RT反应可以包含用于不同片段的多个RT引物(最多10种不同的RT引物)。根据序列的不同,合并RT引物会使逆转录效率降低,但通常效果很好。每个PCR反应应单独进行。
当用DMS探测RNA时,实验条件起着额外的作用,因为许多RNA在热力学上不稳定,并且根据温度等环境因素改变其构象。为避免不规则,实验条件应尽可能保持恒定,在反应时间方面也是如此。当保持碱性条件(缓冲能力和一价(Na)和二价离子(Mg)的存在)以确保RNA24的适当折叠时,缓冲条件似乎可以在一定程度上交换17,20,22,23。
关于修饰RNA的文库制备,必须考虑几个方面。首先,如前所述,修饰的RNA不如未修饰的RNA稳定,这意味着它们可能需要优化片段时间以获得最佳片段大小分布。此外,某些RNA文库制备试剂盒以及许多其他RNAseq方法在逆转录试剂盒中使用随机引物。这可能会导致参考文献的覆盖率降低,特别是在基因的3’中,并最终导致覆盖深度不足。如果某个区域的覆盖率太低,则可能需要从结构预测中删除这些碱基。除了RT-PCR和全基因组RNAseq试剂盒外,还可以使用其他文库制备方法。当使用RNA的小片段或必须避免引物区域中探测信息的丢失时,包括将3’和/或5’接头连接到RNA的方案是有利的。
最后,必须始终仔细解释化学探测实验的分析。目前,还没有软件可以仅从序列中高精度地预测任何RNA的RNA结构。尽管化学探测约束大大提高了准确性,但为长RNA(>500 nt)生成良好的模型仍然具有挑战性。这些模型应通过其他方法和/或诱变进一步测试。RNA预测软件针对最大碱基对数进行优化,从而显着惩罚开放构象,这些构象可能无法准确代表RNA折叠5。因此,应通过量化与基础化学探测数据(例如,通过AUROC)和重复之间的预测一致性(例如,通过mFMI)来测试获得的结构模型,如Lan等人20所示。
理想情况下,应该使用不同系统中的几个实验来挑战获得的结构模型来加强一个人的假设。这些可能包括体 外 和细胞内方法的使用、代偿突变以及不同的细胞系和物种。此外,原始反应性通常与结构预测一样,甚至更具信息性,因为它们记录了RNA折叠系综的“基本事实”快照。因此,原始反应性非常适合比较不同条件之间的结构变化,并且非常有用。重要的是,使用化学探测约束和计算预测计算的最低自由能结构只能用作完整结构模型的起始假设。
The authors have nothing to disclose.
没有
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |