本协议描述了一种映射体3的端处理站点的方法。
过去十年的研究揭示了体裂解和多反应的复杂和动态变化。基因与 3 ‘ 未翻译的区域 (UTRs) 在分化的细胞中产生, 而增殖细胞优先表达的抄本与短 3 ‘ UTRs。我们描述了 A-seq 协议, 现在在其第二个版本, 这是开发地图多网站的全基因组和研究的规则体3的最终处理。并且这个当前协议利用 polyadenylate (聚 (A)) 尾巴在多数哺乳动物基因的生物期间增加, 丰富为充分地被处理的基因。一个 DNA 适配器与 deoxyuracil 在其第四位置允许精确处理 mRNA 3 的末端片段排序。不包括细胞培养和过夜结扎, 该协议需要大约8小时的动手时间。同时, 还提供了一个易于使用的软件包, 用于分析导出的测序数据。A-seq2 和相关的分析软件提供了一个有效的和可靠的解决方案, 体 3 ‘ 两端在广泛的条件, 从 106或更少的细胞。
mrna 3 末端的捕获和测序可以研究 mrna 的处理和基因表达的定量。由于其聚 (A) 尾, 真核基因可有效纯化的总细胞裂解与珠固定寡苷 (dT) 分子, 这也可以是主要的 cDNA 合成。但是, 这种方法有两个缺点。首先, A 的延伸是内部的抄本也可以是主要的 cDNA 合成, 造成杂散 (a) 网站。第二, 同质聚 (A) 拉伸对测序有特定的挑战, 除了不提供信息以记录身份。已经提出了各种方法来绕过这些限制, 如通过聚 (A) 尾的反向转录, 其次是核糖核酸 H 消化 (3 p-seq 1), 使用自定义的测序底漆结束于 20 Ts (2 p-seq 2), 预选RNA 片段与聚 (a) 超过50核苷酸的尾巴与 CU5T45底漆跟随核糖核酸 H 消化 (3 ‘ 读3), 以及在发夹 (a seq 4) 中含有 3 “适配器” 的寡糖-dT 底漆的使用。
最近开发的 A-seq2 方法5的目的是通过聚 (A) 绕过测序, 同时使适配器 self-ligation 产生的聚比例最小化, 特别是当适配器的摩尔浓度超过了插入浓度。当两个适配器都与 A-seq2 中的相同类型的核苷酸端点相连时, 就可以消除这个问题, 在这种情况下, 3 “适配器与 RNA 片段的 5” 端相连, 而 5 “适配器” 则与基因在反向转录后的5端相连。该方法比我们先前提出的 seq-in 更方便, 它的测序是在 5 ‘ 至-3 ‘ 方向, 从而需要精确控制的 RNA 碎片-, 同时保持高精度的聚 (A) 站点识别。大约80% 的测序读数在典型的样本中具有独特的基因组, 并导致2万多个 (A) 站点簇的识别, 其中超过70% 是与注释的 3 “UTRs” 重叠的。
简言之, A-seq2 协议开始于 mRNA 分裂和结扎的反向互补 3 ‘ 适配器到 5 ‘ 端的 RNA 片段。聚 (a) 包含 rna 然后反向转录与25核苷酸 (nt) 长寡糖 (dT) 底漆, 其中包含一个锚核苷酸在 3 ‘ 年底, 杜在位置4和生物素在 5 ‘ 年底, 允许结合的 cDNA 磁性亲和珠。大部分的引物, 包括生物素, 是从在杜分裂的用户酶组合, 以嘧啶 dna glycosylase (UDG) 和 dna glycosylase 裂解切 VIII。这个反应留下完整的两端结扎的 5 ‘ 适配器, 和三 Ts 留下后, 分裂仍然是标记的位置, 聚 (a) 尾。由于 5 “和 3” 适配器都通过结扎连接到收件人5端, 因此不生成适配器聚。在读取开始时引入的四核苷酸随机市场分析允许对最先进的测序仪器进行簇解析, 也可以作为唯一的分子识别器 (UMI) 用于检测和去除 PCR 扩增伪影。UMI 的大小可进一步增加, 如其他研究6所示。该协议生成的读取是反向互补的 mRNA 3 的两端, 所有开始的随机聚丙烯, 其次是 3 ts. 对3诊断 Ts 的读取的处理在其5的末尾开始与 PCR 扩增伪影的修正利用 UMIs, 去除3的适配器序列, 并反向互补。可能源自于内部 A 丰富站点的寡聚 (dT) 启动的读取也被计算出来并被丢弃。杂散站点通常缺少 18 良好和保守的聚 ( A ) 信号中的一个 , 应该位于明显的站点7的上游 21 核苷酸。
该协议需要大约8小时的动手时间, 不计算细胞培养和过夜结扎。关联的读取分析软件可实现高度精确的多 (a) 站点标识。从聚 (A) 网站集群创建的基础上进一步突出的4样本在这篇手稿 (两个生物复制控制 siRNA 和硅 HNRNPC 处理细胞) 84% 重叠与注释基因, 和这些, 75% 重叠与 3 ‘ UTR, 和86% 与任何一个3 ‘ UTR 或终端外显子。在复制样本中, 3 ‘ 端的皮尔逊相关系数为 0.92, 通常用该方法获得0.9 以上的值。因此, A-seq2 是一种方便的方法, 可以获得非常重现的结果。
体3端处理所涉及的众多核心和辅助因素反映在相应的复杂多环境中。此外, 多也响应其他过程的变化, 如转录和剪接。3的 pre-mRNAs 的端裂部位通常是根据添加到 5 ‘ 裂解产物中的特征聚 (A) 尾来识别的。大多数方法使用可变长度的寡聚 (dT) 引物, 允许在反转转录反应中, 含有基因的基因的特定转换。这种方法的一个常见问题是内部启动的丰富的序列, 导致 artifactual 的裂解点。提出了两种在样品制备阶段规避工件的方法。在 3 p-seq 方法1中, 适配器是专门结扎到聚 (a) 尾的帮助下的夹板寡糖后, 部分核糖核酸 T1 消化和反向转录与在反应中作为唯一的核苷酸。由此产生的聚 (A)-聚 (dT) heteroduplexes, 然后消化与核糖核酸 H 和其余的 RNA 片段是孤立的, 结扎到适配器, 并测序。一个简单和优雅的方法, 2 p-seq, 使用自定义排序底漆跳过剩余的寡聚 (dT) 拉伸在排序反应中报告了相同的作者2。在一个相关的方法中, 3 ‘ 读取3, 一个不寻常的长底漆 5 Us 和 45 Ts, 也含有生物素退火到碎片 rna, 其次是严格的洗涤选择的 rna 分子与聚 (a) 的尾巴超过50核苷酸。尽管3的读数大大减少了内部启动的频率, 但它并没有完全消除它的3。还提出了直接 RNA 测序的协议, 但所产生的读数是短的, 并且有很高的错误率, 而且这种方法还没有被进一步开发18,19,20。波利亚序列和商品化的量子序列协议结合了基于寡集 (dT) 的启动与随机启动步骤的 cDNA 第二链合成20。使用模板开关反转转录反应与 Moloney 小鼠白血病病毒 (MMLV) 逆转录酶导致的基因与连接在一个单一的步骤, 从而没有适配器聚可以出现在 PAS-Seq 和 SAPAS 方法21,22。
这里提出的 A-seq2 方法在它的利用裂解核苷酸 (dU) 在化寡糖 (dT) 底漆之内站立了。此修改结合了丰富寡聚 (dt) 杂交、polyadenylated 目标的效用, 并将大部分的寡聚 (dt)25序列从孤立的片段中删除, 然后在库准备就绪并保存三 Ts 时,表示聚 (A) 尾的先验存在。相比之下, 利用核糖核酸 H 从 RNA 分子中去除聚 (A) 的方法会随机地留下数个 As。由于在 A-seq2, 测序是从义股的 3 ‘ 年底完成, 分裂点的位置预计将位于 NNNNTTT 主题后, 在原始序列开始读取。随机体不仅能使基础调用, 而且还能消除 PCR 扩增伪影。更长的 UMIs 也可以容纳。内部启动的可能性仍然在 A-seq2, 并处理计算, 首先通过丢弃 3 ‘ 两端与组编码, 丰富的下游序列, 然后通过丢弃 3 ‘ 结束集群, 可以解释的内部启动在丰富的聚 (a) 信号本身。最近对大量协议推断出的 (a) 站点的分析表明, A-seq2 独有的站点在基因中具有预期的核苷酸分布和位置, 类似于其他3端的测序协议。
在 A-seq2 的关键步骤是选择 polyadenylated rna 和去除核糖体 rna 和各种小 rna。这是最容易完成的一个 mRNA 隔离套件与寡糖 (dT)25磁珠。原则上, 与含酚的溶液分离的总 rna 也提供了高质量的 rna, 可以进一步选择由 mRNA 隔离试剂盒或寡核苷酸 (dT) 琼脂糖。在 A-seq2 中可以改变的一个步骤是碱性水解处理, 可以缩短或扩大, 以获得不同大小的 RNA 片段。关键的是, 增加 3 ‘ dATP 到 3 ‘ 的 RNA 片段由聚 (A) 聚合酶是有效的。在这里描述的协议中, 这种治疗适用于所有的 RNA 片段, 以避免 concatemerization 在结扎反应。最后, 我们注意到, 虽然 rna 连接1通常被用作 rna 连接, 它也 ligates 高效的单链 DNA, 正如我们在这里所做的, 结扎一个适配器到 5 ‘ 末端的 cDNA 分子。
因此, A-seq2 是一种高效且易于实施的协议, 用于识别体3的端处理站点。今后的发展可能包括进一步减少议定书的复杂性和所需材料的数量。相关的计算数据分析工具集进一步使 3 ‘ 端测序读取的齐次处理获得了广泛的协议。
The authors have nothing to disclose.
作者感谢 Mrs. Béatrice Dimitriades 对细胞培养的帮助。这项工作得到了瑞士国家科学基金会的资助 #31003A_170216 和 51NF40_141735 (NCCR RNA 和 #38; 疾病)。
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |