长读序列极大地促进了复杂基因组的组合和结构变异的表征。我们描述了一种利用纳米粒子测序平台生成超长序列的方法。该方法采用优化的 DNA 提取, 然后进行改进的文库准备, 从人体细胞中产生数百条覆盖适度的千列酶读数。
第三代单分子 DNA 测序技术提供了更长的读取长度, 可以促进复杂基因组的组装和复杂结构变异的分析。纳米粒子平台通过直接测量 DNA 通过毛孔介导的电流变化来执行单分子测序, 并可以以最小的资本成本产生数百千卡卡酶 (kb) 读数。该平台已被许多研究人员用于各种应用。实现更长的测序读取长度是利用纳米粒子测序平台价值的最关键因素。要产生超长读数, 需要特别考虑避免 DNA 断裂并提高效率, 以生成高效测序模板。在这里, 我们提供了超长 DNA 测序的详细协议, 包括从新鲜或冷冻细胞中提取高分子量 (HMW) DNA, 通过机械剪切或转相酶碎片化构建库, 以及在纳米粒子器件上进行测序。从20-25 微克的 HMW DNA 中, 该方法可通过机械剪切达到 N50 读取长度 50-70 kb, 采用转相酶介导的碎片化方法, 使 n50 读长度达到 900-100 kb。该协议可应用于从哺乳动物细胞中提取的 DNA, 用于检测结构变异和基因组组装的全基因组测序。DNA 提取和酶反应的进一步改进将进一步增加读取长度并扩大其效用。
在过去的十年里, 大规模并行和高精度的第二代高通量测序技术推动了生物医学发现和技术创新的爆炸式增长 1、2、3。尽管技术取得了进步, 第二代平台生成的短读数据在解决复杂的基因组区域方面是无效的, 在检测基因组结构变量 (Sv) 方面也是有限的, 而基因组结构变异在人类中发挥着重要作用。进化和疾病4,5。此外, 短读数据无法解决重复变异, 不适合鉴别遗传变异的单倍型阶段6。
最近在单分子测序方面取得的进展提供了更长的读取长度, 这有助于检测sv 7、8、9的全谱, 并提供了精确、完整的复杂组件微生物和哺乳动物基因组6,10。纳米孔平台通过直接测量 dna 通过毛孔11、12、13介导的电流变化来执行单分子测序。与任何现有的 DNA 测序化学不同, 纳米粒子测序可以实时生成长 (数万到数千千比特) 读数, 而无需依赖聚合酶动力学或 DNA 样本的人工扩增。因此, 纳米孔长读测序 (NLR-seq) 为产生远远超过 100 kb 的超长读取长度带来了巨大的希望, 这将极大地推动基因组和生物医学分析 14, 特别是在低复杂性或丰富的基因组的区域 15。
纳米粒子测序的独特之处在于它具有在不受理论长度限制的情况下产生长读数的潜力。因此, 读取长度取决于 DNA 的物理长度, 而 dna 的物理长度直接受到 DNA 完整性和测序模板质量的影响。此外, 根据操作的程度和所涉及的步骤数量, 如移液力和提取条件, DNA 的质量差异很大。因此, 仅仅应用标准的 DNA 提取协议和制造商提供的库构建方法, 就很难产生长读。为此, 我们开发了一种可靠的方法来生成从采集的细胞颗粒开始的超长读取 (数百千维酶) 测序数据。我们在 DNA 提取和库制备过程中采用了多项改进。我们简化了协议, 以排除导致 DNA 降解和损害的不必要程序。该方案由高分子量 DNA 提取、超长 DNA 文库构建和纳米平台测序两部分组成。对于训练有素的分子生物学家来说, 从细胞采集到完成 HMW DNA 提取通常需要 6小时, 根据剪切方法的不同, 图书馆建设需要90分钟或 8小时, DNA 测序的时间最高为48小时。该协议的使用将使基因组学社区能够提高我们对基因组复杂性的认识, 并获得对人类疾病基因组变异的新见解。
原则上, 纳米粒子测序能够产生100kb 到超位的读数, 长度为 11,12,13。影响测序运行性能和数据质量的主要因素有四个: 1) 活动孔数和毛孔活性;2) 运动蛋白, 控制 DNA 通过纳米孔的速度;3) DNA 模板 (长度、纯度、质量、质量);4) 测序适配器结扎效率, 这决定了输入样本中可用的 DNA。前两个因素取决于流单元的版本和制造商提供的测序试剂盒。第二个因素是该协议中的关键步骤 (HMW DNA 提取、剪切和结扎)。
这个协议需要耐心和实践。HMW DNA 的质量对超长 DNA 文库具有重要意义.该协议从收集的细胞开始, 细胞的活性很高 (& gt;85% 的活细胞首选), 限制了死亡细胞的降解 DNA。任何可能对 DNA 造成损害的苛刻过程 (例如, 强烈的干扰、晃动、涡旋、多次移液、反复冻结和解冻) 都应避免。在协议的设计中, 我们在 DNA 提取的整个过程中忽略了移液。在库的结构和测序过程中, 机械剪切后需要移液时, 需要使用宽孔前置。由于纳米孔对腔内缓冲液 12中的化学物质敏感, 因此 dna 中的残留污染物 (例如洗涤剂、表面活性剂、苯酚、乙醇、蛋白质 rna 等) 应尽可能少。考虑到苯酚的长度和收率, 与目前测试的多种不同提取方法相比, 苯酚提取方法显示出最佳和最可重复的结果。
尽管此协议能够生成长读取序列, 但仍存在一些限制。首先, 根据发布时可用的纳米粒子测序装置对该协议进行了优化;因此, 它仅限于选择性纳米粒子测序化学, 在其他类型的长读测序器件中进行测序时可能是次优的。其次, 结果在很大程度上取决于从起始材料 (组织或细胞) 中提取的 DNA 的质量。如果起始 DNA 已经退化或损坏, 读取长度将受到影响。第三, 虽然在检查 DNA 质量的协议中纳入了多个 QC 步骤, 但读数的最终产量和长度可能会受到流动细胞和孔隙活动的影响, 而流动细胞和孔隙活动可能会在纳米粒子测序平台的这一早期阶段发生变化发展。
这里描述的协议使用人类悬浮细胞系样本进行 DNA 提取。优化了剪针过程、HMW DNA 转相酶的比例和结扎时间, 得出了所述的结果。该协议可以通过四种方式扩展。首先, 使用者可以从其他培养的哺乳动物细胞开始, 并与不同数量的细胞、组织、临床样本或其他生物结合使用。需要进一步优化裂解孵育时间、反应量和离心。其次, 很难预测超长读取测序的目标大小。如果读取长度比预期的要短, 用户可以调整基于机械剪切方法的传递时间, 或在基于移位的方法中更改 HMW DNA 与移位酶的比率。在清理步骤中更长的结合和洗脱时间是有帮助的, 因为 HMW DNA 具有很高的粘性。第三, 利用不同的纳米粒子测序装置, 可以调整 DNA 的数量和体积, 以满足测序器的标准。第四, 只有那些 DNA 连接到测序适配器将被测序。为了进一步提高结扎效率, 可以尝试滴定适配器和连接酶浓度。改性结扎时间和聚乙二醇18等分子拥挤剂可用于未来。超长 dna 测序协议与 crispr19,20相结合, 可为目标浓缩测序提供有效的工具。
The authors have nothing to disclose.
作者感谢朱先生对手稿的评论。该出版物中报告的研究得到了国家卫生研究院国家癌症研究所 P30CA034196一奖的部分支持。内容完全由作者负责, 不一定代表国家卫生研究院的官方观点。
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |