具有新序列特异性的限制内联酶可以从识别部分退化序列的酶中开发。在这里,我们提供了一个详细的协议,我们成功地用于改变NlaIV酶的序列特异性。该协议的关键成分是转录/翻译反应的体外分块和具有新序列特性的变体的选择。
限制内核酶(REase)特异性工程极其困难。在这里,我们描述了一个多步骤协议,帮助产生比父酶更严格的特性的REase变异。该协议要求为REase的变体创建表达选择盒库(ESCs),理想情况下,在可能影响DNA结合的位置有可变性。ESC 的一侧是限制站点活动所需的序列和生物素标记,另一侧是用于意外活动和引物退火位的限制站点。ESCs被转录并转化为油中水乳液,在使每个液滴存在多个DNA分子的情况下。因此,每个盒式分子中的DNA只受翻译的编码酶的活性的影响。所需特异性的 REase 变体可去除生物素标记,但不会去除引素退火位位。破坏乳液后,DNA分子受到生物蛋白下拉,只有那些在上清液保留。此步骤可确保仅保留未丢失所需活动的变体的 ESC。这些DNA分子然后受到第一次PCR反应。不需要序列中的裂解会切断其中一个引漆的引底器结合位点。因此,PCR 仅从液滴中放大 ESC,而不需要进行所需的活动。然后进行第二次PCR反应,以重新引入所需特异性和生物素标签的限制位点,以便重新选择步骤。选定的开放式阅读帧可以在细菌细胞中过度表达,这些细胞也表达出父母REase的可亲甲基转移酶,因为新进化的REase只针对甲基转移酶靶点的一个子集。
序列特异性工程对 II 类 REase 极具挑战性。在此类内生酶中,序列识别和催化紧密地交织在一起,很可能是作为进化保护,防止产生比其同质甲基转移酶具有更广泛特异性的内联酶,后者会损害宿主DNA。由于需要保护宿主DNA免受新设计的内丘酶活性的影响,细胞中新特异性的定向进化变得更加复杂。因此,只有几个成功的REase工程报告,他们都利用特定酶11,2,3,4,5,6,72,3,4,5,6,7的独特特性。
在这里,我们为特异性工程提供了详细的协议,可用于生成比父母酶更窄的内生酶变异,这种酶基于我们成功的NlaIV内核酶8工程。对于任何具有任意识别序列的此类酶,可以为齿面中的碱基引入额外的特异性。对于识别部分退化序列(如NlaIV及其GGNNCC靶点)的亲酶,还可以在识别序列中引入额外的特异性。由于额外的特异性可能需要蛋白质-DNA接触,新认识的碱基应位于DNA上父母内核酸酶的足迹内。原则上,可以为识别序列的任何所需专门化设置选择方案。然而,大多数识别蛋白酶体和几乎蛋白酶靶序列的REase是功能昏暗器,只识别半位处的苍白。因此,选择违反蛋白质核相互作用对称性的新特性不太可能奏效。例如,对于小NlaIV,GGNNCC序列理论上可以缩小到GGATCC,但将特异性缩小到GGAACC预计更加困难。我们的方案包括正面和消极选择。
当还使用负选择来删除能够切除首选较窄特异性之外的所有序列的特异性时,该过程会更有效。例如,GGATCC 的选择可以与针对 GGBVCC 的反选择相结合(其中 B 是 A 以外的任何基,V 是 T 以外的任何基点)。当一些可能的目标序列未涵盖时,选择实验的结果取决于正和负选择的有效性。在我们的NlaIV工作中,我们选择了GGATCC,针对GGSSCC(其中S是G或C),并获得了一个特异性,忽略对称突破目标,可以描述为GGWWCC(其中W是A或T),这表明在这种情况下,负选择更多比积极选择重要。
我们的方法从创建表达式选择盒 (ESC) 开始。ESC 按部分进行构建。在内部核心部分,在 T7 启动器控制下,REase 的开放读取帧 (ORF) 有变体。ESC 的此核心部分不能包含任何工程 REase 的认知站点。核心夹在两个野生类型 REase 的认知站点之间:用于意外活动的裂解站点(计数器选定序列,本例中的 GGSSCC)和所需活动的裂解站点(所选序列,示例中的 GGATCC)。PCR 中 ESC 制备的最后一步在 5′ 末端添加接近所需活性的生物素,并创建各种计数器选择序列(示例中为 GGSSCC)。选择策略依赖于在体外转录/翻译/选择协议(图1A)之后,在ESC重新放大协议中使用精心设计的引物。ESC库以体外分录转录9、10、1110,11表示。9在每个滴中,表达酶的特异性影响ESC的状态(图1B,步骤I)。对于描述的排列,翻译的蛋白质所需的裂解活性会去除DNA的生物素标签,但不影响其他ESC末端与计数器选择的序列。当乳液破裂时,通过链球菌亲和力下拉下去除生物微化碎片,以便仅保留具有所需活性的液滴碎片(图1B,步骤II)。此步骤删除非活动 REase 变体。然后,PCR 放大了下拉步骤的上清分数。在第一个PCR反应引漆F2和R1中使用(图1A,B,步骤III)。引物 F2 与计数器选定序列和分子端之间的 ESC 部分结合。因此,表达能够分割计数器选定序列的变体(因此,将引物 F2 和 R1 的结合位点分离为两个不同的 DNA 分子)的 ESC 不会放大,因此从库中移除。底漆 R1 在所选站点和 ESC 核心之间绑定,使其不受所选站点的裂解状态的影响,并还原所需活动的裂解位点 (GGATCC)。循环由第二个 PCR(引物 F1 和 R2)关闭,该 PCR 在靠近选定站点的 5′ 端添加生物素,并在靠近 ESC 另一端的计数器选定地点恢复设计变异(图 1B,步骤 IV)。由此产生的DNA混合物准备进行另一轮选择。
选择协议的成功在很大程度上取决于正确选择新的、更严格的目标识别序列,以及仔细设计诱变策略及其有效实施。因为与克服它们相比,在REase的轻微预先存在的偏好上改进要容易得多,因此我们建议从任何预先存在的偏好进行动力学研究。仔细的突变设计的必要性来自突变库的有限大小,该库可以通过提交的协议处理(在单个实验中有109个克隆)。因此,所有20种可能的氨基酸替代品只能在几个位置进行有效测试(参见讨论)。随机突变,如作为替代方法呈现的容易出错的PCR(EP-PCR),将导致现有复杂性的严重低估。如果有任何有关与DNA接触涉及的潜在氨基酸位置的信息(甚至位于与同源序列中退化核苷酸的接近处),它肯定应该用于选择一些氨基酸,用于寡核苷酸引导饱和突变(协议步骤1.6-3.10)。
此处描述的选择协议对 NlaIV 8 进行了测试,NlaIV8是一种二进制 PD-(D/E)XK 折叠识别序列,用于识别具有中央 NN 基座的异位靶点,并催化 NN 基之间的钝端切口。之所以选择NlaIV,是因为NN碱基之间的裂痕表明这些碱基接近复合体中的蛋白质。原则上,该协议可用于任何折叠组的任何序列特定限制内核酶、单体或小链,催化任何交错器的双股断裂,无论催化和特异性域是否重合(如 NlaIV 示例中所示)还是单独(例如 FokI)。此外,该协议原则上不仅有助于产生新的、更窄的酶特异性,还可用于消除恒星活动或创造高保真内核酶。然而,这一切尚未测试。特别是,有针对性地消除恒星活性可能很复杂,因为同样的氨基酸残留物可能参与与期望和不需要的碱基结合。该协议中描述的体外步骤并不限于选择缩小的特异性,还可用于选择其他更改的特异性。然而,变异内联酶存在一个问题:如果基质谱包含非由父母内核酶切割的新目标,则一般没有保护细胞免受这种活性有害影响的好方法。相反,如果内核酶特异性被缩小,目标是野生类型目标的子集,因此现有的同应体甲基转移酶应完全保护。
我们的协议在许多方面不同于许多定向进化协议。开放式阅读帧多样性在实验开始时生成一次,而不是在每个迭代中生成。此外,它是通过拆分和混合合成,而不是由EP-PCR创建的。对于用于此工作中的 NNS 替换,有 (4 x 4 x 2)6 = 1.07 x 109组合的六个位置。因此,任何给定的变体平均存在一次,在 1.7 fmoles 的 ESC.这种能力可以通过与格伦研究公司提供的20个三核苷酸前体混合物的合成,或通过通过分裂和混合寡核苷酸合成在不太有前途的位置降低突变频率,增加到7个位置。如果可能,建议将变化范围限制在六个位置。显然,这种诱变靶向需要一些预先存在的知识,至少涉及基底结合的R易区域。与 EP-PCR 相比,产生多样性的拆分和混合协议具有明显的优势。使用EP-PCR,我们获得了不变的变体和序列,在同一EP-PCR中携带了8个NlaIVESC的替代(表4)。EP-PCR 的库包含应避免的克隆的很大一部分(野生类型序列、多个替换、帧移位和无意义突变,以及不太可能影响序列特异性的地方的突变)。
我们的协议也不同于许多其他定向进化协议,通过存在两个顺序选择步骤。正选择可确保保留所需的活动,否则生物素标记不会被删除,并且可以通过下拉来删除编码序列。从技术上讲,如果靠近所需的裂解部位,但在其他地方存在合适的裂解部位,则偶然出现新颖、非重叠的特异性(例如GCATGC)也可能导致生物素标签的切断。但是,这应该不太可能。负选择会删除为仍然具有不需要活性的酶编码的开放读取帧。此步骤并非严格强制性的,因为该协议仍将使用能够切合选择序列但无法在 ESC 的其他位置切合的变体来丰富输出库,因此不适合 PCR 放大。然而,选择效果预期较低,因为具有原始序列特异性的酶不会从输出中去除,并且会超越具有改变特异性的有前途的变体,但酶活性也会降低。请注意,在总体级别,所需的目标序列和不需要的目标序列都可以(但不必)退化。在 NlaIV 示例中,反目标退化,目标非退化。即使在人口一级有退化,在单个液滴中只有一个(非退化的)目标或反目标存在。在我们的协议中,每次重复选择步骤时都会重新引入目标和反目标序列。因此,开放式阅读帧必须编码能够切开所有可能目标的酶,并且无法切开任何反靶点,才能在多个选择轮中存活。请注意,在协议的每个迭代中重新引入反选择目标的需要都会强制实施两个顺序 PCR。第一个 PCR 使用底漆在反目标外进行内侧,以便反目标的裂解可防止 PCR 反应。第二个 PCR 需要一个底漆,该底漆超出反目标,并重新引入反目标,以确保在多轮选择期间,每个打开的读取帧都针对反目标的所有变体进行测试。
对于产生粘性末端的酶,可以使用基于先前描述的 REase ORF10分离方法的相关替代协议。在我们的实验中使用的生物素捕获的非活性变体的损耗在替代协议中被连接成一个序列,该序列在选择性 PCR 中用作底漆结合位点(图 9)。只有产生具有选定特异性的酶的ESC才会产生具有结扎能力的末端,因此将被选择。计数器 e选定序列的粘滞端序列的设计方式必须使其不能参与与适配器的连接。通过在两个不同的适配器之间切换,从而在选择性 PCR 中切换两个不同的反向引引器,可以轻松实现选择过程的迭代。
即使有了新的协议,在体外工程新特性的任务仍然非常具有挑战性。对于典型的 II 型 REase,序列特异性和内丘解解活性取决于相同的蛋白质区域。因此,在不影响另一种的情况下改变一个是困难的。成功更可能通过一种策略,考虑到酶的足迹,尊重蛋白质-DNA相互作用的对称性,并建立在预先存在的酶偏好之上,这应该预先确定在生化实验中,如对NlaIV的例子8所做的那样。
The authors have nothing to disclose.
这项工作得到了波兰国家科学中心(UMO-2011/02/A/NZ1/00052)提供的波兰国家科学中心(UMO-2011/02/A/NZ1/00052)的赠款(0295/B/PO1/2008/34至MB和N301 100 31/3043至KS)的资助。 UMO-2014/13/B/NZ1/03991 和 UMO-2014/14/M/NZ5/00558 到 MB)和短期 EMBO 奖学金到 KS (ATSF 277.00-05)。
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |