Las endonucleasas de restricción con nueva especificidad de secuencia se pueden desarrollar a partir de enzimas que reconocen una secuencia parcialmente degenerada. Aquí proporcionamos un protocolo detallado que utilizamos con éxito para alterar la especificidad de la secuencia de la enzima NlaIV. Los ingredientes clave del protocolo son la compartimentación in vitro de la reacción de transcripción/traducción y la selección de variantes con nuevas especificidades de secuencia.
La ingeniería de especificidad de endonucleasa de restricciones (REase) es extremadamente difícil. Aquí describimos un protocolo de varios pasos que ayuda a producir variantes REase que tienen una especificidad más estricta que la enzima parental. El protocolo requiere la creación de una biblioteca de casetes de selección de expresiones (ESC) para las variantes del REase, idealmente con variabilidad en posiciones que puedan afectar a la unión al ADN. El ESC está flanqueado por un lado por una secuencia para la actividad del sitio de restricción deseada y una etiqueta de biotina y en el otro lado por un sitio de restricción para la actividad no deseada y un sitio de recocido de imprimación. Los ESC se transcriben y traducen en una emulsión de agua en aceite, en condiciones que hacen improbable la presencia de más de una molécula de ADN por gota. Por lo tanto, el ADN de cada molécula de casete se somete únicamente a la actividad de la enzima traducida y codificada. Las variantes REase de la especificidad deseada eliminan la etiqueta de biotina, pero no el sitio de recocido de imprimación. Después de romper la emulsión, las moléculas de ADN se someten a un pulldown de biotina, y sólo se conservan las del sobrenadante. Este paso garantiza que solo se conservan las ESC para las variantes que no han perdido la actividad deseada. Estas moléculas de ADN se someten a una primera reacción de PCR. El escote en la secuencia no deseada corta el sitio de encuadernación de la imprimación para una de las imprimaciones. Por lo tanto, PCR amplifica solamente los ESC de las gotas sin la actividad no deseada. A continuación, se lleva a cabo una segunda reacción de PCR para reintroducir el sitio de restricción para la especificidad deseada y la etiqueta de biotina, de modo que se pueda reiterar el paso de selección. Los marcos de lectura abiertos seleccionados pueden expresarse en células bacterianas que también expresan la metiltransferasa cognada del REase parental, porque el REase recién evolucionado se dirige sólo a un subconjunto de los sitios de destino de la metiltransferasa.
La ingeniería de especificidad de secuencia es extremadamente difícil para los REases de clase II. En esta clase de endonucleasasas, el reconocimiento de secuencias y la catálisis están estrechamente entrelazados, probablemente como una salvaguardia evolutiva contra la creación de una endonucleasa de especificidad más amplia que su metiltransferasa cognada, que dañaría el ADN del huésped. La evolución dirigida de nuevas especificidades en las células se complica aún más por la necesidad de proteger el ADN del huésped contra la actividad de endonucleasa recién diseñada. Por lo tanto, hay sólo unos pocos intentos exitosos de ingeniería REase reportados y todos ellos explotar las características únicas de una enzima en particular1,2,3,4,5,6,7.
Aquí proporcionamos un protocolo detallado para la ingeniería de especificidad que se puede utilizar para generar variantes de endonucleasa que tienen una especificidad más estrecha que una enzima parental que se basa en nuestra ingeniería exitosa de una endonucleasa NlaIV8. Para cualquier enzima de este tipo con una secuencia de reconocimiento arbitraria, se puede introducir una especificidad adicional para las bases en los flancos. Para las enzimas parentales que reconocen secuencias parcialmente degeneradas (como NlaIV con su objetivo GGNNCC), también se puede introducir especificidad adicional dentro de la secuencia de reconocimiento. Como es probable que la especificidad adicional requiera contactos proteico-ADN, las bases recientemente reconocidas deben estar dentro de la huella de la endonucleasa parental en el ADN. En principio, se pueden configurar esquemas de selección para cualquier especialización deseada de la secuencia de reconocimiento. Sin embargo, la mayoría de los REases que reconocen secuencias diana palindrómicas y casi palindrómicas son dimers funcionales que reconocen sólo un medio sitio del palíndromo. Por lo tanto, es poco probable que la selección de nuevas especificidades que violen la simetría de las interacciones nucleicas proteicas funcione. Para el NlaIV dimerico, por ejemplo, la secuencia GGNNCC teóricamente se puede reducir a GGATCC, pero se espera que reducir la especificidad a GGAACC sea más difícil. Nuestro esquema implica una selección positiva y negativa.
El proceso es más eficiente cuando la selección negativa también se utiliza para eliminar las especificidades capaces de cleave todas las secuencias que no sea la especificidad más estrecha preferida. Por ejemplo, la selección para GGATCC podría combinarse con la antiselección contra GGBVCC (donde B es cualquier base que no sea A, y V es cualquier base distinta de T). Cuando algunas de las posibles secuencias de destino no están cubiertas, el resultado del experimento de selección depende de la eficacia de la selección positiva y negativa. En nuestro trabajo NlaIV, seleccionamos para GGATCC, y contra GGSSCC (donde S es G o C), y obtuvimos una especificidad que, ignorando los objetivos de ruptura de simetría, podría describirse como GGWWCC (donde W es A o T), lo que sugiere que en este caso en particular, la selección negativa era más selección importante que positiva.
Nuestro enfoque comienza con la creación de un casete de selección de expresiones (ESC). El ESC se estructura en secciones. En la sección del núcleo interior, hay variantes del marco de lectura abierto (ORF) del REase, bajo el control del promotor T7. Esta sección principal del ESC no puede contener ningún sitio de cognado para el REase diseñado. El núcleo se intercala entre dos sitios de cognado para el tipo salvaje REase: un sitio de escote para la actividad no deseada (secuencia de contador seleccionada, GGSSCC en este ejemplo) y un sitio de escote para la actividad deseada (secuencia seleccionada, GGATCC en el ejemplo). El paso final de la preparación del ESC en PCR añade biotina cerca de la actividad deseada en el extremo de 5′ y crea una variedad de secuencias seleccionadas de contador (GGSSCC en el ejemplo). La estrategia de selección se basa en el uso de imprimaciones cuidadosamente diseñadas en el protocolo de reamplificación ESC después de un protocolo in vitro de transcripción/traducción/selección(Figura 1A). La biblioteca ESC se expresa en una transcripción compartimentada in vitro de traducción de la emulsión agua en aceite9,10,11. Dentro de cada gota, la especificidad de la enzima expresada afecta el estado de la ESC(Figura 1B,paso I). Para la disposición descrita, la actividad de escisión deseada de la proteína traducida elimina la etiqueta de biotina del ADN, pero no afecta al otro extremo ESC con la secuencia de contador seleccionada. Cuando se rompe la emulsión, los fragmentos biotinylados se eliminan mediante el desplegable de afinidad de estreptavidina, de modo que solo queden fragmentos de gotas con la actividad deseada(Figura 1B,paso II). Este paso elimina las variantes rease inactivas. La fracción sobrenadante del paso desplegable es entonces amplificada por PCR. En los primeros cebatos de reacción PCR se utilizan f2 y R1(Figura 1A,B,paso III). Primer F2 se une a la sección ESC entre la secuencia de contador seleccionada y el extremo de la molécula. Por lo tanto, los ESC que expresan variantes que son capaces de cortar la secuencia seleccionada del contador (y, por lo tanto, separan los sitios de unión para los imprimadores F2 y R1 en dos moléculas de ADN diferentes) no se amplifican y, por lo tanto, se eliminan de la biblioteca. El primer R1 se une entre el sitio seleccionado y el núcleo del ESC para que no se vea afectado por el estado de escisión del sitio seleccionado y restaure el sitio de escisión para la actividad deseada (GGATCC). El ciclo se cierra con un segundo PCR (con imprimaciones F1 y R2) que añade biotina en el extremo de 5′ cerca del sitio seleccionado y restaura la variación diseñada en el sitio seleccionado del contador cerca del extremo opuesto del ESC(Figura 1B,paso IV). La mezcla de ADN resultante está lista para otra ronda de selección.
El éxito del protocolo de selección depende en gran medida de la elección adecuada de la nueva secuencia de reconocimiento de objetivos más estricta y del diseño cuidadoso de la estrategia de mutagénesis y su implementación efectiva. Debido a que es mucho más fácil mejorar las ligeras preferencias preexistentes del REase que superarlas, recomendamos comenzar con un estudio cinético de cualquier preferencia preexistente. La necesidad de un diseño cuidadoso de la mutagénesis resulta del tamaño limitado de una biblioteca mutante que puede ser procesada por el protocolo presentado (109 clones en un solo experimento). Por lo tanto, las 20 posibles sustituciones de aminoácidos se pueden probar eficazmente en sólo unas pocas posiciones (ver discusión). La mutagénesis aleatoria, como la PCR propensa a errores (EP-PCR) presentada como un método alternativo, conducirá a un profundo submuestreo de la complejidad existente. Si hay disponible alguna información sobre posibles posiciones de aminoácidos implicadas en contactos con ADN (o incluso situadas cerca de los nucleótidos degenerados en una secuencia deconada), ciertamente debe utilizarse para seleccionar algunos aminoácidos para la mutagénesis de saturación guiada por oligonucleótidos (pasos de protocolo 1.6-3.10).
El protocolo de selección descrito aquí fue probado para NlaIV8, una secuencia de reconocimiento de plegado dieric-(D/E)XK que reconoce un sitio de destino palindrómico con bases NN centrales y cataliza un corte final contundente entre las bases NN. NlaIV fue recogido porque el escote entre las bases NN sugiere que estas bases están cerca de la proteína en el complejo. En principio, el protocolo podría utilizarse para cualquier restricción específica de la secuencia endonucleasa, monomérica o dimerica, de cualquier grupo de plegado, catalizando roturas de doble hebra de cualquier escalonamiento, independientemente de si los dominios catalíticos y especificidad coinciden (como en el ejemplo NlaIV) o son separados (por ejemplo, FokI). Además, el protocolo en principio es útil no sólo para la generación de nueva especificidad enzimática más estrecha, sino que también podría utilizarse para eliminar las actividades estelares, o para crear endonucleasasas de alta fidelidad. Sin embargo, todo esto aún no ha sido probado. En particular, la eliminación dirigida de la actividad estelar puede ser complicada, porque los mismos residuos de aminoácidos podrían estar involucrados en la unión a las bases deseadas y no deseadas. Los pasos in vitro descritos en este protocolo no se limitan a la selección de especificidades reducidas, sino que también podrían utilizarse para seleccionar especificidades alteradas de otro modo. Sin embargo, entonces hay un problema con las endonucleasas variantes: si el espectro de sustratos incluye nuevos objetivos no aplacados por la endonucleasa parental, en general no hay una buena manera de proteger a las células de los efectos nocivos de esta actividad. Por el contrario, si la especificidad de la endonucleasa sólo se reduce, los objetivos son un subconjunto de los objetivos de tipo silvestre, y por lo tanto la metiltransferasa cognada ya disponible debe ser totalmente protectora.
Nuestro protocolo difiere en varios aspectos de muchos protocolos de evolución dirigida. La diversidad de fotogramas de lectura abierta se genera una vez al principio del experimento, no en todas las iteraciones. Además, se crea mediante la síntesis de división y mezcla, en lugar de por EP-PCR. Para las sustituciones NNS de codones, tal como se utiliza en este trabajo, hay (4 x 4 x 2)6 x 1,07 x 109 combinaciones para seis posiciones. Por lo tanto, cualquier variante dada está presente en promedio una vez en 1,7 fmoles de ESC. Esta capacidad se puede aumentar a siete posiciones mediante el uso de síntesis con una mezcla de 20 precursores de trinucleótidos que es ofrecido por Glen Research o disminuyendo la frecuencia de mutación en posiciones menos prometedoras con síntesis de oligonucleótidos divididos y mixtos. Si es posible, se recomienda limitar el grado de variación a seis posiciones. Obviamente, este tipo de mutagénesis dirigida requiere cierto conocimiento preexistente sobre al menos las regiones del REase involucradas en la unión de sustratos. El protocolo de división y mezcla para generar diversidad tiene claras ventajas en comparación con el EEP-PCR. Utilizando el EP-PCR, obtuvimos variantes y secuencias sin cambios que llevaban ocho sustituciones para los EsC NlaIV en el mismo EP-PCR (cuadro 4). La biblioteca de EP-PCR contiene una fracción sustancial de clones que deben evitarse (secuencias de tipo salvaje, múltiples sustituciones, mutaciones de cambio de fotogramas y sin sentido, y mutaciones en lugares poco probables que afecten a la especificidad de la secuencia).
Nuestro protocolo también difiere de muchos otros protocolos de evolución dirigidos por la presencia de dos pasos de selección secuenciales. La selección positiva se asegura de que se conserva la actividad deseada, de lo contrario la etiqueta biotina no se elimina y la secuencia de codificación se puede eliminar mediante la extracción. Es técnicamente posible que la aparición fortuita de una especificidad no superesofosa no esnueva (por ejemplo, GCATGC) podría conducir a la separación de la etiqueta de biotina también, si un sitio de escote adecuado está presente cerca del escote deseado, pero no en otro lugar. Sin embargo, esto debería ser muy improbable. La selección negativa elimina los fotogramas de lectura abiertos que codifican para las enzimas que todavía tienen la actividad no deseada. Este paso no es estrictamente obligatorio, porque el protocolo todavía enriquecerá la biblioteca de salida con variantes que son capaces de cortar la secuencia de selección pero no pueden cortar en otro lugar del ESC, por lo tanto, lo que la hace inadecuada para la amplificación de PCR. Sin embargo, se espera que la eficacia de la selección sea menor porque las enzimas con la especificidad de la secuencia original no se eliminarán de la salida y superarán a las variantes prometedoras con especificidad alterada, sino también a una menor actividad enzimática. Tenga en cuenta que en el nivel de población, las secuencias de destino deseadas y no deseadas pueden, pero no es necesario, degenerar. En el ejemplo de NlaIV, el antiobjetivo era degenerado y el destino no degenerado. Incluso cuando hay degeneración a nivel de población, en una sola gota sólo está presente un objetivo (no degenerado) o un objetivo antiobjetivo. En nuestro protocolo, las secuencias de objetivo y antiobjetivo se reintroducen en cada repetición de los pasos de selección. Por lo tanto, un marco de lectura abierto debe codificar una enzima capaz de cortar todos los objetivos posibles, e incapaz de cortar ninguno de los objetivos antiobjetivos, para sobrevivir a múltiples rondas de selección. Observe que la necesidad de reintroducir el destino de antiselección en cada iteración del protocolo aplica dos PCR secuenciales. El primer PCR utiliza una imprimación que se recocido fuera del anti-objetivo, de modo que el escote del anti-objetivo previene la reacción PCR. El segundo PCR requiere una imprimación que va más allá del antiobjetivo, y reintroduce anti-target, para asegurarse de que durante múltiples rondas de selección, cada marco de lectura abierto se prueba contra todas las variantes del anti-objetivo.
Para las enzimas que generan extremos pegajosos, se puede utilizar un protocolo alternativo relacionado basado en un método descrito previamente para el aislamiento de REase ORF10. El agotamiento de las variantes inactivas por captura de biotina que se utiliza en nuestros experimentos se sustituye en el protocolo alternativo por la ligadura del adaptador compatible con una secuencia que se utiliza como sitio de enlace de imprimación en un PCR selectivo(Figura 9). Solo los ESC que producen enzimas con la especificidad seleccionada generan extremos capaces de ligar y, por lo tanto, se seleccionarán. La secuencia del extremo pegajoso de la secuencia eseleccionada del contador debe diseñarse de tal manera que no pueda participar en la ligadura con adaptadores. La iteración del proceso de selección se puede lograr fácilmente cambiando entre dos adaptadores diferentes y, en consecuencia, dos imprimaciones inversas diferentes en PCR selectivo.
Incluso con nuevos protocolos, la tarea de ingeniería de nuevas especificidades in vitro sigue siendo muy difícil. Para los REases típicos de tipo II, la especificidad de la secuencia y la actividad endonucleólítica dependen de las mismas regiones proteicas. Por lo tanto, es difícil modificar uno sin afectar al otro. El éxito se hace más probable por una estrategia que tiene en cuenta la huella de la enzima, respeta la simetría de las interacciones proteína-ADN, y se basa en las preferencias enzimáticas preexistentes, que deben determinarse por adelantado en experimentos bioquímicos, como se hizo para el ejemplo8de NlaIV.
The authors have nothing to disclose.
Este trabajo fue apoyado por las subvenciones del Ministerio de Ciencia y Educación Superior (0295/B/PO1/2008/34 a MB y N301 100 31/3043 a KS), del Centro Nacional polaco de ciencias (NCN) (UMO-2011/02/A/NZ1/00052, UMO-2014/13/B/NZ1/03991 y UMO-2014/14/M/NZ5/00558 a MB) y por beca EMBO a corto plazo a KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |