Endonucleases de restrição com nova especificidade de seqüência podem ser desenvolvidas a partir de enzimas que reconhecem uma seqüência parcialmente degenerada. Aqui fornecemos um protocolo detalhado que usamos com sucesso para alterar a especificidade da seqüência da enzima NlaIV. Os ingredientes-chave do protocolo são a compartimentação in vitro da reação de transcrição/tradução e a seleção de variantes com novas especificidades de seqüência.
A engenharia de especificidade de endonuclease de restrição (REase) é extremamente difícil. Aqui descrevemos um protocolo multipasso que ajuda a produzir variantes REase que têm especificidade mais rigorosa do que a enzima parental. O protocolo requer a criação de uma biblioteca de de seleção de expressão (ESCs) para variantes do REase, idealmente com variabilidade em posições susceptíveis de afetar a ligação de DNA. O ESC é flanqueado de um lado por uma seqüência para a atividade do local de restrição desejada e uma etiqueta de biotina e do outro lado por um local de restrição para a atividade indesejada e um local de recozimento de primer. Os ESCs são transcritos e traduzidos em uma emulsão de água no óleo, em condições que tornam improvável a presença de mais de uma molécula de DNA por gota. Portanto, o DNA em cada molécula é submetido apenas à atividade da enzima traduzida e codificada. As variantes REase da especificidade desejada removem a etiqueta de biotina, mas não o local de recozimento do primer. Após a quebra da emulsão, as moléculas de DNA são submetidas a uma retração de biotina, e apenas as do sobrenadante são retidas. Esta etapa garante que apenas ESCs para variantes que não perderam a atividade desejada sejam mantidos. Essas moléculas de DNA são então submetidas a uma primeira reação de PCR. O decote na seqüência indesejada corta o local de ligação do primer para um dos primers. Portanto, o PCR amplifica apenas ESCs de gotículas sem a atividade indesejada. Uma segunda reação de PCR é então realizada para reintroduzir o local de restrição para a especificidade desejada e a tag de biotina, para que a etapa de seleção possa ser reiterada. Quadros de leitura abertos selecionados podem ser superexpressos em células bacterianas que também expressam a metiltransferência de cognato do REase parental, porque o REase recém-evoluído tem como alvo apenas um subconjunto dos locais-alvo da metiltransferase.
A engenharia de especificidade de seqüência é extremamente desafiadora para rEases classe II. Nesta classe de endonucleases, o reconhecimento de seqüências e a catálise estão intimamente entrelaçados, provavelmente como uma salvaguarda evolutiva contra a criação de uma endonuclease de especificidade mais ampla do que sua metiltransferência de cognato, o que danificaria o DNA do hospedeiro. A evolução dirigida de novas especificidades nas células é ainda mais complicada pela necessidade de proteger o DNA do hospedeiro contra a atividade de endonuclease recém-projetada. Portanto, há apenas algumas tentativas bem sucedidas de engenharia REase relatadas e todas elas exploram as características únicas de uma enzima particular1,,2,,3,4,5,6,7.
Aqui fornecemos um protocolo detalhado para engenharia de especificidade que pode ser usado para gerar variantes de endonuclease que têm especificidade mais estreita do que uma enzima parental que se baseia em nossa engenharia bem sucedida de endonuclease NlaIV8. Para qualquer enzima com uma seqüência de reconhecimento arbitrário, uma especificidade extra pode ser introduzida para bases nos flancos. Para enzimas parentais que reconhecem sequências parcialmente degeneradas (como NlaIV com seu alvo GGNNCC), uma especificidade adicional também pode ser introduzida dentro da seqüência de reconhecimento. Como a especificidade extra provavelmente exigirá contatos de Proteína-DNA, as bases recém-reconhecidas devem estar dentro da pegada da endonuclease parental no DNA. Em princípio, os esquemas de seleção podem ser configurados para qualquer especialização desejada da seqüência de reconhecimento. No entanto, a maioria dos REases que reconhecem sequências de alvo palindômicas e quase palindômicas são dimers funcionais que reconhecem apenas um meio-local do palíndromo. Assim, é improvável que a seleção de novas especificidades que violem a simetria das interações nucleicas proteicas funcione. Para o NlaIV dimérico, por exemplo, a seqüência GGNNCC pode teoricamente ser reduzida ao GGATCC, mas reduzir a especificidade para GGAACC é esperado ser mais difícil. Nosso esquema envolve seleção positiva e negativa.
O processo é mais eficiente quando a seleção negativa também é usada para remover as especificidades capazes de cirizar todas as seqüências que não a especificidade mais estreita preferida. Por exemplo, a seleção para GGATCC pode ser combinada com antisseleção contra GGBVCC (onde B é qualquer base diferente de A, e V é qualquer base diferente de T). Quando algumas das possíveis seqüências de alvo não são cobertas, o resultado do experimento de seleção depende da eficácia da seleção positiva e negativa. Em nosso trabalho nlaIV, selecionamos para GGATCC, e contra GGSSCC (onde S é G ou C), e obtivemos uma especificidade que, ignorando metas de quebra de simetria, poderia ser descrita como GGWWCC (onde W é A ou T), sugerindo que neste caso específico, a seleção negativa era mais importante do que a seleção positiva.
Nossa abordagem começa com a criação de um de seleção de expressão (ESC). O ESC está estruturado em seções. Na seção interna do núcleo, há variantes do quadro de leitura aberta (ORF) do REase, o controle do promotor T7. Esta seção central do ESC não pode conter qualquer local cognato para o REase projetado. O núcleo é sanduíche entre dois locais cognatos para o tipo selvagem REase: um site de decote para a atividade indesejada (seqüência de contador selecionado, GGSCCneste exemplo) e um site de decote para a atividade desejada (seqüência selecionada, GGATCC no exemplo). A etapa final da preparação do ESC em PCR adiciona biotina próxima à atividade desejada no final de 5′ e cria uma variedade de seqüências de contra-selecionados (GGSSCC no exemplo). A estratégia de seleção baseia-se no uso de primers cuidadosamente projetados no protocolo de reamplificação ESC após um protocolo de transcrição/tradução/seleção in vitro(Figura 1A). A biblioteca ESC é expressa em uma transcrição compartimentalizada in vitro tradução água-em-óleo emulsão9,10,11. Dentro de cada gotícula, a especificidade da enzima expressa afeta o estado da ESC (Figura 1B, passo I). Para o arranjo descrito, a atividade desejada de decote da proteína traduzida remove a etiqueta de biotina do DNA, mas não afeta a outra extremidade ESC com a seqüência do contador selecionado. Quando a emulsão é quebrada, fragmentos biotinylados são removidos por streptavidin affinity pulldown, de modo que apenas fragmentos de gotículas com a atividade desejada permanecem (Figura 1B, passo II). Esta etapa remove variantes REase inativas. A fração sobrenadante do passo pull-down é então amplificada por PCR. Nas primeiras revezas pcr são utilizados os primers F2 e R1 (Figura 1A,B, passo III). O primer F2 liga-se à seção ESC entre a seqüência do contador selecionada e a extremidade da molécula. Portanto, os ESCs que expressam variantes capazes de afiar a seqüência de contador selecionado (e, portanto, separar os locais de ligação para primers F2 e R1 em duas moléculas de DNA diferentes) não são amplificados e são assim removidos da biblioteca. O primer R1 se liga entre o local selecionado e o núcleo do ESC para que ele não seja afetado pelo status do decote do local selecionado e restaure o local do decote para a atividade desejada (GGATCC). O ciclo é fechado por um segundo PCR (com primers F1 e R2) que adiciona biotina na extremidade de 5′ perto do local selecionado e restaura a variação projetada no balcão selecionado local próximo à extremidade oposta do ESC (Figura 1B, passo IV). A mistura de DNA resultante está pronta para outra rodada de seleção.
O sucesso do protocolo de seleção depende fortemente da escolha adequada da nova e mais rigorosa seqüência de reconhecimento de alvo e do design cuidadoso da estratégia de mutagênese e sua implementação eficaz. Como é muito mais fácil melhorar as preferências preexistentes do REase do que superá-las, recomendamos começar com um estudo cinético de quaisquer preferências pré-existentes. A necessidade de um design de mutagênese cuidadoso resulta do tamanho limitado de uma biblioteca mutante que pode ser processada pelo protocolo apresentado (109 clones em um único experimento). Portanto, todas as 20 possíveis substituições de aminoácidos podem ser efetivamente testadas em apenas algumas posições (ver Discussão). Mutagêneses aleatórias, como pcr propenso a erros (EP-PCR) apresentados como um método alternativo, levarão a uma profunda subamostragem da complexidade existente. Se alguma informação sobre potenciais posições de aminoácidos envolvidas em contatos com DNA (ou mesmo localizada em uma proximidade com os nucleotídeos degenerados em uma seqüência de cognato) certamente deve ser usada para selecionar alguns aminoácidos para saturação guiada por oligonucleotídeos mutagênese (passos de protocolo 1.6-3.10).
O protocolo de seleção descrito aqui foi testado para NlaIV8, uma seqüência de reconhecimento de dobra pd-(D/E)XK dimérica que reconhece um local de destino palindômico com bases nn centrais e catalisa um corte de extremidade sem corte entre as bases NN. NlaIV foi escolhido porque o decote entre as bases NN sugere que essas bases estão próximas da proteína no complexo. Em princípio, o protocolo pode ser usado para qualquer seqüência específica de restrição endonuclease, monomérica ou dimeric, de qualquer grupo dobrável, catalisando quebras duplas de fios de qualquer cambalhota, independentemente de os domínios catalíticos e de especificidade coincidirem (como no exemplo NlaIV) ou são separados (por exemplo, FokI). Além disso, o protocolo em princípio é útil não apenas para a geração de novas especificidades enzimáticas mais estreitas, mas também poderia ser usado para eliminar atividades estelares, ou para criar endonucleases de alta fidelidade. No entanto, tudo isso ainda não foi testado. Em particular, a eliminação direcionada da atividade estelar pode ser complicada, porque os mesmos resíduos de aminoácidos podem estar envolvidos na ligação às bases desejadas e indesejadas. As etapas in vitro descritas neste protocolo não se limitam à seleção de especificidades reduzidas, mas também podem ser usadas para selecionar especificidades alteradas de outra forma. No entanto, há então um problema com endonucleases variantes: se o espectro de substratos inclui novos alvos não cortados pela endonuclease parental, não há, em geral, uma boa maneira de proteger as células dos efeitos nocivos dessa atividade. Em contraste, se a especificidade da endonuclease for reduzida apenas, os alvos são um subconjunto dos alvos do tipo selvagem e, portanto, o cognato metiltransferase já disponível deve ser totalmente protetor.
Nosso protocolo difere em vários aspectos de muitos protocolos de evolução direcionados. A diversidade de quadros de leitura aberta é gerada uma vez no início do experimento, não em todas as iterações. Além disso, é criado por síntese split-and-mix, em vez de por EP-PCR. Para substituições nns de códons, como usado neste trabalho, há (4 x 4 x 2)6 ~ 1,07 x 109 combinações para seis posições. Portanto, qualquer variante está presente em média uma vez em 1,7 fmoles de ESC. Essa capacidade pode ser aumentada para sete posições usando a síntese com uma mistura de 20 precursores trinucleotídeos que é oferecida pela Glen Research ou diminuindo a frequência de mutação em posições menos promissoras com síntese de oligonucleotídeos split-and-mix. Se possível, recomenda-se limitar a extensão da variação a seis posições. Obviamente, tal alvo de mutagênese requer algum conhecimento preexistente sobre pelo menos as regiões da REase envolvidas na ligação do substrato. O protocolo split-and-mix para gerar diversidade tem claras vantagens em comparação com o EP-PCR. Utilizando EP-PCR, obtivemos variantes e seqüências inalteradas que carregam oito substituições para ESCs NlaIV no mesmo EP-PCR (Tabela 4). A biblioteca do EP-PCR contém uma fração substancial de clones que devem ser evitados (seqüências de tipo selvagem, múltiplas substituições, frameshift e mutações sem sentido, e mutações em lugares improváveis de afetar a especificidade da seqüência).
Nosso protocolo também difere de muitos outros protocolos de evolução direcionados pela presença de duas etapas de seleção sequencial. A seleção positiva garante que a atividade desejada seja retida, caso contrário, a etiqueta de biotina não será removida e a seqüência de codificação pode ser removida por pull-down. É tecnicamente possível que o surgimento fortuito de uma especificidade nova e não sobreposta (por exemplo, GCATGC) possa levar ao severção da etiqueta de biotina também, se um local de decote adequado estiver presente perto do decote desejado, mas não em outro lugar. No entanto, isso deve ser altamente improvável. A seleção negativa remove quadros de leitura abertos que codificam enzimas que ainda têm a atividade indesejada. Esta etapa não é estritamente obrigatória, pois o protocolo ainda enriquecerá a biblioteca de saída com variantes que são capazes de cortar a seqüência de seleção, mas não são capazes de cortar em outros lugares do ESC, tornando-a inadequada para amplificação pcr. No entanto, espera-se que a eficácia da seleção seja menor porque as enzimas com a especificidade da seqüência original não serão removidas da saída e superarão as variantes promissoras com especificidade alterada, mas também diminuírão a atividade enzimática. Note que, no nível populacional, tanto as seqüências de alvo desejadas quanto indesejadas podem, mas não precisam ser, degeneradas. No exemplo nlaiv, o anti-alvo era degenerado e o alvo não degenerado. Mesmo quando há degeneração no nível populacional, em uma única gotícula apenas um alvo (não degenerado) ou anti-alvo está presente. Em nosso protocolo, seqüências de alvo e anti-alvo são reintroduzidas a cada repetição das etapas de seleção. Portanto, um quadro de leitura aberto deve codificar uma enzima capaz de cachar todos os alvos possíveis, e incapaz de cachar qualquer um dos anti-alvos, para sobreviver a múltiplas rodadas de seleção. Observe que a necessidade de reintroduzir a meta de antisseleção em cada iteração do protocolo impõe dois PCRs seqüenciais. O primeiro PCR usa um primer que anneals fora do anti-alvo, de modo que o decote do anti-alvo previne a reação pcr. O segundo PCR requer um primer que ultrapasse o anti-alvo, e reintroduz o anti-alvo, para garantir que durante várias rodadas de seleção, cada quadro de leitura aberto seja testado contra todas as variantes do anti-alvo.
Para enzimas que geram extremidades pegajosas, um protocolo alternativo relacionado baseado em um método previamente descrito para o isolamento do REase ORF10 pode ser usado. O esgotamento das variantes inativas pela captura de biotina que é usada em nossos experimentos é substituído no protocolo alternativo pela ligadura do adaptador compatível com uma seqüência que é usada como um local de ligação de primer em um PCR seletivo(Figura 9). Apenas AS ESCs que produzem enzimas com a especificidade selecionada geram extremidades capazes de ligadura e, portanto, serão selecionadas. A seqüência da extremidade pegajosa da seqüência eselecionada do contador deve ser projetada de tal forma que não possa participar da ligadura com adaptadores. A iteração do processo de seleção pode ser facilmente alcançada alternando entre dois adaptadores diferentes e, consequentemente, dois primers reversos diferentes em PCR seletivo.
Mesmo com novos protocolos, a tarefa de criar novas especificidades in vitro ainda é muito desafiadora. Para as reases do tipo II típicas, a especificidade da seqüência e a atividade endonucleolítica dependem das mesmas regiões proteicas. É, portanto, difícil alterar um sem afetar o outro. O sucesso é mais provável por uma estratégia que leva em conta a pegada da enzima, respeita a simetria das interações proteína-DNA e se baseia em preferências enzimáticas pré-existentes, que devem ser determinadas antecipadamente em experimentos bioquímicos, como foi feito para o exemplo NlaIV8.
The authors have nothing to disclose.
Este trabalho foi apoiado pelas bolsas do Ministério da Ciência e Ensino Superior (0295/B/PO1/2008/34 ao MB e N301 100 31/3043 à KS), do Centro Nacional de Ciência da Polônia (NCN) (UMO-2011/02/A/NZ1/00052, UMO-2014/13/B/NZ1/03991 e UMO-2014/14/M/NZ5/00558 à MB) e por bolsa EMBO de curto prazo à KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |