Le endonucleasi di restrizione con nuova specificità della sequenza possono essere sviluppate da enzimi che riconoscono una sequenza parzialmente degenerata. Qui forniamo un protocollo dettagliato che abbiamo usato con successo per alterare la specificità della sequenza dell’enzima NlaIV. Gli ingredienti chiave del protocollo sono la compartimentazione in vitro della reazione di trascrizione/traduzione e la selezione di varianti con nuove specificità di sequenza.
L’ingegneria della specificità di restriction endonuclease (REase) è estremamente difficile. Qui descriviamo un protocollo multifase che aiuta a produrre varianti REase che hanno una specificità più rigorosa rispetto all’enzima parentale. Il protocollo richiede la creazione di una libreria di cassette di selezione delle espressioni (ESC) per le varianti del REase, idealmente con variabilità nelle posizioni che possono influenzare il legame del DNA. L’ESC è affiancato da un lato da una sequenza per l’attività del sito di restrizione desiderata e da un tag biotina e dall’altro da un sito di restrizione per l’attività indesiderata e da un sito di accompagnamento. Gli ESC sono trascritti e tradotti in un’emulsione di acqua in olio, in condizioni che rendono improbabile la presenza di più molecole di DNA per gocciola. Pertanto, il DNA in ogni molecola di cassetta è sottoposto solo all’attività dell’enzima tradotto e codificato. Varianti REase della specificità desiderata rimuovere il tag biotina, ma non il sito di analing primer. Dopo aver rotto l’emulsione, le molecole di DNA sono sottoposte a un pulldown di biotina, e solo quelle nel soppala vengono mantenute. Questo passaggio assicura che vengano mantenuti solo gli ESC per le varianti che non hanno perso l’attività desiderata. Queste molecole di DNA sono poi sottoposte a una prima reazione PCR. Cleavage nella sequenza indesiderata taglia il sito di rilegatura primer per uno dei primers. Pertanto, PCR amplifica solo gli ESC dalle goccioline senza l’attività indesiderata. Viene quindi eseguita una seconda reazione PCR per reintrodurre il sito di restrizione per la specificità desiderata e il tag biotina, in modo che la fase di selezione possa essere ribadita. I frame di lettura aperti selezionati possono essere sovraespressi in cellule batteriche che esprimono anche la cognate metiltransferasi del REase parentale, perché il REase appena evoluto si rivolge solo a un sottoinsieme dei siti di destinazione della metiltransferasi.
L’ingegneria della specificità della sequenza è estremamente complessa per le REase di classe II. In questa classe di endonucleases, il riconoscimento della sequenza e la catalisi sono strettamente intrecciati, molto probabilmente come una salvaguardia evolutiva contro la creazione di un endonuclease di specificità più ampia rispetto alla sua cognate metiltransferase, che danneggerebbe il DNA dell’ospite. L’evoluzione diretta di nuove specificità nelle cellule è ulteriormente complicata dalla necessità di proteggere il DNA dell’ospite dalla nuova attività endonuclease. Pertanto, ci sono solo pochi tentativi riusciti di ingegneria REase segnalati e tutti sfruttano le caratteristiche uniche di un particolare enzima1,2,3,4,5,6,7.
Qui forniamo un protocollo dettagliato per l’ingegneria della specificità che può essere utilizzato per generare varianti endonuclease che hanno una specificità più stretta rispetto a un enzima parentale che si basa sulla nostra ingegneria di successo di un endonuclease NlaIV8. Per qualsiasi enzima di questo tipo con una sequenza di riconoscimento arbitrario, è possibile introdurre una specificità supplementare per le basi nei fianchi. Per gli enzimi parentali che riconoscono sequenze parzialmente degenerate (come NlaIV con il suo obiettivo GGNNCC), è possibile introdurre ulteriori specificità anche all’interno della sequenza di riconoscimento. Poiché la specificità supplementare richiederà probabilmente contatti proteina-DNA, le basi appena riconosciute dovrebbero trovarsi all’interno dell’impronta dell’endonucleano parentale sul DNA. In linea di principio, è possibile impostare schemi di selezione per qualsiasi specializzazione desiderata della sequenza di riconoscimento. Tuttavia, la maggior parte delle REase che riconoscono le sequenze bersaglio palindromo e quasi palindromo sono dimeri funzionali che riconoscono solo un semi-sito del palindromo. Pertanto, è improbabile che la selezione di nuove specificità che violano la simmetria delle interazioni nucleiche proteiche funzioni. Per il dimeric NlaIV, ad esempio, la sequenza GGNNCC può teoricamente essere ristretta a GGATCC, ma si prevede che restringere la specificità a GGAACC sia più difficile. Il nostro schema prevede una selezione sia positiva che negativa.
Il processo è più efficiente quando la selezione negativa viene utilizzata anche per rimuovere le specificità in grado di fendere tutte le sequenze diverse dalla specificità più stretta preferita. Ad esempio, la selezione per GGATCC potrebbe essere combinata con l’antiselezione con GGBVCC (dove B è una qualsiasi base diversa da A e V è qualsiasi base diversa da T). Quando alcune delle possibili sequenze target non sono coperte, il risultato dell’esperimento di selezione dipende dall’efficacia della selezione positiva e negativa. Nel nostro lavoro NlaIV, abbiamo scelto per GGATCC, e contro GGSSCC (dove S è G o C), e ottenuto una specificità che, ignorando gli obiettivi di rottura della simmetria, potrebbe essere descritto come GGWWCC (dove W è A o T), suggerendo che in questo caso particolare, la selezione negativa era più importante della selezione positiva.
Il nostro approccio inizia con la creazione di una cassetta di selezione dell’espressione (ESC). Il CES è strutturato in sezioni. Nella sezione centrale interna, ci sono varianti del frame di lettura aperto (ORF) del REase, sotto il controllo promotore T7. Questa sezione centrale del CES non può contenere alcun sito cognato per il REase progettato. Il nucleo è inserito tra due siti cognati per tipo selvaggio REase: un sito di scissione per l’attività indesiderata (contro sequenza selezionata, GGSSCC in questo esempio) e un sito di scissione per l’attività desiderata (sequenza selezionata, GGATCC nell’esempio). La fase finale della preparazione dell’ESC in PCR aggiunge biotina vicino all’attività desiderata alla fine 5′ e crea una varietà di sequenze contatore selezionate (GGSSCC nell’esempio). La strategia di selezione si basa sull’uso di primer attentamente progettati al protocollo di riamplificazione ESC dopo una trascrizione in vitro/traduzione/selezione (Figura 1A). La libreria ESC è espressa in una tramazione in vitro compartimentata trancilazione emulsione acqua-in-olio9,10,11. All’interno di ogni goccia, la specificità dell’enzima espresso influisce sullo stato dell’ESC(Figura 1B, passaggio I). Per la disposizione descritta, l’attività di scissione desiderata della proteina tradotta rimuove il tag biotina del DNA, ma non influisce sull’altra estremità ESC con la sequenza selezionata dal contatore. Quando l’emulsione viene interrotta, i frammenti biotinylati vengono rimossi dal pulldown di affinità streptavidin, in modo che rimangano solo i frammenti delle goccioline con l’attività desiderata (Figura 1B, passaggio II). Questo passaggio rimuove le varianti REase inattive. La frazione supernatante del passo pull-down viene poi amplificata dalla PCR. Nei primi primer di reazione PCR F2 e R1 sono utilizzati (Figura 1A, B, passo III). Primer F2 si lega alla sezione ESC tra la sequenza del contatore selezionato e l’estremità della molecola. Pertanto, gli ESC che esprimono varianti che sono in grado di fensciolare la sequenza selezionata del contatore (e, di conseguenza, separano i siti di legame per i primer F2 e R1 in due diverse molecole di DNA) non sono amplificate e vengono quindi rimosse dalla libreria. L’inn: R1 si lega tra il sito selezionato e il nucleo dell’ESC in modo che non sia influenzato dallo stato di scissione del sito selezionato e ripristini il sito di scissione per l’attività desiderata (GGATCC). Il ciclo è chiuso da un secondo PCR (con primer F1 e R2) che aggiunge biotina all’estremità 5′ vicino al sito selezionato e ripristina la variazione progettata nel sito selezionato vicino all’estremità opposta del CES (Figura 1B, passo IV). La miscela di DNA risultante è pronta per un altro giro di selezione.
Il successo del protocollo di selezione dipende fortemente dalla corretta scelta della nuova, più rigorosa sequenza di riconoscimento degli obiettivi e da un’attenta progettazione della strategia di mutagenesi e dalla sua effettiva attuazione. Poiché è molto più facile migliorare su lievi preferenze preesistenti del REase che superarle, si consiglia di iniziare con uno studio cinetico di tutte le preferenze preesistenti. La necessità di un’attenta progettazione della mutagenesi deriva dalle dimensioni limitate di una libreria mutata che può essere elaborata dal protocollo presentato (109 cloni in un unico esperimento). Pertanto tutte le 20 possibili sostituzioni di amminoacidi possono essere testate efficacemente solo in poche posizioni (vedi Discussione). La mutagenesi casuale, come la PCR (EP-PCR) soggetta a un errore come metodo alternativo, porterà a un profondo sottocampionamento della complessità esistente. Se sono disponibili informazioni relative a potenziali posizioni di amminoacidi coinvolti nei contatti con il DNA (o anche in prossimità dei nucleotidi degenerati in una sequenza cognata), dovrebbero certamente essere utilizzate per selezionare alcuni amminoacidi per la mutagenesi della saturazione guidata oligonucleotide (passaggi del protocollo 1.6-3.10).
Il protocollo di selezione qui descritto è stato testato per NlaIV8, una dimeric pd-(D/E)XK fold recognition sequence che riconosce un sito di destinazione palindromico con basi NN centrali e catalizza un taglio finale smussato tra le basi NN. NlaIV è stato scelto perché la scissione tra le basi NN suggerisce che queste basi sono vicine alla proteina nel complesso. In linea di principio, il protocollo potrebbe essere utilizzato per qualsiasi restrizione specifica della sequenza endonuclease, monomerico o dimeric, di qualsiasi gruppo di piegatura, catalizzando le rotture a doppio filo di qualsiasi barattolo, indipendentemente dal fatto che i domini catalitici e di specificità coincidano (come nell’esempio NlaIV) o siano separati (ad esempio, FokI). Inoltre, il protocollo in linea di principio è utile non solo per la generazione di nuove specificità enzimatiche più strette, ma potrebbe anche essere utilizzato per eliminare le attività delle stelle o per creare endonucleasi ad alta fedeltà. Tuttavia, tutto questo non è stato ancora testato. In particolare, l’eliminazione mirata dell’attività stellare può essere complicata, perché gli stessi residui di amminoacidi potrebbero essere coinvolti nel legame con le basi desiderate e indesiderate. Le fasi in vitro descritte in questo protocollo non si limitano alla selezione delle specificità ristrette, ma potrebbero anche essere utilizzate per selezionare specificità altrimenti modificate. Tuttavia, c’è poi un problema con le endonucleasi varianti: se lo spettro dei substrati include nuovi bersagli non scissi dalla endonucleasi parentale, in generale non c’è un buon modo per proteggere le cellule dagli effetti nocivi di questa attività. Al contrario, se la specificità endonuclease viene solo ridotta, gli obiettivi sono un sottoinsieme dei bersagli di tipo selvatico, e quindi il cognato metiltransferase già disponibile dovrebbe essere completamente protettivo.
Il nostro protocollo differisce per diversi aspetti da molti protocolli di evoluzione diretti. La diversità dei fotogrammi di lettura aperti viene generata una volta all’inizio dell’esperimento, non in ogni iterazione. Inoltre, è creato dalla sintesi split-and-mix, piuttosto che da EP-PCR. Per le sostituzioni NNS dei codoni, come usato in questo lavoro, ci sono (4 x 4 x 2)6 combinazioni di 1,07 x 109 per sei posizioni. Pertanto, ogni variante è presente in media una volta su 1,7 fmoles di ESC. Questa capacità può essere aumentata a sette posizioni utilizzando la sintesi con una miscela di 20 precursori di trinucleotidi che viene offerta da Glen Research o diminuendo la frequenza di mutazione in posizioni meno promettenti con la sintesi di oligonucleotidi split-and-mix. Se possibile, si raccomanda di limitare l’entità della variazione a sei posizioni. Ovviamente, tale mutagenesi di targeting richiede alcune conoscenze preesistenti su almeno le regioni del REase coinvolte nel binding del substrato. Il protocollo split-and-mix per generare diversità presenta chiari vantaggi rispetto all’EP-PCR. Utilizzando EP-PCR, abbiamo ottenuto varianti e sequenze invariate che trasportano otto sostituzioni per ESC NlaIV nello stesso EP-PCR (Tabella 4). La libreria di EP-PCR contiene una frazione sostanziale di cloni che dovrebbero essere evitati (sequenze di tipo selvaggio, sostituzioni multiple, mutazioni frameshift e senza senso e mutazioni in luoghi che difficilmente influenzano la specificità della sequenza).
Il nostro protocollo si differenzia anche da molti altri protocolli di evoluzione diretti per la presenza di due passaggi di selezione sequenziali. La selezione positiva assicura che l’attività desiderata venga mantenuta, altrimenti il tag biotina non viene rimosso e la sequenza di codifica può essere rimossa tramite pull-down. È tecnicamente possibile che l’emergere fortuito di una nuova specificità non sovrapposta (ad esempio, GCATGC) possa portare alla rottura del tag biotina, se un sito di scissione adatto è presente vicino alla scissione desiderata, ma non altrove. Tuttavia, questo dovrebbe essere altamente improbabile. La selezione negativa rimuove i frame di lettura aperti che codificano per gli enzimi che hanno ancora l’attività indesiderata. Questo passaggio non è strettamente obbligatorio, perché il protocollo arricchirà comunque la libreria di output con varianti che sono in grado di fendere la sequenza di selezione ma non in grado di fendersi altrove nell’ESC, rendendolo quindi inadatto per l’amplificazione PCR. Tuttavia, l’efficacia della selezione dovrebbe essere inferiore perché gli enzimi con la specificità della sequenza originale non verranno rimossi dall’output e supereranno le varianti promettenti con specificità alterata, ma anche una diminuzione dell’attività enzimatica. Si noti che a livello di popolazione, le sequenze di destinazione desiderate e indesiderate possono, ma non devono essere, degenerare. Nell’esempio NlaIV, l’anti-bersaglio è stato degenerato e il bersaglio non degenerato. Anche quando c’è degenerazione a livello di popolazione, in una sola goccia è presente un solo bersaglio (non degenerato). Nel nostro protocollo, le sequenze target e anti-target vengono reintrodotte ad ogni ripetizione dei passaggi di selezione. Pertanto, un telaio di lettura aperto deve codificare un enzima in grado di fendere tutti i possibili bersagli, e incapace di fendere uno qualsiasi degli anti-bersagli, per sopravvivere a più round di selezione. Si noti che la necessità di reintrodurre la destinazione antiselezione a ogni iterazione del protocollo impone due PCR sequenziali. Il primo PCR utilizza un primer che anneals al di fuori del anti-bersaglio, in modo che la scissione dell’anti-bersaglio previene la reazione PCR. Il secondo PCR richiede un primer che va oltre l’anti-bersaglio e reintroduce l’anti-bersaglio, per assicurarsi che durante più round di selezione, ogni frame di lettura aperto venga testato rispetto a tutte le varianti dell’anti-bersaglio.
Per gli enzimi che generano estremità appiccicose, è possibile utilizzare un protocollo alternativo correlato basato su un metodo descritto in precedenza per l’isolamento di REase ORF10. L’esaurimento delle varianti inattive da parte dell’acquisizione di biotina utilizzata nei nostri esperimenti viene sostituita nel protocollo alternativo dalla legatura dell’adattatore compatibile con una sequenza utilizzata come sito di associazione di primer in un PCR selettivo (Figura 9). Solo gli ESC che producono enzimi con la specificità selezionata generano estremità che supportano la legatura e saranno pertanto selezionate. La sequenza dell’estremità appiccicosa della sequenza contatore eselected deve essere progettata in modo tale da non poter partecipare alla legatura con gli adattatori. L’iterazione del processo di selezione può essere facilmente ottenuta passando da due adattatori diversi e di conseguenza due diverse primer inverse nella PCR selettiva.
Anche con nuovi protocolli, il compito di ingegneria nuove specificità in vitro è ancora molto impegnativo. Per le REase di tipo tipico II, la specificità della sequenza e l’attività endonucleolitica dipendono dalle stesse regioni proteiche. È quindi difficile modificare l’uno senza influenzare l’altro. Il successo è reso più probabile da una strategia che tiene conto dell’impronta dell’enzima, rispetta la simmetria delle interazioni proteina-DNA e si basa su preferenze enzimatiche preesistenti, che dovrebbero essere determinate in anticipo negli esperimenti biochimici, come è stato fatto per l’esempio NlaIV8.
The authors have nothing to disclose.
Questo lavoro è stato sostenuto dalle sovvenzioni del Ministero della Scienza e dell’Istruzione Superiore (0295/B/PO1/2008/34 a MB e N301 100 31/3043 a KS), dal Centro Nazionale Polacco (NCN) (UMO-2011/02/A/N UMO-2014/13/B/N-1/03991 e UMO-2014/14/M/N’5/00558 a MB) e con borsa di studio EMBO a breve termine a KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |