De endonucleases van de beperking met nieuwe opeenvolgingsspecificiteit kunnen van enzymen worden ontwikkeld die een gedeeltelijk gedegenereerde opeenvolging erkennen. Hier bieden we een gedetailleerd protocol dat we met succes gebruikt om de volgorde specificiteit van NlaIV enzym te veranderen. De belangrijkste ingrediënten van het protocol zijn de in vitro compartimentering van de transcriptie/vertaalreactie en selectie van varianten met nieuwe sequentiespecifiekekenmerken.
Beperking endonuclease (REase) specificiteit engineering is uiterst moeilijk. Hier beschrijven we een multistep protocol dat helpt bij het produceren van REase-varianten die een strengere specificiteit hebben dan het ouderlijke enzym. Het protocol vereist de oprichting van een bibliotheek van expressie selectie cassettes (EsCs) voor varianten van de REase, idealiter met variabiliteit in posities die waarschijnlijk dna-binding beïnvloeden. De ESC wordt aan de ene kant geflankeerd door een sequentie voor de gewenste beperkingssiteactiviteit en een biotine-tag en aan de andere kant door een beperkingssite voor de ongewenste activiteit en een primerannealing-site. De SER’s worden getranscribeerd en vertaald in een water-in-olie emulsie, in omstandigheden die de aanwezigheid van meer dan een DNA-molecuul per druppel onwaarschijnlijk maken. Daarom wordt het DNA in elk cassettemolecuul alleen onderworpen aan de activiteit van het vertaalde, gecodeerde enzym. REase varianten van de gewenste specificiteit verwijderen de biotine tag, maar niet de primer annealing site. Na het breken van de emulsie worden de DNA-moleculen onderworpen aan een biotine pulldown, en alleen die in de supernatant worden behouden. Deze stap zorgt ervoor dat alleen SER’s voor varianten die de gewenste activiteit niet hebben verloren, behouden blijven. Deze DNA-moleculen worden vervolgens onderworpen aan een eerste PCR-reactie. Decolleté in de ongewenste volgorde snijdt de primer binding site voor een van de primers. Daarom versterkt PCR alleen SPC’s van druppels zonder de ongewenste activiteit. Vervolgens wordt een tweede PCR-reactie uitgevoerd om de beperkingssite opnieuw in te voeren voor de gewenste specificiteit en de biotinetag, zodat de selectiestap kan worden herhaald. Geselecteerde open leesframes kunnen worden overuitgedrukt in bacteriële cellen die ook de cognate methyltransferase van de ouderlijke REase uitdrukken, omdat de nieuw ontwikkelde REase zich richt op slechts een subset van de methyltransferase doellocaties.
Sequentie specificiteit engineering is zeer uitdagend voor klasse II REases. In deze klasse van endonucleases zijn sequentieherkenning en katalyse nauw met elkaar verweven, waarschijnlijk als een evolutionaire bescherming tegen het creëren van een endonuclease van bredere specificiteit dan zijn cognate methyltransferase, die gastheer-DNA zou beschadigen. Gerichte evolutie van nieuwe bijzonderheden in cellen wordt verder bemoeilijkt door de noodzaak om gastheer-DNA te beschermen tegen de nieuw ontworpen endonuclease-activiteit. Daarom zijn er slechts een paar succesvolle pogingen van REase engineering gemeld en ze allemaal gebruik maken van de unieke kenmerken van een bepaald enzym1,2,3,4,5,6,7.
Hier bieden we een gedetailleerd protocol voor specificiteit engineering die kan worden gebruikt om endonuclease varianten die smallere specificiteit dan een ouderlijk enzym dat is gebaseerd op onze succesvolle engineering van een NlaIV endonuclease8te genereren. Voor een dergelijk enzym met een willekeurige herkenningssequentie kan extra specificiteit worden ingevoerd voor basissen in de flanken. Voor ouderlijke enzymen die gedeeltelijk gedegenereerde sequenties herkennen (zoals NlaIV met zijn GGNNCC-doel), kan ook extra specificiteit worden geïntroduceerd binnen de herkenningsreeks. Aangezien extra specificiteit waarschijnlijk eiwit-DNA contacten vereist, moeten de nieuw erkende bases binnen de voetafdruk van de ouderlijke endonuclease op DNA liggen. In principe kunnen selectieschema’s worden opgezet voor elke gewenste specialisatie van de herkenningsreeks. Echter, de meeste REases die palindromische en bijna palindrische doelsequenties herkennen zijn functionele dimers die slechts een halve locatie van het palindroom herkennen. Daarom is het onwaarschijnlijk dat de selectie van nieuwe specifieke kenmerken die de symmetrie van eiwitnucleïneinteracties schenden, zal werken. Voor de dimeric NlaIV, bijvoorbeeld, de GGNNCC sequentie kan theoretisch worden beperkt tot GGATCC, maar vernauwing van de specificiteit tot GGAACC zal naar verwachting moeilijker zijn. Onze regeling omvat zowel positieve als negatieve selectie.
Het proces is efficiënter wanneer negatieve selectie ook wordt gebruikt om de specificiteiten te verwijderen die in staat zijn om alle andere sequenties dan de gewenste smallere specificiteit te splijten. Selectie voor GGATCC kan bijvoorbeeld worden gecombineerd met antiselectie tegen GGBVCC (waarbij B een andere basis dan A is en V een andere basis dan T). Wanneer sommige van de mogelijke doelsequenties niet worden gedekt, hangt de uitkomst van het selectieexperiment af van de effectiviteit van positieve en negatieve selectie. In ons NlaIV-werk hebben we gekozen voor GGATCC, en tegen GGSSCC (waar S G of C is), en kregen we een specificiteit die, het negeren van symmetriebrekende doelen, kan worden omschreven als GGWWCC (waar W A of T is), wat suggereert dat in dit specifieke geval negatieve selectie meer belangrijker dan positieve selectie.
Onze aanpak begint met het maken van een expression selection cassette (ESC). Het ESC is gestructureerd in secties. Op de binnenkant kern sectie, zijn er varianten van de open leesframe (ORF) van de REase, onder T7 promotor controle. Dit kerngedeelte van de ESC mag geen cognate site bevatten voor de engineered REase. De kern is ingeklemd tussen twee cognate sites voor wild type REase: een splitsing site voor de ongewenste activiteit (teller geselecteerde volgorde, GGSSCC in dit voorbeeld) en een splitsing site voor de gewenste activiteit (geselecteerde volgorde, GGATCC in het voorbeeld). De laatste stap van de voorbereiding van de ESC in PCR voegt biotine dicht bij de gewenste activiteit aan het 5′-einde en creëert een verscheidenheid aan tegengeselecteerde sequenties (GGSSCC in het voorbeeld). De selectiestrategie is gebaseerd op het gebruik van zorgvuldig ontworpen primers in het ESC-reamplification-protocol na een in vitro transcriptie/vertaal-/selectieprotocol (figuur 1A). De ESC-bibliotheek wordt uitgedrukt in een in vitro gecompartimenteerde transcriptie vertaling water-in-olie emulsie9,10,11. Binnen elke druppel beïnvloedt de specificiteit van het uitgedrukte enzym de toestand van de ESC (figuur 1B, stap I). Voor de beschreven regeling verwijdert de gewenste decolletéactiviteit van het vertaalde eiwit de biotinetag van het DNA, maar heeft het geen invloed op het andere ESC-einde met de door de teller geselecteerde sequentie. Wanneer de emulsie wordt verbroken, worden biotinylated fragmenten verwijderd door streptavidine affinity pulldown, zodat alleen fragmenten van druppels met de gewenste activiteit overblijven (Figuur 1B,stap II). Met deze stap worden inactieve REase-varianten verwijderd. De supernatant fractie van de pull-down stap wordt vervolgens versterkt door PCR. In de eerste PCR reactie primers F2 en R1 worden gebruikt(Figuur 1A,B, stap III). Primer F2 bindt zich aan de ESC-sectie tussen de geselecteerde volgorde en het molecuuluiteinde. Daarom worden Ser’s die varianten uitdrukken die in staat zijn om de geselecteerde volgorde van de teller te splijten (en daarom de bindingsplaatsen voor primers F2 en R1 in twee verschillende DNA-moleculen te scheiden) niet versterkt en worden ze dus uit de bibliotheek verwijderd. De primer R1 bindt tussen de geselecteerde site en de kern van het ESC, zodat deze niet wordt beïnvloed door de splitsingsstatus van de geselecteerde site en de decolletésite herstelt voor de gewenste activiteit (GGATCC). De cyclus wordt afgesloten door een tweede PCR (met primers F1 en R2) die biotine toevoegt aan het 5′-uiteinde dicht bij de geselecteerde site en herstelt ontworpen variatie op de geselecteerde teller plaats dicht bij het andere uiteinde van de ESC (Figuur 1B, stap IV). Het resulterende DNA mengsel is klaar voor een nieuwe selectieronde.
Het succes van het selectieprotocol hangt sterk af van de juiste keuze van de nieuwe, strengere doelherkenningsvolgorde en van een zorgvuldig ontwerp van de mutagenesestrategie en de effectieve uitvoering ervan. Omdat het veel gemakkelijker is om te verbeteren op lichte reeds bestaande voorkeuren van de REase dan om ze te overwinnen, raden we aan om te beginnen met een kinetische studie van eventuele reeds bestaande voorkeuren. De noodzaak van zorgvuldig mutagenese ontwerp vloeit voort uit de beperkte omvang van een gemuteerde bibliotheek die kan worden verwerkt door het gepresenteerde protocol (109 klonen in een enkel experiment). Daarom kunnen alle 20 mogelijke aminozuursubstituties effectief in slechts een paar posities worden getest (zie Bespreking). Willekeurige mutagenese, zoals foutgevoelige PCR (EP-PCR) gepresenteerd als een alternatieve methode, zal leiden tot diepgaande onderbemonstering van de bestaande complexiteit. Als er informatie beschikbaar is over mogelijke aminozuurposities die betrokken zijn bij contacten met DNA (of zelfs in de nabijheid van de gedegenereerde nucleotiden in een cognate sequentie) beschikbaar is, moet het zeker worden gebruikt om een paar aminozuren te selecteren voor oligonucleotide geleide verzadigingmutagenese (protocolstappen 1.6-3.10).
Het selectieprotocol dat hier wordt beschreven, is getest op NlaIV8, een dimeric PD-(D/E)XK-vouwherkenningssequentie die een palindromische doellocatie met centrale NN-basen herkent en een botte eindsnede tussen de NN-bases katalyseert. NlaIV werd geplukt omdat decolleté tussen de NN-bases suggereert dat deze basen dicht bij het eiwit in het complex liggen. In principe kan het protocol worden gebruikt voor elke sequentiespecifieke beperking endonuclease, monomeric of dimeric, van elke vouwgroep, waarbij dubbele strengbreuken van elke stagger worden gekaald, ongeacht of katalytische en specificiteitsdomeinen samenvallen (zoals in het NlaIV-voorbeeld) of afzonderlijk zijn (bijvoorbeeld FokI). Bovendien is het protocol in principe niet alleen nuttig voor het genereren van nieuwe, meer enge enzymspecificiteit, maar kan het ook worden gebruikt om steractiviteiten te elimineren of om high fidelity endonucleases te creëren. Dit alles is echter nog niet getest. Met name gerichte eliminatie van steractiviteit kan ingewikkeld zijn, omdat dezelfde aminozuurresiduen betrokken kunnen zijn bij het binden aan de gewenste en ongewenste basen. De in vitro stappen die in dit protocol worden beschreven, zijn niet beperkt tot de selectie van verkleinde specificiteiten, maar kunnen ook worden gebruikt om anders gewijzigde specifieke kenmerken te selecteren. Er is dan echter een probleem met variant endonucleases: als het spectrum van substraten nieuwe doelen bevat die niet door de ouderlijke endonuclease worden gespleten, is er over het algemeen geen goede manier om cellen te beschermen tegen de schadelijke effecten van deze activiteit. Als de specificiteit van endonuclease daarentegen slechts wordt verkleind, zijn de doelstellingen een subset van de wilde typedoelen, en daarom moet het reeds beschikbare cognate methyltransferase volledig beschermend zijn.
Ons protocol verschilt in verschillende opzichten van veel gerichte evolutieprotocollen. Open leesframediversiteit wordt eenmaal gegenereerd aan het begin van het experiment, niet in elke iteratie. Bovendien wordt het gemaakt door split-and-mix synthese, in plaats van door EP-PCR. Voor NNS-vervangingen van codons, zoals gebruikt in dit werk, zijn er (4 x 4 x 2)6 ~ 1,07 x 109 combinaties voor zes posities. Daarom is een bepaalde variant gemiddeld eenmaal aanwezig in 1,7 fmoles van ESC. Deze capaciteit kan worden verhoogd tot zeven posities door synthese te gebruiken met een mengsel van 20 trinucleotide precursoren die worden aangeboden door Glen Research of door de mutatiefrequentie te verlagen in minder veelbelovende posities met split-and-mix oligonucleotide synthese. Indien mogelijk wordt aanbevolen om de mate van variatie te beperken tot zes posities. Uiteraard vereist een dergelijke mutagenese targeting enige reeds bestaande kennis over ten minste de regio’s van de REase die betrokken zijn bij substraatbinding. Het split-and-mix protocol om diversiteit te genereren heeft duidelijke voordelen ten opzichte van EP-PCR. Met behulp van EP-PCR verkregen we ongewijzigde varianten en sequenties met acht vervangingen voor NlaIV ESC’s in dezelfde EP-PCR (tabel 4). De bibliotheek van EP-PCR bevat een aanzienlijke fractie van klonen die moeten worden vermeden (wilde type sequenties, meerdere vervangingen, frameshift en onzin mutaties, en mutaties op plaatsen die waarschijnlijk niet van invloed zijn volgorde specificiteit).
Ons protocol verschilt ook van vele andere gerichte evolutieprotocollen door de aanwezigheid van twee opeenvolgende selectiestappen. Positieve selectie zorgt ervoor dat de gewenste activiteit behouden blijft, anders wordt de biotinetag niet verwijderd en kan de coderingsvolgorde worden verwijderd door pull-down. Het is technisch mogelijk dat de toevallige opkomst van een nieuwe, niet-overlappende specificiteit (bijvoorbeeld GCATGC) ook zou kunnen leiden tot het verbreken van de biotinetag, als er een geschikte decolletéplaats aanwezig is in de buurt van het gewenste decolleté, maar niet elders. Dit zou echter hoogst onwaarschijnlijk moeten zijn. Negatieve selectie verwijdert open leesframes die coderen voor enzymen die nog steeds de ongewenste activiteit hebben. Deze stap is niet strikt verplicht, omdat het protocol de uitvoerbibliotheek nog steeds zal verrijken met varianten die in staat zijn om de selectiereeks te splijten, maar niet in staat zijn om zich elders in het ESC te kloven, waardoor het ongeschikt is voor PCR-versterking. De selectieeffectiviteit zal naar verwachting echter lager zijn omdat enzymen met de oorspronkelijke sequentiespecificiteit niet uit de output zullen worden verwijderd en veelbelovende varianten met gewijzigde specificiteit zullen overtreffen, maar ook verminderde enzymatische activiteit. Merk op dat op populatieniveau zowel gewenste als ongewenste doelsequenties kunnen, maar niet hoeven te zijn, ontaarden. In het NlaIV-voorbeeld werd het antidoel gedegenereerde en werd het doel niet gedegenereerde. Zelfs wanneer er sprake is van degeneratie op bevolkingsniveau, is in één druppel slechts één (niet-gedegenereerde) doelstelling of anti-target aanwezig. In ons protocol worden doel- en doelsequenties opnieuw geïntroduceerd bij elke herhaling van de selectiestappen. Daarom moet een open leesframe een enzym coderen dat alle mogelijke doelen kan splijten en niet in staat is om een van de antidoelen te splijten om meerdere selectierondes te overleven. Merk op dat de noodzaak om het antiselectiedoel opnieuw in te voeren bij elke iteratie van het protocol twee opeenvolgende CDR’s afdwingt. De eerste PCR maakt gebruik van een primer die uitvalt buiten het anti-doel, zodat decolleté van het anti-doel de PCR-reactie voorkomt. De tweede PCR vereist een primer die verder reikt dan de anti-target, en herintroduceert anti-target, om ervoor te zorgen dat tijdens meerdere rondes van de selectie, elk open leesframe wordt getest tegen alle varianten van de anti-target.
Voor enzymen die kleverige uiteinden genereren, kan een gerelateerd alternatief protocol op basis van een eerder beschreven methode voor isolatie van REase ORF10 worden gebruikt. De uitputting van inactieve varianten door biotine-opvang die in onze experimenten wordt gebruikt, wordt in het alternatieve protocol vervangen door ligatie van de compatibele adapter met een sequentie die wordt gebruikt als primerbindingssite in een selectieve PCR (figuur 9). Alleen SER’s die enzymen produceren met de geselecteerde specificiteit genereren ligatie-geschikte uiteinden en zullen daarom worden geselecteerd. De volgorde van het kleverige uiteinde van de tegengeselecteerde reeks moet zodanig zijn ontworpen dat het niet kan deelnemen aan ligatie met adapters. Iteratie van het selectieproces kan eenvoudig worden bereikt door te schakelen tussen twee verschillende adapters en dus twee verschillende reverse primers in selectieve PCR.
Zelfs met nieuwe protocollen, de taak van engineering nieuwe specifieke kenmerken in vitro is nog steeds zeer uitdagend. Voor typische type II REases zijn sequentiespecificiteit en endonunucleolytische activiteit afhankelijk van dezelfde eiwitgebieden. Het is daarom moeilijk om het ene te veranderen zonder het andere te beïnvloeden. Succes wordt waarschijnlijker gemaakt door een strategie die rekening houdt met de voetafdruk van het enzym, de symmetrie van eiwit-DNA-interacties respecteert en voortbouwt op reeds bestaande enzymatische voorkeuren, die vooraf moeten worden bepaald in biochemische experimenten, zoals werd gedaan voor het NlaIV-voorbeeld8.
The authors have nothing to disclose.
Dit werk werd ondersteund door de subsidies van het Ministerie van Wetenschap en Hoger Onderwijs (0295/B/PO1/2008/34 aan MB en N301 100 31/3043 aan KS), van het Poolse National Science Centre (NCN) (UMO-2011/02/A/NZ1/00052, UMO-2014/13/B/NZ1/03991 en UMO-2014/14/M/NZ5/00558 naar MB) en op korte termijn EMBO fellowship naar KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |