Restriktionsendonukleasen mit neuer Sequenzspezifität können aus Enzymen entwickelt werden, die eine teilweise degenerierte Sequenz erkennen. Hier stellen wir ein detailliertes Protokoll zur Verfügung, das wir erfolgreich verwendet haben, um die Sequenzspezifität des NlaIV-Enzyms zu verändern. Wesentliche Bestandteile des Protokolls sind die In-vitro-Kompartimentisierung der Transkriptions-/Übersetzungsreaktion und die Auswahl von Varianten mit neuen Sequenzspezifitäten.
Restriktionsendonuklease (REase) Spezifitätstechnik ist extrem schwierig. Hier beschreiben wir ein mehrstufiges Protokoll, das hilft, REase-Varianten zu produzieren, die eine strengere Spezifität als das elternde Enzym aufweisen. Das Protokoll erfordert die Erstellung einer Bibliothek von Expressionsauswahlkassetten (ESCs) für Varianten des REase, idealerweise mit Variabilität in Positionen, die die DNA-Bindung beeinflussen können. Der ESC wird auf der einen Seite durch eine Sequenz für die gewünschte Einschränkungs-Site-Aktivität und ein Biotin-Tag und auf der anderen Seite durch eine Restriktionsstelle für die unerwünschte Aktivität und eine Primer-Glühstelle flankiert. Die ESCs werden transkribiert und in eine Wasser-in-Öl-Emulsion übersetzt, unter Bedingungen, die das Vorhandensein von mehr als einem DNA-Molekül pro Tröpfchen unwahrscheinlich machen. Daher wird die DNA in jedem Kassettenmolekül nur der Aktivität des übersetzten, kodierten Enzyms unterworfen. REase-Varianten der gewünschten Spezifität entfernen das Biotin-Tag, aber nicht die Primer-Glühen-Site. Nach dem Bruch der Emulsion werden die DNA-Moleküle einem Biotin-Pulldown unterzogen, und nur die im Überstand bleiben erhalten. Dieser Schritt stellt sicher, dass nur ESCs für Varianten beibehalten werden, die nicht die gewünschte Aktivität verloren haben. Diese DNA-Moleküle werden dann einer ersten PCR-Reaktion unterzogen. Cleavage in der unerwünschten Sequenz schneidet die Primerbindungsstelle für einen der Primer ab. Daher verstärkt PCR nur ESCs aus Tröpfchen ohne die unerwünschte Aktivität. Anschließend wird eine zweite PCR-Reaktion durchgeführt, um die Restriktionsstelle für die gewünschte Spezifität und das Biotin-Tag wieder einzuführen, so dass der Selektionsschritt wiederholt werden kann. Ausgewählte offene Leserahmen können in Bakterienzellen überexprimiert werden, die auch die cognate Methyltransferase der elterlichen REase ausdrücken, da die neu entwickelte REase nur eine Teilmenge der Methyltransferase-Zielstellen anvisiert.
Sequenzspezifitäts-Engineering ist für REases der Klasse II eine große Herausforderung. In dieser Klasse von Endonukleasen sind Sequenzerkennung und Katalyse eng miteinander verflochten, höchstwahrscheinlich als evolutionärer Schutz gegen die Schaffung einer Endonuklease von breiterer Spezifität als ihre cognate Methyltransferase, die die Wirts-DNA schädigen würde. Die gezielte Evolution neuer Spezifitäten in Zellen wird durch die Notwendigkeit, die Wirts-DNA vor der neu entwickelten Endonuklease-Aktivität zu schützen, noch komplizierter. Daher gibt es nur wenige erfolgreiche Versuche von REase Engineering berichtet und alle von ihnen nutzen die einzigartigen Eigenschaften eines bestimmten Enzyms1,2,3,4,5,6,7.
Hier stellen wir ein detailliertes Protokoll für Spezifitäts-Engineering zur Verfügung, das verwendet werden kann, um Endonuklease-Varianten zu generieren, die eine engere Spezifität haben als ein Elternenzym, das auf unserer erfolgreichen Konstruktion einer NlaIV Endonuklease8basiert. Für jedes solche Enzym mit einer beliebigen Erkennungssequenz kann eine zusätzliche Spezifität für Basen in den Flanken eingeführt werden. Bei Elternenzymen, die teilweise degenerierte Sequenzen erkennen (wie NlaIV mit ihrem GGNNCC-Ziel), kann auch eine zusätzliche Spezifität innerhalb der Erkennungssequenz eingeführt werden. Da zusätzliche Spezifität wahrscheinlich Protein-DNA-Kontakte erfordern, sollten die neu erkannten Basen innerhalb des Fußabdrucks der elterlichen Endonuklease auf DNA liegen. Grundsätzlich können Für jede gewünschte Spezialisierung der Erkennungssequenz Auswahlschemata eingerichtet werden. Die meisten REases, die palindromische und fast palindromische Zielsequenzen erkennen, sind jedoch funktionelle Dimere, die nur eine halbe Stelle des Palindroms erkennen. Daher ist es unwahrscheinlich, dass die Auswahl neuer Spezifitäten, die die Symmetrie von Protein-Nukleinwechselwirkungen verletzen, funktioniert. Für die dimerische NlaIV beispielsweise kann die GGNNCC-Sequenz theoretisch auf GGATCC eingegrenzt werden, aber die Verengung der Spezifität auf GGAACC dürfte schwieriger sein. Unser Schema beinhaltet sowohl eine positive als auch eine negative Auswahl.
Das Verfahren ist effizienter, wenn die negative Auswahl auch verwendet wird, um die Spezifitäten zu entfernen, die alle Sequenzen außer der bevorzugten engeren Spezifität spalten können. Beispielsweise könnte die Auswahl für GGATCC mit einer Antiauswahl gegen GGBVCC kombiniert werden (wobei B eine andere Basis als A und V eine andere Basis als T ist). Wenn einige der möglichen Zielsequenzen nicht abgedeckt sind, hängt das Ergebnis des Auswahlexperiments von der Wirksamkeit der positiven und negativen Selektion ab. In unserer NlaIV-Arbeit haben wir uns für GGATCC und gegen GGSSCC (wobei S G oder C) entschieden hat, und eine Spezifität erhalten, die unter Ignorieren von Symmetriebruchzielen als GGWWCC (wobei W A oder T ist) beschrieben werden könnte, was darauf hindeutet, dass in diesem speziellen Fall die negative Selektion als positive Auswahl.
Unser Ansatz beginnt mit der Erstellung einer Ausdrucksauswahlkassette (ESC). Der ESC ist in Abschnitte gegliedert. Im Innenkernbereich gibt es Varianten des offenen Leserahmens (ORF) der REase unter T7-Promoter-Steuerung. Dieser Kernabschnitt des ESC kann keinen Cognate-Standort für die entwickelte REase enthalten. Der Kern ist zwischen zwei Kognatenstellen für Wildtyp REase eingeklemmt: eine Spaltungsstelle für die unerwünschte Aktivität (in diesem Beispiel die zählergenaue Sequenz GGSSCC) und eine Spaltungsstelle für die gewünschte Aktivität (ausgewählte Sequenz, GGATCC im Beispiel). Der letzte Schritt der Vorbereitung des ESC in PCR fügt Biotin nahe an der gewünschten Aktivität am 5′ Ende hinzu und erzeugt eine Vielzahl von gegeneinander ausgewählten Sequenzen (GGSSCC im Beispiel). Die Auswahlstrategie beruht auf der Verwendung sorgfältig ausgearbeiteter Primer im ESC-Reamplifikationsprotokoll nach einem In-vitro-Transkriptions-/Übersetzungs-/Auswahlprotokoll (Abbildung 1A). Die ESC-Bibliothek wird in einer in vitro unterteilten Transkriptionsübersetzung Wasser-in-Öl-Emulsion9,10,11ausgedrückt. Innerhalb jedes Tröpfchens wirkt sich die Spezifität des exprimierten Enzyms auf den Zustand des ESC aus (Abbildung 1B, Schritt I). Für die beschriebene Anordnung entfernt die gewünschte Spaltaktivität des übersetzten Proteins das Biotin-Tag der DNA, wirkt sich aber nicht auf das andere ESC-Ende mit der gegendien ausgewählten Sequenz aus. Wenn die Emulsion gebrochen ist, werden biotinylierte Fragmente durch Streptavidin-Affinitätspulldown entfernt, so dass nur Fragmente aus Tröpfchen mit der gewünschten Aktivität übrig bleiben(Abbildung 1B, Schritt II). In diesem Schritt werden inaktive REase-Varianten entfernt. Der überstande Teil des Pull-Down-Schritts wird dann durch PCR verstärkt. In den ersten PCR-Reaktionsprimern Werden F2 und R1 verwendet(Abbildung 1A,B, Schritt III). Primer F2 bindet an den ESC-Abschnitt zwischen der gegendien ausgewählten Sequenz und dem Molekülende. Daher werden ESCs, die Varianten exprimieren, die in der Lage sind, die gegensätzliche ausgewählte Sequenz zu trennen (und damit die Bindungsstellen für die Primer F2 und R1 in zwei verschiedene DNA-Moleküle zu trennen), nicht verstärkt und somit aus der Bibliothek entfernt. Der Primer R1 bindet zwischen dem ausgewählten Standort und dem Kern des ESC, so dass er nicht vom Spaltungsstatus des ausgewählten Standorts beeinflusst wird, und stellt die Spaltungsstelle für die gewünschte Aktivität (GGATCC) wieder her. Der Zyklus wird durch eine zweite PCR (mit primer F1 und R2) geschlossen, die Biotin am 5′-Ende in der Nähe des ausgewählten Standorts hinzufügt und die entworfene Variation an der gegenläufigen Stelle in der Nähe des entgegengesetzten Endes des ESC wiederherstellt(Abbildung 1B,Schritt IV). Die resultierende DNA-Mischung ist bereit für eine weitere Auswahlrunde.
Der Erfolg des Auswahlprotokolls hängt stark von der richtigen Wahl der neuen, strengeren Zielerkennungssequenz und von der sorgfältigen Gestaltung der Mutagenese-Strategie und ihrer effektiven Umsetzung ab. Da es viel einfacher ist, leichte bereits bestehende Präferenzen der REase zu verbessern, als sie zu überwinden, empfehlen wir, mit einer kinetischen Studie aller bereits bestehenden Präferenzen zu beginnen. Die Notwendigkeit einer sorgfältigen Mutagenese-Konstruktion ergibt sich aus der begrenzten Größe einer mutierten Bibliothek, die durch das vorgestellte Protokoll verarbeitet werden kann (109 Klone in einem einzigen Experiment). Somit können alle 20 möglichen Aminosäuresubstitutionen in wenigen Positionen effektiv getestet werden (siehe Diskussion). Eine zufällige Mutagenese, wie z. B. fehleranfällige PCR (EP-PCR), die als alternative Methode vorgestellt werden, wird zu einer tiefgreifenden Unterstichprobe der bestehenden Komplexität führen. Wenn Informationen über mögliche Aminosäurepositionen im Zusammenhang mit DNA-Kontakten (oder sogar in unmittelbarer Nähe zu den degenerierten Nukleotiden in einer Cognate-Sequenz) vorliegen, sollte dies sicherlich verwendet werden, um einige Aminosäuren für oligonukleotidgeführte Sättigungsmutagenese auszuwählen (Protokollschritte 1.6-3.10).
Das hier beschriebene Auswahlprotokoll wurde für NlaIV8getestet, eine dimerische PD-(D/E)XK-Falzerkennungssequenz, die eine palindromische Zielstelle mit zentralen NN-Basen erkennt und einen stumpfen Endschnitt zwischen den NN-Basen katalysiert. NlaIV wurde gepflückt, weil die Spaltung zwischen den NN-Basen darauf hindeutet, dass diese Basen in der Nähe des Proteins im Komplex liegen. Prinzipiell könnte das Protokoll für jede sequenzspezifische Restriktionsendonuklease, monomeric oder dimeric, jeder Falzgruppe verwendet werden, wodurch Doppelstrangbrüche von jedem Staffelr katalysiert werden, unabhängig davon, ob katalytische und spezifizistische Domänen übereinstimmen (wie im NlaIV-Beispiel) oder getrennt sind (z. B. FokI). Darüber hinaus ist das Protokoll im Prinzip nicht nur für die Erzeugung neuer, engerer Enzymspezifität nützlich, sondern könnte auch verwendet werden, um Staraktivitäten zu eliminieren oder High-Fidelity-Endonukleasen zu erstellen. All dies wurde jedoch noch nicht getestet. Insbesondere kann die gezielte Eliminierung der Sternaktivität kompliziert sein, da dieselben Aminosäurerückstände an der Bindung an die gewünschten und unerwünschten Basen beteiligt sein könnten. Die in diesem Protokoll beschriebenen In-vitro-Schritte beschränken sich nicht auf die Auswahl eingeengter Spezifitäten, sondern könnten auch zur Auswahl anders veränderter Spezifitäten verwendet werden. Allerdings gibt es dann ein Problem mit variantenenden Endonukleasen: Wenn das Spektrum der Substrate neue Ziele enthält, die nicht durch die elterliche Endonuklease gespaltet werden, gibt es im Allgemeinen keine gute Möglichkeit, Zellen vor den schädlichen Auswirkungen dieser Aktivität zu schützen. Im Gegensatz dazu sind die Ziele, wenn die Endonuklease-Spezifität nur eingeengt wird, eine Teilmenge der Wildtyp-Ziele, und daher sollte die bereits verfügbare Cognate-Methyltransferase vollständig schützend sein.
Unser Protokoll unterscheidet sich in mehrfacher Hinsicht von vielen gerichteten Evolutionsprotokollen. Offene Leserahmenvielfalt wird einmal zu Beginn des Experiments generiert, nicht in jeder Iteration. Darüber hinaus wird es durch Split-and-Mix-Synthese und nicht durch EP-PCR erstellt. Für NNS-Substitutionen von Codons, wie sie in dieser Arbeit verwendet werden, gibt es (4 x 4 x 2)6 x 1,07 x 109 Kombinationen für sechs Positionen. Daher ist jede variante im Durchschnitt einmal in 1,7 Fmoles des ESC vorhanden. Diese Kapazität kann auf sieben Positionen erhöht werden, indem eine Synthese mit einer Mischung aus 20 Tridemoactid-Vorläufern verwendet wird, die von Glen Research angeboten wird, oder durch Verringerung der Mutationshäufigkeit in weniger vielversprechenden Positionen mit Split-and-Mix-Oligonukleotid-Synthese. Wenn möglich, wird empfohlen, das Ausmaß der Variation auf sechs Positionen zu begrenzen. Offensichtlich erfordert eine solche Mutagenese-Targeting einige bereits vorhandene Kenntnisse über zumindest die Regionen der REase, die an der Substratbindung beteiligt sind. Das Split-and-Mix-Protokoll zur Erzeugung von Diversität hat gegenüber EP-PCR deutliche Vorteile. Mit EP-PCR erhielten wir unveränderte Varianten und Sequenzen mit acht Substitutionen für NlaIV-ESCs in derselben EP-PCR (Tabelle 4). Die Bibliothek von EP-PCR enthält einen wesentlichen Bruchteil von Klonen, die vermieden werden sollten (wilde Typsequenzen, Mehrfachersetzungen, Frameshift- und Nonsense-Mutationen und Mutationen an Orten, an denen die Sequenzspezifität wahrscheinlich nicht beeinflusst wird).
Unser Protokoll unterscheidet sich auch von vielen anderen gerichteten Evolutionsprotokollen durch zwei sequenzielle Auswahlschritte. Eine positive Auswahl stellt sicher, dass die gewünschte Aktivität beibehalten wird, da sonst das Biotin-Tag nicht entfernt wird und die Codierungssequenz durch Pull-down entfernt werden kann. Es ist technisch möglich, dass die zufällige Entstehung einer neuartigen, nicht überlappenden Spezifität (z.B. GCATGC) auch zur Abtrennung des Biotin-Tags führen könnte, wenn eine geeignete Spaltungsstelle in der Nähe der gewünschten Spaltung vorhanden ist, aber nicht anderswo. Dies dürfte jedoch höchst unwahrscheinlich sein. Negative Auswahl entfernt offene Leserahmen, die für Enzyme kodieren, die noch die unerwünschte Aktivität haben. Dieser Schritt ist nicht zwingend vorgeschrieben, da das Protokoll die Ausgabebibliothek immer noch mit Varianten anreichert, die in der Lage sind, die Auswahlsequenz zu spalten, aber nicht an anderer Stelle im ESC spalten können, wodurch sie für die PCR-Verstärkung ungeeignet ist. Es wird jedoch erwartet, dass die Auswahlwirksamkeit geringer ist, da Enzyme mit der ursprünglichen Sequenzspezifität nicht aus dem Output entfernt werden und vielversprechende Varianten mit veränderter Spezifität, aber auch verminderter enzymatischer Aktivität übertreffen. Beachten Sie, dass auf der Bevölkerungsebene sowohl gewünschte als auch unerwünschte Zielsequenzen degenerieren können, aber nicht sein müssen. Im NlaIV-Beispiel wurde das Antiziel degeneriert und das Ziel nicht degeneriert. Selbst wenn es Eine Degenerierung auf Bevölkerungsebene gibt, ist in einem einzigen Tröpfchen nur ein (nicht degeneriertes) Ziel oder Antiziel vorhanden. In unserem Protokoll werden Ziel- und Antizielsequenzen bei jeder Wiederholung der Selektionsschritte wieder eingeführt. Daher muss ein offener Leserahmen ein Enzym kodieren, das in der Lage ist, alle möglichen Ziele zu spalten, und nicht in der Lage ist, eines der Anti-Ziele zu spalten, um mehrere Auswahlrunden zu überleben. Beachten Sie, dass die Notwendigkeit, das Antiauswahlziel bei jeder Iteration des Protokolls erneut einzuführen, zwei sequenzielle PCRs erzwingt. Die erste PCR verwendet eine Grundierung, die außerhalb des Anti-Ziels anneals, so dass Spaltung des Anti-Ziel verhindert die PCR-Reaktion. Die zweite PCR erfordert eine Grundierung, die über das Anti-Ziel hinausreicht, und führt das Anti-Ziel wieder ein, um sicherzustellen, dass während mehrerer Auswahlrunden jeder offene Leserahmen mit allen Varianten des Anti-Ziels getestet wird.
Für Enzyme, die klebrige Enden erzeugen, kann ein verwandtes Alternativprotokoll verwendet werden, das auf einer zuvor beschriebenen Methode zur Isolierung von REase ORF10 basiert. Die Erschöpfung inaktiver Varianten durch Biotinerfassung, die in unseren Experimenten verwendet wird, wird im Alternativprotokoll durch Ligation des kompatiblen Adapters durch eine Sequenz ersetzt, die als Primerbindungsstelle in einer selektiven PCR verwendet wird (Abbildung 9). Nur ESCs, die Enzyme mit der ausgewählten Spezifität produzieren, erzeugen ligationsfähige Enden und werden daher ausgewählt. Die Reihenfolge des klebrigen Endes der ausgewählten Zählersequenz muss so gestaltet sein, dass sie nicht an der Ligation mit Adaptern teilnehmen kann. Die Iteration des Auswahlprozesses kann leicht erreicht werden, indem zwischen zwei verschiedenen Adaptern und damit zwei verschiedenen Reverse primern in selektiver PCR gewechselt wird.
Auch mit neuen Protokollen ist die Aufgabe, neue Besonderheiten in vitro zu erarbeiten, immer noch eine große Herausforderung. Bei typischen Typ-II-REases hängen Sequenzspezifität und endonukleolytische Aktivität von denselben Proteinregionen ab. Es ist daher schwierig, das eine zu ändern, ohne das andere zu beeinträchtigen. Der Erfolg wird durch eine Strategie wahrscheinlicher, die den Fußabdruck des Enzyms berücksichtigt, die Symmetrie von Protein-DNA-Wechselwirkungen respektiert und auf bereits bestehenden enzymatischen Präferenzen aufbaut, die im Voraus in biochemischen Experimenten bestimmt werden sollten, wie dies für das NlaIV-Beispiel8geschehen ist.
The authors have nothing to disclose.
Diese Arbeit wurde durch Zuschüsse des Ministeriums für Wissenschaft und Hochschulbildung (0295/B/PO1/2008/34 bis MB und N301 100 31/3043 an KS), des Polnischen Nationalen Wissenschaftszentrums (NCN) (UMO-2011/02/A/NZ1/00052) unterstützt. UMO-2014/13/B/NZ1/03991 und UMO-2014/14/M/NZ5/00558 bis MB) und durch kurzfristigeem EMBO-Stipendium an KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |