Des endonucleases de restriction avec une nouvelle spécificité de séquence peuvent être développées à partir d’enzymes reconnaissant une séquence partiellement dégénérée. Ici, nous fournissons un protocole détaillé que nous avons utilisé avec succès pour modifier la spécificité de la séquence de l’enzyme NlaIV. Les ingrédients clés du protocole sont la compartimentation in vitro de la réaction de transcription/traduction et la sélection de variantes avec de nouvelles spécificités séquences.
L’ingénierie de spécificité de restriction d’endonuclease (REase) est extrêmement difficile. Ici, nous décrivons un protocole multistep qui aide à produire des variantes REase qui ont une spécificité plus stricte que l’enzyme parentale. Le protocole nécessite la création d’une bibliothèque de cassettes de sélection d’expressions (ESC) pour les variantes de la REase, idéalement avec une variabilité dans les positions susceptibles d’affecter la liaison de l’ADN. L’ESC est flanquée d’un côté par une séquence pour l’activité du site de restriction souhaitée et une étiquette de biotine et de l’autre par un site de restriction pour l’activité indésirable et un site d’amorce annealing. Les CES sont transcrits et traduits dans une émulsion d’eau dans l’huile, dans des conditions qui rendent peu probable la présence de plus d’une molécule d’ADN par gouttelette. Par conséquent, l’ADN de chaque molécule de cassette n’est soumis qu’à l’activité de l’enzyme traduite et codée. Les variantes REase de la spécificité souhaitée enlèvent l’étiquette de biotine mais pas le site d’amorce. Après avoir brisé l’émulsion, les molécules d’ADN sont soumises à un retrait de biotine, et seuls ceux dans le supernatant sont conservés. Cette étape assure que seuls les ESC pour les variantes qui n’ont pas perdu l’activité souhaitée sont conservés. Ces molécules d’ADN sont ensuite soumises à une première réaction de PCR. Le décolleté dans la séquence indésirable coupe le site de fixation d’apprêt pour l’une des amorces. Par conséquent, PCR amplifie uniquement les CSE des gouttelettes sans l’activité indésirable. Une deuxième réaction pcR est alors effectuée pour réintroduire le site de restriction pour la spécificité souhaitée et l’étiquette de biotine, afin que l’étape de sélection puisse être réitérée. Les cadres de lecture ouverts sélectionnés peuvent être surexprimés dans les cellules bactériennes qui expriment également la méthyltransferase cognate de la REase parentale, parce que le REase nouvellement évolué ne cible qu’un sous-ensemble des sites cibles de méthyltransferase.
L’ingénierie de spécificité de séquence est extrêmement difficile pour les REases de classe II. Dans cette classe d’endonucleases, la reconnaissance de séquence et la catalyse sont étroitement liées, probablement comme une protection évolutive contre la création d’une endonuclease de spécificité plus large que sa méthyltransferase cognée, qui endommagerait l’ADN hôte. L’évolution dirigée de nouvelles spécificités dans les cellules est encore compliquée par la nécessité de protéger l’ADN hôte contre l’activité nouvellement conçue d’endonuclease. Par conséquent, il n’y a que quelques tentatives réussies de l’ingénierie REase signalé et tous exploitent les caractéristiques uniques d’une enzyme particulière1,2,3,4,5,6,7.
Ici, nous fournissons un protocole détaillé pour l’ingénierie de spécificité qui peut être utilisé pour générer des variantes d’endonuclease qui ont une spécificité plus étroite qu’une enzyme parentale qui est basée sur notre ingénierie réussie d’une endonuclease NlaIV8. Pour une telle enzyme avec une séquence de reconnaissance arbitraire, une spécificité supplémentaire peut être introduite pour les bases sur les flancs. Pour les enzymes parentales qui reconnaissent les séquences partiellement dégénérées (comme NlaIV avec sa cible GGNNCC), une spécificité supplémentaire peut également être introduite dans la séquence de reconnaissance. Comme la spécificité supplémentaire exigera probablement des contacts protéine-ADN, les bases nouvellement reconnues devraient se trouver dans l’empreinte de l’endonuclease parentale sur l’ADN. En principe, des schémas de sélection peuvent être mis en place pour toute spécialisation souhaitée de la séquence de reconnaissance. Cependant, la plupart des REases qui reconnaissent les séquences de cibles palindromic et presque palindromic sont des dimers fonctionnels qui ne reconnaissent qu’un demi-site du palindrome. Par conséquent, il est peu probable que la sélection de nouvelles spécificités qui violent la symétrie des interactions nucléiques protéiques fonctionne. Pour le NlaIV dimerique, par exemple, la séquence GGNNCC peut théoriquement être réduite au CCGCC, mais il devrait être plus difficile de réduire la spécificité jusqu’au CCGACC. Notre régime implique une sélection à la fois positive et négative.
Le processus est plus efficace lorsque la sélection négative est également utilisée pour supprimer les spécificités capables de fendre toutes les séquences autres que la spécificité plus étroite préférée. Par exemple, la sélection du CCGCG pourrait être combinée avec l’antisélection contre le GGBVCC (où B est une base autre que A, et V est toute base autre que T). Lorsque certaines des séquences cibles possibles ne sont pas couvertes, le résultat de l’expérience de sélection dépend de l’efficacité de la sélection positive et négative. Dans notre travail NlaIV, nous avons choisi pour le GGATCC, et contre GGSSCC (où S est G ou C), et obtenu une spécificité qui, ignorant les cibles de rupture de symétrie, pourrait être décrit comme GGWWCC (où W est A ou T), suggérant que dans ce cas particulier, la sélection négative était plus une sélection importante que positive.
Notre approche commence par la création d’une cassette de sélection d’expressions (ESC). Le CES est structuré en sections. Sur la section centrale intérieure, il existe des variantes du cadre de lecture ouverte (ORF) de la REase, sous le contrôle du promoteur T7. Cette section centrale de l’ESC ne peut contenir aucun site cognate pour le REase conçu. Le noyau est pris en sandwich entre deux sites cognate pour le type sauvage REase : un site de clivage pour l’activité indésirable (séquence sélectionnée en contre, GGSSCC dans cet exemple) et un site de clivage pour l’activité désirée (séquence sélectionnée, GGATCC dans l’exemple). La dernière étape de la préparation de l’ESC en PCR ajoute de la biotine proche de l’activité désirée à l’extrémité 5′ et crée une variété de séquences de compteur sélectionnés (GGSSCC dans l’exemple). La stratégie de sélection repose sur l’utilisation d’amorçistes soigneusement conçus au protocole de réaplification de l’ESC après un protocole in vitro de transcription/traduction/sélection(figure 1A). La bibliothèque ESC est exprimée dans une traduction de transcription in vitro compartimentée émulsion d’eau dans l’huile9,10,11. Dans chaque gouttelette, la spécificité de l’enzyme exprimée affecte l’état de l’ESC(figure 1B, étape I). Pour l’arrangement décrit, l’activité de clivage souhaitée de la protéine traduite élimine l’étiquette de biotine de l’ADN, mais n’affecte pas l’autre extrémité ESC avec la séquence sélectionnée par compteur. Lorsque l’émulsion est cassée, les fragments biotinylés sont enlevés par le retrait de l’affinité de streptavidine, de sorte que seuls les fragments des gouttelettes avec l’activité désirée restent(figure 1B, étape II). Cette étape supprime les variantes inactives REase. La fraction supernatante de l’étape de traction est ensuite amplifiée par PCR. Dans les premières amorces de réaction PCR F2 et R1 sont utilisés (Figure 1A,B, étape III). Primer F2 se lie à la section ESC entre la séquence sélectionnée par compteur et l’extrémité de la molécule. Par conséquent, les ESC exprimant des variantes capables de clélire la séquence sélectionnée par compteur (et, par conséquent, de séparer les sites de liaison pour les amorces F2 et R1 en deux molécules d’ADN différentes) ne sont pas amplifiées et sont donc retirées de la bibliothèque. L’amorce R1 se lie entre le site sélectionné et le cœur de l’ESC afin qu’il ne soit pas affecté par l’état de clivage du site sélectionné et restaure le site de clivage pour l’activité désirée (GGATCC). Le cycle est fermé par un deuxième PCR (avec amorce F1 et R2) qui ajoute de la biotine à l’extrémité 5′ près du site sélectionné et restaure la variation conçue au comptoir choisi site près de l’extrémité opposée de l’ESC(figure 1B, étape IV). Le mélange d’ADN qui en résulte est prêt pour une autre ronde de sélection.
Le succès du protocole de sélection dépend fortement du choix approprié de la nouvelle séquence de reconnaissance cible plus rigoureuse et de la conception minutieuse de la stratégie mutagène et de sa mise en œuvre efficace. Parce qu’il est beaucoup plus facile d’améliorer les légères préférences préexistantes de la REase que de les surmonter, nous vous recommandons de commencer par une étude cinétique de toutes les préférences préexistantes. La nécessité d’une conception mutagénieuse soigneuse résulte de la taille limitée d’une bibliothèque mutante qui peut être traitée par le protocole présenté (109 clones dans une seule expérience). Par conséquent, les 20 substitutions possibles d’acide aminé peuvent être testées efficacement en quelques positions (voir Discussion). La mutanèse aléatoire, telle que le PCR (EP-PCR) sujet aux erreurs présenté comme une méthode alternative, entraînera un sous-échantillon profond de la complexité existante. Si des informations concernant les positions potentielles d’acide aminé impliquées dans des contacts avec l’ADN (ou même situées à proximité des nucléotides dégénérés dans une séquence cognate) sont disponibles, il devrait certainement être utilisé pour sélectionner quelques acides aminés pour la mutageèse guidée de saturation oligonucléotide (étapes de protocole 1.6-3.10).
Le protocole de sélection décrit ici a été testé pour NlaIV8, une séquence de reconnaissance de plis PD-(D/E)XK dimerique qui reconnaît un site cible palindromique avec des bases centrales NN et catalyse une coupe d’extrémité émoussée entre les bases NN. NlaIV a été choisi parce que le clivage entre les bases NN suggère que ces bases sont proches de la protéine dans le complexe. En principe, le protocole pourrait être utilisé pour n’importe quelle séquence spécifique restriction endonuclease, monomérique ou dimerique, de tout groupe pli, catalysant les doubles ruptures de brin de n’importe quel échelon, indépendamment du fait que les domaines catalytiques et de spécificité coïncident (comme dans l’exemple NlaIV) ou sont séparés (par exemple, FokI). En outre, le protocole en principe est utile non seulement pour la génération de nouvelles spécificités enzymatiques plus étroites, mais pourrait également être utilisé pour éliminer les activités des étoiles, ou pour créer des endonucleases haute fidélité. Cependant, tout cela n’a pas encore été testé. En particulier, l’élimination ciblée de l’activité des étoiles peut être compliquée, car les mêmes résidus d’acide aminé pourraient être impliqués dans la liaison aux bases désirées et indésirables. Les étapes in vitro décrites dans ce protocole ne se limitent pas à la sélection des spécificités réduites, mais pourraient également être utilisées pour sélectionner des spécificités autrement modifiées. Cependant, il y a alors un problème avec les endonucleases variables : si le spectre des substrats inclut de nouvelles cibles non clivées par l’endonuclease parentale, il n’y a en général aucun bon moyen de protéger les cellules contre les effets nocifs de cette activité. En revanche, si la spécificité de l’endonuclease n’est réduite que, les cibles sont un sous-ensemble des cibles de type sauvage, et donc la méthyltransferase cognate déjà disponible devrait être entièrement protectrice.
Notre protocole diffère à plusieurs égards de nombreux protocoles d’évolution dirigés. La diversité des cadres de lecture ouverte est générée une fois au début de l’expérience, pas dans toutes les itérations. En outre, il est créé par la synthèse split-and-mix, plutôt que par EP-PCR. Pour les substitutions NNS des codons, comme utilisé dans ce travail, il ya (4 x 4 x 2)6 – 1,07 x 109 combinaisons pour six positions. Par conséquent, une variante donnée est présente en moyenne une fois dans 1,7 fmoles de ESC. Cette capacité peut être augmentée à sept positions en utilisant la synthèse avec un mélange de 20 précurseurs de trinucléotide qui est offert par Glen Research ou en diminuant la fréquence de mutation dans des positions moins prometteuses avec la synthèse d’oligoucléotide split-and-mix. Si possible, il est recommandé de limiter l’étendue de la variation à six positions. De toute évidence, un tel ciblage mutagèse nécessite une certaine connaissance préexistante sur au moins les régions de la REase impliquées dans la liaison de substrat. Le protocole de fractionnement pour générer de la diversité présente des avantages évidents par rapport à l’EP-PCR. À l’aide d’EP-PCR, nous avons obtenu des variantes et des séquences inchangées portant huit substitutions pour les CSE NlaIV dans le même EP-PCR(tableau 4). La bibliothèque de l’EP-PCR contient une fraction substantielle de clones qui doivent être évités (séquences de type sauvage, substitutions multiples, frameshift et mutations absurdes, et mutations dans des endroits peu susceptibles d’affecter la spécificité de la séquence).
Notre protocole diffère également de beaucoup d’autres protocoles d’évolution dirigés par la présence de deux étapes de sélection séquentielles. La sélection positive permet de s’assurer que l’activité désirée est conservée, sinon l’étiquette de biotine n’est pas supprimée, et la séquence de codage peut être supprimée par traction vers le bas. Il est techniquement possible que l’émergence fortuite d’une spécificité nouvelle et non chevauchante (p. ex., GCATGC) puisse mener à la rupture de l’étiquette de biotine aussi bien, si un site de clivage approprié est présent près du clivage désiré, mais pas ailleurs. Cependant, cela devrait être très peu probable. La sélection négative supprime les cadres de lecture ouverts qui codent pour les enzymes qui ont encore l’activité indésirable. Cette étape n’est pas strictement obligatoire, car le protocole va encore enrichir la bibliothèque de sortie avec des variantes qui sont capables de fendre la séquence de sélection, mais pas en mesure de fendre ailleurs dans le ESC, ce qui le rend impropre à l’amplification PCR. Cependant, l’efficacité de sélection devrait être plus faible parce que les enzymes avec la spécificité originale de séquence ne seront pas enlevées de la sortie et surpasseront les variantes prometteuses avec la spécificité altérée mais également l’activité enzymatique diminuée. Notez qu’au niveau de la population, les séquences cibles souhaitées et indésirables peuvent, mais n’ont pas besoin d’être, dégénérer. Dans l’exemple du NlaIV, l’anti-cible était dégénérée et la cible non dégénérée. Même lorsqu’il y a dégénérescence au niveau de la population, dans une seule gouttelette, une seule cible (non dégénérée) ou anti-cible est présente. Dans notre protocole, les séquences cibles et anti-cibles sont réintroduites à chaque répétition des étapes de sélection. Par conséquent, un cadre de lecture ouverte doit coder une enzyme capable de clivage de toutes les cibles possibles, et incapable de fendre l’une des cibles anti-cibles, pour survivre à plusieurs tours de sélection. Notez que la nécessité de réintroduire la cible anti-saisie à chaque itération du protocole applique deux PCR séquentiels. Le premier PCR utilise une amorce qui anneals en dehors de l’anti-cible, de sorte que le clivage de l’anti-cible empêche la réaction PCR. Le deuxième PCR nécessite une amorce qui va au-delà de l’anti-cible, et réintroduit anti-cible, pour s’assurer que pendant plusieurs tours de sélection, chaque cadre de lecture ouverte est testé contre toutes les variantes de l’anti-cible.
Pour les enzymes qui génèrent des extrémités collantes, un protocole alternatif connexe basé sur une méthode précédemment décrite pour l’isolement de REase ORF10 peut être utilisé. L’épuisement des variantes inactives par capture de biotine qui est utilisé dans nos expériences est remplacé dans le protocole alternatif par la ligature de l’adaptateur compatible avec une séquence qui est utilisé comme un site de liaison d’amorce dans un PCR sélectif(figure 9). Seuls les ESC qui produisent des enzymes avec la spécificité sélectionnée génèrent des fins capables de ligation et seront donc sélectionnés. La séquence de l’extrémité collante de la séquence anti-eselected doit être conçue de manière à ce qu’elle ne puisse pas participer à la ligature avec des adaptateurs. L’itération du processus de sélection peut être facilement réalisée en passant d’un adaptateur différent à deux adaptateurs différents et, par conséquent, de deux amorces inversées différentes dans le PCR sélectif.
Même avec de nouveaux protocoles, la tâche d’ingénierie de nouvelles spécificités in vitro est encore très difficile. Pour les REases typiques de type II, la spécificité de séquence et l’activité endonucleolytique dépendent des mêmes régions protéiques. Il est donc difficile de modifier l’un sans affecter l’autre. Le succès est rendu plus probable par une stratégie qui prend en compte l’empreinte de l’enzyme, respecte la symétrie des interactions protéines-ADN, et s’appuie sur des préférences enzymatiques préexistantes, qui devraient être déterminées dès le départ dans les expériences biochimiques, comme cela a été fait pour l’exemple NlaIV8.
The authors have nothing to disclose.
Ce travail a été soutenu par les subventions du Ministère de la science et de l’enseignement supérieur (0295/B/PO1/2008/34 à MB et N301 100 31/3043 à KS), du Centre national polonais des sciences (NCN) (UMO-2011/02/A/NZ1/00052, UMO-2014/13/B/NZ1/03991 et UMO-2014/14/M/NZ5/00558 à MB) et par bourse EMBO à court terme à KS (ATSF 277.00-05).
1000Å CPG Support (dA, dT, dC, dG) | Biosset | 45-1000-050 | Other vendors can be used as well |
ASM-800 DNA/RNA | Biosset | 800-001-000 | |
GeneJET Gel Extraction Kit | Thermo Scientific | K0691 | Any other kit can be used |
Glen-Pak DNA purification cartridge | Glen Research | 60-5200 | |
HIS-Select Nickel Affinity Gel | Sigma | P6611 | |
pET 28a vector | Any other vector with T7 promoter upstream of plycloning site can be used instead | ||
Phusion High-Fidelity DNA Polymerase | Thermo Scientific | F530S | Any other high fidelity and highly processive thermophilic polymearse can be used instead |
Porous steel foil | Biosset | 40-063 | |
Rapid Translation System RTS 100, E.coli HY Kit |
Roche | 3 186 148 | |
Restriction endonucleases | Thermo Scientific | Obviously other vendors, enzymes can be used | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | Other vendors can be used as well. We have positively tested beds form Sigma |
Synthesis chemicals including phosphoramidities | Carl Roth | Other vendors can be used as well | |
Synthesis columns (different sizes) | Biosset | ||
T4 DNA ligase | Thermo Scientific | EL0011 | Any other ligase can be used |