Des parties génétiques bien caractérisées sont nécessaires à la conception de nouveaux circuits génétiques. Nous décrivons ici une méthode rentable et à haut débit pour caractériser rapidement des parties génétiques. Notre méthode réduit les coûts et le temps en combinant des lysats acellulaires, de l’ADN linéaire pour éviter le clonage et de la manipulation acoustique des liquides pour augmenter le débit et réduire les volumes de réaction.
La caractérisation et le catalogage des parties génétiques sont essentiels à la conception de circuits génétiques utiles. Le fait d’avoir des pièces bien caractérisées permet d’affiner les circuits génétiques, de sorte que leur fonction entraîne des résultats prévisibles. Avec la croissance de la biologie synthétique en tant que domaine, il y a eu une explosion de circuits génétiques qui ont été mis en œuvre dans les microbes pour exécuter des fonctions relatives à la détection, à l’altération métabolique et à l’informatique cellulaire. Ici, nous montrons une méthode rapide et rentable pour caractériser les parties génétiques. Notre méthode utilise du lysat acellulaire, préparé en interne comme support pour évaluer les pièces via l’expression d’une protéine rapporteur. L’ADN modèle est préparé par amplification PCR à l’aide d’amorces peu coûteuses pour ajouter des parties variantes au gène rapporteur, et le modèle est ajouté à la réaction sous forme d’ADN linéaire sans clonage. Les pièces qui peuvent être ajoutées de cette manière comprennent les promoteurs, les opérateurs, les sites de liaison des ribosomes, les isolants et les terminateurs. Cette approche, combinée à l’incorporation d’un manipulateur de liquide acoustique et de plaques à 384 puits, permet à l’utilisateur d’effectuer des évaluations à haut débit de pièces génétiques en une seule journée. En comparaison, les approches de criblage cellulaire nécessitent un clonage long et des temps d’essai plus longs en raison des étapes de normalisation de la culture et de la densité de culture pendant la nuit. De plus, travailler dans un lysat acellulaire permet à l’utilisateur d’exercer un contrôle plus étroit sur les conditions d’expression grâce à l’ajout de composants exogènes et d’ADN à des concentrations précises. Les résultats obtenus grâce au dépistage acellulaire peuvent être utilisés directement dans des applications de systèmes acellulaires ou, dans certains cas, comme moyen de prédire la fonction dans des cellules entières.
Un effort central de la biologie synthétique est de développer des kits d’outils génétiques contenant des parties bien caractérisées, qui peuvent être utilisées pour construire des circuits génétiques1 qui remplissent des fonctions utiles lorsqu’ils sont déployés dans des microbes ou des lysats acellulaires. Les domaines dans lesquels ces circuits génétiques ont gagné du terrain sont la détection 2,3,4, la performance humaine 5,6, les biocarburants 7,8, la production de matériaux 9,10 et l’informatique cellulaire 11. Des registres de parties génétiques normalisées ont été établis12 pour cataloguer les parties nouvelles et existantes en catégories telles que les promoteurs, les opérateurs, les séquences codantes et les terminateurs, pour n’en nommer que quelques-unes. Des efforts tels que le concours international iGEM (Genetically Engineered Machines)13 ont joué un rôle déterminant dans la caractérisation et le catalogage de ces parties génétiques. De nombreuses méthodes ont été développées pour faciliter l’assemblage rapide de ces pièces en circuits génétiques utiles14,15. Des logiciels ont même été développés pour automatiser la composition de pièces bien caractérisées en circuits qui atteignent une fonction souhaitée16. Cependant, l’assemblage de circuits génétiques utiles avec des fonctions prévisibles repose sur la présomption que les trousses d’outils génétiques contiennent des parties génétiques bien caractérisées. En raison de la nécessité de ces trousses d’outils pour l’avancement de la biologie synthétique, de nombreux efforts pour mieux cataloguer les circuits et les pièces avec des données de caractérisation appropriées ont été décrits 17,18,19,20,21.
Une approche de caractérisation des composants génétiques utilise des systèmes de synthèse de protéines acellulaires (CFPS), qui reconstituent des fonctions cellulaires telles que la transcription et la traduction ex vivo22. Plusieurs études ont démontré le potentiel du CFPS pour le prototypage de composants génétiques 23,24,25,26,27,28,29,30,31,32 que ce soit pour des applications directes dans des systèmes acellulaires ou pour prédire la fonction des constructions génétiques dans les cellules, telles que l’activité relative des parties d’une bibliothèque 29 , optimisation des voies métaboliques27 et charge cellulaire30. Les avantages du prototypage dans CFPS par rapport aux cellules mis en évidence par ces études comprennent l’évitement du clonage fastidieux, un contrôle précis de la concentration de l’ADN et d’autres composants de la réaction, et la capacité de mélanger et de faire correspondre facilement plusieurs constructions d’ADN. L’avantage d’éviter le clonage est particulièrement évident lors de l’utilisation de modèles d’ADN linéaires, qui permettent d’assembler de nouvelles constructions par des méthodes in vitro qui prennent des heures au lieu des jours33. La possibilité de manipuler la concentration de constructions d’ADN et d’autres composants simplement par pipetage rend l’approche encore plus attrayante en permettant une expérimentation à haut débit alimentée par des robots de manipulation de liquides34,35. Bien que des succès dans l’utilisation du CFPS pour le prototypage aient été signalés, il est important de noter qu’il reste à voir dans quels contextes les résultats du CFPS peuvent prédire de manière fiable la fonctionnalité dans les cellules.
Ici, nous présentons une méthode de prototypage CFPS qui met l’accent sur les avantages en termes de vitesse, de débit et de coût par rapport aux approches traditionnelles basées sur les cellules. L’approche est dérivée de nos travaux antérieurs où nous avons utilisé CFPS pour caractériser rapidement une bibliothèque de variantes du promoteur T7 régulées par le facteur de transcription TetR32, élargissant considérablement la petite poignée de variantes de promoteurs T7 réglementées qui étaient disponibles dans la littérature à l’époque36,37. D’autres ont, depuis lors, encore élargi l’éventail de ces promoteurs38. Dans notre méthode, l’assemblage de la construction génétique est accéléré en utilisant la PCR pour amplifier l’ADN modèle via des amorces qui ajoutent des parties génétiques variantes à un gène rapporteur. La manipulation acoustique des liquides dans les plaques à 384 puits est utilisée pour augmenter le débit et diminuer le volume de matériaux requis. Des travaux antérieurs ont démontré l’utilisation réussie de la manipulation acoustique des liquides à des volumes significativement inférieurs39,40 avec une variabilité comparable au pipetage manuel de volumes plus importants 41. En plus de la méthode, nous fournissons des informations de dépannage et une évaluation des économies potentielles de temps et de coûts. Notez que bien que nous incluions ici un protocole pour la production de lysats sans cellules basé sur Sun et al.42, de nombreux autres kits et protocoles commerciaux43,44 devraient également fonctionner. De même, alors que nous démontrons la méthode de caractérisation des variantes promotrices32, d’autres parties peuvent être interchangées par amplification PCR, telles que les riborégulateurs, les sites de liaison des ribosomes (RBS), les isolants, les marqueurs de protéines et les terminateurs. Nous espérons que cette méthodologie pourra aider la communauté de la biologie synthétique à continuer d’augmenter le nombre de pièces caractérisées pour l’assemblage de circuits génétiques prévisibles avec une fonction utile.
Les protocoles décrits ici fournissent un moyen rentable et rapide de cribler des parties génétiques via l’expression d’une protéine rapporteur par CFPS. Des parties génétiques bien caractérisées sont cruciales pour la conception de circuits génétiques prévisibles avec une fonction utile. Cette méthodologie augmente le débit et réduit le temps nécessaire pour cribler de nouvelles parties génétiques en supprimant la nécessité de travailler dans les cellules vivantes, tout en conservant la fonctionnalité qui reflète l’environnement cellulaire en conservant le processus métabolique d’expression des protéines dans le lysat cellulaire. Notre protocole peut être effectué en 1 jour après réception des amorces (~2,5-6 h pour la préparation de la réaction, 2-16 h pour la réaction CFPS; Figure 1), contre au moins 3 jours pour le clonage traditionnel (1 jour pour l’assemblage et la transformation de la construction, la vérification de la séquence des clones et la culture des cellules pour l’évaluation). Nous estimons en outre que le coût par construction utilisant l’ADN linéaire est d’environ un tiers du clonage traditionnel (78 $ contre 237 $; Tableau supplémentaire 1) méthode. Les services de synthèse commerciale offrent actuellement un minimum de 4 jours ouvrables selon la taille, bien qu’ils auraient des coûts similaires à ceux de notre méthode si les fragments linéaires sont criblés directement dans CFPS (78 $ contre 91 $); Nous n’avons pas vérifié cette approche. Le coût d’évaluation d’une pièce avec CFPS est faible par rapport à la génération de l’ADN modèle (0,05 $ / réaction22 contre 78 $ par modèle), bien qu’il faille noter que les coûts de démarrage des réactifs en vrac et de l’équipement de lyse sont d’au moins plusieurs milliers de dollars. L’utilisation d’un manipulateur de liquide acoustique n’améliore que marginalement les coûts en permettant de réduire les volumes jusqu’à 0,5 μL40; L’avantage le plus significatif est la réduction du temps de préparation des réactions (~10 min vs jusqu’à 1 h, selon le nombre de réactions), en particulier lorsque la préparation d’un grand nombre de réactions soulève des préoccupations quant à la réaction préparée en restant assis pendant de longues périodes avant l’incubation.
Bien que rapide et rentable, les limites quant au moment où le prototypage CFPS prédit adéquatement la fonction in vivo restent à voir. Par exemple, toute réactivité croisée avec l’ADN génomique ne sera pas détectée en raison de l’ablation du génome de l’hôte pendant la production du système CFPS. En outre, les concentrations de composants peuvent être inférieures de 1 à 2 ordres de grandeur dans CFPS que dans les cellules51, ce qui est susceptible d’affecter le comportement de certaines parties en raison de différentes conditions d’encombrement macromoléculaire. En outre, la capacité de l’ADN linéaire à prédire la fonction in vivo peut être limitée, par exemple, lorsque la structure secondaire de l’ADN joue un rôle important. Une dernière limitation est que les constructions ne sont pas vérifiées avant de tester les fonctions. Il peut y avoir des cas où la partie caractérisée n’est pas réellement alignée avec la séquence théorique prévue. Toutes ces limitations peuvent être atténuées en validant un sous-ensemble des pièces criblées par cette méthode dans l’application in vivo prévue.
Nous avons initialement développé cette méthodologie pour étudier les effets du changement de position de l’opérateur sur les promoteurs hybrides T7-tetO 32. Nous avons présenté les protocoles ici dans un format plus générique, de sorte qu’ils puissent être appliqués aux promoteurs, aux opérateurs, aux séquences de liaison aux ribosomes, aux isolants et aux terminateurs. Ces parties génétiques peuvent être ajoutées à l’extrémité 5′ ou 3′ du gène rapporteur par PCR à l’aide d’amorces pour chaque conception, évitant ainsi la nécessité de synthétiser ou de cloner chaque variante à tester. Les produits PCR résultants servent d’ADN modèle pour l’évaluation via l’expression d’une protéine rapporteure. Dans notre travail, le protocole de purification d’affinité fourni ici a été utilisé pour TetR et GamS. La même procédure peut être utilisée pour l’expression et la purification d’autres répresseurs, activateurs, polymérases, facteurs sigma et autres protéines apparentées à une partie génétique d’intérêt, bien que des modifications puissent être nécessaires pour la protéine désirée exprimée. La purification et le titrage de ces protéines dans les réactions CFPS permettent une caractérisation plus détaillée d’une partie génétique particulière. Enfin, il existe de nombreux protocoles alternatifs CFPS et chacun devrait se prêter à la partie de la méthodologie consacrée à l’examen préalable des parties. À titre d’exemple, nous n’incluons pas d’étape de dialyse dans ce protocole, que d’autres ont jugée importante pour l’expression des promoteurs bactériens natifs22. Il est également possible de faire varier les concentrations des composants constitutifs sous-jacents du CFPS. L’utilisation de la manipulation de liquides améliore la capacité de tester la myriade de conditions en augmentant le débit et en diminuant les matériaux requis34,35.
Un domaine qui peut nécessiter un dépannage important est l’optimisation du manipulateur de liquide acoustique. La distribution acoustique du liquide doit être optimisée pour chaque composant transféré et il est fortement recommandé d’exécuter des contrôles pour vérifier la distribution et la reproductibilité appropriées avant de collecter des données. Le type de plaque source et le réglage de la classe de liquide idéal dépendront du liquide spécifique à distribuer et de ses composants. Il n’est pas recommandé d’utiliser des plaques enrobées d’amine pour distribuer l’ADN, car le revêtement d’amine peut interagir avec l’ADN. Il convient également de noter que la capacité de distribuer des concentrations plus élevées de certains composants peut dépendre du modèle acoustique de manutention de liquides. Un transfert de liquide d’essai peut être effectué en le distribuant sur un joint de plaque de papier d’aluminium pour visualiser la formation réussie de gouttelettes; Cependant, ce test fournit des informations limitées et les gouttelettes de différents paramètres peuvent sembler identiques. L’utilisation d’un colorant soluble dans l’eau, comme la tartrazine, peut être utilisée pour vérifier avec plus de précision que le volume correct est supprimé avec un réglage ou un flux de travail donné (voir Résultats représentatifs). La programmation optimale des transferts de liquides peut également influer sur l’exactitude et la cohérence des données générées; pour les transferts de >1 μL d’un puits source à un puits de destination, nous avons constaté que les transferts séquentiels de ≤1 μL devraient être programmés pour réduire la variabilité systématique du puits au puits (figure 4). Enfin, les volumes morts théoriques et réels des puits sources peuvent varier considérablement en fonction du type de plaque source, du réglage de la classe de liquide et des composants du liquide spécifique; L’utilisation de la fonction d’étude acoustique du manipulateur de liquides pour évaluer les volumes de puits avant d’exécuter un programme peut aider à évaluer la précision avec laquelle l’instrument est capable de mesurer un liquide particulier.
Les performances de réaction CFPS peuvent varier lorsque l’on compare les résultats entre différents utilisateurs, lots de matériaux, lecteurs de plaques et laboratoires41. Pour les cas où de telles comparaisons sont nécessaires lors du prototypage de circuits génétiques, nous recommandons d’inclure des réactions de contrôle interne avec des promoteurs constitutifs standard dans chaque plaque de réaction pour aider à normaliser les résultats dans les configurations expérimentales. La méthode de préparation de l’ADN peut également contribuer de manière majeure à l’activité du CFPS; L’inclusion d’une étape de précipitation de l’éthanol est recommandée. De plus, la composition réactionnelle optimale peut varier selon le lot d’extrait34. Il a été démontré que les concentrations optimales de glutamate de magnésium et de glutamate de potassium, en particulier, varient selon le lot42 ou avec la protéine promotrice ou rapporteur utilisée24. Les concentrations de ces composants doivent être optimisées par criblage à travers plusieurs concentrations de chaque composant par construction génétique et par préparation d’extrait cellulaire afin de déterminer les conditions optimales pour l’expression des protéines. Enfin, les meilleures pratiques pour une performance constante de la réaction CFPS comprennent un mélange minutieux, un pipetage minutieux et une uniformité dans la préparation de chaque composant du réactif.
Au-delà de la caractérisation de pièces individuelles, la même méthode peut être utilisée pour cribler des combinaisons de pièces qui forment des circuits complexes, tels que les circuits logiques16 ou les oscillateurs52,53. Cette méthode peut également être appliquée au criblage et à l’optimisation des biocapteurs pour des applications dans le diagnostic épidémiologique 54,55,56,57 ou la détection et la quantification des dangers 3,58,59. L’application de techniques basées sur l’IA telles que l’apprentissage actif34 peut également être associée à la nature à haut débit de cette méthode pour conduire une exploration rapide des espaces de conception biologique complexes. En fin de compte, nous envisageons cette approche pour soutenir les temps de développement accélérés pour de nouveaux modèles génétiques en biologie synthétique.
The authors have nothing to disclose.
Ce travail a été rendu possible grâce au programme de recherche appliquée pour l’avancement des priorités scientifiques et technologiques du Bureau du secrétaire à la Défense. Nous remercions Scott Walper (Naval Research Laboratory) pour avoir fourni le stock de sfGFP utilisé, et Zachary Sun et Abel Chiao (Tierra Biosciences) pour les discussions fructueuses liées au prototypage avec des systèmes sans cellules et au dépannage connexe de la manipulation acoustique des liquides.
2x YT medium | Sigma-Aldrich | Y2377-250G | Alternative to making 2xYT media |
Acetic Acid | J.T. Baker | 9508-01 | S30 Buffer B |
Agar | Bacto | 214010 | For plating cells |
Chromatography column (5 cm diameter) | BIO-RAD | 731-1550 | Used for protein purification. |
Destination plate | Thermo Scientific Nunc plate | 142761 | For CFPS reactions |
DMSO | Sigma-Aldrich | D2650 | For dialysis buffer |
DpnI | NEB | R0176L | For digestion of plasmid templates |
DTT | Roche | 20871723 | S30 Buffer B |
E. coli BL21(DE3) Rosetta2 | Novagen | 70954 | Cell line used for production of lysate and purified proteins |
Echo acoustic liquid handler | Labcyte | 525 | Acoustic liquid handler |
French pressure cell | Thermo Spectronic | FA-078 | For lysing cells for CFPS |
Imidazole | Sigma-Aldrich | 56750 | For buffers |
Impermeable plastic sealable lid | Thermo | 232702 | Plate seal |
IPTG | RPI | I56000-25.0 | Used for protein induction. |
K-Glu | Sigma-Aldrich | g1501-500G | S30 Buffer B |
Labcyte Echo source plate | Labcyte | PL-05525 | For use with Echo acoustic liquid handler |
Mg-Glu | Sigma-Aldrich | 49605-250G | S30 Buffer B |
NaCl | Sigma-Aldrich | S7653-250G | For buffers |
NaHPO4 | Sigma-Aldrich | 71505 | For dialysis buffer |
NaOH | Mallinckrodt Chemicals | 7708-10 | For making 2xYT media. Currently not produced by Mallinckrodt. Alternate: Sigma-Aldrich S0899 |
Ni-NTA resin | Invitrogen | R901-15 | For production of purified proteins |
PCR H2O | Ambion | AM9937 | PCR of linear templates |
Plate Reader | BioTek | H10 | Plate reader used |
Q5 PCR Master Mix | NEB | M0494S | PCR of linear templates |
QIAquick Gel Extraction Kit | Qiagen | 28606 | PCR of linear templates |
QIAquick PCR Purification Kit | Qiagen | 28004 | PCR of linear templates |
QSonica Ultrasonic Processor | Qsonica | Q700 | Cell disruption during protein purification |
RTS Amino Acid Sampler | biotechrabbit | BR1401801 | Updated supplier from Sun et al. |
Tris | MP | 819623 | S30 Buffer B |
Tris-Cl | Sigma-Aldrich | T5941 | For buffers |
Tryptone | Fluka | T7293 | For making 2xYT media |
Yeast Extract | Bacto | 212750 | For making 2xYT media |