Las partes genéticas bien caracterizadas son necesarias para el diseño de nuevos circuitos genéticos. Aquí describimos un método rentable y de alto rendimiento para caracterizar rápidamente las partes genéticas. Nuestro método reduce el costo y el tiempo al combinar lisados libres de células, ADN lineal para evitar la clonación y manejo acústico de líquidos para aumentar el rendimiento y reducir los volúmenes de reacción.
La caracterización y catalogación de partes genéticas es fundamental para el diseño de circuitos genéticos útiles. Tener partes bien caracterizadas permite el ajuste fino de los circuitos genéticos, de modo que su función resulte en resultados predecibles. Con el crecimiento de la biología sintética como campo, ha habido una explosión de circuitos genéticos que se han implementado en microbios para ejecutar funciones relacionadas con la detección, la alteración metabólica y la computación celular. Aquí, mostramos un método rápido y rentable para caracterizar partes genéticas. Nuestro método utiliza lisado libre de células, preparado internamente como medio para evaluar partes a través de la expresión de una proteína reportera. El ADN de plantilla se prepara mediante amplificación por PCR utilizando cebadores de bajo costo para agregar partes variantes al gen reportero, y la plantilla se agrega a la reacción como ADN lineal sin clonación. Las partes que se pueden agregar de esta manera incluyen promotores, operadores, sitios de unión de ribosomas, aislantes y terminadores. Este enfoque, combinado con la incorporación de un manipulador de líquidos acústico y placas de 384 pocillos, permite al usuario llevar a cabo evaluaciones de alto rendimiento de partes genéticas en un solo día. En comparación, los enfoques de detección basados en células requieren una clonación que consume mucho tiempo y tienen tiempos de prueba más largos debido a los pasos nocturnos de normalización del cultivo y la densidad de cultivo. Además, trabajar en lisado libre de células permite al usuario ejercer un control más estricto sobre las condiciones de expresión mediante la adición de componentes exógenos y ADN en concentraciones precisas. Los resultados obtenidos del cribado libre de células se pueden utilizar directamente en aplicaciones de sistemas libres de células o, en algunos casos, como una forma de predecir la función en células enteras.
Un esfuerzo central de la biología sintética es desarrollar kits de herramientas genéticas que contengan partes bien caracterizadas, que puedan usarse para construir circuitos genéticos1 que lleven a cabo funciones útiles cuando se despliegan en microbios o lisados libres de células. Las áreas en las que tales circuitos genéticos han ganado tracción son la detección 2,3,4, el rendimiento humano5,6, los biocombustibles 7,8, la producción de materiales 9,10 y la computación celular 11. Se han establecido registros de partes genéticas estandarizadas12 para catalogar partes nuevas y existentes en categorías tales como promotores, operadores, secuencias de codificación y terminadores, por nombrar solo algunos. Esfuerzos como el concurso internacional de máquinas modificadas genéticamente (iGEM (International Genetically Engineered Machines)13 han sido fundamentales para caracterizar y catalogar estas partes genéticas. Muchos métodos han sido desarrollados para facilitar el ensamblaje rápido de estas partes en circuitos genéticos útiles14,15. Incluso se ha desarrollado un software para automatizar la composición de piezas bien caracterizadas en circuitos que logran una función deseada16. Sin embargo, el ensamblaje de circuitos genéticos útiles con funciones predecibles se basa en la presunción de que los kits de herramientas genéticas contienen partes genéticas bien caracterizadas. Debido a la necesidad de estos kits de herramientas hacia el avance de la biología sintética, se han descrito numerosos esfuerzos para catalogar mejor los circuitos y las piezas con datos de caracterización apropiados 17,18,19,20,21.
Un enfoque para caracterizar los componentes genéticos hace uso de sistemas de síntesis de proteínas libres de células (CFPS), que reconstituyen funciones celulares como la transcripción y la traducción ex vivo22. Varios estudios han demostrado el potencial de CFPS para la creación de prototipos de componentes genéticos 23,24,25,26,27,28,29,30,31,32 ya sea para aplicaciones directas en sistemas libres de células o para predecir la función de construcciones genéticas en células, como la actividad relativa de partes dentro de una biblioteca 29 , optimización de la vía metabólica27 y carga celular30. Las ventajas de la creación de prototipos en CFPS frente a las células destacadas por estos estudios incluyen evitar la clonación que consume mucho tiempo, un control preciso sobre la concentración de ADN y otros componentes de la reacción, y la capacidad de mezclar y combinar fácilmente múltiples construcciones de ADN. La ventaja de evitar la clonación es especialmente evidente cuando se utilizan plantillas de ADN lineal, lo que permite ensamblar nuevas construcciones mediante métodos in vitro que toman horas en lugar de días33. La capacidad de manipular la concentración de construcciones de ADN y otros componentes simplemente pipeteando hace que el enfoque sea aún más atractivo al permitir la experimentación de alto rendimiento impulsada por robots de manejo de líquidos34,35. Si bien se han reportado éxitos en el uso de CFPS para la creación de prototipos, es importante tener en cuenta que queda por ver en qué contextos los resultados de CFPS pueden predecir de manera confiable la funcionalidad en las células.
Aquí, presentamos un método para la creación de prototipos CFPS que enfatiza las ventajas en velocidad, rendimiento y costo en comparación con los enfoques tradicionales basados en células. El enfoque se deriva de nuestro trabajo anterior en el que utilizamos CFPS para caracterizar rápidamente una biblioteca de variantes de promotores T7 reguladas por el factor de transcripción TetR32, ampliando significativamente el pequeño puñado de variantes reguladas de promotores T7 que estaban disponibles en la literatura en ese momento36,37. Desde entonces, otros han ampliado aún más la gama de tales promotores38. En nuestro método, el ensamblaje de la construcción genética se acelera mediante el uso de PCR para amplificar el ADN de la plantilla a través de cebadores que agregan partes genéticas variantes a un gen reportero. El manejo acústico de líquidos en placas de 384 pocillos se utiliza para aumentar el rendimiento y disminuir el volumen de materiales requeridos. Trabajos anteriores han demostrado el uso exitoso del manejo acústico de líquidos en volúmenes significativamente más bajos39,40 con una variabilidad comparable al pipeteo manual de volúmenes más grandes 41. Además del método, proporcionamos información de solución de problemas y una evaluación de posibles ahorros de costos y tiempo. Tenga en cuenta que si bien incluimos un protocolo para producir lisados libres de células basado en Sun et al.42 aquí, muchos otros kits y protocolos comerciales43,44 también deberían funcionar. Del mismo modo, mientras demostramos el método para la caracterización de las variantes promotoras32, otras partes pueden intercambiarse mediante amplificación por PCR, como riboreguladores, sitios de unión a ribosomas (RBS), aisladores, etiquetas de proteínas y terminadores. Esperamos que esta metodología pueda ayudar a la comunidad de biología sintética a continuar aumentando el número de piezas caracterizadas para el ensamblaje de circuitos genéticos predecibles con función útil.
Los protocolos descritos aquí proporcionan un medio rentable y rápido para detectar partes genéticas a través de la expresión de una proteína reportera por CFPS. Las partes genéticas bien caracterizadas son cruciales para el diseño de circuitos genéticos predecibles con una función útil. Esta metodología aumenta el rendimiento y disminuye el tiempo necesario para detectar nuevas partes genéticas al eliminar el requisito de trabajar en células vivas, al tiempo que conserva la funcionalidad que refleja el entorno celular al retener el proceso metabólico de la expresión de proteínas en el lisado celular. Nuestro protocolo se puede realizar en 1 día después de recibir los cebadores (~ 2.5-6 h para la preparación de la reacción, 2-16 h para la reacción CFPS; Figura 1), en comparación con al menos 3 días para la clonación tradicional (1 día cada uno para el ensamblaje y transformación de constructos, la verificación de la secuencia de clones y el cultivo de células para la evaluación). Estimamos además que el costo por constructo utilizando ADN lineal es aproximadamente un tercio de la clonación tradicional ($78 vs. $237; Cuadro complementario 1) métodos. Los servicios de síntesis comerciales actualmente cotizan un mínimo de 4 días hábiles dependiendo del tamaño, aunque tendrían costos similares a nuestro método si los fragmentos lineales se criban directamente en CFPS ($ 78 vs. $ 91); No hemos verificado este enfoque. El costo de evaluar una pieza con CFPS es pequeño en comparación con la generación del ADN de la plantilla ($ 0.05 / reacción22 frente a $ 78 por plantilla), aunque debe tenerse en cuenta que los costos iniciales de reactivos a granel y equipos de lisis son de al menos varios miles de dólares. El uso de un manipulador de líquidos acústico solo mejora marginalmente los costos al permitir volúmenes más pequeños hasta 0.5 μL40; La ventaja más significativa es la reducción del tiempo para preparar las reacciones (~ 10 min frente a hasta 1 h, dependiendo del número de reacciones), especialmente cuando la preparación de un gran número de reacciones plantea preocupaciones de que la reacción preparada permanezca durante largos tiempos antes de la incubación.
Si bien es rápido y rentable, las limitaciones sobre cuándo la creación de prototipos CFPS predice adecuadamente la función in vivo aún están por verse. Por ejemplo, cualquier reactividad cruzada con el ADN genómico no se detectará debido a la eliminación del genoma del huésped durante la producción del sistema CFPS. Además, las concentraciones de componentes pueden ser 1-2 órdenes de magnitud más bajas en CFPS que en las células51, lo que probablemente afecte el comportamiento de algunas partes como resultado de diferentes condiciones de hacinamiento macromolecular. Además, la capacidad del ADN lineal para predecir la función in vivo puede ser limitada, por ejemplo, cuando la estructura secundaria del ADN juega un papel importante. Una limitación final es que las construcciones no se verifican en secuencia antes de probar las funciones. Puede haber casos en los que la parte caracterizada no esté realmente alineada con la secuencia teórica prevista. Todas estas limitaciones pueden mitigarse validando un subconjunto de las piezas examinadas por este método en la aplicación in vivo prevista.
Originalmente desarrollamos esta metodología para investigar los efectos del cambio de la posición del operador en promotores híbridos T7-tetO 32. Hemos presentado los protocolos aquí en un formato más genérico, de modo que se pueden aplicar a promotores, operadores, secuencias de unión a ribosomas, aislantes y terminadores. Estas partes genéticas se pueden agregar al extremo 5′ o 3′ del gen reportero mediante PCR utilizando cebadores para cada diseño, obviando la necesidad de síntesis o clonación de cada variante a probar. Los productos de PCR resultantes sirven como ADN de plantilla para la evaluación a través de la expresión de una proteína reportera. En nuestro trabajo, el protocolo de purificación de afinidad proporcionado aquí se utilizó para TetR y GamS. El mismo procedimiento se puede utilizar para la expresión y purificación de otros represores, activadores, polimerasas, factores sigma y otras proteínas afines a una parte genética de interés, aunque pueden ser necesarias modificaciones para la proteína deseada que se expresa. La purificación y titulación de estas proteínas en reacciones CFPS permite una caracterización más detallada de una parte genética particular. Por último, existen numerosos protocolos alternativos de CFPS y cada uno de ellos debería ser susceptible de la parte de selección de piezas de la metodología. Como ejemplo, no incluimos un paso de diálisis en este protocolo, que otros han encontrado importante para la expresión de promotores bacterianos nativos22. También es posible variar las concentraciones de los componentes constitutivos subyacentes de la PPC. El uso de la manipulación de líquidos mejora la capacidad de probar la miríada de condiciones al aumentar el rendimiento y disminuir los materiales requeridos34,35.
Un área que puede requerir una solución de problemas significativa es la optimización del manejador de líquidos acústico. La dispensación acústica del manipulador de líquidos debe optimizarse para cada componente que se transfiere y se recomienda encarecidamente ejecutar controles para verificar la distribución adecuada y la reproducibilidad antes de recopilar datos. El tipo de placa de origen ideal y la configuración de la clase de líquido dependerán del líquido específico que se dispensará y sus componentes. No se recomienda usar placas recubiertas de aminas para dispensar ADN, ya que el recubrimiento de amina puede interactuar con el ADN. También debe tenerse en cuenta que la capacidad de dispensar concentraciones más altas de ciertos componentes puede depender del modelo de manipulador de líquidos acústico. Se puede realizar una transferencia de líquido de prueba dispensando en un sello de placa de aluminio para visualizar la formación exitosa de gotas; Sin embargo, esta prueba proporciona información limitada y las gotas de diferentes configuraciones pueden parecer idénticas. El uso de un colorante soluble en agua, como la tartrazina, se puede utilizar para verificar con mayor precisión que se dispensa el volumen correcto con un entorno o flujo de trabajo determinado (consulte Resultados representativos). La programación óptima de las transferencias de líquidos también puede influir en la precisión y consistencia de los datos generados; para transferencias >1 μL de un pozo fuente a un pozo de destino, hemos encontrado que las transferencias secuenciales de ≤1 μL deben programarse para reducir la variabilidad sistemática de pozo a pozo (Figura 4). Por último, los volúmenes muertos de pozo fuente teóricos y reales pueden variar drásticamente según el tipo de placa fuente, la configuración de la clase de líquido y los componentes del líquido específico; El uso de la función de inspección acústica de manejo de líquidos para evaluar los volúmenes del pozo antes de ejecutar un programa puede ayudar a medir con qué precisión el instrumento puede medir un líquido en particular.
El rendimiento de la reacción CFPS puede variar al comparar los resultados entre diferentes usuarios, lotes de materiales, lectores de placas y laboratorios41. Para los casos en que se requieren tales comparaciones al crear prototipos de circuitos genéticos, recomendamos incluir reacciones de control interno con promotores constitutivos estándar en cada placa de reacción para ayudar a normalizar los resultados en configuraciones experimentales. El método de preparación del ADN también puede contribuir en gran medida a la actividad de CFPS; Se recomienda la inclusión de un paso de precipitación de etanol. Además, la composición óptima de la reacción puede variar según el lote de extracto34. Se ha demostrado que las concentraciones óptimas de glutamato de magnesio y glutamato de potasio, en particular, varían según el lote42 o con la proteína promotora o informadora utilizada24. Las concentraciones de estos componentes deben optimizarse mediante el cribado a través de varias concentraciones de cada componente por construcción genética y por preparación de extracto celular para determinar las condiciones óptimas para la expresión de proteínas. Finalmente, las mejores prácticas para un rendimiento de reacción CFPS consistente incluyen una mezcla completa, un pipeteo cuidadoso y consistencia en la preparación de cada componente del reactivo.
Más allá de la caracterización de partes individuales, el mismo método se puede utilizar para filtrar combinaciones de partes que forman circuitos complejos, como circuitos lógicos16 u osciladores52,53. Este método también se puede aplicar a la detección y optimización de biosensores para aplicaciones en diagnóstico epidemiológico 54,55,56,57 o detección y cuantificación de peligros 3,58,59. La aplicación de técnicas impulsadas por IA, como el aprendizaje activo34, también se puede combinar con la naturaleza de alto rendimiento de este método para impulsar la exploración rápida de espacios de diseño biológico complejos. En última instancia, prevemos que este enfoque apoye tiempos de desarrollo acelerados para nuevos diseños genéticos en biología sintética.
The authors have nothing to disclose.
Este trabajo fue posible gracias al programa de Investigación Aplicada para el Avance de las Prioridades de Ciencia y Tecnología de la Oficina del Secretario de Defensa. Agradecemos a Scott Walper (Laboratorio de Investigación Naval) por proporcionar el stock de sfGFP utilizado, y a Zachary Sun y Abel Chiao (Tierra Biosciences) por las fructíferas discusiones relacionadas con la creación de prototipos con sistemas libres de células y la solución de problemas relacionados con el manejo de líquidos acústicos.
2x YT medium | Sigma-Aldrich | Y2377-250G | Alternative to making 2xYT media |
Acetic Acid | J.T. Baker | 9508-01 | S30 Buffer B |
Agar | Bacto | 214010 | For plating cells |
Chromatography column (5 cm diameter) | BIO-RAD | 731-1550 | Used for protein purification. |
Destination plate | Thermo Scientific Nunc plate | 142761 | For CFPS reactions |
DMSO | Sigma-Aldrich | D2650 | For dialysis buffer |
DpnI | NEB | R0176L | For digestion of plasmid templates |
DTT | Roche | 20871723 | S30 Buffer B |
E. coli BL21(DE3) Rosetta2 | Novagen | 70954 | Cell line used for production of lysate and purified proteins |
Echo acoustic liquid handler | Labcyte | 525 | Acoustic liquid handler |
French pressure cell | Thermo Spectronic | FA-078 | For lysing cells for CFPS |
Imidazole | Sigma-Aldrich | 56750 | For buffers |
Impermeable plastic sealable lid | Thermo | 232702 | Plate seal |
IPTG | RPI | I56000-25.0 | Used for protein induction. |
K-Glu | Sigma-Aldrich | g1501-500G | S30 Buffer B |
Labcyte Echo source plate | Labcyte | PL-05525 | For use with Echo acoustic liquid handler |
Mg-Glu | Sigma-Aldrich | 49605-250G | S30 Buffer B |
NaCl | Sigma-Aldrich | S7653-250G | For buffers |
NaHPO4 | Sigma-Aldrich | 71505 | For dialysis buffer |
NaOH | Mallinckrodt Chemicals | 7708-10 | For making 2xYT media. Currently not produced by Mallinckrodt. Alternate: Sigma-Aldrich S0899 |
Ni-NTA resin | Invitrogen | R901-15 | For production of purified proteins |
PCR H2O | Ambion | AM9937 | PCR of linear templates |
Plate Reader | BioTek | H10 | Plate reader used |
Q5 PCR Master Mix | NEB | M0494S | PCR of linear templates |
QIAquick Gel Extraction Kit | Qiagen | 28606 | PCR of linear templates |
QIAquick PCR Purification Kit | Qiagen | 28004 | PCR of linear templates |
QSonica Ultrasonic Processor | Qsonica | Q700 | Cell disruption during protein purification |
RTS Amino Acid Sampler | biotechrabbit | BR1401801 | Updated supplier from Sun et al. |
Tris | MP | 819623 | S30 Buffer B |
Tris-Cl | Sigma-Aldrich | T5941 | For buffers |
Tryptone | Fluka | T7293 | For making 2xYT media |
Yeast Extract | Bacto | 212750 | For making 2xYT media |