El sistema de edición del genoma CRISPR-Cas9 es un editor de genoma fácil de usar que se ha utilizado en especies modelo y no modelo. Aquí presentamos una versión basada en proteínas de este sistema que se utilizó para introducir un codón de parada prematura en un gen de apareamiento de un hongo ascomiceto filamentoso no modelo.
El sistema de edición del genoma CRISPR-Cas9 es una herramienta molecular que se puede utilizar para introducir cambios precisos en los genomas de especies modelo y no modelo por igual. Esta tecnología se puede utilizar para una variedad de enfoques de edición del genoma, desde nocauts genéticos y knockins hasta cambios más específicos como la introducción de algunos nucleótidos en un lugar específico. La edición del genoma se puede utilizar para multitud de aplicaciones, incluyendo la caracterización funcional parcial de genes, la producción de organismos transgénicos y el desarrollo de herramientas de diagnóstico. En comparación con las estrategias de edición genética disponibles anteriormente, el sistema CRISPR-Cas9 ha demostrado ser fácil de establecer en nuevas especies y cuenta con una alta eficiencia y especificidad. La razón principal de esto es que la herramienta de edición utiliza una molécula de ARN para apuntar al gen o la secuencia de interés, haciendo que el diseño de moléculas diana sea sencillo, dado que las reglas de emparejamiento base estándar pueden ser explotadas. Al igual que otros sistemas de edición del genoma, los métodos basados en CRISPR-Cas9 también requieren protocolos de transformación eficientes y eficaces, así como acceso a datos de secuencias de buena calidad para el diseño del ARN objetivo y las moléculas de ADN. Desde la introducción de este sistema en 2013, se ha utilizado para diseñar genéticamente una variedad de especies modelo, incluyendo Saccharomyces cerevisiae, Arabidopsis thaliana, Drosophila melanogaster y Mus musculus. Posteriormente, los investigadores que trabajan en especies no modelo han aprovechado el sistema y lo han utilizado para el estudio de genes implicados en procesos tan diversos como el metabolismo secundario en hongos, crecimiento de nematodos y resistencia a enfermedades en plantas, entre muchos otros. Este protocolo detallado a continuación describe el uso del protocolo de edición del genoma CRISPR-Cas9 para el truncamiento de un gen implicado en el ciclo sexual de Huntiella omanensis,un hongo ascomiceto filamentoso perteneciente a la familia Ceratocystidaceae.
La creciente disponibilidad de genomas y transcriptomas de alta calidad, completamente ensamblados, ha mejorado considerablemente la capacidad de estudiar una amplia variedad de procesos biológicos en una serie de organismos1. Esto es cierto tanto para las especies modelo como para las no modelos, muchas de las cuales pueden ofrecer una comprensión más diversa de los procesos biológicos. Estos tipos de datos se pueden utilizar para el descubrimiento de genes, la identificación de redes de transcripción y comparaciones de genoma completo y transcriptoma, cada uno de los cuales viene con su propio conjunto de aplicaciones. Sin embargo, mientras que los genes están siendo predichos, anotados y putativamente vinculados a diferentes vías funcionales a un ritmo nunca antes visto, la caracterización funcional de estos genes permanece detrás, limitada por los kits de herramientas moleculares disponibles para muchas especies. Este es particularmente el caso de las especies no modelo, donde los datos genómicos son relativamente fáciles de generar, pero donde la caracterización molecular posterior ha sido casi imposible1,2.
La caracterización parcial de las funciones de genes específicos importantes para la biología de las especies fúngicas se puede lograr mediante experimentos de knockout o knockin seguidos de análisis fenotípicos de las cepas mutantes3. Estos dos sistemas se basan enteramente en la disponibilidad de protocolos de ingeniería genética, incluyendo, como mínimo, un sistema de transformación y un sistema de edición genética. Hay una serie de diferentes sistemas de transformación que se han desarrollado en una variedad de hongos filamentosos4. Sistemas físicos como los que se basan en la biolística y la electroporación se han desarrollado en Trichoderma harzianum5 y Aspergillus niger6, respectivamente. Los sistemas que utilizan sustancias químicas como el cloruro de calcio o el acetato de litio se han desarrollado en Neurospora crassa7. Por último, los sistemas biológicos que dependen del uso de Agrobacterium tumefaciens para la transformación se han utilizado con éxito en Ceratocystis albifundus8.
En contraste con la disponibilidad de diferentes protocolos de transformación, los sistemas de edición del genoma son menos abundantes. Muchos de los experimentos tradicionales de caracterización funcional realizados en hongos filamentosos utilizaron una construcción de nocaut de marcador dividido en forma de marcador seleccionable flanqueado por regiones de homología a la región o gen objetivo en el genoma3. El método se basa en la reparación del ADN dirigida por la homología (HR), que alberga la recombinación homóloga entre la construcción de knockout y la región de interés. Este evento de recombinación resulta en la sustitución del gen de interés por la secuencia del marcador seleccionable. Desafortunadamente, si bien esto tuvo éxito en muchas especies incluyendo Cercospora nicotianae10, Aspergillus fumigatus11 y Grosmannia clavigera12, las tasas de recombinación homóloga son muy variables en diferentes especies de hongos, lo que hace de este un protocolo ineficiente y a veces inutilizable en ciertas especies3.
Otros sistemas de edición del genoma, incluidos los que hacen uso de nucleasas de zinc-dedo (ZFN) y nucleasas efectores de tipo activador de transcripción (TALENs) representaron una gran mejora en los sistemas más antiguos, particularmente dadas sus capacidades para realizar cambios específicos y específicos13. Tanto las ZFN como las TALENs se componen de una proteína de nucleasa y una proteína que es capaz de reconocer secuencias específicas de nucleótidos13. Tras el reconocimiento, la nucleasa induce una rotura de ADN de doble cadena que puede facilitar la introducción de mutaciones específicas. Para lograr cambios en el genoma, la región de proteínas que reconoce la secuencia de nucleótidos debe diseñarse específicamente para cada experimento. Debido a esta dependencia de las interacciones proteína-ácido nucleico para guiar la edición, diseño y producción de las moléculas de orientación para cada experimento knockout o knockin es difícil y trabajo intensivo14,,15. Ilustrando estos desafíos, muy pocos hongos filamentosos han sido sometidos a la edición del genoma utilizando estos sistemas. Un ejemplo es el sistema basado en TALENs que se desarrolló en el hongo de la explosión de arroz, Magnaporthe oryzae16.
Podría decirse que la mayor revolución en el campo de la edición del genoma fue el descubrimiento y posterior desarrollo del sistema CRISPR-Cas9- un editor del genoma que permite la escisión dirigida de una secuencia de interés por una endonucleasa que es guiada por una molécula de ARN. Esto fue una gran mejora en los editores del genoma previamente desarrollados que se basaron en las interacciones entre proteínas y ácidos nucleicos, ya que la principal ventaja del sistema CRISPR-Cas9 es que se basa en una molécula de ARN para dirigirse a la región de interés. Esto significa que el sistema se basa en una interacción ARN-ADN y, por lo tanto, las reglas de emparejamiento base estándar se pueden explotar al diseñar cada experimento15.
El sistema CRISPR-Cas9, tal como se detalla aquí, se compone de tres componentes principales: un ARN guía único (sgRNA), la enzima Cas9 y un ADN de donante (dDNA)17. El sgRNA se compone de una región de 20 nucleótidos llamada protoespacialismo, así como una región más larga llamada andamio18. La región del protoespacial se utiliza para guiar el sistema de edición a la región de destino y, por lo tanto, se rediseña para cada experimento. El andamio es la región de ARN que se une físicamente a la enzima Cas9 para formar la ribonucleoproteína (RNP) y por lo tanto es idéntica independientemente de la región a la que se va a dirigir. La enzima Cas9 facilita físicamente el escote del ADN objetivo, utilizando el protoespacialista como guía para identificar esta región19. El último componente, el dDNA, es opcional y su uso depende del experimento20en particular. El dDNA alberga la secuencia que debe insertarse específicamente en la región que está cortando la enzima Cas9, y por lo tanto es ideal para experimentos de knockina genética en los que se está introduciendo un gen en el genoma o para experimentos de eliminación de genes en los que se introduce un gen de resistencia a los antibióticos u otro marcador seleccionable para reemplazar el gen de interés. El dDNA también se puede diseñar de tal manera que introduzca secuencias novedosas en el genoma. Por ejemplo, como se detalla a continuación, es posible introducir un codón de parada en el marco en una región determinada en el gen de interés cuando se requiere un truncamiento del gen21. Otras aplicaciones incluyen la mutación de regiones específicas del gen, como un dominio funcional22,o la introducción de una secuencia de etiquetado23.
Una de las principales ventajas de utilizar el sistema CRISPR-Cas9 es su versatilidad24. Un ejemplo de esta adaptabilidad es que la enzima Cas9 se puede introducir en la célula huésped en una de sus tres formas- ADN, ARN o proteína- dependiendo del sistema de transformación particular que se utilice. Cuando se introduce en forma de ADN, el gen cas9 se incluye a menudo en un plásmido junto con un marcador seleccionable, un casete para expresar el sgRNA y, si es necesario, un casete que codifica la secuenciadDNA 25. La principal ventaja de este sistema es que sólo una sola construcción necesita ser transformada en la célula y la transformación exitosa asegura que todos los componentes necesarios para la edición del genoma mediado por CRISRP-Cas9 están presentes. Sin embargo, este método se basa en la disponibilidad de un sistema de expresión para la especie anfitriona. Para que Cas9 induzca con éxito el daño del ADN, debe expresarse a niveles altos y, por lo tanto, se requiere un promotor adecuado y potencialmente específico. Para las especies no modelo en las que estos promotores aún no se han desarrollado, esto puede ser un factor detracción y, por lo tanto, la capacidad de introducir Cas9 en forma de ARN o proteína puede ser una opción más atractiva. La introducción del ARN en la célula trae sus propios desafíos, particularmente en que el ARN es inestable y puede no sobrevivir al proceso de transformación. Además, cuando se introduce en forma de ADN o ARN, la secuencia génica Cas9 puede necesitar estar optimizada para codón para su uso en el sistema host particular17. Por ejemplo, el gen cas9 de Streptococcus pyogenes puede no funcionar en una célula huésped de mamíferos y un gen cas9 optimizado para su uso en una célula de mamífero puede no funcionar en una célula vegetal. Todos estos desafíos se pueden superar utilizando la forma proteica de Cas9, que, junto con el sgRNA, se puede ensamblar en un RNP y transformarse en la célula huésped26,,27. Este sistema no se basa en ningún sistema de expresión endógeno ni en la optimización de codones y, por lo tanto, debería funcionar en la mayoría de las especies no modelo. La desventaja del sistema basado en proteínas es que no es compatible con sistemas de transformación basados en ADN como la transferencia mediada por Agrobacterium. Por lo tanto, para que el método basado en proteínas funcione, es necesario disponer de un protocolo de transformación como los que se basan en protoplastos o biolística. Este sistema basado en RNP se ha utilizado con éxito en los hongos filamentosos, Fusarium oxysporum26 y Mucor circinelloides27.
Huntiella omanensis, un miembro de la familia Ceratocystidaceae, es un hongo cosmopolita que a menudo se encuentra en plantas leñosas recién heridas28. Si bien hay datos de genoma y transcriptoma de alta calidad disponibles para esta especie28,,29,,30,no se han desarrollado protocolos de edición de transformación o genoma. Hasta la fecha, la investigación sobre H. omanensis se ha centrado en los componentes genéticos subyacentes de su ciclo sexual29,,31. Este hongo presenta un ciclo sexual heterotálico típico, con reproducción sexual que ocurre exclusivamente entre los aislados de los tipos de apareamiento MAT1-1 y MAT1-231. Por el contrario, los aislados MAT1-2 de la Huntiella moniliformis estrechamente relacionada son capaces de reproducirse sexualmente independientemente y completar un ciclo sexual en ausencia de una pareja MAT1-131. Esta diferencia en las capacidades sexuales se cree que es, al menos en parte, debido a una diferencia importante en el gen de apareamiento, MAT1-2-7, donde H. omanensis alberga una longitud completa y una copia intacta, mientras que el gen se trunca gravemente en H. moniliformis29,31. Para caracterizar aún más el papel de este gen en la reproducción sexual, el gen MAT1-2-7 de H. omanensis se truncó para imitar el truncamiento observado en H. moniliformis21.
El protocolo siguiente detalla la transformación de H. omanensis y el truncamiento del gen MAT1-2-7 utilizando una versión basada en proteínas del sistema de edición del genoma CRISPR-Cas9. Este protocolo se desarrolló después de que los enfoques de reemplazo genético basado en recombinación homóloga y la edición del genoma CRISPR-Cas9 basada en plásmidos no tuvieron éxito.
El protocolo para la transformación exitosa de H. omanensis y la edición del gen MAT1-2-7 se demostró mediante la introducción de un codón de parada prematura en el marco junto con un gen para la resistencia a la higromicina B21. Esto se logró utilizando una versión basada en proteínas del sistema de edición del genoma CRISPR-Cas9. El experimento implicó la transcripción in vitro del sgRNA, el ensamblaje basado en PCR del dDNA y la cointravención de estos dos ácidos nucleicos con una enzima Cas9 disponible comercialmente en protoplastos extraídos de H. omanensis
A diferencia de otros protocolos que dependen de la disponibilidad de muchas otras herramientas moleculares, el protocolo descrito anteriormente se puede utilizar con éxito en especies para las que la caja de herramientas molecular está todavía bastante limitada21. El protocolo se basa únicamente en un sistema de transformación establecido y en la disponibilidad de datos NGS, preferiblemente en la secuencia completa del genoma. Si bien un sistema de transformación eficaz puede tomar alguna optimización en una especie para la que esto no está disponible, hay muchos protocolos diferentes disponibles para una variedad de especies. Además, los datos del genoma están cada vez más disponibles incluso para las especies más oscuras y son cada vez más fáciles de generar de novo si aún no existen.
Dada la longitud del protocolo, hay muchos pasos en los que se pueden introducir modificaciones y donde puede ser necesario solucionar problemas. Esto es particularmente cierto en los pasos que se consideran específicos de las especies. Por ejemplo, hay muchos pasos de incubación en este protocolo que deben llevarse a cabo a temperaturas específicas y durante períodos de tiempo específicos con el fin de generar tipos de células importantes para el experimento. Por lo tanto, estos pasos requerirían una optimización específica de la especie. Siempre que sea posible, se han proporcionado micrografías de las células o fases de crecimiento particulares para ayudar a transferir este protocolo a una especie diferente(Fig. ure 1). El tipo y la concentración de enzimas utilizadas para degradar las paredes celulares de las células fúngicas con el fin de liberar los protoplastos también será específico de las especies de hongos que se están estudiando. En este protocolo, sólo se utiliza una fuente de enzimas de lansión, mientras que se requieren diferentes combinaciones de enzimas para la extracción de protoplastos en especies como Fusarium verticillioides33. Este paso depende enteramente de la marca química de la pared celular y por lo tanto tendrá que ser optimizado en una base de especie a especie.
Este método es particularmente significativo para aquellos que estudian especies no modelo, ya que no hay dependencia de un sistema de expresión. Un método popular para establecer el sistema de edición del genoma CRISPR-Cas9 es expresar la proteína Cas9, el sgRNA, así como el dDNA de uno o dos plásmidos que se transforman en las células de elección. En este caso, el Cas9 debe ser expresado por un promotor que sea capaz de altos niveles de expresión en el organismo en particular que se está estudiando. Los promotores generales han sido desarrollados para su uso en hongos filamentosos y aunque no son compatibles en todas las especies, permiten una expresión de bajo nivel y se pueden utilizar con éxito para expresar, por ejemplo, genes de resistencia a los antibióticos. Estos promotores, sin embargo, a menudo no permiten altos niveles de expresión y por lo tanto no se pueden utilizar para expresar la proteína Cas9. El uso de una versión basada en proteínas del sistema de edición del genoma CRISPR-Cas9 supera esta limitación y permite que el sgRNA y el dDNA se transformen conjuntamente en la célula con una enzima Cas9 ya producida.
El desarrollo de este sistema basado en proteínas para su uso en H. omanensis se produjo después de muchos intentos fallidos de edición del genoma utilizando tanto el enfoque clásico de marcador dividido como el sistema CRISPR-Cas9 basado en plásmidos. Si bien las eficiencias difieren de una especie a otra, el enfoque de marcador dividido se ha utilizado con éxito con una eficiencia del 100% en especies tan diversas como Alternaria alternata34,35y C. nicotianae36. Por el contrario, la eficiencia de este sistema en H. omanensis fue cero, a pesar de más de 80 eventos independientes de transformación e integración. Del mismo modo, el sistema CRISPR-Cas9 basado en plásmidos se ha utilizado con éxito con altas eficiencias en Trichoderma reesei (>93%)17 y Penicillium chrysogenum (hasta 100%)37. Esto es, de nuevo, en contraste con la utilidad de este sistema en H. omanensis. La expresión suficiente de la proteína Cas9 no fue alcanzable en H. omanensis a pesar de probar una serie de promotores potenciales, incluyendo dos promotores específicos de especies predichas a partir de genes de limpieza. Por lo tanto, este sistema no se pudo utilizar en absoluto. Sin embargo, el uso de la versión basada en proteínas del sistema CRISPR-Cas9 produjo muchos transformantes independientes, dos de los cuales albergaron el dDNA integrado en la ubicación correcta. Además, este experimento se intentó una sola vez y tuvo éxito, ilustrando aún más la facilidad con la que se puede utilizar este sistema.
Las aplicaciones futuras de este protocolo incluyen su optimización y uso en otras especies de las Ceratocistodídaceae. Ya hay una gran cantidad de datos NGS disponibles para estas especies30,,38,,39 y se han realizado estudios sobre su especificidad de huésped40,tasa de crecimiento y virulencia41. Estos estudios pueden ser reforzados por la caracterización funcional de los genes que se cree que están involucrados en estos procesos, investigación que ahora será posible debido a la disponibilidad de un protocolo de transformación y edición del genoma.
En conclusión, la investigación exhaustiva de los genes subyacentes a importantes procesos biológicos en especies no modelos es cada vez más accesible gracias a la disponibilidad de protocolos de edición del genoma fáciles de usar que no se basan en la existencia de amplios recursos biológicos y conjuntos de herramientas moleculares. El estudio de especies no modelos es cada vez más fácil y permitirá el descubrimiento de nuevas vías y desviaciones interesantes de los procesos biológicos estándar que han sido aclarados en especies modelo.
The authors have nothing to disclose.
Este proyecto contó con el apoyo de la Universidad de Pretoria, el Departamento de Ciencia y Tecnología (DST)/National Research Foundation (NRF) Centre of Excellence in Tree Health Biotechnology (CTHB). El proyecto fue también apoyado por la silla DST/NRF SARChI del prof. BD Wingfield en Genómica De los Hongos (número de concesión: 98353), así como por la beca de doctorado NRF del Dr. AM Wilson (108548). Los titulares de subvenciones reconocen que las opiniones, conclusiones y conclusiones o recomendaciones expresadas en este trabajo son las de los investigadores y que los organismos de financiación no aceptan responsabilidad alguna a este respecto.
EcoRI-HF | New England Biolabs, Ipswich, USA | R3101S | |
EnGen Spy Cas9 NLS protein | New England Biolabs, Ipswich, USA | M0646T | Used to assemble the RNP |
Eppendorf 5810 R centrifuge | Eppendorf, Hamberg, Germany | ||
FastStart Taq DNA Polymerase | Sigma, St Louis, USA | 12032902001 | Standard DNA polyermase |
GeneJET Gel Extraction Kit | ThermoFisher Scientific, Waltham, USA | K0691 | |
HindIII-HF | New England Biolabs, Ipswich, USA | R3104S | |
HiScribeTM T7 Quick High Yield RNA synthesis kit | New England Biolabs, Ipswich, USA | E2050S | |
Hygromycin B from Streptomyces hygroscopicus | Sigma, St Louis, USA | 10843555001 | |
Infors HT Ecotron Shaking Incubator | Infors AG, Bottmingen, Switzerland | ||
LongAmp Taq DNA Polymerase | New England Biolabs, Ipswich, USA | M0323S | Long-range, high-fidelity DNA polymerase |
Malt extract agar, 2% (MEA) | 20 g ME and 20 g agar in 1 l ddH20 | ||
Malt extract | Sigma, St Louis, USA | 70167-500G | |
Agar | Sigma, St Louis, USA | A5306 | |
Malt Extract broth, 1% (MEB) | Sigma, St Louis, USA | 70167-500G | 2 g ME in 200 ml ddH20 |
Malt Extract broth, 2% (MEB) | Sigma, St Louis, USA | 70167-500G | 4 g ME in 200 ml ddH20 |
Miracloth | Merck Millipore, New Jersey, USA | 475855 | |
Nylon membrane (positively charged) | Sigma, St Louis, USA | 11209299001 | |
Osmotic control medium (OCM) | 0.3% yeast extract, 20% sucrose, 0.3% casein hydrolysate | ||
Casein Hydrolysate | Sigma, St Louis, USA | 22090 | |
Sucrose | Sigma, St Louis, USA | 84097 | |
Yeast extract | Sigma, St Louis, USA | Y1625 | |
Osmotic control medium (OCM) agar | Osmotic control medium (OCM) + 1% agar | ||
Agar | Sigma, St Louis, USA | A5306 | |
PCR DIG Labeling Mix | Sigma, St Louis, USA | 11585550910 | |
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific, Waltham, USA | F-530XL | High fidelity DNA polymerase |
Plasmid pcb1004 | N/A | N/A | From: Carroll et al., 1994 |
Presynthesized sgRNA | Inqaba Biotec, Pretoria, South Africa | Ordered as an synthesized dsDNA with specified sequence | |
Proteinase K | Sigma, St Louis, USA | P2308 | |
PTC Solution | 30% polyethylene glycol 8000 in STC buffer from above | ||
Polyethylene glycol 8000 | Sigma, St Louis, USA | 1546605 | |
RNase A | ThermoFisher Scientific, Waltham, USA | 12091021 | |
RNAfold Webserver | Institute for Theoretical Chemistry, University of Vienna | N/A | http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi |
RNAstructure | Mathews Lab | N/A | https://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html |
Sorbitol, 1 M | Sigma, St Louis, USA | 1617000 | 182.17g sorbitol in 1 l ddH20 |
STC Buffer | 20% sucrose, 50 mM Tris-HCl pH 8.00 and 50 mM CaCl2 | ||
Calcium chloride | Sigma, St Louis, USA | 429759 | |
Tris-HCl pH 8.00 | Sigma, St Louis, USA | 10812846001 | |
Sucrose | Sigma, St Louis, USA | 84097 | |
Trichoderma harzianum lysing enzymes | Sigma, St Louis, USA | L1412 | |
Zeiss Axioskop 2 Plus Ergonomic Trinocular Microscope | Zeiss, Oberkochen, Germany |