O sistema de edição de genomas CRISPR-Cas9 é um editor de genomas fácil de usar que tem sido usado em espécies modelo e não-modelo. Aqui apresentamos uma versão baseada em proteínas deste sistema que foi usada para introduzir um codon stop prematuro em um gene de acasalamento de um fungo ascomiceto não-modelado.
O sistema de edição de genomas CRISPR-Cas9 é uma ferramenta molecular que pode ser usada para introduzir mudanças precisas nos genomas de espécies modelo e não-modelo. Esta tecnologia pode ser usada para uma variedade de abordagens de edição de genomas, desde nocautes genéticos e knockins até mudanças mais específicas, como a introdução de alguns nucleotídeos em um local alvo. A edição de genomas pode ser usada para uma infinidade de aplicações, incluindo a caracterização funcional parcial dos genes, a produção de organismos transgênicos e o desenvolvimento de ferramentas de diagnóstico. Em comparação com as estratégias de edição de genes anteriormente disponíveis, o sistema CRISPR-Cas9 tem se mostrado fácil de estabelecer em novas espécies e possui alta eficiência e especificidade. A principal razão para isso é que a ferramenta de edição usa uma molécula de RNA para atingir o gene ou sequência de interesse, tornando o design da molécula alvo simples, dado que as regras padrão de pareamento de base podem ser exploradas. Semelhante a outros sistemas de edição de genomas, os métodos baseados em CRISPR-Cas9 também requerem protocolos de transformação eficientes e eficazes, bem como acesso a dados de sequência de boa qualidade para o projeto das moléculas de RNA e DNA alvo. Desde a introdução deste sistema, em 2013, tem sido usado para criar geneticamente uma variedade de espécies modelo, incluindo Saccharomyces cerevisiae, Arabidopsis thaliana, Drosophila melanogaster e Mus musculus. Posteriormente, pesquisadores que trabalham com espécies não-modelo têm aproveitado o sistema e utilizado para o estudo de genes envolvidos em processos tão diversos quanto o metabolismo secundário em fungos, crescimento de nematoides e resistência a doenças nas plantas, entre muitos outros. Este protocolo detalhado abaixo descreve o uso do protocolo de edição do genoma CRISPR-Cas9 para a truncação de um gene envolvido no ciclo sexual de Huntiella omanensis, um fungo ascomíceo filamentoso pertencente à família Ceratocystidaceae.
A crescente disponibilidade de genomas e transcritos de alta qualidade, totalmente montados, melhorou muito a capacidade de estudar uma ampla variedade de processos biológicos em uma matriz de organismos1. Isso é verdade tanto para espécies modelo quanto para espécies não-modelo, muitas das quais podem oferecer uma compreensão mais diversificada dos processos biológicos. Esses tipos de dados podem ser usados para a descoberta genética, a identificação de redes de transcrição e comparações de genoma e transcriptome inteiros, cada uma delas com seu próprio conjunto de aplicações. No entanto, enquanto os genes estão sendo previstos, anotados e putativamente ligados a diferentes vias funcionais a uma taxa nunca antes vista, a caracterização funcional desses genes permanece para trás, limitada pelos kits de ferramentas moleculares disponíveis para muitas espécies. Este é particularmente o caso das espécies não-modelo, onde os dados genômicos são relativamente fáceis de gerar, mas onde a caracterização molecular adicional tem sido quase impossível1,,2.
A caracterização parcial das funções de genes específicos importantes para a biologia das espécies fúngicas pode ser alcançada por experimentos de nocaute ou knockin seguidos de análise fenotípica das cepas mutantes3. Esses dois sistemas dependem inteiramente da disponibilidade de protocolos de engenharia genética, incluindo, no mínimo, um sistema de transformação e um sistema de edição genética. Existem uma série de diferentes sistemas de transformação que foram desenvolvidos em uma variedade de fungos filamentosos4. Sistemas físicos como os que dependem da biolística e eletroporação foram desenvolvidos em Trichoderma harzianum5 e Aspergillus niger6 ,respectivamente. Sistemas que utilizam produtos químicos como cloreto de cálcio ou acetato de lítio foram desenvolvidos em Neurospora crassa7. Por fim, sistemas biológicos que dependem do uso de tumefaciens agrobacterium para transformação têm sido utilizados com sucesso no Ceratocystis albifundus8.
Em contraste com a disponibilidade de diferentes protocolos de transformação, os sistemas de edição de genomas são menos abundantes. Muitos dos experimentos tradicionais de caracterização funcional realizados em fungos filamentosos utilizaram uma construção de nocaute de marcador dividido na forma de um marcador selecionável ladeado por regiões de homologia à região-alvo ou gene no genoma3. O método conta com a reparação de DNA direcionada à homologia (RH), que instala recombinação homologiosa entre a construção do nocaute e a região de interesse. Este evento de recombinação resulta na substituição do gene de interesse pela sequência do marcador selecionável. Infelizmente, embora isso tenha sido bem sucedido em muitas espécies, incluindo Cercospora nicotianae10, Aspergillus fumigatus11 e Grosmannia clavigera12, as taxas de recombinação homologos são altamente variáveis entre diferentes espécies fúngicas, tornando este um protocolo ineficiente e às vezes inutilizável em determinadas espécies3.
Outros sistemas de edição de genomas, incluindo aqueles que fazem uso de núcleos de dedo de zinco (ZFNs) e núcleos de efeitos (TALENs) semelhantes a ativação de transcrição (TALENs) representaram uma grande melhoria nos sistemas mais antigos, particularmente dadas suas habilidades para fazer mudanças específicas e direcionadas13. Tanto zfns quanto TALENs são compostos por uma proteína nuclease e uma proteína capaz de reconhecer sequências específicas de nucleotídeos13. Após o reconhecimento, a nuclease induz uma quebra de DNA duplamente encalhada que pode facilitar a introdução de mutações específicas. Para provocar mudanças no genoma, a região proteica que reconhece a sequência de nucleotídeos precisa ser projetada especificamente para cada experimento. Devido a essa dependência de interações proteína-nucleicas de ácido para orientar a edição, projetar e produzir as moléculas de alvo para cada experimento de nocaute ou knockin é difícil e trabalhosa intensiva14,15. Ilustrativos desses desafios, pouquíssimos fungos filamentosos foram submetidos à edição de genomas usando esses sistemas. Um exemplo é o sistema baseado em TALENs que foi desenvolvido no fungo da explosão de arroz, Magnaporthe oryzae16.
Sem dúvida, a maior revolução para o campo da edição de genomas foi a descoberta e o desenvolvimento subsequente do sistema CRISPR-Cas9, um editor de genomas que permite o decote direcionado de uma sequência de interesse por uma endonuclease que é guiada por uma molécula de RNA. Esta foi uma grande melhoria nos editores de genomas previamente desenvolvidos que dependiam de interações proteína-nucleicos ácidos como a principal vantagem do sistema CRISPR-Cas9 é que ele conta com uma molécula de RNA para atingir a região de interesse. Isso significa que o sistema depende de uma interação RNA-DNA e, portanto, as regras padrão de pareamento base podem ser exploradas ao projetar cada experimento15.
O sistema CRISPR-Cas9 conforme detalhado aqui é composto por três componentes principais: um único guia RNA (sgRNA), a enzima Cas9 e um DNA doador (dDNA)17. O sgRNA é composto por uma região de 20 nucleotídeos chamada protoespaço, bem como uma região mais longa chamada andaime18. A região do protoespaço é usada para guiar o sistema de edição para a região alvo e, portanto, é redesenhada para cada experimento. O andaime é a região do RNA que se liga fisicamente à enzima Cas9 para formar a ribonucleoproteína (RNP) e é, portanto, idêntica independentemente da região a ser alvo. A enzima Cas9 facilita fisicamente o decote do DNA alvo, utilizando o protoespaço como guia para identificar essa região19. O último componente, o dDNA, é opcional e seu uso depende do experimento particular20. O dDNA abriga a sequência que deve ser especificamente inserida na região sendo cortada pela enzima Cas9, e é, portanto, ideal para experimentos de knockin genético onde um gene está sendo introduzido no genoma ou para experimentos de nocaute genético onde um gene de resistência a antibióticos ou outro marcador selecionável está sendo introduzido para substituir o gene de interesse. O dDNA também pode ser projetado de forma a introduzir novas sequências no genoma. Por exemplo, conforme detalhado abaixo, é possível introduzir um codon stop in-frame em uma determinada região no gene de interesse quando uma truncação genética é necessária21. Outras aplicações incluem a mutação de regiões específicas do gene, como um domínio funcional22, ou a introdução de uma sequência de marcação23.
Um grande benefício do uso do sistema CRISPR-Cas9 é sua versatilidade24. Um exemplo dessa adaptabilidade é que a enzima Cas9 pode ser introduzida na célula hospedeira em uma de suas três formas: DNA, RNA ou proteína, dependendo do sistema de transformação particular que está sendo utilizado. Quando introduzido na forma de DNA, o gene cas9 é frequentemente incluído em um plasmídeo juntamente com um marcador selecionável, um para expressar o sgRNA e, se necessário, um codificando a sequência dDNA25. A principal vantagem deste sistema é que apenas uma única construção precisa ser transformada na célula e a transformação bem sucedida garante que todos os componentes necessários para a edição de genomas mediados pelo CRISRP-Cas9 estejam presentes. No entanto, este método conta com a disponibilidade de um sistema de expressão para as espécies hospedeiras. Para cas9 induzir com sucesso danos de DNA, ele precisa ser expresso em níveis elevados e, portanto, é necessário um promotor adequado e potencialmente específico. Para espécies não-modelo onde tais promotores ainda não foram desenvolvidos, isso pode ser um fator desfante e, portanto, a capacidade de introduzir Cas9 em RNA ou forma proteica pode ser uma opção mais atraente. A introdução do RNA na célula traz seus próprios desafios, particularmente no que o RNA é instável e pode não sobreviver ao processo de transformação. Além disso, quando introduzida na forma DEM ou RNA, a sequência genética Cas9 pode precisar ser otimizada para uso no sistema hospedeiroespecífico 17. Por exemplo, o gene cas9 de Streptococcus pyogenes pode não funcionar em uma célula hospedeira de mamíferos e um gene cas9 que foi otimizado para uso em uma célula mamífera pode não funcionar em uma célula vegetal. Todos esses desafios podem ser superados usando a forma proteica do Cas9, que, juntamente com o sgRNA, pode ser montado em um RNP e transformado na célula hospedeira26,27. Este sistema não conta com nenhum sistema de expressão endógena ou otimização de codon e deve, portanto, funcionar na maioria das espécies não-modelo. A desvantagem do sistema à base de proteínas é que ele não é compatível com sistemas de transformação baseados em DNA, como a transferência mediada pelo Agrobacterium. Assim, para que o método baseado em proteínas funcione, um protocolo de transformação como aqueles que dependem de protoplastos ou biolísticas precisa estar disponível. Este sistema baseado em RNP tem sido usado com sucesso nos fungos filamentosos, Fusarium oxysporum26 e Mucor circinelloides27.
Huntiella omanensis, um membro da família Ceratocystidaceae, é um fungo cosmopolita frequentemente encontrado em plantas lenhosas recém-feridas28. Enquanto dados de genoma e transcriptome de alta qualidade estão disponíveis para esta espécie28,,29,,30, nenhum protocolo de transformação ou edição de genomas foram desenvolvidos. Até o momento, a pesquisa sobre H. omanensis se concentrou nos componentes genéticos subjacentes de seu ciclo sexual29,31. Este fungo exibe um ciclo sexual heterotálico típico, com reprodução sexual ocorrendo exclusivamente entre isolados dos tipos de acasalamento MAT1-1 e MAT1-231. Em contraste, os isolados MAT1-2 da Huntiella moniliformis intimamente relacionadas são capazes de reprodução sexual independente e completam um ciclo sexual na ausência de um parceiro MAT1-131. Acredita-se que essa diferença nas capacidades sexuais seja, pelo menos em parte, devido a uma grande diferença no gene de acasalamento, MAT1-2-7, onde h. omanensis abriga uma cópia completa e intacta, enquanto o gene é severamente truncado em H. moniliformis29,31. Para caracterizar ainda mais o papel desse gene na reprodução sexual, o gene MAT1-2-7 de H. omanensis foi truncado para imitar a truncação vista em H. moniliformis21.
O protocolo abaixo detalha a transformação da H. omanensis e a truncação do gene MAT1-2-7 usando uma versão baseada em proteínas do sistema de edição de genomas CRISPR-Cas9. Este protocolo foi desenvolvido depois que as abordagens de substituição de genes baseados em recombinação homólogo e edição de genoma CRISPR-Cas9 baseada em plasmídeos não tiveram sucesso.
O protocolo para a transformação bem sucedida de H. omanensis e edição do gene MAT1-2-7 foi demonstrado pela introdução de um codon de parada prematuro no quadro, juntamente com um gene para resistência à higmicina B21. Isso foi conseguido usando uma versão baseada em proteínas do sistema de edição de genomas CRISPR-Cas9. O experimento envolveu a transcrição in vitro do sgRNA, montagem baseada em PCR do dDNA e a co-transformação desses dois ácidos nucleicos com uma enzima Cas9 comercialmente disponível em protoplastos extraídos de H. omanensis
Ao contrário de outros protocolos que dependem da disponibilidade de muitas outras ferramentas moleculares, o protocolo descrito acima pode ser usado com sucesso em espécies para as quais a caixa de ferramentas moleculares ainda é bastante limitada21. O protocolo conta apenas com um sistema de transformação estabelecido e a disponibilidade de dados de NGS, preferencialmente toda a sequência de genomas. Embora um sistema de transformação eficaz possa ter alguma otimização em uma espécie para a qual isso não está disponível, existem muitos protocolos diferentes disponíveis para uma variedade de espécies. Além disso, os dados do genoma estão se tornando cada vez mais disponíveis até mesmo para as espécies mais obscuras e está se tornando mais fácil de gerar de novo se ele ainda não existe.
Dada a duração do protocolo, existem muitas etapas em que as modificações podem ser introduzidas e onde a solução de problemas pode ser necessária. Isso é particularmente verdadeiro para os passos que são considerados espécies específicas. Por exemplo, existem muitas etapas de incubação neste protocolo que precisam ser conduzidas a temperaturas específicas e por períodos específicos de tempo, a fim de gerar tipos de células importantes para o experimento. Essas etapas exigiriam, assim, otimização específica das espécies. Sempre que possível, micrografos das células particulares ou fases de crescimento foram fornecidos para auxiliar na transferência deste protocolo para uma espécie diferente (Figure 1). O tipo e concentração de enzimas utilizadas para degradar as paredes celulares das células fúngicas para liberar os protoplastos também será específico para as espécies de fungos que estão sendo estudadas. Neste protocolo, apenas uma fonte de enzimas de lise é usada, enquanto diferentes combinações de enzimas são necessárias para a extração de protoplastos em espécies como fusarium verticillioides33. Esta etapa depende inteiramente da produção química da parede celular e, portanto, precisará ser otimizada em uma espécie para base de espécies.
Este método é particularmente significativo para aqueles que estudam espécies não-modelo, pois não há dependência de um sistema de expressão. Um método popular de estabelecer o sistema de edição de genomas CRISPR-Cas9 é expressar a proteína Cas9, o sgRNA, bem como o dDNA de um ou dois plasmídeos que são transformados nas células de escolha. Neste caso, o Cas9 precisa ser expresso por um promotor capaz de altos níveis de expressão no organismo em particular que está sendo estudado. Promotores gerais foram desenvolvidos para uso em fungos filamentosos e, embora não sejam compatíveis em todas as espécies, eles permitem uma expressão de baixo nível e podem ser usados com sucesso para expressar, por exemplo, genes de resistência a antibióticos. Esses promotores, no entanto, muitas vezes não permitem altos níveis de expressão e, portanto, não podem ser usados para expressar a proteína Cas9. O uso de uma versão baseada em proteínas do sistema de edição de genomas CRISPR-Cas9 supera essa limitação e permite que o sgRNA e o dDNA sejam co-transformados na célula com uma enzima Cas9 já produzida.
O desenvolvimento deste sistema baseado em proteínas para uso em H. omanensis veio depois de muitas tentativas mal sucedidas de edição de genomas usando tanto a abordagem clássica de marcador split como o sistema CRISPR-Cas9 baseado em plasmídeos. Embora as eficiências diferem de espécies para espécies, a abordagem de marcador dividido tem sido usada com sucesso com 100% de eficiência em espécies tão diversas quanto alternaria alternada34,35e C. nicotianae36. Em contrapartida, a eficiência desse sistema em H. omanensis foi zero, apesar de mais de 80 eventos independentes de transformação e integração. Da mesma forma, o sistema CRISPR-Cas9 baseado em plasmídeo tem sido usado com sucesso com alta eficiência em Trichoderma reesei (>93%)17 e Penicillium chrysogenum (até 100%)37. Isto é, novamente, em contraste com a utilidade deste sistema em H. omanensis. A expressão suficiente da proteína Cas9 não era alcançável em H. omanensis, apesar de tentar uma série de promotores potenciais, incluindo dois promotores específicos de espécies previstos a partir de genes de limpeza. Assim, este sistema não poderia ser usado em tudo. Usando a versão baseada em proteínas do sistema CRISPR-Cas9, no entanto, produziu muitos transformadores independentes, dois dos quais abrigavam o dDNA integrado no local correto. Além disso, este experimento foi tentado apenas uma vez e foi bem sucedido, ilustrando ainda mais a facilidade com que este sistema pode ser usado.
As aplicações futuras deste protocolo incluem sua otimização e uso em outras espécies do Ceratocystidaceae. Já existe uma riqueza de dados de NGS disponíveis para essas espécies30,,38,,39 e estudos sobre sua especificidade de hospedeiro40, taxa de crescimento e virulência41 foram realizados. Esses estudos podem ser reforçados pela caracterização funcional dos genes que se acredita estarem envolvidos nesses processos, pesquisas que agora se tornarão possíveis devido à disponibilidade de um protocolo de transformação e edição de genomas.
Em conclusão, uma investigação minuciosa sobre os genes subjacentes a importantes processos biológicos em espécies não-modelo está se tornando mais acessível graças à disponibilidade de protocolos de edição de genomas fáceis de usar que não dependem da existência de extensos recursos biológicos e kits de ferramentas moleculares. Estudar espécies não-modelo está se tornando mais fácil e permitirá a descoberta de novos caminhos e desvios interessantes dos processos biológicos padrão que foram elucidados em espécies modelo.
The authors have nothing to disclose.
Este projeto contou com o apoio da Universidade de Pretória, do Departamento de Ciência e Tecnologia (DST)/Fundação Nacional de Pesquisa (NRF) Centro de Excelência em Biotecnologia em Saúde da Árvore (CTHB). O projeto foi apoiado adicionalmente pela cadeira DST/NRF SARChI do Prof BD Wingfield em Gêmica Fúngica (número de subvenção: 98353) bem como pela bolsa de doutorado NRF do Dr. AM Wilson (108548). Os bolsistas reconhecem que opiniões, conclusões e conclusões ou recomendações expressas neste trabalho são dos pesquisadores e que os órgãos financiadores não aceitam qualquer responsabilidade a esse respeito.
EcoRI-HF | New England Biolabs, Ipswich, USA | R3101S | |
EnGen Spy Cas9 NLS protein | New England Biolabs, Ipswich, USA | M0646T | Used to assemble the RNP |
Eppendorf 5810 R centrifuge | Eppendorf, Hamberg, Germany | ||
FastStart Taq DNA Polymerase | Sigma, St Louis, USA | 12032902001 | Standard DNA polyermase |
GeneJET Gel Extraction Kit | ThermoFisher Scientific, Waltham, USA | K0691 | |
HindIII-HF | New England Biolabs, Ipswich, USA | R3104S | |
HiScribeTM T7 Quick High Yield RNA synthesis kit | New England Biolabs, Ipswich, USA | E2050S | |
Hygromycin B from Streptomyces hygroscopicus | Sigma, St Louis, USA | 10843555001 | |
Infors HT Ecotron Shaking Incubator | Infors AG, Bottmingen, Switzerland | ||
LongAmp Taq DNA Polymerase | New England Biolabs, Ipswich, USA | M0323S | Long-range, high-fidelity DNA polymerase |
Malt extract agar, 2% (MEA) | 20 g ME and 20 g agar in 1 l ddH20 | ||
Malt extract | Sigma, St Louis, USA | 70167-500G | |
Agar | Sigma, St Louis, USA | A5306 | |
Malt Extract broth, 1% (MEB) | Sigma, St Louis, USA | 70167-500G | 2 g ME in 200 ml ddH20 |
Malt Extract broth, 2% (MEB) | Sigma, St Louis, USA | 70167-500G | 4 g ME in 200 ml ddH20 |
Miracloth | Merck Millipore, New Jersey, USA | 475855 | |
Nylon membrane (positively charged) | Sigma, St Louis, USA | 11209299001 | |
Osmotic control medium (OCM) | 0.3% yeast extract, 20% sucrose, 0.3% casein hydrolysate | ||
Casein Hydrolysate | Sigma, St Louis, USA | 22090 | |
Sucrose | Sigma, St Louis, USA | 84097 | |
Yeast extract | Sigma, St Louis, USA | Y1625 | |
Osmotic control medium (OCM) agar | Osmotic control medium (OCM) + 1% agar | ||
Agar | Sigma, St Louis, USA | A5306 | |
PCR DIG Labeling Mix | Sigma, St Louis, USA | 11585550910 | |
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific, Waltham, USA | F-530XL | High fidelity DNA polymerase |
Plasmid pcb1004 | N/A | N/A | From: Carroll et al., 1994 |
Presynthesized sgRNA | Inqaba Biotec, Pretoria, South Africa | Ordered as an synthesized dsDNA with specified sequence | |
Proteinase K | Sigma, St Louis, USA | P2308 | |
PTC Solution | 30% polyethylene glycol 8000 in STC buffer from above | ||
Polyethylene glycol 8000 | Sigma, St Louis, USA | 1546605 | |
RNase A | ThermoFisher Scientific, Waltham, USA | 12091021 | |
RNAfold Webserver | Institute for Theoretical Chemistry, University of Vienna | N/A | http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi |
RNAstructure | Mathews Lab | N/A | https://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html |
Sorbitol, 1 M | Sigma, St Louis, USA | 1617000 | 182.17g sorbitol in 1 l ddH20 |
STC Buffer | 20% sucrose, 50 mM Tris-HCl pH 8.00 and 50 mM CaCl2 | ||
Calcium chloride | Sigma, St Louis, USA | 429759 | |
Tris-HCl pH 8.00 | Sigma, St Louis, USA | 10812846001 | |
Sucrose | Sigma, St Louis, USA | 84097 | |
Trichoderma harzianum lysing enzymes | Sigma, St Louis, USA | L1412 | |
Zeiss Axioskop 2 Plus Ergonomic Trinocular Microscope | Zeiss, Oberkochen, Germany |