Le système d’édition du génome CRISPR-Cas9 est un éditeur de génome facile à utiliser qui a été utilisé dans les espèces modèles et non modèles. Ici, nous présentons une version à base de protéines de ce système qui a été utilisé pour introduire un codon d’arrêt prématuré dans un gène d’accouplement d’un champignon filamenteux d’ascocète non-modèle.
Le système d’édition du génome CRISPR-Cas9 est un outil moléculaire qui peut être utilisé pour introduire des changements précis dans les génomes des espèces modèles et non modèles. Cette technologie peut être utilisée pour une variété d’approches d’édition du génome, des knock-outs de gène et des knockins à des changements plus spécifiques comme l’introduction de quelques nucléotides à un endroit ciblé. L’édition du génome peut être utilisée pour une multitude d’applications, y compris la caractérisation fonctionnelle partielle des gènes, la production d’organismes transgéniques et le développement d’outils de diagnostic. Par rapport aux stratégies d’édition de gènes précédemment disponibles, le système CRISPR-Cas9 s’est avéré facile à établir chez de nouvelles espèces et bénéficie d’une grande efficacité et d’une spécificité. La raison principale en est que l’outil d’édition utilise une molécule d’ARN pour cibler le gène ou la séquence d’intérêt, ce qui rend la conception de molécule cible simple, étant donné que les règles standard d’appariement de base peuvent être exploitées. À l’instar d’autres systèmes d’édition du génome, les méthodes basées sur CRISPR-Cas9 nécessitent également des protocoles de transformation efficaces et efficaces ainsi que l’accès à des données de séquence de bonne qualité pour la conception des molécules d’ARN et d’ADN ciblants. Depuis l’introduction de ce système en 2013, il a été utilisé pour concevoir génétiquement une variété d’espèces modèles, y compris Saccharomyces cerevisiae, Arabidopsis thaliana, Drosophila melanogaster et Mus musculus. Par la suite, les chercheurs travaillant sur des espèces non modèles ont profité du système et l’ont utilisé pour l’étude des gènes impliqués dans des processus aussi divers que le métabolisme secondaire chez les champignons, la croissance des nématodes et la résistance aux maladies chez les plantes, entre autres. Ce protocole décrit ci-dessous l’utilisation du protocole d’édition du génome CRISPR-Cas9 pour la troncation d’un gène impliqué dans le cycle sexuel de Huntiella omanensis, un champignon incamenteux d’ascocète appartenant à la famille des Ceratocystidaceae.
La disponibilité croissante de génomes et de transcriptomes de haute qualité entièrement assemblés a grandement amélioré la capacité d’étudier une grande variété de processus biologiques dans un éventail d’organismes1. Cela est vrai tant pour les espèces modèles que pour les espèces non modèles, dont bon nombre peuvent offrir une compréhension plus diversifiée des processus biologiques. Ces types de données peuvent être utilisés pour la découverte de gènes, l’identification des réseaux de transcription et les comparaisons du génome entier et du transcriptome, chacun d’entre eux avec son propre ensemble d’applications. Cependant, alors que les gènes sont prédits, annotés et misativement liés à différentes voies fonctionnelles à un rythme jamais vu auparavant, la caractérisation fonctionnelle de ces gènes reste en retard, limitée par les boîtes à outils moléculaires disponibles pour de nombreuses espèces. C’est particulièrement le cas pour les espèces non modèles, où les données génomiques sont relativement faciles à générer, mais où d’autres caractérisations moléculaires ont été presqueimpossibles 1,2.
La caractérisation partielle des fonctions de gènes spécifiques importants pour la biologie des espèces fongiques peut être réalisée par des expériences par KO ou knockin suivies d’une analyse phénotypique des souches mutantes3. Ces deux systèmes reposent entièrement sur la disponibilité de protocoles de génie génétique, y compris, au minimum, un système de transformation et un système d’édition génétique. Il existe un certain nombre de différents systèmes de transformation qui ont été développés dans une variété de champignons filamenteux4. Des systèmes physiques comme ceux qui reposent sur la biolistique et l’électroporation ont été développés dans Trichoderma harzianum5 et Aspergillus niger6, respectivement. Des systèmes qui utilisent des produits chimiques tels que le chlorure de calcium ou l’acétate de lithium ont été développés dans Neurospora crassa7. Enfin, les systèmes biologiques qui reposent sur l’utilisation d’Agrobacterium tumefaciens pour la transformation ont été utilisés avec succès dans Ceratocystis albifundus8.
Contrairement à la disponibilité de différents protocoles de transformation, les systèmes d’édition du génome sont moins abondants. Bon nombre des expériences traditionnelles de caractérisation fonctionnelle menées dans des champignons filamenteux ont utilisé une construction par KO de marqueurs fendus sous la forme d’un marqueur sélectionnable flanqué de régions d’homologie à la région cible ou au gène dans le génome3. La méthode repose sur l’homologie dirigée (HR) réparation de l’ADN, qui installations recombinaison homologue entre la construction knockout et la région d’intérêt. Cet événement de recombinaison entraîne le remplacement du gène d’intérêt par la séquence du marqueur sélectionnable. Malheureusement, bien que cela ait été couronné de succès chez de nombreuses espèces, y compris Cercospora nicotianae10, Aspergillus fumigatus11 et Grosmannia clavigera12, les taux de recombinaison homologue sont très variables entre les différentes espèces fongiques, ce qui en fait un protocole inefficace et parfois inutilisable dans certaines espèces3.
D’autres systèmes d’édition du génome, y compris ceux qui utilisent des nucléases zinc-doigts (ZFN) et des nucléases effecteurs de type activateur de transcription (TALENs) ont représenté une grande amélioration par rapport aux systèmes plus anciens, en particulier compte tenu de leurs capacités à apporter des changements spécifiques et ciblés13. Les ZFN et TALENs sont composés d’une protéine nucléase et d’une protéine capable de reconnaître des séquences nucléotides spécifiques13. Une fois la reconnaissance, la nucléase induit une double rupture d’ADN échouée qui peut faciliter l’introduction de mutations spécifiques. Afin d’apporter des changements du génome, la région protéique qui reconnaît la séquence des nucléotides doit être spécialement conçue pour chaque expérience. En raison de cette dépendance sur les interactions protéine-acide nucléique pour guider l’édition, la conception et la production des molécules de ciblage pour chaque expérience knockout ou knockin est difficile et la main-d’œuvre intensive14,15. Illustrant ces défis, très peu de champignons filamenteux ont été soumis à l’édition du génome à l’aide de ces systèmes. Un exemple est le système à base de TALENs qui a été développé dans le champignon de souffle de riz, Magnaporthe oryzae16.
On peut soutenir que la plus grande révolution dans le domaine de l’édition du génome a été la découverte et le développement ultérieur du système CRISPR-Cas9, un éditeur de génome qui permet le clivage ciblé d’une séquence d’intérêt par une endonuclease qui est guidée par une molécule d’ARN. Il s’agissait d’une énorme amélioration par rapport aux éditeurs du génome précédemment développés qui s’appuyaient sur les interactions protéine-nucléique d’acide, car l’avantage majeur du système CRISPR-Cas9 est qu’il s’appuie sur une molécule d’ARN pour cibler la région d’intérêt. Cela signifie que le système repose sur une interaction ARN-ADN et donc des règles standard d’appariement de base peuvent être exploitées lors de la conception de chaque expérience15.
Le système CRISPR-Cas9 tel que détaillé ici est composé de trois composantes principales : un ARN guide unique (sgRNA), l’enzyme Cas9 et un ADN donneur (ADND)17. Le sgRNA est composé d’une région de 20 nucléotides appelée le protospacer ainsi que d’une région plus longue appelée l’échafaudage18. La région protospacer est utilisée pour guider le système d’édition vers la région cible et est donc repensée pour chaque expérience. L’échafaudage est la région de l’ARN qui se lie physiquement à l’enzyme Cas9 pour former la ribonucléoprotéine (RNP) et est donc identique quelle que soit la région à cibler. L’enzyme Cas9 facilite physiquement le clivage de l’ADN cible, en utilisant le protospacer comme guide pour identifier cette région19. Le dernier composant, l’ADND, est facultatif et son utilisation dépend de l’expérienceparticulière 20. L’ADND abrite la séquence qui devrait être spécifiquement insérée dans la région coupée par l’enzyme Cas9, et est donc idéal pour les expériences de knockin de gène où un gène est introduit dans le génome ou pour des expériences de knock-out de gène où un gène de résistance aux antibiotiques ou un autre marqueur sélectionnable est introduit pour remplacer le gène d’intérêt. L’ADND peut également être conçu de manière à introduire de nouvelles séquences dans le génome. Par exemple, comme indiqué ci-dessous, il est possible d’introduire un codon d’arrêt en images dans une région particulière dans le gène d’intérêt lorsqu’une troncation génétique est requise21. D’autres applications incluent la mutation de régions spécifiques du gène, telles qu’un domaine fonctionnel22, ou l’introduction d’une séquence de marquage23.
Un avantage majeur de l’utilisation du système CRISPR-Cas9 est sa polyvalence24. Un exemple de cette adaptabilité est que l’enzyme Cas9 peut être introduite dans la cellule hôte dans l’une de ses trois formes – ADN, ARN ou protéine – selon le système de transformation particulier utilisé. Lorsqu’il est introduit sous forme d’ADN, le gène cas9 est souvent inclus sur un plasmide avec un marqueur sélectionnable, une cassette pour exprimer le sgRNA et, si nécessaire, une cassette codant la séquence dDNA25. Le principal avantage de ce système est qu’une seule construction doit être transformée en cellule et une transformation réussie garantit la présence de tous les composants nécessaires à l’édition du génome à médiation CRISRP-Cas9. Toutefois, cette méthode repose sur la disponibilité d’un système d’expression pour l’espèce hôte. Pour que Cas9 puisse causer des dommages à l’ADN, il doit être exprimé à des niveaux élevés, et donc, un promoteur approprié et potentiellement spécifique est nécessaire. Pour les espèces non modèles où de tels promoteurs n’ont pas encore été développés, cela peut être un facteur de détraction et donc la capacité d’introduire Cas9 sous forme d’ARN ou de protéines peut être une option plus attrayante. L’introduction de l’ARN dans la cellule apporte ses propres défis, en particulier dans le fait que l’ARN est instable et peut ne pas survivre au processus de transformation. En outre, lorsqu’elle est introduite sous forme d’ADN ou d’ARN, la séquence du gène Cas9 peut devoir être codon-optimisée pour une utilisation dans le système hôte particulier17. Par exemple, le gène cas9 de Streptococcus pyogenes peut ne pas fonctionner dans une cellule hôte de mammifères et un gène cas9 qui a été codon-optimisé pour une utilisation dans une cellule de mammifères peut ne pas fonctionner dans une cellule végétale. Tous ces défis peuvent être surmontés en utilisant la forme protéique de Cas9, qui, avec le sgRNA, peut être assemblé en RNP et transformé en cellule hôte26,27. Ce système ne repose pas sur un système d’expression endogène ou l’optimisation du codon et devrait donc fonctionner dans la majorité des espèces non modèles. L’inconvénient du système à base de protéines est qu’il n’est pas compatible avec les systèmes de transformation à base d’ADN comme le transfert agrobacterium-médié. Ainsi, pour que la méthode à base de protéines fonctionne, un protocole de transformation tel que ceux qui reposent sur des protoplastes ou des biolistiques doit être disponible. Ce système à base de RNP a été utilisé avec succès dans les champignons filamenteux, Fusarium oxysporum26 et Mucor circinelloides27.
Huntiella omanensis, un membre de la famille Ceratocystidaceae, est un champignon cosmopolite souvent trouvé sur les plantes ligneuses fraîchement blessées28. Bien que des données de haute qualité sur le génome et la transcription sont disponibles pour cette espèce28,29,30, aucun protocole de transformation ou d’édition du génome n’a été développé. À ce jour, la recherche sur H. omanensis s’est concentrée sur les composantes génétiques sous-jacentes de son cycle sexuel29,31. Ce champignon présente un cycle sexuel hétérothallique typique, avec la reproduction sexuelle se produisant exclusivement entre les isolats des types d’accouplement MAT1-1 et MAT1-231. En revanche, les isolats MAT1-2 des Huntiella moniliformis étroitement apparentés sont capables de reproduction sexuelle indépendante et complètent un cycle sexuel en l’absence d’un partenaire MAT1-131. Cette différence dans les capacités sexuelles est pensé pour être, au moins en partie, en raison d’une différence majeure dans le gène d’accouplement, MAT1-2-7, où H. omanensis abrite une pleine longueur et copie intacte, tandis que le gène est sévèrement tronqué dans H. moniliformis29,31. Pour caractériser davantage le rôle de ce gène dans la reproduction sexuelle, le gène MAT1-2-7 de H. omanensis a été tronqué pour imiter la troncation observée dans H. moniliformis21.
Le protocole ci-dessous détaille la transformation de H. omanensis et la troncation du gène MAT1-2-7 à l’aide d’une version à base de protéines du système d’édition du génome CRISPR-Cas9. Ce protocole a été développé après que les approches du remplacement homologue de gène basé sur la recombinaison et l’édition du génome de CRISPR-Cas9 basée sur le plasmide aient échoué.
Le protocole pour la transformation réussie de H. omanensis et l’édition du gène MAT1-2-7 a été démontré par l’introduction d’un codon d’arrêt prématuré dans le cadre avec un gène pour la résistance à l’hygromycine B21. Ceci a été réalisé à l’aide d’une version à base de protéines du système d’édition du génome CRISPR-Cas9. L’expérience a nécessité la transcription in vitro de l’assemblage sgRNA, à base de PCR de l’ADN et la co-transformation de ces deux acides nucléiques avec une enzyme Cas9 disponible dans le commerce en protoplastes extraits de H. omanensis
Contrairement à d’autres protocoles qui reposent sur la disponibilité de nombreux autres outils moléculaires, le protocole décrit ci-dessus peut être utilisé avec succès dans les espèces pour lesquelles la boîte à outils moléculaire est encore assez limitée21. Le protocole ne repose que sur un système de transformation établi et la disponibilité des données NGS, de préférence séquence du génome entier. Bien qu’un système de transformation efficace puisse prendre une certaine optimisation dans une espèce pour laquelle cela n’est pas disponible, il existe de nombreux protocoles différents disponibles pour une variété d’espèces. En outre, les données génomiques sont de plus en plus disponibles même pour les espèces les plus obscures et deviennent plus faciles à générer de novo si elles n’existent pas déjà.
Compte tenu de la longueur du protocole, il existe de nombreuses étapes à laquelle des modifications peuvent être introduites et où le dépannage peut être nécessaire. Cela est particulièrement vrai pour les étapes qui sont considérées comme spécifiques aux espèces. Par exemple, il existe de nombreuses étapes d’incubation dans ce protocole qui doivent être menées à des températures spécifiques et pour des durées spécifiques afin de générer des types de cellules importants pour l’expérience. Ces étapes nécessiteraient donc une optimisation spécifique aux espèces. Dans la mesure du possible, des micrographes des cellules ou des phases de croissance particulières ont été fournis pour aider à transférer ce protocole à une espèce différente (Figure 1). Le type et la concentration des enzymes utilisées pour dégrader les parois cellulaires des cellules fongiques afin de libérer les protoplastes seront également spécifiques à l’espèce de champignon à l’étude. Dans ce protocole, une seule source d’enzymes de lysing est utilisée, tandis que différentes combinaisons d’enzymes sont nécessaires pour l’extraction de protoplastes chez des espèces comme Fusarium verticillioides33. Cette étape dépend entièrement de la fabrication chimique de la paroi cellulaire et devra donc être optimisée d’une espèce à l’autre.
Cette méthode est particulièrement importante pour ceux qui étudient des espèces non modèles, car il n’y a pas de dépendance à l’égard d’un système d’expression. Une méthode populaire d’établissement du système d’édition du génome CRISPR-Cas9 consiste à exprimer la protéine Cas9, le sgRNA ainsi que l’ADN d’un ou deux plasmides qui sont transformés en cellules de choix. Dans ce cas, le Cas9 doit être exprimé par un promoteur capable de niveaux élevés d’expression dans l’organisme particulier étudié. Des promoteurs généraux ont été développés pour être utilisés dans les champignons filamenteux et bien qu’ils ne soient pas compatibles chez toutes les espèces, ils permettent une expression de faible niveau et peuvent être utilisés avec succès pour exprimer, par exemple, des gènes de résistance aux antibiotiques. Ces promoteurs, cependant, ne permettent souvent pas des niveaux élevés d’expression et ne peuvent donc pas être utilisés pour exprimer la protéine Cas9. L’utilisation d’une version à base de protéines du système d’édition du génome CRISPR-Cas9 surmonte cette limitation et permet à l’ARN et à l’ADD d’être co-transformés en cellule avec une enzyme Cas9 déjà produite.
Le développement de ce système à base de protéines pour une utilisation dans H. omanensis est venu après de nombreuses tentatives infructueuses à l’édition du génome en utilisant à la fois l’approche classique de marqueur fractionné ainsi que le système à base de plasmide CRISPR-Cas9. Bien que les gains d’efficacité diffèrent d’une espèce à l’autre, l’approche des marqueurs fractionnés a été utilisée avec succès avec une efficacité de 100 % chez des espèces aussi diverses qu’Alternaria alternata34,35et C. nicotiayae36. En revanche, l’efficacité de ce système à H. omanensis était nulle, malgré plus de 80 événements indépendants de transformation et d’intégration. De même, le système CRISPR-Cas9 basé sur le plasmide a été utilisé avec succès avec une grande efficacité dans Trichoderma reesei (>93%)17 et Penicillium chrysogenum (jusqu’à 100%)37. C’est, encore une fois, en contraste avec l’utilité de ce système dans H. omanensis. L’expression suffisante de la protéine Cas9 n’était pas accessible à H. omanensis malgré l’essai d’un certain nombre de promoteurs potentiels, y compris deux promoteurs spécifiques à l’espèce prédits à partir des gènes d’entretien ménager. Ainsi, ce système ne pouvait pas être utilisé du tout. L’utilisation de la version à base de protéines du système CRISPR-Cas9, cependant, a donné de nombreux transformateurs indépendants, dont deux abritaient l’ADND intégré dans le bon emplacement. En outre, cette expérience n’a été tentée qu’une seule fois et a été couronnée de succès, illustrant davantage la facilité avec laquelle ce système peut être utilisé.
Les applications futures de ce protocole incluent son optimisation et son utilisation dans d’autres espèces des Ceratocystidaceae. Il ya déjà une mine de données NGS disponibles pour ces espèces30,38,39 et des études concernant leur spécificité hôte40, taux de croissance et de virulence41 ont été menées. Ces études peuvent être renforcées par la caractérisation fonctionnelle des gènes qui sont censés être impliqués dans ces processus, la recherche qui deviendra maintenant possible en raison de la disponibilité d’un protocole de transformation et d’édition du génome.
En conclusion, une étude approfondie des gènes sous-jacents à d’importants processus biologiques chez des espèces non modèles est de plus en plus accessible grâce à la disponibilité de protocoles d’édition du génome faciles à utiliser qui ne reposent pas sur l’existence de vastes ressources biologiques et de boîtes à outils moléculaires. L’étude des espèces non modèles devient plus facile et permettra la découverte de nouvelles voies et de déviations intéressantes par rapport aux processus biologiques standard qui ont été élucidés chez les espèces modèles.
The authors have nothing to disclose.
Ce projet a été soutenu par l’Université de Pretoria, le Department of Science and Technology (DST)/National Research Foundation (NRF) Centre of Excellence in Tree Health Biotechnology (CTHB). Le projet a également été soutenu par la chaire SARChi du Professeur BD Wingfield en génomique fongique (numéro de subvention : 98353) ainsi que par la bourse de doctorat NRF du Dr AM Wilson (108548). Les titulaires de subventions reconnaissent que les opinions, les conclusions et conclusions ou recommandations exprimées dans ce travail sont celle des chercheurs et que les organismes de financement n’acceptent aucune responsabilité à cet égard.
EcoRI-HF | New England Biolabs, Ipswich, USA | R3101S | |
EnGen Spy Cas9 NLS protein | New England Biolabs, Ipswich, USA | M0646T | Used to assemble the RNP |
Eppendorf 5810 R centrifuge | Eppendorf, Hamberg, Germany | ||
FastStart Taq DNA Polymerase | Sigma, St Louis, USA | 12032902001 | Standard DNA polyermase |
GeneJET Gel Extraction Kit | ThermoFisher Scientific, Waltham, USA | K0691 | |
HindIII-HF | New England Biolabs, Ipswich, USA | R3104S | |
HiScribeTM T7 Quick High Yield RNA synthesis kit | New England Biolabs, Ipswich, USA | E2050S | |
Hygromycin B from Streptomyces hygroscopicus | Sigma, St Louis, USA | 10843555001 | |
Infors HT Ecotron Shaking Incubator | Infors AG, Bottmingen, Switzerland | ||
LongAmp Taq DNA Polymerase | New England Biolabs, Ipswich, USA | M0323S | Long-range, high-fidelity DNA polymerase |
Malt extract agar, 2% (MEA) | 20 g ME and 20 g agar in 1 l ddH20 | ||
Malt extract | Sigma, St Louis, USA | 70167-500G | |
Agar | Sigma, St Louis, USA | A5306 | |
Malt Extract broth, 1% (MEB) | Sigma, St Louis, USA | 70167-500G | 2 g ME in 200 ml ddH20 |
Malt Extract broth, 2% (MEB) | Sigma, St Louis, USA | 70167-500G | 4 g ME in 200 ml ddH20 |
Miracloth | Merck Millipore, New Jersey, USA | 475855 | |
Nylon membrane (positively charged) | Sigma, St Louis, USA | 11209299001 | |
Osmotic control medium (OCM) | 0.3% yeast extract, 20% sucrose, 0.3% casein hydrolysate | ||
Casein Hydrolysate | Sigma, St Louis, USA | 22090 | |
Sucrose | Sigma, St Louis, USA | 84097 | |
Yeast extract | Sigma, St Louis, USA | Y1625 | |
Osmotic control medium (OCM) agar | Osmotic control medium (OCM) + 1% agar | ||
Agar | Sigma, St Louis, USA | A5306 | |
PCR DIG Labeling Mix | Sigma, St Louis, USA | 11585550910 | |
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific, Waltham, USA | F-530XL | High fidelity DNA polymerase |
Plasmid pcb1004 | N/A | N/A | From: Carroll et al., 1994 |
Presynthesized sgRNA | Inqaba Biotec, Pretoria, South Africa | Ordered as an synthesized dsDNA with specified sequence | |
Proteinase K | Sigma, St Louis, USA | P2308 | |
PTC Solution | 30% polyethylene glycol 8000 in STC buffer from above | ||
Polyethylene glycol 8000 | Sigma, St Louis, USA | 1546605 | |
RNase A | ThermoFisher Scientific, Waltham, USA | 12091021 | |
RNAfold Webserver | Institute for Theoretical Chemistry, University of Vienna | N/A | http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi |
RNAstructure | Mathews Lab | N/A | https://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html |
Sorbitol, 1 M | Sigma, St Louis, USA | 1617000 | 182.17g sorbitol in 1 l ddH20 |
STC Buffer | 20% sucrose, 50 mM Tris-HCl pH 8.00 and 50 mM CaCl2 | ||
Calcium chloride | Sigma, St Louis, USA | 429759 | |
Tris-HCl pH 8.00 | Sigma, St Louis, USA | 10812846001 | |
Sucrose | Sigma, St Louis, USA | 84097 | |
Trichoderma harzianum lysing enzymes | Sigma, St Louis, USA | L1412 | |
Zeiss Axioskop 2 Plus Ergonomic Trinocular Microscope | Zeiss, Oberkochen, Germany |