Décrite ici, c’est un protocole pour le marquage de façon endogène des protéines avec des étiquettes fluorescentes dans les cellules souches humaines pluripotentes induites à l’aide de CRISPR/Cas9 exprimées. Cellules putativement édités sont enrichis en triant les cellules fluorescence activé et lignées clonales sont générées.
Un protocole est présenté pour générer des cellules souches humaines pluripotentes induites (hiPSCs) que les protéines endogènes express fusionnés pour étiquettes fluorescentes N – ou C-terminale dans le cadre. Le système CRISPR/Cas9 procaryote (cluster court régulièrement dois‑je palindromique 9 répétitions/CRISPR-associés) peut-être servir d’y introduire les grandes séquences exogènes locus génomiques par réparation homologie réalisée (HDR). Pour atteindre le désiré knock-in, ce protocole utilise les ribonucléoprotéines (RNP)-approche où les protéines de type sauvage Cas9 Streptococcus pyogenes , synthétique 2 parties guide RNA (gRNA) et un plasmide de modèle de donateurs sont livrées aux cellules par l’intermédiaire de base électroporation. Putativement édités cellules exprimant les protéines fluorescent étiquetées sont enrichis par cellule à fluorescence activé triant (FACS). Lignées clonales sont alors générées et peuvent être analysées pour résultats de montage précis. En introduisant la balise fluorescente au locus génomique du gène d’intérêt, la localisation subcellulaire qui en résulte et la dynamique de la protéine de fusion peut être étudiée sous contrôle réglementaire endogène, une amélioration clé sur la surexpression classique systèmes. L’utilisation de hiPSCs comme un système modèle pour le gène marquage fournit l’occasion d’étudier les protéines étiquetées dans les cellules diploïdes, non transformées. Étant donné que les hiPSCs peuvent être différenciés dans plusieurs types de cellules, cette approche offre la possibilité de créer et d’étudier les protéines étiquetées dans une variété de contextes cellulaires isogéniques.
L’utilisation de stratégies de modification du génome, surtout CRISPR/Cas9, à étudier les processus cellulaires devient de plus en plus accessible et plus précieux1,2,3,4,5, 6 , 7. une des nombreuses applications de CRISPR/Cas9 est l’introduction (via la réparation (HDR) de l’homologie réalisée) des grandes séquences exogènes comme GFP dans des loci génomiques spécifiques qui servent ensuite de reporters pour l’activité d’un gène ou une protéine produit8 . Cette technique peut être utilisée pour joindre une séquence de la protéine fluorescente à un cadre de lecture ouvert endogène où la protéine de fusion endogène réglementé qui en résulte peut être utilisée pour visualiser la localisation subcellulaire et la dynamique de la protéine d’intérêt5 ,6,9,10,11. Alors que les protéines étiquetées de façon endogène offrent de nombreux avantages par rapport aux systèmes de surexpression, insérant des grandes séquences du génome humain est un processus inefficace exigent généralement une sélection ou une stratégie d’enrichissement pour obtenir une population de cellules qui peuvent être facilement étudié5,12.
Ce protocole décrit l’insertion d’une séquence d’ADN codant pour une protéine fluorescente (FP) dans un locus génomique désiré. Le protocole prévoit la conception et la livraison du plasmide modèle donateur et le complexe ribonucléoprotéique (RNP) (protéine de type sauvage S. pyogenes Cas9 combiné avec l’ARN synthétique de CRISPR (crRNA) et activation de trans crRNA (tracrRNA)). Également décrit est l’enrichissement des cellules putativement édités par cellule à fluorescence activé triant (FACS) et le processus de génération de ligne de cellules clonales. A ce jour, cette méthode a été utilisée pour générer des lignes de hiPSC avec monoallelic ou balises (rarement) bi-alléliques protéine fluorescente verte (GFP), étiquetage des vingt-cinq protéines représentant les principales structures cellulaires. Les cellules édités résultants de ces efforts ont été confirmés ont l’insertion génétique attendue, exprimer une protéine de fusion localiser correctement, et maintenir la pluripotence et un caryotype stable12 (et des données non publiées). Cette méthode a également été utilisée pour générer plusieurs autre single et double (deux différentes protéines marquées dans la même cellule) sous la direction des populations de hiPSCs (données non publiées).
CISP humains provenant d’un donneur sain ont été choisis pour ces efforts de modification du génome car, contrairement à nombreuses lignées classiques, ils sont diploïdes, caryotype stable, non transformées et prolifératives. Ces propriétés fournissent un modèle attrayant pour l’étude de la biologie cellulaire fondamentale et modélisation de la maladie. En outre, le potentiel de différenciation des hiPSCs offre la possibilité d’étudier plusieurs stades de développement en parallèle à travers diverses lignées et des types de cellules en utilisant des cellules isogéniques, y compris les organoids, les tissus et les modèles « maladie dans un plat »13 ,14,15. Alors que ce protocole a été développé pour hiPSCs (ligne WTC), il peut être instructif pour l’élaboration de protocoles à l’aide d’autres lignées cellulaires de mammifères.
La méthode présentée ici pour générer de façon endogène sont réglementés par des fusions de protéine fluorescente dans hiPSCs est une approche souple et puissante pour générer des lignées cellulaires de gène édité avec des applications allant de l’imagerie de cellules vivantes à diverses études fonctionnelles et » modèles de maladies dans un plat » à l’aide de dérivés de patient hiPSC lignes13,14,15. Bien que cette méthode a servi à introduire de grandes étiquettes FP à la N – ou C-terminale de protéines endogènes, il susceptibles de servir à présenter autres balises ou des petits changements génétiques de modèle ou pathogènes correcte des mutations22,23 . Pour les insertions plus petites, la taille du bras homologie peut être réduite, mais l’approche générale présentée dans cette méthode d’édition peut-être toujours s’appliquer24,25. Tandis que l’utilisation de hiPSCs est fortement encouragée pour leur grande utilité, avec optimisation de l’attention, ce protocole peut être adapté afin de modifier le génome d’autres lignées cellulaires de mammifères.
Lorsqu’on veut identifier un gène d’intérêt pour le marquage de FP, estimations de l’abondance de la transcription (à partir de « microarray » ou données de RNA-Seq) est un bon point de départ pour déterminer si un gène ou une isoforme d’intérêt est exprimé, bien que les niveaux de transcription ne concordent pas toujours avec taux de protéines. La stratégie de FACS-enrichissement décrite ici qui fonctionnera le mieux pour les gènes qui sont exprimés au moins modérément bien dans le type de cellules d’intérêt. Cette stratégie a également été réussie en choisissant des fusions qui montrent des phénomènes de localisation ponctuée et/ou discrètes comme centrine, desmoplakine et paxillin où le rapport fond signal est très faible12,19. Les gènes qui ne sont pas fortement exprimées ou sont exprimés uniquement dans les types dérivés de cellules peuvent exiger des stratégies de sélection supplémentaires.
Le point de départ pour crRNA et donateurs plasmide modèles utilisés dans des lignées cellulaires humaines devrait être le génome humain de référence (GRCh38). Parce que les génomes de différentes lignées cellulaires peuvent varier au sein de la même espèce, et que CRISPR/Cas9 est séquence-spécifique, il est très utile identifier les variantes de ligne spécifique de cellule (polymorphismes mononucléotidiques ou insertions/délétions (indels)) qui diffèrent du génome de référence et incorporer dans la conception. Cela garantit que crRNAs sera compatible avec le génome de l’hôte et que les bras d’homologie donateur modèle plasmide seront conservé pour les éventuelles variantes spécifiques de la lignée cellulaire. Une stratégie suggérée est d’intégrer les variantes homozygotes dans bras d’homologie du plasmide de modèle de crRNAs et donateur au cours du processus de conception. Incorporant des variantes hétérozygotes est facultative. Les réactifs spécifiques utilisés pour grandes expériences knock-in et autres considérations clés de ce protocole sont examinées ci-dessous.
Protéine de Cas9
Le principal avantage de l’utilisation de protéines Cas9 est celle présentant le Cas9 et gRNA comme un complexe RNP s’est avéré résulter en une durée limitée de l’activité nucléasique par rapport aux approches axées sur le plasmide où expression des Cas9 et gRNA peut continuer pendant des jours et conduire sur – et hors-cible à une plus grande activité26,27. Un autre avantage de l’utilisation de protéines Cas9, c’est qu’il est facilement disponible en conjonction avec une fois à l’intérieur des cellules. Cela contraste avec les méthodes plus conventionnelles d’utiliser Cas9 ARNm ou Cas9/gRNA plasmide nécessitant une transcription, traduction et protéine traitement26,28. Protéine S. pyogenes Cas9 type sauvage est maintenant disponible auprès de nombreuses sources commerciales.
Guide de l’ARN
Il existe de nombreux outils accessibles au public pour trouver les cibles de crRNA près du site d’insertion FP désiré qui ont zéro ou peu estimées hors-cibles dans l’hôte du génome29,30,31,32. Gains d’efficience en HDR et la précision des résultats HDR varient considérablement de crRNA cibles utilisées à un locus donné12. Pour cette raison, les tests crRNAs plusieurs (2-4 et de préférence moins de 50 bp du site d’insertion souhaité) par locus est recommandé car cela peut augmenter la probabilité d’une expérience d’édition réussie. Possibilités de livraison gRNA incluent synthétiques 2-partie crRNA et tracrRNA, synthétique unique gRNAs (sgRNAs), in vitro transcrit sgRNAs, ou livrer un plasmide de cellules exprimant le sgRNA partir d’un promoteur U6. Ce protocole ne était pas optimisé pour l’activité élevée de clivage. CrRNA de 2 parties non modifiée et tracrRNA (voir la Table des matières) ont été utilisés dans le but de générer des lignées de cellules mono-alléliques de FP-tag tout en causant la moins possible perturbation aux cellules.
Donateur modèle plasmide
Parce que certains de l’homologie arm séquence autant chez le donneur plasmide modèle est incorporée dans le génome hôte pendant l’événement HDR, mutations ponctuelles pour les sites de reconnaissance de crRNA devrait être introduites pour prévenir d’autres clivage par Cas9 suite HDR. Souvent, le changement de perturbateur plus simple consiste à muter la séquence de PAM. Parce que certaines séquences non canonique de PAM se distingues encore par sauvage S. pyogenes Cas9, il est préférable d’éviter d’utiliser NGG, NAG ou NGA33. Lorsque la mutation le bras d’homologie, éviter les mutations non-synonymes et l’introduction des codons rares. Si un changement synonyme à la séquence de PAM n’est pas possible, pensez à faire trois mutations synonymes de point dans la région de semences (10 bp proximal à PAM) du site de fixation crRNA. Doit être très prudent lorsque vous effectuez ces modifications dans la région non traduite de 5ʹ (UTR) car ces régions peuvent contenir des séquences régulatrices importants. Consulter une base de données de conservation génétique tels que les titres de génomique Comparative du navigateur UCSC Genome peuvent guider dans ces cas, comme changements aux bases non conservée peuvent être mieux tolérées que devient hautement conservée bases17. Parfois la simple insertion de la séquence de la FP est suffisant pour perturber le site de liaison de crRNA (comme dans la Figure 1) ; Cependant, la séquence nouvellement ajoutée doit être vérifiée pour la persistance des séquences de PAM et de la liaison crRNA.
Acide aminé linkers entre FP et la protéine native sont recommandés pour conserver la fonction de la protéine de fusion34. Souvent un linker acide aminé peut être choisi pour sa charge particulière ou de taille. Si une fusion d’ADNc avec un design similaire à le ciblées endogène protéine de fusion a été bien étudiée, que même linker séquence peut être utilisée pour le CRISPR/Cas9 knock-in expérience12,19. Si cette information n’est pas disponible, un éditeur de liens court tels que GTSGGS a également été utilisée avec succès12. Autres études ont démontré le succès avec une séquence de générique petit éditeur de liens acide amino-3 pour une variété d’objectifs35.
La transfection et l’enrichissement des FACS
De nombreux réactifs de transfection disponibles dans le commerce sont formulés pour la livraison de certains types de molécules, de cellules, alors qu’un système d’électroporation permet de livrer des réactifs avec un large éventail de taille, charge et composition. En plus d’être une méthode commune de transfection de cellules de dur-à-transfecter comme hiPSCs, électroporation réalise également l’avantage de fournir tous les trois composants pour FP CRISPR/Cas9-mediated knock-in tel que décrit dans cette méthode. Électroporation a été trouvée pour produire les meilleurs résultats par rapport aux autres réactifs disponibles dans le commerce dans l’élaboration de cette méthode (données non présentées) et a également été utilisé par d’autres pour le RNP livraison26,28,36 .
Lorsque vous utilisez ce protocole pour l’édition hiPSCs, spécial il faut pour assurer une manipulation douce des cellules avant et après le gène processus de survie optimale cellulaire et différenciation spontanée minimale de montage. En particulier, les méthodes d’enrichissement FACS doivent être adaptés pour le tri des cellules souches à l’aide de la buse plus grande possible (130 µm), un faible débit (≤24 µL/min), liquide de gaine sans agent de conservation (comme le sérum physiologique, voir la Table des matières) et l’échantillon faible pression (10 lb/po2). Au lieu de cellule unique tri, qui se traduit par viabilité sous-optimale dans les cellules souches, les hiPSCs enrichie en FACS sont triés en vrac et élargis comme une population pour optimiser l’intégrité de cellules souches et de la viabilité cellulaire. Cependant, il peut être approprié pour moins de types de cellules sensibles d’unicellulaire tri. Afin de favoriser la survie des cellules, cellules sont retournés à la culture n’est plus d’une heure après la récolte pour l’enrichissement de FACS et conservés à température ambiante pendant tout le processus de tri. Pour certains types de cellules, la survie des cellules peut également être améliorée par incubation des cellules sur la glace (4° C) pendant tout le processus de tri.
L’expansion en vrac des cellules positives FP fournit une occasion d’évaluer la population par l’analyse d’imagerie pour la localisation de protéine de fusion avant de générer des lignées clonales. Alors que la population enrichie résultante de cellules peut être suffisante pour certaines études, ces populations affichent fréquemment FP signal d’intensité variable. Les lignées clonales isolées ont signal uniforme (Figure 3), ce qui les rend plus approprié pour les expériences fonctionnelles12.
Génération de ligne de cellules clonales
Tout au long du processus de génération de ligne montage et clonale, il est important de surveiller la morphologie cellulaire. hiPSC colonies cultivées dans des conditions sans chargeur devraient montrer des bords lisses et un centre même, bien emballé12,18,19. Les cellules différenciées doivent être observées dans moins de 5 % de la culture. Lors de la cueillette des colonies individuelles, choisissez ceux que la morphologie bonne exposition. Au cours de la plaque à 96 puits passage des événements, vérifiez les clones pour la morphologie et arrêter ceux qui ont envahi car cela pourrait conduire à la différenciation ou être l’indice d’instabilité génétique.
Génération de lignées clonales permettant la confirmation génétique de montage précis, qui est important parce qu’induite par le Cas9 double brins dans le génome sont souvent réparé imprécisément malgré l’incorporation de la balise du locus désirée. Tests PCR décrites précédemment ont montré que cumulativement à travers dix locus génomiques uniques nombreux (45 %) des clones exprimant le FP a souffert de l’intégration de colonne vertébrale plasmide donneur au locus ciblé ou (rarement) au hasard dans le génome de12. En outre, 23 % des séropositifs au GFP clones (n = 177) dans dix lieux uniques trouvées pour héberger les mutations au ou près du site de coupe crRNA prévus dans l’allèle non balisé, probablement en raison de NHEJ12. Cette analyse génétique de nombreuses lignées clonales (~ 100 clones/edit) a souligné l’importance de validation génétique qui n’est pas possible dans une population de cellules puisque FP-expression et localisation des protéines fusion attendue seul ne garantit pas un montage précis12 . En outre, ces analyses basées sur la PCR ne peuvent être effectuées sur une population enrichie de cellules avec certitude, justifiant la nécessité pour la génération de la lignée clonale avant une analyse significative peut être complétée. Confirmation génétique de la balise insérée de FP et de vérification de l’intégrité génétique de l’allèle non éditée (dans un clone édité mono-alléliques) sont toutes deux nécessaires pour assurer un montage précis du locus ciblées au-delà l’expression de l’étiquette.
Un faible taux de modifications bi-alléliques et absence de mutations hors-cible (comme analysée par Sanger et séquençage de l’exome) ont été observés à ce jour à l’aide de cette méthode (données non publiées)12. Cela concorde avec les études précédentes décrivant l’utilisation du RNP de courte durée pour CRISPR/Cas9 expériences26,27. L’absence de lignées clonales avec bi-alléliques modifications peut aussi être locus spécifique ou en raison de l’incapacité de la cellule à tolérer deux tag copies d’une protéine essentielle, comme le suggèrent des expériences publiées antérieurement où étaient les cellules édités bi-alléliques putatifs observées pour un locus (LMNB1), mais pas un autre (TUBA1B)12. Bi-alléliques entièrement validée lignées clonales ont été générées à l’aide de cette méthode pour tag ST6 bêta-galactoside alpha-2, 6-sialyltransférase 1 (ST6GAL1) et membre de le RAB5A famille d’oncogène RAS (RAB5A) avec mEGFP19.
Au-delà de confirmer la précision du montage dans le génome, il existe une variété de tests de contrôle de la qualité qui peuvent être utilisés pour caractériser la lignée clonale et identifier les clones qui répondent à toutes les cellules souches, génomique, et critères biologiques de cellule pour utilisent à l’avenir des études . Analyses biologiques et fonctionnels des cellules peuvent être utilisés pour confirmer l’expression appropriée, localisation et fonction de la protéine de fusion12. La comparaison avec les contrôles parentaux aidera à évaluer l’influence du processus d’édition sur la localisation, la dynamique et la fonction. Autres tests tels que l’analyse de la croissance et des tests de stabilité génomique contribue également à déterminent si la protéine étiquetée est perturbante à la cellule. Lorsque vous utilisez hiPSC dans le présent protocole, évaluation des marqueurs pluripotence et potentiel de différenciation peut être critique dans la détermination d’un clone qui est précieux pour en aval d’études12. Parce que l’étendue de la culture de hiPSC a démontré que conduire à une instabilité génétique, suivi du taux de croissance et caryotype des lignées clonales est aussi important de12,37. Toutefois, la finale destinée utilisation des cellules édités déterminera en fin de compte le niveau et la profondeur de l’analyse de contrôle qualité et variera selon l’application.
The authors have nothing to disclose.
Nous remercions Dambournet Daphné pour de nombreuses discussions perspicaces et conseils sur le gène édition, Thao à titre d’illustration, Angelique Nelson pour une lecture critique du manuscrit et Andrew Tucker pour la génération de la lignée de cellules B1 Lamin-le tag mEGFP. Nous tenons à souligner les cellules souches et les gène Editing et les équipes de développement de l’analyse à l’Institut Allen pour la Science des cellules pour leur contribution au processus de contrôle de la qualité et de gène d’édition. La ligne WTC qui nous permet de créer notre lignée génétique-édité a été fournie par le Bruce R. Conklin Laboratory aux instituts de Gladstone et UCSF. Nous remercions l’Institut Allen pour le fondateur de la Science des cellules, Paul G. Allen, pour sa vision, encouragement et appuyer.
Geneious R9 | Biomatters, or similar | bioinformatics software for in silico donor plasmid design | |
TE Buffer pH 8.0 | IDT, or similar | 11-01-02-05 | |
HERAcell VIOS 160i CO2 incubator, or similar | ThermoFisher Scientific, or similar | 51030408 | |
Pipettes (1000 µL, 200 µL, 20 µL, 10 µL, 2 µL) | Rainin, or similar | ||
Pipette tips (1000 µL, 200 µL, 20 µL) | Rainin, or similar | ||
Multi-channel Pipette (200 µL) | Rainin, or similar | ||
Serological pipetes (25 mL, 10 mL, 5 mL) | Costar, or similar | ||
BRAND 8-Channel Manifold for Quiksip, Autoclavable | Millipore Sigma, or similar | BR704526-1EA | use with non-filtered pipet tips, such as Molecular BioProducts Low Retention Pipet Tips, Pure 10, below |
Molecular BioProducts Low Retention Pipet Tips, Pure 10 | Thermo Fisher, or similar | 3501-05 | |
XP2 Pipette Controller | Drummond, or similar | 4-000-501 | |
Disposable Pasteur Pipets | VWR, or similar | 53300-567 | |
Class II, Type A2 Biological Safety Cabinet | CELLGARD, or similar | NU-481 | |
Matrigel Matrix, Growth Factor Reduced | Corning | 354230 | lot tested before use with hiPSC |
DMEM/F12 (-phenol red) | Gibco | 11039-021 | cold, for diluting Matrigel 1:30 |
mTeSR1 Complete Media | StemCell Technologies | 85850 | recommended growth media for WTC hiPSC line |
Penicillin-streptomycin | Gibco | 15070-063 | |
WTC hiPSC line | Coriell | GM25256 | the hiPSC line used in this protocol is available through Coriell |
Tissue culture dish 100 mm | Falcon | 353003 | |
6-well Cell Culture Plate | CELLSTAR | 657160 | |
StemPro Accutase | Gibco | A11105-01 | |
Dulbecco's Phosphate Buffered Saline (DPBS) no calcium, no magnesium | Gibco | 14190144 | |
15 mL polystyrene conical | Sarstedt | 62.554.100 | |
Y-27632 (ROCK Inhibitor) | StemCell Technologies | 72308 | |
Edit-R CRISPR-Cas9 Synthetic crRNA, unmodified (custom sequence) | Dharmacon | Custom0247 | |
Edit-R CRISPR-Cas9 Synthetic tracrRNA | Dharmacon | U-002005-05 | |
Recombinant wild-type Streptococcus pyogenes Cas9-NLS purified protein, 40 µM | University of California-Berkeley QB3 Macrolab | ||
Custom donor plasmid (PriorityGENE) | Genewiz | donor insert design was synthesized and cloned into pUC57 backbone by Genewiz | |
DNA LoBind Tube 1.5 mL | Eppendorf | 22431021 | |
NucleoBond Xtra Maxi EF | Clontech | 740424.50 | |
Neon Transfetion System | ThermoFisher Scientific | MPK5000 | |
Neon Transfection System, 100 µL kit | ThermoFisher Scientific | MPK10096 | |
5 mL Polystyrene Round-bottom Tube with Cell Strainer Cap | Falcon | 352235 | |
15 mL High Clarity Polyproylene Conical Tube | Falcon | 352196 | |
FACSAriaIII Fusion | BD Biosciences | 656700 | |
FACSDiva software | BD Biosciences | ||
FlowJo version 10.2 | TreeStar | ||
NERL Blood Bank Saline | ThermoFisher Scientific | 8504 | used as preservative-free FACS Buffer |
Olympus SZX7 Stereo Microscope, or similar | Olympus, or similar | ||
Tissue culture plate, 96-well | Falcon | 353072 | |
96 well Cell Culture Plate, V-Bottom | CELLSTAR | 351180 | |
CryoStor CS10 | Sigma | C2874-100ML | used as cryopreservation buffer for cells in 96-well plate format |
Parafilm | Bemis | PM-996 | |
24 well Cell Culture Plate | CELLSTAR | 662160 |