在这里,我们提出了一种用于 体外 选择工程转录抑制因子 (ETR) 的方案,该方案具有高、长期、稳定、靶向沉默效率和低全基因组脱靶活性。该工作流程允许将初始的、复杂的候选 ETR 库减少到一个简短的列表,适合在治疗相关环境中进行进一步评估。
基因灭活有助于研究基因功能,是治疗多种疾病的有前途的策略。在传统技术中,RNA干扰存在部分靶标消除和终身治疗的需要。相比之下,人工核酸酶可以通过诱导DNA双链断裂(DSB)来实现稳定的基因失活,但最近的研究质疑这种方法的安全性。 通过 工程转录阻遏因子 (ETR) 进行靶向表观遗传编辑可能是一种解决方案,因为单次施用特定的 ETR 组合可以导致持久的沉默,而不会诱导 DNA 断裂。
ETR 是含有可编程 DNA 结合域 (DBD) 和来自天然转录阻遏蛋白的效应子的蛋白质。具体而言,配备人 ZNF10 的 KRAB 结构域、人 DNMT3A 和人 DNMT3L 的催化结构域的三种 ETR 的组合被证明可以在 ETR 靶基因上诱导可遗传的抑制性表观遗传状态。该平台的肇事逃逸性质,对靶标的DNA序列没有影响,以及通过按需DNA去甲基化恢复到抑制状态的可能性,使表观遗传沉默成为改变游戏规则的工具。一个关键步骤是确定ETR在靶基因上的正确位置,以最大限度地提高靶向和最小化脱靶沉默。在最终的 离体 或 体内 临床前环境中执行此步骤可能很麻烦。
本文以 CRISPR/催化死亡的 Cas9 系统作为 ETR 的范式 DBD,描述了一种方案,包括体 外 筛选向导 RNA (gRNA) 与三重 ETR 组合偶联,以实现有效的靶向沉默,然后评估热门命中的全基因组特异性特征。这允许将候选 gRNA 的初始库减少到一小段有前途的 gRNA,其复杂性适合在感兴趣的治疗相关环境中进行最终评估。
传统上,基因失活在研究细胞和动物模型中的基因功能方面发挥着关键作用。此外,在过去的二十年中,随着基因疗法的兴起,它已被提议作为一种潜在的改变游戏规则的方法,用于治疗由功能获得性突变1、传染病2 或一种基因沉默可以补偿另一个基因的遗传缺陷3 的病理学引起的疾病。最后,提出了细胞适应性和功能控制关键调节因子的遗传失活,以提高细胞产品在癌症免疫治疗4 和再生医学5 中的效率。
在实现基因失活的不同技术中,最有前途的技术之一是靶向表观遗传沉默6,7。该技术的核心是所谓的工程转录抑制因子(ETR),即由可编程DNA结合结构域(DBD)和具有表观遗传抑制功能的效应结构域(ED)组成的嵌合蛋白。锌指蛋白 (ZFP)8、转录激活因子样效应子 (TALEs)9 或基于 CRISPR/dCas910 的 DBD 可以设计为选择性地将 ED 拴系在待沉默的靶基因的启动子/增强子序列上。一旦到达那里,ETR 的 ED 通过施加异染色质诱导的抑制性表观遗传标记来执行其沉默活性,例如组蛋白修饰(H3K9 11,12 或 H3K27 13 甲基化、H3 或 H4 脱乙酰化14)和 CpG DNA 甲基化 15,根据所使用的抑制结构域。
特别是,受植入前胚胎16 中发生的内源性逆转录病毒永久转录抑制的分子过程的启发,已经产生了三种 ETR 的组合来利用以下 ED:i) 人 ZNF10 的 Krüppel 相关盒 (KRAB) 结构域;ii) 人从头 DNA 甲基转移酶 3A (DNMT3A) 的催化结构域;iii) 全长人类 DNA 甲基转移酶 3 样 (DNMT3L)。KRAB 是高等脊椎动物中多个 ZFP 共享的保守抑制结构域17,18,其沉默活性主要基于其募集 KAP119-a 支架蛋白的能力,然后与其他几种异染色质诱导剂相互作用 20-包括核小体重塑和脱乙酰化 (NuRD) 复合物 21、H3K9 组蛋白甲基转移酶 SETDB1 22 和 H3K9 甲基化读取器 HP1 23,24 等。
DNMT3A 在 CpG 序列25 处主动转移 DNA 上的甲基。DNMT3A 的催化活性通过其与 DNMT3L 的物理结合而增强,DNMT3L 是 DNMT3A 的胚胎和生殖细胞限制性旁系同源物,缺乏负责甲基转移的催化结构域26,27。嵌入哺乳动物基因启动子/增强子元件的富含 CpG 的区域(称为 CpG 岛 (CGI))的 DNA 甲基化通常与转录沉默有关28。重要的是,一旦沉积,CpG 甲基化可以通过基于 UHRF1-DNMT1 的分子复合物在整个有丝分裂过程中稳定遗传29。
ETRs在靶细胞中的稳定过表达可能是有问题的,这可能是因为随着时间的推移,脱靶活性和内源性相互作用物从其生理靶位点被抑制的风险增加。然而,单 ETR 部分的瞬时表达可能无法以高效率诱导长期沉默30,从而阻碍了它们的治疗应用。因此,该领域的一项开创性突破是有证据表明,三种基于 KRAB、DNMT3A 和 DNMT3L 的 ETR 的组合可以协同作用,即使只是瞬时共递送,也会对靶基因 H3K9 和 CpG 甲基化的启动子序列施加影响。然后,这些细胞在整个有丝分裂过程中被细胞读取和繁殖,导致多种人和小鼠细胞系以及 离体 培养的原代细胞中的可遗传沉默30。
值得注意的是,ETR 施加的表观遗传沉默可以通过靶向(例如,在沉默位点上募集基于 CRISPR/dCas9 的 TET1 DNA 去甲基化酶)或药理学(施用 DNA 甲基转移酶抑制剂 5-Aza)DNA 去甲基化30 来按需恢复,这是 ETR 相关不良事件的潜在解毒剂。还描述了携带三种基于 KRAB、DNMT3A 和 DNMT3L 的 ED 的多合一 ETR,显示出细胞系31,32 对绝大多数蛋白质编码基因的显着沉默效率。此外,几项采用 ETR 的研究报告了高安全性,在从头 CpG 甲基化或染色质可及性改变方面没有重大脱靶活性30,31,32。然而,建议在临床应用之前对配备新设计的 DBD 的 ETR 的特异性特征进行专门分析。
从临床角度来看,靶向表观遗传沉默可能为基于 RNA 干扰 (RNAi) 的敲低33 和基于人工核酸酶的基因破坏8 提供关键优势。与RNAi相比,靶向表观遗传沉默可以诱导每个细胞的靶标完全消失,并且不需要定期治疗来确保长期沉默;与基因破坏相比,它使 DNA 序列保持不变,避免了 DNA 双链断裂 (DSB) 的产生。然后,DSB 可以诱导细胞凋亡和细胞周期停滞,可能导致针对具有功能性 p53 通路的细胞的选择 34,35,尤其是在多重基因编辑环境中,染色体重排35。此外,通过传递非同源末端连接介导的 DNA DSB 修复36 的不可逆镶嵌结果,基因破坏无法避免将靶标的框内修复为功能编码序列作为最终结果之一,并且与表观遗传沉默相比,不能按需擦除。
最后,表观遗传沉默有可能将可靶向遗传元件的范围扩大到完全或至少部分对 RNAi 和基因破坏难治的类别,例如非转录调控元件和非编码 RNA30,32。任何靶向表观遗传沉默应用的第一个关键步骤是设计一组涵盖靶基因不同调控序列的 ETR,并确定性能最佳的 ETR。考虑到不断开发的可编程 DNA 结合技术可以靶向的基因组部分越来越多,要测试的 ETR 数量可能至关重要37。直接在细胞类型上进行ETR的筛选,以治疗性地沉默靶基因将代表最相关的选择。然而,高通量筛选在原代细胞中可能技术上很麻烦,因为它们在培养中的存活率有限,而且其工程能力通常不理想。大屏幕在体内可能更加不可行。
一种更实用的替代方案包括首先在易于工程化的细胞系中对大量 ETR 进行初步筛选,然后只验证治疗相关细胞类型中最有希望的 ETR。一个平行的问题是选择适当的读数来测量ETR的沉默效率。通过RT-qPCR、蛋白质印迹或ELISA直接评估靶基因的转录本或蛋白水平可能既昂贵又耗时,并且可能缺乏足够的灵敏度,从而限制了它们在高通量规模上的应用。在靶基因调控序列的转录控制下,产生 临时 工程化报告细胞系,允许利用基于流式细胞术的方法在单细胞水平和高通量速度读取表观遗传沉默。
遵循这些一般考虑,本文描述了一种方案,该方案包括用于靶向沉默效率的 体外 阵列 ETR 筛选,然后评估顶级命中的全基因组脱靶活性。该工作流程允许将候选 ETR 的初始库减少到一个有前途的短列表,其复杂性适合于在感兴趣的治疗相关细胞类型中进行最终评估。
在可用于生成 ETR 的不同可编程 DBD 中,该协议将专注于基于 CRISPR/dCas9 的技术,因为易于在高通量规模上设计跨越靶基因启动子的 gRNA。然而,可以采用下面描述的相同概念工作流程来评估配备其他DBD的ETR的效率和特异性。
靶向表观遗传沉默可能代表了一种很有前途的解决方案,可以治疗可以从永久性基因失活中受益的疾病,包括由功能获得性突变引起的疾病 1、传染病2 以及一种基因沉默可以补偿另一个基因的遗传缺陷3 或释放过继细胞疗法的全部潜力4,5.通过在染色质水平上起作用并由细胞 7,30,32 自动繁殖,表观遗传沉默可以避免靶基因 DNA 序列的毒性改变(例如,染色体重排)和靶基因的部分、瞬时沉默,这分别是基于人工核酸酶的基因破坏8、34、35 和基于 RNAi 的敲低 33 的限制。
任何表观遗传沉默方案中的关键初步步骤之一是确定靶基因上的适当位置,以引导 ETR,这些 ETR 将沉积关闭靶标转录活性所需的抑制性表观遗传标记。不同的转录起始位点近端和远端调控元件可能同时支持给定人类基因的转录输出54。此外,由于越来越多的可编程 DNA 结合技术,现在可以识别每个特定调控元件的不同靶位点6。因此,在开始对最终治疗环境中的最佳候选药物进行繁琐且耗时的评估工作之前,可以使用方案(例如本文在工程细胞系中描述的方案)来指定适合ETR介导的表观遗传沉默的单个靶位点和/或基因组区域。该协议的一些关键方面将在下面进一步描述。
预测最终治疗靶点的报告细胞系工程
尽管细胞工程方案不断优化,需要在靶基因中插入荧光报告基因编码的盒并递送ETR,但不能想当然地认为它们可能已经可用于最接近最终治疗靶点的细胞系。在这种情况下,可以应用不同的缓解策略:a)利用供应商提供的优化试剂盒来优化目标细胞系的内部转染方案;b)切换到仍在表达该靶基因但属于最终治疗靶标以外的组织的其他细胞系 – 工程方案已被广泛优化。如果这些选项不可用,可以考虑切换到代表最终靶标的原代细胞类型或类器官。作为基于ETR的表观遗传沉默的临床前研究和治疗应用的一般考虑因素,应摒弃靶基因对靶细胞类型至关重要的情况。随着时间的流逝,ETRs强加的必需基因的完全、长期沉默将导致靶细胞的反选择(以及潜在的治疗毒性)。在这些情况下,首选提供部分靶标消除的替代技术,例如 RNAi33。
评估ETR的靶向沉默活性
基于 KRAB、DNMT3A 和 DNMT3L 效应结构域组合的 ETR 已被证明对绝大多数蛋白质编码基因有效,其广泛的 1 kb碱基长许可靶向窗口以转录起始位点32 为中心。为了了解表现良好的表观遗传沉默实验的外观,这里提供了在K-562细胞中沉默 B2M 基因的技术细节和结果。这可以被认为是一个重要的阳性对照,不仅被研究K-562细胞的研究人员包括在内,而且被那些首次接近基于ETR的技术的研究人员所包括。如方案所述,推荐使用基于人工核酸酶(例如CRISPR / Cas9)的基因破坏作为对目标细胞类型中基因递送效率和被剥夺靶基因的细胞表型的额外控制。在与基于 CRISPR/dCas9 的 ETR 偶联的 gRNA 进行初始筛选后,如果测试的 gRNA 都不能永久沉默靶基因,则应按以下顺序考虑:1) 增加递送的 gRNA 和 ETR 的数量;2)测试顶级gRNA的池,寻找它们之间的协同效应。如果仍未实现长期沉默,则应考虑:3)测试额外的gRNA,这些gRNA可能靶向与指导表观遗传沉默更相关的位点;4)切换到基于ZFP8或TALE9的DBD平台,其与靶染色质的结合能力可能更高;5)从瞬时切换到稳定,例如,整合基于病毒载体的ETR表达(采用CRISPR/dCas9技术时,gRNA或dCas9融合构建体或两者兼而有之)。由于我们小组开发了三个单独的 ETR30 的共同交付,并且拥有丰富的经验,因此此处显示的协议和结果都基于这种方法。然而,类似的概念工作流程可能适用于基于CRISPR的多合一系统32。
评估ETR的脱靶活性
多项研究表明,基于 KRAB、DNMT3A 和 DNMT3L 效应结构域组合的 ETR 特异性初步体外适应症30,31,32。然而,如果在测试的 gRNA 中,它们都没有在转录调控和/或从头 DNA 甲基化方面显示出令人满意的特异性特征,则可以采用两种非相互排斥的策略:a) 通过降低 ETR 的剂量或测试替代递送系统来减少 ETR 在细胞内的停留时间(从而减少它们潜在的脱靶活性)。例如,与质粒相比,mRNA 和蛋白质递送都有望减少细胞暴露于 ETR 的时间,从而减少脱靶活性的可能性55;b) 切换到更新的 Cas9 变体,优化以减少平台56 的脱靶结合,或替代基于 ZFP8 或 TALE9 的 DNA 结合技术。重要的是要考虑到,与模拟处理的样本相比,基因沉默的靶向和脱靶活性不仅受到DBD与其靶序列结合的影响,还受到表观遗传效应结构域的潜在能力的影响,这些能力被其天然的内源性辅因子募集到其他位点。因此,减少 ETR 在靶细胞中的停留时间不仅可以降低 DBD 与脱靶位点结合的可能性,还可以降低 ETR 与内源性辅因子相互作用的可能性,在特异性方面具有潜在的优势,在靶向活性方面具有劣势。最后,与模拟处理的样本相比,在沉默细胞中测量到的一些转录和不太可能的 CpG 甲基化改变可以简单地通过剥夺靶基因来得出。这些不被视为消音技术的偏离目标。为了识别它们,还应在实验面板8、9、10 中包括人工核酸酶的基因破坏。由于靶基因功能丧失而导致的生物学改变将在表观遗传沉默和这种替代技术之间共享。
The authors have nothing to disclose.
作者要感谢 Angelo Amabile、Paola Capasso、Ilaria Caserta、Tania Baccega、Alice Reschigna、Valeria Mollica 和 Deborah Cipria 多年来在开发表观遗传沉默技术方面的合作努力;Dejan Lazarevic 和 Francesca Giannese 对协议中描述的 RNA-seq 和 MeDIP-seq 分析进行了严格审查。这项工作得到了Telethon基金会(TIGET资助号F1)和欧盟地平线2020计划(UPGRADE)对A.L.的资助。插图是用 BioRender.com 创作的。
作者贡献
A.M、M.A.C.、F.G. 和 A.C. 为协议的设计和撰写手稿做出了贡献;S.V.、I.M. 和 D.C. 设计了协议的生物信息学部分并修订了手稿;A.M.和A.L.设计了协议,构思并撰写了手稿,并听取了所有作者的意见。
4200 TapeStation System | Agilent | G2991BA | DNA quantification |
4D-Nucleofector X Unit | Lonza Bioscience | AAF-1003X | Nucleofection |
B2M silencing gRNA #1 | Lombardo's lab | GCAATCAGGACAAGGCCCGC | Gene silencing |
B2M silencing gRNA #2 | Lombardo's lab | GGGGTAGGAGAGACTCACGC | Gene silencing |
B2M silencing gRNA #3 | Lombardo's lab | GAGTCCAGGGCTGGATCTCG | Gene silencing |
BD FACSAria Fusion Flow Cytometer | BD Biosciences | https://www.bdbiosciences.com/en-us/products/instruments/flow-cytometers/research-cell-sorters/bd-facsaria-fusion | Fluorescence Activated Cell Sorting |
bedtools | Bedtools | http://bedtools.readthedocs.io/en/latest/ | Processing of genomic intervals |
bwa | Ih3 | https://github.com/lh3/bwa | Alignment of MeDIP-seq reads |
Chopchop | Valen's lab | http://chopchop.cbu.uib.no/ | gRNA selection software |
Corning RPMI 1640 Medium (Mod.) 1x with L-Glutamine | Corning | 10-040-CV | Cell culture |
cqn | Bioconductor | http://bioconductor.org/packages/release/bioc/html/cqn.html | Region-wise normalization by GC-content |
CRISPR design suite | Zhang's lab | https://zlab.bio/resources-2 | off-target gRNA binding prediction |
CRISPRoff-v2.1 plasmid | Addgene | 167981 | Gene silencing |
CytoFLEX S V4-B4-R3-I2 Flow Cytometer | Beckman Coulter | C01161 | Flow cytometry |
Donor template sequence for tdTomato integration in the first intron of the B2M gene | Lombardo's lab |
ctcctcctctgacctgtgtgtgggttttgtttttgtttt |
Genetic engineering |
E220 Focused-ultrasonicator | Covaris | 500239 | DNA sonication |
edgeR | Bioconductor | https://bioconductor.org/packages/release/bioc/html/edgeR.html | Differential abundance testing |
EnGen Mutation Detection Kit | NEB | E3321 | Gene disruption quantification |
Fetal Bovine Serum | Sigma-Aldrich | F2442 | Cell culture |
Flowjo | BD Biosciences | https://www.flowjo.com/solutions/flowjo | Flow cytometry data analysis software |
Gel Loading Dye, Purple (6x) | NEB | B7024S | DNA gel loading |
Go Taq G2 Hot Start DNA Polymerase | Promega | M7401 | PCR amplification |
gRNA sequence for dTomato integration in the first intron of the B2M gene | Lombardo's lab | AGGCTACTAGCCCCATCAAG | Genetic engineering |
hCas9 plasmid | Addgene | 41815 | Genetic engineering |
High Sensitivity D1000 Reagents | Agilent | 5067-5585 | DNA quantification |
High Sensitivity D1000 ScreenTape | Agilent | 5067-5584 | DNA quantification |
High Sensitivity RNA ScreenTape | Agilent | 5067-5579 | RNA quantification |
High Sensitivity RNA ScreenTape Ladder | Agilent | 5067-5581 | RNA quantification |
High Sensitivity RNA ScreenTape Sample Buffer | Agilent | 5067-5580 | RNA quantification |
IPure kit | Diagenode | C03010011 | Purification of the 5-methylcytosine immunoprecipitation product |
K-562 cells | ATCC | CCL-243 | Cell engineering |
KAPA Library Quantification Kit | Roche | KK4824 | MeDIP-Seq libraries preparation |
MACS2 | Taoliu | https://github.com/macs3-project/MACS | Identification of methyl-enriched regions |
MagMeDIP kit | Diagenode | C02010020 | 5-methylcytosine immunoprecipitation |
NextFlex Methylseq kit 1 | Bioo Scientific | 5118-01 | MeDIP-Seq libraries preparation |
NextSeq 500 / NovaSeq 6000 | Illumina | SY-415-1002 / 20012850 | Next Generation Sequencing |
NucleoBond Xtra Midi kit for transfection-grade plasmid DNA | Macherey-nagel | 740410.50 | Midiprep plasmid preparation |
One Shot TOP10 Chemically Competent cells | ThermoFisher | C404010 | Plasmid transformation |
pAC154-dual-dCas9VP160-sgExpression plasmid | Addgene | 48240 | Gene activation |
pcDNA.CMV.dCas9:KRAB plasmid | Lombardo's lab | available on request (lombardo.angelo@hsr.it) | Gene silencing |
pcDNA.CMV.dCas9:KRAB plasmid | Lombardo's lab | available on request (lombardo.angelo@hsr.it) | Gene silencing |
pcDNA.CMV.dCas9:KRAB plasmid | Lombardo's lab | available on request (lombardo.angelo@hsr.it) | Gene silencing |
Penicillin/Streptomycin | Sigma-Aldrich | P0781 | Cell culture |
phU6.sgRNA plasmid | Addgene | 53188 | Genetic engineering |
PowerPac Basic Power Supply | Biorad | 1645050 | Agarose gel electrophoresis |
Primer forward sequence to check tdTomato integration in the first intron of the B2M gene | Lombardo's lab | GTATTTGCTGGTTATGTTAG | Genetic engineering |
Primer reverse sequence to check tdTomato integration in the first intron of the B2M gene | Lombardo's lab | AATGGTTGAGTTGGAC | Genetic engineering |
QIAamp DNA Mini Kit | Qiagen | 51304 | DNA extraction |
Qubit | Thermo Fisher | Q33238 | DNA quantification |
Qubit dsDNA HS (high sensitivity) Assay Kit | Thermo Fisher | Q32851 | DNA quantification |
Qubit RNA HS (high sensitivity) Assay Kit | Thermo Fisher | Q32852 | RNA quantification |
Restriction enzymes | NEB | DNA digestion | |
RNeasy Mini kit | Qiagen | 74106 | RNA extraction |
Rsubread | Bioconductor | https://bioconductor.org/packages/release/bioc/html/Rsubread.html | Quantification of gene expression |
SF Cell Line 4D-Nucleofector X Kit S (32 RCT) | Lonza Bioscience | V4XC-2032 | Nucleofection |
SnapGene | Dotmatics | https://www.snapgene.com/ | Molecular biology design software |
STAR | Alexander Dobin | https://github.com/alexdobin/STAR | Alignment of RNA-seq reads |
T100 Thermal Cycler | Biorad | 1861096 | PCR amplification |
T4 DNA Ligase | Promega | M1801 | DNA ligation |
TAE Buffer | Fisher scientific | BP1332500 | Agarose gel electrophoresis |
TruSeq Stranded Total RNA kit | Illumina | 20020597 | RNA-Seq library preparation |
UltraPure Agarose | ThermoFisher | 16500500 | Agarose gel |