Экспрессия генов регулируется взаимодействием промоторов генов с дистальными регуляторными элементами. Здесь мы рассмотрим, как низкий входной захват Hi-C (liCHi-C) позволяет идентифицировать эти взаимодействия в редких типах клеток, которые ранее не поддавались измерению.
Пространственно-временная транскрипция генов жестко регулируется дистальными регуляторными элементами, такими как энхансеры и глушители, которые полагаются на физическую близость к своим целевым промоторам генов для контроля транскрипции. Хотя эти регуляторные элементы легко идентифицировать, их гены-мишени трудно предсказать, поскольку большинство из них специфичны для клеточного типа и могут быть разделены сотнями килобаз в линейной последовательности генома, пропуская другие нецелевые гены. В течение нескольких лет Promoter Capture Hi-C (PCHi-C) был золотым стандартом ассоциации дистальных регуляторных элементов с их генами-мишенями. Тем не менее, PCHi-C полагается на наличие миллионов клеток, что запрещает изучение редких клеточных популяций, таких как те, которые обычно получают из первичных тканей. Чтобы преодолеть это ограничение, был разработан низковходной захват Hi-C (liCHi-C), экономически эффективный и настраиваемый метод идентификации репертуара дистальных регуляторных элементов, контролирующих каждый ген генома. liCHi-C опирается на аналогичную экспериментальную и вычислительную структуру, что и PCHi-C, но, используя минимальные изменения трубок, изменяя концентрацию и объемы реагентов, а также заменяя или устраняя шаги, он учитывает минимальные потери материала при строительстве библиотеки. В совокупности liCHi-C позволяет изучать регуляцию генов и пространственно-временную организацию генома в контексте биологии развития и клеточной функции.
Временная экспрессия генов стимулирует дифференцировку клеток и, в конечном счете, развитие организма, и ее изменение тесно связано с широким спектром заболеваний 1,2,3,4,5. Транскрипция генов тонко регулируется действием регуляторных элементов, которые можно классифицировать как проксимальные (т.е. промоторы генов) и дистальные (например, энхансеры или глушители), последние из которых часто расположены далеко от своих генов-мишеней и физически взаимодействуют с ними посредством петли хроматина для модуляции экспрессии генов 6,7,8.
Идентификация дистальных регуляторных областей в геноме является широко согласованным вопросом, поскольку эти области содержат специфические модификации гистонов 9,10,11 и содержат специфические мотивы распознавания факторов транскрипции, выступая в качестве рекрутинговых платформ для них12,13,14. Кроме того, в случае энхансеров и суперэнхансеров 15,16 они также имеют низконуклеосомную занятость 17,18 и транскрибируются в некодирующие эРНК 19,20.
Тем не менее, гены-мишени каждого дистального регуляторного элемента труднее предсказать. Чаще всего взаимодействия между дистальными регуляторными элементами и их мишенями являются клеточными и специфическими для стимула 21,22, охватывают сотни килооснований, соединяя другие гены в любом направлении 23,24,25, и даже могут быть расположены внутри интронных областей их гена-мишени или других непромежуточных генов 26,27. Кроме того, дистальные регуляторные элементы также могут контролировать более одного гена одновременно, и наоборот28,29. Эта позиционная сложность препятствует выявлению регуляторных ассоциаций между ними, и, следовательно, большинство мишеней каждого регуляторного элемента в каждом типе клеток остаются неизвестными.
В последние годы наблюдается значительный бум в развитии методов захвата конформации хромосом (3C) для изучения хроматиновых взаимодействий. Наиболее широко используемый из них, Hi-C, позволяет создать карту всех взаимодействий между каждым фрагментом геномаклетки 30. Однако для обнаружения значимых взаимодействий на уровне рестрикционных фрагментов Hi-C полагается на сверхглубокое секвенирование, запрещая его использование для рутинного изучения регуляторного ландшафта отдельных генов. Чтобы преодолеть это экономическое ограничение, появилось несколько методов 3C на основе обогащения, таких как ChIA-PET31, HiChIP32 и его аналог HiCuT33 с низким энергопотреблением. Эти методы зависят от использования антител для обогащения полногеномных взаимодействий, опосредованных специфическим белком. Тем не менее, уникальная особенность этих методов 3C также является проклятием их применения; Пользователи рассчитывают на наличие высококачественных антител к интересующему белку и не могут сравнивать условия, в которых связывание белка является динамическим.
Promoter Capture Hi-C (PCHi-C) — это еще один метод 3C на основе обогащения, который обходит эти ограничения34,35. Используя систему обогащения биотинилированного зонда РНК, PCHi-C может генерировать полногеномные библиотеки геномных областей с высоким разрешением, взаимодействующих с 28 650 промоторами генов, аннотированными человеком или 27 595 промоторами генов, также известными как промоторный интерактом. Такой подход позволяет выявлять значимые дальние взаимодействия при разрешении на уровне рестрикционных фрагментов как активных, так и неактивных промоторов, а также надежно сравнивать промоторные интерактомы между любыми условиями независимо от динамики модификаций гистонов или связывания с белками. PCHi-C широко используется в последние годы для идентификации промоторных интерактомных реорганизаций во время дифференцировкиклеток 36,37, идентификации механизма действия транскрипционных факторов38,39 и обнаружения новых потенциальных генов и путей, дерегулированных при заболевании некодирующими вариантами 40,41,42,43,44,45,46,47,48, наряду с мутациями нового драйвера, не кодирующими49,50. Кроме того, просто модифицируя систему захвата, этот метод может быть настроен в соответствии с биологическим вопросом для опроса любого интерактома (например, энхансерного интерактома 51 или интерактома набора некодирующих изменений41,52).
Тем не менее, PCHi-C полагается как минимум на 20 миллионов клеток для выполнения этого метода, что предотвращает изучение дефицитных клеточных популяций, таких как те, которые часто используются в биологии развития и клинических приложениях. По этой причине мы разработали Capture Hi-C с низким входом (liCHi-C), новый экономичный и настраиваемый метод, основанный на экспериментальной структуре PCHi-C для создания промоторных интерактомов высокого разрешения с низким входом клеток. Выполняя эксперимент с минимальными изменениями пробирок, заменяя или исключая этапы из исходного протокола PCHi-C, резко сокращая объемы реакции и изменяя концентрации реагентов, сложность библиотеки максимизируется, и можно создавать высококачественные библиотеки всего с 50 000 ячеек53.
Низковходной захват Hi-C (liCHi-C) был протестирован с PCHi-C и использовался для выяснения перенастройки промоторного интерактома во время дифференцировки гемопоэтических клеток человека, обнаружения потенциальных новых генов и путей, связанных с заболеванием, дерегулированных некодирующими изменениями, и выявления хромосомных аномалий53. Пошаговый протокол и различные элементы контроля качества с помощью этой техники подробно описаны здесь до окончательного создания библиотек и их вычислительного анализа.
liCHi-C предлагает возможность создания библиотек промоторных интерактомов с высоким разрешением, используя аналогичную экспериментальную структуру PCHi-C, но со значительно уменьшенным числом клеток. Это в значительной степени достигается за счет устранения ненужных этапов, таких как оч…
The authors have nothing to disclose.
Мы благодарим остальных сотрудников лаборатории Хавьера за отзыв о рукописи. Мы благодарим Программу CERCA, Женералитат Каталонии и Фонд Хосепа Каррераса за институциональную поддержку. Эта работа финансировалась FEDER/Министерством науки и инноваций Испании (RTI2018-094788-A-I00), Европейской гематологической ассоциацией (4823998) и Испанской ассоциацией по борьбе с раком (AECC) LABAE21981JAVI. BMJ финансируется проектом «Младший лидер» La Caixa Banking Foundation (LCF/BQ/PI19/11690001), LR финансируется стипендией AGAUR FI (2019FI-B00017), а LT-D финансируется стипендией FPI (PRE2019-088005). Мы благодарим докторскую программу по биохимии и молекулярной биологии из Автономного университета Барселоны за поддержку. Ни один из спонсоров не участвовал ни в одном из этапов разработки эксперимента или написания рукописи.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |