ДНК нормативных элементов, таких как усилители, контроль экспрессии генов связавшись физически целевой генным стимуляторам, часто через большой дальности хромосомных взаимодействия, охватывающих большие расстояния геномной. Промоутер захватить Hi-C (PCHi-C) идентифицирует значимых взаимодействий между промоутеров и дистальной регионами, позволяя назначение потенциал регулирования последовательностей для их целевых генов.
Трёхмерный Организации генома связано с ее функции. Например нормативных элементов, таких как транскрипционный анализ усилители управляют пространственно временных выражение их целевых генов через физический контакт, часто преодоление значительно (в некоторых случаях сотни kilobases) геномных расстояния и обход близлежащих генов. Геном человека затаивает примерно один миллион усилители, подавляющее большинство из которых имеют неизвестные цели ген. Присвоение их генов-мишеней дистальной регулирования регионах важно таким образом понять управления выражения гена. Мы разработали промоутер захватить Hi-C (PCHi-C), чтобы включить обнаружение генома общесистемной дистальной промоутер взаимодействующих областей (Пирс), для всех промоутеров в одном эксперименте. В PCHi-C весьма сложные Hi-C библиотек специально обогащены промоутер последовательностей подборку в решение для совместной работы с тысячами биотинилированным РНК приманки дополняет концы всех промоутер содержащих ограничение фрагментов. Цель состоит в том, затем потяните вниз промоутер последовательностей и их частое взаимодействие партнеров таких усилителей и других потенциальных регуляторных элементов. После высокой пропускной способности в паре конец последовательности, статистический тест применяется для каждого фрагмента промоутер лигируют ограничений для выявления значительных Пирс на уровне фрагмент ограничение. Мы использовали PCHi-C для создания атласа на большие расстояния промоутер взаимодействий в десятки человека и типы клеток мыши. Эти карты interactome промоутер способствовали более глубокому пониманию млекопитающих ген выражение управления присвоения предполагаемого регулирования регионов их генов-мишеней и выявление преференциальных пространственных промоутер промоутер взаимодействия сетей. Эта информация также имеет большое значение для понимания генетических болезней человека и выявление потенциальных болезней генов, связывая некодирующих болезни связанные последовательности вариантов или поблизости управляющие последовательности для их целевых генов.
Накопление доказательств свидетельствует о том, что трехмерной Организации генома играет важную функциональную роль в диапазоне ядерных процессов, в том числе генов активации1,2,3, репрессии4 ,5,6,7,8, рекомбинация9,10, ДНК ремонт11, репликации ДНК12,13, и 14клеточного старения. Далекие усилители находятся в пространственной близости к промоутеров, что они регулируют15,16,17, которая необходима для надлежащего пространственно временных ген выражение элемента управления. Усилитель удаления показывают, что дистальной усилители важны для целевого гена транскрипции18,19,20,21,22и «вынуждены хроматина цикла» показывает что инженерных привязывая между enhancer и его целевой промоутер в локусе ГБД является достаточным для привода transcriptional активации23. Кроме того перестановки генома, которые приносят гены под контролем внематочная усилители может привести к неуместным генов активации и болезни24,25,26. Вместе эти примеры иллюстрируют, что промоутер усилитель взаимодействия необходимы для управления гена и требуют жесткой регулирования для обеспечения соответствующего гена выражение. Человека и мыши геномов каждого оцениваются в гавани около одного миллиона усилители. Для подавляющего большинства этих усилителей генов-мишеней неизвестны, и плохо понимаются «правила применения вооруженной силы» между промоутеров и усилители. Таким образом назначение transcriptional усилители для их целевых генов остается серьезной проблемой в расшифровке млекопитающих ген выражение элемента управления.
Наше понимание архитектуры трехмерной генома революционизировал введение 3C27 (хромосома конформации захвата) и его варианты28,,2930,31 . Самый мощный из этих методов, Hi-C (высокая пропускная способность хромосома конформации захват) предназначена для идентификации весь ансамбль хромосомных взаимодействий в популяции клеток. Привет-C библиотек, обычно создается из миллионов клеток, являются весьма сложными с приблизительно 1011 независимых лигирование продуктов между фрагментами ~ 4 kb в геноме человека32. Как следствие, надежных и воспроизводимых определение взаимодействий между отдельными ограничение фрагменты (например, содержащие промоутер или усилитель) от Hi-C данных невозможно, если библиотеки Hi-C подвергаются Ультра глубокое последовательности, которая не является экономически жизнеспособным решением для лабораторий, регулярно готовит Hi-C библиотек. Чтобы обойти этот недостаток, мы разработали промоутер захватить Hi-C специально обогатить промоутер содержащие продукты лигирование от Hi-C библиотек. Мы сосредоточились на промоутеров по двум причинам. Во-первых промоутер усилитель контактов было показано, чтобы иметь решающее значение для надлежащего ген выражение уровней в многочисленных исследованиях (см. ссылки выше), и во-вторых, как промоутеров во многом инвариантны между типами клеток, одной и той же системы приманки захвата может использоваться для допросов регулирования цепь на нескольких типов клеток и условий. Наш подход опирается на решение гибридизации Hi-C библиотек с десятками тысяч биотинилированным РНК 120mers дополняет промоутер содержащих продуктов перешнуровки Hi-C и последующего захвата на стрептавидина покрытием магнитные бусы. Это приводит к PCHi-C библиотек с значительно снижена сложность по сравнению с исходной библиотеке Hi-C, сосредоточив внимание только на идентификации фрагментов, которые лигируют промоутеров на значительно высоких частотах.
Мы использовали PCHi-C в типы клеток мыши для содействия более глубокому пониманию управления выражение гена, раскрытие дальнего дистальной промоутер взаимодействующих регионах с предполагаемым функции регулирования и ряд человека, а также не случайные Промоутер промоутер контактов в трехмерном пространстве ядра. Эти исследования сопоставлены сотни тысяч промоутер усилитель контактов через многочисленные ячейки типы33,34,35,36,,3738, 39, определены Организации Polycomb репрессивных комплекс-опосредованной пространственных генома мыши эмбриональные стволовые клетки7, продемонстрировали масштабный переоснащая промоутер interactomes в клеточной дифференциации37, 38 , 39и связанных некодирующих болезни связанные последовательности вариантов гена промоутеров35.
PCHi-C является метод идеально подходит для карты генома общесистемной ансамбль последовательностей ДНК, взаимодействующих с промоутерами. Соответствующих подходов, таких как захват Привет-C непрерывного геномной регионов (см. обсуждение) являются методом выбора для получения высокого разрешения взаимодействия профили для выбранных регионах геномной. PCHi-C и захватить Hi-C чрезвычайно схожи с экспериментальной точки зрения (единственное различие является выбор системы захвата), так что рекомендации и руководящие принципы, мы предоставляем применимы для обоих подходов. Здесь мы представляем детальное описание PCHi-C. Мы изложить обоснование и дизайн PCHi-C эксперимента, предоставляют пошаговые протокол поколения библиотека PCHi-C и иллюстрируют, как качество библиотек PCHi-C может контролироваться на различных этапах в протоколе для получения качественных данных.
Модульная конструкция промоутер захватить Hi-C
Промоутер захватить Hi-C предназначен для специально обогатить Hi-C библиотеки для взаимодействия с участием промоутеров. Эти взаимодействия составляют только подмножество лигирование продуктов, присутствующих в библиотеке Hi-C.
Захват Привет-C можно легко изменить для обогащения Hi-C библиотек для любой геномной региона или регионов интерес, изменив систему захвата. Захват регионов может быть непрерывной геномной сегментов44,45,46,48, усилители, которые были определены в PCHi-C (35′обратный захват Hi-C’), или DNase сверхчувствительным сайты49 . Размер захвата системы может корректироваться в зависимости от области экспериментальной. Например, Драйден и др. целевые 519 приманки фрагментов в трех пустынь генов, связанных с раком молочной железы44. Система захвата Мартин и др. цели обеих непрерывной геномной сегментов («Региона захватить»: 211 геномной регионов в общей сложности; 2 131 фрагментов) и промоутеров (3857 генным стимуляторам)45.
SureSelect библиотеки доступны в разные типоразмеры: 1 КБ до 499 kb (5 190 – 4,806), 500 КБ до 2,9 МБ (5 190 – 4,816) и 3 МБ до 5,9 МБ (5 190 – 4,831). Как каждый индивидуальный захват биотин РНК длиной 120 нуклеотидов, они захватить систем вместить максимум 4,158, 24,166 и 49,166 отдельных захватить датчиков, соответственно. Это соответствует 2,079, 12,083 и 24,583 целевых фрагментов, соответственно (Обратите внимание, что номера для фрагментов нижней границы, основывается на предположении, что два отдельных захвата зонды могут быть разработаны для каждого ограничения фрагмент — в действительности из-за повторяющихся последовательностей это не будет случай для каждого ограничения фрагмент (см. также Рисунок 1B, C), приводит в большее количество фрагментов ориентации ограничение для постоянного числа доступных захвата зонды ).
Протокол, описанные здесь основана на использовании энзима ограничения с узлом признание 6 bp раскрыть на большие расстояния взаимодействия. С помощью энзима ограничения с 4 сайта признание bp для большей резолюции более проксимальном взаимодействий является также возможно40,49.
Ограничения PCHi-C
Одно ограничение, свойственное все хромосомы конформации захвата анализов является, что их резолюции определяется энзима ограничения, используемый для создания библиотеки. Взаимодействия, которые происходят между ДНК элементов, расположенных на один и тот же фрагмент ограничения являются невидимыми для «C-тип» анализов. Кроме того в PCHi-C, в некоторых случаях более чем один сайт начало транскрипции может быть расположен на тот же промоутер содержащих ограничение фрагмент, и Пирс в некоторых случаях гавани оба активных и репрессивных гистона знаки, что делает его трудно определить который регулирования элементы посредником взаимодействий и предсказать регулирования выходной промоутер взаимодействий. С помощью энзимов ограничения с 4 bp признание сайтов устраняет эту проблему, но происходит за счет значительно возросшей сложности библиотека Hi-C (Hi-C библиотек, созданных с энзимами ограничения распознавания сайта 4 bp по крайней мере в 100 раз более сложной, чем Hi-C библиотеки, созданные с энзимами ограничения распознавания сайта 6 bp) и связанные с этим расходы для следующего поколения последовательности.
Еще одним ограничением является, что текущий протокол PCHi-C требует миллионы клеток как исходного материала, исключающего анализ взаимодействий промоутер в типах редких клеток. Модифицированная версия PCHi-C с тем чтобы допрос промоутер контактов в клеточных популяций с 10 000 до 100 000 клеток (например, клетки во время раннего эмбрионального развития или гемопоэтических стволовых клеток) поэтому бы ценным дополнением к захвату Привет-C панели инструментов.
Наконец как все методы, которые полагаются на формальдегид фиксации, PCHi-C только записи взаимодействий, которые являются «заморожены» в момент времени фиксации. Таким образом для изучения кинетики и динамика промоутер взаимодействий, требуются методы, такие как супер резолюции микроскопия живой клетки вместе с PCHi-C.
Методы для того чтобы рассечь пространственных хромосома Организации с высоким разрешением
Огромные сложности хромосомных взаимодействия библиотек запрещает надежной идентификации продуктов взаимодействия между двух конкретных фрагментов с статистической значимости. Чтобы обойти эту проблему, захват последовательности был использован для обогащения Hi-C-33,–34,–40,–44 или 3 C50,51 библиотек для специфических взаимодействий. Основным преимуществом использования Hi-C библиотеки свыше 3C для обогащения шаг является Hi-C, в отличие от 3C, включает обогащение шаг для подлинного лигирование продуктов. Как следствие процент действительно читает в PCHi-C библиотек примерно в 10 раз выше, чем в захват-C библиотек50, в которой содержится около 5-8% действительный читает после фильтрации HiCUP. Sahlen et al. непосредственно сравнивать захвата-C HiCap, который, как PCHi-C использует библиотеки Hi-C для захвата обогащения, в отличие от захвата-C, которая использует 3 C библиотек. В соответствии с нашими выводами, они обнаружили, что захват-C библиотек главным образом состоят из ООН перевязаны фрагменты40. Кроме того HiCap библиотек был выше сложность, чем захват-C библиотек40.
Вариант захвата-C, под названием следующего поколения захвата-C52 (нг захвата-C) использует один oligo на конец фрагмента ограничения, ранее созданного в PCHi-C33,34, вместо дублирования датчики, используемые в оригинале Захват-C протокол50. Это увеличивает процент действительно читает по сравнению с захвата-C скромно, но нг захвата-C использует два последовательных раундов захвата обогащения, и относительно большое количество PCR циклов (20-24 циклов в общей сложности, по сравнению с 11 циклов обычно для PCHi-C), которая неизбежно приводит к росту числа дубликатов последовательности и Нижняя библиотека сложности. В пробные эксперименты во время оптимизации PCHi-C, мы обнаружили, что процент уникальных (т.е., не дублируются) читать пар был только около 15% когда мы использовали 19 циклов PCR (13 циклов предварительного захвата + 6 циклов после захвата; данные не показаны), однако Оптимизация на меньшее количество циклов PCR, обычно дает 75 – 90% уникальных чтения пар. Таким образом уменьшение числа циклов PCR значительно увеличивает количество информативный последовательности данных.
Бронирование метод сочетает в себе чип с Hi-C, чтобы сосредоточиться на хромосомные взаимодействий при посредничестве специфического протеина интереса (53HiChIP). По сравнению с Цзя-PET54, которая основана на аналогичные обоснования, HiChIP данные содержат большее количество информативный последовательности читает, позволяя больше доверия взаимодействия вызова53. Это будет очень интересно непосредственно сравнить соответствующие HiChIP и наборы данных захватить Hi-C когда они становятся доступными (к примеру, HiChIP, используя антитело против когезинов группы Smc1a53 с захвата Hi-C для всех Smc1a связано ограничение фрагменты) бок о бок. Одно неотъемлемое различие между этими двумя подходами, что захватить Hi-C не полагаться на иммунопреципитации chromatin и поэтому способен опрашивания хромосомных взаимодействия независимо от белка размещение. Это позволяет сравнение 3D генома Организации в наличие или отсутствие привязки конкретных факторов, как была использована для выявления PRC1 как ключевым регулятором мыши ESC пространственных генома архитектура7.
PCHi-C и GWAS
Геном всей ассоциации исследований (GWAS) показали, что более чем 95% болезней связанные последовательности вариантов расположены в регионах некодирующих генома, часто на большие расстояния, чтобы белок кодирование генов55. GWAS варианты являются часто найдены в непосредственной близости от DNase я сверхчувствительным сайтов, который является отличительной чертой последовательностей с потенциальными регулирующей деятельности. PCHi-C и захватить Hi-C широко использовались для связи промоутеров GWAS риска локусов причастны рака груди44,48колоректального рака и аутоиммунных заболеваний35,45,46. PCHi-C исследование на 17 различных гемопоэтических клеток человека типы нашел SNPs, связанные с аутоиммунным заболеванием обогатились в Пирс в лимфоидных клеток, тогда как последовательность варианты, связанные с тромбоцитов и эритроцитов специфические черты преимущественно были найдены в макрофаги и erythroblasts, соответственно35,56. Таким образом конкретные промоутер ткани тип interactomes обнаружили в PCHi-C может помочь понять функцию некодирующих болезни связанные последовательности вариантов и выявлять новых потенциальных болезней генов для терапевтической интервенции.
Особенности взаимодействия промоутер регионов
Несколько линий доказательств связать промоутер interactomes управления выражения гена. Во-первых несколько PCHi-C исследования показали, что геномной регионов, взаимодействующих с промоутерами (высоко) выразил генов обогащаются в метках, связанные с деятельностью enhancer, таких как H3K27 ацетилирования и p300 привязки33,34 , 37. Мы нашли положительная корреляция между уровнем выражение гена и количество взаимодействующих усилители, предполагая, что эффект суммирования результата усилители в выражении увеличение гена уровнях34,35. Во-вторых естественным выражение в Пирс, которые подключены к же генов, экспрессия которых зависит от eQTLs35обогащены локусов количественных признаков (eQTLs). В-третьих путем интеграции путешествие57 и данных PCHi-C, Кэрнс et al. обнаружили, что путешествие репортер генов сопоставление Пирс в мыши ЭСК Показать сильнее репортер экспрессии генов, чем репортер генов в интеграции сайтов в регионах, не взаимодействующих промоутер 58, указав, что Пирс обладают транскрипционный анализ нормативной деятельности. Вместе эти результаты показывают, что промоутер interactomes обнаружили PCHi-C в различных мыши и типы клеток человека включают в себя ключевые нормативные модули для управления выражения гена.
Стоит отметить, что усилители представляют лишь малую долю (~ 20%) из всех Пирс, обнаружили PCHi-C33,34. Другие пиры могут иметь структурные или топологических ролей, вместо того, чтобы прямые транскрипционный анализ регулирующих функций. Однако есть также доказательства того, что PCHi-C может раскрыть элементы ДНК с функции регулирования, которые не гавани классической усилитель знаки. В линии лимфоидных клеток человека промоутер BRD7 было обнаружено взаимодействовать с регионом лишенный знаков Улушитель, что было показано, обладают усилитель активность Репортер ген анализов33. Нормативные элементы с аналогичными характеристиками могут быть более обильны, чем в настоящее время высоко. Например основанный ТРИФОСФАТЫ экран для регулирования ДНК элементы выявленных немаркированных регуляторных элементов (Урес) которые контролируют экспрессию генов, но лишены усилитель марки59.
В других случаях было показано PIRs гавани хроматина знаков, связанные с транскрипционный анализ репрессий. Пирс и взаимодействующих промоутеров, обязательность PRC1 в мыши ЭСК занимались обширные пространственные сети репрессированных генов, учитывая что репрессивные Марк H3K27me37. В человеческой лимфобластоидных клетках элемент далекой, взаимодействующих с BCL6 промоутер репрессированных трансген Репортер ген выражение33, предполагая, что он может функционировать для подавления BCL6 транскрипции в своем собственном контексте.
Пирс, обогащенного для размещения белка хроматина изолятор CTCF в человеческих ЭСК и NECs37 может представлять еще один класс Пирс. Вместе эти результаты показывают, что Пирс гавани коллекцию гена регулирования деятельности еще функционально охарактеризовать.
The authors have nothing to disclose.
Мы благодарим Валерия Малышева для критических чтении рукописи и квалифицированную помощь с рис. Эта работа была поддержана Советом медицинских исследований, Великобритания (MR/L007150/1) и Великобритании биотехнологии и биологических наук исследовательский совет, Великобритания (BB/J004480/1).
16% (vol/vol) paraformaldehyde solution | Agar Scientific | R1026 | |
Dulbecco's Modified Eagle Medium (DMEM) 1x | Life Technologies | 41965-039 | |
Fetal bovine serum (FBS) sterile filtered | Sigma | F9665 | |
Low-retention filter tips | Starlab | S1180-3810, S1180-1810, S1180-8810 and S1182-1830 | |
10x PBS pH 7.4 | Life Technologies | 70011-036 | |
Molecular biology grade water | Sigma-Aldrich | W4502 | |
1 M Tris-HCl pH 8.0 | Life Technologies | 15568-025 | |
IGEPAL CA-630 | Sigma-Aldrich | I8896 | |
5 M NaCl | Life Technologies | 24740-011 | |
Protease inhibitor cocktail (EDTA-free) | Roche Diagnostics | 11873580001 | |
Restriction buffer 2 (10x NEBuffer 2) | New England Biolabs | B7002 | |
DNA LoBind tube, 1.5 mL | Eppendorf | 0030 108.051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
20% (wt/vol) SDS | Bio-Rad Laboratories | 161-0418 | |
20% (vol/vol) Triton X-100 | Sigma-Aldrich | T8787 | |
HindIII, 100 U/uL | New England Biolabs | R0104 | |
10 mM dCTP | Life Technologies | 18253-013 | |
10 mM dGTP | Life Technologies | 18254-011 | |
10 mM dTTP | Life Technologies | 18255-018 | |
0.4 mM Biotin-14-dATP | Life Technologies | 19524-016 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202 | |
100x 10mg/ml Bovine Serum Albumin | New England Biolabs | B9001 | |
T4 DNA ligase, 1 U/μL | Invitrogen | 15224-025 | |
RNase A | Roche | 10109142001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
20 000×g 50 ml centrifuge tube | VWR | 525-0156 | |
0.5 M EDTA pH 8.0 | Life Technologies | 15575-020 | |
Phenol pH 8.0 | Sigma | P4557 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1 | Sigma | P3803 | |
Sodium acetate pH 5.2 | Sigma | S7899 | |
Quant-iT PicoGreen | Invitrogen | P7589 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
Restriction buffer 2.1 (10x NEBuffer 2.1) | New England Biolabs | B7202 | |
NheI, 100U/uL | New England Biolabs | R0131 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6x16mm vials | Covaris | 520045 | For sonication |
SPRI beads (Agencourt AMPure XP) | Beckman Coulter | A63881 | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
Tween 20 | Sigma | P9416 | |
10 mM dATP | Life Technologies | 18252-015 | |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203 | |
T4 PNK 10000 units/mL | New England Biolabs | M0201 | |
Klenow exo minus 5000 units/mL | New England Biolabs | M0212 | |
Quick ligation reaction buffer | New England Biolabs | B6058 | |
NEB DNA Quick ligase | New England Biolabs | M2200 | |
PE adapter 1.0 (5'-P-GATCGGAAGAGCGGTTCAGC AGGAATGCCGAG-3') |
Illumina | ||
PE adapter 2.0 (5'-ACACTCTTTCCCTACACGACGCT CTTCCGATCT-3') |
Illumina | ||
NEB Phusion PCR kit | New England Biolabs | M0530 | |
PE PCR primer 1.0 (5'-AATGATACGGCGACCACCGA GATCTACACTCTTTCCCTAC ACGACGCTCTTCCGATCT-3') |
Illumina | ||
PE PCR primer 2.0 (5'-CAAGCAGAAGACGGCATACGA GATCGGTCTCGGCATTCCT GCTGAACCGCTCTTCCGATCT-3') |
Illumina | ||
PCR strips | Agilent Technologies | 410022 and 401425 | |
SureSelect SSEL TE Reagent ILM PE full adaptor kit | Agilent Technologies | 931108 | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | custom design mouse or human PCHi-C system |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65601 | |
E220 high-performance focused ultra-sonicator | Corvaris | E220 |