O Hi-C 3.0 é um protocolo Hi-C aprimorado que combina reticulantes de formaldeído e glutarato de disuccinimidil com um coquetel de enzimas de restrição DpnII e DdeI para aumentar a relação sinal-ruído e a resolução da detecção da interação cromatina.
A captura de conformação cromossômica (3C) é usada para detectar interações tridimensionais de cromatina. Normalmente, a reticulação química com formaldeído (AF) é usada para fixar interações de cromatina. Em seguida, a digestão da cromatina com uma enzima de restrição e a subsequente religação das extremidades do fragmento convertem a proximidade tridimensional (3D) em produtos de ligadura exclusivos. Finalmente, após a reversão das ligações cruzadas, remoção de proteínas e isolamento do DNA, o DNA é cortado e preparado para sequenciamento de alto rendimento. A frequência de ligadura de proximidade de pares de loci é uma medida da frequência de sua colocalização no espaço tridimensional em uma população celular.
Uma biblioteca Hi-C sequenciada fornece informações de todo o genoma sobre frequências de interação entre todos os pares de loci. A resolução e a precisão do Hi-C dependem de uma reticulação eficiente que mantém os contatos da cromatina e da fragmentação frequente e uniforme da cromatina. Este trabalho descreve um protocolo Hi-C in situ melhorado, Hi-C 3.0, que aumenta a eficiência da reticulação combinando dois reticulantes (formaldeído [FA] e glutarato de disuccinimidil [DSG]), seguido de digestão mais fina usando duas enzimas de restrição (DpnII e DdeI). O Hi-C 3.0 é um protocolo único para a quantificação precisa de características de dobramento do genoma em escalas menores, como loops e domínios topologicamente associados (TADs), bem como características em escalas maiores de todo o núcleo, como compartimentos.
A captura de conformação cromossômica tem sido utilizada desde 20021. Fundamentalmente, cada variante de captura de conformação depende da fixação das interações DNA-proteína e proteína-proteína para preservar a organização da cromatina 3D. Isto é seguido por fragmentação de DNA, geralmente por digestão de restrição e, finalmente, religação de extremidades de DNA próximas para converter loci espacialmente proximais em sequências de DNA covalentes únicas. Os protocolos 3C iniciais usavam PCR para amostrar interações específicas “um-para-um”. Ensaios 4C subsequentes permitiram a detecção de interações “um-para-todos”2, enquanto o 5C detectou interações “muitos-para-muitos”3. A captura de conformação cromossômica se concretizou completamente após a implementação de sequenciamento de alta produção (NGS) de próxima geração, que permitiu a detecção de interações genômicas “all-to-all” usando Hi-C4 em todo o genoma e técnicas comparáveis, como 3C-seq5, TCC6 e Micro-C 7,8 (ver também revisão por Denker e De Laat9).
Em Hi-C, nucleotídeos biotinilados são usados para marcar saliências de 5′ após a digestão e antes da ligadura (Figura 1). Isso permite a seleção de fragmentos adequadamente digeridos e religados usando contas revestidas com estreptavidina, diferenciando-o do GCC10. Uma importante atualização do protocolo Hi-C foi implementada por Rao et al.11, que realizaram a digestão e religação em núcleos intactos (ou seja, in situ) para reduzir os produtos de ligadura espúria. Além disso, a substituição da digestão HindIII pela digestão MboI (ou DpnII) reduziu o tamanho do fragmento e aumentou o potencial de resolução do Hi-C. Esse aumento permitiu a detecção de estruturas de escala relativamente pequena e uma localização genômica mais precisa de pontos de contato, como alças de DNA entre pequenos cis-elementos, por exemplo, alças entre sítios ligados à CTCF geradas por extrusão de alça11,12. No entanto, esse potencial tem um custo. Primeiro, um aumento de duas vezes na resolução requer um aumento de quatro vezes (22) nas leituras de sequenciamento13. Em segundo lugar, os pequenos tamanhos de fragmentos aumentam a possibilidade de confundir fragmentos vizinhos não digeridos com fragmentos digeridos e religados14. Como mencionado, em Hi-C, fragmentos digeridos e religados diferem dos fragmentos não digeridos pela presença de biotina na junção de ligadura. No entanto, a remoção adequada da biotina das extremidades não ligadas é necessária para garantir que apenas as junções de ligadura sejam puxadas para baixo14,15.
Com a diminuição do custo do NGS, torna-se viável estudar o dobramento cromossômico com mais detalhes. Para diminuir o tamanho dos fragmentos de DNA e, assim, aumentar a resolução, o protocolo Hi-C pode ser adaptado para usar com maior frequência enzimas de restrição de corte16 ou para usar combinações de enzimas de restrição17,18,19. Alternativamente, a MNase 7,8 em Micro-C e DNase em DNase Hi-C20 podem ser tituladas para alcançar a digestão ideal.
Uma avaliação sistemática recente dos fundamentos dos métodos 3C mostrou que a detecção de características de dobramento cromossômico em todas as escalas de comprimento melhorou muito com reticulação sequencial com 1% de AF seguida de 3 mM DSG17. Além disso, o Hi-C com digestão HindIII foi a melhor opção para detectar características de dobramento em larga escala, como compartimentos, e que o Micro-C foi superior na detecção de características de dobramento em pequena escala, como laços de DNA. Esses resultados levaram ao desenvolvimento de uma estratégia “Hi-C 3.0” única e de alta resolução, que utiliza a combinação de reticulantes FA e DSG seguida de dupla digestão com endonucleases DpnII e DdeI21. O Hi-C 3.0 fornece uma estratégia eficaz para uso geral, pois detecta com precisão os recursos de dobragem em todas as escalas de comprimento17. A parte experimental do protocolo Hi-C 3.0 é detalhada aqui e os resultados típicos que podem ser esperados após o sequenciamento são mostrados.
Figura 1: Procedimento Hi-C em seis etapas. As células são fixadas primeiro com AF e, em seguida, DSG (1). Em seguida, a lise precede uma dupla digestão com DdeI e DpnII (2). A biotina é adicionada por saliência de preenchimento e as extremidades embotadas proximais são ligadas (3) antes da purificação do DNA (4). A biotina é removida das extremidades não ligadas antes da sonicação e seleção de tamanho (5). Finalmente, o pull-down da biotina permite a ligadura do adaptador e a amplificação da biblioteca por PCR (6). Abreviaturas: FA = formaldeído; DSG = glutarato de disuccinimidilo; B = Biotina. Por favor, clique aqui para ver uma versão maior desta figura.
Etapas críticas para o manuseio de células
Embora seja possível usar um número menor de células de entrada, este protocolo foi otimizado para ~ 5 × 106 células por pista de sequenciamento (~ 400 M lê) para garantir a complexidade adequada após o sequenciamento profundo. As células são melhor contadas antes da fixação. Para a geração de bibliotecas ultraprofundas, geralmente multiplicamos o número de pistas (e células) até que a profundidade de leitura desejada seja atingida. Para uma fixação ideal, o meio contendo soro deve ser substituído por PBS antes da fixação da AF, e soluções fixadoras devem ser adicionadas imediatamente e sem gradientes de concentração 15,22. Para a colheita celular, a raspagem é preferida à tripsinização, porque a transição de uma forma mais plana para uma forma esférica após a tripsinização pode afetar a conformação nuclear. Após a adição de DSG, pellets de células soltas e aglomeradas são facilmente perdidos. Tenha cuidado ao manusear as células nesta fase e adicione até 0,05% de BSA para diminuir a aglomeração.
Modificações no método
Esse protocolo foi desenvolvido utilizando células humanas17. No entanto, com base na experiência com a captura de conformação cromossômica, esse protocolo deve funcionar para a maioria das células eucarióticas. Para uma entrada significativamente menor (~1 × 106 células), aconselhamos o uso de metade dos volumes para os procedimentos de lise e captura de conformação [etapas 2.1-2.4]. Isso também permitiria que o isolamento do DNA [etapa 2.5] fosse realizado em uma centrífuga de mesa com tubos de 1,7 mL, o que poderia melhorar a peletização para baixas concentrações de DNA. A quantificação do ADN (passo 2.6.6) indicará como proceder. Para baixas quantidades de DNA isolado (1-5 μg), sugerimos pular a seleção de tamanho (etapa 3.3) e prosseguir com a remoção de biotina após reduzir o volume de 130 μL para ~45 μL com uma UFC.
Este protocolo foi desenvolvido especificamente para garantir dados de alta qualidade após subsequente reticulação com AF e DSG e digestão com DpnII e DdeI. No entanto, estratégias alternativas de reticulação, como a AF seguida de EGS (bis(succinimidil succinato)), que também é usada em ChIP-seq23 e ChIA-PET24, podem funcionar igualmente bem17. Da mesma forma, diferentes combinações enzimáticas, como DpnII e HinfI18 ou MboI, MseI e NlaIII19 podem ser usadas para digestão. Ao adaptar combinações enzimáticas, certifique-se de usar nucleotídeos biotinilados que possam preencher as saliências específicas de 5 ‘e usar os tampões mais ideais para cada coquetel. DpnII vem com seu próprio tampão e o fabricante da enzima recomenda um tampão específico para a digestão DdeI. No entanto, para a dupla digestão com DpnII e DdeI neste protocolo, o tampão de restrição é recomendado porque é avaliado em 100% de atividade para ambas as enzimas.
Solução de problemas de captura de conformação
As três etapas principais na captura da conformação cromossômica: reticulação, digestão e religação foram realizadas antes que os resultados possam ser visualizados em gel. Para determinar a qualidade de cada uma dessas três etapas e discernir onde os problemas poderiam ter surgido, as alíquotas antes (IC) e após a digestão (DC) são tomadas e carregadas no gel junto com a amostra de Hi-C ligada (Figura 2). Este gel é usado para determinar a qualidade da amostra Hi-C e se valerá a pena continuar o protocolo. Sem o IC e a DO, é difícil identificar possíveis passos subótimos. Vale a pena notar que a ligadura subótima pode ser devido a um problema na própria ligadura, no preenchimento ou em um problema com a reticulação. Para solucionar problemas de reticulação, certifique-se de não usar mais de 1 × 107 células por biblioteca e comece com novos reagentes de reticulação e células limpas (ou seja, enxaguadas com PBS). Para ligadura, certifique-se de que as células e a mistura de ligadura sejam mantidas no gelo. Adicionar T4 DNA ligase imediatamente antes da incubação de 4 h a 16 °C e misturar bem.
Solução de problemas de preparação da biblioteca
Se forem necessários mais de 10 ciclos de PCR ou nenhum produto de PCR puder ser visto em gel após a titulação por PCR (Figura 4), há algumas opções para salvar a amostra Hi-C. Trabalhando de volta a partir da titulação de PCR, a primeira opção é tentar a PCR novamente. Se ainda não houver produto suficiente, é possível tentar outra rodada de retailing A e ligadura do adaptador (etapa 3.6) depois de lavar as contas duas vezes com 1x buffer TLE. Após esta ligadura adicional de cauda A e adaptador, pode-se proceder à titulação por PCR como antes. Se ainda não houver produto, a última opção é resonicar a fração 0,8x da etapa 3.3 e prosseguir a partir daí.
Limitações e vantagens do Hi-C3.0
É importante perceber que o Hi-C é um método de base populacional que captura a frequência média de interações entre pares de loci na população celular. Algumas análises computacionais são projetadas para desembaraçar combinações de conformações de uma população25, mas, em princípio, o Hi-C é cego para as diferenças entre as células. Embora seja possível realizar Hi-C 26,27 de célula única e inferências computacionais possam ser feitas 28, o Hi-C de célula única não é adequado para a obtenção de informações 3C de ultra-alta resolução. Uma limitação adicional do Hi-C é que ele detecta apenas interações pareadas. Para detectar interações multicontato, pode-se usar cortadores frequentes combinados com sequenciamento de leitura curta (Illumina)16 ou realizar multicontato 3C29 ou 4C30, usando sequenciamento de leitura longa de plataformas PacBio ou Oxford Nanopore. Derivados de Hi-C para detectar especificamente contatos entre e ao longo de cromátides irmãs também foram desenvolvidos31,32.
Embora o Hi-C19 e o Micro-C33 possam ser usados para gerar mapas de contato em resoluções subquilobase, ambos exigem uma grande quantidade de leituras de sequenciamento e isso pode se tornar um empreendimento caro. Para chegar a uma resolução semelhante ou até maior sem os custos, o enriquecimento para regiões genômicas específicas (captura-C 34) ou interações proteicas específicas (ChiA-PET 35, PLAC-seq36, Hi-ChIP37) pode ser aplicado. A força e a desvantagem dessas aplicações de enriquecimento é que apenas um número limitado de interações é amostrado. Com tais enriquecimentos, o aspecto global do Hi-C (e a opção da normalização global) é perdido.
Importância e potenciais aplicações do Hi-C3.0
Esse protocolo foi projetado para permitir 3C ultraprofundos de alta resolução e, ao mesmo tempo, detectar recursos de dobragem em larga escala, como TADs e compartimentos17 (Figura 6). Este protocolo começa com 5 × 106 células por tubo para cada biblioteca Hi-C, que deve ser material mais do que suficiente para sequenciar uma ou duas pistas em uma célula de fluxo para obter até 1 bilhão de leituras emparelhadas. Para sequenciamento ultraprofundo, múltiplos tubos de 5 × 106 células devem ser preparados, dependendo do número de leituras mapeadas e duplicatas de PCR. Na resolução mais alta (<1 kb), as interações de looping são encontradas principalmente entre os locais da CTCF, mas as interações promotor-potenciador também podem ser detectadas. Os leitores podem consultar Akgol Oksuz et al.17 para uma descrição detalhada da análise dos dados.
The authors have nothing to disclose.
Gostaríamos de agradecer a Denis Lafontaine pelo desenvolvimento do protocolo e a Sergey Venev pela assistência em Bioinformática. Este trabalho foi apoiado por uma doação do National Institutes of Health Common Fund 4D Nucleome Program para J.D. (U54-DK107980, UM1-HG011536). J.D. é investigador do Howard Hughes Medical Institute.
Este artigo está sujeito à política de Acesso Aberto a Publicações da HHMI. Os chefes de laboratório do HHMI já concederam uma licença CC BY 4.0 não exclusiva ao público e uma licença sublicenciável ao HHMI em seus artigos de pesquisa. De acordo com essas licenças, o manuscrito aceito pelo autor deste artigo pode ser disponibilizado gratuitamente sob uma licença CC BY 4.0 imediatamente após a publicação.
1 kb Ladder | New England Biolabs | N3232L | |
Agarose | Invitrogen | 16500100 | |
Agencourt AMPure XP magnetic beads , 60 mL | Beckman Coulter | A63881 | |
Amicon Ultra-0.5 Centrifugal Filter Unit (CFU) | EMD Millipore | UFC500396 | |
Annealing Buffer (5x) | See recipe in supplemental materials | ||
ATP 10 mM | ThermoFisher | R0441 | |
Avanti J-25i High Speed Refrigerated ultra-centrifuge | Beckman Coulter | ||
beckman ultracentrifuge tube 35 mL | Beckman Coulter | 357002 | |
Binding Buffer (2x) | See recipe in supplemental materials | ||
biotin-14-dATP 0.4 mM | Invitrogen | 19524-016 | |
BSA 10 mg/mL | New England Biolabs | B9000S | dilute from 20 mg/mL |
Cell scraper | Falcon | 353089 | |
Cell scraper | Corning | 3008 | |
Conical polypropylene tubes 50 mL | Denville | C1062-P | |
Conical tube 15 mL | Denville | C1017-P | |
Covaris micro tube AFA fiber with snap-cap 130 µL | Covaris | 520045/520077 | |
Covaris Sonicator | Covaris | E220/E220evolution/M220 | |
Culture flask 175 cm2 | Falcon | 353112 | |
Culture plates 150 mm x 25 mm | Corning | 430599 | |
dATP 1 mM | Invitrogen | 56172 | |
dATP 10 mM | Invitrogen | 56172 | |
dCTP 10 mM | Invitrogen | 56173 | |
DdeI | New England Biolabs | R0175L | |
dGTP 10 mM | Invitrogen | 56174 | |
DMSO | Sigma | D2650-5x10ML | |
dNTP mix 25 mM | Invitrogen | 10297117 | |
Dounce homogenizer | DWK Life Sciences | 8853010002/8853030002 | |
DPBS | Gibco | 14190-144 | |
DpnII | New England Biolabs | R0543M | |
DSG | ThermoScientific | 20593 | |
dTTP 10 mM | Invitrogen | 56175 | |
Ethanol 70% | Fisher | A409-4 | Diluted from 100% |
Ethidium Bromide | Fisher | BP1302-10 | |
Formaldehyde (37%) | Fisher | BP531-500 | |
Gel loading dye (6x ) | New England Biolabs | B7024S | |
Glycine in ultrapure water 2.5 M | Sigma | G8898-1KG | |
HBSS | Gibco | 14025-092 | |
Igepal CA-630 detergent | MP Biomedicals | 198596 | |
Klenow DNA polymerase 5 U/µL | New England Biolabs | M0210L | |
Klenow Fragment 3–>5’ exo-, 5 U/µL | New England Biolabs | M0212L | |
ligation buffer (10x) | New England Biolabs | B7203S | |
Liquid nitrogen | |||
LoBind microcentrifuge tube 1.7 mL | Eppendorf | 22431021 | |
Low Molecular Weight DNA Ladder | New England Biolabs | N3233L | |
Lysis buffer | See recipe in supplemental materials | ||
Magnetic Particle separator | ThermoFisher | 12321D | |
Microfuge tubes 1.7 mL | Axygen | MCT-175-C | |
MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
NEBuffer 2.1 (10x) | New England Biolabs | B7002S | |
NEBuffer 3.1 (10x) | New England Biolabs | B7203S | |
PBS | Gibco | 70013-032 | |
PCR (strip) tubes | Biorad | TBS0201/ TCS0803 | |
PCR thermocycler | Biorad | T100 | |
Pfu Ultra II Buffer (10x) | Agilent | Comes with Pfu Ultra | |
PfuUltra II Fusion HS DNA Polymerase | Agilent | 600674 | |
Phase lock tube 15 mL | Qiagen | 129065 | |
Phase lock tubes 2 mL | Qiagen | 129056 | |
Phenol:chloroform:isoamyl alcohol | Invitrogen | 15593-049 | |
Protease inhibitor cocktail | ThermoFisher | 78440 | |
Proteinase K in ultrapure water 10 mg/mL | Invitrogen | 25530-031 | |
Refrigerated Centrifuge | Eppendorf | 5810R | |
RNase A, DNase and protease-free 10 mg/mL | Thermo Scientific | EN0531 | |
Rotator | Argos technologies | EW-04397-40 or rocking platform | |
SDS 1% | Fisher | BP13111 | |
Sodium acetate pH = 5.2, 3 M | Sigma | ||
Sub-Cell GT Horizontal Electrophoresis System | Biorad | 1704401 | |
T4 DNA ligase 1 U/µL | Invitrogen | 100004817 | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase 3 U/µL | New England Biolabs | M0203L | |
T4 ligation buffer (5x) | Invitrogen | Y90001 | |
T4 polynucleotide kinase 10 U/µL | New England Biolabs | M0201L | |
Tabletop centrifuge | Eppendorf | 5425 | |
TBE buffer | See recipe in supplemental materials | ||
Tris Low EDTA Buffer (TLE) | See recipe in supplemental materials | ||
Triton X-100 (10%) | Sigma | 93443 | |
Truseq adapter oligos | Integrated DNA Technologies (IDT)) | https://www.idtdna.com/site/order/oligoentry | 250 nmole and HPLC purified |
Tween 20 detergent | Fisher | 9005-64-5 | |
Tween Wash Buffer | See recipe in supplemental materials | ||
Vortex | Scientific Industries | (G560)SI-0236 |