Relatamos a aplicação da captura de conformação de cromossomos quantitativos seguida de sequenciamento de alto throughput em corpos embrionários gerados a partir de células-tronco embrionárias. Esta técnica permite identificar e quantificar os contatos entre melhoradores putativos e regiões promotoras de um determinado gene durante a diferenciação de células-tronco embrionárias.
Durante o desenvolvimento dos mamíferos, os destinos celulares são determinados através do estabelecimento de redes regulatórias que definem a especificidade, o tempo e os padrões espaciais da expressão genética. Corpos embrióides (EBs) derivados de células-tronco pluripotentes têm sido um modelo popular para estudar a diferenciação das três principais camadas de germes e definir circuitos regulatórios durante a especificação do destino celular. Embora seja sabido que os melhoradores específicos do tecido desempenham um papel importante nessas redes interagindo com os promotores, atribuindo-os aos seus genes-alvo relevantes ainda permanece desafiador. Para que isso seja possível, são necessárias abordagens quantitativas para estudar os contatos intensificadores-promotores e suas dinâmicas durante o desenvolvimento. Aqui, adaptamos um método 4C para definir os melhoradores e seus contatos com promotores cognatos no modelo de diferenciação EB. O método usa frequentemente enzimas de restrição de corte, sônica e um protocolo de PCR mediado por ligadura aninhada compatível com kits de preparação de bibliotecas de DNA comerciais. Posteriormente, as bibliotecas 4C são submetidas a sequenciamento de alto throughput e analisadas bioinforformaticamente, permitindo a detecção e quantificação de todas as sequências que tenham contatos com um promotor escolhido. Os dados de seqüenciamento resultantes também podem ser usados para obter informações sobre a dinâmica dos contatos do intensificador-promotor durante a diferenciação. A técnica descrita para o modelo de diferenciação EB é fácil de implementar.
Em camundongos, a massa celular interna (ICM) de embriões de 3,5 dias de idade contém células-tronco pluripotentes embrionárias. O ICM desenvolve-se ainda no epiblasto no dia 4.5, gerando células de ectoderme, mesoderme e endoderme, as três principais camadas germinativas do embrião. Embora as células pluripotentes no ICM existam apenas transitoriamente in vivo, elas podem ser capturadas na cultura pelo estabelecimento de células-tronco embrionárias de camundongos (mESCs)1,2,3. Os mESCs permanecem em um estado indiferenciado e proliferam indefinidamente, mas após estímulos intrínsecos e extrínsecos também são capazes de sair do estado de pluripotência e gerar células das três camadas de germes de desenvolvimento2,4. Curiosamente, quando cultivados em suspensão em pequenas gotículas, os mESCs formam agregados tridimensionais (ou seja, EBs) que se diferenciam em todas as três camadas de germes5. O ensaio de formação eb é uma ferramenta importante para estudar o processo de especificação da linhagem precoce.
Durante a especificação da linhagem, as células de cada camada de germe adquirem um programa específico de expressão genética4. A expressão espacial precisa dos genes é regulada por diversos elementos cis-regulatórios, incluindo promotores centrais, intensificadores, silenciadores e isoladores6,7,8,9. Intensificadores, segmentos de DNA regulatório tipicamente abrangendo algumas centenas de pares de bases, coordenam a expressão genética específica do tecido8. Os intensificadores são ativados ou silenciados por meio da vinculação de fatores de transcrição e cofatores que regulam a estrutura local da cromatina8,10. Técnicas comumente utilizadas para identificar melhoradores putativos são a imunoprecipitação de cromatina em todo o genoma, seguida de sequenciamento (ChIP-seq) e o ensaio para cromatina acessível à transposase usando técnicas de sequenciamento (ATAC-seq). Assim, os intensificadores ativos são caracterizados por marcas específicas de histona ativa e pelo aumento da acessibilidade do DNA local11,12,13,14. Além disso, acredita-se que os melhoradores de desenvolvimento requerem interação física com seu promotor cognato8,9. De fato, foi demonstrado que as variantes e exclusões de aprimoramentos que interrompem os contatos do intensificador-promotor podem levar a malformações de desenvolvimento15. Portanto, há necessidade de novas técnicas que forneçam informações adicionais para a identificação de melhoradores funcionais que controlem a expressão genética do desenvolvimento.
Desde o desenvolvimento da técnica de captura de conformação de cromossomo (3C)16,o mapeamento dos contatos cromossômicos tem sido intensamente utilizado para avaliar a distância física entre elementos regulatórios. É importante ressaltar que foram desenvolvidas recentemente variantes de alto throughput de técnicas 3C, fornecendo diferentes estratégias de fixação, digestão, ligadura e recuperação de contatos entre fragmentos de cromatina17. Entre eles, in situ Hi-C tornou-se uma técnica popular que permite o sequenciamento de produtos de ligadura 3C genoma-wide18. No entanto, os altos custos de sequenciamento necessários para alcançar uma resolução adequada para a análise de contatos intensificadores-promotores torna essa técnica impraticável para o estudo de loci específicos. Assim, foram desenvolvidos métodos alternativos para analisar loci direcionados em resolução mais alta19,20,21,22. Um desses métodos, ou seja, 4C, conhecido como uma estratégia um contra todos, permite a detecção de todas as sequências que entram em contato com um site selecionado como ponto de vista. No entanto, uma desvantagem da técnica 4C padrão é a PCR inversa necessária, que amplifica fragmentos de tamanho diferente, favorecendo pequenos produtos e quantificação de viés após sequenciamento de alta taxa de throughput. Recentemente, umI-4C, uma nova variante da técnica 4C usando identificadores moleculares exclusivos (UMI) foi desenvolvida para perfis de contato cromossômico quantitativos e direcionados que contornam esse problema23. Esta abordagem utiliza cortadores freqüentes, sonagem e um protocolo de PCR mediado por ligadura aninhada, envolvendo assim a amplificação de fragmentos de DNA com distribuição de comprimento relativamente uniforme. Essa homogeneidade reduz vieses no processo de amplificação das preferências de PCR para sequências mais curtas e permite uma recuperação eficiente e contagem precisa de moléculas/fragmentos espacialmente conectados.
Aqui descrevemos um protocolo que adapta a técnica UMI-4C para identificar e quantificar contatos de cromatina entre promotores e intensificadores de fatores instrutivos de transcrição de linhagem durante a diferenciação do EB.
O método de cultura de queda suspensa não precisa de fatores de crescimento adicionais ou citocinas e gera reprodutivelmente populações homogêneas de EBs a partir de um número predeterminado de mESCs5. Aqui descrevemos um protocolo de 4C quantitativo adaptado da abordagem UMI-4C para quantificar o contato melhorador-promotor de fatores de transcrição específicos de linhagem no modelo de diferenciação eB. Identificamos regiões de cromatina que entram em contato com promotores de genes Pou5f1 e T de forma dinâmica durante a diferenciação do EB. O Pou5f1 foi desregulado durante a diferenciação do EB e a freqüência de contato entre o promotor Pou5f1 e seu potencializador distal diminuiu. Por outro lado, t foi regulado durante a diferenciação de EB e identificamos três melhoradores para os quais as frequências de contato com seu promotor são diminuídas (Figura 3). Para confirmar a identificação, um ensaio de imunoprecipitação de cromatina (ChIP) da marca de histona ativa H3K27ac pode ser realizado24, uma vez que esta marca histona tem se mostrado associada à ativação do intensificador e os intensificadores perdem essa marca durante sua inativação11.
Uma técnica 4C padrão tem sido amplamente utilizada para pesquisar o perfil de contato com cromatina de locais genômicos específicos25. No entanto, essa abordagem é difícil de interpretar quantitativamente mesmo após extensa normalização26,27,28 devido aos vieses introduzidos pela heterogeneidade do tamanho do fragmento de PCR e a impossibilidade de distinguir duplicatas pcr. Nosso método quantitativo 4C é em grande parte idêntico à técnica UMI-4C que permite a quantificação de moléculas únicas usando sonificação e um passo pcr mediado por ligadura aninhada para contornar a limitação da abordagem clássica 4C23. No entanto, ao contrário do UMI-4C que usa identificadores moleculares únicos, nosso protocolo quantitativo 4C permite a quantificação de moléculas únicas com base na quebra de DNA específica produzida pela etapa de sonificação. Torna nosso protocolo compatível com kits comerciais de preparação de bibliotecas de DNA, obviede a necessidade de primers com identificadores moleculares exclusivos.
Nosso protocolo envolve vários passos-chave que devem ser considerados. Como no método 4C clássico28, fatores críticos do nosso protocolo são a eficiência da digestão e a ligadura durante a preparação das moléculas 3C. A baixa eficiência de digestão/ligadura pode diminuir drasticamente a complexidade da interação com um fragmento de interesse, resultando em uma resolução reduzida. Como descrito anteriormente23, outra etapa crítica do protocolo é o design dos primers para a amplificação da biblioteca. Os segundo primers de reação pcr devem ser localizados 5-15 nt a partir do local de restrição interrogado. Em uma leitura de seqüenciamento de 75 nt, isso permite pelo menos 40 nt esquerda do comprimento de captura para mapeamento. O primer usado na primeira reação pcr deve ser projetado a montante do segundo primer sem sobreposição e ambos devem ser específicos o suficiente para garantir uma amplificação eficiente do DNA. Para multiplexação, os primers devem ser projetados independentemente, visando uma temperatura de fusão (Tm) de 60-65 °C. Além disso, quanto a outras técnicas 3C, a resolução do método quantitativo 4C é determinada pela enzima de restrição utilizada no protocolo25. Este protocolo usa uma enzima de restrição com um site de reconhecimento de 4 bps, MboI. A resolução máxima com esta enzima é de cerca de 500 bp, mas esta é altamente dependente de lócus e raramente alcançada. Outra limitação é que as interações que ocorrem entre elementos localizados no mesmo fragmento de restrição não são detectáveis. Além disso, as interações que ocorrem a uma distância de um local de restrição não podem ser distinguidas do fundo não digerido. O uso de uma etapa de preenchimento antes da ligadura pode permitir a detecção dessas interações.
Quantitative 4C é ideal para interrogar contatos de cromatina de loci alvo. No entanto, a etapa específica de amplificação do PCR limita o número de loci que podem ser investigados simultaneamente. Uma maneira de aumentar o número de loci direcionados é multiplexar as etapas do PCR para amplificar simultaneamente vários alvos, mas isso requer compatibilidade dos primers usados e testes de cada par de primer antes da implementação. Se forem desejadas mudanças globais na arquitetura de cromatina nos promotores, abordagens em todo o genoma como Hi-C, PC Hi-C ou HiChIP seriam mais apropriadas29,,30,,31.
The authors have nothing to disclose.
Gostaríamos de agradecer a F. Le Dily, R. Stadhouders e membros do laboratório Graf por seus conselhos e discussões. G.S. foi apoiado por uma bolsa marie sklodowska-curie (H2020-MSCA-IF-2016, miRStem), T.V.T por uma bolsa de pós-doutorado Juan de la Cierva (MINECO, FJCI-2014-22946). Este trabalho foi apoiado pelo Conselho Europeu de Pesquisa no âmbito do7º Programa-Quadro FP7 (ERC Synergy Grant 4D-Genome, convênio de subvenção 609989 à T.G.), pelo Ministério da Economia, Indústria e Competitividade da Espanha (MEIC) à parceria da EMBL, Centro de Excelencia Severo Ochoa 2013-2017 e Ao Programa CERCA Generalitat de Catalunya.
0.1% EmbryoMax gelatin | EMD Millipore | ES-006-B | Cell culture |
0.25% Trypsin-EDTA | 25200072 | ||
AMPure XP | Beckman Coulter | 10136224 | 4C/DNA purification |
B27 supplement | Gibco | 17504044 | Cell culture |
Beta-mercaptoethanol | Gibco | 31350010 | Cell culture |
Bioruptor Pico | Diagencode | B01060010 | 4C/sonication |
BSA | NEB | B9000S | 4C |
CHIR99021 | Selleck Chemicals | S1263 | Cell culture |
CIP | NEB | M0212 | 4C |
cOmplete Protease Inhibitor Cocktail | Roche | 4693116001 | 4C |
DMEM/F12 medium | Gibco | 11320033 | Cell culture |
dNTP | NEB | N0447S | 4C |
ESGRO Leukaemia Inhibitory Factor (LIF) | EMD Millipore | ESG1107 | Cell culture |
Formaldehyde solution (37%) | Sigma | 252549-25ML | 4C |
Glycin | Sigma | GE17-1323-01 | 4C |
Glycogen | ThermoFischer | R0551 | 4C |
Herculase II Fusion DNA polymerase | Agilent | 600675 | 4C |
IGEPAL CA-630 | Sigma | I3021-50ML | 4C |
Knockout DMEM | 10829018 | ||
L-glutamine | Gibco | 25030081 | Cell culture |
MboI | NEB | R0147M | 4C |
MEM non-essential amino acids | Gibco | 11140050 | Cell culture |
N2 supplement | Gibco | A1370701 | Cell culture |
NEBNext DNA Library prep | NEB | E6040 | 4C |
NEBuffer 2.1 | NEB | B7202S | 4C/digestion |
Neurobasal medium | Gibco | 21103049 | Cell culture |
PD0325901 | Selleck Chemicals | S1036 | Cell culture |
Penicillin Streptomycin | Gibco | 15140122 | Cell culture |
Proteinase K | NEB | P8107S | 4C |
Qubit 4 Fluorometer | ThermoFischer | Q33238 | 4C |
Qubit dsDNA HS Assay Kit | ThermoFischer | Q32851 | 4C |
RNase A | ThermoFischer | EN0531 | 4C |
Sodium pyruvate solution | Gibco | 11360070 | Cell culture |
StemPro Accutase Cell Dissociation Reagent | Gibco | A1110501 | Cell culture |
T4 DNA Ligase Reaction Buffer | NEB | B0202S | 4C |
T4 DNA Ligase Reaction Buffer | NEB | M0202M | 4C |