Aqui, apresentamos uma adaptação da técnica de captura da conformação cromossômica (3C) em detalhes com ênfase no envolvimento e aprendizagem da graduação.
A captura de conformação cromossômica (3C) é uma ferramenta poderosa que gerou uma família de técnicas semelhantes (por exemplo, Hi-C, 4C e 5C, referidas aqui como técnicas 3C) que fornecem informações detalhadas da organização tridimensional da cromatina. As técnicas 3C têm sido utilizadas em uma ampla gama de estudos, desde o monitoramento das mudanças na organização da cromatina em células cancerosas até a identificação de contatos intensificadores feitos com promotores gênicos. Embora muitos dos estudos usando essas técnicas estejam fazendo grandes perguntas sobre o genoma com tipos de amostra intrincados (ou seja, análise de célula única), o que muitas vezes se perde é que as técnicas 3C são fundamentadas em métodos básicos de biologia molecular que são aplicáveis a uma ampla gama de estudos. Ao abordar questões fortemente focadas na organização da cromatina, esta técnica de ponta pode ser usada para melhorar a experiência de laboratório de pesquisa e ensino de graduação. Este artigo apresenta um protocolo 3C e fornece adaptações e pontos de ênfase para implementação em instituições de ensino e pesquisa de graduação.
O genoma de um organismo não só contém todos os genes necessários para a função, mas também todas as instruções sobre como e quando usá-los. Isso faz com que regular o acesso ao genoma seja uma das funções mais importantes da célula. Existem muitos mecanismos para controlar a função gênica; no entanto, em seu nível básico, a regulação gênica se resume à capacidade dos fatores de transcrição regulatórios (trans-fatores) de se ligarem às suas sequências específicas de DNA (sequências cis-regulatórias). Esta não é uma habilidade inata; em vez disso, é governada pela organização/estrutura do genoma no núcleo, que controla a disponibilidade/exposição das sequências cis-regulatórias aos trans-fatores 1,2,3. Se os trans-fatores não podem encontrar suas sequências cis-regulatórias, então os trans-fatores não podem executar suas tarefas regulatórias. Isso tornou a compreensão de como os genomas estão organizados no núcleo uma importante fonte de investigação.
É amplamente aceito que, durante a interfase, os cromossomos eucarióticos no núcleo ocupam seu próprio domínio ancorados à lâmina nuclear e à matriz nuclear (Figura 1), tornando o cromossomo mais parecido com uma fatia de pizza do que com um macarrão em um prato de espaguete. Os cromossomos são parcialmente condensados por interações proteína-DNA (cromatina) que torcem e fazem loop de porções do cromossomo. Através de microscopia eletrônica, fluorescência tridimensional do DNA hibridização in situ (FISH) e técnicas de marcação de DNA (i.e., metilação fluorescente e artificial do DNA), domínios inativos da cromatina foram encontrados firmemente embalados ao longo da periferia nuclear 4,5,6, enquanto porções de cromatina ativa menos condensada são encontradas no interior do núcleo 7,8,9, 10º. Esses experimentos fornecem uma visão grande angular da dinâmica cromossômica, mas pouco fazem para capturar as mudanças que ocorrem localmente ao redor dos promotores gênicos observados nos estudos com DNase11,12 e nucleossomo13,14,15.
A chave para desbloquear a dinâmica da cromatina de alta resolução foi a formulação da técnica de mapeamento cromossômico 3D, 3C. A técnica 3C propriamente dita compreende quatro etapas principais: reticulação da cromatina, digestão da cromatina por enzimas de restrição, ligadura da cromatina e purificação do DNA (Figura 2). Os novos fragmentos artificiais de DNA gerados por esse processo podem então ser caracterizados para revelar a estreita associação física entre pedaços linearmente distantes de DNA16. A técnica 3C tornou-se a base para a criação de múltiplas técnicas derivadas que utilizam os passos iniciais do 3C para fazer perguntas mais amplas sobre o genoma (por exemplo, Hi-C, 4C, ChIP-C). Esta família de técnicas 3C identificou que os cromossomos são organizados em múltiplas unidades discretas denominadas domínios topologicamente associados (DATs). As DATs são codificadas no genoma e definidas por alças de cromatina flanqueadas por limites não loopados16,17,18,19. Os limites das DAT são mantidos por dois fatores evolutivamente conservados e ubíquos, incluindo o fator de ligação da TCCCT (CTCF) e a coesão, que impedem que laços dentro de DATs separadosinterajam 16,20. As alças são mediadas pela interação de transfatores com suas sequências regulatórias, assim como a TCCF e a coesão21.
Embora muitos estudos usando tecnologias 3C façam perguntas amplas sobre o genoma e empreguem técnicas complicadas de coleta de amostras, a formulação da técnica 3C é baseada em técnicas básicas de biologia molecular. Isso torna o 3C intrigante para implantação em laboratórios de iniciação científica e ensino. A técnica 3C pode ser empregada para questões focadas menores e é inerentemente flexível para escalar para cima ou para baixo (genes únicos22, cromossomos16 e/ou genomas18), dependendo do foco e direção das perguntas feitas. Essa técnica também tem sido aplicada a uma ampla gama de sistemas modelo7,16,19,23 e tem se mostrado versátil em seu uso. Isso torna o 3C uma excelente técnica para graduandos, na medida em que os alunos podem ganhar experiência em técnicas comuns de biologia molecular, ao mesmo tempo em que ganham experiência valiosa em responder a perguntas direcionadas.
Apresenta-se um protocolo adaptado para preparação de biblioteca 3C baseado em protocolos previamente publicados24,25,26,27. Este protocolo foi otimizado para aproximadamente 1 × 107 células, embora tenha gerado bibliotecas 3C com apenas 1 × 105 células. Este protocolo provou ser versátil e tem sido usado para gerar bibliotecas 3C a partir de embriões de peixe-zebra, linhagens celulares de peixe-zebra e filho-adulto (YA) Caenorhabditis elegans (lombriga). O protocolo também deve ser apropriado para linhagens celulares de mamíferos e, com maior adaptação, leveduras.
O objetivo dessas adaptações é tornar o 3C mais acessível para os graduandos. Tem-se tido o cuidado de utilizar técnicas semelhantes àquelas que podem ser realizadas em um laboratório de ensino de graduação. A técnica 3C oferece muitas oportunidades de aprendizado para os alunos de graduação aprenderem técnicas básicas de biologia molecular que beneficiarão seu desenvolvimento na bancada, na sala de aula e em seus esforços após a graduação.
O 3C é uma técnica poderosa que está enraizada em técnicas moleculares básicas. É essa base de ferramentas fundamentais que torna o 3C uma técnica tão intrigante para usar com alunos de graduação. Com tantos estudos recentes observando a dinâmica da cromatina em uma escala tão ampla, usar esses resultados para elaborar um experimento com foco restrito em um único gene ou região genômica tem o potencial de criar um experimento único e impactante na iniciação científica. Muitas vezes, experimentos como esses são considerados muito avançados para os graduandos, mas com um planejamento cuidadoso, eles são facilmente alcançáveis. É importante notar que os ensaios projetados para sondar as conexões de cromatina capturadas pela biblioteca 3C podem variar de PCR semiquantitativo final a sequenciamento do genoma inteiro. Na verdade, os dados do primeiro papel 3C16 foram gerados a partir de qPCR. Essa ampla gama de ensaios pode ser usada porque todas as tecnologias 3C produzem o mesmo produto – uma biblioteca de fragmentos de DNA representando conexões 3D no núcleo.
Apresenta-se aqui uma adaptação de um protocolo mais flexível e acomodado que melhor se adapta aos pesquisadores de graduação. Os períodos de pausa listados acima implicam atrasos durante a noite; No entanto, essas pausas podem se estender por finais de semana e, no caso das células e núcleos, por semanas. A consideração mais crucial é quando o trabalho será feito. Muitas vezes, em protocolos, há etapas sensíveis ao tempo quando a pausa não é uma opção. Fora alguns pontos (dia 1 e dia 2), há muitos lugares para parar e congelar a amostra. Estes são críticos quando se trabalha com estudantes de graduação, onde os horários e horários do trabalho de laboratório precisam ser flexíveis. Além de engendrar essas paradas no protocolo, os graduandos são incentivados a trabalhar em duplas ou mesmo pequenos grupos de três ou quatro. Os grupos funcionam bem para esse protocolo, pois os alunos podem apoiar uns aos outros e criar um sistema de amigos para que todos estejam trabalhando com segurança. O trabalho de laboratório também é mais divertido com os outros envolvidos. Com os grupos, os alunos também podem trabalhar uma variedade de questões focadas na organização da cromatina enquanto ainda realizam o mesmo protocolo. Assim, mesmo enquanto os alunos estão trabalhando em projetos separados, o protocolo vincula seus esforços e, por isso, eles podem apoiar uns aos outros.
Outras adaptações visam contornar o fato de que certas ferramentas e equipamentos especializados não são necessariamente encontrados em todas as instituições de graduação. Esses equipamentos incluem, mas não estão limitados a termocicladores qPCR, sistemas de documentação de gel e espectrômetros de nanovolume. Na verdade, esses equipamentos são convenientes, mas não são uma exigência. Aqui, o método clássico do 3C também é descrito na parte de design do primer; Isso envolve a identificação de um locus genômico de interesse e, a partir disso, a avaliação de outros loci genômicos para pontos de contato com a cromatina mais distantes. Essa técnica também funciona bem se um conjunto de dados publicado for usado, como um conjunto de dados usando Hi-C, onde loci positivos (conectando) e negativos (não conectando) conhecidos são identificados. Projetar experimentos usando esses conjuntos de dados publicados é outra ótima adaptação para laboratórios de ensino, pois a chance de sucesso na identificação de conexões de cromatina é geralmente maior. Além disso, o artigo de pesquisa pode ser discutido em sala de aula e ser utilizado como referência.
Este protocolo usa uma abordagem de qPCR modificada para visualizar a formação do produto 3C. Os controles são essenciais para o sucesso da técnica 3C. Cada experimento usa controles de amostra e controles de primer para determinar a conclusão do procedimento 3C. Os controles da amostra incluem um controle não digerido (DNA genômico) e um controle digerido. O controle não digerido determina o sinal basal para os conjuntos de primers e é usado com o controle de digestão reticulado para determinar a eficiência da digestão Espera-se que haja uma queda no produto para quaisquer primers direcionados através de um local de restrição. A comparação desse valor com o controle não digerido fornece uma indicação de quão bem a amostra foi digerida.
Os primers para a PCR incluem um primer de controle e primers de teste. O primer controle é um conjunto de primers que está próximo à região genômica que está sendo ensaiada e não contém um local de restrição. Isso fornece a linha de base para determinar a abundância dos produtos de PCR do primer de teste. Os primers de teste são primers para frente e para trás que ladeiam um local de restrição para um determinado locus genômico de interesse (Figura 3). As reações usando esses conjuntos de primers são comparadas para determinar a eficiência da digestão, pois a abundância do produto deve cair se o local de restrição tiver sido cortado. Na determinação da organização da cromatina, um primer de teste de um locus é emparelhado com outro primer de teste de um locus genômico diferente para determinar se esses dois loci estão próximos no espaço 3D. Nesse caso, a expectativa é que um produto de PCR só seja encontrado usando a amostra 3C como modelo.
É importante notar que mesmo os primers validados têm a tendência de falhar (Figura 4: conjunto de primers r14). Além disso, os produtos de PCR são frequentemente identificados em reações de controle e em reações nas quais uma conexão de cromatina não é prevista (como o controle digerido, uma vez que não é ligado). Essas instâncias são sequenciadas e falham no QC do Sanger ou retornam sem uma sequência definida (Figura 5). Além disso, os experimentos tradicionais em 3C geram um “modelo de controle”, uma amostra de DNA não cruzada, digerida e ligada, que representa todos os possíveis fragmentos ligados que podem ser produzidos com uma determinada quantidade de DNA. O “modelo de controle” desempenha um papel importante na comparação das intensidades dos sinais de qPCR entre dois loci genômicos para determinar se o sinal representa uma interação verdadeira ou apenas uma associação aleatória. Criar um “modelo de controle” pode ser problemático, pois uma grande parte da cromatina que está sendo ensaiada deve ser capturada na forma de um cromossomo artificial e processada junto com as amostras 3C. Garantir tal construção pode não ser viável, e criar uma pode estar fora do escopo de um projeto semestral. Devido a essas dificuldades, sugere-se o uso de um primer controle. O primer de controle não substitui toda a funcionalidade do “modelo de controle”, mas ainda fornece a oportunidade de analisar os dados para fazer determinações de “presença” ou “ausência”.
Ao realizar qPCR, o uso de quantidades iguais da amostra é importante. Isso deve ser determinado, mesmo usando um nanoespectrofotômetro como uma nanogota, gerando uma curva padrão a partir do DNA genômico de uma concentração conhecida e ajustando as amostras de 3C a essa linha. Essas quantidades devem ser registradas e usadas em PCRs subsequentes. A qualidade da reação de PCR também é importante. Como a PCR é executada em qPCR, a abundância do produto é medida usando fluorescência e registrada. Esta gravação é acessível no gráfico de amplificação. Uma vez terminado o programa, é importante verificar o gráfico de amplificação e garantir que as reações (exceto os controles sem modelo) tenham três fases: uma linha de base, uma exponencial e uma fase de platô/saturação. É importante verificar se as reações têm uma fase exponencial, em particular para a definição do limiar (ver abaixo). Além disso, para amostras diluídas em série, deve haver uma mudança nos valores de Ct consistente com a diluição da amostra (a concentração mais alta terá os menores valores de Ct, enquanto a menor concentração terá os maiores valores de Ct). Amostras que não refletem essa mudança no gráfico de amplificação requerem uma nova diluição ou indicam um problema maior com a formação da amostra 3C. Finalmente, ao gerar a curva padrão, o software PCR calculará a eficiência da PCR e o valor de R2 . A eficiência da PCR deve ser maior que 90%, e o valor de R2 deve ser maior que 0,99. Se qualquer uma dessas condições não for atendida, é provável que algo esteja errado com a amostra ou os primers do PCR.
Após a qPCR, a porcentagem de digestão e a presença de interações 3C podem ser calculadas usando o qPCR Ct para cada reação. Para determiná-los, primeiro, o limiar para a reação de PCR deve ser definido. Isso normalmente é feito usando o software que vem com a máquina qPCR. A definição do limiar definirá a concentração do produto de PCR que será usado para comparar os valores de Ct da amostra. O limiar deve bissetriz as curvas de amplificação das reações de PCR na fase exponencial de amplificação. Somente as reações de PCR com amplificação exponencial podem ser comparadas (neste caso, os primers de controle e as reações de primer teste), pois esta é a única maneira de garantir que as reações estejam amplificando o DNA na mesma taxa e possam ser comparadas fielmente. Ao analisar os gráficos 3C, as reações condicionalmente positivas são identificadas como aquelas com mais produto do que as amostras controle, o controle genômico e o controle da digestão (Figura 4B). No entanto, essas amostras devem ser validadas usando o sequenciamento de Sanger após a purificação em gel do produto de PCR.
Após o sequenciamento de Sanger, as amostras que passam pelo CQ podem ser analisadas usando Blat. O objetivo desta análise é determinar se a amostra possui a sequência de ambos os loci genômicos alvo flanqueando o sítio de restrição (DpnII no caso deste protocolo). Se ambas as sequências forem identificadas, o fragmento 3C pode ser considerado validado. Se os resultados do Blat não retornarem a sequência esperada, isso pode indicar que um ou ambos os primers não são ideais, resultando em um resultado falso positivo de qPCR. Os arquivos de rastreamento para as amostras falso-positivas terão picos de base indefinidos, e os relatórios Seq conterão principalmente “n” chamadas de base.
A validação de Sanger é essencial, pois falsos positivos da formação de produtos de PCR artefactuais são possíveis. Esses falsos positivos podem ser identificados quando os produtos de sequenciamento não têm a sequência alvo esperada ou um sítio DpnII característico de um fragmento 3C adequado (Figura 5). O sequenciamento dos fragmentos de PCR também fornece outro ponto de dados para o experimento e mostra aos alunos que a técnica 3C está identificando loci genômicos distantes que estão se juntando no espaço 3D dentro dos núcleos.
A técnica 3C fornece uma riqueza de técnicas moleculares fundamentais para estudantes de graduação em um procedimento flexível e direto. Esta técnica 3C também é um ponto de partida para as outras técnicas 3C que incorporam sequenciamento de próxima geração (NGS). Esses tipos de experimentos podem expor os graduandos a aspectos importantes da bioinformática e estão enraizados nos princípios básicos aqui descritos. A experiência e o envolvimento na graduação são fundamentais para seu sucesso e desenvolvimento como jovens cientistas. Ao oferecer essas oportunidades, os graduandos podem fortalecer sua compreensão dos princípios básicos e, ao mesmo tempo, construir sua confiança para lidar com técnicas e questões de ponta.
The authors have nothing to disclose.
Este trabalho foi apoiado em parte pela Rhode Island Institutional Development Award (IDeA) Network of Biomedical Research Excellence do National Institute of General Medical Sciences dos National Institutes of Health sob o número de concessão P20GM103430 e pelo Bryant Center of Health and Behavioral Sciences.
37% Formaldehyde | Millapore-Sigma | F8775 | |
100% Ethanol | Millapore-Sigma | E7023 | |
CaCl2 | MP Biomedical | 215350280 | |
chloroform | Millapore-Sigma | C0549 | |
cOmplete, EDTA-free Protease Inhibitor Cocktail | Millapore-Sigma | COEDTAF-RO | mixed to 50x in water. Diluted to 1x in Sucrose buffer and GB buffer fresh |
Dithiothreitol (DTT) | Millapore-Sigma | D0632 | 1 M stock diluted to 500 µM in Sucrose buffer and GB buffer fresh |
DpnII | NEB | R0543M | |
Glycerol | Millapore-Sigma | G9012 | |
glycine | Millapore-Sigma | G8898 | |
glycogen | Millapore-Sigma | 10901393001 | |
HEPES | Millapore-Sigma | H3375 | |
KCl | Millapore-Sigma | P3911 | |
KH2PO4 | Millapore-Sigma | P5655 | |
methyl green pyronin | Millapore-Sigma | HT70116 | |
MgAc2 | Thermoscientific | 1222530 | |
Na2HPO4 | Millapore-Sigma | S5136 | |
NaCl | Millapore-Sigma | S9888 | |
phenol-chloroform | Millapore-Sigma | P3803 | |
Pronase | Millapore-Sigma | 11459643001 | |
Proteinase K | IBI Scientific | IB05406 | |
qPCR Ready mix (Phire Taq etc) | Millapore-Sigma | KCQS07 | |
RNase A | Millapore-Sigma | R6148 | |
Sodium Acetate | Millapore-Sigma | S2889 | |
sodium dodecyl sulfate (SDS) | Millapore-Sigma | L3771 | |
Sucrose | Millapore-Sigma | S0389 | |
T4 DNA Ligase | Promega | M1804 | |
Tris-HCl | Millapore-Sigma | 108319 | |
Triton X-100 | Millapore-Sigma | T9284 | |
Trypsin-EDTA | Millapore-Sigma | T4049 |