A expressão gênica é regulada por interações de promotores gênicos com elementos regulatórios distais. Aqui, descrevemos como a baixa entrada de Capture Hi-C (liCHi-C) permite a identificação dessas interações em tipos celulares raros, que antes eram imensuráveis.
A transcrição espacial temporal de genes é fortemente regulada por elementos regulatórios distais, como intensificadores e silenciadores, que dependem da proximidade física com seus promotores gênicos alvo para controlar a transcrição. Embora esses elementos regulatórios sejam fáceis de identificar, seus genes-alvo são difíceis de prever, uma vez que a maioria deles é específica do tipo celular e pode ser separada por centenas de quilobases na sequência linear do genoma, pulando sobre outros genes não-alvo. Por vários anos, o Promoter Capture Hi-C (PCHi-C) tem sido o padrão-ouro para a associação de elementos regulatórios distais aos seus genes-alvo. No entanto, a PCHi-C depende da disponibilidade de milhões de células, proibindo o estudo de populações celulares raras, como as comumente obtidas de tecidos primários. Para superar essa limitação, foi desenvolvido o Low input Capture Hi-C (liCHi-C), um método econômico e personalizável para identificar o repertório de elementos regulatórios distais que controlam cada gene do genoma. O liCHi-C baseia-se em uma estrutura experimental e computacional semelhante à PCHi-C, mas empregando mudanças mínimas de tubo, modificando a concentração e os volumes do reagente e trocando ou eliminando etapas, ele é responsável por uma perda mínima de material durante a construção da biblioteca. Coletivamente, o liCHi-C possibilita o estudo da regulação gênica e da organização espaço-temporal do genoma no contexto da biologia do desenvolvimento e da função celular.
A expressão gênica temporal impulsiona a diferenciação celular e, em última instância, o desenvolvimento do organismo, e sua alteração está intimamente relacionada a uma ampla gama de doenças1,2,3,4,5. A transcrição gênica é finamente regulada pela ação de elementos regulatórios, que podem ser classificados em proximais (i.e., promotores gênicos) e distais (e.g., intensificadores ou silenciadores), estes últimos frequentemente localizados distantes de seus genes-alvo e interagindo fisicamente com eles através de looping de cromatina para modular a expressão gênica 6,7,8.
A identificação de regiões reguladoras distais no genoma é uma questão amplamente consensual, uma vez que essas regiões abrigam modificações específicas de histonas 9,10,11 e contêm motivos específicos de reconhecimento de fatores de transcrição, atuando como plataformas de recrutamento para elas12,13,14. Além disso, no caso dos intensificadores e superpotencializadores 15,16, eles também apresentam baixa ocupação nucleossômica 17,18 e são transcritos em eRNAs não codificantes 19,20.
No entanto, os genes-alvo de cada elemento regulatório distal são mais difíceis de prever. Na maioria das vezes, as interações entre os elementos regulatórios distais e seus alvos são do tipo celular e estímulo específico 21,22, abrangem centenas de quilobases, fazendo ponte com outros genes em qualquer direção 23,24,25, podendo inclusive estar localizadas dentro de regiões intrônicas de seu gene alvo ou de outros genes não intervenientes 26,27. Além disso, elementos reguladores distais também podem controlar mais de um gene ao mesmo tempo, evice-versa28,29. Essa complexidade posicional dificulta a identificação de associações regulatórias entre eles e, portanto, a maioria dos alvos de cada elemento regulatório em cada tipo celular permanece desconhecida.
Durante os últimos anos, houve um boom significativo no desenvolvimento de técnicas de captura de conformação cromossômica (3C) para estudar interações com cromatina. O mais utilizado deles, o Hi-C, permite gerar um mapa de todas as interações entre cada fragmento do genoma de uma célula30. No entanto, para detectar interações significativas no nível de fragmento de restrição, o Hi-C depende de sequenciamento ultraprofundo, proibindo seu uso para estudar rotineiramente o cenário regulatório de genes individuais. Para superar essa limitação econômica, várias técnicas 3C baseadas em enriquecimento surgiram, como ChIA-PET31, HiChIP 32 e sua contraparte de baixa entrada HiCuT33. Essas técnicas dependem do uso de anticorpos para enriquecer interações genômicas mediadas por uma proteína específica. No entanto, a característica única dessas técnicas 3C é também a banalidade de sua aplicação; Os usuários contam com a disponibilidade de anticorpos de alta qualidade para a proteína de interesse e não podem comparar condições em que a ligação da proteína é dinâmica.
O Promoter Capture Hi-C (PCHi-C) é outra técnica 3C baseada em enriquecimento que contorna essas limitações34,35. Ao empregar um sistema de enriquecimento de sonda de RNA biotinilado, o PCHi-C é capaz de gerar bibliotecas genômicas de alta resolução de regiões genômicas interagindo com 28.650 promotores de genes humanos ou 27.595 anotados em camundongos, também conhecidos como interactome promotor. Esta abordagem permite detectar interações significativas de longo alcance na resolução do nível de fragmento de restrição de promotores ativos e inativos, e comparar robustamente os interátomos promotores entre qualquer condição, independentemente da dinâmica de modificações de histonas ou ligação de proteínas. A PCHi-C tem sido amplamente utilizada nos últimos anos para identificar reorganizações interatomas promotoras durante a diferenciação celular 36,37, identificar o mecanismo de ação dos fatores de transcrição38,39 e descobrir novos potenciais genes e vias desreguladas na doença por variantes não codificantes 40,41,42,43,44,45,46,47,48, ao lado de novas mutações não codificadoras 49,50. Além disso, apenas modificando o sistema de captura, essa técnica pode ser personalizada de acordo com a questão biológica para interrogar qualquer interatoma (por exemplo, o interatoma intensificador 51 ou o interatoma de uma coleção de alterações não codificantes41,52).
No entanto, a PCHi-C depende de um mínimo de 20 milhões de células para realizar a técnica, o que impede o estudo de populações celulares escassas como as frequentemente usadas em biologia do desenvolvimento e aplicações clínicas. Por esta razão, desenvolvemos o Low input Capture Hi-C (liCHi-C), um novo método econômico e personalizável baseado na estrutura experimental do PCHi-C para gerar interatomas promotores de alta resolução com entrada de baixa célula. Realizando o experimento com trocas mínimas de tubo, trocando ou eliminando etapas do protocolo PCHi-C original, reduzindo drasticamente os volumes de reação e modificando as concentrações de reagentes, a complexidade da biblioteca é maximizada e é possível gerar bibliotecas de alta qualidade com apenas 50.000 células53.
O Low input Capture Hi-C (liCHi-C) tem sido comparado com PCHi-C e usado para elucidar a religação do interatoma promotor durante a diferenciação de células hematopoéticas humanas, descobrir potenciais novos genes e vias associadas à doença desreguladas por alterações não-codificantes e detectar anormalidades cromossômicas53. O passo-a-passo do protocolo e os diferentes controles de qualidade através da técnica são detalhados aqui até a geração final das bibliotecas e sua análise computacional.
O liCHi-C oferece a capacidade de gerar bibliotecas de interatoma promotor de alta resolução usando uma estrutura experimental semelhante à da PCHi-C, mas com um número de células muito reduzido. Isso é muito conseguido eliminando etapas desnecessárias, como purificação de fenol e remoção de biotina. No protocolo clássico de ligadura intranúcleo Hi-C57 e sua subsequente técnica derivada PCHi-C, a biotina é removida de fragmentos de restrição não ligados para evitar puxar para bai…
The authors have nothing to disclose.
Agradecemos ao resto dos membros do laboratório Javierre por seu feedback sobre o manuscrito. Agradecemos ao Programa CERCA, à Generalitat de Catalunya e à Fundação Josep Carreras pelo apoio institucional. Este trabalho foi financiado pelo FEDER/Ministério da Ciência e Inovação da Espanha (RTI2018-094788-A-I00), pela Associação Europeia de Hematologia (4823998) e pela Associação Espanhola contra o Câncer (AECC) LABAE21981JAVI. O BMJ é financiado pelo projeto Líder Júnior da Fundação Bancária La Caixa (LCF/BQ/PI19/11690001), o LR é financiado por uma bolsa AGAUR FI (2019FI-B00017) e o LT-D é financiado por uma bolsa FPI (PRE2019-088005). Agradecemos ao programa de doutorado em bioquímica e biologia molecular da Universitat Autònoma de Barcelona pelo apoio. Nenhum dos financiadores esteve envolvido em nenhum momento do desenho experimental ou da redação do manuscrito.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |