La expresión génica está regulada por interacciones de promotores génicos con elementos reguladores distales. Aquí, describimos cómo la baja entrada de Capture Hi-C (liCHi-C) permite la identificación de estas interacciones en tipos de células raras, que antes no se podían medir.
La transcripción de genes espaciotemporales está estrechamente regulada por elementos reguladores distales, como potenciadores y silenciadores, que dependen de la proximidad física con sus promotores de genes objetivo para controlar la transcripción. Aunque estos elementos reguladores son fáciles de identificar, sus genes diana son difíciles de predecir, ya que la mayoría de ellos son específicos de tipo celular y pueden estar separados por cientos de kilobases en la secuencia lineal del genoma, saltándose otros genes no diana. Durante varios años, Promoter Capture Hi-C (PCHi-C) ha sido el estándar de oro para la asociación de elementos reguladores distales a sus genes diana. Sin embargo, PCHi-C se basa en la disponibilidad de millones de células, lo que prohíbe el estudio de poblaciones de células raras, como las que se obtienen comúnmente de los tejidos primarios. Para superar esta limitación, se ha desarrollado Low input Capture Hi-C (liCHi-C), un método rentable y personalizable para identificar el repertorio de elementos reguladores distales que controlan cada gen del genoma. liCHi-C se basa en un marco experimental y computacional similar al PCHi-C, pero al emplear cambios mínimos en los tubos, modificar la concentración y los volúmenes del reactivo e intercambiar o eliminar pasos, representa una pérdida mínima de material durante la construcción de la biblioteca. En conjunto, liCHi-C permite el estudio de la regulación génica y la organización del genoma espaciotemporal en el contexto de la biología del desarrollo y la función celular.
La expresión génica temporal impulsa la diferenciación celular y, en última instancia, el desarrollo del organismo, y su alteración está estrechamente relacionada con una amplia plétora de enfermedades 1,2,3,4,5. La transcripción génica está finamente regulada por la acción de elementos reguladores, que pueden clasificarse como proximales (es decir, promotores génicos) y distales (por ejemplo, potenciadores o silenciadores), estos últimos frecuentemente ubicados lejos de sus genes diana e interactúan físicamente con ellos a través del bucle de cromatina para modular la expresión génica 6,7,8.
La identificación de regiones reguladoras distales en el genoma es un asunto ampliamente consensuado, ya que estas regiones albergan modificaciones específicas de histonas 9,10,11 y contienen motivos específicos de reconocimiento de factores de transcripción, actuando como plataformas de reclutamiento para ellos12,13,14. Además, en el caso de los potenciadores y superpotenciadores 15,16, también tienen baja ocupación nucleosómica 17,18 y se transcriben en eRNAs no codificantes 19,20.
No obstante, los genes diana de cada elemento regulador distal son más difíciles de predecir. La mayoría de las veces, las interacciones entre los elementos reguladores distales y sus objetivos son de tipo celular y específicas del estímulo 21,22, abarcan cientos de kilobases, puenteando sobre otros genes en cualquier dirección 23,24,25, e incluso pueden ubicarse dentro de regiones intrónicas de su gen objetivo u otros genes no intervinientes 26,27. Además, los elementos reguladores distales también pueden controlar más de un gen al mismo tiempo, y viceversa28,29. Esta complejidad posicional dificulta la identificación de asociaciones regulatorias entre ellos y, por lo tanto, la mayoría de los objetivos de cada elemento regulador en cada tipo de célula siguen siendo desconocidos.
Durante los últimos años, ha habido un auge significativo en el desarrollo de técnicas de captura de conformación cromosómica (3C) para estudiar las interacciones de la cromatina. El más utilizado de ellos, Hi-C, permite generar un mapa de todas las interacciones entre cada fragmento del genoma de una célula30. Sin embargo, para detectar interacciones significativas a nivel de fragmento de restricción, Hi-C se basa en la secuenciación ultraprofunda, lo que prohíbe su uso para estudiar rutinariamente el panorama regulatorio de genes individuales. Para superar esta limitación económica, han surgido varias técnicas 3C basadas en el enriquecimiento, como ChIA-PET31, HiChIP 32 y su contraparte HiCuT33 de baja entrada. Estas técnicas dependen del uso de anticuerpos para enriquecer las interacciones de todo el genoma mediadas por una proteína específica. No obstante, la característica única de estas técnicas 3C es también la pesadilla de su aplicación; Los usuarios cuentan con la disponibilidad de anticuerpos de alta calidad para la proteína de interés y no pueden comparar condiciones en las que la unión de la proteína es dinámica.
Promoter Capture Hi-C (PCHi-C) es otra técnica 3C basada en el enriquecimiento que elude estas limitaciones34,35. Mediante el empleo de un sistema de enriquecimiento de sonda de ARN biotinilado, PCHi-C es capaz de generar bibliotecas de alta resolución de todo el genoma de regiones genómicas que interactúan con 28.650 promotores de genes anotados en humanos o 27.595 en ratones, también conocidos como interactoma promotor. Este enfoque permite detectar interacciones significativas de largo alcance a nivel de resolución de fragmentos de restricción de promotores activos e inactivos, y comparar robustamente los interactomas promotores entre cualquier condición independientemente de la dinámica de las modificaciones de histonas o la unión a proteínas. El PCHi-C ha sido ampliamente utilizado en los últimos años para identificar reorganizaciones del interactoma promotor durante la diferenciación celular 36,37, identificar el mecanismo de acción de los factores de transcripción38,39 y descubrir nuevos genes potenciales y vías desreguladas en la enfermedad por variantes no codificantes 40,41,42,43,44,45,46,47,48, junto con nuevas mutaciones no codificantes49,50. Además, con solo modificar el sistema de captura, esta técnica puede personalizarse de acuerdo con la pregunta biológica para interrogar cualquier interactoma (por ejemplo, el interactoma potenciador 51 o el interactoma de una colección de alteraciones no codificantes41,52).
Sin embargo, PCHi-C se basa en un mínimo de 20 millones de células para realizar la técnica, lo que impide el estudio de poblaciones celulares escasas como las que se utilizan a menudo en biología del desarrollo y aplicaciones clínicas. Por esta razón, hemos desarrollado Low input Capture Hi-C (liCHi-C), un nuevo método rentable y personalizable basado en el marco experimental de PCHi-C para generar interactomas promotores de alta resolución con entrada de baja celda. Al realizar el experimento con cambios mínimos de tubo, intercambiar o eliminar pasos del protocolo PCHi-C original, reducir drásticamente los volúmenes de reacción y modificar las concentraciones de reactivos, se maximiza la complejidad de la biblioteca y es posible generar bibliotecas de alta calidad con tan solo 50,000 celdas53.
La captura Hi-C de baja entrada (liCHi-C) ha sido comparada con PCHi-C y utilizada para dilucidar el recableado del interactoma promotor durante la diferenciación de células hematopoyéticas humanas, descubrir nuevos genes y vías potenciales asociadas a enfermedades desreguladas por alteraciones no codificantes y detectar anomalías cromosómicas53. El protocolo paso a paso y los diferentes controles de calidad a través de la técnica se detallan aquí hasta la generación final de las librerías y su análisis computacional.
liCHi-C ofrece la capacidad de generar bibliotecas de interactoma promotor de alta resolución utilizando un marco experimental similar al de PCHi-C, pero con un número de células muy reducido. Esto se logra en gran medida mediante la eliminación de pasos innecesarios, como la purificación de fenol y la eliminación de biotina. En el protocolo clásico Hi-C de ligadura en núcleo57 y su posterior técnica derivada PCHi-C, la biotina se elimina de fragmentos de restricción no ligados para evit…
The authors have nothing to disclose.
Agradecemos al resto de miembros del laboratorio Javierre sus comentarios sobre el manuscrito. Agradecemos al Programa CERCA, a la Generalitat de Catalunya y a la Fundación Josep Carreras por el apoyo institucional. Este trabajo ha sido financiado por FEDER/Ministerio de Ciencia e Innovación (RTI2018-094788-A-I00), la Asociación Europea de Hematología (4823998) y la Asociación Española contra el Cáncer (AECC) LABAE21981JAVI. BMJ está financiado por el proyecto Junior Leader de la Fundación Bancaria La Caixa (LCF/BQ/PI19/11690001), LR está financiado por una beca AGAUR FI (2019FI-B00017) y LT-D está financiado por una beca FPI (PRE2019-088005). Agradecemos el apoyo del programa de doctorado en bioquímica y biología molecular de la Universitat Autònoma de Barcelona. Ninguno de los financiadores participó en ningún momento en el diseño experimental o la redacción del manuscrito.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |