Hi-C 3.0 es un protocolo Hi-C mejorado que combina reticulantes de formaldehído y glutarato de disuccinimidil con un cóctel de enzimas de restricción DpnII y DdeI para aumentar la relación señal-ruido y la resolución de la detección de interacción de cromatina.
La captura de conformación cromosómica (3C) se utiliza para detectar interacciones tridimensionales de la cromatina. Por lo general, la reticulación química con formaldehído (FA) se utiliza para fijar las interacciones de la cromatina. Luego, la digestión de la cromatina con una enzima de restricción y la posterior religación de los extremos del fragmento convierte la proximidad tridimensional (3D) en productos de ligadura únicos. Finalmente, después de la reversión de los enlaces cruzados, la eliminación de proteínas y el aislamiento del ADN, el ADN se corta y se prepara para la secuenciación de alto rendimiento. La frecuencia de ligadura de proximidad de pares de loci es una medida de la frecuencia de su colocalización en el espacio tridimensional en una población celular.
Una biblioteca Hi-C secuenciada proporciona información de todo el genoma sobre las frecuencias de interacción entre todos los pares de loci. La resolución y precisión de Hi-C se basa en una reticulación eficiente que mantiene los contactos de la cromatina y la fragmentación frecuente y uniforme de la cromatina. Este documento describe un protocolo Hi-C in situ mejorado, Hi-C 3.0, que aumenta la eficiencia de la reticulación mediante la combinación de dos reticulantes (formaldehído [FA] y glutarato de disuccinimidil [DSG]), seguido de una digestión más fina utilizando dos enzimas de restricción (DpnII y DdeI). Hi-C 3.0 es un protocolo único para la cuantificación precisa de las características de plegamiento del genoma a escalas más pequeñas, como bucles y dominios de asociación topológica (TAD), así como características a escalas más grandes de todo el núcleo, como los compartimentos.
La captura de conformación cromosómica se ha utilizado desde 20021. Fundamentalmente, cada variante de captura de conformación se basa en la fijación de las interacciones ADN-proteína y proteína-proteína para preservar la organización de la cromatina 3D. Esto es seguido por la fragmentación del ADN, generalmente por la digestión de restricción y, finalmente, la religación de los extremos de ADN cercanos para convertir loci espacialmente proximales en secuencias de ADN covalentes únicas. Los protocolos 3C iniciales utilizaron PCR para muestrear interacciones específicas “uno a uno”. Los ensayos 4C posteriores permitieron la detección de interacciones “uno a todos”2, mientras que 5C detectó interacciones “muchos a muchos”3. La captura de la conformación cromosómica llegó a buen término después de implementar la secuenciación de alto rendimiento (NGS) de próxima generación, que permitió la detección de interacciones genómicas “todo a todos” utilizando Hi-C4 de todo el genoma y técnicas comparables como 3C-seq5, TCC6 y Micro-C 7,8 (ver también revisión de Denker y De Laat9).
En Hi-C, los nucleótidos biotinilados se utilizan para marcar voladizos 5′ después de la digestión y antes de la ligadura (Figura 1). Esto permite la selección de fragmentos adecuadamente digeridos y religados utilizando perlas recubiertas de estreptavidina, diferenciándolo de GCC10. Una importante actualización del protocolo Hi-C fue implementada por Rao et al.11, quienes realizaron la digestión y religación en núcleos intactos (es decir, in situ) para reducir los productos de ligadura espuria. Además, la sustitución de la digestión HindIII con la digestión MboI (o DpnII) redujo el tamaño del fragmento y aumentó el potencial de resolución de Hi-C. Este aumento permitió la detección de estructuras de escala relativamente pequeña y una localización genómica más precisa de puntos de contacto, como bucles de ADN entre pequeños elementos cis, por ejemplo, bucles entre sitios unidos a CTCF generados por extrusión de bucle11,12. Sin embargo, este potencial tiene un costo. En primer lugar, un aumento de dos veces en la resolución requiere un aumento de cuatro veces (22) en las lecturas de secuenciación13. En segundo lugar, los pequeños tamaños de los fragmentos aumentan la posibilidad de confundir fragmentos vecinos no digeridos con fragmentos digeridos y religados14. Como se mencionó, en Hi-C, los fragmentos digeridos y religados difieren de los fragmentos no digeridos por la presencia de biotina en la unión de ligadura. Sin embargo, se requiere una eliminación adecuada de biotina de los extremos no ligados para asegurar que solo las uniones de ligadura se retiren14,15.
Con el costo decreciente de NGS, se hace factible estudiar el plegamiento cromosómico con mayor detalle. Para disminuir el tamaño de los fragmentos de ADN y, por lo tanto, aumentar la resolución, el protocolo Hi-C se puede adaptar para usar enzimas de restricción de corte con mayor frecuencia16 o para usar combinaciones de enzimas de restricción17,18,19. Alternativamente, la MNasa 7,8 en Micro-C y la DNasa en DNasa Hi-C20 pueden ajustarse para lograr una digestión óptima.
Una evaluación sistemática reciente de los fundamentos de los métodos 3C mostró que la detección de características de plegamiento cromosómico en cada escala de longitud mejoró enormemente con la reticulación secuencial con 1% FA seguida de 3 mM DSG17. Además, Hi-C con digestión HindIII fue la mejor opción para detectar características de plegado a gran escala, como compartimentos, y que Micro-C fue superior en la detección de características de plegamiento a pequeña escala, como bucles de ADN. Estos resultados condujeron al desarrollo de una única estrategia de alta resolución “Hi-C 3.0”, que utiliza la combinación de reticulantes FA y DSG seguidos de doble digestión con endonucleasas DpnII y DdeI21. Hi-C 3.0 proporciona una estrategia eficaz para uso general porque detecta con precisión las características de plegado en todas las escalas de longitud17. La parte experimental del protocolo Hi-C 3.0 se detalla aquí y se muestran los resultados típicos que se pueden esperar después de la secuenciación.
Figura 1: Procedimiento Hi-C en seis pasos. Las celdas se fijan primero con FA y luego con DSG (1). Luego, la lisis precede a una doble digestión con DdeI y DpnII (2). La biotina se agrega por relleno saliente y los extremos romos proximales se ligan (3) antes de la purificación del ADN (4). La biotina se elimina de los extremos no ligados antes de la sonicación y la selección del tamaño (5). Finalmente, la extracción de biotina permite la ligadura del adaptador y la amplificación de la biblioteca por PCR (6). Abreviaturas: FA = formaldehído; DSG = glutarato de disuccinimidilo; B = Biotina. Haga clic aquí para ver una versión más grande de esta figura.
Pasos críticos para el manejo celular
Aunque es posible utilizar un número menor de celdas de entrada, este protocolo se ha optimizado para ~ 5 × 106 celdas por carril de secuenciación (~ 400 M lecturas) para garantizar la complejidad adecuada después de la secuenciación profunda. Las células se cuentan mejor antes de la fijación. Para la generación de bibliotecas ultraprofundas, generalmente multiplicamos el número de carriles (y celdas) hasta que se alcanza la profundidad de lectura deseada. Para una fijación óptima, el medio que contiene suero debe ser reemplazado por PBS antes de la fijación de AF, y las soluciones fijadoras deben agregarse inmediatamente y sin gradientes de concentración15,22. Para la recolección celular, se prefiere el raspado a la tripsinización, porque la transición de una forma más plana a una forma esférica después de la tripsinización podría afectar la conformación nuclear. Después de la adición de DSG, los gránulos de células sueltas y grumosas se pierden fácilmente. Tenga cuidado al manipular células en esta etapa y agregue hasta 0.05% de BSA para disminuir la aglutinación.
Modificaciones al método
Este protocolo fue desarrollado utilizando células humanas17. Sin embargo, según la experiencia con la captura de la conformación cromosómica, este protocolo debería funcionar para la mayoría de las células eucariotas. Para una entrada significativamente menor (~ 1 × 106 celdas), recomendamos usar la mitad de los volúmenes para los procedimientos de captura de lisis y conformación [pasos 2.1-2.4]. Esto también permitiría realizar el aislamiento de ADN [paso 2.5] en una centrífuga de mesa con tubos de 1,7 ml, lo que podría mejorar la granulación para bajas concentraciones de ADN. La cuantificación del ADN (paso 2.6.6) indicará cómo proceder. Para cantidades bajas de ADN aislado (1-5 μg), sugerimos omitir la selección de tamaño (paso 3.3) y proceder con la eliminación de biotina después de reducir el volumen de 130 μL a ~ 45 μL con una UFC.
Este protocolo fue desarrollado específicamente para garantizar datos de alta calidad después de la posterior reticulación con FA y DSG y la digestión con DpnII y DdeI. Sin embargo, las estrategias alternativas de reticulación como FA seguida de EGS (etilenglicol bis (succinato de succinidil)), que también se utiliza en ChIP-seq23 y ChIA-PET24, podrían funcionar igualmente bien17. Del mismo modo, se pueden usar diferentes combinaciones de enzimas, como DpnII y HinfI18 o MboI, MseI y NlaIII19 para la digestión. Al adaptar combinaciones de enzimas, asegúrese de usar nucleótidos biotinilados que puedan llenar los voladizos específicos de 5′ y use los tampones más óptimos para cada cóctel. DpnII viene con su propio tampón y el fabricante de enzimas recomienda un tampón específico para la digestión DdeI. Sin embargo, para la doble digestión con DpnII y DdeI en este protocolo, se recomienda el tampón de restricción porque está clasificado en 100% de actividad para ambas enzimas.
Solución de problemas de captura de conformación
Los tres pasos clave en la captura de la conformación cromosómica: reticulación, digestión y religación se han realizado antes de que los resultados se puedan visualizar en gel. Para determinar la calidad de cada uno de estos tres pasos y discernir dónde podrían haber surgido los problemas, se toman alícuotas antes (IC) y después de la digestión (DC) y se cargan en el gel junto con la muestra Hi-C ligada (Figura 2). Este gel se utiliza para determinar la calidad de la muestra Hi-C y si valdrá la pena continuar con el protocolo. Sin el IC y el DC, es difícil identificar posibles pasos subóptimos. Vale la pena señalar que la ligadura subóptima podría deberse a un problema en la ligadura en sí, el relleno o un problema con la reticulación. Para solucionar problemas de reticulación, asegúrese de no usar más de 1 × 107 celdas por biblioteca y comience con reactivos de reticulación nuevos y celdas limpias (es decir, enjuagadas con PBS). Para la ligadura, asegúrese de que las células y la mezcla de ligadura se mantengan en hielo. Añadir T4 DNA ligasa justo antes de la incubación de 4 h a 16 °C y mezclar bien.
Solución de problemas de preparación de la biblioteca
Si se necesitan más de 10 ciclos de PCR o no se puede ver ningún producto de PCR en el gel después de la titulación por PCR (Figura 4), hay algunas opciones para guardar la muestra Hi-C. Trabajando hacia atrás desde la titulación de PCR, la primera opción es probar la PCR nuevamente. Si todavía no hay suficiente producto, es posible intentar otra ronda de A-tailing y ligadura del adaptador (paso 3.6) después de lavar las perlas dos veces con 1x tampón TLE. Después de esta ligadura adicional de cola A y adaptador, se puede proceder a la titulación por PCR como antes. Si todavía no hay producto, la última opción es volver a sonizar la fracción 0.8x del paso 3.3 y proceder desde allí.
Limitaciones y ventajas de Hi-C3.0
Es importante darse cuenta de que Hi-C es un método basado en la población que captura la frecuencia promedio de interacciones entre pares de loci en la población celular. Algunos análisis computacionales están diseñados para desentrañar combinaciones de conformaciones de una población25, pero en principio, Hi-C es ciego a las diferencias entre células. Aunque es posible realizar Hi-C26,27 de una sola celda y se pueden hacer inferencias computacionales28, Hi-C de una sola celda no es adecuado para obtener información 3C de ultra alta resolución. Una limitación adicional de Hi-C es que solo detecta interacciones por pares. Para detectar interacciones multicontacto, se pueden usar cortadores frecuentes combinados con secuenciación de lectura corta (Illumina)16 o realizar multicontacto 3C29 o 4C30, utilizando secuenciación de lectura larga de plataformas PacBio u Oxford Nanopore. También se han desarrollado derivados de Hi-C para detectar específicamente contactos entre y a lo largo de cromátidas hermanas31,32.
Aunque Hi-C19 y Micro-C33 se pueden usar para generar mapas de contactos a resoluciones subkilobase, ambos requieren una gran cantidad de lecturas de secuenciación y esto puede convertirse en una tarea costosa. Para llegar a una resolución similar o incluso mayor sin los costos, se puede aplicar el enriquecimiento para regiones genómicas específicas (captura-C 34) o interacciones proteicas específicas (ChiA-PET 35, PLAC-seq36, Hi-ChIP37). La fuerza y la desventaja de estas aplicaciones de enriquecimiento es que solo se muestrea un número limitado de interacciones. Con tales enriquecimientos, el aspecto global de Hi-C (y la opción de normalización global) se pierde.
Importancia y aplicaciones potenciales de Hi-C3.0
Este protocolo fue diseñado para permitir 3C ultraprofundo de alta resolución y, al mismo tiempo, detectar características de plegado a gran escala, como TAD y compartimentos17 (Figura 6). Este protocolo comienza con 5 × 106 celdas por tubo para cada biblioteca Hi-C, que debería ser material más que suficiente para secuenciar uno o dos carriles en una celda de flujo para obtener hasta mil millones de lecturas de extremo emparejado. Para la secuenciación ultraprofunda, se deben preparar múltiples tubos de 5 × 106 células, dependiendo del número de lecturas mapeadas y duplicados de PCR. A la resolución más alta (<1 kb), las interacciones en bucle se encuentran principalmente entre los sitios CTCF, pero también se pueden detectar interacciones promotor-potenciador. Los lectores pueden consultar Akgol Oksuz et al.17 para una descripción detallada del análisis de datos.
The authors have nothing to disclose.
Nos gustaría agradecer a Denis Lafontaine por el desarrollo del protocolo y a Sergey Venev por la asistencia bioinformática. Este trabajo fue apoyado por una subvención del Programa de Nucleomas 4D del Fondo Común de los Institutos Nacionales de Salud a J.D. (U54-DK107980, UM1-HG011536). J.D. es investigador del Instituto Médico Howard Hughes.
Este artículo está sujeto a la política de acceso abierto a publicaciones del HHMI. Los jefes de laboratorio de HHMI han otorgado previamente una licencia CC BY 4.0 no exclusiva al público y una licencia sublicenciable a HHMI en sus artículos de investigación. De conformidad con esas licencias, el manuscrito aceptado por el autor de este artículo puede estar disponible gratuitamente bajo una licencia CC BY 4.0 inmediatamente después de su publicación.
1 kb Ladder | New England Biolabs | N3232L | |
Agarose | Invitrogen | 16500100 | |
Agencourt AMPure XP magnetic beads , 60 mL | Beckman Coulter | A63881 | |
Amicon Ultra-0.5 Centrifugal Filter Unit (CFU) | EMD Millipore | UFC500396 | |
Annealing Buffer (5x) | See recipe in supplemental materials | ||
ATP 10 mM | ThermoFisher | R0441 | |
Avanti J-25i High Speed Refrigerated ultra-centrifuge | Beckman Coulter | ||
beckman ultracentrifuge tube 35 mL | Beckman Coulter | 357002 | |
Binding Buffer (2x) | See recipe in supplemental materials | ||
biotin-14-dATP 0.4 mM | Invitrogen | 19524-016 | |
BSA 10 mg/mL | New England Biolabs | B9000S | dilute from 20 mg/mL |
Cell scraper | Falcon | 353089 | |
Cell scraper | Corning | 3008 | |
Conical polypropylene tubes 50 mL | Denville | C1062-P | |
Conical tube 15 mL | Denville | C1017-P | |
Covaris micro tube AFA fiber with snap-cap 130 µL | Covaris | 520045/520077 | |
Covaris Sonicator | Covaris | E220/E220evolution/M220 | |
Culture flask 175 cm2 | Falcon | 353112 | |
Culture plates 150 mm x 25 mm | Corning | 430599 | |
dATP 1 mM | Invitrogen | 56172 | |
dATP 10 mM | Invitrogen | 56172 | |
dCTP 10 mM | Invitrogen | 56173 | |
DdeI | New England Biolabs | R0175L | |
dGTP 10 mM | Invitrogen | 56174 | |
DMSO | Sigma | D2650-5x10ML | |
dNTP mix 25 mM | Invitrogen | 10297117 | |
Dounce homogenizer | DWK Life Sciences | 8853010002/8853030002 | |
DPBS | Gibco | 14190-144 | |
DpnII | New England Biolabs | R0543M | |
DSG | ThermoScientific | 20593 | |
dTTP 10 mM | Invitrogen | 56175 | |
Ethanol 70% | Fisher | A409-4 | Diluted from 100% |
Ethidium Bromide | Fisher | BP1302-10 | |
Formaldehyde (37%) | Fisher | BP531-500 | |
Gel loading dye (6x ) | New England Biolabs | B7024S | |
Glycine in ultrapure water 2.5 M | Sigma | G8898-1KG | |
HBSS | Gibco | 14025-092 | |
Igepal CA-630 detergent | MP Biomedicals | 198596 | |
Klenow DNA polymerase 5 U/µL | New England Biolabs | M0210L | |
Klenow Fragment 3–>5’ exo-, 5 U/µL | New England Biolabs | M0212L | |
ligation buffer (10x) | New England Biolabs | B7203S | |
Liquid nitrogen | |||
LoBind microcentrifuge tube 1.7 mL | Eppendorf | 22431021 | |
Low Molecular Weight DNA Ladder | New England Biolabs | N3233L | |
Lysis buffer | See recipe in supplemental materials | ||
Magnetic Particle separator | ThermoFisher | 12321D | |
Microfuge tubes 1.7 mL | Axygen | MCT-175-C | |
MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
NEBuffer 2.1 (10x) | New England Biolabs | B7002S | |
NEBuffer 3.1 (10x) | New England Biolabs | B7203S | |
PBS | Gibco | 70013-032 | |
PCR (strip) tubes | Biorad | TBS0201/ TCS0803 | |
PCR thermocycler | Biorad | T100 | |
Pfu Ultra II Buffer (10x) | Agilent | Comes with Pfu Ultra | |
PfuUltra II Fusion HS DNA Polymerase | Agilent | 600674 | |
Phase lock tube 15 mL | Qiagen | 129065 | |
Phase lock tubes 2 mL | Qiagen | 129056 | |
Phenol:chloroform:isoamyl alcohol | Invitrogen | 15593-049 | |
Protease inhibitor cocktail | ThermoFisher | 78440 | |
Proteinase K in ultrapure water 10 mg/mL | Invitrogen | 25530-031 | |
Refrigerated Centrifuge | Eppendorf | 5810R | |
RNase A, DNase and protease-free 10 mg/mL | Thermo Scientific | EN0531 | |
Rotator | Argos technologies | EW-04397-40 or rocking platform | |
SDS 1% | Fisher | BP13111 | |
Sodium acetate pH = 5.2, 3 M | Sigma | ||
Sub-Cell GT Horizontal Electrophoresis System | Biorad | 1704401 | |
T4 DNA ligase 1 U/µL | Invitrogen | 100004817 | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase 3 U/µL | New England Biolabs | M0203L | |
T4 ligation buffer (5x) | Invitrogen | Y90001 | |
T4 polynucleotide kinase 10 U/µL | New England Biolabs | M0201L | |
Tabletop centrifuge | Eppendorf | 5425 | |
TBE buffer | See recipe in supplemental materials | ||
Tris Low EDTA Buffer (TLE) | See recipe in supplemental materials | ||
Triton X-100 (10%) | Sigma | 93443 | |
Truseq adapter oligos | Integrated DNA Technologies (IDT)) | https://www.idtdna.com/site/order/oligoentry | 250 nmole and HPLC purified |
Tween 20 detergent | Fisher | 9005-64-5 | |
Tween Wash Buffer | See recipe in supplemental materials | ||
Vortex | Scientific Industries | (G560)SI-0236 |