Informamos de la aplicación de la captura cuantitativa de conformación cromosómica seguida de la secuenciación de alto rendimiento en cuerpos embrionarios generados a partir de células madre embrionarias. Esta técnica permite identificar y cuantificar los contactos entre potenciadores putativos y regiones promotoras de un gen dado durante la diferenciación de células madre embrionarias.
Durante el desarrollo de los mamíferos, los destinos celulares se determinan mediante el establecimiento de redes reguladoras que definen la especificidad, el momento y los patrones espaciales de la expresión génica. Los cuerpos embrionarios (EB) derivados de células madre pluripotentes han sido un modelo popular para estudiar la diferenciación de las tres capas principales de gérmenes y definir circuitos reguladores durante la especificación del destino celular. Aunque es bien sabido que los potenciadores específicos de los tejidos desempeñan un papel importante en estas redes al interactuar con los promotores, asignarlos a sus genes objetivo relevantes sigue siendo un desafío. Para que esto sea posible, se necesitan enfoques cuantitativos para estudiar los contactos potenciador-promotor y su dinámica durante el desarrollo. Aquí, adaptamos un método 4C para definir potenciadores y sus contactos con promotores cognados en el modelo de diferenciación EB. El método utiliza con frecuencia enzimas de restricción de corte, sonicación y un protocolo de PCR mediado por ligación anidada compatible con kits de preparación de bibliotecas de ADN comerciales. Posteriormente, las bibliotecas 4C son sometidas a secuenciación de alto rendimiento y analizadas bioinformáticamente, permitiendo la detección y cuantificación de todas las secuencias que tienen contactos con un promotor elegido. Los datos de secuenciación resultantes también se pueden utilizar para obtener información sobre la dinámica de los contactos potenciador-promotor durante la diferenciación. La técnica descrita para el modelo de diferenciación EB es fácil de implementar.
En ratones, la masa celular interna (MIC) de embriones de 3,5 días de edad contiene células madre pluripotentes embrionarias. El MIC se desarrolla aún más en el epiblasto en el día 4.5, generando ectodermos, células de mesodermo y endodermo, las tres principales capas germinales en el embrión. Aunque las células pluripotentes en el MIC sólo existen transitoriamente in vivo, pueden ser capturadas en cultivo mediante el establecimiento de células madre embrionarias de ratón (mESC)1,2,3. Los mESC permanecen en un estado indiferenciado y proliferan indefinidamente, pero sobre estímulos intrínsecos y extrínsecos también son capaces de salir del estado de pluripotencia y generar células de las tres capas germinales del desarrollo2,,4. Curiosamente, cuando se cultiva en suspensión en pequeñas gotas, los mESC forman agregados tridimensionales (es decir, EBs) que se diferencian en las tres capas germinales5. El ensayo de formación de EB es una herramienta importante para estudiar el proceso de especificación de linaje temprano.
Durante la especificación del linaje, las células de cada capa germinal adquieren un programa específico de expresión génica4. La expresión espaciotemporal precisa de genes está regulada por diversos elementos cis-reguladores, incluyendo promotores de núcleos, potenciadores, silenciadores y aislantes6,,7,,8,,9. Los potenciadores, segmentos de ADN reguladores que normalmente abarcan unos pocos cientos de pares de bases, coordinan la expresión génica específica del tejido8. Los potenciadores se activan o silencian mediante la unión de factores de transcripción y cofactores que regulan la estructura de cromatina local8,10. Las técnicas comúnmente utilizadas para identificar potenciadores putativos son la inmunoprecipitación de cromatina en todo el genoma seguida de la secuenciación (ChIP-seq) y el ensayo para la cromatina accesible a la transposasa utilizando técnicas de secuenciación (ATAC-seq). Así, los potenciadores activos se caracterizan por marcas de histona activas específicas y por el aumento de la accesibilidad local al ADN11,12,13,14. Además, potenciadores del desarrollo se cree que requieren interacción física con su promotor de cognado8,9. De hecho, se ha demostrado que las variantes de potenciadory y eliminaciones que interrumpen los contactos potenciador-promotor pueden conducir a malformaciones del desarrollo15. Por lo tanto, es necesario una técnica novedosa que proporcione información adicional para la identificación de potenciadores funcionales que controlan la expresión génica del desarrollo.
Desde el desarrollo de la técnica16de la captura de conformación cromosómica (3C), el mapeo de contactos cromosómicos se ha utilizado intensamente para evaluar la distancia física entre los elementos reguladores. Es importante destacar que recientemente se han desarrollado variantes de alto rendimiento de técnicas 3C, proporcionando diferentes estrategias para la fijación, digestión, ligadura y recuperación de contactos entre fragmentos de cromatina17. Entre ellos, in situ Hi-C se ha convertido en una técnica popular que permite la secuenciación de productos de ligadura 3C genoma-ancho18. Sin embargo, los altos costos de secuenciación necesarios para alcanzar una resolución adecuada para el análisis de los contactos potenciador-promotor hacen que esta técnica no sea práctica para el estudio de loci específicos. Por lo tanto, se desarrollaron métodos alternativos para analizar loci específicos a mayor resolución19,20,21,22. Uno de estos métodos, a saber, 4C, conocido como una estrategia uno contra todos, permite la detección de todas las secuencias que se comunican con un sitio seleccionado como punto de vista. Sin embargo, una desventaja de la técnica 4C estándar es la PCR inversa requerida, que amplifica fragmentos de diferente tamaño, favoreciendo productos pequeños y cuantificación de sesgo después de la secuenciación de alto rendimiento. Recientemente, UMI-4C, una nueva variante de la técnica 4C utilizando identificadores moleculares únicos (UMI) se ha desarrollado para la elaboración de perfiles de contacto cromosómico cuantitativos y dirigidos que elude este problema23. Este enfoque utiliza cortadores frecuentes, sonicación y un protocolo de PCR mediado por ligaduras anidadas, lo que implica la amplificación de fragmentos de ADN con una distribución de longitud relativamente uniforme. Esta homogeneidad reduce los sesgos en el proceso de amplificación de las preferencias de PCR para secuencias más cortas y permite una recuperación eficiente y un recuento preciso de moléculas/fragmentos conectados espacialmente.
Aquí describimos un protocolo que adapta la técnica UMI-4C para identificar y cuantificar los contactos de cromatina entre promotores y potenciadores de los factores de transcripción instructiva del linaje durante la diferenciación de EB.
El método de cultivo de gotas colgantes no necesita factores de crecimiento o citoquinas adicionales y genera reproduciblemente poblaciones homogéneas de EBs a partir de un número predeterminado demESC5. Aquí describimos un protocolo de 4C cuantitativo adaptado del enfoque UMI-4C para cuantificar el contacto potenciador-promotor de factores de transcripción específicos del linaje en el modelo de diferenciación EB. Identificamos regiones de cromatina que contactan a los promotores de los genes Pou5f1 y T de forma dinámica durante la diferenciación de EB. Pou5f1 fue regulado durante la diferenciación de EB y la frecuencia de contacto entre el promotor de Pou5f1 y su potenciador distal disminuyó. Por el contrario, T fue regulado al alza durante la diferenciación de EB e identificamos tres potenciadores para los cuales las frecuencias de contacto con su promotor disminuyen(Figura 3). Para confirmar la identificación, se puede realizar un ensayo de inmunoprecipitación de cromatina (ChIP) de la marca de histona activa H3K27ac24,ya que se ha demostrado que esta marca de histona está asociada con la activación del potenciador y los potenciadores pierden esta marca durante su inactivación11.
Una técnica 4C estándar se ha utilizado ampliamente para examinar el perfil de contacto de cromatina de sitios genómicos específicos25. Sin embargo, este enfoque es difícil de interpretar cuantitativamente incluso después de una normalización extensa26,27,28 debido a los sesgos introducidos por la heterogeneidad del tamaño del fragmento de PCR y la imposibilidad de distinguir los duplicados de PCR. Nuestro método cuantitativo 4C es en gran medida idéntico a la técnica UMI-4C que permite la cuantificación de moléculas individuales utilizando sonicación y un paso pcR mediado por liga-ligación anidada para eludir la limitación del enfoque 4C clásico23. Sin embargo, a diferencia del UMI-4C que utiliza identificadores moleculares únicos, nuestro protocolo cuantitativo 4C permite la cuantificación de moléculas individuales basadas en la rotura específica del ADN producida por el paso de sonicación. Hace que nuestro protocolo sea compatible con kits de preparación de bibliotecas de ADN comerciales, obviando la necesidad de imprimadores con identificadores moleculares únicos.
Nuestro protocolo implica varios pasos clave que deben ser considerados. Al igual que en el método 4C clásico28,los factores críticos de nuestro protocolo son la eficiencia de la digestión y la ligadura durante la preparación de las moléculas 3C. Las bajas eficiencias de digestión/ligación pueden disminuir drásticamente la complejidad de la interacción con un fragmento de interés, lo que resulta en una resolución reducida. Como se describió anteriormente23, otro paso crítico del protocolo es el diseño de las imprimaciones para la amplificación de la biblioteca. Los segundos imprimadores de reacción PCR deben estar situados 5-15 nt desde el sitio de restricción interrogado. En una lectura de secuenciación de 75 nt, esto permite por lo menos 40 nt a la izquierda de la longitud de la captura para la asignación. La imprimación utilizada en la primera reacción PCR debe diseñarse aguas arriba de la segunda imprimación sin solapamiento y ambas deben ser lo suficientemente específicas como para garantizar una amplificación eficiente del ADN. Para la multiplexación, las imprimaciones deben diseñarse de forma independiente, apuntando a una temperatura de fusión (Tm) de 60-65 oC. Además, en cuanto a otras técnicas 3C, la resolución del método cuantitativo 4C viene determinada por la enzima de restricción utilizada en el protocolo25. Este protocolo utiliza una enzima de restricción con un sitio de reconocimiento de 4 bp, MboI. La resolución máxima con esta enzima es de alrededor de 500 bp, pero esto es altamente dependiente del locus y rara vez se logra. Otra limitación es que las interacciones que se producen entre los elementos ubicados en el mismo fragmento de restricción no son detectables. Además, las interacciones que se producen a una distancia de un sitio de restricción no se pueden distinguir del fondo no digerido. El uso de un paso de relleno antes de la ligadura podría permitir la detección de estas interacciones.
Quantitative 4C es ideal para interrogar contactos de cromatina de loci dirigidos. Sin embargo, el paso de amplificación de PCR específico limita el número de loci que se pueden investigar simultáneamente. Una manera de aumentar el número de loci dirigidos es multiplexar los pasos de PCR para amplificar simultáneamente varios objetivos, pero esto requiere compatibilidad de los imprimadores utilizados y probar cada par de imprimación antes de la implementación. Si se desean cambios globales de la arquitectura de la cromatina en los promotores, los enfoques de todo el genoma como Hi-C, PC Hi-C o HiChIP serían más apropiados29,30,31.
The authors have nothing to disclose.
Nos gustaría dar las gracias a F. Le Dily, R. Stadhouders y a los miembros del laboratorio Graf por sus consejos y discusiones. G.S. fue apoyado por una beca Marie Sklodowska-Curie (H2020-MSCA-IF-2016, miRStem), T.V.T por una beca postdoctoral Juan de la Cierva (MINECO, FJCI-2014-22946). Este trabajo fue apoyado por el Consejo Europeo de Investigación en el marco del7o Programa Marco 77 (ERC Synergy Grant 4D-Genome, acuerdo de subvención 609989 a T.G.), el Ministerio de Economía, Industria y Competitividad (MEIC) de España a la asociación EMBL, el Centro de Excelencia Severo Ochoa 2013-2017 y el Programa Generalitat de Catalunya DE CERCA.
0.1% EmbryoMax gelatin | EMD Millipore | ES-006-B | Cell culture |
0.25% Trypsin-EDTA | 25200072 | ||
AMPure XP | Beckman Coulter | 10136224 | 4C/DNA purification |
B27 supplement | Gibco | 17504044 | Cell culture |
Beta-mercaptoethanol | Gibco | 31350010 | Cell culture |
Bioruptor Pico | Diagencode | B01060010 | 4C/sonication |
BSA | NEB | B9000S | 4C |
CHIR99021 | Selleck Chemicals | S1263 | Cell culture |
CIP | NEB | M0212 | 4C |
cOmplete Protease Inhibitor Cocktail | Roche | 4693116001 | 4C |
DMEM/F12 medium | Gibco | 11320033 | Cell culture |
dNTP | NEB | N0447S | 4C |
ESGRO Leukaemia Inhibitory Factor (LIF) | EMD Millipore | ESG1107 | Cell culture |
Formaldehyde solution (37%) | Sigma | 252549-25ML | 4C |
Glycin | Sigma | GE17-1323-01 | 4C |
Glycogen | ThermoFischer | R0551 | 4C |
Herculase II Fusion DNA polymerase | Agilent | 600675 | 4C |
IGEPAL CA-630 | Sigma | I3021-50ML | 4C |
Knockout DMEM | 10829018 | ||
L-glutamine | Gibco | 25030081 | Cell culture |
MboI | NEB | R0147M | 4C |
MEM non-essential amino acids | Gibco | 11140050 | Cell culture |
N2 supplement | Gibco | A1370701 | Cell culture |
NEBNext DNA Library prep | NEB | E6040 | 4C |
NEBuffer 2.1 | NEB | B7202S | 4C/digestion |
Neurobasal medium | Gibco | 21103049 | Cell culture |
PD0325901 | Selleck Chemicals | S1036 | Cell culture |
Penicillin Streptomycin | Gibco | 15140122 | Cell culture |
Proteinase K | NEB | P8107S | 4C |
Qubit 4 Fluorometer | ThermoFischer | Q33238 | 4C |
Qubit dsDNA HS Assay Kit | ThermoFischer | Q32851 | 4C |
RNase A | ThermoFischer | EN0531 | 4C |
Sodium pyruvate solution | Gibco | 11360070 | Cell culture |
StemPro Accutase Cell Dissociation Reagent | Gibco | A1110501 | Cell culture |
T4 DNA Ligase Reaction Buffer | NEB | B0202S | 4C |
T4 DNA Ligase Reaction Buffer | NEB | M0202M | 4C |