Aquí, presentamos una adaptación de la técnica de captura de conformación cromosómica (3C) en detalle con énfasis en la participación y el aprendizaje de pregrado.
La captura de conformación cromosómica (3C) es una herramienta poderosa que ha generado una familia de técnicas similares (por ejemplo, Hi-C, 4C y 5C, denominadas aquí técnicas 3C) que proporcionan información detallada de la organización tridimensional de la cromatina. Las técnicas 3C se han utilizado en una amplia gama de estudios, desde el monitoreo de los cambios en la organización de la cromatina en las células cancerosas hasta la identificación de contactos potenciadores realizados con promotores de genes. Si bien muchos de los estudios que utilizan estas técnicas están haciendo grandes preguntas sobre todo el genoma con tipos de muestras intrincadas (es decir, análisis de células individuales), lo que a menudo se pierde es que las técnicas 3C se basan en métodos básicos de biología molecular que son aplicables a una amplia gama de estudios. Al abordar preguntas estrechamente enfocadas de la organización de la cromatina, esta técnica de vanguardia se puede utilizar para mejorar la investigación de pregrado y la experiencia de laboratorio de enseñanza. Este documento presenta un protocolo 3C y proporciona adaptaciones y puntos de énfasis para la implementación en instituciones principalmente de pregrado en investigación de pregrado y experiencias docentes.
El genoma de un organismo no solo contiene todos los genes necesarios para la función, sino también todas las instrucciones sobre cómo y cuándo usarlos. Esto hace que la regulación del acceso al genoma sea una de las funciones más importantes de la célula. Hay muchos mecanismos para controlar la función de los genes; sin embargo, en su nivel base, la regulación génica se reduce a la capacidad de los factores de transcripción reguladores (transfactores) para unirse a sus secuencias específicas de ADN (secuencias reguladoras cis). Esta no es una habilidad innata; En cambio, se rige por la organización/estructura del genoma en el núcleo, que controla la disponibilidad/exposición de las secuencias cis-reguladoras a los trans-factores 1,2,3. Si los transfactores no pueden encontrar sus secuencias cis-reguladoras, entonces los trans-factores no pueden realizar sus tareas regulatorias. Esto ha hecho que comprender cómo se organizan los genomas en el núcleo sea una fuente importante de investigación.
Es ampliamente aceptado que durante la interfase, los cromosomas eucariotas en el núcleo ocupan su propio dominio anclado a la lámina nuclear y la matriz nuclear (Figura 1), lo que hace que el cromosoma se parezca más a una rebanada de pizza, en lugar de un fideo en un plato de espaguetis. Los cromosomas están parcialmente condensados por interacciones proteína-ADN (cromatina) que retuercen y refuerzan porciones del cromosoma. A través de microscopía electrónica, hibridación tridimensional de fluorescencia de ADN in situ (FISH) y técnicas de marcado de ADN (es decir, metilación de ADN fluorescente y artificial), se ha encontrado que los dominios inactivos de la cromatina están empaquetados firmemente a lo largo de la periferia nuclear 4,5,6, mientras que porciones de cromatina activa y menos condensada se encuentran en el interior del núcleo 7,8,9, 10. Estos experimentos proporcionan una visión de gran angular de la dinámica cromosómica, pero hacen poco para capturar los cambios que ocurren localmente alrededor de los promotores de genes observados en los estudios de DNasa11,12 y nucleosoma13,14,15.
La clave para desbloquear la dinámica de la cromatina de mayor resolución fue la formulación de la técnica de mapeo cromosómico 3D, 3C. La técnica 3C en sí comprende cuatro pasos principales: reticulación de la cromatina, digestión de la cromatina por enzimas de restricción, ligadura de la cromatina y purificación del ADN (Figura 2). Los nuevos fragmentos de ADN artificial generados por este proceso pueden ser caracterizados para revelar la estrecha asociación física entre piezas linealmente distantes de ADN16. La técnica 3C se convirtió en la base para la creación de múltiples técnicas derivadas que utilizan los pasos iniciales de 3C para hacer preguntas más amplias sobre todo el genoma (por ejemplo, Hi-C, 4C, ChIP-C). Esta familia de técnicas 3C ha identificado que los cromosomas están organizados en múltiples unidades discretas denominadas dominios topológicamente asociados (TADs). Los TADs están codificados en el genoma y están definidos por bucles de cromatina flanqueados por límites sin bucle16,17,18,19. Los límites de TAD son mantenidos por dos factores evolutivamente conservados y ubicuos, incluyendo el factor de unión CCCT (CTCF) y la cohesión, que evitan que los bucles dentro de TADs separadosinteractúen 16,20. Los bucles están mediados por la interacción de los transfactores con sus secuencias reguladoras, así como CTCF y cohesión21.
Aunque muchos estudios que utilizan tecnologías 3C hacen preguntas amplias sobre todo el genoma y emplean técnicas complicadas de recolección de muestras, la formulación de la técnica 3C se basa en técnicas básicas de biología molecular. Esto hace que 3C sea intrigante para su implementación tanto en la investigación de pregrado como en los laboratorios de enseñanza. La técnica 3C se puede emplear para preguntas enfocadas más pequeñas y es inherentemente flexible para escalar hacia arriba o hacia abajo (genes individuales22, cromosomas16 y / o genomas18) dependiendo del enfoque y la dirección de las preguntas formuladas. Esta técnica también se ha aplicado a una amplia gama de sistemas modelo 7,16,19,23 y ha demostrado ser versátil en su uso. Esto hace que 3C sea una excelente técnica para estudiantes universitarios, ya que los estudiantes pueden adquirir experiencia en técnicas comunes de biología molecular al tiempo que adquieren una valiosa experiencia en responder preguntas dirigidas.
Aquí se presenta un protocolo adaptado para la preparación de bibliotecas 3C basado en protocolos previamente publicados24,25,26,27. Este protocolo ha sido optimizado para aproximadamente 1 × 107 celdas, aunque ha generado bibliotecas 3C con tan solo 1 × 105 celdas. Este protocolo ha demostrado ser versátil y se ha utilizado para generar bibliotecas 3C a partir de embriones de pez cebra, líneas celulares de pez cebra y Caenorhabditis elegans (lombriz intestinal) adulta joven (YA). El protocolo también debe ser apropiado para líneas celulares de mamíferos y, con mayor adaptación, levadura.
El objetivo de estas adaptaciones es hacer que 3C sea más accesible para los estudiantes universitarios. Se ha tenido cuidado de utilizar técnicas que son similares a las que se pueden lograr en un laboratorio de enseñanza de pregrado. La técnica 3C ofrece muchas oportunidades de aprendizaje para que los estudiantes universitarios aprendan técnicas básicas de biología molecular que beneficiarán su desarrollo en el banco, en el aula y en sus esfuerzos después de la graduación.
El 3C es una técnica poderosa que tiene sus raíces en técnicas moleculares básicas. Es esta base de herramientas fundamentales lo que hace que 3C sea una técnica tan intrigante para usar con estudiantes universitarios. Con tantos estudios recientes que observan la dinámica de la cromatina a una escala tan amplia, el uso de estos resultados para diseñar un experimento enfocado en un solo gen o región genómica tiene el potencial de crear un experimento único e impactante en la investigación de pregrado. A menudo, experimentos como estos se consideran demasiado avanzados para los estudiantes universitarios, pero con una planificación cuidadosa, son fácilmente alcanzables. Es importante tener en cuenta que los ensayos diseñados para sondear las conexiones de cromatina capturadas por la biblioteca 3C pueden variar desde la PCR semicuantitativa de punto final hasta la secuenciación del genoma completo. De hecho, los datos del primer artículo 3C16 se generaron a partir de qPCR. Esta amplia gama de ensayos se puede utilizar porque todas las tecnologías 3C producen el mismo producto: una biblioteca de fragmentos de ADN que representan conexiones 3D en el núcleo.
Aquí se presenta una adaptación de un protocolo más flexible y complaciente que se ajusta mejor a los investigadores de pregrado. Los períodos de pausa enumerados anteriormente implican retrasos nocturnos; Sin embargo, estas pausas pueden extenderse durante los fines de semana y, en el caso de las células y los núcleos, durante semanas. La consideración más importante es cuándo se realizará el trabajo. A menudo, en los protocolos, hay pasos sensibles al tiempo cuando la pausa no es una opción. Fuera de algunos puntos (día 1 y día 2), hay muchos lugares para detenerse y congelar la muestra. Estos son críticos cuando se trabaja con estudiantes universitarios donde los horarios y horarios del trabajo de laboratorio deben ser flexibles. Además de diseñar estas paradas en el protocolo, se alienta a los estudiantes universitarios a trabajar en parejas o incluso en pequeños grupos de tres o cuatro. Los grupos funcionan bien para este protocolo, ya que los estudiantes pueden apoyarse mutuamente y crear un sistema de compañeros para que todos trabajen de manera segura. El trabajo de laboratorio también es más divertido con otros involucrados. Con los grupos, los estudiantes también pueden trabajar en una variedad de preguntas centradas en la organización de la cromatina mientras realizan el mismo protocolo. Por lo tanto, incluso mientras los estudiantes están trabajando en proyectos separados, el protocolo vincula sus esfuerzos y, debido a esto, pueden apoyarse mutuamente.
Otras adaptaciones están destinadas a evitar el hecho de que ciertas herramientas y equipos especializados no se encuentran necesariamente en todas las instituciones de pregrado. Estos equipos incluyen, entre otros, termocicladores qPCR, sistemas de documentación de gel y espectrómetros de nanovolumen. De hecho, estos equipos son convenientes pero no son un requisito. Aquí, el método clásico de 3C también se describe en la parte de diseño de imprimación; Esto implica identificar un locus genómico de interés y, a partir de eso, evaluar otros loci genómicos para los puntos de contacto de la cromatina más lejanos. Esta técnica también funciona bien si se utiliza un conjunto de datos publicado, como un conjunto de datos que utiliza Hi-C, donde se identifican los loci positivos (conectados) y negativos (no conectados) conocidos. El diseño de experimentos utilizando estos conjuntos de datos publicados es otra gran adaptación para los laboratorios de enseñanza, ya que la posibilidad de identificar con éxito las conexiones de la cromatina suele ser mayor. Además, el artículo de investigación puede ser discutido en clase y ser utilizado como referencia.
Este protocolo utiliza un enfoque de qPCR modificado para visualizar la formación del producto 3C. Los controles son esenciales para el éxito de la técnica 3C. Cada experimento utiliza controles de muestra y controles de cebador para determinar la finalización del procedimiento 3C. Los controles de la muestra incluyen un control no digerido (ADN genómico) y un control digerido. El control no digerido determina la señal de referencia para los juegos de cebadores y se utiliza con el control de digestión reticulado para determinar la eficiencia de digestión Se espera que haya una caída en el producto para cualquier cebador dirigido a través de un sitio de restricción. La comparación de este valor con el control no digerido proporciona una indicación de qué tan bien se digirió la muestra.
Los cebadores para la PCR incluyen un cebador de control y cebadores de prueba. El cebador de control es un conjunto de cebadores que está cerca de la región genómica que se está ensayando y no contiene un sitio de restricción. Esto proporciona la línea de base para determinar la abundancia de los productos de PCR de imprimación de prueba. Los cebadores de prueba son cebadores directos e inversos que flanquean un sitio de restricción para un locus genómico particular de interés (Figura 3). Las reacciones que utilizan estos juegos de imprimación se comparan para determinar la eficiencia de digestión, ya que la abundancia de producto debe disminuir si se ha cortado el sitio de restricción. Al determinar la organización de la cromatina, un cebador de prueba de un locus se empareja con otro cebador de prueba de un locus genómico diferente para determinar si estos dos loci están muy juntos en el espacio 3D. En ese caso, la expectativa es que un producto de PCR solo se encuentre utilizando la muestra 3C como plantilla.
Es importante tener en cuenta que incluso los cebadores validados tienen la tendencia a fallar (Figura 4: juego de cebadores r14). Además, los productos de PCR se identifican con frecuencia en reacciones de control y en reacciones en las que no se predice una conexión de cromatina (como el control digerido, ya que no está ligado). Estas instancias están secuenciadas y fallan en el control de calidad de Sanger o regresan sin una secuencia definida (Figura 5). Además, los experimentos tradicionales de 3C generan una “plantilla de control”, una muestra de ADN no entrecruzada, digerida y ligada, que representa todos los posibles fragmentos ligados que se pueden producir con una cantidad dada de ADN. La “plantilla de control” juega un papel importante en la comparación de las intensidades de las señales de qPCR entre dos loci genómicos para determinar si la señal representa una verdadera interacción o simplemente una asociación aleatoria. Crear una “plantilla de control” puede ser problemático, ya que una gran parte de la cromatina que se está ensayando debe capturarse en forma de un cromosoma artificial y procesarse junto con las muestras 3C. Asegurar tal construcción puede no ser factible, y crear uno podría estar fuera del alcance de un proyecto semestral. Debido a estas dificultades, sugerimos usar un cebador de control. El manual de control no reemplaza toda la funcionalidad de la “plantilla de control”, pero aún brinda la oportunidad de analizar los datos para hacer determinaciones de “presencia” o “ausencia”.
Al realizar qPCR, es importante utilizar cantidades iguales de la muestra. Esto debe determinarse, incluso si se utiliza un nanoespectrofotómetro como una nanogota, generando una curva estándar a partir del ADN genómico de una concentración conocida y ajustando las muestras 3C a esa línea. Estas cantidades deben registrarse y utilizarse en PCR posteriores. La calidad de la reacción de PCR también es importante. Como la PCR se ejecuta en qPCR, la abundancia del producto se mide mediante fluorescencia y se registra. Esta grabación es accesible en la gráfica de amplificación. Una vez finalizado el programa, es importante comprobar la gráfica de amplificación y asegurarse de que las reacciones (excepto los controles sin plantilla) tienen tres fases: una línea base, una exponencial y una fase de meseta/saturación. Es importante comprobar que las reacciones tienen una fase exponencial, en particular para establecer el umbral (véase más adelante). Además, para las muestras diluidas en serie, debe haber un cambio en los valores de Ct consistente con la dilución de la muestra (la concentración más alta tendrá los valores de Ct más bajos, mientras que la concentración más baja tendrá los valores de Ct más altos). Las muestras que no reflejan este cambio en la gráfica de amplificación requieren una nueva dilución o indican un problema mayor con la formación de la muestra 3C. Finalmente, al generar la curva estándar, el software de PCR calculará la eficiencia de PCR y el valor de R2 . La eficiencia de PCR debe ser superior al 90% y el valor deR2 debe ser superior a 0,99. Si no se cumple alguna de estas condiciones, es probable que algo esté mal con la muestra o los cebadores de PCR.
Después de la qPCR, el porcentaje de digestión y la presencia de interacciones 3C se pueden calcular utilizando la qPCR Ct para cada reacción. Para determinarlos, primero, se debe establecer el umbral para la reacción de PCR. Esto se hace normalmente utilizando el software que viene con la máquina qPCR. El establecimiento del umbral definirá la concentración del producto de PCR que se utilizará para comparar los valores de Ct de la muestra. El umbral debe dividir las curvas de amplificación de las reacciones de PCR en la fase exponencial de amplificación. Solo se pueden comparar las reacciones de PCR con amplificación exponencial (en este caso, los cebadores de control y las reacciones del cebador de prueba), ya que esta es la única forma de garantizar que las reacciones amplifiquen el ADN a la misma velocidad y se puedan comparar fielmente. Al analizar los gráficos 3C, las reacciones condicionalmente positivas se identifican como aquellas con más producto sobre las muestras de control, control genómico y control de digestión (Figura 4B). Sin embargo, estas muestras deben validarse aún más mediante la secuenciación de Sanger después de la purificación en gel del producto de PCR.
Después de la secuenciación de Sanger, las muestras que pasan el control de calidad se pueden analizar utilizando Blat. El objetivo de este análisis es determinar si la muestra tiene la secuencia de ambos loci genómicos diana que flanquean el sitio de restricción (DpnII en el caso de este protocolo). Si se identifican ambas secuencias, entonces el fragmento 3C puede considerarse validado. Si los resultados del Blat no devuelven la secuencia esperada, esto puede indicar que uno o ambos cebadores no son óptimos, lo que resulta en un resultado de qPCR falso positivo. Los archivos de seguimiento para las muestras de falsos positivos tendrán picos base indefinidos, y los informes Seq contendrán principalmente “n” llamadas base.
La validación de Sanger es esencial, ya que son posibles los falsos positivos de la formación de productos de PCR artificial. Estos falsos positivos se pueden identificar cuando los productos de secuenciación no tienen la secuencia objetivo esperada o un sitio DpnII característico de un fragmento 3C adecuado (Figura 5). La secuenciación de los fragmentos de PCR también proporciona otro punto de datos para el experimento y lleva a los estudiantes a casa que la técnica 3C está identificando loci genómicos distantes que se están uniendo en el espacio 3D dentro de los núcleos.
La técnica 3C proporciona una gran cantidad de técnicas moleculares fundamentales para estudiantes universitarios en un procedimiento flexible y sencillo. Esta técnica 3C es también un punto de partida para las otras técnicas 3C que incorporan secuenciación de próxima generación (NGS). Este tipo de experimentos pueden exponer a los estudiantes universitarios a aspectos importantes de la bioinformática y se basan en los principios básicos descritos aquí. La experiencia y la participación de pregrado son clave para su éxito y desarrollo como jóvenes científicos. Al proporcionar estas oportunidades, los estudiantes universitarios pueden fortalecer su comprensión de los principios básicos mientras desarrollan su confianza para abordar técnicas y preguntas de vanguardia.
The authors have nothing to disclose.
Este trabajo fue apoyado en parte por la Red de Excelencia en Investigación Biomédica del Premio al Desarrollo Institucional de Rhode Island (IDeA) del Instituto Nacional de Ciencias Médicas Generales de los Institutos Nacionales de Salud bajo el número de subvención P20GM103430 y el Centro Bryant de Salud y Ciencias del Comportamiento.
37% Formaldehyde | Millapore-Sigma | F8775 | |
100% Ethanol | Millapore-Sigma | E7023 | |
CaCl2 | MP Biomedical | 215350280 | |
chloroform | Millapore-Sigma | C0549 | |
cOmplete, EDTA-free Protease Inhibitor Cocktail | Millapore-Sigma | COEDTAF-RO | mixed to 50x in water. Diluted to 1x in Sucrose buffer and GB buffer fresh |
Dithiothreitol (DTT) | Millapore-Sigma | D0632 | 1 M stock diluted to 500 µM in Sucrose buffer and GB buffer fresh |
DpnII | NEB | R0543M | |
Glycerol | Millapore-Sigma | G9012 | |
glycine | Millapore-Sigma | G8898 | |
glycogen | Millapore-Sigma | 10901393001 | |
HEPES | Millapore-Sigma | H3375 | |
KCl | Millapore-Sigma | P3911 | |
KH2PO4 | Millapore-Sigma | P5655 | |
methyl green pyronin | Millapore-Sigma | HT70116 | |
MgAc2 | Thermoscientific | 1222530 | |
Na2HPO4 | Millapore-Sigma | S5136 | |
NaCl | Millapore-Sigma | S9888 | |
phenol-chloroform | Millapore-Sigma | P3803 | |
Pronase | Millapore-Sigma | 11459643001 | |
Proteinase K | IBI Scientific | IB05406 | |
qPCR Ready mix (Phire Taq etc) | Millapore-Sigma | KCQS07 | |
RNase A | Millapore-Sigma | R6148 | |
Sodium Acetate | Millapore-Sigma | S2889 | |
sodium dodecyl sulfate (SDS) | Millapore-Sigma | L3771 | |
Sucrose | Millapore-Sigma | S0389 | |
T4 DNA Ligase | Promega | M1804 | |
Tris-HCl | Millapore-Sigma | 108319 | |
Triton X-100 | Millapore-Sigma | T9284 | |
Trypsin-EDTA | Millapore-Sigma | T4049 |