Summary

Captura de alto rendimiento identificación de secuencias reguladoras de genes utilizando secuenciación de próxima generación de conformación Circular cromosoma (4C-seq)

Published: October 05, 2018
doi:

Summary

La identificación de interacciones físicas entre los genes y elementos reguladores es un reto, pero ha sido facilitada por los métodos de captura de conformación de cromosoma. Esta modificación al Protocolo de 4C-seq mitiga sesgo PCR minimizando la amplificación excesiva de plantillas de PCR y maximiza el mappability de Lee mediante la incorporación de un paso de síntesis de enzima de la restricción además.

Abstract

La identificación de elementos reglamentarios para un gen determinado objetivo plantea un desafío técnico significativo debido a la variabilidad en los tamaños de efecto y colocación de elementos reguladores para un gene de la blanco. Algunos progresos con la predicción de Bioinformática de la existencia y función de las modificaciones epigenéticas proximal asociada a genes activados usando sitios de unión del factor de transcripción conservado. Estudios de captura de conformación de la cromatina han revolucionado nuestra capacidad de descubrir contactos físicos cromatina entre secuencias e incluso dentro de un genoma entero. Captura de la conformación de cromatina circular juntada con la secuenciación de próxima generación (4C-seq), en particular, está diseñada para descubrir todas las posibles interacciones de cromatina física para una secuencia dada de interés (mirador), como un gene de la blanco o un regulador potenciador. Las 4C-seq estrategias directamente de la secuencia en el punto de vista pero requieren numerosos y diversos puntos de vista para ser secuenciado simultáneamente para evitar los desafíos técnicos de uniforme basan llamando a (imagen) con plataformas de secuenciación de nueva generación. Este volumen de experimentos puede no ser práctico para muchos laboratorios. Aquí, Divulgamos un acercamiento modificado para el protocolo C 4-seq que incorpora una digestión de la enzima de restricción adicional y pasos de amplificación basada en qPCR que están diseñados para facilitar una mayor captura de lecturas de diversa secuencia y mitigar el potencial de Polimerización en cadena diagonal, respectivamente. Nuestro método modificado de 4C es favorable para el laboratorio de biología molecular estándar para evaluar la arquitectura de la cromatina.

Introduction

La identificación de elementos reguladores de expresión génica se ha facilitado por el proyecto de la enciclopedia de elementos de ADN (ENCODE) que comprensivo había anotado actividad funcional para el 80% del genoma humano1,2. La identificación de los sitios en vivo Unión de factor de transcripción, hipersensibilidad al DNaseI, y epigenético histona modificaciones de metilación del ADN en tipos de células individuales allanó el camino para el análisis funcional del candidato regulatorio elementos para la expresión del gen objetivo. Armado con estos resultados, nos enfrentamos con el desafío de determinar la interconexión funcional entre elementos reguladores y genes. Específicamente, ¿cuál es la relación entre un gen dada y su enhancer(s)? El método de captura (3C) de conformación de la cromatina aborda directamente esta cuestión por la identificación físicas y probablemente funcionales, las interacciones entre una región de interés y candidato interactuando secuencias a través de eventos capturados en cromatina fija3 . Como nuestra comprensión de las interacciones de la cromatina ha aumentado, sin embargo, es claro que la investigación de los lugares geométricos del candidato preseleccionado es insuficiente para proporcionar una comprensión completa de las interacciones del gene enhancer. Por ejemplo, codificar utiliza el método de copia (C 5) conformación cromosómica de alto rendimiento captura para examinar una pequeña parte del genoma humano (1%, piloto de 44 loci) y reportó la compleja interconexión de los loci. Genes y potenciadores con interacciones identificadas un promedio de 2 – 4 socios interactúan diferentes, muchos de los cuales fueron cientos de kilobases lejos en el espacio lineal4. Además, Li et al. utilizado el análisis de interacción de cromatina por Paired-End etiqueta secuenciación (ChIA-PET) para analizar las interacciones promotor de todo el genoma y encontró que 65% de los sitios de Unión II de ARN polimerasa estuvieron implicado en las interacciones de la cromatina. Algunas de estas interacciones dio como resultado grandes, genes múltiples complejos que abarcan cientos de kilobases de distancia genómica y que contiene, en promedio, 8-9 genes cada5. Juntos, estos resultados destacan la necesidad de métodos imparciales de todo el genoma para interrogar a las interacciones de la cromatina. Algunos de estos métodos se revisan en Schmitt et al. 6.

Métodos más recientes para los estudios de captura de conformación de la cromatina junto con generación de secuenciación (Hi-C y C 4-seq) permiten el descubrimiento de secuencias desconocidas interactuando con una región de interés6. Específicamente, captura de conformación circular cromosoma con secuenciación de próxima generación (4C-seq) fue desarrollado para identificar loci interactuando con una secuencia de interés en una manera imparcial7 mediante la secuenciación de ADN de cromatina capturada proximal a la región de interés en el espacio 3D. Brevemente, la cromatina se fija para preservar sus interacciones proteína-ADN nativo, troceados con una enzima de la restricción y posteriormente ligarse en condiciones diluidas captura biológicamente relevantes “enredos” de loci interactuantes (figura 1). Los enlaces cruzados se invierten para quitar la proteína, quedando así el ADN disponible para escote adicional con una segunda enzima de restricción. Una ligadura final genera círculos más pequeños de loci interactuando. Cartillas para la secuencia de interés entonces se utilizan para generar una biblioteca amplificada de secuencias desconocidas de los fragmentos circular, seguidos por la secuencia de generación siguiente aguas abajo.

El protocolo presentado aquí, que se centra en la preparación de la muestra, hace dos alteraciones principales existentes 4C-seq métodos8,9,10,11,12. En primer lugar, utiliza un método basado en qPCR empíricamente determinar el número óptimo de amplificación ciclos para pasos de preparación de biblioteca C 4-seq y así mitiga el potencial sesgo de PCR de amplificación excesiva de las bibliotecas. En segundo lugar, utiliza un paso de recopilación de restricción adicionales en un esfuerzo para reducir la uniformidad de secuencias conocidas de “cebo” que impide precisa base llamada por el instrumento de la secuencia y, por lo tanto, maximiza la secuencia informativa, única en cada lectura. Otros protocolos de eluden esta cuestión poniendo en muchas bibliotecas de (12-15)8 4 C-seq con cebo diferentes secuencias o sitios de restricción, un volumen de experimentos que no sean alcanzables por otros laboratorios. Las modificaciones aquí presentadas permiten un pequeño número de experimentos, las muestras o repeticiones para ser indexadas y agrupados en un solo carril.

Protocol

1. selección de la enzima de la restricción Identificar una región de interés (por ej., promotor del gene, polimorfismo de nucleótido único (SNP), potenciador) y obtener la secuencia del ADN de los repositorios como centro nacional para información biotecnológica (NCBI). Identificar las enzimas de restricción del candidato (REs) de la primera enzima de la restricción digestión (RE1) que no corte dentro de la secuencia de interés, que producir extremos pegajosos (termini de ADN con…

Representative Results

Queratinocitos humanos primarios fueron aislados de prepucio neonatal descartada 2 – 3, agrupados y culta en KSFM complementado con 30 μg/mL pituitaria bovina extracto, 0,26 ng/mL recombinante humana factor de crecimiento epidérmico y 0,09 mM cloruro de calcio (CaCl2 ) a 37 ° C, 5% dióxido de carbono. Las células se dividieron en dos frascos, y un matraz fue distinguido por la adición de CaCl2 a una concentración final de 1,2 mM para 72 h. 107 las…

Discussion

4C resultados tienen el potencial para revelar las interacciones de la cromatina que pueden identificar elementos reguladores desconocidos o genes de la blanco que son importantes en un contexto biológico específico24,25,26. Sin embargo, obstáculos técnicos pueden limitar los datos obtenidos de estos experimentos. Sesgo PCR de amplificación excesiva de la plantilla en C 4 protocolos es probable. Este protocolo soluciona est…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabajo fue apoyado por NIAMS (R01AR065523).

Materials

HindIII NEB R0104S
CviQI NEB R0639S
DNA oligonucleotide primers IDT To be designed by the reader
50 mL conical centrifuge tubes Fisher Scientific 06-443-19
1.7 mL microcentrifuge tubes MidSci AVSS1700
Phosphate buffered saline Thermo Fisher 14190-136
Formaldehyde, methanol free Electron Microscopy Sciences 15710
Nutator VWR 15172-203
Glycine JT Baker 4059-00
Benchtop centrifuge
Refrigerated microcentrifuge
Ethylenediaminetetraacetic acid (EDTA) Sigma-Aldrich ED2SS
20% SDS solution Sigma-Aldrich 05030
Trypan Blue Thermo Fisher 15250061
Glass slides Fisher Scientific 12-550-143
Cover slips VWR 16004-094
Light microscope
Triton X-100 Alfa Aesar A16046
Shaking heat block
2M Tris-HCl Quality Biological 351-048-101
Proteinase K NEB P8107S
Phenol:chloroform:isoamyl alcohol (25:24:1) Sigma-Aldrich P2069
Sodium acetate Sigma-Aldrich M5661
20 mg/mL glycogen Thermo Fisher R0561
Ethanol Fisher Scientific 04-355-223
Nuclease-free water Fisher Scientific MT-46-000-CM
qPCR cycler Thermo Fisher 4453536
qPCR plates Thermo Fisher 4309849
Thermocycler Thermo Fisher 4375786
PCR strip tubes MidSci AVSST-FL
1M Magnesium chloride Quality Biological 351-033-721
Dithiothreotol Sigma-Aldrich 43815
Adenosine triphosphate Sigma-Aldrich A2383
T4 DNA Ligase NEB M0202S
Agarose Sigma-Aldrich A6013
RNase A Thermo Fisher EN0531
Qiaquick PCR purification kit Qiagen 28104
MinElute PCR Purification kit Qiagen 28004
Spectrophotometer
Expand Long Template PCR System Sigma-Aldrich 11681834001
dNTP mix Thermo Fisher R0191
SYBR Green I Sigma-Aldrich S9430
ROX BioRad 172-5858
Sodium chloride Sigma-Aldrich S5886
End-It DNA End-Repair Kit Lucigen ER0720
LigaFast Rapid DNA Ligation System Promega M8221
SYBR Safe Thermo Fisher S33102
Taq Polymerase NEB M0267S
UltraSieve Agarose IBI Scientific IB70054
Qiaquick Gel Extraction Kit Qiagen 28704

References

  1. Dunham, I., et al. An integrated encyclopedia of DNA elements in the human genome. Nature. 489 (7414), 57-74 (2012).
  2. Hoffman, M. M., et al. Integrative annotation of chromatin elements from ENCODE data. Nucleic Acids Research. 41 (2), 827-841 (2013).
  3. Dekker, J., Rippe, K., Dekker, M., Kleckner, N. Capturing Chromosome Conformation. Science. 295 (5558), 1306-1311 (2002).
  4. Sanyal, A., Lajoie, B. R., Jain, G., Dekker, J. The long-range interaction landscape of gene promoters. Nature. 489 (7414), 109-113 (2012).
  5. Li, G., et al. Extensive promoter-centered chromatin interactions provide a topological basis for transcription regulation. Cell. 148 (1-2), 84-98 (2012).
  6. Schmitt, A. D., Hu, M., Ren, B. Genome-wide mapping and analysis of chromosome architecture. Nature Reviews Molecular Cell Biology. 17 (12), 743-755 (2016).
  7. Zhao, Z., et al. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra- and interchromosomal interactions. Nature genetics. 38 (11), 1341-1347 (2006).
  8. Splinter, E., de Wit, E., van de Werken, H. J. G., Klous, P., de Laat, W. Determining long-range chromatin interactions for selected genomic sites using 4C-seq technology: From fixation to computation. Methods. 58 (3), 221-230 (2012).
  9. Van De Werken, H. J. G., et al. 4C technology: Protocols and data analysis. Methods in Enzymology. 513, (2012).
  10. Brouwer, R. W. W., van den Hout, M. C. G. N., van IJcken, W. F. J., Soler, E., Stadhouders, R. Unbiased Interrogation of 3D Genome Topology Using Chromosome Conformation Capture Coupled to High-Throughput Sequencing (4C-Seq). Eukaryotic Transcriptional and Post-Transcriptional Gene Expression Regulation. , 199-220 (2017).
  11. Matelot, M., Noordermeer, D. Determination of High-Resolution 3D Chromatin Organization Using Circular Chromosome Conformation Capture (4C-seq). Polycomb Group Proteins: Methods and Protocols. , 223-241 (2016).
  12. Gheldof, N., Leleu, M., Noordermeer, D., Rougemont, J., Reymond, A. Detecting Long-Range Chromatin Interactions Using the Chromosome Conformation Capture Sequencing (4C-seq) Method. Gene Regulatory Networks: Methods and Protocols. , 211-225 (2012).
  13. Göndör, A., Rougier, C., Ohlsson, R. High-resolution circular chromosome conformation capture assay. Nature. 3 (2), 303-313 (2008).
  14. Hagège, H., et al. Quantitative analysis of chromosome conformation capture assays (3C-qPCR). Nature. 2 (7), 1722-1733 (2007).
  15. Anand, R. D., Sertil, O., Lowry, C. V. Restriction digestion monitors facilitate plasmid construction and PCR cloning. BioTechniques. 36 (6), 982-985 (2004).
  16. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic acids research. 44 (W1), W3-W10 (2016).
  17. Li, H., Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics. 26 (5), 589-595 (2010).
  18. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  19. Walter, C., Schuetzmann, D., Rosenbauer, F., Dugas, M. Basic4Cseq: An R/Bioconductor package for analyzing 4C-seq data. Bioinformatics. 30 (22), 3268-3269 (2014).
  20. Raviram, R., et al. 4C-ker: A Method to Reproducibly Identify Genome-Wide Interactions Captured by 4C-Seq Experiments. PLoS Computational Biology. 12 (3), (2016).
  21. Klein, F. A., Pakozdi, T., Anders, S., Ghavi-helm, Y., Furlong, E. E. M., Huber, W. FourCSeq: analysis of 4C sequencing data. Bioinformatics. 31 (19), 3085-3091 (2015).
  22. Williams, R. L., et al. fourSig a method for determining chromosomal interactions in 4C-Seq data. Nucleic Acids Research. 42 (8), (2014).
  23. McLean, C. Y., et al. GREAT improves functional interpretation of cis-regulatory regions. Nature Biotechnology. 28 (5), 495-501 (2010).
  24. Stolzenburg, L. R., et al. Regulatory dynamics of 11p13 suggest a role for EHF in modifying CF lung disease severity. Nucleic Acids Research. 45 (15), 8773-8784 (2017).
  25. Meddens, C. A., et al. Systematic analysis of chromatin interactions at disease associated loci links novel candidate genes to inflammatory bowel disease. Genome Biology. 17 (1), 1-15 (2016).
  26. Yeung, J., et al. Transcription factor activity rhythms and tissue-specific chromatin interactions explain circadian gene expression across organs. Genome research. , 207787 (2017).

Play Video

Cite This Article
Brettmann, E. A., Oh, I. Y., de Guzman Strong, C. High-throughput Identification of Gene Regulatory Sequences Using Next-generation Sequencing of Circular Chromosome Conformation Capture (4C-seq). J. Vis. Exp. (140), e58030, doi:10.3791/58030 (2018).

View Video