We rapporteren de toepassing van kwantitatieve chromosoomconformatievangst gevolgd door high-throughput sequencing in embryoïndische lichamen gegenereerd uit embryonale stamcellen. Deze techniek maakt het mogelijk om de contacten tussen putatieve versterkers en promotorgebieden van een bepaald gen te identificeren en te kwantificeren tijdens embryonale stamceldifferentiatie.
Tijdens de ontwikkeling van zoogdieren, cel lot worden bepaald door de oprichting van regelgevende netwerken die de specificiteit, timing en ruimtelijke patronen van genexpressie te definiëren. Embryoïteielichamen (EB’s) afkomstig van pluripotente stamcellen zijn een populair model om de differentiatie van de drie belangrijkste kiemlagen te bestuderen en regulerende circuits te definiëren tijdens de specificatie van het cellot. Hoewel het bekend is dat weefselspecifieke versterkers een belangrijke rol spelen in deze netwerken door interactie met promotors, blijft het nog steeds een uitdaging om ze toe te kennen aan hun relevante doelgenen. Om dit mogelijk te maken, zijn kwantitatieve benaderingen nodig om de contacten tussen verbeterveen en hun dynamiek tijdens de ontwikkeling te bestuderen. Hier hebben we een 4C-methode aangepast om versterkers en hun contacten met cognate promotors te definiëren in het EB-differentiatiemodel. De methode maakt gebruik van vaak snijden beperking enzymen, sonicatie, en een geneste-ligatie-gemedieerde PCR protocol compatibel met commerciële DNA bibliotheek voorbereiding kits. Vervolgens worden de 4C-bibliotheken onderworpen aan high-throughput sequencing en bio-informatica geanalyseerd, waardoor detectie en kwantificering van alle sequenties die contacten hebben met een gekozen promotor. De resulterende sequencing gegevens kunnen ook worden gebruikt om informatie te verkrijgen over de dynamiek van versterker-promotor contacten tijdens differentiatie. De techniek beschreven voor het EB differentiatie model is eenvoudig te implementeren.
Bij muizen bevat de binnencelmassa (ICM) van 3,5 dagen oude embryo’s embryonale pluripotente stamcellen. De ICM ontwikkelt zich verder tot de epiblast op dag 4.5, het genereren van ectoderm, mesoderm, en endoderm cellen, de belangrijkste drie kiemlagen in het embryo. Hoewel pluripotente cellen in de ICM slechts tijdelijk in vivo bestaan, kunnen ze in cultuur worden gevangen door de oprichting van embryonale stamcellen van muizen (mESC’s)1,2,3. De mSCs blijven in een ongedifferentieerde toestand en vermenigvuldigen zich voor onbepaalde tijd, maar bij intrinsieke en extrinsieke stimuli zijn ze ook in staat om de pluripotentietoestand te verlaten en cellen van de drie ontwikkelingskiemlagen2,4tegenereren . Interessant is dat wanneer gekweekt in suspensie in kleine druppeltjes, mESC’s vormen driedimensionale aggregaten (dat wil zeggen, EBs) die zich onderscheiden in alle drie kiemlagen5. De EB-vormingstest is een belangrijk instrument om het proces van vroege afstammingsspecificatie te bestuderen.
Tijdens de afstammingsspecificatie krijgen cellen van elke kiemlaag een specifiek genexpressieprogramma4. De precieze spatiotemporale expressie van genen wordt gereguleerd door diverse cis-regulerende elementen, waaronder kernpromotors, versterkers, dempers en isolatoren6,7,8,9. Versterkers, regelgevende DNA-segmenten meestal verspreid over een paar honderd basisparen, coördineren weefsel-specifieke genexpressie8. Versterkers worden geactiveerd of tot zwijgen gebracht door binding van transcriptiefactoren en cofactoren die de lokale chromatinestructuur8,10reguleren . Veelgebruikte technieken om putatieve versterkers te identificeren zijn genoombrede chromatineimmunoneerslag, gevolgd door sequencing (ChIP-seq) en de test voor transposase-toegankelijke chromatine met behulp van sequencing (ATAC-seq) technieken. Zo worden actieve versterkers gekenmerkt door specifieke actieve histone-tekens en door verhoogde lokale DNA-toegankelijkheid11,12,13,14. Bovendien, ontwikkelingsbevorderende versterkers worden verondersteld om fysieke interactie met hun cognate promotor8,9. Inderdaad, het is aangetoond dat enhancer varianten en schrappingen die verstoren versterker-promotor contacten kan leiden tot ontwikkelingsmisvormingen15. Daarom is er behoefte aan nieuwe technieken die aanvullende informatie bieden voor de identificatie van functionele versterkers die ontwikkelingsgenexpressie controleren.
Sinds de ontwikkeling van de chromosoombevleesing (3C) techniek16, is het in kaart brengen van chromosomale contacten intensief gebruikt om de fysieke afstand tussen regelgevende elementen te beoordelen. Belangrijk is dat er onlangs varianten van 3C-technieken met een hoge doorvoer zijn ontwikkeld, die verschillende strategieën bieden voor fixatie, spijsvertering, ligatie en herstel van contacten tussen chromatinefragmenten17. Onder hen, in situ Hi-C is uitgegroeid tot een populaire techniek waardoor de volgorde van 3C ligatieproducten genoom-brede18. De hoge sequencingkosten die nodig zijn om tot een oplossing te komen die geschikt is voor de analyse van contacten tussen de versterker-promotoren, maken deze techniek echter onpraktisch voor de studie van specifieke loci. Daarom werden alternatieve methoden ontwikkeld om gerichte loci te analyseren bij hogere resolutie19,20,21,22. Een van deze methoden, namelijk 4C, bekend als een een versus alle strategie, maakt detectie van alle sequenties die contact opnemen met een site geselecteerd als gezichtspunt. Echter, een nadeel van de standaard 4C-techniek is de omgekeerde PCR vereist, die verschillende grootte fragmenten versterkt, ten gunste van kleine producten en biasing kwantificering na high-throughput sequencing. Onlangs is UMI-4C, een nieuwe variant van de 4C-techniek met behulp van unieke moleculaire identificatiemiddelen (UMI) ontwikkeld voor kwantitatieve en gerichte chromosomale contactprofilering die dit probleem omzeilt23. Deze benadering maakt gebruik van frequente snijders, sonicatie, en een geneste-ligatie-gemedieerde PCR-protocol, waarbij versterking van DNA-fragmenten met relatief uniforme lengte verdeling. Deze homogeniteit vermindert vooroordelen in het versterkingsproces van PCR-voorkeuren voor kortere sequenties en maakt efficiënt herstel en nauwkeurige telling van ruimtelijk verbonden moleculen/fragmenten mogelijk.
Hier beschrijven we een protocol dat de UMI-4C-techniek aanpast om chromatinecontacten tussen promotors en versterkers van lineage-leerzame transcriptiefactoren tijdens EB-differentiatie te identificeren en te kwantificeren.
De hangdropcultuurmethode heeft geen extra groeifactoren of cytokines nodig en genereert reproduceerde homogene populaties VAN EB’s uit een vooraf bepaald aantal mESCs5. Hier beschrijven we een protocol van kwantitatieve 4C aangepast aan de UMI-4C aanpak om versterker-promotor contact van lijnspecifieke transcriptiefactoren in het EB differentiatiemodel te kwantificeren. We identificeerden chromatineregio’s die tijdens EB-differentiatie op dynamische wijze contact opnemen met promotors van Pou5f1- en T-genen. Pou5f1 werd gedownreguleerd tijdens EB differentiatie en de contactfrequentie tussen de Pou5f1 promotor en zijn distale versterker verminderde. Omgekeerd werd T tijdens EB-differentiatie upregulated en hebben we drie versterkers geïdentificeerd waarvoor de contactfrequenties met hun promotor zijn afgenomen (Figuur 3). Om de identificatie te bevestigen, kan een chromatine immunoprecipitatie (ChIP) test van actieve histone merk H3K27ac worden uitgevoerd24, omdat dit histone merk is aangetoond dat geassocieerd met versterker activering en versterkers verliezen dit merk tijdens hun inactivatie11.
Een standaard 4C techniek is op grote schaal gebruikt om het chromatine contactprofiel van specifieke genomische sites te onderzoeken25. Deze benadering is echter moeilijk kwantitatief te interpreteren, zelfs na uitgebreide normalisatie26,27,28 vanwege de vooroordelen die worden geïntroduceerd door de heterogeniteit van pcr-fragmentatiegrootte en de onmogelijkheid om PCR-duplicaten te onderscheiden. Onze kwantitatieve 4C-methode is grotendeels identiek aan de UMI-4C-techniek die het mogelijk maakt de kwantificering van enkele moleculen met behulp van sonicatie en een geneste-ligatie-gemedieerde PCR-stap om de beperking van de klassieke 4C-aanpak te omzeilen23. Echter, in tegenstelling tot de UMI-4C die gebruik maakt van unieke moleculaire identificatiemiddelen, ons kwantitatieve 4C-protocol maakt de kwantificering van enkele moleculen op basis van de specifieke DNA-breuk geproduceerd door de sonicatie stap. Het maakt ons protocol compatibel met commerciële DNA-bibliotheek voorbereidingkits, waardoor de behoefte aan primers met unieke moleculaire identificatiemiddelen wordt voorkomen.
Ons protocol omvat een aantal belangrijke stappen die moeten worden overwogen. Net als bij de klassieke 4C-methode28zijn kritische factoren van ons protocol de efficiëntie van de spijsvertering en de ligatie tijdens de voorbereiding van de 3C-moleculen. Lage spijsvertering/ligatie-efficiëntie kan de complexiteit van de interactie met een fragment van belang drastisch verminderen, wat resulteert in een verminderde resolutie. Zoals eerder beschreven23, een andere kritische stap van het protocol is het ontwerp van de primers voor de bibliotheek versterking. De tweede PCR reactie primers moeten worden gevestigd 5-15 nt van de ondervraagde beperking site. In een 75 nt sequencing lezen, dit zorgt voor ten minste 40 nt links van de capture lengte voor mapping. De primer die in de eerste PCR-reactie wordt gebruikt, moet stroomopwaarts van de tweede primer worden ontworpen zonder overlap en beide moeten specifiek genoeg zijn om een efficiënte DNA-versterking te garanderen. Voor multiplexing moeten primers onafhankelijk worden ontworpen, met als doel een smelttemperatuur (Tm)van 60-65 °C. Bovendien wordt, net als voor andere 3C-technieken, de resolutie van de kwantitatieve 4C-methode bepaald door het beperkingsenzym dat in protocol25wordt gebruikt . Dit protocol maakt gebruik van een beperking enzym met een 4 bp erkenning site, MboI. De maximale resolutie met dit enzym is ongeveer 500 bp, maar dit is zeer locus afhankelijk en zelden bereikt. Een andere beperking is dat interacties die optreden tussen elementen in hetzelfde beperkingsfragment niet detecteerbaar zijn. Bovendien kunnen interacties die zich op een afstand van één beperkingsplaats voordoen, niet worden onderscheiden van de onverteerde achtergrond. Het gebruik van een invulstap voorafgaand aan de ligatie kan de detectie van deze interacties mogelijk maken.
Kwantitatieve 4C is bij uitstek geschikt om chromatine contacten van gerichte loci te ondervragen. De specifieke PCR-versterkingsstap beperkt echter het aantal loci dat tegelijkertijd kan worden onderzocht. Een manier om het aantal gerichte loci te verhogen is om multiplex de PCR stappen om tegelijkertijd te versterken verschillende doelen, maar dit vereist compatibiliteit van de gebruikte primers en het testen van elk primer paar voorafgaand aan de implementatie. Als globale veranderingen van chromatine architectuur bij promotors gewenst zijn, genoom-brede benaderingen zoals Hi-C, PC Hi-C, of HiChIP zou meer geschikt29,30,31.
The authors have nothing to disclose.
We willen F. Le Dily, R. Stadhouders en leden van het Graf laboratorium bedanken voor hun advies en discussies. G.S. werd ondersteund door een Marie Sklodowska-Curie fellowship (H2020-MSCA-IF-2016, miRStem), T.V.T. door een Juan de la Cierva postdoctoralfellowship (MINECO, FJCI-2014-22946). Dit werk werd ondersteund door de Europese Onderzoeksraad in het kader van het7e Kaderprogramma FP7 (ERC Synergy Grant 4D-Genome, grant agreement 609989 to T.G.), het Spaanse ministerie van Economie, Industrie en Concurrentievermogen (MEIC) aan het EMBL-partnerschap, Centro de Excelencia Severo Ochoa 2013-2017 en CERCA Program Generalitat de Catalunya.
0.1% EmbryoMax gelatin | EMD Millipore | ES-006-B | Cell culture |
0.25% Trypsin-EDTA | 25200072 | ||
AMPure XP | Beckman Coulter | 10136224 | 4C/DNA purification |
B27 supplement | Gibco | 17504044 | Cell culture |
Beta-mercaptoethanol | Gibco | 31350010 | Cell culture |
Bioruptor Pico | Diagencode | B01060010 | 4C/sonication |
BSA | NEB | B9000S | 4C |
CHIR99021 | Selleck Chemicals | S1263 | Cell culture |
CIP | NEB | M0212 | 4C |
cOmplete Protease Inhibitor Cocktail | Roche | 4693116001 | 4C |
DMEM/F12 medium | Gibco | 11320033 | Cell culture |
dNTP | NEB | N0447S | 4C |
ESGRO Leukaemia Inhibitory Factor (LIF) | EMD Millipore | ESG1107 | Cell culture |
Formaldehyde solution (37%) | Sigma | 252549-25ML | 4C |
Glycin | Sigma | GE17-1323-01 | 4C |
Glycogen | ThermoFischer | R0551 | 4C |
Herculase II Fusion DNA polymerase | Agilent | 600675 | 4C |
IGEPAL CA-630 | Sigma | I3021-50ML | 4C |
Knockout DMEM | 10829018 | ||
L-glutamine | Gibco | 25030081 | Cell culture |
MboI | NEB | R0147M | 4C |
MEM non-essential amino acids | Gibco | 11140050 | Cell culture |
N2 supplement | Gibco | A1370701 | Cell culture |
NEBNext DNA Library prep | NEB | E6040 | 4C |
NEBuffer 2.1 | NEB | B7202S | 4C/digestion |
Neurobasal medium | Gibco | 21103049 | Cell culture |
PD0325901 | Selleck Chemicals | S1036 | Cell culture |
Penicillin Streptomycin | Gibco | 15140122 | Cell culture |
Proteinase K | NEB | P8107S | 4C |
Qubit 4 Fluorometer | ThermoFischer | Q33238 | 4C |
Qubit dsDNA HS Assay Kit | ThermoFischer | Q32851 | 4C |
RNase A | ThermoFischer | EN0531 | 4C |
Sodium pyruvate solution | Gibco | 11360070 | Cell culture |
StemPro Accutase Cell Dissociation Reagent | Gibco | A1110501 | Cell culture |
T4 DNA Ligase Reaction Buffer | NEB | B0202S | 4C |
T4 DNA Ligase Reaction Buffer | NEB | M0202M | 4C |