Wir berichten über die Anwendung der quantitativen Chromosomenkonformationsaufnahme, gefolgt von einer Hochdurchsatzsequenzierung in embryonalen Körpern, die aus embryonalen Stammzellen erzeugt werden. Diese Technik ermöglicht es, die Kontakte zwischen vermeintlichen Enhancern und Promotorregionen eines bestimmten Gens während der embryonalen Stammzelldifferenzierung zu identifizieren und zu quantitieren.
Während der Entwicklung von Säugetieren werden Zellschicksale durch den Aufbau von regulatorischen Netzwerken bestimmt, die die Spezifität, den Zeitpunkt und die räumlichen Muster der Genexpression definieren. Embryoide Körper (EBs), die aus pluripotenten Stammzellen gewonnen wurden, waren ein beliebtes Modell, um die Differenzierung der drei wichtigsten Keimschichten zu untersuchen und regulatorische Schaltkreise während der Zellschicksalsspezifikation zu definieren. Obwohl bekannt ist, dass gewebespezifische Enhancer in diesen Netzwerken eine wichtige Rolle spielen, indem sie mit Promotoren interagieren, bleibt die Zuordnung zu ihren relevanten Zielgenen eine Herausforderung. Um dies zu ermöglichen, sind quantitative Ansätze erforderlich, um Kontakte zwischen Enhancer und Promoter und deren Dynamik während der Entwicklung zu untersuchen. Hier haben wir eine 4C-Methode angepasst, um Enhancer und deren Kontakte mit Cognate-Promotern im EB-Differenzierungsmodell zu definieren. Die Methode verwendet häufig Schneiden Vonrestriktionsenzyme, Beschallung und ein verschachteltes Ligations-vermitteltes PCR-Protokoll, das mit kommerziellen DNA-Bibliotheksvorbereitungskits kompatibel ist. Anschließend werden die 4C-Bibliotheken einer Hochdurchsatzsequenzierung unterzogen und bioinformatisch analysiert, was die Erkennung und Quantifizierung aller Sequenzen ermöglicht, die Kontakte zu einem ausgewählten Promotor haben. Die resultierenden Sequenzierungsdaten können auch verwendet werden, um Informationen über die Dynamik von Enhancer-Promoter-Kontakten während der Differenzierung zu erhalten. Die für das EB-Differenzierungsmodell beschriebene Technik ist einfach zu implementieren.
Bei Mäusen enthält die innere Zellmasse (ICM) von 3,5 Tage alten Embryonen embryonale pluripotente Stammzellen. Das ICM entwickelt sich an Tag 4.5 weiter zum Epiblast und erzeugt Ektoderm-, Mesoderm- und Endodermzellen, die drei wichtigsten Keimschichten im Embryo. Obwohl pluripotente Zellen im ICM nur vorübergehend in vivo existieren, können sie in der Kultur durch die Etablierung von mausembryonalen Stammzellen (mESCs)1,2,3erfasst werden. Die mESCs bleiben in einem undifferenzierten Zustand und vermehren sich auf unbestimmte Zeit, aber bei intrinsischen und extrinsischen Reizen sind sie auch in der Lage, den Pluripotenzzustand zu verlassen und Zellen der drei Entwicklungskeimschichten2,4zu erzeugen. Interessanterweise bilden mESCs, wenn sie in Suspension in kleinen Tröpfchen kultiviert werden, dreidimensionale Aggregate (d.h. EBs), die sich in alle drei Keimschichten differenzieren5. Der EB-Formationstest ist ein wichtiges Werkzeug, um den frühen Linienspezifikationsprozess zu untersuchen.
Während der Abstammungsspezifikation erhalten Zellen jeder Keimschicht ein spezifisches Genexpressionsprogramm4. Die präzise räumlich-zeitliche Expression von Genen wird durch verschiedene cis-regulatorische Elemente reguliert, einschließlich Kernpromotoren, Enhancer, Schalldämpfer und Isolatoren6,7,8,9. Enhancer, regulatorische DNA-Segmente, die sich typischerweise über ein paar hundert Basenpaare erstrecken, koordinieren die gewebespezifische Genexpression8. Enhancer werden durch Bindung von Transkriptionsfaktoren und Kofaktoren, die die8lokale Chromatinstruktur regulieren 8,10, aktiviert oder zum Schweigen gebracht. Häufig verwendete Techniken zur Identifizierung vermeintlicher Enhancer sind genomweite Chromatin-Immunpräzipitation, gefolgt von Sequenzierung (ChIP-seq) und dem Assay für transposase-zugängliches Chromatin mit Sequenzierungstechniken (ATAC-seq). So zeichnen sich aktive Enhancer durch spezifische aktive Histonmarkierungen und durch erhöhte lokale DNA-Zugänglichkeit11,12,13,14aus. Darüber hinaus wird angenommen, dass Entwicklungsförderer physische Interaktion mit ihrem Kognatenpromotor8,9erfordern. In der Tat hat sich gezeigt, dass Enhancer-Varianten und Löschungen, die Enhancer-Promoter-Kontakte stören, zu Entwicklungsfehlbildungen führen können15. Daher sind neuartige Techniken erforderlich, die zusätzliche Informationen für die Identifizierung funktioneller Enhancer liefern, die die Entwicklung der Genexpression steuern.
Seit der Entwicklung der Chromosomenkonformationsaufnahme (3C) Technik16wird die Kartierung von Chromosomenkontakten intensiv genutzt, um den physikalischen Abstand zwischen regulatorischen Elementen zu bewerten. Wichtig ist, dass vor kurzem Hochdurchsatzvarianten von 3C-Techniken entwickelt wurden, die verschiedene Strategien für die Fixierung, Verdauung, Ligation und Wiederherstellung von Kontakten zwischen Chromatinfragmenten17bieten. Unter ihnen, in situ Hi-C hat sich zu einer beliebten Technik ermöglicht die Sequenzierung von 3C Ligation Produkte genom-wide18. Die hohen Sequenzierungskosten, die erforderlich sind, um eine Fürdengeeignete Lösung für die Analyse von Enhancer-Promoter-Kontakten zu erreichen, machen diese Technik jedoch für die Untersuchung bestimmter Loci unpraktisch. Daher wurden alternative Methoden entwickelt, um gezielte Loci mit höherer Auflösung19,20,21,22zu analysieren. Eine dieser Methoden, nämlich 4C, bekannt als eine gegen alle Strategie, ermöglicht die Erkennung aller Sequenzen, die eine Website kontaktieren, die als Ansichtspunkt ausgewählt wurde. Ein Nachteil der Standard-4C-Technik ist jedoch die erforderliche inverse PCR, die Fragmente unterschiedlich großer Größe verstärkt, kleine Produkte begünstigt und die Quantifizierung nach Hochdurchsatzsequenzierung verzerrt. Kürzlich wurde UMI-4C, eine neue Variante der 4C-Technik mit einzigartigen molekularen Identifikatoren (UMI) für quantitative und gezielte chromosomale Kontaktprofilierung entwickelt, die dieses Problem umgeht23. Dieser Ansatz verwendet vielschneider, Beschallung und ein verschachteltes, ligationsvermitteltes PCR-Protokoll, wodurch DNA-Fragmente mit relativ gleichmäßiger Längenverteilung verstärkt werden. Diese Homogenität reduziert Verzerrungen im Amplifikationsprozess von PCR-Präferenzen für kürzere Sequenzen und ermöglicht eine effiziente Rückgewinnung und genaue Zählung räumlich verbundener Moleküle/Fragmente.
Hier beschreiben wir ein Protokoll, das die UMI-4C-Technik anpasst, um Chromatinkontakte zwischen Promotoren und Enhancer von lineage instruktiven Transkriptionsfaktoren während der EB-Differenzierung zu identifizieren und zu quantifizieren.
Die Hangtropfenkulturmethode benötigt keine zusätzlichen Wachstumsfaktoren oder Zytokine und erzeugt reproduzesstlich homogene Populationen von EBs aus einer vorgegebenen Anzahl von mESCs5. Hier beschreiben wir ein Protokoll von quantitativem 4C, das vom UMI-4C-Ansatz angepasst wurde, um den Enhancer-Promoter-Kontakt von linienspezifischen Transkriptionsfaktoren im EB-Differenzierungsmodell zu quantifizieren. Wir identifizierten Chromatinregionen, die während der EB-Differenzierung dynamisch mit Promotern von Pou5f1- und T-Genen in Kontakt treten. Pou5f1 wurde während der EB-Differenzierung herunterreguliert und die Kontaktfrequenz zwischen dem Pou5f1-Promoter und seinem distalen Enhancer verringert. Umgekehrt wurde T während der EB-Differenzierung hochreguliert und wir identifizierten drei Enhancer, bei denen die Kontaktfrequenzen mit ihrem Promotor verringert werden (Abbildung 3). Zur Bestätigung der Identifizierung kann ein Chromatin-Immunpräzipitationstest (ChIP) des aktiven Histonzeichens H3K27ac24durchgeführt werden, da sich gezeigt hat, dass diese Histonmarke mit Enhancer-Aktivierung in Verbindung gebracht wird und Enhancer diese Marke während ihrer Inaktivierung verlieren11.
Eine Standard-4C-Technik wurde ausgiebig verwendet, um das Chromatin-Kontaktprofil bestimmter genomischer Standorte zu untersuchen25. Dieser Ansatz ist jedoch auch nach extensiver Normalisierung quantitativ schwer zu interpretieren26,27,28, da die Heterogenität der PCR-Fragmentgröße und die Unmöglichkeit, PCR-Duplikate zu unterscheiden, mit Verzerrungen einhergehen. Unsere quantitative 4C-Methode ist weitgehend identisch mit der UMI-4C-Technik, die die Quantifizierung einzelner Moleküle mittels Beschallung und einem verschachtelten Ligations-vermittelten PCR-Schritt ermöglicht, um die Begrenzung des klassischen 4C-Ansatzes zu umgehen23. Im Gegensatz zum UMI-4C, der eindeutige molekulare Identifikatoren verwendet, ermöglicht unser quantitatives 4C-Protokoll jedoch die Quantifizierung einzelner Moleküle auf der Grundlage des spezifischen DNA-Bruchs, der durch den Beschallungsschritt erzeugt wird. Es macht unser Protokoll kompatibel mit kommerziellen DNA-Bibliothek Vorbereitung Kits, die Notwendigkeit von Primern mit einzigartigen molekularen Identifikatoren zu machen.
Unser Protokoll umfasst mehrere wichtige Schritte, die in Betracht gezogen werden sollten. Wie bei der klassischen 4C-Methode28sind kritische Faktoren unseres Protokolls die Effizienz der Verdauung und der Ligation bei der Herstellung der 3C-Moleküle. Niedrige Effizienzderdungen bei der Verdauung/Ligation können die Komplexität der Interaktion mit einem Fragment von Interesse drastisch verringern, was zu einer reduzierten Auflösung führt. Wie bereits beschrieben23, ist ein weiterer kritischer Schritt des Protokolls das Design der Primer für die Bibliotheksverstärkung. Die zweite PCR-Reaktionsgrundierung sollte 5-15 nt von der abgefragten Restriktionsstelle entfernt sein. Bei einer 75 nt-Sequenzierung ermöglicht dies mindestens 40 nt links der Erfassungslänge für die Zuordnung. Die in der ersten PCR-Reaktion verwendete Grundierung sollte vor der zweiten Grundierung ohne Überlappung ausgelegt sein und beide sollten spezifisch genug sein, um eine effiziente DNA-Verstärkung zu gewährleisten. Für Multiplexing sollten Primer unabhängig ausgelegt werden, die auf eine Schmelztemperatur (Tm) von 60-65 °C abzielen. Darüber hinaus wird, wie bei anderen 3C-Techniken, die Auflösung der quantitativen 4C-Methode durch das im Protokoll25verwendete Restriktionsenzym bestimmt. Dieses Protokoll verwendet ein Restriktionsenzym mit einer 4 bp Erkennungsstelle, MboI. Die maximale Auflösung mit diesem Enzym ist etwa 500 bp, aber dies ist stark Lok-abhängig und selten erreicht. Eine weitere Einschränkung besteht darin, dass Interaktionen, die zwischen Elementen im gleichen Einschränkungsfragment auftreten, nicht nachweisbar sind. Darüber hinaus können Interaktionen, die in einem Abstand von einer Einschränkungsstelle auftreten, nicht vom unverdauten Hintergrund unterschieden werden. Die Verwendung eines Einfüllschritts vor der Ligation kann die Erkennung dieser Wechselwirkungen ermöglichen.
Quantitative 4C ist ideal geeignet, um Chromatinkontakte von gezielten Loci abzuhören. Der spezifische PCR-Verstärkungsschritt begrenzt jedoch die Anzahl der Loci, die gleichzeitig untersucht werden können. Eine Möglichkeit, die Anzahl der Ziel-Loci zu erhöhen, besteht darin, die PCR-Schritte zu multiplen, um mehrere Ziele gleichzeitig zu verstärken, aber dies erfordert kompatibilität der verwendeten Primer und das Testen jedes Primer-Paares vor der Implementierung. Wenn globale Änderungen der Chromatinarchitektur bei Promotoren gewünscht werden, wären genomweite Ansätze wie Hi-C, PC Hi-C oder HiChIP besser geeignet29,30,31.
The authors have nothing to disclose.
Wir danken F. Le Dily, R. Stadhouders und Mitgliedern des Graf-Labors für ihre Beratung und Diskussionen. G.S. wurde von einem Marie Sklodowska-Curie-Stipendium (H2020-MSCA-IF-2016, miRStem), T.V.T, von einem Juan de la Cierva Postdoktorandenstipendium (MINECO, FJCI-2014-22946) unterstützt. Diese Arbeit wurde vom Europäischen Forschungsrat im Rahmen des7. Rahmenprogramms RP7 (ERC Synergy Grant 4D-Genome, Grant Agreement 609989 an T.G.), dem spanischen Ministerium für Wirtschaft, Industrie und Wettbewerbsfähigkeit (MEIC) an die EMBL-Partnerschaft Centro de Excelencia Severo Ochoa 2013-2017 und CERCA Program Generalitat de Catalunya unterstützt.
0.1% EmbryoMax gelatin | EMD Millipore | ES-006-B | Cell culture |
0.25% Trypsin-EDTA | 25200072 | ||
AMPure XP | Beckman Coulter | 10136224 | 4C/DNA purification |
B27 supplement | Gibco | 17504044 | Cell culture |
Beta-mercaptoethanol | Gibco | 31350010 | Cell culture |
Bioruptor Pico | Diagencode | B01060010 | 4C/sonication |
BSA | NEB | B9000S | 4C |
CHIR99021 | Selleck Chemicals | S1263 | Cell culture |
CIP | NEB | M0212 | 4C |
cOmplete Protease Inhibitor Cocktail | Roche | 4693116001 | 4C |
DMEM/F12 medium | Gibco | 11320033 | Cell culture |
dNTP | NEB | N0447S | 4C |
ESGRO Leukaemia Inhibitory Factor (LIF) | EMD Millipore | ESG1107 | Cell culture |
Formaldehyde solution (37%) | Sigma | 252549-25ML | 4C |
Glycin | Sigma | GE17-1323-01 | 4C |
Glycogen | ThermoFischer | R0551 | 4C |
Herculase II Fusion DNA polymerase | Agilent | 600675 | 4C |
IGEPAL CA-630 | Sigma | I3021-50ML | 4C |
Knockout DMEM | 10829018 | ||
L-glutamine | Gibco | 25030081 | Cell culture |
MboI | NEB | R0147M | 4C |
MEM non-essential amino acids | Gibco | 11140050 | Cell culture |
N2 supplement | Gibco | A1370701 | Cell culture |
NEBNext DNA Library prep | NEB | E6040 | 4C |
NEBuffer 2.1 | NEB | B7202S | 4C/digestion |
Neurobasal medium | Gibco | 21103049 | Cell culture |
PD0325901 | Selleck Chemicals | S1036 | Cell culture |
Penicillin Streptomycin | Gibco | 15140122 | Cell culture |
Proteinase K | NEB | P8107S | 4C |
Qubit 4 Fluorometer | ThermoFischer | Q33238 | 4C |
Qubit dsDNA HS Assay Kit | ThermoFischer | Q32851 | 4C |
RNase A | ThermoFischer | EN0531 | 4C |
Sodium pyruvate solution | Gibco | 11360070 | Cell culture |
StemPro Accutase Cell Dissociation Reagent | Gibco | A1110501 | Cell culture |
T4 DNA Ligase Reaction Buffer | NEB | B0202S | 4C |
T4 DNA Ligase Reaction Buffer | NEB | M0202M | 4C |