Nous rapportons l’application de la capture quantitative de conformation de chromosome suivie du séquençage à haut débit dans les corps embryonnaires générés par les cellules souches embryonnaires. Cette technique permet d’identifier et de quantifier les contacts entre les exhausteurs putatifs et les régions promoteurs d’un gène donné lors de la différenciation des cellules souches embryonnaires.
Pendant le développement des mammifères, les destins cellulaires sont déterminés par l’établissement de réseaux de réglementation qui définissent la spécificité, le moment et les modèles spatiaux de l’expression des gènes. Les corps embryonnaires (EB) dérivés des cellules souches pluripotentes ont été un modèle populaire pour étudier la différenciation des trois principales couches germinales et pour définir les circuits réglementaires pendant la spécification du destin cellulaire. Bien qu’il soit bien connu que les exhausteurs spécifiques aux tissus jouent un rôle important dans ces réseaux en interagissant avec les promoteurs, leur attribution à leurs gènes cibles pertinents demeure difficile. Pour ce faire, des approches quantitatives sont nécessaires pour étudier les contacts enhancer-promoteur et leur dynamique pendant le développement. Ici, nous avons adapté une méthode 4C pour définir les exhausteurs et leurs contacts avec les promoteurs cognate dans le modèle de différenciation EB. La méthode utilise fréquemment des enzymes de restriction de coupe, la sonication, et un protocole PCR imbriqué-négocié compatible avec les kits commerciaux de préparation de bibliothèque d’ADN. Par la suite, les bibliothèques 4C sont soumises à un séquençage à haut débit et analysées bioinformatement, permettant la détection et la quantification de toutes les séquences qui ont des contacts avec un promoteur choisi. Les données de séquençage qui en résultent peuvent également être utilisées pour obtenir des informations sur la dynamique des contacts enhancer-promoteur lors de la différenciation. La technique décrite pour le modèle de différenciation EB est facile à mettre en œuvre.
Chez la souris, la masse des cellules internes (ICM) d’embryons de 3,5 jours contient des cellules souches pluripotentes embryonnaires. L’ICM se développe également dans l’épiblaste au jour 4.5, générant des cellules d’ectoderm, de mésoderm, et d’endoderm, les trois principales couches de germes dans l’embryon. Bien que les cellules pluripotentes dans l’ICM n’existent que de façon transitoire in vivo, elles peuvent être capturées en culture par l’établissement de cellules souches embryonnaires de souris (MESC)1,2,3. Les MESC restent dans un état indiffélant et prolifèrent indéfiniment, mais sur des stimuli intrinsèques et extrinsèques, ils sont également capables de sortir de l’état de pluripotence et de générer des cellules des trois couches germinales développementales2,4. Fait intéressant, lorsqu’ils sont cultivés en suspension dans de petites gouttelettes, les MESC forment des agrégats tridimensionnels (c.-à-d., EB) qui se différencient en trois couches germinales5. L’essai de formation EB est un outil important pour étudier le processus de spécification de lignée précoce.
Pendant la spécification de lignée, les cellules de chaque couche germinale acquièrent un programme spécifique d’expression génique4. L’expression spatiotemporal précise des gènes est réglementée par divers éléments de réglementation cis-, y compris les promoteurs de base, exhausteurs, silencieux, et isolants6,7,8,9. Enhancers, segments d’ADN réglementaires couvrant généralement quelques centaines de paires de base, coordonnent l’expression génétique tissulaire8. Les exhausteurs sont activés ou réduits au silence par la liaison des facteurs de transcription et des cofacteurs qui régulent la structure locale de chromatine8,10. Les techniques couramment utilisées pour identifier les exhausteurs putatifs sont l’immunoprécipitation de chromatine à l’échelle du génome suivie du séquençage (ChIP-seq) et de l’essai pour la chromatine accessible à la transposase à l’aide de techniques de séquençage (ATAC-seq). Ainsi, les exhausteurs actifs sont caractérisés par des marques d’histone actives spécifiques et par l’accessibilité accrue de l’ADN local11,12,13,14. En outre, les exhausteurs de développement sont censés exiger une interaction physique avec leur promoteur cognate8,9. En effet, il a été démontré que les variantes et les suppressions d’exhausteurs qui perturbent les contacts enhancer-promoteur peuvent conduire à des malformations développementales15. Par conséquent, il est nécessaire de nouvelles techniques qui fournissent des informations supplémentaires pour l’identification des exhausteurs fonctionnels qui contrôlent l’expression des gènes du développement.
Depuis le développement de la technique de capture de conformation chromosomique (3C)16, la cartographie des contacts chromosomiques a été intensivement utilisée pour évaluer la distance physique entre les éléments réglementaires. Fait important, des variantes à haut débit de techniques 3C ont récemment été développées, fournissant différentes stratégies pour la fixation, la digestion, la ligature, et la récupération des contacts entre les fragments de chromatine17. Parmi eux, in situ Hi-C est devenu une technique populaire permettant le séquençage des produits de ligature 3C à l’échelle du génome18. Cependant, les coûts élevés de séquençage requis pour parvenir à une résolution adaptée à l’analyse des contacts enhancer-promoteur rendent cette technique peu pratique pour l’étude de loci spécifiques. Par conséquent, d’autres méthodes ont été développées pour analyser les loci ciblés à la résolutionsupérieure 19,20,21,22. L’une de ces méthodes, à savoir 4C, connue sous le nom de stratégie un contre tous, permet de détecter toutes les séquences qui contactent un site choisi comme point de vue. Cependant, un inconvénient de la technique standard 4C est le PCR inverse requis, qui amplifie des fragments de taille différente, favorisant les petits produits et la quantification biaisée après le séquençage à haut débit. Récemment, UMI-4C, une nouvelle variante de la technique 4C à l’aide d’identificateurs moléculaires uniques (UMI) a été développé pour le profilage de contact chromosomique quantitatif et ciblé qui contourne ce problème23. Cette approche utilise des coupeurs fréquents, une sonication et un protocole PCR imbriqué, impliquant ainsi l’amplification de fragments d’ADN avec une répartition de longueur relativement uniforme. Cette homogénéité réduit les biais dans le processus d’amplification des préférences PCR pour des séquences plus courtes et permet une récupération efficace et un comptage précis des molécules/fragments connectés à l’espace.
Ici, nous décrivons un protocole qui adapte la technique UMI-4C pour identifier et quantifier les contacts de chromatine entre les promoteurs et les exhausteurs des facteurs de transcription instructifs de lignée pendant la différenciation d’EB.
La méthode de culture de la chute suspendue n’a pas besoin de facteurs de croissance ou de cytokines supplémentaires et génère de façon reproductible des populations homogènes d’EB à partir d’un nombre prédéterminé de MESCs5. Ici, nous décrivons un protocole de 4C quantitatif adapté de l’approche UMI-4C pour quantifier le contact enhancer-promoteur des facteurs de transcription spécifiques de lignée dans le modèle de différenciation EB. Nous avons identifié des régions de chromatine qui contactent les promoteurs des gènes Pou5f1 et T d’une manière dynamique pendant la différenciation EB. Pou5f1 a été réduit pendant la différenciation EB et la fréquence de contact entre le promoteur Pou5f1 et son exhausteur distal a diminué. Inversement, T a été régulé pendant la différenciation EB et nous avons identifié trois exhausteurs pour lesquels les fréquences de contact avec leur promoteur sont diminuées(figure 3). Pour confirmer l’identification, un essai d’immunoprécipitation de chromatine (ChIP) de marque d’histone active H3K27ac peut être effectué24, comme cette marque d’histone a été montré pour être associé à l’activation de l’exhausteur et les exhausteurs perdent cette marque au cours de leur inactivation11.
Une technique standard 4C a été largement utilisée pour étudier le profil de contact chromatine de sites génomiques spécifiques25. Cependant, cette approche est difficile à interpréter quantitativement même après une normalisation étendue26,27,28 en raison des biais introduits par l’hétérogénéité de la taille du fragment de PCR et l’impossibilité de distinguer les doublons de PCR. Notre méthode quantitative 4C est en grande partie identique à la technique UMI-4C qui permet la quantification de molécules uniques à l’aide de la sonication et d’une étape PCR imbriquée-ligation-négociée pour contourner la limitation de l’approche 4C classique23. Cependant, contrairement à l’UMI-4C qui utilise des identificateurs moléculaires uniques, notre protocole quantitatif 4C permet la quantification de molécules uniques en fonction de la rupture spécifique de l’ADN produite par l’étape de sonication. Il rend notre protocole compatible avec les kits commerciaux de préparation de bibliothèque d’ADN, en respectant le besoin d’amorce avec des identificateurs moléculaires uniques.
Notre protocole comporte plusieurs étapes clés qui devraient être prises en considération. Comme dans la méthode 4C classique28, les facteurs critiques de notre protocole sont l’efficacité de la digestion et la ligature lors de la préparation des molécules 3C. Une faible efficacité de digestion/ligation peut réduire considérablement la complexité de l’interaction avec un fragment d’intérêt, ce qui entraîne une résolution réduite. Comme décrit précédemment23, une autre étape critique du protocole est la conception des amorces pour l’amplification de la bibliothèque. Les deuxièmes amorces de réaction PCR doivent être situées de 5 à 15 nt à partir du site de restriction interrogé. Dans une lecture de séquençage de 75 nt, cela permet au moins 40 nt gauche de la longueur de capture pour la cartographie. L’apprêt utilisé dans la première réaction PCR doit être conçu en amont de la deuxième amorce sans chevauchement et les deux devraient être suffisamment spécifiques pour assurer une amplification efficace de l’ADN. Pour le multiplexe, les amorces doivent être conçues indépendamment, en visant une température de fonte (Tm)de 60-65 oC. En outre, comme pour les autres techniques 3C, la résolution de la méthode quantitative 4C est déterminée par l’enzyme de restriction utilisée dans le protocole25. Ce protocole utilise une enzyme de restriction avec un site de reconnaissance de 4 bp, MboI. La résolution maximale avec cette enzyme est d’environ 500 bp, mais c’est très locus dépendant et rarement atteint. Une autre limitation est que les interactions qui se produisent entre les éléments situés dans le même fragment de restriction ne sont pas détectables. En outre, les interactions se produisant à une distance d’un site de restriction ne peuvent pas être distinguées de l’arrière-plan non digéré. L’utilisation d’une étape de remplissage avant la ligature pourrait permettre la détection de ces interactions.
Quantitative 4C est idéalement adapté pour interroger les contacts en chromatine des loci ciblés. Cependant, l’étape spécifique d’amplification de PCR limite le nombre de loci qui peuvent être étudiés simultanément. Une façon d’augmenter le nombre de loci ciblés est de multiplex les étapes PCR pour amplifier simultanément plusieurs cibles, mais cela nécessite la compatibilité des amorces utilisées et de tester chaque paire d’amorce avant la mise en œuvre. Si l’on souhaite des changements globaux de l’architecture de chromatine chez les promoteurs, des approches à l’échelle du génome telles que Hi-C, PC Hi-C ou HiChIP seraient plus appropriées29,30,31.
The authors have nothing to disclose.
Nous tenons à remercier F. Le Dily, R. Stadhouders et les membres du laboratoire Graf pour leurs conseils et leurs discussions. G.S. a été soutenu par une bourse Marie Sklodowska-Curie (H2020-MSCA-IF-2016, miRStem), T.V.T par une bourse postdoctorale Juan de la Cierva (MINECO, FJCI-2014-22946). Ces travaux ont été soutenus par le Conseil européen de la recherche dans le cadre du7e programme-cadre FP7 (ERC Synergy Grant 4D-Genome, accord de subvention 609989 à T.G.), le Ministère espagnol de l’économie, de l’industrie et de la compétitivité (MEIC) au partenariat EMBL, Centro de Excelencia Severo Ochoa 2013-2017 et le Programme général de Catalunya.
0.1% EmbryoMax gelatin | EMD Millipore | ES-006-B | Cell culture |
0.25% Trypsin-EDTA | 25200072 | ||
AMPure XP | Beckman Coulter | 10136224 | 4C/DNA purification |
B27 supplement | Gibco | 17504044 | Cell culture |
Beta-mercaptoethanol | Gibco | 31350010 | Cell culture |
Bioruptor Pico | Diagencode | B01060010 | 4C/sonication |
BSA | NEB | B9000S | 4C |
CHIR99021 | Selleck Chemicals | S1263 | Cell culture |
CIP | NEB | M0212 | 4C |
cOmplete Protease Inhibitor Cocktail | Roche | 4693116001 | 4C |
DMEM/F12 medium | Gibco | 11320033 | Cell culture |
dNTP | NEB | N0447S | 4C |
ESGRO Leukaemia Inhibitory Factor (LIF) | EMD Millipore | ESG1107 | Cell culture |
Formaldehyde solution (37%) | Sigma | 252549-25ML | 4C |
Glycin | Sigma | GE17-1323-01 | 4C |
Glycogen | ThermoFischer | R0551 | 4C |
Herculase II Fusion DNA polymerase | Agilent | 600675 | 4C |
IGEPAL CA-630 | Sigma | I3021-50ML | 4C |
Knockout DMEM | 10829018 | ||
L-glutamine | Gibco | 25030081 | Cell culture |
MboI | NEB | R0147M | 4C |
MEM non-essential amino acids | Gibco | 11140050 | Cell culture |
N2 supplement | Gibco | A1370701 | Cell culture |
NEBNext DNA Library prep | NEB | E6040 | 4C |
NEBuffer 2.1 | NEB | B7202S | 4C/digestion |
Neurobasal medium | Gibco | 21103049 | Cell culture |
PD0325901 | Selleck Chemicals | S1036 | Cell culture |
Penicillin Streptomycin | Gibco | 15140122 | Cell culture |
Proteinase K | NEB | P8107S | 4C |
Qubit 4 Fluorometer | ThermoFischer | Q33238 | 4C |
Qubit dsDNA HS Assay Kit | ThermoFischer | Q32851 | 4C |
RNase A | ThermoFischer | EN0531 | 4C |
Sodium pyruvate solution | Gibco | 11360070 | Cell culture |
StemPro Accutase Cell Dissociation Reagent | Gibco | A1110501 | Cell culture |
T4 DNA Ligase Reaction Buffer | NEB | B0202S | 4C |
T4 DNA Ligase Reaction Buffer | NEB | M0202M | 4C |