Segnaliamo l’applicazione della cattura della conformazione quantitativa del cromosoma seguita dal sequenziamento ad alto processo in corpi embrionali generati da cellule staminali embrionali. Questa tecnica consente di identificare e quantificare i contatti tra stimolatori e regioni promotrici di un determinato gene durante la differenziazione delle cellule staminali embrionali.
Durante lo sviluppo dei mammiferi, i destini cellulari sono determinati attraverso la creazione di reti regolatorie che definiscono la specificità, la tempistica e i modelli spaziali dell’espressione genica. I corpi embrionali (EB) derivati dalle cellule staminali pluripotenti sono stati un modello popolare per studiare la differenziazione dei principali tre strati germinali e per definire i circuiti regolatori durante la specifica del destino cellulare. Anche se è ben noto che gli stimolatori specifici dei tessuti svolgono un ruolo importante in queste reti interagendo con i promotori, assegnarli ai loro geni bersaglio rilevanti rimane ancora impegnativo. Per rendere possibile tutto ciò, sono necessari approcci quantitativi per studiare i contatti potenziatori-promotori e le loro dinamiche durante lo sviluppo. Qui, abbiamo adattato un metodo 4C per definire gli esaltatori e i loro contatti con i promotori di cognati nel modello di differenziazione EB. Il metodo utilizza spesso enzimi di restrizione di taglio, sonicazione e un protocollo PCR mediato con la legatura nidificata compatibile con i kit di preparazione della libreria del DNA commerciale. Successivamente, le librerie 4C sono sottoposte a sequenziamento ad alto contenuto di velocità e analizzate in modo bioinformatico, consentendo il rilevamento e la quantificazione di tutte le sequenze che hanno contatti con un promotore scelto. I dati di sequenziamento risultanti possono essere utilizzati anche per ottenere informazioni sulle dinamiche dei contatti enhancer-promotore durante la differenziazione. La tecnica descritta per il modello di differenziazione EB è facile da implementare.
Nei topi, la massa cellulare interna (ICM) di embrioni di 3,5 giorni contiene cellule staminali pluripotenti embrionali. L’ICM si sviluppa ulteriormente nell’epiblast al giorno 4.5, generando ectodermi, mesodermi ed cellule endodermiche, i principali tre strati germinali nell’embrione. Sebbene le cellule pluripotenti nell’ICM esistano solo in modo transitorio in vivo, possono essere catturate nella coltura dalla creazione di cellule staminali embrionali di topo (mESC)1,2,3. I mESC rimangono in uno stato indifferenziato e proliferano a tempo indeterminato, ma su stimoli intrinseci ed estrinseci sono anche in grado di uscire dallo stato di pluripotenza e generare cellule dei tre strati germinali dello sviluppo2,4. È interessante notare che, quando coltivati in sospensione in piccole goccioline, le mESC formano aggregati tridimensionali (cioè EB) che si differenziano in tutti e tre gli strati germinali5. L’analisi della formazione EB è uno strumento importante per studiare il processo di specifica del lignaggio precoce.
Durante la specifica del lignaggio, le cellule di ogni strato germinale acquisiscono un programma di espressione genica specifico4. L’esatta espressione spatiotemporale dei geni è regolata da diversi elementi cis-regolatori, tra cui promotori di base, esaltatori, silenziatori e isolanti6,7,8,9.9 Stimolatori, segmenti di DNA regolatori in genere che abbracciano poche centinaia di coppie di basi, coordinano l’espressione genica specifica del tessuto8. Gli esaltatori sono attivati o silenziati mediante il legame di fattori di trascrizione e cofattori che regolano la struttura della cromatina locale8,10. Le tecniche comunemente usate per identificare gli stimolatori sono l’immunoprecipitazioni di cromatina a livello di genoma, seguita dal sequenziamento (ChIP-seq) e il test per la cromatina accessibile alla trasposta utilizzando tecniche di sequenziamento (ATAC-seq). Così, esaltatori attivi sono caratterizzati da specifici segni itoni attivi e da una maggiore accessibilità del DNA locale11,12,13,14. Inoltre, si ritiene che gli esaltatori dello sviluppo richiedano l’interazione fisica con il loro promotore di cognato8,9. Infatti, è stato dimostrato che le varianti e le delezioni dell’potenziatore che interrompono i contatti del promotore dell’avanzata possono portare a malformazioni dello sviluppo15. Pertanto, vi è la necessità di nuove tecniche che forniscano informazioni aggiuntive per l’identificazione dei potenziatori funzionali che controllano l’espressione genica dello sviluppo.
Dallo sviluppo della tecnica di cattura della conformazione cromosomica (3C)16, la mappatura dei contatti cromosomici è stata utilizzata in modo intensivo per valutare la distanza fisica tra gli elementi normativi. È importante sottolineare che di recente sono state sviluppate varianti ad alto contenuto di velocità effettiva di tecniche 3C, fornendo diverse strategie per la fissazione, la digestione, la legatura e il recupero dei contatti tra frammenti di cromatina17. Tra questi, in situ Hi-C è diventata una tecnica popolare permettendo il sequenziamento di prodotti di ligazione 3C genome-wide18. Tuttavia, gli elevati costi di sequenziamento necessari per raggiungere una risoluzione idonea per l’analisi dei contatti enhancer-promotore rende questa tecnica poco pratica per lo studio di loci specifici. Pertanto, sono stati sviluppati metodi alternativi per analizzare i loci mirati ad alta risoluzione19,20,21,22. Uno di questi metodi, vale a dire 4C, noto come uno contro tutta la strategia, consente il rilevamento di tutte le sequenze che contattano un sito selezionato come punto di vista. Tuttavia, uno svantaggio della tecnica standard 4C è la PCR inversa richiesta, che amplifica frammenti di dimensioni diverse, favorendo i piccoli prodotti e la quantificazione di biasimata dopo il sequenziamento ad alto throughput. Recentemente, UMI-4C, è stata sviluppata una nuova variante della tecnica 4C che utilizza identificatori molecolari univoci (UMI) per la profilazione quantitativa e mirata dei contatti cromosomici che aggira questo problema23. Questo approccio utilizza frese frequenti, sonicazione e un protocollo PCR mediato con legatura nidificata, che comporta così l’amplificazione di frammenti di DNA con una distribuzione della lunghezza relativamente uniforme. Questa omogeneità riduce le distorsioni nel processo di amplificazione delle preferenze PCR per sequenze più brevi e consente un recupero efficiente e un conteggio accurato delle molecole/frammenti collegati spazialmente.
Qui descriviamo un protocollo che adatta la tecnica UMI-4C per identificare e quantificare i contatti della cromatina tra promotori e stimolatori dei fattori di trascrizione istruttivi del lignaggio durante la differenziazione EB.
Il metodo di coltura della caduta sospesa non ha bisogno di ulteriori fattori di crescita o citochine e genera riproducibilmente popolazioni omogenee di EB da un numero predeterminato di mESC5. Qui descriviamo un protocollo di quantitative 4C adattato dall’approccio UMI-4C per quantificare il contatto enhancer-promotore dei fattori di trascrizione specifici del lignaggio nel modello di differenziazione EB. Abbiamo identificato le regioni della cromatina che contattano i promotori dei geni Pou5f1 e T in modo dinamico durante la differenziazione EB. Pou5f1 è stato regolato durante la differenziazione EB e la frequenza di contatto tra il promotore Pou5f1 e il suo potenziatore distale è diminuita. Al contrario, T è stato regolato durante la differenziazione EB e abbiamo identificato tre stimolatori per i quali le frequenze di contatto con il loro promotore sono diminuite (Figura 3). Per confermare l’identificazione, un’immunoprecipitazioni della cromatina (ChIP) di marchio istorio attivo H3K27ac può essere eseguita24, in quanto questo segno istono è stato dimostrato essere associato con l’attivazione potenziatore e stimolatori perdere questo marchio durante la loro inattivazione11.
Una tecnica standard 4C è stata ampiamente utilizzata per esaminare il profilo di contatto della cromatina di specifici siti genomici25. Tuttavia, questo approccio è difficile da interpretare quantitativamente anche dopo un’ampia normalizzazione26,27,28 a causa delle distorsioni introdotte dall’eterogeneità delle dimensioni dei frammenti PCR e dall’impossibilità di distinguere i duplicati PCR. Il nostro metodo quantitativo 4C è in gran parte identico alla tecnica UMI-4C che consente la quantificazione di singole molecole utilizzando la sonicazione e un passo PCR mediato a legatura nidificata per aggirare la limitazione del classico approccio 4C23. Tuttavia, a differenza dell’UMI-4C che utilizza identificatori molecolari univoci, il nostro protocollo quantitativo 4C consente la quantificazione di singole molecole in base alla rottura specifica del DNA prodotta dalla fase di sonicazione. Rende il nostro protocollo compatibile con i kit di preparazione della libreria del DNA commerciale, eliminando la necessità di primer con identificatori molecolari unici.
Il nostro protocollo prevede diversi passaggi chiave che dovrebbero essere considerati. Come nel metodo 4C classico28, fattori critici del nostro protocollo sono l’efficienza della digestione e la legatura durante la preparazione delle molecole 3C. Basse efficienze di digestione/legamento possono ridurre drasticamente la complessità dell’interazione con un frammento di interesse, con conseguente riduzione della risoluzione. Come descritto in precedenza23, un altro passaggio critico del protocollo è la progettazione dei primer per l’amplificazione della libreria. I secondi primer di reazione PCR dovrebbero trovarsi a 5-15 nt dal sito di restrizione interrogatorio. In una lettura di sequenza 75 nt, ciò consente di almeno 40 nt a sinistra della lunghezza di acquisizione per il mapping. Il primer utilizzato nella prima reazione PCR deve essere progettato a monte del secondo primer senza sovrapposizioni ed entrambi dovrebbero essere sufficientemente specifici da garantire un’amplificazione efficiente del DNA. Per il multiplexing, i primer devono essere progettati in modo indipendente, puntando a una temperatura di fusione (Tm)di 60-65 gradi centigradi. Inoltre, come per altre tecniche 3C, la risoluzione del metodo quantitativo 4C è determinata dall’enzima di restrizione utilizzato nel protocollo25. Questo protocollo utilizza un enzima di restrizione con un sito di riconoscimento di 4 bp, MboI. La risoluzione massima con questo enzima è di circa 500 bp, ma questo è altamente dipendente dal locus e raramente raggiunto. Un’altra limitazione è che le interazioni che si verificano tra gli elementi che si trovano nello stesso frammento di restrizione non sono rilevabili. Inoltre, le interazioni che si verificano a una distanza di un sito di restrizione non possono essere distinte dallo sfondo non digerito. L’uso di un passaggio di riempimento prima della legatura potrebbe consentire il rilevamento di queste interazioni.
Quantitative 4C è ideale per interrogare i contatti della cromatina di loci mirati. Tuttavia, la fase specifica di amplificazione PCR limita il numero di loci che possono essere studiati contemporaneamente. Un modo per aumentare il numero di loci mirati è quello di multiplex passaggi PCR per amplificare contemporaneamente diversi obiettivi, ma questo richiede la compatibilità dei primer utilizzati e testare ogni coppia di primer prima dell’implementazione. Se si desiderano cambiamenti globali dell’architettura della cromatina nei promotori, approcci a livello di genoma come Hi-C, PC Hi-C o HiChIP sarebbero più appropriati29,30,31.
The authors have nothing to disclose.
Ringraziamo F. Le Dily, R. Stadhouders e i membri del laboratorio Graf per i loro consigli e discussioni. G.S. è stata sostenuta da una borsa di studio Marie Sklodowska-Curie (H2020-MSCA-IF-2016, miRStem), T.V.T da una borsa di studio post-dottorato Juan de la Cierva (MINECO, FJCI-2014-22946). Questo lavoro è stato sostenuto dal Consiglio europeo della ricerca nell’ambito del7th Framework Programme FP7 (ERC Synergy Grant 4D-Genome, accordo 609989 a T.G.), del Ministero spagnolo dell’economia, dell’industria e della competitività (MEIC) al partenariato EMBL, Centro de Excelencia Severo Ochoa 2013-2017 e del programma CERCA Generalitat de Catalunya.
0.1% EmbryoMax gelatin | EMD Millipore | ES-006-B | Cell culture |
0.25% Trypsin-EDTA | 25200072 | ||
AMPure XP | Beckman Coulter | 10136224 | 4C/DNA purification |
B27 supplement | Gibco | 17504044 | Cell culture |
Beta-mercaptoethanol | Gibco | 31350010 | Cell culture |
Bioruptor Pico | Diagencode | B01060010 | 4C/sonication |
BSA | NEB | B9000S | 4C |
CHIR99021 | Selleck Chemicals | S1263 | Cell culture |
CIP | NEB | M0212 | 4C |
cOmplete Protease Inhibitor Cocktail | Roche | 4693116001 | 4C |
DMEM/F12 medium | Gibco | 11320033 | Cell culture |
dNTP | NEB | N0447S | 4C |
ESGRO Leukaemia Inhibitory Factor (LIF) | EMD Millipore | ESG1107 | Cell culture |
Formaldehyde solution (37%) | Sigma | 252549-25ML | 4C |
Glycin | Sigma | GE17-1323-01 | 4C |
Glycogen | ThermoFischer | R0551 | 4C |
Herculase II Fusion DNA polymerase | Agilent | 600675 | 4C |
IGEPAL CA-630 | Sigma | I3021-50ML | 4C |
Knockout DMEM | 10829018 | ||
L-glutamine | Gibco | 25030081 | Cell culture |
MboI | NEB | R0147M | 4C |
MEM non-essential amino acids | Gibco | 11140050 | Cell culture |
N2 supplement | Gibco | A1370701 | Cell culture |
NEBNext DNA Library prep | NEB | E6040 | 4C |
NEBuffer 2.1 | NEB | B7202S | 4C/digestion |
Neurobasal medium | Gibco | 21103049 | Cell culture |
PD0325901 | Selleck Chemicals | S1036 | Cell culture |
Penicillin Streptomycin | Gibco | 15140122 | Cell culture |
Proteinase K | NEB | P8107S | 4C |
Qubit 4 Fluorometer | ThermoFischer | Q33238 | 4C |
Qubit dsDNA HS Assay Kit | ThermoFischer | Q32851 | 4C |
RNase A | ThermoFischer | EN0531 | 4C |
Sodium pyruvate solution | Gibco | 11360070 | Cell culture |
StemPro Accutase Cell Dissociation Reagent | Gibco | A1110501 | Cell culture |
T4 DNA Ligase Reaction Buffer | NEB | B0202S | 4C |
T4 DNA Ligase Reaction Buffer | NEB | M0202M | 4C |