Hi-C 3.0 è un protocollo Hi-C migliorato che combina crosslinker di formaldeide e disuccinimidil glutarato con un cocktail di enzimi di restrizione DpnII e DdeI per aumentare il rapporto segnale-rumore e la risoluzione del rilevamento dell’interazione cromatina.
La cattura della conformazione cromosomica (3C) viene utilizzata per rilevare interazioni tridimensionali della cromatina. Tipicamente, la reticolazione chimica con la formaldeide (FA) viene utilizzata per fissare le interazioni della cromatina. Quindi, la digestione della cromatina con un enzima di restrizione e la successiva legatura delle estremità del frammento converte la prossimità tridimensionale (3D) in prodotti di legatura unici. Infine, dopo l’inversione dei legami incrociati, la rimozione delle proteine e l’isolamento del DNA, il DNA viene tagliato e preparato per il sequenziamento ad alto rendimento. La frequenza di legatura di prossimità di coppie di loci è una misura della frequenza della loro colocalizzazione nello spazio tridimensionale in una popolazione cellulare.
Una libreria Hi-C sequenziata fornisce informazioni sull’intero genoma sulle frequenze di interazione tra tutte le coppie di loci. La risoluzione e la precisione di Hi-C si basano su una reticolazione efficiente che mantiene i contatti della cromatina e la frammentazione frequente e uniforme della cromatina. Questo articolo descrive un protocollo Hi-C in situ migliorato, Hi-C 3.0, che aumenta l’efficienza della reticolazione combinando due reticolanti (formaldeide [FA] e disuccinimidil glutarato [DSG]), seguiti da una digestione più fine utilizzando due enzimi di restrizione (DpnII e DdeI). Hi-C 3.0 è un singolo protocollo per la quantificazione accurata delle caratteristiche di ripiegamento del genoma su scale più piccole come loop e domini topologicamente associati (TAD), nonché caratteristiche su scale più grandi a livello di nucleo come i compartimenti.
La cattura della conformazione cromosomica è stata utilizzata dal 20021. Fondamentalmente, ogni variante di cattura della conformazione si basa sulla fissazione delle interazioni DNA-proteina e proteina-proteina per preservare l’organizzazione della cromatina 3D. Questo è seguito dalla frammentazione del DNA, di solito dalla digestione di restrizione e, infine, dalla religenza delle estremità del DNA vicine per convertire loci spazialmente prossimali in sequenze di DNA covalenti uniche. I protocolli 3C iniziali utilizzavano la PCR per campionare specifiche interazioni “one-to-one”. I successivi saggi 4C hanno permesso di rilevare interazioni “uno-a-tutti”2, mentre 5C ha rilevato interazioni “molti-a-molti”3. La cattura della conformazione cromosomica è arrivata a pieno compimento dopo aver implementato il sequenziamento ad alto rendimento (NGS) di nuova generazione, che ha permesso di rilevare interazioni genomiche “all-to-all” utilizzando Hi-C 4 a livello di genoma e tecniche comparabili come 3C-seq5, TCC6 eMicro-C 7,8 (vedi anche revisione di Denker e De Laat9).
In Hi-C, i nucleotidi biotinilati sono usati per marcare le sporgenze di 5′ dopo la digestione e prima della legatura (Figura 1). Ciò consente la selezione di frammenti correttamente digeriti e religati utilizzando perle rivestite di streptavidina, distinguendolo dal GCC10. Un importante aggiornamento del protocollo Hi-C è stato implementato da Rao et al.11, che hanno eseguito la digestione e la religazione in nuclei intatti (cioè in situ) per ridurre i prodotti di legatura spuria. Inoltre, la sostituzione della digestione HindIII con la digestione MboI (o DpnII) ha ridotto la dimensione del frammento e aumentato il potenziale di risoluzione di Hi-C. Questo aumento ha permesso la rilevazione di strutture relativamente piccole e una localizzazione genomica più precisa dei punti di contatto, come i loop di DNA tra piccoli cis-elementi, ad esempio loop tra siti legati al CTCF generati dall’estrusione di loop11,12. Tuttavia, questo potenziale ha un costo. In primo luogo, un aumento di due volte della risoluzione richiede un aumento di quattro volte (22) delle letture di sequenziamento13. In secondo luogo, le piccole dimensioni dei frammenti aumentano la possibilità di confondere i frammenti vicini non digeriti con frammenti digeriti e relegati14. Come accennato, in Hi-C, i frammenti digeriti e relegati differiscono dai frammenti non digeriti per la presenza di biotina alla giunzione della legatura. Tuttavia, è necessaria una corretta rimozione della biotina dalle estremità non legate per assicurare che solo le giunzioni di legatura vengano abbassate14,15.
Con la diminuzione del costo di NGS, diventa possibile studiare il ripiegamento cromosomico in modo più dettagliato. Per ridurre le dimensioni dei frammenti di DNA, e quindi aumentare la risoluzione, il protocollo Hi-C può essere adattato per utilizzare più frequentemente gli enzimi di restrizione di taglio16 o per utilizzare combinazioni di enzimi di restrizione17,18,19. In alternativa, MNasi 7,8 in Micro-C e DNasi in DNasi Hi-C20 possono essere titolate per ottenere una digestione ottimale.
Una recente valutazione sistematica dei fondamenti dei metodi 3C ha mostrato che la rilevazione delle caratteristiche di ripiegamento cromosomico su ogni scala di lunghezza è notevolmente migliorata con la reticolazione sequenziale con 1% FA seguito da 3 mM DSG17. Inoltre, Hi-C con digestione HindIII era l’opzione migliore per rilevare caratteristiche di piegatura su larga scala, come i compartimenti, e che Micro-C era superiore nel rilevare caratteristiche di ripiegamento su piccola scala come i loop di DNA. Questi risultati hanno portato allo sviluppo di un’unica strategia “Hi-C 3.0” ad alta risoluzione, che utilizza la combinazione di reticolanti FA e DSG seguita da una doppia digestione con endonucleasi DpnII e DdeI21. Hi-C 3.0 fornisce una strategia efficace per l’uso generale perché rileva con precisione le caratteristiche di piegatura su tutte le scale di lunghezza17. La parte sperimentale del protocollo Hi-C 3.0 è dettagliata qui e vengono mostrati i risultati tipici che ci si può aspettare dopo il sequenziamento.
Figura 1: Procedura Hi-C in sei fasi. Le celle vengono fissate prima con FA e poi DSG (1). Quindi, la lisi precede una doppia digestione con DdeI e DpnII (2). La biotina viene aggiunta per riempimento sporgente e le estremità smussate prossimali vengono legate (3) prima della purificazione del DNA (4). La biotina viene rimossa dalle estremità non legate prima della sonicazione e della selezione delle dimensioni (5). Infine, il pull-down della biotina consente la legatura dell’adattatore e l’amplificazione della libreria mediante PCR (6). Abbreviazioni: FA = formaldeide; DSG = glutarato di disuccinimidile; B = Biotina. Fare clic qui per visualizzare una versione ingrandita di questa figura.
Passaggi critici per la gestione delle celle
Sebbene sia possibile utilizzare un numero inferiore di celle di input, questo protocollo è stato ottimizzato per ~ 5 × 106 celle per corsia di sequenziamento (~ 400 M letture) per garantire la corretta complessità dopo il sequenziamento profondo. Le cellule sono meglio contate prima della fissazione. Per la generazione di librerie ultraprofonde, generalmente moltiplichiamo il numero di corsie (e celle) fino a raggiungere la profondità di lettura desiderata. Per una fissazione ottimale, il mezzo contenente siero deve essere sostituito con PBS prima della fissazione FA e le soluzioni fissative devono essere aggiunte immediatamente e senza gradienti di concentrazione15,22. Per la raccolta cellulare, la raschiatura è preferita alla tripsinizzazione, perché il passaggio da una forma più piatta a una sferica dopo la tripsinizzazione potrebbe influenzare la conformazione nucleare. Dopo l’aggiunta di DSG, i pellet di cellule sciolte e grumose vengono facilmente persi. Fare attenzione quando si maneggiano le cellule in questa fase e aggiungere fino allo 0,05% di BSA per ridurre l’aggregazione.
Modifiche al metodo
Questo protocollo è stato sviluppato utilizzando cellule umane17. Tuttavia, sulla base dell’esperienza con la cattura della conformazione cromosomica, questo protocollo dovrebbe funzionare per la maggior parte delle cellule eucariotiche. Per un input significativamente inferiore (~1 × 106 celle), si consiglia di utilizzare metà dei volumi per le procedure di lisi e cattura della conformazione [passi 2.1-2.4]. Ciò consentirebbe anche di eseguire l’isolamento del DNA [fase 2.5] in una centrifuga da tavolo con tubi da 1,7 ml, che potrebbe migliorare la pellettizzazione per basse concentrazioni di DNA. La quantificazione del DNA (fase 2.6.6) indicherà come procedere. Per basse quantità di DNA isolato (1-5 μg), suggeriamo di saltare la selezione delle dimensioni (fase 3.3) e procedere con la rimozione della biotina dopo aver ridotto il volume da 130 μL a ~45 μL con un CFU.
Questo protocollo è stato sviluppato appositamente per garantire dati di alta qualità dopo la successiva reticolazione con FA e DSG e la digestione con DpnII e DdeI. Tuttavia, strategie di reticolazione alternative come la FA seguita da EGS (glicole etilenico bis (succinimidil succinato)), utilizzata anche in ChIP-seq23 e ChIA-PET24, potrebbero funzionare altrettanto bene17. Allo stesso modo, diverse combinazioni enzimatiche, come DpnII e HinfI18 o MboI, MseI e NlaIII19 possono essere utilizzate per la digestione. Quando si adattano le combinazioni enzimatiche, assicurarsi di utilizzare nucleotidi biotinilati in grado di riempire le sporgenze specifiche di 5′ e utilizzare i tamponi più ottimali per ogni cocktail. DpnII viene fornito con il proprio tampone e il produttore dell’enzima raccomanda un tampone specifico per la digestione DdeI. Tuttavia, per la doppia digestione con DpnII e DdeI in questo protocollo, il Restriction Buffer è raccomandato perché è valutato al 100% di attività per entrambi gli enzimi.
Risoluzione dei problemi relativi all’acquisizione delle conformazioni
I tre passaggi chiave nella cattura della conformazione cromosomica: reticolazione, digestione e religenza sono stati tutti eseguiti prima che i risultati possano essere visualizzati su gel. Per determinare la qualità di ciascuno di questi tre passaggi e discernere dove potrebbero essere sorti problemi, le aliquote prima (CI) e dopo la digestione (DC) vengono prelevate e caricate sul gel insieme al campione Hi-C legato (Figura 2). Questo gel viene utilizzato per determinare la qualità del campione Hi-C e se varrà la pena continuare il protocollo. Senza CI e DC, è difficile individuare potenziali passaggi subottimali. Vale la pena notare che la legatura subottimale potrebbe essere dovuta a un problema nella legatura stessa, il fill-in o un problema con la reticolazione. Per risolvere i problemi di reticolazione, assicurarsi di non utilizzare più di 1 × 107 cellule per libreria e iniziare con reagenti di reticolazione freschi e cellule pulite (cioè risciacquate con PBS). Per la legatura, assicurarsi che le cellule e la miscela di legatura siano mantenute sul ghiaccio. Aggiungere T4 DNA ligasi poco prima dell’incubazione di 4 ore a 16 °C e mescolare bene.
Risoluzione dei problemi relativi alla preparazione della libreria
Se sono necessari più di 10 cicli di PCR o nessun prodotto PCR può essere visto sul gel dopo la titolazione PCR (Figura 4), ci sono alcune opzioni per salvare il campione Hi-C. Lavorando a ritroso dalla titolazione della PCR, la prima opzione è quella di provare di nuovo la PCR. Se non c’è ancora abbastanza prodotto, è possibile tentare un altro giro di coda A e legatura dell’adattatore (passaggio 3.6) dopo aver lavato le perline due volte con 1x tampone TLE. Dopo questa ulteriore legatura della coda A e dell’adattatore, si può procedere alla titolazione PCR come prima. Se non c’è ancora alcun prodotto, l’ultima opzione è quella di risonicare la frazione 0,8x dal passaggio 3.3 e procedere da lì.
Limitazioni e vantaggi di Hi-C3.0
È importante rendersi conto che Hi-C è un metodo basato sulla popolazione che cattura la frequenza media delle interazioni tra coppie di loci nella popolazione cellulare. Alcune analisi computazionali sono progettate per districare combinazioni di conformazioni da una popolazione25, ma in linea di principio, Hi-C è cieco alle differenze tra le cellule. Sebbene sia possibile eseguire Hi-C26,27 a cella singola e possano essere effettuate inferenze computazionali28, Hi-C a cella singola non è adatto per ottenere informazioni 3C ad altissima risoluzione. Un’ulteriore limitazione di Hi-C è che rileva solo interazioni a coppie. Per rilevare interazioni multicontatto, è possibile utilizzare frese frequenti combinate con sequenziamento a lettura breve (Illumina)16 o eseguire il sequenziamento multicontatto 3C29 o 4C30, utilizzando il sequenziamento a lunga lettura dalle piattaforme PacBio o Oxford Nanopore. Sono stati sviluppati anche derivati Hi-C per rilevare specificamente i contatti tra e lungo i cromatidi fratelli31,32.
Sebbene Hi-C19 e Micro-C33 possano essere utilizzati per generare mappe di contatto a risoluzioni subkilobase, entrambi richiedono una grande quantità di letture di sequenziamento e questo può diventare un’impresa costosa. Per ottenere una risoluzione simile o addirittura superiore senza i costi, è possibile applicare l’arricchimento per specifiche regioni genomiche (capture-C 34) o specifiche interazioni proteiche (ChiA-PET 35, PLAC-seq36, Hi-ChIP37). Il punto di forza e lo svantaggio di queste applicazioni di arricchimento è che viene campionato solo un numero limitato di interazioni. Con tali arricchimenti, l’aspetto globale di Hi-C (e l’opzione della normalizzazione globale) è perso.
Importanza e potenziali applicazioni di Hi-C3.0
Questo protocollo è stato progettato per consentire 3C ultraprofondi ad alta risoluzione e allo stesso tempo rilevare caratteristiche di piegatura su larga scala come TAD e scomparti17 (Figura 6). Questo protocollo inizia con 5 × 106 celle per tubo per ogni libreria Hi-C, che dovrebbe essere materiale più che sufficiente per sequenziare una o due corsie su una cella di flusso per ottenere fino a 1 miliardo di letture accoppiate. Per il sequenziamento ultraprofondo, devono essere preparate più provette da 5 × 106 cellule, a seconda del numero di letture mappate e duplicati PCR. Alla massima risoluzione (<1 kb), le interazioni cicliche si trovano principalmente tra i siti CTCF, ma possono anche essere rilevate interazioni promotore-potenziatore. I lettori possono fare riferimento ad Akgol Oksuz et al.17 per una descrizione dettagliata dell’analisi dei dati.
The authors have nothing to disclose.
Vorremmo ringraziare Denis Lafontaine per lo sviluppo del protocollo e Sergey Venev per l’assistenza bioinformatica. Questo lavoro è stato supportato da una sovvenzione del National Institutes of Health Common Fund 4D Nucleome Program a J.D. (U54-DK107980, UM1-HG011536). J.D. è un investigatore dell’Howard Hughes Medical Institute.
Questo articolo è soggetto alla politica Open Access to Publications di HHMI. I responsabili dei laboratori HHMI hanno precedentemente concesso una licenza CC BY 4.0 non esclusiva al pubblico e una licenza sublicenziabile a HHMI nei loro articoli di ricerca. In base a tali licenze, il manoscritto accettato dall’autore di questo articolo può essere reso liberamente disponibile sotto una licenza CC BY 4.0 immediatamente dopo la pubblicazione.
1 kb Ladder | New England Biolabs | N3232L | |
Agarose | Invitrogen | 16500100 | |
Agencourt AMPure XP magnetic beads , 60 mL | Beckman Coulter | A63881 | |
Amicon Ultra-0.5 Centrifugal Filter Unit (CFU) | EMD Millipore | UFC500396 | |
Annealing Buffer (5x) | See recipe in supplemental materials | ||
ATP 10 mM | ThermoFisher | R0441 | |
Avanti J-25i High Speed Refrigerated ultra-centrifuge | Beckman Coulter | ||
beckman ultracentrifuge tube 35 mL | Beckman Coulter | 357002 | |
Binding Buffer (2x) | See recipe in supplemental materials | ||
biotin-14-dATP 0.4 mM | Invitrogen | 19524-016 | |
BSA 10 mg/mL | New England Biolabs | B9000S | dilute from 20 mg/mL |
Cell scraper | Falcon | 353089 | |
Cell scraper | Corning | 3008 | |
Conical polypropylene tubes 50 mL | Denville | C1062-P | |
Conical tube 15 mL | Denville | C1017-P | |
Covaris micro tube AFA fiber with snap-cap 130 µL | Covaris | 520045/520077 | |
Covaris Sonicator | Covaris | E220/E220evolution/M220 | |
Culture flask 175 cm2 | Falcon | 353112 | |
Culture plates 150 mm x 25 mm | Corning | 430599 | |
dATP 1 mM | Invitrogen | 56172 | |
dATP 10 mM | Invitrogen | 56172 | |
dCTP 10 mM | Invitrogen | 56173 | |
DdeI | New England Biolabs | R0175L | |
dGTP 10 mM | Invitrogen | 56174 | |
DMSO | Sigma | D2650-5x10ML | |
dNTP mix 25 mM | Invitrogen | 10297117 | |
Dounce homogenizer | DWK Life Sciences | 8853010002/8853030002 | |
DPBS | Gibco | 14190-144 | |
DpnII | New England Biolabs | R0543M | |
DSG | ThermoScientific | 20593 | |
dTTP 10 mM | Invitrogen | 56175 | |
Ethanol 70% | Fisher | A409-4 | Diluted from 100% |
Ethidium Bromide | Fisher | BP1302-10 | |
Formaldehyde (37%) | Fisher | BP531-500 | |
Gel loading dye (6x ) | New England Biolabs | B7024S | |
Glycine in ultrapure water 2.5 M | Sigma | G8898-1KG | |
HBSS | Gibco | 14025-092 | |
Igepal CA-630 detergent | MP Biomedicals | 198596 | |
Klenow DNA polymerase 5 U/µL | New England Biolabs | M0210L | |
Klenow Fragment 3–>5’ exo-, 5 U/µL | New England Biolabs | M0212L | |
ligation buffer (10x) | New England Biolabs | B7203S | |
Liquid nitrogen | |||
LoBind microcentrifuge tube 1.7 mL | Eppendorf | 22431021 | |
Low Molecular Weight DNA Ladder | New England Biolabs | N3233L | |
Lysis buffer | See recipe in supplemental materials | ||
Magnetic Particle separator | ThermoFisher | 12321D | |
Microfuge tubes 1.7 mL | Axygen | MCT-175-C | |
MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
NEBuffer 2.1 (10x) | New England Biolabs | B7002S | |
NEBuffer 3.1 (10x) | New England Biolabs | B7203S | |
PBS | Gibco | 70013-032 | |
PCR (strip) tubes | Biorad | TBS0201/ TCS0803 | |
PCR thermocycler | Biorad | T100 | |
Pfu Ultra II Buffer (10x) | Agilent | Comes with Pfu Ultra | |
PfuUltra II Fusion HS DNA Polymerase | Agilent | 600674 | |
Phase lock tube 15 mL | Qiagen | 129065 | |
Phase lock tubes 2 mL | Qiagen | 129056 | |
Phenol:chloroform:isoamyl alcohol | Invitrogen | 15593-049 | |
Protease inhibitor cocktail | ThermoFisher | 78440 | |
Proteinase K in ultrapure water 10 mg/mL | Invitrogen | 25530-031 | |
Refrigerated Centrifuge | Eppendorf | 5810R | |
RNase A, DNase and protease-free 10 mg/mL | Thermo Scientific | EN0531 | |
Rotator | Argos technologies | EW-04397-40 or rocking platform | |
SDS 1% | Fisher | BP13111 | |
Sodium acetate pH = 5.2, 3 M | Sigma | ||
Sub-Cell GT Horizontal Electrophoresis System | Biorad | 1704401 | |
T4 DNA ligase 1 U/µL | Invitrogen | 100004817 | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase | New England Biolabs | M0203L | |
T4 DNA polymerase 3 U/µL | New England Biolabs | M0203L | |
T4 ligation buffer (5x) | Invitrogen | Y90001 | |
T4 polynucleotide kinase 10 U/µL | New England Biolabs | M0201L | |
Tabletop centrifuge | Eppendorf | 5425 | |
TBE buffer | See recipe in supplemental materials | ||
Tris Low EDTA Buffer (TLE) | See recipe in supplemental materials | ||
Triton X-100 (10%) | Sigma | 93443 | |
Truseq adapter oligos | Integrated DNA Technologies (IDT)) | https://www.idtdna.com/site/order/oligoentry | 250 nmole and HPLC purified |
Tween 20 detergent | Fisher | 9005-64-5 | |
Tween Wash Buffer | See recipe in supplemental materials | ||
Vortex | Scientific Industries | (G560)SI-0236 |