Qui, presentiamo un adattamento della tecnica di cattura della conformazione cromosomica (3C) in dettaglio con particolare attenzione al coinvolgimento e all’apprendimento universitario.
La cattura della conformazione cromosomica (3C) è un potente strumento che ha generato una famiglia di tecniche simili (ad esempio, Hi-C, 4C e 5C, indicate qui come tecniche 3C) che forniscono informazioni dettagliate sull’organizzazione tridimensionale della cromatina. Le tecniche 3C sono state utilizzate in una vasta gamma di studi, dal monitoraggio dei cambiamenti nell’organizzazione della cromatina nelle cellule tumorali all’identificazione dei contatti enhancer effettuati con i promotori genici. Mentre molti degli studi che utilizzano queste tecniche pongono grandi domande a livello di genoma con tipi di campioni complessi (cioè analisi a singola cellula), ciò che spesso si perde è che le tecniche 3C sono basate su metodi di biologia molecolare di base applicabili a una vasta gamma di studi. Affrontando questioni strettamente focalizzate sull’organizzazione della cromatina, questa tecnica all’avanguardia può essere utilizzata per migliorare l’esperienza di ricerca universitaria e di laboratorio di insegnamento. Questo documento presenta un protocollo 3C e fornisce adattamenti e punti di enfasi per l’implementazione presso istituzioni principalmente universitarie in esperienze di ricerca e insegnamento universitarie.
Il genoma di un organismo non solo contiene tutti i geni necessari per la funzione, ma anche tutte le istruzioni su come e quando usarli. Ciò rende la regolazione dell’accesso al genoma una delle funzioni più importanti della cellula. Ci sono molti meccanismi per controllare la funzione genica; tuttavia, al suo livello di base, la regolazione genica si riduce alla capacità dei fattori di trascrizione regolatori (trans-fattori) di legarsi alle loro specifiche sequenze di DNA (sequenze cis-regolatorie). Questa non è un’abilità innata; Invece, è governato dall’organizzazione/struttura del genoma nel nucleo, che controlla la disponibilità/esposizione delle sequenze cis-regolatorie ai trans-fattori 1,2,3. Se i trans-fattori non riescono a trovare le loro sequenze cis-regolatorie, allora i trans-fattori non possono svolgere i loro compiti regolatori. Ciò ha reso la comprensione di come i genomi sono organizzati nel nucleo un’importante fonte di indagine.
È ampiamente accettato che durante l’interfase, i cromosomi eucariotici nel nucleo occupano il proprio dominio ancorato alla lamina nucleare e alla matrice nucleare (Figura 1), rendendo così il cromosoma più simile a una fetta di pizza, piuttosto che a una tagliatella su un piatto di spaghetti. I cromosomi sono parzialmente condensati da interazioni proteina-DNA (cromatina) che torcono e ciclizzano porzioni del cromosoma. Attraverso la microscopia elettronica, l’ibridazione tridimensionale in situ con fluorescenza del DNA (FISH) e le tecniche di marcatura del DNA (cioè metilazione del DNA fluorescente e artificiale), i domini inattivi della cromatina sono stati trovati impacchettati strettamente lungo la periferia nucleare 4,5,6, mentre porzioni di cromatina attiva e meno condensata si trovano all’interno del nucleo 7,8,9, 10. Questi esperimenti forniscono una visione grandangolare della dinamica cromosomica, ma fanno poco per catturare i cambiamenti che si verificano localmente intorno ai promotori genici osservati negli studi DNasi11,12 e nucleosoma13,14,15.
La chiave per sbloccare la dinamica della cromatina ad alta risoluzione è stata la formulazione della tecnica di mappatura cromosomica 3D, 3C. La tecnica 3C comprende quattro fasi principali: reticolazione della cromatina, digestione della cromatina mediante enzimi di restrizione, legatura della cromatina e purificazione del DNA (Figura 2). I nuovi frammenti di DNA artificiale generati da questo processo possono quindi essere caratterizzati per rivelare la stretta associazione fisica tra pezzi linearmente distanti di DNA16. La tecnica 3C è diventata la base per la creazione di molteplici tecniche spin-off che utilizzano i passaggi iniziali di 3C per porre domande più ampie sull’intero genoma (ad esempio, Hi-C, 4C, ChIP-C). Questa famiglia di tecniche 3C ha identificato che i cromosomi sono organizzati in più unità discrete chiamate domini topologicamente associati (TAD). I TAD sono codificati nel genoma e sono definiti da anelli di cromatina affiancati da confini non looped16,17,18,19. I confini del TAD sono mantenuti da due fattori evolutivamente conservati e ubiquitari, tra cui il fattore di legame CCCT (CTCF) e la coesione, che impediscono ai circuiti all’interno di TAD separati di interagire16,20. I loop sono mediati dall’interazione dei fattori trans con le loro sequenze regolatorie, nonché dalla CTCF e dalla coesione21.
Sebbene molti studi che utilizzano tecnologie 3C pongano ampie domande sull’intero genoma e impieghino complicate tecniche di raccolta dei campioni, la formulazione della tecnica 3C si basa su tecniche di biologia molecolare di base. Ciò rende 3C intrigante per l’implementazione sia nella ricerca universitaria che nei laboratori didattici. La tecnica 3C può essere impiegata per domande focalizzate più piccole ed è intrinsecamente flessibile al ridimensionamento verso l’alto o verso il basso (singoli geni22, cromosomi16 e / o genomi18) a seconda del focus e della direzione delle domande poste. Questa tecnica è stata applicata anche a una vasta gamma di sistemi modello 7,16,19,23 e si è dimostrata versatile nel suo utilizzo. Ciò rende 3C una tecnica eccellente per gli studenti universitari in quanto gli studenti possono acquisire esperienza nelle comuni tecniche di biologia molecolare e allo stesso tempo acquisire una preziosa esperienza nel rispondere a domande dirette.
Presentato qui è un protocollo adattato per la preparazione della libreria 3C basato sui protocolli precedentemente pubblicati24,25,26,27. Questo protocollo è stato ottimizzato per circa 1 × 107 celle, sebbene abbia generato librerie 3C con un minimo di 1 × 105 celle. Questo protocollo ha dimostrato di essere versatile ed è stato utilizzato per generare librerie 3C da embrioni di zebrafish, linee cellulari di zebrafish e Caenorhabditis elegans (nematodi) giovani adulti (YA). Il protocollo dovrebbe essere appropriato anche per le linee cellulari di mammifero e, con un ulteriore adattamento, per il lievito.
L’obiettivo di questi adattamenti è quello di rendere 3C più accessibile per gli studenti universitari. È stata prestata attenzione a utilizzare tecniche simili a quelle che possono essere realizzate in un laboratorio didattico universitario. La tecnica 3C offre molte opportunità di apprendimento per gli studenti universitari per apprendere tecniche di biologia molecolare di base che andranno a beneficio del loro sviluppo al banco, in classe e nei loro sforzi dopo la laurea.
Il 3C è una tecnica potente che affonda le sue radici nelle tecniche molecolari di base. È questa base di strumenti fondamentali che rende 3C una tecnica così intrigante da utilizzare con gli studenti universitari. Con così tanti studi recenti che osservano la dinamica della cromatina su una scala così ampia, l’utilizzo di questi risultati per ideare un esperimento focalizzato su un singolo gene o regione genomica ha il potenziale per creare un esperimento unico e di impatto nella ricerca universitaria. Spesso, esperimenti come questi sono considerati troppo avanzati per gli studenti universitari, ma con un’attenta pianificazione, sono facilmente realizzabili. È importante notare che i saggi progettati per sondare le connessioni della cromatina catturate dalla libreria 3C possono variare dalla PCR semi-quantitativa dell’endpoint al sequenziamento dell’intero genoma. Infatti, i dati del primo documento 3C16 sono stati generati da qPCR. Questa vasta gamma di saggi può essere utilizzata perché tutte le tecnologie 3C producono lo stesso prodotto: una libreria di frammenti di DNA che rappresentano le connessioni 3D nel nucleo.
Presentato qui è un adattamento di un protocollo più flessibile e accomodante che si adatta meglio ai ricercatori universitari. I periodi di pausa sopra elencati implicano ritardi notturni; Tuttavia, queste pause possono estendersi durante i fine settimana e, nel caso delle cellule e dei nuclei, per settimane. La considerazione più cruciale è quando il lavoro sarà fatto. Spesso nei protocolli, ci sono passaggi sensibili al tempo quando la pausa non è un’opzione. Al di fuori di alcuni punti (giorno 1 e giorno 2), ci sono molti posti dove fermarsi e congelare il campione. Questi sono fondamentali quando si lavora con studenti universitari in cui gli orari e i tempi del lavoro di laboratorio devono essere flessibili. Oltre a progettare queste fermate nel protocollo, gli studenti universitari sono incoraggiati a lavorare in coppia o anche in piccoli gruppi di tre o quattro. I gruppi funzionano bene per questo protocollo, poiché gli studenti possono sostenersi a vicenda e creare un sistema di amicizia in modo che tutti lavorino in sicurezza. Il lavoro di laboratorio è anche più divertente con gli altri coinvolti. Con i gruppi, gli studenti possono anche lavorare su una varietà di domande incentrate sull’organizzazione della cromatina pur eseguendo lo stesso protocollo. Pertanto, anche mentre gli studenti stanno lavorando su progetti separati, il protocollo collega i loro sforzi e, per questo motivo, possono sostenersi a vicenda.
Altri adattamenti hanno lo scopo di aggirare il fatto che alcuni strumenti e attrezzature specializzati non si trovano necessariamente in tutte le istituzioni universitarie. Queste apparecchiature includono, ma non sono limitate a, termociclatori qPCR, sistemi di documentazione su gel e spettrometri di volume nano. In effetti, questi pezzi di equipaggiamento sono convenienti ma non sono un requisito. Qui, il metodo classico di 3C è anche descritto nella parte di progettazione del primer; Ciò comporta l’identificazione di un locus genomico di interesse e, da questo, la valutazione di altri loci genomici per i punti di contatto della cromatina più lontani. Questa tecnica funziona bene anche se viene utilizzato un set di dati pubblicato, ad esempio un set di dati che utilizza Hi-C, in cui vengono identificati loci positivi (di connessione) e negativi (non di connessione) noti. La progettazione di esperimenti utilizzando questi set di dati pubblicati è un altro grande adattamento per i laboratori didattici, poiché la possibilità di identificare con successo le connessioni della cromatina è solitamente maggiore. Inoltre, l’articolo di ricerca può essere discusso in classe ed essere utilizzato come riferimento.
Questo protocollo utilizza un approccio qPCR modificato per visualizzare la formazione del prodotto 3C. I controlli sono essenziali per il successo della tecnica 3C. Ogni esperimento utilizza sia controlli di esempio che controlli di base per determinare il completamento della procedura 3C. I controlli del campione includono un controllo non digerito (DNA genomico) e un controllo digerito. Il controllo non digerito determina il segnale di base per i set di primer e viene utilizzato con il controllo della digestione reticolato per determinare l’efficienza della digestione Si prevede che ci sarà un calo del prodotto per qualsiasi primer diretto attraverso un sito di restrizione. Il confronto di questo valore con il controllo non digerito fornisce un’indicazione di quanto bene il campione è stato digerito.
I primer per la PCR includono un primer di controllo e primer di prova. Il primer di controllo è un set di primer che si trova vicino alla regione genomica da analizzare e non contiene un sito di restrizione. Ciò fornisce la linea di base per determinare l’abbondanza dei prodotti PCR primer di prova. I primer di prova sono primer avanti e indietro che fiancheggiano un sito di restrizione per un particolare locus genomico di interesse (Figura 3). Le reazioni che utilizzano questi set di primer vengono confrontate per determinare l’efficienza della digestione, poiché l’abbondanza di prodotto dovrebbe diminuire se il sito di restrizione è stato tagliato. Nel determinare l’organizzazione della cromatina, un primer di prova da un locus è accoppiato con un altro primer di prova da un altro locus genomico per determinare se questi due loci sono vicini nello spazio 3D. In tal caso, l’aspettativa è che un prodotto PCR venga trovato solo utilizzando il campione 3C come modello.
È importante notare che anche i primer convalidati hanno la tendenza a fallire (Figura 4: set di primer r14). Inoltre, i prodotti PCR sono spesso identificati nelle reazioni di controllo e nelle reazioni in cui non è prevista una connessione della cromatina (come il controllo digerito, poiché non è legato). Queste istanze vengono sequenziate e non superano il controllo qualità Sanger o restituiscono senza una sequenza definita (Figura 5). Inoltre, gli esperimenti 3C tradizionali generano un “modello di controllo”, un campione di DNA non reticolato, digerito e legato, che rappresenta tutti i possibili frammenti legati che possono essere prodotti con una data quantità di DNA. Il “modello di controllo” svolge un ruolo importante nel confrontare le intensità dei segnali qPCR tra due loci genomici per determinare se il segnale rappresenta una vera interazione o solo un’associazione casuale. La creazione di un “modello di controllo” può essere problematica, poiché gran parte della cromatina da analizzare deve essere catturata sotto forma di cromosoma artificiale ed elaborata insieme ai campioni 3C. Garantire un tale costrutto potrebbe non essere fattibile e crearne uno potrebbe essere al di fuori dell’ambito di un progetto semestrale. A causa di queste difficoltà, si consiglia di utilizzare un primer di controllo. Il primer di controllo non sostituisce tutte le funzionalità del “modello di controllo”, ma offre comunque l’opportunità di analizzare i dati per effettuare determinazioni di “presenza” o “assenza”.
Quando si esegue la qPCR, è importante utilizzare quantità uguali di campione. Questo dovrebbe essere determinato, anche se si utilizza un nano-spettrofotometro come un nanodrop, generando una curva standard dal DNA genomico di una concentrazione nota e adattando i campioni 3C a quella linea. Queste quantità devono essere registrate e utilizzate nelle PCR successive. Anche la qualità della reazione PCR è importante. Poiché la PCR viene eseguita in qPCR, l’abbondanza del prodotto viene misurata utilizzando la fluorescenza e registrata. Questa registrazione è accessibile nel grafico di amplificazione. Una volta terminato il programma, è importante controllare il grafico di amplificazione e assicurarsi che le reazioni (ad eccezione dei controlli no template) abbiano tre fasi: una baseline, una esponenziale e una fase plateau/saturazione. È importante verificare che le reazioni abbiano una fase esponenziale, in particolare per la definizione della soglia (vedi sotto). Inoltre, per i campioni diluiti in serie, dovrebbe esserci uno spostamento dei valori di Ct coerente con la diluizione del campione (la concentrazione più alta avrà i valori di Ct più bassi, mentre la concentrazione più bassa avrà i valori di Ct più alti). I campioni che non riflettono questo cambiamento nel grafico di amplificazione richiedono una nuova diluizione o indicano un problema più ampio con la formazione del campione 3C. Infine, durante la generazione della curva standard, il software PCR calcolerà l’efficienza della PCR e il valore R2 . L’efficienza della PCR dovrebbe essere superiore al 90% e il valore di R2 dovrebbe essere maggiore di 0,99. Se una di queste condizioni non è soddisfatta, è probabile che qualcosa non vada nel campione o nei primer PCR.
Dopo la qPCR, la percentuale di digestione e la presenza di interazioni 3C possono essere calcolate utilizzando la qPCR Ct per ogni reazione. Per determinarli, in primo luogo, deve essere impostata la soglia per la reazione PCR. Questo viene normalmente fatto utilizzando il software fornito con la macchina qPCR. L’impostazione della soglia definirà la concentrazione del prodotto PCR che verrà utilizzato per confrontare i valori di Ct del campione. La soglia dovrebbe dividere in due le curve di amplificazione delle reazioni PCR nella fase esponenziale di amplificazione. Solo le reazioni PCR con amplificazione esponenziale possono essere confrontate (in questo caso, i primer di controllo e le reazioni di primer del test), poiché questo è l’unico modo per garantire che le reazioni stiano amplificando il DNA alla stessa velocità e possano essere confrontate fedelmente. Quando si analizzano i grafici 3C, le reazioni condizionatamente positive sono identificate come quelle con più prodotto rispetto ai campioni di controllo, al controllo genomico e al controllo della digestione (Figura 4B). Tuttavia, questi campioni devono essere ulteriormente convalidati utilizzando il sequenziamento Sanger dopo la purificazione del gel del prodotto PCR.
Dopo il sequenziamento Sanger, i campioni che superano il controllo qualità possono essere analizzati utilizzando Blat. L’obiettivo di questa analisi è determinare se il campione ha la sequenza di entrambi i loci genomici bersaglio che fiancheggiano il sito di restrizione (DpnII nel caso di questo protocollo). Se vengono identificate entrambe le sequenze, il frammento 3C può essere considerato convalidato. Se i risultati del Blat non restituiscono la sequenza prevista, ciò potrebbe indicare che uno o entrambi i primer non sono ottimali, con conseguente risultato qPCR falso positivo. I file di traccia per i campioni falsi positivi avranno picchi di base indefiniti e i report Seq conterranno principalmente “n” chiamate di base.
La convalida con metodo Sanger è essenziale, poiché sono possibili falsi positivi dalla formazione di prodotti PCR artifattuali. Questi falsi positivi possono essere identificati quando i prodotti di sequenziamento non hanno la sequenza target prevista o una caratteristica del sito DpnII di un frammento 3C appropriato (Figura 5). Il sequenziamento dei frammenti di PCR fornisce anche un altro punto dati per l’esperimento e fa capire agli studenti che la tecnica 3C sta identificando loci genomici distanti che si stanno unendo nello spazio 3D all’interno dei nuclei.
La tecnica 3C fornisce una vasta gamma di tecniche molecolari fondamentali per gli studenti universitari in una procedura flessibile e semplice. Questa tecnica 3C è anche un punto di partenza per le altre tecniche 3C che incorporano il sequenziamento di nuova generazione (NGS). Questi tipi di esperimenti possono esporre gli studenti universitari ad aspetti importanti della bioinformatica e sono radicati nei principi di base qui delineati. L’esperienza universitaria e il coinvolgimento sono fondamentali per il loro successo e sviluppo come giovani scienziati. Fornendo queste opportunità, gli studenti universitari possono rafforzare la loro comprensione dei principi di base mentre costruiscono la loro fiducia per affrontare tecniche e domande all’avanguardia.
The authors have nothing to disclose.
Questo lavoro è stato sostenuto in parte dal Rhode Island Institutional Development Award (IDeA) Network of Biomedical Research Excellence del National Institute of General Medical Sciences del National Institutes of Health con il numero di sovvenzione P20GM103430 e dal Bryant Center of Health and Behavioral Sciences.
37% Formaldehyde | Millapore-Sigma | F8775 | |
100% Ethanol | Millapore-Sigma | E7023 | |
CaCl2 | MP Biomedical | 215350280 | |
chloroform | Millapore-Sigma | C0549 | |
cOmplete, EDTA-free Protease Inhibitor Cocktail | Millapore-Sigma | COEDTAF-RO | mixed to 50x in water. Diluted to 1x in Sucrose buffer and GB buffer fresh |
Dithiothreitol (DTT) | Millapore-Sigma | D0632 | 1 M stock diluted to 500 µM in Sucrose buffer and GB buffer fresh |
DpnII | NEB | R0543M | |
Glycerol | Millapore-Sigma | G9012 | |
glycine | Millapore-Sigma | G8898 | |
glycogen | Millapore-Sigma | 10901393001 | |
HEPES | Millapore-Sigma | H3375 | |
KCl | Millapore-Sigma | P3911 | |
KH2PO4 | Millapore-Sigma | P5655 | |
methyl green pyronin | Millapore-Sigma | HT70116 | |
MgAc2 | Thermoscientific | 1222530 | |
Na2HPO4 | Millapore-Sigma | S5136 | |
NaCl | Millapore-Sigma | S9888 | |
phenol-chloroform | Millapore-Sigma | P3803 | |
Pronase | Millapore-Sigma | 11459643001 | |
Proteinase K | IBI Scientific | IB05406 | |
qPCR Ready mix (Phire Taq etc) | Millapore-Sigma | KCQS07 | |
RNase A | Millapore-Sigma | R6148 | |
Sodium Acetate | Millapore-Sigma | S2889 | |
sodium dodecyl sulfate (SDS) | Millapore-Sigma | L3771 | |
Sucrose | Millapore-Sigma | S0389 | |
T4 DNA Ligase | Promega | M1804 | |
Tris-HCl | Millapore-Sigma | 108319 | |
Triton X-100 | Millapore-Sigma | T9284 | |
Trypsin-EDTA | Millapore-Sigma | T4049 |