L’espressione genica è regolata dalle interazioni dei promotori genici con gli elementi regolatori distali. Qui, descriviamo come basso input Capture Hi-C (liCHi-C) consenta l’identificazione di queste interazioni in tipi di cellule rare, che in precedenza non erano misurabili.
La trascrizione genica spaziotemporale è strettamente regolata da elementi regolatori distali, come potenziatori e silenziatori, che si basano sulla vicinanza fisica con i loro promotori genici bersaglio per controllare la trascrizione. Sebbene questi elementi regolatori siano facili da identificare, i loro geni bersaglio sono difficili da prevedere, poiché la maggior parte di essi sono specifici del tipo di cellula e possono essere separati da centinaia di kilobasi nella sequenza lineare del genoma, saltando altri geni non bersaglio. Per diversi anni, Promoter Capture Hi-C (PCHi-C) è stato il gold standard per l’associazione di elementi regolatori distali ai loro geni bersaglio. Tuttavia, PCHi-C si basa sulla disponibilità di milioni di cellule, vietando lo studio di popolazioni cellulari rare come quelle comunemente ottenute da tessuti primari. Per superare questa limitazione, è stato sviluppato Capture Hi-C (liCHi-C) a basso input, un metodo economico e personalizzabile per identificare il repertorio di elementi regolatori distali che controllano ciascun gene del genoma. liCHi-C si basa su un framework sperimentale e computazionale simile a PCHi-C, ma impiegando cambiamenti minimi del tubo, modificando la concentrazione e i volumi del reagente e scambiando o eliminando passaggi, rappresenta una perdita minima di materiale durante la costruzione della libreria. Collettivamente, liCHi-C consente lo studio della regolazione genica e dell’organizzazione spaziotemporale del genoma nel contesto della biologia dello sviluppo e della funzione cellulare.
L’espressione genica temporale guida la differenziazione cellulare e, in definitiva, lo sviluppo dell’organismo, e la sua alterazione è strettamente correlata a un’ampia pletora di malattie 1,2,3,4,5. La trascrizione genica è finemente regolata dall’azione di elementi regolatori, che possono essere classificati come prossimali (cioè promotori genici) e distali (ad esempio, potenziatori o silenziatori), questi ultimi sono frequentemente situati lontano dai loro geni bersaglio e interagiscono fisicamente con loro attraverso il looping della cromatina per modulare l’espressione genica 6,7,8.
L’identificazione delle regioni regolatorie distali nel genoma è una questione ampiamente condivisa, poiché queste regioni ospitano specifiche modificazioni degli istoni 9,10,11 e contengono specifici motivi di riconoscimento dei fattori di trascrizione, fungendo da piattaforme di reclutamento per loro12,13,14. Inoltre, nel caso di enhancer e super-enhancers 15,16, hanno anche una bassa occupazione nucleosomica 17,18 e sono trascritti in eRNA non codificanti 19,20.
Tuttavia, i geni bersaglio di ciascun elemento regolatore distale sono più difficili da prevedere. Il più delle volte, le interazioni tra gli elementi regolatori distali e i loro bersagli sono specifiche del tipo cellulare e dello stimolo 21,22, si estendono su centinaia di kilobasi, collegando altri geni in qualsiasi direzione 23,24,25 e possono anche essere localizzate all’interno di regioni introniche del loro gene bersaglio o di altri geni non intervenienti 26,27. Inoltre, gli elementi regolatori distali possono anche controllare più di un gene allo stesso tempo, e viceversa28,29. Questa complessità posizionale ostacola l’individuazione delle associazioni regolatorie tra loro e, pertanto, la maggior parte degli obiettivi di ciascun elemento regolatore in ogni tipo di cellula rimane sconosciuta.
Negli ultimi anni, c’è stato un boom significativo nello sviluppo di tecniche di cattura della conformazione cromosomica (3C) per lo studio delle interazioni della cromatina. Il più utilizzato di essi, Hi-C, permette di generare una mappa di tutte le interazioni tra ogni frammento del genoma di una cellula30. Tuttavia, per rilevare interazioni significative a livello di frammento di restrizione, Hi-C si basa sul sequenziamento ultra-profondo, vietandone l’uso per studiare regolarmente il panorama regolatorio dei singoli geni. Per superare questa limitazione economica, sono emerse diverse tecniche 3C basate sull’arricchimento, come ChIA-PET31, HiChIP 32 e la sua controparte a basso input HiCuT33. Queste tecniche dipendono dall’uso di anticorpi per arricchire le interazioni genome-wide mediate da una proteina specifica. Tuttavia, la caratteristica unica di queste tecniche 3C è anche la rovina della loro applicazione; Gli utenti contano sulla disponibilità di anticorpi di alta qualità per la proteina di interesse e non possono confrontare le condizioni in cui il legame della proteina è dinamico.
Promoter Capture Hi-C (PCHi-C) è un’altra tecnica 3C basata sull’arricchimento che aggira queste limitazioni34,35. Utilizzando un sistema di arricchimento della sonda di RNA biotinilato, PCHi-C è in grado di generare librerie ad alta risoluzione a livello di genoma di regioni genomiche che interagiscono con 28.650 promotori genici umani o 27.595 annotati nel topo, noti anche come interattoma del promotore. Questo approccio consente di rilevare interazioni significative a lungo raggio alla risoluzione a livello di frammento di restrizione di entrambi i promotori attivi e inattivi e di confrontare in modo robusto gli interattomi del promotore tra qualsiasi condizione indipendentemente dalla dinamica delle modificazioni istoniche o del legame proteico. PCHi-C è stato ampiamente utilizzato negli ultimi anni per identificare le riorganizzazioni dell’interattoma del promotore durante il differenziamento cellulare 36,37, identificare il meccanismo d’azione dei fattori di trascrizione38,39 e scoprire nuovi potenziali geni e vie deregolate nella malattia da varianti non codificanti 40,41,42,43,44,45,46,47,48, accanto alle mutazioni non codificanti del nuovo driver49,50. Inoltre, semplicemente modificando il sistema di cattura, questa tecnica può essere personalizzata in base alla domanda biologica per interrogare qualsiasi interattoma (ad esempio, l’interattoma enhancer 51 o l’interattoma di una raccolta di alterazioni non codificanti41,52).
Tuttavia, PCHi-C si basa su un minimo di 20 milioni di cellule per eseguire la tecnica, che impedisce lo studio di popolazioni cellulari scarse come quelle spesso utilizzate nella biologia dello sviluppo e nelle applicazioni cliniche. Per questo motivo, abbiamo sviluppato Capture Hi-C (liCHi-C) a basso input, un nuovo metodo economico e personalizzabile basato sul framework sperimentale di PCHi-C per generare interattomi promotori ad alta risoluzione con input a bassa cella. Eseguendo l’esperimento con minime modifiche del tubo, scambiando o eliminando passaggi dal protocollo PCHi-C originale, riducendo drasticamente i volumi di reazione e modificando le concentrazioni di reagenti, la complessità della libreria è massimizzata ed è possibile generare librerie di alta qualità con un minimo di 50.000 celle53.
Low input Capture Hi-C (liCHi-C) è stato confrontato con PCHi-C e utilizzato per chiarire il ricablaggio dell’interattoma del promotore durante la differenziazione delle cellule ematopoietiche umane, scoprire potenziali nuovi geni e percorsi associati alla malattia deregolati da alterazioni non codificanti e rilevare anomalie cromosomiche53. Il protocollo passo-passo e i diversi controlli di qualità attraverso la tecnica sono dettagliati qui fino alla generazione finale delle librerie e alla loro analisi computazionale.
liCHi-C offre la capacità di generare librerie di interattomi promotori ad alta risoluzione utilizzando un framework sperimentale simile a PCHi-C ma con un numero di celle notevolmente ridotto. Ciò si ottiene notevolmente eliminando i passaggi non necessari, come la purificazione del fenolo e la rimozione della biotina. Nel classico protocollo Hi-C57 della legatura in-nucleo e nella sua successiva tecnica derivata PCHi-C, la biotina viene rimossa dai frammenti di restrizione non legati per evita…
The authors have nothing to disclose.
Ringraziamo il resto dei membri del laboratorio Javierre per il loro feedback sul manoscritto. Ringraziamo il Programma CERCA, la Generalitat de Catalunya e la Fondazione Josep Carreras per il sostegno istituzionale. Questo lavoro è stato finanziato dal FEDER/Ministero spagnolo della Scienza e dell’Innovazione (RTI2018-094788-A-I00), dall’Associazione europea di ematologia (4823998) e dall’Associazione spagnola contro il cancro (AECC) LABAE21981JAVI. BMJ è finanziato dal progetto Junior Leader della La Caixa Banking Foundation (LCF / BQ / PI19 / 11690001), LR è finanziato da una borsa di studio AGAUR FI (2019FI-B00017) e LT-D è finanziato da una borsa di studio FPI (PRE2019-088005). Ringraziamo il programma di dottorato in biochimica e biologia molecolare dell’Universitat Autònoma de Barcelona per il suo supporto. Nessuno dei finanziatori è stato coinvolto in nessun momento nella progettazione sperimentale o nella scrittura del manoscritto.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |