Genexpressie wordt gereguleerd door interacties van genpromotors met distale regulerende elementen. Hier beschrijven we hoe low input Capture Hi-C (liCHi-C) de identificatie van deze interacties in zeldzame celtypen mogelijk maakt, die voorheen niet meetbaar waren.
Spatiotemporale gentranscriptie wordt strak gereguleerd door distale regulerende elementen, zoals versterkers en geluiddempers, die afhankelijk zijn van fysieke nabijheid met hun doelgenpromotors om transcriptie te regelen. Hoewel deze regulerende elementen gemakkelijk te identificeren zijn, zijn hun doelgenen moeilijk te voorspellen, omdat de meeste celtypespecifiek zijn en kunnen worden gescheiden door honderden kilobases in de lineaire genoomsequentie, waarbij andere niet-doelgenen worden overgeslagen. Sinds enkele jaren is Promoter Capture Hi-C (PCHi-C) de gouden standaard voor de associatie van distale regulerende elementen aan hun doelgenen. PCHi-C is echter afhankelijk van de beschikbaarheid van miljoenen cellen, waardoor de studie van zeldzame celpopulaties zoals die gewoonlijk worden verkregen uit primaire weefsels, wordt verboden. Om deze beperking te overwinnen, is low input Capture Hi-C (liCHi-C), een kosteneffectieve en aanpasbare methode om het repertoire van distale regulerende elementen te identificeren die elk gen van het genoom beheersen, ontwikkeld. liCHi-C vertrouwt op een vergelijkbaar experimenteel en computationeel raamwerk als PCHi-C, maar door minimale buisveranderingen toe te passen, de reagensconcentratie en -volumes te wijzigen en stappen te verwisselen of te elimineren, is het goed voor minimaal materiaalverlies tijdens de bouw van de bibliotheek. Gezamenlijk maakt liCHi-C de studie van genregulatie en spatiotemporale genoomorganisatie mogelijk in de context van ontwikkelingsbiologie en cellulaire functie.
Temporele genexpressie stimuleert celdifferentiatie en, uiteindelijk, de ontwikkeling van organismen, en de verandering ervan is nauw verbonden met een breed scala aan ziekten 1,2,3,4,5. Gentranscriptie wordt fijn gereguleerd door de werking van regulerende elementen, die kunnen worden geclassificeerd als proximaal (d.w.z. genbevorderaars) en distale (bijv. versterkers of geluiddempers), waarvan de laatste zich vaak ver van hun doelgenen bevinden en fysiek met hen interageren door chromatinelussen om genexpressie 6,7,8 te moduleren.
De identificatie van distale regulerende regio’s in het genoom is een zaak waarover algemeen wordt gesproken, aangezien deze regio’s specifieke histonmodificaties 9,10,11 bevatten en specifieke transcriptiefactorherkenningsmotieven bevatten, die fungeren als wervingsplatforms voor hen12,13,14. Trouwens, in het geval van enhancers en super-enhancers 15,16, hebben ze ook een lage nucleosoombezetting 17,18 en worden ze getranscribeerd in niet-coderende eRNA’s 19,20.
Niettemin zijn de doelgenen van elk distale regulerend element moeilijker te voorspellen. Vaker wel dan niet, interacties tussen distale regulerende elementen en hun doelen zijn celtype en stimulusspecifiek 21,22, beslaan honderden kilobases, overbruggen over andere genen in elke richting 23,24,25, en kunnen zelfs worden gelokaliseerd in intronische gebieden van hun doelgen of andere niet-interveniërende genen 26,27. Bovendien kunnen distale regulerende elementen ook meer dan één gen tegelijk aansturen, en vice versa28,29. Deze positionele complexiteit belemmert het lokaliseren van regulerende associaties tussen hen, en daarom blijven de meeste doelen van elk regulerend element in elk celtype onbekend.
In de afgelopen jaren is er een aanzienlijke hausse geweest in de ontwikkeling van chromosoomconformatie-capture (3C) -technieken voor het bestuderen van chromatine-interacties. De meest gebruikte van hen, Hi-C, maakt het mogelijk om een kaart te genereren van alle interacties tussen elk fragment van het genoom van een cel30. Om significante interacties op het niveau van restrictiefragmenten te detecteren, vertrouwt Hi-C echter op ultradiepe sequencing, waardoor het gebruik ervan wordt verboden om routinematig het regulerende landschap van individuele genen te bestuderen. Om deze economische beperking te overwinnen, zijn verschillende op verrijking gebaseerde 3C-technieken ontstaan, zoals ChIA-PET31, HiChIP 32 en zijn tegenhanger met lage input HiCuT33. Deze technieken zijn afhankelijk van het gebruik van antilichamen om te verrijken voor genoombrede interacties gemedieerd door een specifiek eiwit. Toch is het unieke kenmerk van deze 3C-technieken ook de vloek van hun toepassing; Gebruikers rekenen op de beschikbaarheid van hoogwaardige antilichamen voor het eiwit van belang en kunnen geen omstandigheden vergelijken waarin de binding van het eiwit dynamisch is.
Promoter Capture Hi-C (PCHi-C) is een andere op verrijking gebaseerde 3C-techniek die deze beperkingen omzeilt34,35. Door gebruik te maken van een gebiotinyleerd RNA-sondeverrijkingssysteem, is PCHi-C in staat om genoombrede hogeresolutiebibliotheken van genomische regio’s te genereren die interageren met 28.650 menselijke of 27.595 muis-geannoteerde genpromotors, ook bekend als het promotorinteractoom. Deze benadering stelt men in staat om significante langeafstandsinteracties te detecteren op het niveau van restrictiefragmenten van zowel actieve als inactieve promotors, en promotorinteractomen robuust te vergelijken tussen elke aandoening, onafhankelijk van de dynamiek van histonmodificaties of eiwitbinding. PCHi-C is de afgelopen jaren op grote schaal gebruikt om promotor-interactoomreorganisaties te identificeren tijdens celdifferentiatie 36,37, het werkingsmechanisme van transcriptiefactoren38,39 te identificeren en nieuwe potentiële genen en routes te ontdekken die in de ziekte zijn gedereguleerd door niet-coderende varianten 40,41,42,43,44,45,46,47,48, naast nieuwe driver niet-coderende mutaties49,50. Bovendien kan deze techniek, door alleen het vangsysteem aan te passen, worden aangepast aan de biologische vraag om elk interactoom te ondervragen (bijvoorbeeld het enhancer-interactoom 51 of het interactoom van een verzameling niet-coderende wijzigingen41,52).
PCHi-C vertrouwt echter op minimaal 20 miljoen cellen om de techniek uit te voeren, wat de studie van schaarse celpopulaties zoals die vaak worden gebruikt in ontwikkelingsbiologie en klinische toepassingen voorkomt. Om deze reden hebben we low input Capture Hi-C (liCHi-C) ontwikkeld, een nieuwe kosteneffectieve en aanpasbare methode op basis van het experimentele raamwerk van PCHi-C om promotorinteractomen met hoge resolutie te genereren met laagcellige input. Door het experiment uit te voeren met minimale buisveranderingen, stappen uit het oorspronkelijke PCHi-C-protocol te verwisselen of te elimineren, de reactievolumes drastisch te verminderen en reagensconcentraties te wijzigen, wordt de complexiteit van de bibliotheek gemaximaliseerd en is het mogelijk om bibliotheken van hoge kwaliteit te genereren met slechts 50.000 cellen53.
Low input Capture Hi-C (liCHi-C) is vergeleken met PCHi-C en gebruikt om promotor interactome herbedrading tijdens menselijke hematopoietische celdifferentiatie op te helderen, potentiële nieuwe ziekte-geassocieerde genen en routes te ontdekken die zijn gedereguleerd door niet-coderende veranderingen, en chromosomale afwijkingen te detecteren53. Het stapsgewijze protocol en de verschillende kwaliteitscontroles via de techniek worden hier gedetailleerd beschreven tot de laatste generatie van de bibliotheken en hun computationele analyse.
liCHi-C biedt de mogelijkheid om interactoombibliotheken met hoge resolutie te genereren met behulp van een vergelijkbaar experimenteel raamwerk van PCHi-C’s, maar met een sterk verminderd celnummer. Dit wordt in hoge mate bereikt door het elimineren van onnodige stappen, zoals fenolzuivering en biotineverwijdering. In het klassieke in-nucleus ligatie Hi-C protocol57 en de daaropvolgende afgeleide techniek PCHi-C wordt biotine verwijderd uit niet-geligeerde restrictiefragmenten om te voorkomen dat…
The authors have nothing to disclose.
We bedanken de rest van de leden van het Javierre lab voor hun feedback op het manuscript. We danken het CERCA-programma, Generalitat de Catalunya en de Josep Carreras Foundation voor institutionele steun. Dit werk werd gefinancierd door FEDER/Spaans Ministerie van Wetenschap en Innovatie (RTI2018-094788-A-I00), de European Hematology Association (4823998) en de Spaanse Vereniging tegen Kanker (AECC) LABAE21981JAVI. BMJ wordt gefinancierd door het La Caixa Banking Foundation Junior Leader-project (LCF / BQ / PI19 / 11690001), LR wordt gefinancierd door een AGAUR FI-beurs (2019FI-B00017) en LT-D wordt gefinancierd door een FPI Fellowship (PRE2019-088005). We danken het biochemie en moleculaire biologie PhD-programma van de Universitat Autònoma de Barcelona voor zijn steun. Geen van de financiers was op enig moment betrokken bij het experimentele ontwerp of het schrijven van manuscripten.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |