Die Genexpression wird durch Wechselwirkungen von Genpromotoren mit distalen regulatorischen Elementen reguliert. In dieser Arbeit beschreiben wir, wie Low Input Capture Hi-C (liCHi-C) die Identifizierung dieser Interaktionen in seltenen Zelltypen ermöglicht, die bisher nicht messbar waren.
Die räumlich-zeitliche Gentranskription wird durch distale regulatorische Elemente wie Enhancer und Silencer streng reguliert, die auf die physische Nähe zu ihren Zielgenpromotoren angewiesen sind, um die Transkription zu kontrollieren. Obwohl diese regulatorischen Elemente leicht zu identifizieren sind, sind ihre Zielgene schwer vorherzusagen, da die meisten von ihnen zelltypspezifisch sind und in der linearen Genomsequenz durch Hunderte von Kilobasen getrennt sein können, wodurch andere Nicht-Zielgene übersprungen werden. Seit einigen Jahren ist Promoter Capture Hi-C (PCHi-C) der Goldstandard für die Assoziation von distalen regulatorischen Elementen mit ihren Zielgenen. PCHi-C ist jedoch auf die Verfügbarkeit von Millionen von Zellen angewiesen, was die Untersuchung seltener Zellpopulationen, wie sie üblicherweise aus primären Geweben gewonnen werden, verbietet. Um diese Einschränkung zu überwinden, wurde Low Input Capture Hi-C (liCHi-C) entwickelt, eine kostengünstige und anpassbare Methode zur Identifizierung des Repertoires an distalen regulatorischen Elementen, die jedes Gen des Genoms steuern. liCHi-C basiert auf einem ähnlichen experimentellen und rechnerischen Rahmen wie PCHi-C, aber durch minimale Röhrchenwechsel, Modifikation der Reagenzienkonzentration und -volumina sowie Austausch oder Eliminierung von Schritten wird ein minimaler Materialverlust während des Bibliotheksaufbaus verursacht. Insgesamt ermöglicht liCHi-C die Untersuchung der Genregulation und der raumzeitlichen Genomorganisation im Kontext der Entwicklungsbiologie und der zellulären Funktion.
Die zeitliche Genexpression treibt die Zelldifferenzierung und letztendlich die Entwicklung von Organismen voran, und ihre Veränderung steht in engem Zusammenhang mit einer Vielzahl von Krankheiten 1,2,3,4,5. Die Gentranskription wird durch die Wirkung von regulatorischen Elementen fein reguliert, die als proximal (d. h. Genpromotoren) und distale (z. B. Enhancer oder Silencer) klassifiziert werden können, von denen letztere häufig weit von ihren Zielgenen entfernt sind und physisch mit ihnen durch Chromatinschleifen interagieren, um die Genexpression zu modulieren 6,7,8.
Die Identifizierung distaler regulatorischer Regionen im Genom ist eine Angelegenheit, über die man sich weitgehend einig ist, da diese Regionen spezifische Histonmodifikationenaufweisen 9,10,11 und spezifische Transkriptionsfaktor-Erkennungsmotive enthalten, die als Rekrutierungsplattformen für sie fungieren12,13,14. Außerdem haben sie im Fall von Enhancern und Super-Enhancern 15,16 auch eine geringe Nukleosomenbelegung 17,18 und werden in nicht-kodierende eRNAs transkribiert 19,20.
Nichtsdestotrotz sind die Zielgene der einzelnen distalen regulatorischen Elemente schwieriger vorherzusagen. In den meisten Fällen sind Interaktionen zwischen distalen regulatorischen Elementen und ihren Zielen zelltyp- und stimulusspezifisch 21,22, erstrecken sich über Hunderte von Kilobasen, überbrücken andere Gene in jede Richtung 23,24,25 und können sogar innerhalb von intronischen Regionen ihres Zielgens oder anderer nicht dazwischenliegender Gene lokalisiert werden 26,27. Darüber hinaus können distale regulatorische Elemente auch mehr als ein Gen gleichzeitig steuern und umgekehrt28,29. Diese Positionskomplexität erschwert es, regulatorische Zusammenhänge zwischen ihnen zu lokalisieren, und daher bleiben die meisten Ziele der einzelnen regulatorischen Elemente in jedem Zelltyp unbekannt.
In den letzten Jahren gab es einen bedeutenden Boom bei der Entwicklung von Techniken zur Erfassung der Chromosomenkonformation (3C) zur Untersuchung von Chromatin-Interaktionen. Die am weitesten verbreitete von ihnen, Hi-C, ermöglicht es, eine Karte aller Interaktionen zwischen jedem Fragment des Genoms einer Zelle zu erstellen30. Um jedoch signifikante Wechselwirkungen auf der Ebene der Restriktionsfragmente zu erkennen, verlässt sich Hi-C auf eine ultratiefe Sequenzierung, die seine Verwendung zur routinemäßigen Untersuchung der regulatorischen Landschaft einzelner Gene verbietet. Um diese wirtschaftlichen Einschränkungen zu überwinden, haben sich mehrere anreicherungsbasierte 3C-Techniken herausgebildet, wie z. B. ChIA-PET31, HiChIP 32 und sein Gegenstück HiCuT33 mit geringem Input. Diese Techniken beruhen auf der Verwendung von Antikörpern zur Anreicherung für genomweite Interaktionen, die durch ein bestimmtes Protein vermittelt werden. Nichtsdestotrotz ist das Alleinstellungsmerkmal dieser 3C-Techniken auch der Fluch ihrer Anwendung; Anwender verlassen sich auf die Verfügbarkeit von qualitativ hochwertigen Antikörpern für das interessierende Protein und können Bedingungen nicht vergleichen, unter denen die Bindung des Proteins dynamisch ist.
Promoter Capture Hi-C (PCHi-C) ist eine weitere anreicherungsbasierte 3C-Technik, die diese Einschränkungen umgeht34,35. Durch den Einsatz eines biotinylierten RNA-Sondenanreicherungssystems ist PCHi-C in der Lage, genomweite hochauflösende Bibliotheken von Genomregionen zu erstellen, die mit 28.650 humanen oder 27.595 mausannotierten Genpromotoren interagieren, die auch als Promotor-Interaktom bekannt sind. Dieser Ansatz ermöglicht es, signifikante langreichweitige Wechselwirkungen bei der Auflösung von Restriktionsfragmenten sowohl von aktiven als auch von inaktiven Promotoren zu detektieren und Promotor-Interaktome zwischen allen Bedingungen unabhängig von der Dynamik von Histonmodifikationen oder Proteinbindungen robust zu vergleichen. PCHi-C wurde in den letzten Jahren häufig eingesetzt, um Promotor-Interaktom-Reorganisationen während der Zelldifferenzierung zu identifizieren 36,37, den Wirkmechanismus von Transkriptionsfaktoren zu identifizieren38,39 und neue potenzielle Gene und Signalwege zu entdecken, die bei Krankheiten durch nicht-kodierende Varianten dereguliert werden 40,41,42,43,44,45,46,47,48, daneben neue nicht-kodierende Treibermutationen49,50. Außerdem kann diese Technik durch einfaches Modifizieren des Erfassungssystems entsprechend der biologischen Fragestellung angepasst werden, um jedes Interaktom (z. B. das Enhancer-Interaktom 51 oder das Interaktom einer Sammlung von nicht-kodierenden Veränderungen41, 52) abzufragen.
PCHi-C ist jedoch auf mindestens 20 Millionen Zellen angewiesen, um die Technik durchzuführen, was die Untersuchung knapper Zellpopulationen, wie sie häufig in der Entwicklungsbiologie und in klinischen Anwendungen verwendet werden, verhindert. Aus diesem Grund haben wir Low Input Capture Hi-C (liCHi-C) entwickelt, eine neue kostengünstige und anpassbare Methode, die auf dem experimentellen Rahmen von PCHi-C basiert, um hochauflösende Promotor-Interaktome mit geringem Zellinput zu erzeugen. Durch die Durchführung des Experiments mit minimalen Röhrchenänderungen, dem Austausch oder der Eliminierung von Schritten aus dem ursprünglichen PCHi-C-Protokoll, der drastischen Reduzierung des Reaktionsvolumens und der Änderung der Reagenzienkonzentrationen wird die Komplexität der Bibliothek maximiert und es ist möglich, qualitativ hochwertige Bibliotheken mit nur 50.000 Zellen zu generieren53.
Low Input Capture Hi-C (liCHi-C) wurde mit PCHi-C verglichen und verwendet, um die Neuverdrahtung des Promotor-Interaktoms während der Differenzierung menschlicher hämatopoetischer Zellen aufzuklären, potenzielle neue krankheitsassoziierte Gene und Signalwege zu entdecken, die durch nicht-kodierende Veränderungen dereguliert werden, und Chromosomenanomalien zu erkennen53. Das Schritt-für-Schritt-Protokoll und die verschiedenen Qualitätskontrollen durch die Technik werden hier bis zur endgültigen Generierung der Bibliotheken und ihrer rechnerischen Analyse detailliert beschrieben.
liCHi-C bietet die Möglichkeit, hochauflösende Promotor-Interaktom-Bibliotheken zu generieren, indem ein ähnlicher experimenteller Rahmen wie PCHi-Cs verwendet wird, jedoch mit einer stark reduzierten Zellzahl. Dies wird in hohem Maße durch den Wegfall unnötiger Schritte wie Phenolreinigung und Biotinentfernung erreicht. Beim klassischen Hi-C-Protokoll57 für die Ligatur im Zellkern und seiner nachfolgenden Derivatetechnik PCHi-C wird Biotin aus nicht-ligierten Restriktionsfragmenten entfernt…
The authors have nothing to disclose.
Wir danken den anderen Mitgliedern des Javierre-Labors für ihr Feedback zum Manuskript. Wir danken dem CERCA-Programm, der Generalitat de Catalunya und der Josep-Carreras-Stiftung für die institutionelle Unterstützung. Diese Arbeit wurde von der FEDER/dem spanischen Ministerium für Wissenschaft und Innovation (RTI2018-094788-A-I00), der European Hematology Association (4823998) und der Spanish Association against Cancer (AECC) LABAE21981JAVI finanziert. BMJ wird durch das Junior Leader-Projekt der La Caixa Banking Foundation (LCF/BQ/PI19/11690001) finanziert, LR wird durch ein AGAUR FI-Stipendium (2019FI-B00017) und LT-D durch ein FPI-Stipendium (PRE2019-088005) finanziert. Wir danken dem Doktorandenprogramm Biochemie und Molekularbiologie der Universitat Autònoma de Barcelona für seine Unterstützung. Keiner der Geldgeber war zu irgendeinem Zeitpunkt an der Versuchsplanung oder dem Schreiben des Manuskripts beteiligt.
0.4 mM Biotin-14-dATP | Invitrogen | 19524-016 | |
0.5 M EDTA pH 8.0 | Invitrogen | AM9260G | |
1 M Tris pH 8.0 | Invitrogen | AM9855G | |
10x NEBuffer 2 | New England Biolabs | B7002S | Referenced as restriction buffer 2 in the manuscript |
10x PBS | Fisher Scientific | BP3994 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202S | |
16% formaldehyde solution (w/v), methanol-free | Thermo Scientific | 28908 | |
20 mg/mL Bovine Serum Albumin | New England Biolabs | B9000S | |
5 M NaCl | Invitrogen | AM9760G | |
5PRIME Phase Lock Gel Light tubes | Qiuantabio | 2302820 | For phenol-chloroform purification in section 4 (DNA purification). Phase Lock Gel tubes are a commercial type of tubes specially designed to maximize DNA recovery after phenol-chloroform purifications while avoiding carryover of contaminants in the organic phase by containing a resin of intermediate density which settles between the organic and aqueous phase and isolates them. PLG tubes should be spun at 12,000 x g for 30 s before use to ensure that the resin is well-placed at the bottom of the tube |
Adapters and PCR primers for library amplification | Integrated DNA Technologies | – | Bought as individual primers with PAGE purification for NGS |
Cell scrappers | Nunc | 179693 | Or any other brand |
Centrifuge (fixed-angle rotor for 1.5 mL tubes) | Any brand | ||
CHiCAGO R package | 1.14.0 | ||
CleanNGS beads | CleanNA | CNGS-0050 | |
dATP, dCTP, dGTP, dTTP | Promega | U120A, U121A, U122A, U123A | Or any other brand |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210L | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65002 | For biotin pull-down of the pre-captured library in section 8 (biotin pull-down) |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65602 | For biotin pull-down of the post-captured library in section 11 (biotin pull-down and PCR amplification) |
DynaMag-2 | Invitrogen | 12321D | Or any other magnet suitable for 1.5 ml tubeL |
Ethanol absolute | VWR | 20821.321 | |
FBS, qualified | Gibco | 10270-106 | Or any other brand |
Glycine | Fisher BioReagents | BP381-1 | |
GlycoBlue Coprecipitant | Invitrogen | AM9515 | Used for DNA coprecipitation in section 4 (DNA purification) |
HiCUP | 0.8.2 | ||
HindIII, 100 U/µL | New England Biolabs | R0104T | |
IGEPAL CA-630 | Sigma-Aldrich | I8896-50ML | |
Klenow EXO- 5000 units/mL | New England Biolabs | M0212L | |
Low-retention filter tips (10 µL, 20 µL, 200 µL and 1000 µL) | ZeroTip | PMT233010, PMT252020, PMT231200, PMT252000 | |
M220 Focused-ultrasonicator | Covaris | 500295 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6 x 16 mm vials | Covaris | 520045 | For sonication in section 6 (sonication) |
NheI-HF, 100 U/µL | New England Biolabs | R3131M | |
Nuclease-free molecular biology grade water | Sigma-Aldrich | W4502 | |
PCR primers for quality controls | Integrated DNA Technologies | – | |
PCR strips and caps | Agilent Technologies | 410022, 401425 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1, Saturated with 10 mM Tris, pH 8.0, 1 mM EDTA | Sigma-Aldrich | P3803 | |
Phusion High-Fidelity PCR Master Mix with HF Buffer | New England Biolabs | M0531L | For amplification of the library in sections 9 (dATP-tailing, adapter ligation and PCR amplification) and 11 (biotin pull-down and PCR amplification) |
Protease inhibitor cocktail (EDTA-free) | Roche | 11873580001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
Qubit 1x dsDNA High Sensitivity kit | Invitrogen | Q33230 | For DNA quantification after precipitation in section 4 (DNA purification) |
Qubit assay tubes | Invitrogen | Q32856 | |
rCutsmart buffer | New England Biolabs | B6004S | |
RPMI Medium 1640 1x + GlutaMAX | Gibco | 61870-010 | Or any other brand |
SDS – Solution 10% for molecular biology | PanReac AppliChem | A0676 | |
Sodium acetate pH 5.2 | Sigma-Aldrich | S7899-100ML | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | Custom designed mouse or human capture system, used for the capture |
SureSelect Target Enrichment Box 1 | Agilent Technologies | 5190-8645 | Used for the capture |
SureSelect Target Enrichment Kit ILM PE Full Adapter | Agilent Technologies | 931107 | Used for the capture |
T4 DNA ligase 1 U/µL | Invitrogen | 15224025 | For ligation in section 3 (ligation and decrosslink) |
T4 DNA ligase 2000000/mL | New England Biolabs | M0202T | For ligation in section 9 (dATP-tailing, adapter ligation and PCR amplification) |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203L | |
T4 PNK 10000 units/mL | New England Biolabs | M0201L | |
Tapestation 4200 instrument | Agilent Technologies | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
|
Tapestation reagents | Agilent Technologies | 5067-5582, 5067-5583, 5067-5584, 5067-5585, | For automated electrophoresis in section 9 (dATP-tailing, adapter ligation, and PCR amplification) and section 11 (Biotin pull-down and PCR amplification). Any other automated electrophoresis system is valid |
Triton X-100 for molecular biology | PanReac AppliChem | A4975 | |
Tween 20 | Sigma-Aldrich | P9416-50ML |