このプロトコルは、トポロジー的会合ドメイン(TAD)の境界や、調節と他のDNA配列要素との間の長距離クロマチン相互作用など、メガベースサイズの標的ゲノム領域の3D組織を高解像度で特徴付けるために使用されるCapture Hi-C法について説明しています。
ゲノムの空間構成は、転写、複製、組換え、修復など、多くの状況でその機能と調節に貢献しています。したがって、ゲノムトポロジーと機能の間の正確な因果関係を理解することは非常に重要であり、ますます集中的な研究の対象となっています。染色体立体構造捕捉技術(3C)は、ゲノムの任意の領域間の相互作用の頻度を測定することにより、クロマチンの3D構造を推測することを可能にする。ここでは、メガベースサイズのゲノムターゲットの対立遺伝子特異的3D組織を高解像度で特徴付ける3Cベースのターゲット濃縮法であるCapture Hi-Cを実行するための高速で簡単なプロトコルについて説明します。Capture Hi-Cでは、ダウンストリームのハイスループットシーケンシングの前に、ターゲット領域がビオチン化プローブのアレイによってキャプチャされます。したがって、より高い分解能と対立遺伝子特異性が達成され、技術の時間効率と手頃な価格が向上します。その強みを実証するために、Capture Hi-Cプロトコルを、X染色体不活性化(XCI)のマスター調節遺伝子座であるマウスX不活性化センター (Xic)に適用しました。
線形ゲノムは、生物が胚発生を経験し、成人期を通して生き残るために必要なすべての情報を保持しています。しかし、遺伝的に同一の細胞に異なる機能を実行するように指示することは、異なる組織や発生段階を含む特定のコンテキストで使用される情報を正確に制御するための基本です。ゲノムの3次元構成は、線状ゲノム内の数百キロベース離れることができる調節要素間の物理的相互作用を促進または防止することにより、遺伝子活性のこの正確な時空間調節に関与していると考えられています(レビュー1,2,3).過去20年間で、ゲノムフォールディングと活性の相互作用に関する私たちの理解は、主に染色体立体構造捕捉技術(3C)の開発により急速に増加しました(レビュー4,5,6,7)。これらの方法は、ゲノムの任意の領域間の相互作用の頻度を測定し、核内で3D近接しているDNA配列のライゲーションに依存しています。最も一般的な3Cプロトコルは、ホルムアルデヒドなどの架橋剤で細胞集団を固定することから始まります。その後、架橋クロマチンは制限酵素で消化されますが、MNase消化も使用されています8,9。消化後、空間的に近接した遊離DNA末端が再ライゲーションされ、架橋が逆転します。このステップにより、核に3D近接していた配列が同じDNA断片にライゲーションされる可能性が高いハイブリッド断片の混合プールである3C「ライブラリ」または「テンプレート」が生じます。これらのハイブリッドフラグメントの下流定量により、線形ゲノム内で数千塩基対離れて位置しているが、3D空間で相互作用する可能性のあるゲノム領域の3Dコンフォメーションを推測できます。
3Cライブラリの特性評価にはさまざまなアプローチが開発されており、ライゲーションフラグメントのサブセットを分析する方法と、その下流の定量に使用する技術の両方が異なります。元の3Cプロトコルは、2つの関心領域の選択と、PCR10,11によるそれらの「1対1」の相互作用頻度の定量化に依存していました。4Cアプローチ(環状染色体コンフォメーションキャプチャ)は、関心のある単一の遺伝子座(「視点」)とゲノムの残りの部分(「1つ対すべて」)の間の相互作用を測定します12,13,14。4Cでは、3Cライブラリーは2回目の消化および再ライゲーションを経て、視点特異的プライマー15によってPCR増幅される小環状DNA分子を生成する。5C(染色体コンフォメーションキャプチャーカーボンコピー)は、より大きな関心領域にわたる3D相互作用の特性評価を可能にし、その領域内の高次クロマチンフォールディング(「多対多」)に関する洞察を提供します16。5Cにおいて、3Cライブラリーは、制限部位と重複するオリゴヌクレオチドのプールにハイブリダイズされ、その後、ユニバーサルプライマー15を用いたマルチプレックスPCRによって増幅され得る。4Cと5Cの両方で、有益なDNA断片は最初にマイクロアレイによって定量され、後に次世代シーケンシング(NGS)によって定量されました17,18,19。これらの戦略は、標的の関心領域を特徴付けますが、ゲノム全体の相互作用のマッピングには適用できません。この後者の目標は、3Cテンプレートの超並列シーケンシングにより、ゲノムワイドレベル(「すべて対すべて」)でのクロマチンフォールディングの偏りのない特性評価を可能にする3Cベースのハイスループット戦略であるHi-Cによって達成されます20。Hi-Cプロトコルには、消化されたフラグメントの末端にビオチン化残基を組み込み、その後、ライゲーションフラグメントをストレプトアビジンビーズでプルダウンして、ライゲーションフラグメントの回収率を高めることが含まれます20。
Hi-Cは、哺乳類のゲノムが3次元核内で複数のスケールで構造的に組織化されていることを明らかにしました。メガベーススケールでは、ゲノムは活性クロマチンと不活性クロマチンの領域、それぞれAコンパートメントとBコンパートメントに分けられます20,21。異なるクロマチンおよび活性状態によって表されるさらなるサブコンパートメントの存在もまた、続いて示された22。より高い解像度では、ゲノムはさらにトポロジー的会合ドメイン(TAD)と呼ばれるサブメガベースの自己相互作用ドメインに分割され、ヒトおよびマウスゲノムのHi-Cおよび5C分析によって最初に明らかにされる23,24。組織特異的に変化するコンパートメントとは異なり、TADは一定である傾向があります(ただし、多くの例外があります)。重要なことに、TAD境界は種全体で保存されています25。哺乳類細胞では、TADは同じ調節ランドスケープを共有する遺伝子を包含することが多く、隣接する調節ドメインとの相互作用を制限しながら遺伝子共制御を促進する構造フレームワークを表すことが示されています(レビュー3,26,27,28)。さらに、TAD内では、コヒーシン押出ループの基部にあるCTCF部位による相互作用は、プロモーター-エンハンサーまたはエンハンサー-エンハンサー相互作用の可能性を高める可能性がある(レビュー29)。
Hi-Cでは、コンパートメントとTADは1 Mb〜40 kbの解像度で検出できますが、5〜10 kbのスケールで遠位エレメント間のループ相互作用などのより小さなスケールの接触を特徴付けるために、より高い分解能を実現できます。ただし、このようなループをHiCで効率的に検出できるように分解能を上げるには、シーケンシングの深さを大幅に増やす必要があり、したがってシーケンシングコストも増加します。分析が対立遺伝子特異的である必要がある場合、これは悪化します。実際、分解能をX倍に高めるには、シーケンシングの深さをX2 増加させる必要があり、高解像度で対立遺伝子特異的なゲノムワイドアプローチは法外に高価になる可能性があります30。
高分解能を維持しながら費用対効果と手頃な価格を向上させるために、ターゲット領域は、ダウンストリームシーケンシングの前に相補的なビオチン標識オリゴヌクレオチドプローブとのハイブリダイゼーション後に、ゲノムワイドな3CまたはHi-Cライブラリから物理的にプルダウンできます。これらの標的濃縮戦略はCapture-C法と呼ばれ、ゲノム全体に散在する数百の標的遺伝子座の相互作用の調査を可能にします(すなわち、プロモーターキャプチャー(PC)Hi-C;次世代(NG)キャプチャ-C;低入力(LI)キャプチャ-C;核滴定(NuTi)キャプチャ-C;Tri-C)31、32、33、34、35、36、37、38、39、40、または複数のメガベースにまたがる地域間(すなわち、Capture HiC;ハイブリッドキャプチャハイC(ハイC2);タイル-C)41,42,43。キャプチャベースの方法では2つの態様が異なる場合があります:(1)ビオチン化オリゴヌクレオチド(すなわち、RNAまたはDNA、分散したゲノムターゲットを捕捉する単一オリゴ、または関心領域をタイリングする複数のオリゴ)の性質および設計;(2)ターゲットをプルダウンするために使用されるテンプレートは、3CまたはHi-Cライブラリであり得、後者は3Cライブラリからプルダウンされたビオチン化制限断片からなる。
ここでは、3Cライブラリからのターゲットコンタクトのエンリッチメントに基づくキャプチャHi-Cプロトコルについて説明します。このプロトコルは、ビオチン化RNAプローブのカスタムメイドのタイリングアレイの設計に依存しており、3Cライブラリの調製からNGSシーケンシングまで1週間で実行できます。このプロトコルは高速でシンプルで、メガベースサイズの関心領域の高次3D構成を5 kbの解像度で特徴付けることができ、他の3Cメソッドと比較して時間効率と手頃な価格が向上します。Capture Hi-Cプロトコルは、X染色体不活性化(XCI)のマスター調節遺伝子座であるX-不活性化センター(Xic)に適用され、XistノンコーディングRNAをホストします。Xicは、以前は広範な構造および機能分析の対象となっていました(レビュー44,45)。哺乳類では、XCIは雌(XX)と雄(XY)の間のX結合遺伝子の投与量を補い、雌細胞内の2つのX染色体のうちの1つのほぼ全体の転写サイレンシングを含みます。Xicは、3Dゲノムトポロジーと遺伝子制御との相互作用の研究のための強力でゴールドスタンダードの遺伝子座を表しています44。マウス胚性幹細胞(mESC)におけるXicの5C分析は、TADの発見と命名につながり、トポロジカル分割と遺伝子共制御の機能的関連性に関する最初の洞察を提供しました24。その後、Xicのトポロジカル構成は、XistのアップレギュレーションとXCI46の適切な発生タイミングに決定的に関与していることが示され、TAD内およびTAD間の遺伝子活性に影響を与える可能性のある疑われないシス調節要素も最近Xic47,48,49内で発見されました。Capture Hi-CをXicにまたがるマウスX染色体の3 Mbに適用すると、大規模なクロマチンフォールディングを高解像度で解剖するこのアプローチの力が実証されます。対象領域内のすべてのDpnII制限部位にわたるビオチン化プローブのアレイの設計から、ゲノムワイドな3Cライブラリの生成、ターゲットコンタクトのハイブリダイゼーションとキャプチャ、およびダウンストリームデータ解析まで、詳細でわかりやすいプロトコルが提供されます。また、適切な品質管理と期待される結果の概要も含まれており、同様の既存の方法に照らして、アプローチの長所と限界の両方について説明します。
ここでは、メガベースサイズのゲノム領域の高次構成を5〜10 kbの解像度で特徴付けるための比較的迅速で簡単なCapture Hi-Cプロトコルについて説明します。Capture Hi-Cは、ゲノムワイドな3CまたはHi-Cテンプレートから標的クロマチン相互作用を濃縮するように設計されたCapture-Cテクノロジーのファミリーに属しています。現在までに、Capture-Cアプリケーションの大部分は、ゲノム全体に散在する比較的小さな調節要素のクロマチン接触をマッピングするために利用されてきました。第1のCapture−Cプロトコルにおいて、赤血球細胞31から調製された3Cライブラリー中の>400個の予め選択されたプロモーターを捕捉するために、複数の重複RNAビオチン化プローブを使用した。その後、次世代(NG)および核滴定(NuTi)キャプチャ-Cでも同じ戦略が改善され、単一の制限部位にまたがる単一の120 bp DNAベイトと2回の連続したキャプチャーを使用して、有益なライゲーションフラグメントの濃縮を最大化することにより、>8,000プロモーターの高解像度相互作用プロファイルを達成しました32,40。.これらの戦略は、マウス胚発生、細胞分化、X染色体の不活性化、および病理学的状態における遺伝子の誤調節を含む、多くの異なる状況でシス作用要素の機能的解剖につながりました46、63、65、66、67、68、69、70、71。
Promoter Capture Hi−C(PCHi−C)において、制限フラグメント34,72のいずれかまたは両端における単一RNA 120-merビオチン化プローブのハイブリダイゼーションによって、制限フラグメントを含む>22,000個のアノテーション付きプロモーターをHi−Cライブラリーからプルダウンした。この方法では、マウス胚性幹細胞、胎児肝細胞、脂肪細胞34,35,72,73だけでなく、ヒトリンパ芽球系、造血前駆細胞、表皮角化細胞、多能性細胞など、急速に増加する細胞型における数千のプロモーターの相互作用の解剖が可能になりました37,74,75,76,77.
これらのターゲット濃縮技術と比較して、Capture Hi-Cはメガベーススケールまでの連続したゲノム領域をターゲットとし、それによって1つ以上のTADにまたがり、遺伝子の調節ランドスケープを網羅します。対象領域全体を、ターゲット内の各DpnII制限部位を包含するビオチン化プローブのアレイでタイリングする必要があります。ビオチン化アレイの3Cテンプレートへのハイブリダイゼーション、それに続くストレプトアビジンベースの捕捉、およびマルチプレックスシーケンシングのための処理は、イルミナペアエンドマルチプレックスシーケンシングのターゲットエンリッチメントシステムを使用して実行されます。プロトコル全体は、3Cライブラリの準備からNGSシーケンシングまで1週間で実行できるため高速であり、わずかな適応やカスタム固有のトラブルシューティングのみが必要です。
このプロトコルは、他の3Cベースの方法と比較して利点も提供します。5〜10 kbの解像度で相互作用マップを取得するために、100〜120 Mのペアエンドリードをシーケンスしました。比較として、ここでは571 MリードのHi-Cデータセットを使用して20 kbの解像度64 (GSM2053973)に到達し、染色体全体のHi-C22で5 kbの解像度に到達するには少なくとも10億リードが必要です。
本研究で用いた捕捉Hi−Cは、6bpカッター制限酵素47 に基づいて以前に公表された5Cよりもはるかに高い分解能に達する(補足表1)。重要なことに、5Cにおける標的相互作用を強化および増幅するために設計された戦略では、クロマチン相互作用の対立遺伝子特異的分析は不可能である。それどころか、Capture Hi−Cデータは対立遺伝子特異的にマッピングすることができ、例えばヒト細胞または遺伝的に異なるマウス系統を交配することによって誘導されたF1ハイブリッド細胞株における相同染色体の対の3D構造ランドスケープの解剖を可能にする78。対立遺伝子特異的なCapture Hi-C相互作用マップを5 kbの分解能で生成するために、SNPカバレッジを高めるために150 bpのペアエンドリードをシーケンスしました。同様の対立遺伝子特異的アプローチをヒト細胞株に適用することができ、SNPのアノテーションが利用可能である22。
重要なことに、Capture Hi-Cは一般的に高分解能を保証しながらシーケンシングコストの手頃な価格を改善しますが、カスタムメイドのビオチン化オリゴヌクレオチドの製造はこの方法の全体的なコストに影響を与えます。したがって、最適な3Cメソッドの選択は、アプリケーションによって異なり、対処されている生物学的問題と必要な解像度、および関心領域のサイズによって異なります。開発された他のCapture Hi-Cプロトコルは、ここで説明するプロトコルと主要な機能を共有しています。例えば、Capture Hi-C戦略を適用して、乳がんおよび結腸直腸がんのリスクに関連する非コード変異にまたがる~50 kbから1 Mbのゲノム領域を特徴付けました。このプロトコルでは、標的領域を3倍のカバレッジでタイリングする120量体RNAベイトをハイブリダイズすることにより、標的領域をHi-Cライブラリからプルダウンしました33、38、79。同様に、HYbrid Capture Hi-C(Hi-C 2)を使用して、最大2 Mb80の関心領域内の相互作用をターゲットにしました。どちらのプロトコルでも、ビオチンプルダウンライゲーションフラグメントに富んだHi-Cテンプレートを使用することで、当社のプロトコルと比較して、総情報リードの割合が増加しました。たとえば、ここで比較64(GSM2053973)に使用したHi-Cデータセットでは、重複を削除した後の有効なペアの割合は、図3と補足表1で説明されているように、Capture Hi-Cで得られた有効なペアの4.8倍です。ただし、ビオチン化ライゲーションフラグメントとハイブリダイズプローブの連続プルダウンにより、プロトコルが大幅に複雑になり、時間がかかると同時に、キャプチャ領域の複雑さが軽減される可能性があります。
タイリングプローブで3Cテンプレートを濃縮するための別の利用可能な方法は、マウス赤血球分化中に高い空間的および時間分解能でクロマチン構造を研究するために適用されたTiled-Cです43。Tiled-Cでは、70 bpのビオチン化プローブのパネルを使用して、2回の連続したキャプチャラウンドで大規模領域内の接触を濃縮し、標的相互作用の非常に高解像度のマップを生成します43,81。また、ダブルキャプチャエンリッチメントにより、キャプチャHi-Cと比較してプロトコルが長く複雑になります。しかし、単一の制限サイトを対象とするCapture-C戦略とは異なり、Tiled-Cでは、2回目のキャプチャはキャプチャ効率を大幅に向上させないように見えるため、おそらく省略できます43。最後に、この研究で使用されたのと同じターゲット濃縮戦略に基づく同様のタイリングアプローチが、先天性奇形の患者に記載され、トランスジェニックマウスで再設計された構造変異を含む調節ランドスケープの解剖に適用されました41,42。この場合、プローブのタイリングアレイは、DpnII制限部位41の近くではなく、ターゲット全体にわたって設計されました。それにもかかわらず、この研究は、異なる状況で大きなゲノム領域の高解像度の特性評価を達成するためのこの戦略の感度と力を強調する上で独創的でした41、42、48。
結論として、ここで説明するプロトコルは、関心のあるゲノム領域の高解像度3D特性評価のための簡単で堅牢かつ強力な戦略を表しています。このアプローチをさまざまなモデルシステム、細胞型、発生的に制御されたクロマチンランドスケープ、および健康および病理学的条件における遺伝子制御に適用することで、エピジェネティクス分野における基本的な未解決の問題の1つであるゲノムトポロジーと遺伝子制御の間の相互作用と因果関係の理解が容易になる可能性があります。さらに、Capture Hi-Cを適用して、GWAS研究によって同定されたリスク変異体の長距離相互作用と高次クロマチンフォールディングをマッピングすることは、さまざまな状況でヒト疾患に関連するノンコーディングゲノム遺伝子座の機能的関連性を明らかにし、それによって潜在的に根底にある病因のプロセスへの新しい洞察を提供する可能性があります。
The authors have nothing to disclose.
ハード研究所での作業は、欧州研究会議の上級研究者賞(XPRESS – AdG671027)によってサポートされました。A.L.は、欧州連合のマリー・スクウォドフスカ・キュリー・アクションズ個人フェローシップ(IF-838408)によってサポートされています。A.H.は、マリー・スクウォドフスカ・キュリー・グラント契約813327の下で、ITN革新的で学際的なネットワーククロムデザインによってサポートされています。著者らは、有益な技術的アドバイスを提供してくれたDaniel Ibrahim(MPI for Molecular Genetics、Berlin)、Institut Curie(パリ)のNGSプラットフォーム、およびEMBLのVladimir BenesとGenomics Core Facility(ハイデルベルク)にサポートと支援を提供してくれたことに感謝している。
10x PBS pH 7.4 | Gibco | 10010-023 | |
37% (vol/vol) paraformaldehyde solution | Electron Microscopy Sciences | 15686 | single use glass-vials; do not reuse |
50 mL PP conical tube | Falcon | 352070 | |
Agarose | Sigma | A9539-500g | |
Bioanalyzer | Agilent | G2939BA | |
Cell Scrapers – 25 cm Handle and 3.0 cm Blade | Falcon | 353089 | |
CHIR99021 | Axon Medchem BV | Axon 1386 | |
cOmplete Mini, Protease inhibitor cocktail (EDTA-free) | Merck | 11836170001 | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | |
Countess II FL | Invitrogen | ZGEXSCCOUNTESS2FL | Automated cell counter |
Covaris S2 | Covaris | 500217 | Sonicator |
DNA LoBind tube, 1.5 mL | Eppendorf | 30108051 | |
DpnII (50000 units/mL) | New England Biolabs | R0543M | |
Dulbecco's Modified Eagle Medium (DMEM) | Merck | D6429 | |
Ethanol (100%) | Merck | 1.00983.2500 | |
Fetal Bovine Serum (FBS) | Thermo Scientific | 10270106 | |
gelatine from porcine skin | Sigma | G1890 | |
GeneRuler 1 kb Plus DNA Ladder | Thermo Scientific | SM0313 | |
GlycoBlue | Thermo Scientific | AM9516 | Coprecipitant |
High-Sensitivity Bioanlayzer chips | Agilent | 5067-4626 | |
Large Cooling Centrifuge 5920 R | Eppendorf | 5948000018 | |
leukaemia inhibitory factor (LIF) | Merck | ESG1107 | |
Liquiport | KNF | NF300 | Benchtop aspiration system |
Low-binding filter tips | Biozym | VT0260U, VT0240, VT0220, VT0200U | |
Molecular biology grade water | Merck | W3500-6x500ML | |
Next Seq 500 | Illumina | SY-415-1001 | |
Next Seq 500 High Output v2 Kit (300 cycles) | Illumina | FC-404-2004 | |
Nonidet P40 Substitute (NP40) | Merck | 11332473001 | |
PD0325901 | Axon Medchem BV | Axon 1408 | |
Protease inhibitor cocktail (EDTA-free) | Merck | 11873580001 | |
Proteinase K – recombinant, PCR-grade (20 mg/mL) | Thermo Scientific | EO0491 | |
Qubit 2.0 | Thermo Scientific | Q32871 | |
Qubit assay tubes | Thermo Scientific | Q32856 | |
Qubit dsDNA High Sensitivity kit | Thermo Scientific | Q32851 | |
RNase A (10 mg/mL) | Thermo Scientific | EN0531 | |
Sodium acetate pH 5.2 (3M) | Merck | S7899 | |
speed vacuum concentrator | Eppendorf | EP5305000100-1EA | |
Agencourt AMPureXP | Beckman Coulter | A63881 | SPRI beads |
SureSelect Target Enrichment Box 1 | Agilent | 5190-8645 | |
SureSelect Target Enrichment Kit ILM Indexing Hyb Module Box 2 | Agilent | 5190-4455 | |
SureSelect XT Library Prep Kit ILM | Agilent | 5500-0132 | |
T4 ligase (30 units/µL) | Thermo Scientific | EL0013 | |
table-top Centrifuge 5427 R | Eppendorf | 5409000012 | |
Triton-X-100 (500 mL) | Merck | X100-500ML | |
Trypan Blue | Invitrogen | T10282 | |
Trypsine | Thermo Scientific | 25300054 | |
UltraPure Glycine | Thermo Scientific | 15527013 | |
β-mercaptoethanol | Thermo Scientific | 31350010 |