DNA 規制要素、エンハンサーなどは、物理的にゲノム長距離にまたがる長距離染色体相互作用を介して多くの場合、ターゲット遺伝子のプロモーターに連絡して遺伝子発現を制御します。プロモーターが PCHi ハをやあ-C のキャプチャは、その標的遺伝子への潜在的な規制シーケンスの割り当てを有効にするプロモーターと遠位領域の重要な相互作用を識別します。
ゲノムの 3次元組織は、その機能にリンクされます。たとえば、規制など転写エンハンサー制御時空 (場合によっては何百もの kilobases の) でかなりゲノム距離を多くの場合ブリッジとバイパスの物理的な接触を介してターゲット遺伝子発現近くの遺伝子。人間のゲノムの大半がある不明、推定 100 万のエンハンサーを隠し持って遺伝子ターゲット。遺伝子発現制御を理解することが重要、その標的遺伝子に遠位の規定する領域を割り当てます。単一の実験すべてのプロモーターのプロモーターが (PCHi C) 遠位相互作用のプロモーター領域 (ピアース) のゲノム規模の検出を有効にするをやあ-C のキャプチャを開発しました。PCHi – c、非常に複雑なやあ-C ライブラリはプロモータ配列をすべてプロモーターを含む断片の両端に相補的な RNA をビオチン化餌の何千ものハイブリッド ソリューションの選択の特に濃縮されています。目的は、プルダウン プロモータ配列し、エンハンサーやその他の潜在的な規制要素などの頻繁な相互作用パートナーです。高スループット ペアエンド シーケンス後統計テストは制限のフラグメント レベルで重要なピアースを識別するために各プロモーター結紮制限のフラグメントに適用されます。人間の数十とマウスの細胞型で長距離プロモーター作用のアトラスを生成する PCHi C を使いました。これらのプロモーター インタラクトーム マップは、ターゲット遺伝子に推定の規定する領域を割り当て、優遇空間プロモーター プロモーター間相互作用ネットワークを明らかに哺乳類の遺伝子発現制御のより深い理解に貢献しました。この情報も、疾患に関連する非コードをリンクすることによってヒトの遺伝性疾患と潜在的な疾患遺伝子の同定を理解する関連性の高いシーケンスまたは制御シーケンスのターゲット遺伝子の近くの亜種。
ゲノムの 3次元組織が遺伝子活性化1,2,3,4 の抑圧を含む核プロセスの範囲の重要な役割を果たしていることを示唆している証拠の蓄積 ,5,6,7、8組換え9,10、DNA 修理11、DNA 複製12,13と細胞の老化が14。遠いエンハンサーは、彼らは適切な時空間的遺伝子発現制御のために不可欠である15,16,17を調節するプロモーターに近い空間で発見されます。エンハンサー削除表示ターゲット遺伝子転写18,19,20,21,22と ‘の forced でクロマチンのループのため遠位エンハンサーが欠かせないエンハンサーとHbbの軌跡でそのターゲットのプロモーターとの間に設計されたテザリング転写活性化23を駆動するため十分であることを示します。さらに、異所性の増強物の制御の下で遺伝子をもたらすゲノム再編成は、不適切な遺伝子の活性化と疾患24,25,26で起因できます。一緒に、プロモーター エンハンサーの相互作用は遺伝子制御に不可欠な適切な遺伝子発現を確保するための厳格な規制を必要とする例を示します。人間とマウスのゲノムのそれぞれのハーバーの周り 100 万エンハンサーと推定されています。これらの増強物の大半は、標的遺伝子が知られている, とプロモーターやエンハンサーの間 ‘ルールの契約’ は不完全に理解されます。こうして哺乳類遺伝子発現制御の解読において主要な課題に残る人のターゲット遺伝子転写のエンハンサーを割り当てます。
3 C27 (染色体構造キャプチャ) の導入とそのバリアント28,29,30,31三次元ゲノムの私達の理解をもたらしました.これらのテクニックは、やあ-C (高スループット染色体構造キャプチャ) の中で最も強力な細胞集団内で染色体の相互作用の全体のアンサンブルを識別するために設計されています。ハイ-C のライブラリ、通常細胞の数百万から生成されますは、ヒトゲノム32〜 4 kb フラグメント間推定 1011独立した結紮製品と非常に複雑です。(プロモーターやエンハンサーが含まれているなど)、個々 の制約間の相互作用の信頼性と再現性の同定結果のフラグメントとしてやあ-C のデータ可能な限りはやあ-C ライブラリ、超ディープのシーケンスに供されるこれは定期的にやあ-C ライブラリを準備する所の経済的に実行可能なソリューションではありません。この欠点を回避するためにプロモーターをキャプチャ具体的にはやあ-C ライブラリから結紮製品のプロモーターを含むを豊かにやあ-C を開発しました。我々 は 2 つの理由プロモーターに焦点を当てた。まず、プロモーター エンハンサー連絡先がたくさんの研究 (上記参照) で適切な遺伝子発現レベルの重要であると示されている、第二に、プロモーターは細胞のタイプ間主バリアント、同じキャプチャ ベイト システムを尋問する使用ことができます複数の細胞のタイプおよび条件調節回路。我々 のアプローチは、ビオチン標識 RNA 120mers プロモーターを含むやあ-C 結紮製品およびストレプトアビジン コートした磁気ビーズとそれに続くキャプチャに補足の数万人のやあ-C ライブラリのソリューションで交配に依存します。PCHi C 図書館でこの結果多くが大幅高周波数でプロモーターに組み合わされて断片の識別のみに焦点を当ててオリジナルのやあ-C ライブラリと比較しての複雑さの低減。
人間の数と推定される規制機能を暴く長距離遠位プロモーター相互作用する地域によって遺伝子発現制御のよりよい理解に貢献するマウス細胞型 PCHi C とで同様に非ランダムを使いました核の三次元空間でのプロモーター プロモーターの連絡先。多数のセル型33,34,35,36,37,38,マップいるプロモーター エンハンサー連絡先の何千もの何百も研究39、マウス胚性幹細胞7におけるポリコーム抑制複合媒介空間ゲノム構成を識別、細胞分化37,中にプロモーター interactomes の大規模な配線を実証38,39、およびリンク非コーディング疾患関連遺伝子プロモーター35の亜種を順序します。
PCHi C は、プロモーターとの相互作用の DNA シーケンスのゲノム広いアンサンブルをマップするに適して 方法です。関連するアプローチなどキャプチャやあ-C の連続ゲノム領域 (ディスカッションを参照してください) は、選択されたゲノム領域の高解像度の相互作用のプロファイルを取得する任意の方法です。PCHi C とやあ-C のキャプチャ、実験的観点から (唯一の違いは、キャプチャ システムの選択)、非常に似ている、アドバイスと提供のガイドラインが両方の方法に適用されます。ここでは、提案する PCHi C の詳細な説明根拠と PCHi C 実験の設計の概要を説明、ステップバイ ステップ PCHi C ライブラリの世代の議定書を提供する、高品質なデータを生成するプロトコルの様々 な段階での PCHi C ライブラリの品質の監視方法を示します。
モジュラー設計のプロモーターをキャプチャやあ-C
プロモーターをキャプチャやあ-C は、具体的にはプロモーターを含む相互作用のためのやあ-C ライブラリを豊かにする設計されています。これらの相互作用は、結紮製品こんにちは C ライブラリに存在のサブセットのみを構成します。
やあ-C のキャプチャは、キャプチャ システムを変更することによって genomic 地域または関心領域のやあ-C ライブラリを豊かにする簡単に変更できます。キャプチャ領域は、連続的なゲノム セグメント44,45,46,48, されている増強物をすることができます私は過敏症のサイト49 PCHi C (‘ 逆キャプチャやあ-C’35) または DNase で識別.実験的スコープに応じて、キャプチャ ・ システムのサイズを調整できます。たとえば、ドライデンら。乳房癌44に関連する 3 つの遺伝子砂漠で 519 餌フラグメントをターゲットします。マーティンらによってキャプチャ システム。両方の連続的なゲノム セグメントを対象 (‘ 領域をキャプチャ ‘: 合計 211 ゲノム領域; 2,131 制限のフラグメント)、プロモーター (3,857 遺伝子プロモーター)45を選択。
SureSelect ライブラリは、異なるサイズの範囲で利用できる: 499 kb (5,190-4,806) 2.9 mb (5,190-4,816)、500 kb を 1 kb と 5.9 mb (5,190-4,831) 3 Mb。それぞれ個々 のキャプチャのビオチン RNA は 120 ヌクレオチド長いので、これらはシステムをキャプチャ 4,158 の最大宿泊人数は、24,166 と 49,166 個々 それぞれプローブをキャプチャします。これはそれぞれ 2,079、12,083, 24,583 の対象制限のフラグメントに対応して (制限のフラグメントの番号が 2 つの個々 のキャプチャ プローブがすべての制限のような仮定に基づく下限であることに注意してくださいフラグメント-反復配列により、現実にこれがすべての制限のケースではないフラグメント (図 1 b、 Cを参照してください)、使用可能なキャプチャ プローブの一定数の対象制限のフラグメントの数の増加の結果).
ここで説明されているプロトコルは 6 bp 認識部位を長距離相互作用を明らかにする制限酵素の使用に基づいています。4 bp 認識部位より近位の相互作用のより高い解像度の制限の酵素を使用しても可能な40,49です。
PCHi C の制限
1 つ固有の制限すべての染色体構造キャプチャ アッセイは、ライブラリの生成に使用される制限の酵素がその解像度を決定することです。同じ制限のフラグメントである DNA 要素間で発生する相互作用は、’ 型 ‘ の試金に表示されません。さらに、PCHi C でいくつかのケースで 1 つ以上の転写開始部位は同じプロモーターを含む制限断片に配置でき、いくつかのケースでピアース港両方のアクティブおよび抑圧的なヒストン マークを難しくピンポイント規制要素は、の相互作用を仲介するプロモーターの相互作用の制御出力を予測します。この問題を軽減します 4 bp 認識部位による制限酵素が大幅に増加のやあ-C ライブラリの複雑さを犠牲にして来る (4 bp 認識サイト制限の酵素と生成されたこんにちは C ライブラリはやあ-C よりも少なくとも 100 倍以上複雑な6 bp 認識サイト制限の酵素と生成ライブラリ) と次世代シーケンシングのコスト。
別の制限は、現在 PCHi C プロトコルが開始材料は、まれなセルタイプのプロモーター作用の解析を排除として細胞の数百万を必要することです。10,000、100,000 細胞 (たとえば初期胚または造血幹細胞中に細胞) の細胞集団でプロモーター連絡先の尋問をする PCHi C の修正版にはキャプチャに貴重な追加となりますハイ-C のツールボックス。
最後に、ホルムアルデヒド固定に依存するすべてのメソッドと同様 PCHi C のみを記録 ‘フリーズ’ されている固定の時点でします。したがって、動態とプロモーターの相互作用の動力学を調査する超解像度の生細胞の顕微鏡検査などの方法が PCHi C. と一緒に必要な
高解像度で空間染色体組織を分析する方法
染色体操作ライブラリの広大な複雑さには、統計的有意性の 2 の特定の制限の片の間の相互作用の製品の信頼性の高い識別が禁止されています。この問題を回避するためにシーケンスのキャプチャは、やあ-C33,34,40,44または特定の相互作用の 3 C50,51ライブラリを豊かに使用されています。濃縮のステップのやあ-C ライブラリ 3 C 以上のライブラリを使用する主な利点は、やあ-C、3 C とは異なり含まれている本物の結紮用濃縮ステップです。結果として、PCHi C ライブラリで有効な読み取りの割合は約キャプチャ c ライブラリ50、約 5-8% の有効なを含んだ HiCUP フィルタ リング後読み取りよりも 10 倍高い。Sahlenらは直接 HiCap PCHi C のような 3 C ライブラリを使用してキャプチャ-C と対照をなして、キャプチャ濃縮のやあ-C のライブラリを使用するをキャプチャ-C を比較しています。我々 の調査結果に一貫した、彼らは非結紮断片40のキャプチャ C ライブラリは、主に見つけた。加えて、HiCap ライブラリは、キャプチャ C ライブラリ40より高い複雑さを持っていた。
次世代キャプチャ C52 (NG キャプチャ-C) と呼ばれるキャプチャ-C のバリアントが PCHi C33,34, 元のプローブを重複するのではなく、以前に確立として制限のフラグメントの最後あたり 1 つのオリゴを使用します。キャプチャ C プロトコル50。控えめ、キャプチャ C と比較して有効な読み取りの割合が高くこれが NG キャプチャ-C はキャプチャ濃縮の 2 つの連続したラウンドを採用し、サイクルの PCR の比較的高い数 (合計で 20 に 24 のサイクルと比較して 11 サイクル通常 PCHi c)、シーケンス重複およびライブラリ複雑さの高い数値で必然的に結果は。PCHi C の最適化中に試用実験でユニークな (すなわち、重複していない) の割合がペアがのみ約 15% 出来る 19 PCR のサイクルを読むことがわかった (事前にキャプチャし 13 サイクル + 6 サイクル後キャプチャのデータは表示されません)、しかしPCR のサイクルの数を減らすための最適化は通常 75-90% 読み取りペアを生成します。PCR のサイクル数を大幅に削減、有益なシーケンス データの量を増やします。
最近メソッドは、やあ-C (HiChIP53) の興味の特定の蛋白質を介した染色体の相互作用に焦点を当てるとチップを組み合わせたものです。HiChIP データには嘉ペット54、類似原理に基づくと比較してより高い数53を呼び出すより高い信頼の相互作用を可能にする有益なシーケンス リードにはが含まれます。対応する HiChIP を直接比較する非常に興味深いものになるし、やあ-C のキャプチャ データを一度使用可能になった (たとえばコヒーシン ユニット Smc1a に対する抗体を用いた HiChIP53とキャプチャやあ-C のすべての Smc1a バインド制限フラグメント) 側。これらの 2 つのアプローチ間の 1 つの本質的な違いはやあ-C のキャプチャはクロマチン免疫沈降に依存しないし、したがって染色体相互作用タンパク質占有関係を問い合わせることが可能です。これにより、マウス esc キー空間ゲノム アーキテクチャ7の重要な調節因子としてよう PRC1 を識別するために使用されています、特定の要因バインドの有無で 3 D ゲノム構成の比較。
PCHi C および GWAS
ゲノムワイド関連研究 (GWAS) を明らかにしたことの 95% を超える疾患関連蛋白質のコーディングの遺伝子55に遠距離が多いで、ゲノムの非コーディング領域に塩基配列変異株があります。GWAS 亜種が多い私は発見 DNase 近くに過敏症のサイト規制電位とシーケンスの認刻極印であります。PCHi C とやあ-C のキャプチャは、GWAS リスク遺伝子座乳房癌44、大腸癌48、および自己免疫疾患35,45,46に関与するプロモーターをリンクに広く使用されています。PCHi C 型が自己免疫疾患に関連する Snp はリンパ球様細胞でピアースで濃縮した血小板と赤血球の特定の特性に関連付けられているシーケンスの亜種主に発見されたに対し 17 の異なるひと造血細胞に関する研究します。大食細胞と赤芽球、それぞれ35,56。したがって、組織型特異的プロモーター PCHi C が明らかに interactomes 可能性があります非コーディングの疾患関連の機能を理解するのに役立つの亜種をシーケンス、治療的介入の新しい潜在的な病気の遺伝子を識別します。
相互作用の促進者の地域の特徴
証拠の複数のラインは、遺伝子発現制御にプロモーター interactomes をリンクします。最初に、いくつかの PCHi C 研究は、ゲノム領域 (非常に) 表現された遺伝子のプロモーターとの相互作用が H3K27 アセチル化および p300 バインディング33,34などのエンハンサー アクティビティに関連付けられているマークで濃縮され、示されています。,37. 我々 は遺伝子発現レベルおよび相互作用のエンハンサーは、遺伝子発現の増強物の結果の添加効果レベル34,35のことを示唆している数には正の相関を発見しました。第二に、量的形質遺伝子座 (eQTLs) は、式は eQTLs35によって影響される同じ遺伝子に接続しているピアースで濃縮され表現が自然発生します。第三に、旅行57と PCHi C データの統合、ケアンズら発見旅行レポーター遺伝子マウス Esc でピアースへのマッピングを示す強い記者統合サイトでレポーター遺伝子よりも遺伝子発現プロモーター-相互作用する領域に58ピアースが転写調節活性を有していることを示します。一緒に、プロモーター interactomes PCHi C によって明らかに様々 なマウスとヒトの細胞型が遺伝子発現制御の主要な規制モジュールを含めることが示唆されました。
PCHi C33,34で検出されたすべてのピアースのエンハンサーがごく一部 (~ 20%) を表すことは注目に値するです。他のピアースは、構造や位相の役割ではなく、直接転写調節機能可能性があります。ただし、PCHi C 古典的なエンハンサー マークを抱くない調節機能を持つ DNA の要素が明らかにする証拠もあります。リンパ系細胞ラインでBRD7プロモーターはレポーター遺伝子アッセイ33エンハンサー活性を有することを示したエンハンサー マークに欠けている地域との対話を発見されました。同様の特性を持つ規制要素は現在高く評価よりも多い可能性があります。たとえば、規制 DNA 要素識別マークされていない規制要素 (UREs) が遺伝子発現を制御エンハンサーを欠いているため CRISPR ベースの画面は、59をマークします。
他のケースでピアースが転写抑制に関連するクロマチン マークを港に示されています。ピアースのマウス Esc のよう PRC1 によってバインドされている相互作用するプロモーターが従事して、抑圧的なマーク H3K27me37軸受抑圧された遺伝子の広範な空間ネットワーク。ヒトリンパ芽球細胞で遠い要素BCL6プロモーターとの相互作用は遺伝子レポーター遺伝子式33、ネイティブ コンテキストにBCL6転写を抑制する機能があることを示唆を鎮圧しました。
ピアースは、Esc での人間37クロマチン絶縁体蛋白 CTCF の占有率は、ピアースのもう一つのクラスを表すことができるためにの濃縮します。総称して、ピアース港遺伝子特徴付けられる機能的にまだ規制活動のコレクションであることが示唆されました。
The authors have nothing to disclose.
ヴァレリア ・ トランスに批判的な読み原稿および図 1 による専門家の助けをありがちましょう。この作品は、医学研究評議会、英国 (氏/L007150/1) 英国バイオ ・生物科学研究会議、英国 (BB/J004480/1) によって支えられました。
16% (vol/vol) paraformaldehyde solution | Agar Scientific | R1026 | |
Dulbecco's Modified Eagle Medium (DMEM) 1x | Life Technologies | 41965-039 | |
Fetal bovine serum (FBS) sterile filtered | Sigma | F9665 | |
Low-retention filter tips | Starlab | S1180-3810, S1180-1810, S1180-8810 and S1182-1830 | |
10x PBS pH 7.4 | Life Technologies | 70011-036 | |
Molecular biology grade water | Sigma-Aldrich | W4502 | |
1 M Tris-HCl pH 8.0 | Life Technologies | 15568-025 | |
IGEPAL CA-630 | Sigma-Aldrich | I8896 | |
5 M NaCl | Life Technologies | 24740-011 | |
Protease inhibitor cocktail (EDTA-free) | Roche Diagnostics | 11873580001 | |
Restriction buffer 2 (10x NEBuffer 2) | New England Biolabs | B7002 | |
DNA LoBind tube, 1.5 mL | Eppendorf | 0030 108.051 | |
DNA LoBind tube, 2 mL | Eppendorf | 30108078 | |
20% (wt/vol) SDS | Bio-Rad Laboratories | 161-0418 | |
20% (vol/vol) Triton X-100 | Sigma-Aldrich | T8787 | |
HindIII, 100 U/uL | New England Biolabs | R0104 | |
10 mM dCTP | Life Technologies | 18253-013 | |
10 mM dGTP | Life Technologies | 18254-011 | |
10 mM dTTP | Life Technologies | 18255-018 | |
0.4 mM Biotin-14-dATP | Life Technologies | 19524-016 | |
DNA polymerase I large (Klenow) fragment 5000 units/mL | New England Biolabs | M0210 | |
10x T4 DNA ligase reaction buffer | New England Biolabs | B0202 | |
100x 10mg/ml Bovine Serum Albumin | New England Biolabs | B9001 | |
T4 DNA ligase, 1 U/μL | Invitrogen | 15224-025 | |
RNase A | Roche | 10109142001 | |
Proteinase K, recombinant, PCR grade | Roche | 3115836001 | |
20 000×g 50 ml centrifuge tube | VWR | 525-0156 | |
0.5 M EDTA pH 8.0 | Life Technologies | 15575-020 | |
Phenol pH 8.0 | Sigma | P4557 | |
Phenol: Chloroform: Isoamyl Alcohol 25:24:1 | Sigma | P3803 | |
Sodium acetate pH 5.2 | Sigma | S7899 | |
Quant-iT PicoGreen | Invitrogen | P7589 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
Restriction buffer 2.1 (10x NEBuffer 2.1) | New England Biolabs | B7202 | |
NheI, 100U/uL | New England Biolabs | R0131 | |
Micro TUBE AFA Fiber Pre-slit snap cap 6x16mm vials | Covaris | 520045 | For sonication |
SPRI beads (Agencourt AMPure XP) | Beckman Coulter | A63881 | |
Dynabeads MyOne Streptavidin C1 beads | Invitrogen | 65001 | |
Tween 20 | Sigma | P9416 | |
10 mM dATP | Life Technologies | 18252-015 | |
T4 DNA polymerase 3000 units/mL | New England Biolabs | M0203 | |
T4 PNK 10000 units/mL | New England Biolabs | M0201 | |
Klenow exo minus 5000 units/mL | New England Biolabs | M0212 | |
Quick ligation reaction buffer | New England Biolabs | B6058 | |
NEB DNA Quick ligase | New England Biolabs | M2200 | |
PE adapter 1.0 (5'-P-GATCGGAAGAGCGGTTCAGC AGGAATGCCGAG-3') |
Illumina | ||
PE adapter 2.0 (5'-ACACTCTTTCCCTACACGACGCT CTTCCGATCT-3') |
Illumina | ||
NEB Phusion PCR kit | New England Biolabs | M0530 | |
PE PCR primer 1.0 (5'-AATGATACGGCGACCACCGA GATCTACACTCTTTCCCTAC ACGACGCTCTTCCGATCT-3') |
Illumina | ||
PE PCR primer 2.0 (5'-CAAGCAGAAGACGGCATACGA GATCGGTCTCGGCATTCCT GCTGAACCGCTCTTCCGATCT-3') |
Illumina | ||
PCR strips | Agilent Technologies | 410022 and 401425 | |
SureSelect SSEL TE Reagent ILM PE full adaptor kit | Agilent Technologies | 931108 | |
SureSelect custom 3-5.9 Mb library | Agilent Technologies | 5190-4831 | custom design mouse or human PCHi-C system |
Dynabeads MyOne Streptavidin T1 beads | Invitrogen | 65601 | |
E220 high-performance focused ultra-sonicator | Corvaris | E220 |