Summary

トランスクリプトーム解析を用いた無秩序発がん性転写因子の構造機能関係のマッピング

Published: June 27, 2020
doi:

Summary

本質的に障害が発生したドメインは、発癌性融合転写因子機能にとって重要である。これらのタンパク質を治療的に標的にするためには、これらのドメインで採用される調節機構のより詳細な理解が必要である。ここでは、Ewing肉腫における本質的に無秩序なEWSドメインの重要な構造的特徴をマッピングするために、トランスクリプトミクスを使用する。

Abstract

多くの癌は、発癌性融合転写因子の発現をもたらす染色体転座によって特徴付けられる。典型的には、これらのタンパク質は、別のタンパク質のDNA結合ドメイン(DBD)と融合した本質的に障害のあるドメイン(IDD)を含み、悪性腫瘍を促進するために広範囲にわたる転写変化を調整する。これらの融合は、多くの場合、それらが引き起こす癌における唯一の繰り返しゲノム収差であり、魅力的な治療標的となる。しかし、発がん性転写因子を標的化するには、その機能において複雑性の低いIDDが果たす機械学的役割をよりよく理解する必要があります。EWSR1 の N 末端ドメインは、EWS/FLI、EWS/ATF、および EWS/WT1 を含むさまざまな発癌性融合転写因子に関与する IDD です。ここでは、RNA-シーケンシングを用い、ユーイング肉腫におけるEWS/FLIの転写機能に重要なEWSドメインの構造的特徴を調べる。まず、種々のEWS変異体構築物の異所発現と組み合わせたユーイング肉腫細胞からの内因性融合のshRNA媒介型枯渇が行われる。次に、RNA-シーケンシングを使用して、これらの構築物を発現する細胞の転写体を分析し、EWSドメインの突然変異に関連する機能的欠陥を特徴付ける。トランスクリプトーム解析と、EWS/FLI DNA結合モチーフに関する以前に発表された情報、ゲノム局在化、および機能性転換のための機能アッセイを統合することで、発癌に重要なEWS/FLIの構造的特徴を特定し、ユーイング肉腫にとって重要なEWS/FLI標的遺伝子の新しいセットを定義することができました。本論文では、発癌性転写因子の本質的に乱れたドメインの構造機能関係をマッピングする方法としてRNA-シーケンシングを用いることを示す。

Introduction

小児期および青年期の多くの悪性腫瘍を含む癌のサブセットは、新しい融合オンコゲネス1、2、3、4、5、6生成する染色体転座によって特徴付けられる。得られた融合タンパク質は、しばしば発癌性転写因子として機能し、転写調節の広範な変化を調整して、腫瘍形成7,8を促進する。これらの転位を持つ癌は、一般的に、病理学的融合4、9を除いて、いくつかの反復的なゲノム収差を有する静かな突然変異景観を有する。このように、融合タンパク質を直接標的化することは、これらの疾患における魅力的な治療戦略である。しかしながら、これらの発癌性転写因子は、一般的に、低複雑性、本質的に障害を有し、転写活性化ドメインとDNA結合ドメイン(DBD)10、11、12、13、14と融合したドメインから構成される。これらのタンパク質の本質的に障害のあるドメイン(IDD)とDBDの両方が、従来の薬理学的アプローチで標的にすることは困難であることが証明されています。したがって、新しい治療アプローチの開発には、遺伝子発現を異常に調節するためにこれらの融合によって採用されるメカニズムのより詳細な分子理解が必要である。

EWSR1のN末端IDD部分は、一般に、ユーイング肉腫におけるEWS/FLI、びまん小丸細胞腫のEWS/WT1、軟部10の透明細胞肉腫におけるEWS/ATF1を含む癌におけるDBDに融合する。これらの融合のそれぞれにおける EWS IDD の機械主義的役割は完全に理解されていません。EWS/ETS ファミリ、特に EWS/FLI は、これまでで最も機能的に特徴付けられています。EWS/FLIは、ゲノム全体のエピジェネティックおよび転写変化を調整、7、11、15、16の遺伝子の活性化と抑制につながる。研究は、IDDが両方の転写共活性化剤(p300、WDR5、およびBAF複合体など)の採用に重要であることを示しているだけでなく、共リプレッサー(NuRD複合体など)11、15、17。FLI1のC末端部分へのEWS IDDの融合は、FLI1のETS DBDに新規なDNA結合特異性を与え、融合オンコプロテイン(EWS/FLI)がコンセンサスETSモチーフ18、19、20に加えてゲノムの反復的なGGAAマイクロサテライト領域に結合するようにする。共同アクティベーター採用機能と組み合わせ、 EWS/FLIのこの創発的なDNA結合活性は、GGAAマイクロサテライトにおけるデノボエンハンサー形成を転写開始部位(TSS)(TSS)(「エンハンサーライク」マイクロサテライト)に促進し、TSSに近位のGGAAマイクロサテライトで転写を促進するRNAポリメラーゼIIを募集する11, 15, 15,151.

これらのデータを組み合わせることで、EWSドメイン内の個別の要素が、異なるタイプのEWS / FLI結合サイトへの明確な共同規制当局の採用に寄与すると仮定しました。しかし、EWS/FLI の EWS 部分内でこれらの要素を識別し、それらの機能を識別することは、ドメインの非常に反復的で乱れた性質によって妨げられています。ここでは、ユーイング肉腫細胞で以前に公開されたノックダウンレスキューシステムを利用して、EWS IDDでこれらの要素を機能的にマッピングします。このシステムでは、EWS/FLIは、FLI1遺伝子の3’UTRを標的とするshRNAを用いて枯渇し、3’UTR7、17、22を欠いた様々なEWS/FLI変異型cDNA構築物で発現が救い出される。これらの実験は、GGAAマイクロサテライトレポーター構築物の活性化、コロニー形成アッセイ、EWS/FLI活性化および-抑圧された遺伝子7、17、22の標的検証を含む、EWS IDDと重要な発癌表現型との間の構造機能関係をマッピングするための様々な欠失を有する構造に焦点当てた。.しかし、これらの研究では、EWS/FLI の EWS IDD 内で、アクティブ化または抑制に対して一意に重要な個別のサブドメインを見つけることができませんでした。すべての試験された構築物は、特異的標的遺伝子を活性化および抑制し、効率的なコロニー形成を導くことができたか、またはEWS/FLI標的遺伝子のいずれかを調節することができず、コロニー形成7、17、22の喪失につながった。

次世代シーケンシングの普及によって可能になったトランスクリプトーム分析は、スクリーニングまたは記述的研究の文脈で頻繁に、2つの条件で遺伝子発現シグネチャを比較するために一般的に使用される。その代わりに、RNA-シーケンシング(RNA-seq)を用いてゲノム全体の発現データを捕捉し、IDDが転写因子機能に寄与することを特徴付ける機能を活用したいと考えていました。この場合、RNA-seq はノックダウン-レスキューシステムと組み合わされ、EWS ドメインの構造機能関係を調べます。このアプローチは、他のEWS融合や、十分に理解されていない機能を持つ野生型転写因子を含む他の融合転写因子に適用可能であり、レポーターアッセイや標的qRT-PCRなどの機能マッピング研究に使用される他のアッセイよりも複数の利点があります。これらには、関連クロマチンコンテキストにおける機能の構造的決定要因のテスト、1つのアッセイで複数のタイプの応答要素(すなわち、活性化および抑圧された、GGAA-マイクロサテライトおよび非マイクロサテライトなど)をテストする能力、および部分的な機能をより良く検出する能力が含まれる。

このアプローチの成功した実装は、対象となる表現型(この場合はshRNA媒介EWS/FLI枯渇を有するA673細胞)を捕捉する細胞系システムと、細胞系システムに適した発現ベクター中の変異構造のパネル(この場合、pMSCV-hygroと様々な3x FLAGタグ付きEWS/FLI変異体を有する様々な3x-FLAGタグ付きEWS/FLI変異体を有する)に依存する。CRISPRベースの枯渇構築物、shRNAベースの枯渇構築物、および安定した細胞株を生成するための適切な選択を伴うcDNA発現構築物のウイルス伝達は、一過性トランスフェクションよりも推奨される。結果の下流の解釈は、トランスクリプトームデータが、転写因子および他の表記の読み出しの局在化に関連する他のデータと組み合わせることができる場合に強化される。

本稿では、このアプローチを適用して、EWS/FLI14のDAF変異体の活性を特徴付けます。DAF変異体は、EWS/FLI14のEWS IDDの反復領域における17のチロシンからアラニン変異を有する。この特定のEWS変異体は以前に報告されており、ATF1 DBD14に融合するとレポーター遺伝子発現を活性化することができない。しかし、予備的なqRT-PCRデータは、この変異体がEWS/FLI標的 NR0B123の転写を活性化することができたことを示唆した。ここで説明したトランスクリプトームアプローチにより、DAF変異体の部分機能の検出に成功した。これらのトランスクリプトデータとEWS/FLI結合および認識モチーフに関する情報を組み合わせることで、DAF変異体がGGAAマイクロサテライトの繰り返しで機能を保持することをさらに示す。これらの結果は、DAFを最初の部分的に機能的なEWS/FLI変異体として同定し、非マイクロサテライト遺伝子のハイライト機能を、腫瘍発生にとって重要である(報告された23)。これは、発癌性転写因子の機能に関する洞察を提供するために、この転写構造関数マッピングアプローチの力を示す。

Protocol

1. 構成体のインビトロパネルを設定する 注:このステップは、分析する特定のタンパク質によって異なります。 必要に応じて、ウイルスのアリコートを枯渇や発現構造に備える。 ウイルス導入に必要な各構築物に対して、3-5 x 106 HEK293-EBNAまたはHEK293T細胞を使用して10cmの組織培養皿をシードします。10%のウシ胎児血清(FBS)、ペニシリン/ストレプトマイシン/グルタミン(P/S/Q)、0.3 mg/mL G418を補ったダルベックコの改変イーグル培地(DMEM)で細胞を一晩接着させます。注:HEK293-EBNAおよびHEK293T細胞は、増殖が容易で、トランスフェクション効率が高く、エピソームプラスミドから組み換えタンパク質を効率的に発現するため、ウイルス産生に推奨されています。細胞は、トランスフェクションの日に50〜70%コンフルエントの間でなければなりません。 各ウイルス導入構築物のためのトランスフェクションミックスを準備します。2 mLの減らされた血清培地と90 μLのトランスフェクション試薬を組み合わせます。注意:予め温めの低下した血清培地を推奨します。 ウイルス包装プラスミド(例えば、gag-pol)、ウイルスエンベローププラスミド(例えば、VSV-G)、CRISPRベースの枯渇、shRNAベースの枯渇、またはcDNA発現構造(例えば、pMKOまたはpMSCV)のいずれかをトランスフェクションミックスにそれぞれ10μg添加する。穏やかなピペットでよく混ぜます。 トランスフェクションミックスを室温で20分間座らせます。組織培養皿からHEK293-EBNA成長培地を取り除き、10S、P/ S/Q、および10 mMナトリウムピルビン酸を添加した3mL DMEMを加えます。各料理に、2 mLのトランスフェクションミックスを滴下して加えます。細胞は、37°Cおよび5%CO2のインキュベーターで一晩トランスフェクション培地に座らせます。 翌朝、10S、P/S/Q補充、および10 mMナトリウムピルビン酸を含むDMEM培地を20 mL追加します。細胞を37°Cで、5%CO2で一晩インキュベートします。 翌朝、メディアを5mLウイルス収集メディア(VCM)に交換します(DMEMは10%の熱不活化FBS、P / S / Q、および20 mM HEPESで補います)。 4時間後、プレートからVCMを収集し、4°Cの氷上の50 mL円錐管に保管してください。 5 mLの新鮮なVCMに交換してください。 4時間後、同じ50 mL円錐形チューブのプレートからVCMを収集し、4°Cで氷の上に保管してください。 一晩のコレクションのための新鮮なVCMの8 mLと交換してください。 朝はプレートからVCMを収集し、4°Cの氷の上に50 mL円錐管に保管してください。 5 mLの新鮮なVCMに交換してください。 4時間後、プレートからVCMを収集し、4°Cの氷の上に50 mL円錐管に保管してください。 5 mLの新鮮なVCMに交換してください。4時間後、プレートからVCMを収集し、50 mL円錐管に追加します。 0.45 μm フィルターを濾過した後、50 mL チューブからクライオチューブ (アリコートあたり 2 mL) までのアリコート コレクション。使用するまで-80°Cでウイルスアリコートを保管してください。注: プロトコルはここで一時停止することができ、ウイルスのアリコートは使用できるまで保存できます。 10cmの組織培養皿において適切な密度で細胞をシードする。目標50%合流。細胞は、5%CO2を含む37°Cでインキュベーターに入れることによって一晩接着させる。注:A673細胞の場合、これは10S、P / S / Q補充、および10 mMナトリウムピルビン酸を有するDMEM培地の10 mLで5 x 106 細胞です。これらの条件は、使用する細胞の増殖速度によって異なる場合がある。 関心のある内因性の要因を枯渇.細胞が目的の内因性タンパク質を枯渇させる必要がない場合は、ステップ1.4に進んでください。 目的のタンパク質を標的とするshRNAまたはCRISPR構築物の伝達のためのウイルスアリコートを解凍する。37°Cの水浴で冷凍アリコートを素早く解凍します。 各ウイルスアリコートに8mg/mLポリブレンの2.5 μLを加え、穏やかなピペットで混ぜます。細胞のプレートから培地を取り除き、プレートの側面に沿ってピペッティングして10cmプレートにウイルスアリコートを静かに加えます。プレートを揺らし、2 mLのウイルスアリコートを広げる。 組織培養インキュベーター中で37°Cで2時間インキュベートする。プレートの領域が乾燥するのを防ぐために、30分ごとにプレートを揺らします。 5 mLのDMEM培地に10S、P/S/Q補充、10 mMのピルビン酸ナトリウムを加え、5 μLの8 mg/mLポリブレンを加えます。細胞を一晩インキュベートしましょう。 朝、細胞から培地を取り出し、細胞を通過させると、選択試薬を補充した培地に入れ替わります。細胞を通過させる場合は、48-72時間成長し、50%の合流に達するようにそれらを播種します。注:pSRP-iEF-2のA673細胞の場合、細胞は1:5分割で播種され、2μg/mLピューロマイシンで72時間選択されます。 cDNA 発現構造を変換します。 50~70%の合流性を確認するために細胞を確認してください。 対象のcDNAコンストラクトの伝達のためのウイルスアリコート(複数可)を解凍する。37°Cの水浴で冷凍アリコートを素早く解凍します。各ウイルスアリコートに8mg/mLポリブレンの2.5 μLを加え、穏やかにピペットで混ぜます。 メッキされた細胞から培地を取り出し、プレートの側面に沿ってピペット処理を行い、10cmプレートにウイルスアリコートを加えます。プレートを揺らし、2 mLのウイルスアリコートを広げる。 組織培養インキュベーター中で37°Cで2時間インキュベートする。プレートの領域が乾燥するのを防ぐために、30分ごとにプレートを揺らします。 5 mLのDMEM培地に10S、P/S/Q補充、10 mMのピルビン酸ナトリウムを加え、5 μLの8 mg/mLポリブレンを加えます。細胞を一晩インキュベートしましょう。 朝、細胞から培地を取り出し、セルを通過させるセルを二重選択媒体にします。cDNAコンストラクトの二重選択と発現を可能にするために、必要に応じて細胞を成長させ、7〜10日間通過させます。注: この節の分割では、異なるセルラインの最適化が必要になる場合があります。pSRP-iEF-2とpMSCV-ハイグロコンストラクトを有するA673細胞の場合、細胞は2μg/mLピューロマイシンおよび100 μg/mLハイグロマイシンに分かれずに渡されます。 2. 細胞を収集し、構成体の発現を検証し、相関表現法アッセイを設定する 二重選択の7-10日後に15 mL円錐管の細胞を集める。集めた細胞をヘモサイトメーターで数える。アリコートは、RNA-シーケンシング用の細胞を収集し、cDNA構築物の発現を検証した。注:調査中の研究課題に必要な相関表現型アッセイを設定してください。コロニー形成アッセイは、ここで使用される相関表現型アッセイの一例である。 5 x 105と 1 x 106細胞の間で RNA-シーケンシング、2 x 106細胞を収集してタンパク質抽出を行います。ペレット細胞は、4°Cで1,000xgで5分間遠心分離し、上清を除去した。 1 mL の冷たい PBS でペレットを洗います。4°Cで1,000xgで5分間遠心分離して5分間ペレットを除去し、上清を除去します。フラッシュは液体窒素中のペレットを凍結し、-80°Cで保存します。 残りのセルに対して、任意の相関アッセイを設定します。注: このプロトコルは、収集したサンプルを -80 °C の冷凍庫に保存して、ここで一時停止できます。 目的のタンパク質のノックダウン(使用する場合)と構築物のパネルの発現を検証します。 氷上でのタンパク質抽出用の細胞ペレットを解凍します。氷冷500μL核抽出バッファー(20 mM HEPES pH 7.9,140 mM NaCl,10%グリセロール,1.5 mM MgCl2,1mM EDTA,1 mM DTT,1%IGEPAL)を用いた細胞を再懸濁液化します。氷の上に5分間座らせます。 ペレット核は、4°Cで1,000 x g で5分間遠心分離し、上清を除去した。500 μL 氷冷核抽出バッファー (20 mM HEPES pH 7.9, 140 mM NaCl, 10% グリセロール, 1.5 mM MgCl2,1 mM EDTA, 1 mM DTT, 1% IGEPAL) の核をプロテアーゼ阻害剤で洗浄します。 ペレット核は、4°Cで1,000 x g で5分間遠心分離して上清を除去します。プロテアーゼ阻害剤を用いて200μLの冷たいRIPAバッファーで核を再懸濁する(ペレットサイズに応じてRIPAバッファの体積を調整する)。15分ごとに激しい渦を出して45〜60分間氷の上に座らせます。 45〜60分間4°Cで16,000 x g の遠心分離によるペレット細胞デブリ。上清を保ち、新鮮な冷たい管に移す 5分間の1x負荷バッファーで5~10 μgのタンパク質を沸騰させることにより、SDS-PAGE電気泳動用サンプルを調製します。目的のタンパク質に必要な SDS-PAGE ゲルを実行します。 目的のタンパク質に必要に応じてニトロセルロースまたはPVDF膜に移します。ブロック、および適切な一次および二次抗体を用いてブロットして、内因性タンパク質のノックダウン(使用する場合)およびcDNA構築物の異所発現を確認する。注: プロトコルはここで一時停止することができます。 RNAを抽出します。RNAの品質と量を評価します。 氷の上に細胞ペレットを解凍します。メーカーの指示に従ってシリカスピンカラムベースの抽出キットを使用して、トータルRNAを抽出します。 簡単に言えば、キットのライシスバッファーを使用して細胞をライスします。30〜60秒間>13000 rpmで短いスピンでシリカスピンカラムにライセートを塗布するか、または30〜60秒間>13000rpmで短いスピンでgDNA除去カラムにライセートを適用してgDNAを除去します。 シリカスピンカラムに直接リセートを適用した場合は、オンカラムDNA消化を行います。gDNA除去カラムを使用する場合は、30〜60の>13000rpmで短いスピンでシリカスピンカラムに溶出物を塗布します。 メーカーの指示に従ってカラムにRNAを洗浄します。溶出バッファーの 30 μL で RNA を溶出します。 フルオロメーター、または他の同等の機器を使用して、RNAの品質と量を評価します。260/280比が2に近く、シーケンシング用に2.5μg以上のRNAが存在することを確認してください。注: レプリケートが収集されると、各複製は同じ RNA 抽出プロトコルで処理する必要があります。 必要に応じて、qRT-PCR によって目的のタンパク質の安定したノックダウンを確認するために、RNA の小さなアリコートを使用します。残りのRNAサンプルは-80°Cで保存してください。 3~4個の完全なRNAセットが収集されるまで、ステップ1~2を繰り返して生物学的複製物を収集します。各複製が、cDNA構築物の適切な発現と内因性タンパク質の安定したノックダウン(使用する場合)を表示することを確認します。 3. 次世代シーケンシング 5,000万個の150塩基対(bp)ペアエンドリードを目標とする次世代シーケンシングプラットフォームを使用して、抽出されたRNAをシーケンシングします。サンプルを処理する施設の指示に従います。ポリアデニル化 RNA とストランド固有のシーケンシングを選択します。 4. アライメントとトランスクリプトカウントパイプライン 注: このプロトコルは、次のサンプルの送信と処理を、各サンプルに対して一連の FASTQ ファイルが返されることを前提としています。これらのファイルは、頻繁に “fastq.gz という接尾辞を付けて圧縮されます。これらのFASTQファイルのさらなる分析は、Linuxオペレーティングシステムを実行しているハイパフォーマンスコンピューティング(HPC)機能へのアクセスを必要とします。 ファイルの転送 PuTTY で HPC 環境に端末を開きます。「プロジェクト」と呼ばれる分析のためのディレクトリを作成します。 「path_to/プロジェクト」ディレクトリに移動し、”fastq”と呼ばれる圧縮された raw fastq.gz ファイルの新しいディレクトリを作成します。また、「トリミング」というディレクトリを作ります。これは 図 S1A-Cに示されています。 WinSCP または同様のプログラムを使用して、ローカルストレージから “path_to/project/fastq/” ディレクトリに圧縮された生の fastq.gz ファイルを転送します。 図 S1Bに示すように、各サンプルに “R1” と “R2” ファイルがあることを確認します。 オプション: 必要に応じて、TrimGalore をインストールします。Linux の PATH 環境変数で、trim_galore実行可能ファイルを含むディレクトリを設定します。メモ: 低品質の読み取りとアダプターは TrimGalore でトリミングされます。トリムガロアは https://github.com/FelixKrueger/TrimGalore で入手できます。 オプション: ダウンロードしたソフトウェアパッケージのディレクトリに移動します (つまり、「path_to/ソフトウェア」)。コマンドを使用して最新のTrimGaloreパッケージをダウンロードします “curl -fsSL https://github.com/FelixKrueger/TrimGalore/archive/[バージョン].tar.gz -o trim_galore-[バージョン].tar.gz。 オプション: tar .gz ファイルをアンパックします。コマンド “tar -xvzf trim_galore-[version_number].tar.gz”を使用します。 オプション: TrimGalore を実行可能にします。コマンドを使用して “chmod a +x path_to/ソフトウェア/トリムガロア-[バージョン]/trim_galore”.この新しいディレクトリが PATH に含まれるようにしてください。コマンドを使用して”PATH=path_to/ソフトウェア/トリムガロア-[バージョン]:$PATH”。 path_to/プロジェクト/ファストク/にナビゲートします。 図 S1Cに示すコマンドを使用して、fastq.gz ファイルからの低品質の読み取りをトリムするには TrimGalore を使用します。注 : このコマンドの追加フラグは関連している可能性があり、ここで見つけることができます: https://github.com/FelixKrueger/TrimGalore/blob/master/Docs/Trim_Galore_User_Guide.md path_to/プロジェクト/トリミングされたディレクトリ内のトリミングされた fastq.gz ファイルを確認します。sample1_R1_val_1.fq.gzとsample1_R2_val_2.fqと呼ばれることを確認してください.gz トリムされた FASTQ ファイルを STAR に合わせて、トランスクリプトの数を生成します。注:星は https://github.com/alexdobin/STAR)で入手可能です。 オプション: STAR バージョン 2.6 以降をインストールします。パスに STAR 実行可能ファイルを設定します。 オプション: ダウンロードしたソフトウェアパッケージのディレクトリに移動します (つまり、「path_to/ソフトウェア」)。 オプション: コマンド 「curl -SLO https://github.com/alexdobin/STAR/archive/[バージョン].tar.gz」を使用して STAR パッケージをダウンロードします。tar .gz ファイルを解凍します。 オプション: コマンド 「tar -xzf [バージョン].tar.gz」を使用します。STAR を実行可能にします。コマンドを使用して “chmod a +x path_to/ソフトウェア/STAR-[バージョン]/ビン”. オプション: この新しいディレクトリーがパス内に存在することを確認します。コマンド「PATH=path_to/ソフトウェア/STAR-[version_number]/ビン/linux_x86_64_static:$PATHをエクスポートする」コマンドを使用してください。注意:STARマニュアルは次のページにあります: (https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf)。 STARで使用するゲノムインデックスがあることを確認します。これをpath_to/プロジェクト/ディレクトリとは別のディレクトリに配置します。以前の実験でインデックスが生成された場合は、それを使用します。代わりに、適切な事前生成インデックスを使用してください http://refgenomes.databio.org/。それ以外の場合は、STAR マニュアルの指示を使用して、”STAR–runMode genomeGenerate” コマンドを使用して新しいインデックスを構築します。注: このプロトコルの残りの部分では、STAR インデックスへのパスは「path_to/STAR_index」と呼ばれます。 path_to/プロジェクト/ディレクトリに移動します。 図 S1Dに示すように、”STAR_output” という新しいディレクトリを作成します。 path_to/プロジェクト/トリミング/ディレクトリに移動します。 図 S1D に示すコマンドを使用して STAR を実行し、トリミングされた fastq.gz ファイルを整列します。注: このステップは、計算負荷が最も高く、複数のスレッド (つまり、>16) がアライメントタスク用に指定された HPC クラスター上で実行することをお勧めします。サンプル数や利用可能な計算リソースによっては、この手順に数時間から数日かかる場合があります。 次の場所で、トランスクリプトごとの数を含む次のステップに必要な出力を見つけます: path_to/プロジェクト/STAR_output/sampleN_ReadsPerGene.out.tab。注: ReadsPerGene.out.tab ファイルの列 1 には、カウントされる機能に関する情報が保持されます。列 2 には、立ち往生していない読み取りカウントが保持され、列 3 は前方の立ち往生読み取りカウントを保持し、列 4 は逆の読み取りカウントを保持します。このファイルの最初の 4 行には、単一のジーンに合致しなかった位置合わせ読み取りに関する情報が含まれます。このプロトコルには、非孤立読み取りカウントが必要です。 HPC 環境で RStudio (推奨) または R を使用して、各サンプルの列 1 および 2 の行 5 および下のデータをコンパイルします。Rの「プロジェクト」に作業ディレクトリを設定します。 図 S2Aのコマンドを使用して、各 ReadsPerGene.out.tab ファイルを読み取ります。最初の列では、下流処理を容易にするために、「Ensembl遺伝子ID」列の「.」の前の文字のみを使用します。 図 S2Bのコマンドを使用して、すべてのサンプルから “totcts” というデータフレームにカウントをコンパイルします。この新しい未処理カウント データのテーブルを、必要に応じて “write.table” コマンドを使用して、.txtファイルで区切られたタブとして保存します sample_counts.txt。注: Ensembl 遺伝子 ID の順序は、サンプル間のすべての ReadsPerGene.out.tab ファイルで同じです。 5. 微分式と下流解析 ComBat を使用してサンプル間のバッチ効果を正規化します。注:遺伝子発現の変化を説明する2つの変数があり、最初は使用される構造(すなわちサンプル)であり、第2は時間の経過(すなわちバッチ)に関連する外部要因である。R パッケージ ComBat を使用してバッチからバッチへのバリエーションのサンプルを正規化する手順をお勧めします。 必要に応じてインストールし、sva、DESeq2、アノテーションDBI、組織のライブラリをロードします。Hs.例.db、プヒートマップ、RColorBrewer、遺伝子フィルター、カイロ、ggplot2、ggbiplot、rgl、および図 S2Cに示すように再形状2。インストールの場合は、各パッケージのドキュメントに従って”install.packages”コマンドまたはバイオコンダクタを使用してください。 最初に、読み取りごとに少なくとも 1 つのカウントを持つ遺伝子のみにデータをフィルター処理します。 図 S2Dに示すように、この新しいテーブルを保存して、フィルタリングを示します。注: 多くの遺伝子は読み取り数が非常に少ないか、まったく読み取り数を持たない場合があります。 図 S2Eに示すように、”vars” と呼ばれるバッチ正規化用の 2 つ目のテーブルを準備します。行名を各サンプルの一意の名前に設定します。列名を「サンプル」、「バッチ」、および「コンストラクト」に設定します。 すべてのサンプルに、1 ~ n の”サンプル”列に一意の数値を割り当て、n はサンプル数です。「バッチ」列のすべてのサンプルにロット番号を割り当て、条件a_1と条件b_1の両方が 1 に割り当てられ、条件a_2と条件b_2の両方が 2 に割り当てられます。条件-aのサンプルがすべて「A」であり、条件bサンプルがすべて「B」になるように、「コンストラクト」列のすべてのサンプルにすべての条件指定を割り当てます。 図 S2Fに示すように、バッチ変数と ComBat の特定の null モデル行列も定義します。図 S2Fで定義されたコマンドを使用して ComBat を実行します。 さらに、最も近い整数に丸めることでデータをキュレーションします。また、負の値を持つ遺伝子を削除します。 図 S3Aに示すコマンドを使用します。注: バッチ正規化の出力には、整数以外の読み取り数と負の値を持ついくつかの遺伝子が含まれます。下流の微分式解析では負の読み取り数がサポートされないため、この手順が必要です。 DESeq2 を使用して、各構成体の微分式プロファイルを定義します。 図 S3Bに示すように、DESeq2 の実験計画を入力します。DESeqDataSetFromMatrix 関数を使用して DESeqDataSet (dds) を構築し、サイズファクターを見積もり、DESEq2 を実行します (図 S3Bを参照)。注: 「条件」に入力された列データは、カウント行列の列と同じ順序にすることが不可欠です。 分析の品質を評価するために、DESeq2 で使用される rlog 正規化されたカウントを抽出します ( 図 S3Bを参照)。注: 分析中、DESeq2 は、サンプル間でカウントが大きい遺伝子の差を保持するために、サンプル数が少ない (情報が少ない) 遺伝子のサンプル間の違いを縮小する「正規化されたログ」、rlog、変換を行います(高い情報)。 DESeq2の結果から転写プロファイルごとに結果を抽出する場合、 図S3Cに示すように、ノックダウン条件またはベースライン空ベクトルのいずれかを参照して対方向比較を行う。 さらに、図S3Dに示すようにHGNC遺伝子シンボルを用いてこれらの結果を修正する。 図S3Eに示すように、DESeq2結果からデータを抽出します。log2FoldChangeと生および調整されたp値を持つすべてのコンストラクトのEnsembl遺伝子ID、HGNCシンボル、基本平均式、および微分発現データを含む単一のファイルとしてエクスポートします。注: 調整された p 値< 0.05 を使用すると、微分式のカットオフを推奨します。 バッチ正規化の成功とサンプル内の類似性を評価します。 図 S4A-Bに示すコードを使用して、rlog 正規化カウントを使用して、PCA とサンプルからサンプルまでの距離プロットを使用してサンプル・クラスタリングをチェックします。 微分式プロファイルを使用して、 図 S4C のコードを使用して火山プロットを生成します。構成体間の遺伝子発現の変化を評価する。 rlog 正規化カウントと階層クラスタリングを使用して、異なる構成要素に固有の遺伝子シグネチャを識別します。 図 S4Dに示すコードを使用します。 マトリックス内のすべてのコンストラクトで、最も多くの可変遺伝子を抽出します。pheatmap を使用して、これらの遺伝子に基づいてサンプルの教師なし階層クラスターを実行します。 目的の樹状図クラスターの表示レベルを決定して、デデンドログラムから目的のクラスターを抽出します。”k” をそのレベルのクラスターの数に設定します。 図 S5に示すように、クラスターによって順序付けられたヒートマップを再プロットして、どのクラスターが対象であるかを判断します。 表 S1に示すように、各クラスターに関連付けられた遺伝子のリストをエクスポートします。この情報を使用して、対象となるクラスター内の遺伝子を判別します。 同定された遺伝子の異なるクラスターの生物学的役割を特定し、クラス間で比較します。これは、バイオインフォマティクスの様々なツールを使用して行うことができます。ToppGene24 はここで使用され、オンラインで自由に利用できます。注:ウェブサイト上のフィールドにコピーして貼り付けるために遺伝子のリストを必要とする多くの無料ツールがあります。調査中の研究課題に最適な分析ツールを選択します。 必要に応じて、目的の転写因子の転写出力を駆動するゲノム結合に関するデータがある場合、異なる結合要素に関連する遺伝子における転写応答を比較して、変異関数をさらに評価する。 6. 関連する型との比較 相関表現型と生成されたトランスクリプトームプロファイルデータを比較し、適切に解釈します。

Representative Results

予備的なqRT-PCRデータは、DAFと呼ばれるEWS/FLI変異体が、EWSの反復および障害領域におけるアラニン突然変異に特異的なチロシンを有し、EWS/FLI標的遺伝子を活性化する能力を維持したが、重要な標的遺伝子23を抑制できなかったことを示唆した。EWS ドメインと EWS/FLI 関数におけるこれらの残留物の関係をより深く理解するために、上記で説明したプロトコルと 、図 1 で概説したプロトコルを使用しました。A673ユーイング肉腫細胞は 、FLI1の3’UTRを標的とするshRNAでウイルス的にトランスタイズされ、内因性EWS/FLIが枯渇した。4日間の選択の後、EWS/FLI機能は、異なる3XFLAGタグ付きEWS/ FLI変異体構造のウイルス伝達で救出され、救助のためのコントロールとして空のベクトルを備えた。EWSドメインを欠いた非機能的変異体(Δ22)を負のコントロールとして使用し、wtEFと呼ばれる野生型EWS/FLIを陽性対照として使用した(図2A)。DAF はテストコンストラクトとして使用されましたが、必要に応じて複数のテスト構成を使用できます。細胞をさらに10日間選択して、構築発現が安定化し、RNA(gDNA除去ステップを有する)、タンパク質およびコロニー形成アッセイについて収集した。4つの複製物を収集し、効果的なノックダウンとレスキューを示す代表的なqRT-PCRとウェスタンブロットを 図2B-Dに示します。DAF救出細胞は 図2Eに示すようにコロニーを形成できず、発癌性転換障害を示唆することに留意すべきである。 複製検証と表現型アッセイが完了した後、RNAは図書館の準備と次世代シーケンシングのために全国小児病院ゲノム医学研究所に提出され、約5,000万個の150-bpペアエンドリードを収集しました。データは fastq.gz ファイルとして返されました。低品質の読み取りはTrimGaloreでこれらのファイルからトリミングされ、STARは読み取りをヒトゲノムhg19に整列させ、遺伝子あたりの読み取りをカウントするために使用されました。hg19は、下流分析で使用されるEWS/FLI用の他のキュレーションデータセットとの互換性を目的として使用されました。これらの読み取りカウントは、すべてのサンプルの単一のカウント行列に結合され、最初の6行は 図3に示されています。 カウントは、最初はバッチ正規化なしでDESeq2を介して実行されたが、サンプルからサンプルまでの距離の目視検査は、 図4Aの赤い矢印で強調された図のように、潜在的な交位バッチ効果を示した。これは、培養中の細胞の通過によって導入された生物学的変動と、各バッチの処理の違いのために生じた可能性が高い。バッチ効果の正規化は、ComBat で行われ、一般的にお勧めします。バッチ正規化データのサンプルからサンプルまでの距離を 図 4Bに示します。バッチ正規化の後、DESeq2を使用して、ベースラインに対する3つの構成体(wtEF、Δ22、およびDAF)の転写プロファイルを生成した。「ペアレンタル」A673細胞(ここで「iLuc」と呼ばれる模擬ノックダウンと模擬救助)が含まれていたが、この実験の参照は、iEF細胞と呼ばれるEWS / FLIが枯渇した細胞である。iLucサンプルとiEFを比較することで、内因性タンパク質の転写プロファイルを生成することができ、これは救助システムの仕組みを理解することに興味があるかもしれませんが、それはこの特定の分析の目的ではありません。突然変異体に対して生成される転写プロファイルには、陽性(wtEF)および負(Δ22)コントロールが含まれ、iEFに関しては、これらは他の突然変異体のベンチマークとして機能すべきである。これは、この例の正のコントロールが他の7,23で説明されているように内因性 EWS/FLI の機能を完全に再現していなかったので、重要です。 図5の主成分分析(PCA)は、DAFの転写プロファイルがwtEFとΔ22の中間であることを示唆しており、部分機能を確認する。さらに、サンプル全体で最も多い1000個の可変遺伝子の階層クラスタリングは、図6Aおよび図S5に示すように、DAFがEWS/FLI標的遺伝子を抑制できず、部分的に遺伝子活性化活性を部分的に保持したことを示した。ToppGene分析は、DAFが活性化する遺伝子のクラスが、DAFが機能しないEWS/FLI活性化ターゲットと機能的に異なることを示唆した(図6B)。興味深いことに、wtEFによって救出された活性化遺伝子の機能は、DAFではなく、転写制御およびクロマチン調節に関連しているように見える。コロニー形成アッセイの結果に基づいて、このコア遺伝子シグネチャからの遺伝子は、EWS/FLI媒介性腫瘍発生におけるその役割についてさらに分析されるべきである。EWS/FLI媒介遺伝子抑制の重要性は、以前に17. EWS/FLIはGGAAマイクロサテライトリピート要素19、22に対するユニークな結合親和性を有し、これらの要素での結合が下流遺伝子調節11、15、18、20、22を駆動することが知られている。これらのマイクロサテライトは、活性化または抑圧に関連付けられているかとして特徴付けられており、近位(5 kb)TSS25との間に近い。また、TSS23に近い近位に高親和性(HA)ETSモチーフを有するEWS/FLI調節遺伝子があります。DAF機能の特性や、DAFがどのような種類のEWS/FLI活性化遺伝子を救い出すことができたかをさらに分析するために、これらの異なるクラスに関連する遺伝子の微分発現を分析した。興味深いことに、DAFはGGAAマイクロサテライト活性化遺伝子を最も救出することができたが、図7に示すようにHAサイトの近くで活性化された遺伝子を救出することができなかった。階層クラスタリングに見られるように、DAF は、モチーフ クラス間で EWS/FLI 媒介の抑圧を救い出しません。これらのデータは、DAFがGGAAマイクロサテライトに結合し、TSSに近位および遠位の両方で活性化するのに十分なEWSの構造的特徴を保持していることを示唆している。これは、GGAA の EWS/FLI アクティビティで重要であると考えられている無傷の SYGQ ドメインが11を繰り返し行うことから生じる可能性があります。これらのデータはまた、DAFで変異した特定のチロシンが、HAサイトからのEWS/FLI媒介性遺伝子調節における重要な役割を果たすが、十分に理解されておらず、遺伝子抑制において、さらなる調査の重要な領域を強調することを示唆している。 図1:ワークフロー。転写法による構造関数マッピングを行うステップバイステップの手順の描写。細胞は、構造関数マッピングに必要な一連の構成体を表すために最初に用意された。次の発現に続いて、細胞をRNAおよびタンパク質について採取し、相関表現型についてアッセイした。構築物の発現を検証し、このプロセスを3〜4回繰り返して独立した生物学的複製物を収集した。RNAは次世代シーケンシング(NGS)のために提出されました。データを受信すると、データの品質が調整され、位置合わせされ、トランスクリプトあたりの数が計算されました。バッチ効果を、転写シグネチャおよび微分発現について制御し、DESeq2を用いて決定した。他の-omicsデータセットと異なる経路または機能解析を統合した階層クラスタリングとダウンストリーム解析を組み込むことができます。 この図の大きなバージョンを表示するには、ここをクリックしてください。 図2:構築式および相関アッセイの検証(A) この例でテストされた構成を示す回路図。(B) 免疫ブロットによる内因性EWS/FLIのノックダウンと3X FLAGタグ付きコンストラクトの発現の検証(C,D)EWS/FLI(C)活性化標的遺伝子における構築活性の検証、NR0B1、および(D)は、qRT-PCRによる標的遺伝子TGFBR2を抑圧した。データは平均 +/- 標準偏差として表示されます。P値は、Tukeyの正直な有意性検定で計算された。* p < 0.05, ** p < 0.01, ***p < 0.005 (E) コロニーは、構成体の変換活性を評価するために行われるソフト寒天アッセイからカウントします。P値は、Tukeyの正直な有意性検定で計算された。* p < 0.05, ** p < 0.01, *** p < 0.005.この図は、Theisen、他の23から適応され、この図のより大きなバージョンを表示するには、ここをクリックしてください。 図 3: 分析用の最終的な照合されたカウント データ。バッチ正規化および分析されるすべてのサンプルの遺伝子数を含むカウントファイルの最初の6行のスクリーンショット。 この図の大きなバージョンを表示するには、ここをクリックしてください。 図 4: サンプルからサンプルまでの距離ヒートマップ(A) 生のカウント データのサンプル クラスタリングを示すサンプルからサンプルまでの距離プロット。バッチとサンプルの両方でクラスタリングしているサンプルは赤い矢印で示されます。(B)ComBat でのバッチ正規化後のサンプルからサンプルまでの距離プロット。ここでは、すべてのサンプルがバッチから独立してクラスターをまとめて複製します。 この図の大きなバージョンを表示するには、ここをクリックしてください。 図5:微分式解析の結果(A)全サンプルに対して生成されたトランスクリプトームシグネチャの原理成分分析(PCA)プロットは、強力なサンプル内クラスタリングを示し、DAFが正(wtEF)と負(Δ22)コントロールの間で中間であることを実証する。(B) 各コンストラクトの遺伝子について、log2FoldChange に対してプロットされた -log(p-value) を示す火山プロット。調整されたp値 1 は重要と見なされ、赤で示されます。パネル5Bは、Theisenから適応され、他の23この図の大きなバージョンを表示するには、ここをクリックしてください。 図 6: 遺伝子クラスを識別するための階層クラスタリング(A) 全ての構成体およびベースラインであるiEFにおける上位1000個の最も可変的な遺伝子の階層的クラスタリングは、DAFがEWS/FLI媒介遺伝子活性化を部分的に救い出す。(B) 遺伝子オントロジー(分子機能)は、DAFによって救出されるか、または救出されないEWS/FLI活性化遺伝子の機能的エンリッチメントを示すToppGeneから生じる。パネル6Bは、Theisenから適応され、他の23この図のより大きなバージョンを表示するには、ここをクリックしてください。 図 7: 異なる構成体に対する異なる転写因子応答要素の詳細な分析: (A)パネルの生成に使用されるデータ処理を示す回路図 (B) と (C) トランスクリプトーム プロファイルを持つ他の利用可能なデータセットを組み込むことによって、(B,C)直接EWS/FLI- (B) がアクティブ化され、(C) がターゲットを抑圧されたさまざまなクラスのレスキューを示すコンパイル。含まれる遺伝子は、内因性EWS/FLIによる検出可能な微分発現を有する遺伝子のみであった。各円グラフでは、構成体によって救出されない遺伝子の部分を灰色で示しています。赤は遺伝子の中で、微分活性を示し、青色は、遺伝子の一部を示し、その部分は、微分抑圧されている。この図は、Theisen、他の23から適応され、この図のより大きなバージョンを表示するには、ここをクリックしてください。 図 S1: HPC 環境への fastq.gz ファイルのロード、トリミング、および配置こちらをクリックして、この図をダウンロードしてください。 図 S2: サンプル全体で読み取り数を照合し、ComBat でバッチ正規化を実行します。こちらをクリックして、この図をダウンロードしてください。 図S3:DESeq2の実行と微分式解析の結果の抽出こちらをクリックして、この図をダウンロードしてください。 図 S4: 出力の分析こちらをクリックして、この図をダウンロードしてください。 図 S5: 遺伝子クラスを識別するための階層クラスタリング: すべての構成体とベースライン iEF の上位 1000 個の可変遺伝子の階層的クラスタリングは 、k クラスターに分類されます。この例では k=7 ですが、このパラメータは 図 S4Dに示すようにユーザーによって設定されます。 こちらをクリックして、この図をダウンロードしてください。 表S1:クラスターアノテーションを有する遺伝子(Ensembl遺伝子ID)のリスト。こちらの表をダウンロードしてください。

Discussion

発がん性転写因子の生化学的メカニズムを研究することは、それらが引き起こす疾患を理解し、新しい治療戦略を設計するために非常に重要である。これは、融合転写因子をもたらす染色体転座によって特徴づけられる悪性腫瘍において特に当てはまる。これらのキメラタンパク質に含まれるドメインは、野生型タンパク質中に存在する調節ドメインとの有意義な相互作用を欠く可能性があり、融合26、27、28の文脈における構造機能情報の解釈能を複雑にする。さらに、これらの発癌性融合の多くは、低複雑性の本質的に障害ドメイン10、13、29、30によって特徴付けられる。

EWSドメインは、種々の発癌性融合10に関与する、本質的に乱れたドメインの例である。本質的に無秩序で反復的な性質は、EWSドメインで採用されている分子メカニズムを理解する努力を妨げている。構造機能を調査する以前の取り組みは、レポーター遺伝子アッセイの文脈や、関連する細胞コンテキストを再現できない細胞背景において異なる変異体を使用することに大きく頼っており、意味のある部分機能11、17、25を産生する構造的な変化を欠いている。ここで紹介する方法では、これらの問題に対処します。構造機能マッピングは、疾患関連細胞コンテキストで行われ、次世代シーケンシングにより、転写プロファイリングがネイティブクロマチンの設定における転写因子関数を評価することが可能になる。EWS/FLIのDAF変異体の具体的な場合には、DAFは、単離された応答要素を用いたレポーターアッセイにおいてほとんど活性を示さないと報告されたが、レポーターアッセイまたは天然クロマチンのいずれかで、完全な遺伝子プロモーターのコンテキストで活性を示すために、興味深い表現型23を示唆した。ここで説明する方法を使用すると、ゲノム全体のどの種類の調節要素が疾患の設定で最も反応が良いかという問題がより直接的に解決されます。すべての候補標的遺伝子をネイティブクロマチンのコンテキストで同時にテストすることで、トランスクリプトーミックアプローチは部分機能を持つ構築物を同定する可能性が高くなります。

疾患関連の細胞バックグラウンドを使用することの固有の強さは、おそらくこの技術の最大の限界です。最も重要な要因の1つは、これらの実験に適した細胞系を選択することです。病理転写因子を有する悪性腫瘍に由来する多くの細胞株は、その転写因子のノックダウンを容易に許容せず、特に小児癌の場合、起源の真の細胞は依然として議論の余地があり、他の細胞背景における腫瘍遺伝子の発現は非常に有毒である31、32 .これらの場合、研究者が結果の解釈に注意を払い、より疾患に関連する細胞タイプの関連所見を適切に検証する限り、異なる細胞バックグラウンドで実験を行うことが役立つ可能性があります。

オンコジーンの発現の安定性と表現性の結果を慎重に検証し、厳密な基準を満たすシーケンシングのためのサンプルのみを提出することが非常に重要です。ここでは、ノックダウンとレスキューを確認するウェスタンブロットと、陽性制御を検証するために少数の既知の標的遺伝子のqRT-PCRが含まれていました(図2)。また、各バッチを通じて細胞およびRNAの調製を可能な限り同様に行うことにより、できるだけ多くのバッチ変動性を減らすことも重要です。

ここで説明する方法は、研究中の転写因子のゲノム全体の機能に話す他のタイプのゲノムデータと組み合わせると特に強力になります。このタイプの構造機能解析の今後の方向性は、ChIP-seqおよびATAC-seqを含むように拡大し、転写因子の結合性およびクロマチンのアクセシビリティにおける任意の誘発変化を決定するであろう。スイートとして、このタイプのデータは、発癌性転写因子の異なる構造成分が機能の異なる側面(すなわちDNA結合とクロマチン修飾対共調節体の採用)に寄与する場所を指し示すことができます。全体として、NGSベースのアプローチを使用して融合転写因子の構造機能関係をマッピングすることで、これらのタンパク質の発癌機能の生化学的決定因子における新しい洞察を明らかにすることができる。これは、彼らが引き起こす病気の理解を深め、新しい治療戦略の開発を可能にするために重要です。

Disclosures

The authors have nothing to disclose.

Acknowledgements

この研究は、全国小児病院のアビゲイル・ウェクスナー研究所の高性能コンピューティング施設によって支援されました。この研究は、国立衛生研究所国立がん研究所[U54 CA231641からSLL、R01 CA183776からSLLへ]によってサポートされました。アレックスのレモネードスタンド財団[ERTに若い調査官賞];ペロトニア [ERTへのフェローシップ];国家保健医療研究評議会CJマーティン海外生物医学フェローシップ[APP1111032 to KIP]。

Materials

Wet Lab Reagents
anti-FLI rabbit pAb Abcam ab15289 1:500
anti-lamin B1 rabbit pAb Abcam ab16048 1:2000
Cell-based system for introduction of mutant constructs Determined by cell system used
Cryotubes For viral aliquots
DMEM Corning Cellgro 10-013-CV For viral production
Fetal bovine serum Gibco 16000-044 For viral production
G418 ThermoFisher 10131027 For viral production
HEK293-EBNAs ATCC CRL-10852 For viral production
HEPES Gibco 15630106
Hygromycin B ThermoFisher 10687010
M2 anti-FLAG mouse mAb Sigma F3165 1:2000
Near IR-secondary antibodies Li-Cor
Optimem Gibco 31985062 For viral production
Penicillin/Streptomycin/Glutamine Gibco 10378-016 For viral production
Polybrene Sigma TR-1003-G For viral transduction
Puromycin Sigma P8833 Stored at 2 mg/mL stock
RNeasy Plus kit Qiagen 74136 Has gDNA removal columns
Selection reagents As dictated by cell system used
Sodium Pyruvate Gibco 11360-070 For viral production
Tissue culture media Determined by cell system used
TransIT-LT1 Mirus MIR 2304 For viral production
Software
Access to HPC environment
AnnotationDbi 1.38.2
Cairo 1.5-10
DESeq2 1.16.1
genefilter 1.58.1
ggbiplot 0.55
ggplot2 3.1.1
org.Hs.eg.db 3.4.1
pheatmap 1.0.12
PuTTY
R 3.4.0
RColorBrewer 1.1-2
reshape2 1.4.3
rgl 0.100.19
R-studio
STAR Version 2.6 or later
sva 3.24.4
TrimGalore!
WinSCP

References

  1. Miettinen, M., et al. New fusion sarcomas: histopathology and clinical significance of selected entities. Human Pathology. 86, 57-65 (2019).
  2. Knott, M. M. L., et al. Targeting the undruggable: exploiting neomorphic features of fusion oncoproteins in childhood sarcomas for innovative therapies. Cancer and Metastasis Reviews. 38, 625-642 (2019).
  3. Yoshihara, K., et al. The landscape and therapeutic relevance of cancer-associated transcript fusions. Oncogene. 34, 4845-4854 (2015).
  4. Duesberg, P. H. Cancer genes generated by rare chromosomal rearrangements rather than activation of oncogenes. Medical Oncology and Tumor Pharmacotherapy. 4, 163-175 (1987).
  5. Dupain, C., Harttrampf, A. C., Urbinati, G., Geoerger, B., Massaad-Massade, L. Relevance of Fusion Genes in Pediatric Cancers: Toward Precision Medicine. Molecular Therapy – Nucleic Acids. 6, 315-326 (2017).
  6. Mitelman, F., Johansson, B., Mertens, F. The impact of translocations and gene fusions on cancer causation. Nature Reviews Cancer. 7, 233-245 (2007).
  7. Smith, R., et al. Expression profiling of EWS/FLI identifies NKX2.2 as a critical target gene in Ewing’s sarcoma. Cancer Cell. 9, 405-416 (2006).
  8. Davicioni, E., et al. Identification of a PAX-FKHR gene expression signature that defines molecular classes and determines the prognosis of alveolar rhabdomyosarcomas. Cancer Research. 66, 6936-6946 (2006).
  9. Gröbner, S. N., et al. The landscape of genomic alterations across childhood cancers. Nature. 555, 321-327 (2018).
  10. Kim, J., Pelletier, J. Molecular genetics of chromosome translocations involving EWS and related family members. Physiological Genomics. 1, 127-138 (1999).
  11. Boulay, G., et al. Cancer-Specific Retargeting of BAF Complexes by a Prion-like Domain. Cell. 171, 163-178 (2017).
  12. Lessnick, S. L., Braun, B. S., Denny, C. T., May, W. A. Multiple domains mediate transformation by the Ewing’s sarcoma EWS/FLI-1 fusion gene. Oncogene. 10, 423-431 (1995).
  13. Leach, B. I., et al. Leukemia fusion target AF9 is an intrinsically disordered transcriptional regulator that recruits multiple partners via coupled folding and binding. Structure. 21, 176-183 (2013).
  14. Ng, K. P., et al. Multiple aromatic side chains within a disordered structure are critical for transcription and transforming activity of EWS family oncoproteins. Proceedings of the National Academy of Sciences U.S.A. 104, 479-484 (2007).
  15. Riggi, N., et al. EWS-FLI1 Divergent Chromatin Remodeling Mechanisms to Directly Activate or Repress Enhancer Elements in Ewing Sarcoma. Cancer Cell. 26, 668-681 (2014).
  16. Tomazou, E. M., et al. Epigenome Mapping Reveals Distinct Modes of Gene Regulation and Widespread Enhancer Reprogramming by the Oncogenic Fusion Protein EWS-FLI1. Cell Reports. 10, 1082-1095 (2015).
  17. Sankar, S., et al. Mechanism and relevance of EWS/FLI-mediated transcriptional repression in Ewing sarcoma. Oncogene. 32, 5089-5100 (2013).
  18. Gangwal, K., et al. Microsatellites as EWS/FLI response elements in Ewing’s sarcoma. Proceedings of the National Academy of Sciences U.S.A. 105, 10149-10154 (2008).
  19. Gangwal, K., Close, D., Enriquez, C. A., Hill, C. P., Lessnick, S. L. Emergent Properties of EWS/FLI Regulation via GGAA Microsatellites in Ewing’s Sarcoma. Genes & Cancer. 1, 177-187 (2010).
  20. Guillon, N., et al. The Oncogenic EWS-FLI1 Protein Binds In Vivo GGAA Microsatellite Sequences with Potential Transcriptional Activation Function. PLoS One. 4, 4932 (2009).
  21. Chong, S., et al. Imaging dynamic and selective low-complexity domain interactions that control gene transcription. Science. 361, (2018).
  22. Johnson, K. M., et al. Role for the EWS domain of EWS/FLI in binding GGAA-microsatellites required for Ewing sarcoma anchorage independent growth. Proceedings of the National Academy of Sciences U.S.A. 114, 9870-9875 (2017).
  23. Theisen, E. R., et al. Transcriptomic analysis functionally maps the intrinsically disordered domain of EWS/FLI and reveals novel transcriptional dependencies for oncogenesis. Genes & Cancer. 10, 21-38 (2019).
  24. Chen, J., Bardes, E. E., Aronow, B. J., Jegga, A. G. ToppGene Suite for gene list enrichment analysis and candidate gene prioritization. Nucleic Acids Research. 37, 305-311 (2009).
  25. Johnson, K. M., Taslim, C., Saund, R. S., Lessnick, S. L. Identification of two types of GGAA-microsatellites and their roles in EWS/FLI binding and gene regulation in Ewing sarcoma. PLOS One. 12, 0186275 (2017).
  26. Kim, P., Ballester, L. Y., Zhao, Z. Domain retention in transcription factor fusion genes and its biological and clinical implications: a pan-cancer study. Oncotarget. 8, 110103-110117 (2017).
  27. de Mendíbil, I. O., Vizmanos, J. L., Novo, F. J. Signatures of Selection in Fusion Transcripts Resulting from Chromosomal Translocations in Human Cancer. PLOS One. 4, 4805 (2009).
  28. Frenkel-Morgenstern, M., Valencia, A. Novel domain combinations in proteins encoded by chimeric transcripts. Bioinformatics. 28, 67-74 (2012).
  29. Hegyi, H., Buday, L., Tompa, P. Intrinsic Structural Disorder Confers Cellular Viability on Oncogenic Fusion Proteins. PLoS Computational Biology. 5, 1000552 (2009).
  30. Latysheva, N. S., Babu, M. M. Discovering and understanding oncogenic gene fusions through data intensive computational approaches. Nucleic Acids Research. 44, 4487-4503 (2016).
  31. Deneen, B., Denny, C. T. Loss of p16 pathways stabilizes EWS/FLI1 expression and complements EWS/FLI1 mediated transformation. Oncogene. 20, 6731-6741 (2001).
  32. Kendall, G. C., et al. PAX3-FOXO1 transgenic zebrafish models identify HES3 as a mediator of rhabdomyosarcoma tumorigenesis. eLife. 7, 33800 (2018).

Play Video

Cite This Article
Showpnil, I. A., Miller, K. R., Taslim, C., Pishas, K. I., Lessnick, S. L., Theisen, E. R. Mapping the Structure-Function Relationships of Disordered Oncogenic Transcription Factors Using Transcriptomic Analysis. J. Vis. Exp. (160), e61564, doi:10.3791/61564 (2020).

View Video