概要

バッチ酵母 2 ハイブリッド スクリーンからシーケンス データの情報解析

Published: June 28, 2018
doi:

概要

肯定的な酵母 2 ハイブリッド相互作用の可能性があります選択酵母集団のディープ シーケンスには、パートナーの相互作用の蛋白質についての情報の富が得られます。ここでは、特定のバイオインフォマティクス ツールとこのような画面からシーケンス データを分析するカスタマイズされた更新されたソフトウェアの操作について述べる。

Abstract

我々 は、同時に高スループット短鎖 DNA シーケンスを利用した単一の画面内で一過性と静的な蛋白質の相互作用の多数を明らかにする酵母 2 ハイブリッド試金を適応しています。結果のシーケンスのデータセットだけでなく、肯定的な酵母 2 ハイブリッド相互作用のための選択中に濃縮されている人口はどのような遺伝子を追跡も蛋白質の相互作用のために十分の関連するサブドメインに関する詳細情報を与えます。ここでは、我々 は非専門家すべての生物情報学および処理し、バッチ酵母 2 ハイブリッド試金から DNA シーケンス fastq ファイルを分析する統計手順を実行することができるスタンドアロンのソフトウェア プログラムの完全なスイートをについて説明します。これらのソフトウェアによって覆われている処理手順が含まれます: 酵母 2 ハイブリッド獲物ライブラリ内でエンコードされた各候補タンパク質に対応する 1) マッピングとカウントのシーケンス リード2) 濃縮プロファイルを評価する統計解析プログラム・ 3) 並進フレームと興味の相互作用の蛋白質を符号化する各の豊かなプラスミッドのコーディング領域内の位置を調べるためのツール。

Introduction

蛋白質の相互作用を検出する方法の 1 つは、どの攻撃設計興味の蛋白質の相互作用のパートナー1フラグメントにバインドされたときだけ拡張酵母、酵母 2 ハイブリッド (Y2H) アッセイです。大規模な並列高スループット シーケンスの助けを借りて複数 Y2H 相互作用の検出を行うことが今できます。いくつかのフォーマットがされている個体群が生成するプラスミドを含む酵母の選択条件下でバッチで栽培されたものを開発した 1 つを含む2,3,45の説明、正 Y2H 相互作用6。我々 は、開発 deepn 深さ (評価のタンパク質ネットワークの動的な濃縮) と呼ばれる、1 つの蛋白質 (またはドメイン) のと相互作用するタンパク質を識別するために同じ獲物ライブラリから差分 interactomes を識別するワークフロー。別の蛋白質またはコンホメーションの突然変異体のドメイン。このワークフローの主な手順は、適正処理や DNA シーケンス データの解析があります。RNA シーケンス実験に似ていますファッション Y2H 相互作用の選択の前後に各遺伝子のための読み取りの数をカウントするだけでいくつかの情報を拾うことができます。しかしより多くの詳細な情報は、Y2H 相互作用を作り出すことができるある特定の蛋白質のサブドメイン情報を含むこれらのデータセットから抽出できます。さらに、DEEPN アプローチが重要であるに対し多くのサンプルの複製を分析することができます面倒で高価です。複製の数が限られている6DEEPN データセットのために特別に開発された統計モデルを使用して、この問題を軽減します。生物情報学の知識がなくても捜査官の DNA シーケンスのデータセットの処理および分析信頼できる、完全な堅牢で、アクセスを作る、分析のすべてのステップをカバーするソフトウェア プログラムのスイートを開発しました。

デスクトップ コンピューター上で実行されるスタンドアロンのソフトウェア プログラムのこのスイートには、MAPster、deepn 深さと Stat_Maker が含まれます。MAPster は、生産して下流のアプリケーションで使用する標準 .sam ファイル HISAT2 のプログラム7を使用してゲノムへのマッピングにより、各 fastq ファイル キューに登録グラフィック ユーザー インターフェイスです。Deepn 深さは、いくつかのモジュールです。それは割り当て、特定遺伝子モジュール ‘遺伝子’ カウントを使用して RNA シーケンス型数量化と同様に対応する読み取りをカウントします。また、Gal4 転写ドメインと獲物のシーケンス間の接合に対応するシーケンスを抽出し、比較表やグラフ (‘Junction_Make’ モジュールを使用) の点検を許可するようにこれらの接合位置の照合順序’Blast_Query’ モジュールには、簡単な検査、定量、ジャンクション Gal4 結合配列の比較ができます。Stat_Maker は、可能性が高い Y2H ヒットの優先順位付けの方法として統計的に遺伝子濃縮データあたりの読み取り数を評価します。ここでは、これらのソフトウェア プログラムを使用して完全に DEEPN Y2H からデータ実験 dna 塩基配列を解析する方法について述べる.PC、Mac、および Linux システム上で実行する deepn 深さのバージョンがあります。MAPster マッピング プログラムなどの他のプログラムと deepn 深さ統計モジュール Stat_Maker Unix で実行、Mac および linux システム上でのみ利用可能なサブルーチンに頼る。

Protocol

1. マッピング Fastq ファイル 注: DEEPN ソフトウェアとして多くの生物情報学プログラムは、参照 DNA の位置を読む各シーケンスがマップされて前記 DNA シーケンス データを使用します。HISTAT2 プログラムを使用して、以降の手順で使用される .sam ファイルを生成ここに MAPster インターフェイスを含んでこれのためさまざまなマッピング プログラムを使用できます。 ?…

Representative Results

Fastq データをマッピングする: 最初の手順Deepn 深さが初期の出力は、ゲノムに配置してマップする必要があります短い一連の読み取りのファイルを含む事実上すべての NGS アプリケーション、トランスクリプトーム、または他は DNA8を参照します。最近では、HISAT2 の配置プログラムは、最新のインデックス作成アルゴリズムを使用して…

Discussion

ここで説明するソフトウェア スイート完全に DEEPN 実験からハイスループット DNA シーケンス データを分析処理しことができます。使用する最初のプログラムは、MAPster、DNA シーケンスの読み取りは、標準 fastq ファイルと参照 DNA 情報学プログラム DEEPN ソフトウェアを含む全体のホストによる下流の処理のために彼らの位置をマップです。出力ファイル、プログラム7制御の?…

開示

The authors have nothing to disclose.

Acknowledgements

この仕事は健康の国民の協会によって支えられた: NIH R21 EB021870 01A1、NSF 研究プロジェクト助成: 1517110。

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

参考文献

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

記事を引用
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video