肯定的な酵母 2 ハイブリッド相互作用の可能性があります選択酵母集団のディープ シーケンスには、パートナーの相互作用の蛋白質についての情報の富が得られます。ここでは、特定のバイオインフォマティクス ツールとこのような画面からシーケンス データを分析するカスタマイズされた更新されたソフトウェアの操作について述べる。
我々 は、同時に高スループット短鎖 DNA シーケンスを利用した単一の画面内で一過性と静的な蛋白質の相互作用の多数を明らかにする酵母 2 ハイブリッド試金を適応しています。結果のシーケンスのデータセットだけでなく、肯定的な酵母 2 ハイブリッド相互作用のための選択中に濃縮されている人口はどのような遺伝子を追跡も蛋白質の相互作用のために十分の関連するサブドメインに関する詳細情報を与えます。ここでは、我々 は非専門家すべての生物情報学および処理し、バッチ酵母 2 ハイブリッド試金から DNA シーケンス fastq ファイルを分析する統計手順を実行することができるスタンドアロンのソフトウェア プログラムの完全なスイートをについて説明します。これらのソフトウェアによって覆われている処理手順が含まれます: 酵母 2 ハイブリッド獲物ライブラリ内でエンコードされた各候補タンパク質に対応する 1) マッピングとカウントのシーケンス リード2) 濃縮プロファイルを評価する統計解析プログラム・ 3) 並進フレームと興味の相互作用の蛋白質を符号化する各の豊かなプラスミッドのコーディング領域内の位置を調べるためのツール。
蛋白質の相互作用を検出する方法の 1 つは、どの攻撃設計興味の蛋白質の相互作用のパートナー1フラグメントにバインドされたときだけ拡張酵母、酵母 2 ハイブリッド (Y2H) アッセイです。大規模な並列高スループット シーケンスの助けを借りて複数 Y2H 相互作用の検出を行うことが今できます。いくつかのフォーマットがされている個体群が生成するプラスミドを含む酵母の選択条件下でバッチで栽培されたものを開発した 1 つを含む2,3,4、5の説明、正 Y2H 相互作用6。我々 は、開発 deepn 深さ (評価のタンパク質ネットワークの動的な濃縮) と呼ばれる、1 つの蛋白質 (またはドメイン) の対と相互作用するタンパク質を識別するために同じ獲物ライブラリから差分 interactomes を識別するワークフロー。別の蛋白質またはコンホメーションの突然変異体のドメイン。このワークフローの主な手順は、適正処理や DNA シーケンス データの解析があります。RNA シーケンス実験に似ていますファッション Y2H 相互作用の選択の前後に各遺伝子のための読み取りの数をカウントするだけでいくつかの情報を拾うことができます。しかしより多くの詳細な情報は、Y2H 相互作用を作り出すことができるある特定の蛋白質のサブドメイン情報を含むこれらのデータセットから抽出できます。さらに、DEEPN アプローチが重要であるに対し多くのサンプルの複製を分析することができます面倒で高価です。複製の数が限られている6DEEPN データセットのために特別に開発された統計モデルを使用して、この問題を軽減します。生物情報学の知識がなくても捜査官の DNA シーケンスのデータセットの処理および分析信頼できる、完全な堅牢で、アクセスを作る、分析のすべてのステップをカバーするソフトウェア プログラムのスイートを開発しました。
デスクトップ コンピューター上で実行されるスタンドアロンのソフトウェア プログラムのこのスイートには、MAPster、deepn 深さと Stat_Maker が含まれます。MAPster は、生産して下流のアプリケーションで使用する標準 .sam ファイル HISAT2 のプログラム7を使用してゲノムへのマッピングにより、各 fastq ファイル キューに登録グラフィック ユーザー インターフェイスです。Deepn 深さは、いくつかのモジュールです。それは割り当て、特定遺伝子モジュール ‘遺伝子’ カウントを使用して RNA シーケンス型数量化と同様に対応する読み取りをカウントします。また、Gal4 転写ドメインと獲物のシーケンス間の接合に対応するシーケンスを抽出し、比較表やグラフ (‘Junction_Make’ モジュールを使用) の点検を許可するようにこれらの接合位置の照合順序’Blast_Query’ モジュールには、簡単な検査、定量、ジャンクション Gal4 結合配列の比較ができます。Stat_Maker は、可能性が高い Y2H ヒットの優先順位付けの方法として統計的に遺伝子濃縮データあたりの読み取り数を評価します。ここでは、これらのソフトウェア プログラムを使用して完全に DEEPN Y2H からデータ実験 dna 塩基配列を解析する方法について述べる.PC、Mac、および Linux システム上で実行する deepn 深さのバージョンがあります。MAPster マッピング プログラムなどの他のプログラムと deepn 深さ統計モジュール Stat_Maker Unix で実行、Mac および linux システム上でのみ利用可能なサブルーチンに頼る。
ここで説明するソフトウェア スイート完全に DEEPN 実験からハイスループット DNA シーケンス データを分析処理しことができます。使用する最初のプログラムは、MAPster、DNA シーケンスの読み取りは、標準 fastq ファイルと参照 DNA 情報学プログラム DEEPN ソフトウェアを含む全体のホストによる下流の処理のために彼らの位置をマップです。出力ファイル、プログラム7制御の?…
The authors have nothing to disclose.
この仕事は健康の国民の協会によって支えられた: NIH R21 EB021870 01A1、NSF 研究プロジェクト助成: 1517110。