I – TASSERのパイプラインを使用してタンパク質の構造と機能解析に基づくコンピューターのためのガイドラインが記述されています。クエリタンパク質配列から始まる、3Dモデルは、複数のスレッドアラインメントを使用して生成され、構造組立シミュレーションを反復している。機能的な推論は、その後、既知の構造と機能を持つ蛋白質の一致に基づいて描画されます。
ゲノムシーケンシングプロジェクトは、その生物学的役割についての理解を向上させるために、それらの構造と機能の知識を必要とするタンパク質の配列の何百万を、暗号化されている。実験方法は、これらの蛋白質のごく一部のために詳細な情報を提供することができますが、計算モデルは実験的に未知されているタンパク質分子の大部分のために必要です。 I – TASSERサーバは、タンパク質の構造と機能の高解像度モデリングのためのオンラインワークベンチです。タンパク質配列を考えると、I – TASSERサーバからの典型的な出力は、二次構造予測が含まれ、各残基の溶媒露出度、スレッドと構造アラインメントによって検出された相同テンプレートのタンパク質、最大5つのフルレングスの三次構造モデル、および構造ベースの予測酵素の分類のための機能のアノテーション、遺伝子オントロジーの用語と蛋白質 – リガンド結合部位。すべての予測は信頼性スコアでタグ付けされている予測は実験データを知らなくてもあるか正確に伝えます。エンドユーザーの特殊な要求を容易にするために、サーバはユーザが指定した残基間の距離を受け入れ、対話的にI – TASSERのモデリングを変更するマップを連絡するチャネルを提供し、それはまた、ユーザーがテンプレートとして任意のタンパク質を指定するには、または任意のテンプレートを除外することができます構造の組み立てシミュレーション中のタンパク質。構造情報は、I – TASSER予測の質を改善する目的で実験的証拠または生物学的洞察に基づいて、ユーザーによって収集することができます。サーバは、最近の社会全体のCASP実験でタンパク質の構造と機能の予測のための最高のプログラムとして評価した。現在ありません>オンラインI – TASSERサーバを使用している100カ国以上から20,000登録の科学者が。
上記のプロトコルは、I – TASSERサーバを使用して構造と機能のモデリングのための一般的なガイドラインです。 、この自動化された手順は、タンパク質の大部分を非常にうまく動作しますが、人間の介入は、しばしば特にPDBライブラリに近いテンプレートを欠いているタンパク質のため、大幅にモデリングの精度を向上させるのに役立ちます。 (b)の構造のアセンブリを改善するための外部制約を提供する;マルチドメインタンパク質の(A)の分割及び(c)のモデル化の際にテンプレートを削除:ユーザーは、次の方法でI – TASSERのモデリング中に介入することができます。
分割するマルチドメイン蛋白質:
多くの長いタンパク質配列は、頻繁に実験と計算の両方の技術を使用して、その構造の解明を困難にする柔軟なリンカー領域によってつなが複数のドメインが含まれています。それにもかかわらず、ドメインは独立して折り畳み式の実体であり、明確な分子機能を実行することができますように、それは個別に各ドメインの長いマルチドメインタンパク質とモデルを分割することが望ましい。モデリングのドメインは、個別にのみ予測のプロセスをスピードアップしませんが、またクエリテンプレートのアラインメントの質はより信頼性の高い構造と機能の予測の結果、増加する。
タンパク質配列のドメイン境界は、NCBI CDD 24、PFAM 25またはInterProScanの26として自由に利用できる外部のオンラインプログラムを使用して予測することができます。また、アラインメントのスレッドLOMETS、クエリタンパク質のために使用可能な場合は、ドメインの境界を視覚的に(ステップ5.4を参照)上のスレッドのテンプレートに整列されていない残基の長いストレッチを識別することによって見つけることができます。これらのアライメントされていない領域は、主にドメインリンカー領域に対応しています。すべてのクエリーのドメインが整列してマルチドメインのテンプレートがテンプレートPDBライブラリですでに使用可能な場合は、クエリのタンパク質は、全長としてモデル化することができます。
外部制約を提供する
<pクラスは、="jove_content"> I – TASSERの構造のアセンブリのシミュレーションは、主にテンプレートをスレッドLOMETSから収集された空間的な制約によって導かれる。テンプレートライブラリに優れたスレッドヒット(Norm. Z -スコア > 1)を持っているクエリタンパク質については、派生空間的制約は、高精度であることが多い。とI – TASSERは、これらのタンパク質の高分解能構造モデルを生成します。逆に、弱い、またはまったくスレッディングヒット(Norm. Z -スコア <1)を持つクエリのタンパク質で、収集された空間的な制約は、しばしばテンプレートとアライメントの不確実性のエラーが含まれている。これらのタンパク質のターゲットでは、ユーザーが指定した空間情報は、予測モデルの品質を向上させるために非常に役立ちます。ユーザーは、2つの方法でI – TASSERサーバーへの外部制約を提供することができます。A.は、接触/距離制約を指定します。
NMRから、例えば実験的に特徴づけられる残基間コンタクト/距離、または架橋実験を、拘束のファイルをアップロードして指定することができます。例のファイルは図8に示すように、カラム1が拘束の種類を指定する場所、"DIST"または"CONTACT"すなわち。距離拘束(DIST)の場合は、列が2と4は、残基位置(i、j)を含む、列3と5は、残基と6列目の原子の種類を含む2つの指定された原子間の距離を指定します。接触拘束(CONTACT)の場合は、列2と3は接触にあるべき残基の位置を(i、j)を含んでいます。これらの連絡残基ペアの側鎖の中心間の距離は、PDBで知られている構造で観測された距離に基づいて決定されます。 I – TASSERは、構造精密化のシミュレーション中に指定された距離に近いこれらの原子のペアを描画しようとします。
B.は、タンパク質の構造のテンプレートを指定します。
LOMETSスレッドプログラムでは、クエリのprotのためのもっともらしい襞を見つけるために代表的なPDBライブラリを使用してくださいアイン。代表的な構造のライブラリを使用すると、配列構造のアラインメントを計算するために必要な時間を減らすために役立ちますが、それは良いテンプレートのタンパク質がライブラリ内に見落とされた場合、またはテンプレートが、それがであっても、LOMETSスレッドプログラムで識別されていない可能性がありますライブラリ内に存在する。これらのケースでは、ユーザーがテンプレートとして所望のタンパク質の構造を指定する必要があります。
追加のテンプレートとしてタンパク質の構造を指定するには、ユーザーがいずれかのPDBフォーマットされた構造のファイルをアップロードするか、PDB、ライブラリ内の堆積タンパク質の構造のPDB IDを指定することができます。 I – TASSERは召集プログラム23を使用してクエリテンプレートのアラインメントを生成し、指定されたユーザーテンプレートと構造の組立シミュレーションを導くためにLOMETSテンプレートの両方から空間的な制約を収集します。 LOMETS拘束具の精度が異なるターゲットが異なるため、LOMETSの拘束の重みは、容易に(相同)TAに強力です。体系的に私たちのベンチマークトレーニングにチューニングされているハード(非相同)ターゲット、のそれよりもrgets。
またユーザが独自のクエリテンプレートのアラインメントを指定することができます。 FASTA形式(図9A)及び3Dフォーマット(図9B):サーバーには2つの形式で位置合わせを受け入れます。 FASTA形式は標準とで説明されていますhttp://zhanglab。 ccmb.med.umich.edu / FASTA / 。 3Dフォーマットは、標準的なPDB形式(に似ていますhttp://www.wwpdb.org/documentation/format32/sect9.html )が、テンプレートから派生した2つの追加列はATOMの記録(図9B参照)に追加されます。
列1-30:アトム(C -αのみ)と残クエリシーケンスの名前。
列31から54:テンプレートの対応する原子からコピーされたクエリのC -α原子の座標。
列55から59:アライメントに基づいて、テンプレート内の対応する残基の数
列60から64:テンプレートの対応する残基名
テンプレートの蛋白質を除外する
タンパク質は、柔軟な分子であり、それらの生物学的活性を変更するには、複数の構造状態を採用することができます。例えば、多くのプロテインキナーゼと細胞膜タンパク質の構造は、 アクティブおよび非アクティブの両方コンフォメーションで解決されている。また、結合したリガンドの有無は、大きな構造的な動きを引き起こす可能性があります。テンプレートのすべての構造状態は、スレッド化プログラムのために似ているが、それは1つだけ特定の状態でテンプレートを使用してクエリをモデル化することが望ましい。サーバ上の新しいオプションは、ユーザが構造のモデリング時にテンプレートの蛋白質を除外することができます。また、この機能は、ユーザーがモデリングに使用するテンプレートの相同性レベルを選択できるようになります。ユーザーがテンプレートタンパク質frを除外することができます。OM I – TASSERライブラリ替え:
A.は、配列同一性のカットオフを指定する
ユーザーは、I – TASSERのテンプレートライブラリから相同蛋白質を除外するには、このオプションを使用することができます。相同性のレベルが配列同一のカットオフに基づいて設定されて、クエリとクエリ配列のシーケンスの長さで割ったテンプレートのタンパク質間の同一の残基の数、すなわち。提供する形で"70%"、配列同一性を持っているすべてのテンプレートのタンパク質> 70%のユーザーがクエリタンパク質にたとえば、私は、予定I – TASSERのテンプレートライブラリから除外される。
B.特定のテンプレートの蛋白質を除外
特定のテンプレートのタンパク質が除外される構造のPDB IDを含むリストをアップロードすることによってI – TASSERのテンプレートライブラリから除外することができます。サンプルファイルは、図10に示します。同じタンパク質としてI – TASSER SE、PDBライブラリに複数のエントリとして存在することができますrverはデフォルトで指定されたテンプレート(列1の)だけでなく、アイデンティティーを持つライブラリから他のすべてのテンプレート>指定したテンプレート〜90%が除外されます。また、ユーザーは、アイデンティティーを持つすべてのテンプレート> 70%、指定されたテンプレートのタンパク質には除外されるなどの70%を、別のアイデンティティのカットオフを指定することができます。
The authors have nothing to disclose.
プロジェクトは、アルフレッドP.スローン財団、NSFのキャリア賞(DBI 1027394)、および米国立総合医科学研究所(GM083107、GM084222)によって部分的にサポートされています。