概要

Bio3D-webとのタンパク質配列構造ダイナミクスの関係の研究

Published: July 16, 2017
doi:

概要

Bio3D-webを用いたタンパク質配列 – 構造 – 動態関係のオンライン調査のためのプロトコールを提示する。

Abstract

我々は、生体分子構造データの対話的分析のためのBio3D-webの使用法を実証します。 Bio3D-webアプリケーションは、以下の目的でオンライン機能を提供します。(1)ユーザーが指定した類似性の閾値に関連するタンパク質構造の識別。 (2)それらの複数のアラインメントおよび構造の重ね合わせ; (3)配列および構造保存分析; (4)主成分分析との相互コンター関係マッピング、および(5)アンサンブルノーマルモード分析による予測内部ダイナミクスの比較。この統合された機能は、タンパク質ファミリーおよびスーパーファミリー内の配列 – 構造 – 動的関係を調べるための完全なオンラインワークフローを提供します。

Introduction

現在、タンパク質データバンク(PDB)には120,000を超えるタンパク質構造が含まれています。その多くは同じタンパク質ファミリーであるが、異なる実験条件下で解明されています。これらの複数の構造は、タンパク質の形態と機能の複雑さを理解する上で貴重なリソースです。例えば、これらの構造アンサンブルの厳密な比較は重要な分子機構1、2、3明らかすることができるし、リガンド結合、酵素触媒および二分子認識4、5、6、7を含むプロセスに関与するコンホメーション力学に通知します。タンパク質ファミリーの配列、構造および動態の詳細な大規模分析から、しばしば新しい洞察を得ることができます。しかしながら、これは、典型的には、かなりのバイオイン研究の対象となるタンパク質システムに精通した上で、例えば、そのようなBio3D、ProDyとMavenのようなソフトウェアパッケージは、R、PythonとMatlabの、それぞれ8、9、10にプログラミングを必要とします。逆に、構造的柔軟性を分析するためのオンラインツールは、一般的に個々の構造11、12の調査に限定されています。この点に関する例外として、最近開発されたWebNM @サーバーがあります。これにより、事前調整されたいくつかのユーザー指定構造13の標準モード解析(NMA)から得られた柔軟性パターンを比較できます。しかし、このサーバーには、NMAを超えた比較、その整列、またはそれ以上の分析のための構造の識別のための自動化された手順が欠けています。もう1つの最近の貢献は、オンラインPDBFlexデータベースで、プレc95%以上の配列同一14を共有するPDB構造のomputed分析。しかし、より多様な構造セットの分析は現在利用できません。

我々は以前Bio3Dウェブを提示している-タンパク質配列-構造-動的な関係15の分析のためのWebアプリケーションを使用して簡単にできます。 Bio3D-webは、大規模な同種構造セットのオンライン同定、比較、詳細解析に使いやすい統合機能を提供する点でユニークです。ここでは、Bio3D-webを用いたタンパク質配列 – 構造 – 動態関係のオンライン調査のための詳細なプロトコルを紹介します。 Bio3D-webは、 図1に示すデータ分析の5つの主要なステップをサポートするためのさまざまな機能を提供し、以下で詳しく説明します。これらのステップは、問合せシーケンスまたは構造入力から、複数レベルの順序構造動的解析、要約までのワークフローを構成しますyレポート生成。結果は、広範なブラウザ内のビジュアライゼーションおよびプロッティング・デバイスを介して、および一般的に使用されるフォーマットで結果ファイルをダウンロードすることによって、すぐに利用可能です。 Bio3D-webは、パラメータやメソッドの選択肢の効果を調べるための便利で使いやすいダイナミックインターフェイスに加えて、PDF、DOC、HTML形式の共有可能な再現可能なレポートとして、ユーザーセッションの完全なユーザー入力とそれに続くグラフィカルな結果を記録します。ユーザセッションは将来保存され、再ロードされ、ユーザのローカルマシン上のBio3D Rパッケージによって完全な結果がダウンロードされ、さらに解釈される。

Bio3Dウェブは生体分子の構造、配列及び分子シミュレーションデータ8、16の分析のためBio3D Rパッケージによって供給されます。特に、リジッドコア識別のためのBio3Dアルゴリズム 8 、重ね合わせ、主成分分析(PCA) 8およびアンサンブル標準モード解析(eNMA) 16は、アプリケーションの基礎を形成する。また、関連するタンパク質構造の同定のためにpHMMER 17に依存するBio3Dプロトコール、および多重配列アラインメントのためのMUSCLE 18を利用する。構造および配列の注釈は、RCSB PDB 19およびPFAMデータベース20からBio3Dユーティリティを介して得られる。 Bio3D-webは、当社のオンラインサーバーから実行することも、Rを実行する任意のコンピュータにローカルにインストールすることもできます。Bio3D-webは、すべてのユーザーに開放されており、http:// thegrantlabからGPL-3オープンソースライセンスで無償で提供されます。 org / bio3d / webapps

Protocol

注記:典型的なBio3D-webセッションは、5つの連続した依存するステップを経て進められます( 図1を参照)。各ステップは、ウェブアプリケーションの連続ナビゲーションタブ、すなわちSEARCH、ALIGN、FIT、PCA、およびeNMAとして実装されます。 1.構造検索と選択(SEARCH) 入力構造 例えば 、PDBを検索することにより、アデニル酸キナーゼ(Adk)のPDB IDを取得する[http://www.rcsb.org/pdb]。あるいは、目的のタンパク質アミノ酸配列を、 例えば UniProt [http://uniprot.org]から入手する。 Adk用の4文字の長さのPDB ID( 例: 1AKE)を入力するか、タンパク質配列を「Input structure or sequence」パネルのテキストボックスに貼り付けます。 ヒットの選択 最初のパネルの青色の「次へ」(ヒット選択)ボタンをクリックするか、単にパネルにスクロールダウンします。B)「ヒット選択」さらなる解析のために。 「包含構造の総数を制限する」スライダがカットオフの上のすべての構造を含むように最大値に設定されていることを確認します。 「包括BitScoreカットオフを調整する」を低くして、より遠くに関連するヒットを含めるか、それを増やして除外します。 オプションのヒットフィルタリング 最初のパネルの青色の「次へ」(ヒット選択)ボタンをクリックするか、単にパネルC)「次の分析のための関連構造のオプションのフィルタリング」までスクロールします。 選択されたヒットは、テーブルの内容を検査することにより、 例えば PDB名、種、および結合したリガンドを、関連する構造を表すことを確認してください。 必要に応じて、テーブルの行をクリックして、選択した構造のサブセットを手動で修正します。 注:青色で強調表示された行は、後続のタブでさらに解析するために選択されたPDB IDを示します。 2。複数配列アライメント分析(ALIGN) ALIGNタブをクリックして、SEARCHタブから選択した構造の配列アライメントを実行します。 アライメントの要約 パネルA)の「整列要約」の整列要約を確認してください。関心領域が1つ以上の構造のギャップによって整列され、マスクされていないことを確認します。 必要に応じて、「Display alignment editing options」を切り替えて、望ましくないPDB ID、 たとえば欠損がないPDBを削除します。 配列アラインメント解析 収集された構造のシーケンスベースのクラスタリング分析を実行するには、青色の「次へ」(分析)ボタンをクリックします。 プロットオプションDendrogramを選択します。 ClusterをK groupsスライダに調整し、構造をk個のグループに分割します。 必要に応じて、「クラスタリングおよび出力オプションを追加」チェック・ボックスを切り替えて、クラスタリング方法を変更します(オプション)。 </o1> 残渣保存分析 青色の「次へ」(Conservation)ボタンをクリックして、カラムごとの残渣保存量を計算します。 整列構造セットを選択して、各整列位置での残基保存のプロットを生成します。 ファミリーの代表メンバーを含む関連するPFAMシードアライメントに関して計算された保存を示すために、PFAMシードアラインメントと整列した構造を選択する。 シーケンスアライメント表示 青色の「次へ」(整列)ボタンをクリックすると、ブラウザ内整列可視化ツールで完全な整列が表示されます。 3.構造フィッティングと解析(FIT) FITタブを入力して構造の重ね合わせを実行します。 構造重畳 「PDBを表示」チェックボックスを切り替えて、整列したタンパク質を可視化します。ブラウザー内のn個の構造体。 目視検査により、タンパク質構造が対応する関連領域に重なることを確認する。マウスをクリックして回転する構造上にドラッグし、スクロールしてズームします。 「カラーオプション」をクリックして、構造体の色付けを調整します。配色オプションには、アライメント位置、位置ごとの構造的変動性、RMSDクラスターグループ、シーケンスクラスターグループ、位置合わせされた領域、および2次構造が含まれます。 特別な分子ビューアプログラムで視覚化するために、従来のPDBファイルまたは単一のPyMOLセッションファイルとして重畳構造をダウンロードします。 構造解析 収集されたPDB構造の構造ベースのクラスタリングを実行するには、青色の「次へ」(分析)ボタンをクリックします。 プロットオプションドロップダウンメニューでRMSDヒートマップを切り替えます。 クラスタリングの方法を含め、クラスタリングのオプションを調整する「より多くのクラスタリングと出力オプション」チェックボックスを切り替えることによって、 注記:ペアのRMSDデータは、樹状図、ヒストグラム、またはヒートマップとして視覚化することもできます。 残渣の変動 青色の「次へ(RMSF)」ボタンをクリックすると、各残差(RMSFプロットとして表示)の構造的変動性が表示され、主要な二次構造要素がx軸の周辺領域に表示されます。 Show B-factorsチェックボックスを切り替えて、参照構造の結晶学的BファクタをRMSFプロットにオーバーレイします。 4.主成分分析(PCA) 「PCA」タブを入力して主成分分析を実行します。 主成分の視覚化 ブラウザの視覚化ツールを使用してPCで記述された動作を視覚化するには、[Show PC Trajectory]チェックボックスを切り替えます。 「プリンcipalコンポーネント1 "が最初のドロップダウンメニューから選択されます。 他のPCで記述された動作を視覚化するには、「Principal Componentの選択」ドロップダウンメニューから目的のPCを選択します。 軌道の色を「カラーオプション」ドロップダウンメニューから変更します。 変位の大きさで色を付けるには、[カラーオプション]から[位置ごとの変動]を選択します。 [Principal Component Visualization]パネルの[Download PDB trajectory]ボタンをクリックすると、PCで記述されたモーションの軌跡ビューが表示されます。 「Download PyMOL」セッションファイルのボタンをクリックして、動きをベクトルフィールドとして与えるPyMOLセッションファイルを生成します。 コンフォーマー分析 青色の「次へ」(プロット)ボタンをクリックして、選択した2つのPCに個々の構造を投影します。 「X軸のPC」が1に設定されていること、「PC on Y軸 "を2に設定します。構造を他のPCに投影するには、それに応じてPCの番号付けを調整します。 PCベースのクラスタリングを使用してプロット内の構造を色付けするには、[PCサブスペースでクラスタ化]を選択します。 「RMSDベースの」クラスタリングによって色付けする「RMSD」。 「Sequence」はシーケンスベースのクラスタリングで色付けします。 プロット内の個々の点をクリックして、構造にラベルを付けます。または、プロットの下にある「PCAコンフォーマルプロット注釈」テーブルの1つ以上の構造を強調表示します。 部分空間スライダ内のPCをクラスタリングアルゴリズムのためのより多くの/少ないPCにスライドさせます。 残余貢献 青色の「次へ」(残余分)ボタンをクリックして、個々のPCへの残留分を計算します。 PC番号を「プリンシパルコンポーネントの選択」テキストボックスに含めて、追加のPCの寄稿をプロットします。 「Spread li」を切り替えます。nes "チェックボックスをオンにすると、残留物の寄与を互いに重ね合わせてプロットしないようにします。 "Multiline plot"チェックボックスをオフにして、残余寄与を別々のプロットにプロットします。 RMSF値を含めるには、[FMS]タブの[Show RMSF]を切り替えます。 5.アンサンブル標準モード解析(eNMA) ノーマルモード(NM)計算を開始するには、[eNMA]タブをクリックします。 フィルタ構造 構造の包含/除外のために "Cutoff"を下げたり上げたりして、構造の数を調整します。 緑色の「Run Ensemble NMA」をクリックして、NMA計算を開始します。 標準モードの視覚化 eNMAタブの2番目のパネル(Normal Modes Visualization)までスクロールし、NMを視覚化します。 注記:デフォルトでは、PC-1との重複度が最も高いNM(類似度)がビジュアルizationウィンドウ。 他のNMや他のPDB構造で記述されたモーションを視覚化するには、「Choose Mode」と「NMs for structure」のドロップダウンメニューから目的のNMと構造を選択します。 残渣の変動 eNMAのために選択された構造の残基の揺らぎを計算するために、青色の "Next"(Fluctuations)ボタンをクリックしてください。 RMSDベースのクラスタリングを使用して変動プロファイルをカラーリングするには、「RMSDによるクラスタ」を切り替えます。 RMSIPベースのクラスタリングによって変動プロファイルの色を付けるには、「RMSIPによるクラスタ」を切り替えます。 グループ化された変動プロファイルを互いに離れてプロットするには、「スプレッドライン」チェックボックスを切り替えます。 NMAとPCAの比較 青色の「次へ」(PCA-vs-NMA)ボタンをクリックして、個々のNMとPCの類似度を計算します。 Pを選択「Structure of NMsの比較」ドロップダウンメニューから「DB ID」を選択して、この構造のNMとPCAタブで計算されたPCとの類似性を計算します。 重複分析 青色の「次へ」(オーバーラップ解析)ボタンをクリックすると、計算されたNMと2つの選択された構造間の構造差ベクトルの重なりが計算されます。 「構造体のNMを比較」ドロップダウンメニューから「参照」PDB IDを選択し、参照PDBとのペアワイズ比較のために構造テーブル内の1つ以上のPDB IDを選択します。 クラスタリング分析 青色の「次へ」(クラスタリング)ボタンをクリックして、ペアワイズNM類似性(RMSIP)に基づいて構造クラスタリングを実行します。

Representative Results

アデニル酸キナーゼ(Adk)は、多くの細胞プロセスに必須の細胞質ヌクレオチド間の平衡を維持するように機能する遍在性酵素である。 Adkは、ATPからAMPへのホスホリル基の可逆的な転移を触媒することによって作用する。この反応は、コンフォメーションのトランジション3、21を制限するだけでなく、研究率を伴っています。ここでは、Bio3D-webを使って現在入手可能なすべてのAdk構造を分析し、これらの不可欠な移行の詳細な機能とメカニズム原理を明らかにする。 既知のAdk構造のRCSB PDBコードを入力することにより、AdkのBio3D-web分析を開始することができます。例えば、SEARCHタブのパネルAにPDB ID 1AKEを入力すると、類似の構造167個が返され、そこからトップ26が自動的に選択されて解析されます(パネルBを参照)。現在存在する注釈これらの選択された構造が全て大腸菌に由来することをパネルCで示したものは、一連の空間群におけるX線回折によって解決した。分解能範囲は1.63〜2.8Åであり、範囲の異なるリガンド(リガンド、AMP、ADP、MGおよび阻害剤AP5を含まない)の範囲と共結晶化された。パネルCの「列の表示/非表示」オプションをクリックすると、追加の注釈の詳細を表示できます。 ALIGNタブに入ると、複数の配列アライメントが実行されます。 ALIGNタブの最初のパネルには、シーケンス行の数(PDB構造の数に相当)と位置( すなわち、配置列)の数に関する詳細を提供するアライメントの要約が表示されます。これには、ギャップおよびギャップを含まない列の数の指定が含まれます。第1行の右側の数字は、配列アラインメントの略図を提供する。ここでは灰色の領域はギャップのない位置を表し、アラインメントの白い領域はギャップに対応する。配列保存の表現は、よく保存された位置を示す赤色領域とのアライメントの上に示され、白色は保存性が低いことを示す。この図のシーケンスは、左側のクラスタリング・デンドログラムによって提供される類似性に基づいて順序付けられていることに注意してください。このタブの第2のパネルは、樹状図またはヒートマップのいずれかとして視覚化することができるペアワイズ配列類似性に基づいて、選択されたPDBのクラスタリングをさらに容易にする。デフォルトでは、クラスタの配置を表す樹状図(またはツリー図)が表示されます。樹状図のy軸は、クラスタ間の距離(配列同一性に関して)を表す。 FITタブに入ると、構造の重ね合わせが自動的に実行されます。スーパーインポーズされた構造は、パネルA、インディカ比較的硬いコア領域(残基1-29,68-117、および161-214を包含する;詳細については、FITタブの下部にある「オプションのコアおよびRMSDの詳細」パネルを参照)。さらに2つの可変ヌクレオチド結合領域(残基30-67および118-167)も明瞭に見える( 図2 )。 RMSDベースのクラスタリングは、これらの構造を2つの別個のコンホメーションにグループ化します。 PCAタブをクリックすると、関連構造( 図2Bおよび2C )における結合したヌクレオチド種を効果的に閉じるこれらの領域の置換の観点から、構造間の関係がより明確に示される。大部分の構造は「閉鎖」形態( 図2Cでは青色)であり、結合リガンドまたは阻害剤と関連している。対照的に、より多くの「オープン」立体配座は、ヌクレオチドおよび阻害剤を含まない。これは効率的なホスホリル転移および有害な加水分解事象の抑制のために、これらの領域のオープンな配置がヌクレオチド結合に必要であり、閉じたコンフォメーションが必要であることを示す、Adkの構造および動力学に関する広範な研究体系。単一のPCがこのAdk構造セットの平均二乗変位の97%を捕捉し、この機能的変位に対する個々の残留物の寄与とともに開放状態から閉状態への遷移の明確かつ説得力のある記述を提供することは注目に値する図2 )。 NMAタブを訪れ、計算に考慮される構造の数を増やすこと(同様の構造をフィルタリングするためのカットオフを減少させることを介して)は、開いた状態の構造が閉じたフォーム構造( 図2DおよびappのC) 。 PCAとNMAの結果を比較する個々の構造(パネルD)は、全てのオープンフォーム構造の第1のモードがPC1(平均値0.37±0.04)と比較的高い重複を示すことを示す。対照的に、閉形式構造は、より低い値(平均0.30±0.01)を示す。オープンフォーム構造(0.62±0.003)のRMSIP値も閉鎖構造(0.56±0.008)のRMSIP値よりも高い。さらに、重複分析は、開状態の第1のモードが、開状態および閉状態の差異を示す立体構造変化(パネルE)と良好に一致することを示す。 RMSIP値に基づくクラスタリングは、開いた状態構造と閉じた状態構造の一貫した分割を再表示します(パネルF)。 まとめると、これらの結果は、Adkの2つの主要な立体配座状態の存在を示している。これらは、別個のフレキシビを示す2つのヌクレオチド結合部位領域の集合的低頻度置換によって異なるヌクレオチド結合の際に不安定である。 図1: PCAおよびNMAタブのスクリーンショットを含むBio3D-web概要 Bio3D-webは、ユーザーが入力したタンパク質構造または配列をSEARCHタブ( 1 )に入力します。サーバーは、関連する構造のリストを提供します。これは、後で分析するために選択することができます。 ( 2 )ALIGNタブは、SEARCHタブで選択された構造の配列アライメントと解析を行います。 ( 3 )FITタブでは、従来のペアワイズ構造解析の結果とともに、すべての構造が3Dで重ね合わされ可視化されます。 ( 4 )構造セットの主成分分析は、PCAタブで実行され、異種間の関係を特徴付ける。 ( 5 )各構造のノーマルモード解析は、eNMAタブで行うことができます利用可能な構造状態の動的傾向を調べる。 この図の拡大版を見るには、ここをクリックしてください。 図2: アデニル酸キナーゼのBio3D-web分析の結果。 ( A )同定された不変核に重ね合わされたアデニル酸キナーゼの利用可能なPDB構造。構造は、FITタブで提供されるRMSDベースのクラスタリングに従って色付けされます。 ( B )主成分の視覚化は、データセットの主要な配座変化を特徴付けるためにPCAタブから利用可能である。ここでは、第1主成分に対応する軌跡が、タンパク質の大規模な閉動作を示すチューブ表示で示されている。 ( C )構造はprである配座異性体の低次元表現を示すコンフォーマープロットの2つの第1の主成分上に注いだ。各ドット(または構造)は、ユーザーが指定した基準に従って色付けされます。この場合、PCAベースのクラスタリング結果です。 ( D )eNMAタブのノーマルモード分析は、閉じた形態(青色)の構造と比較して、開いた状態(赤色)の構造に対する局所的および全体的ダイナミクスの増強を示唆する。 この図の拡大版を見るには、ここをクリックしてください。

Discussion

Bio3D-webは、利用可能な結晶学的構造からタンパク質の構造的、動的および機能的状態をインタラクティブに探索およびマッピングするために使用することができる。さらに、NMAおよびPCAに基づくクラスタリング結果は、アノテーションおよびシーケンスベースの分析とともに、アンサンブル小分子ドッキングまたは分子動力学シミュレーションなどのより時間のかかる分析のための代表的な構造の選択に特に有用であり得る。 Bio3D-webは、技術的専門知識の必要レベルを下げることにより、幅広い研究者に高度な構造バイオインフォマティクス解析を容易にします。 Bio3D-webの現在のデザインは、完全なスタンドアローンのBio3Dパッケージで利用可能な多くの分析方法を網羅的に含める上での単純さを強調しています。多くの場合、研究者は、タンパク質ファミリーまたはスーパーファミリーの一般的な傾向を理解するためにBio3D-webを使用し、より専門的な分析を行うことが想定されています。 Bio3D-webは生体分子構造のデータセットを迅速に探索し、仮説生成ツールとして機能するように設計されています。再現性のあるレポートにサンプルのBio3Dコードを提供することにより、ユーザーがデータをさらに詳しく調べることをお勧めします。このコードには、すべてのクエリの詳細と分析結果も保存されます。

上記の代表的なプロトコールでは、Ad3kの機能的構造変化の構造的特徴を明らかにするBio3D-webの能力を示す。 Bio3D-webの追加アプリケーションには、ユーザーがアップロードしたPDB構造の構造と動力学解析が含まれます。例えば、ユーザは新しい構造または実際に分析のためのタンパク質配列をアップロードすることができる。先に述べた分析ステップ、特にeNMAステップは、タンパク質運動の局所的および全体的な傾向を明らかにすることができ、集合的な動きは機能的に重要である。アポ構造との比較は、結合していないコンホメーションへの移行の特徴を明らかにすることもできる。適用の追加例さまざまなタンパク質ファミリーがオンラインで提供されています。

すべてのタンパク質は柔軟で動的な実体であるが、すべてのタンパク質が異なる状態の範囲( 例えば 、活性状態および不活性状態)で利用可能な原子分解構造を有するわけではない。したがって、タンパク質構造の空間に関する我々の見解は限られており、したがって、Bio3D-webのようなツールから得られる洞察は、必然的に特定のタンパク質にも限られている。しかし、現在の技術的進歩と構造ゲノミクスの新しいイニシアチブで、ここに提示されたプロトコールは、重要な構造 – 機能関係への洞察を得るための重要な経路になりつつあります。重要なステップは、より遠くに関連するタンパク質を分析する場合に特に重要ですが、ALIGNタブでアライメントエラーが発生する可能性があります。配列の類似性が30%以下に低下した場合、配列誤差は必然的に発生し、そのような場合には配列アライメントを二重に確認して修正する必要があります[整列]タブに表示されます。アラインメントエラーは、FITタブ内の誤った重ね合わされた構造をもたらし、後続のPCAのために最も関連性のあるコンフォメーション変化をマスクする可能性がある。さらに、現在のインプリメンテーションのように、選択されたPDB構造内に欠けている残基があることに注意する必要があります。PCAは、すべての構造に対応する炭素アルファ原子が解明されたタンパク質残基に対してのみ実行できます。その結果、選択されたPDBがタンパク質の特定の領域について未解明残基を有する場合、この領域はPCAから省略される。

Bio3D-webは現在、一本鎖PDB構造の解析に限定されています。したがって、現在のプロトコルを使用して、四次レベルで発生する機能的な動きを調べることはできません。我々は現在、Bio3D-webにこのような分析を含めるための新しいアルゴリズムを開発していますが、現在の唯一の選択肢は従来のBio3Dの使用によるものです。

Bio3D-webは唯一のオンラインアプリですイオンは、構造セットを照会および同定し、シーケンスパターンおよび構造可変性を解釈し、その構造可塑性の分析および予測の両方からメカニズム情報を抽出することを可能にする。幅広い分子視覚化ツールとオンラインサーバーにより、研究者は個々の生体分子構造を探索し分析することができます。しかし、大規模な異種タンパク質ファミリーの配列、構造および動態を分析するための既存のツールは、しばしば重要な計算の専門知識を必要とし、通常、関連するプログラミングスキルを有するユーザーのみがアクセス可能である。 Bio3Dパッケージは、R 8が必要例えば、ProDyは、Pythonを必要とMavenは、MATLAB知識9、10必要とします。対照的に、Bio3D-webはプログラミング知識を必要とせず、したがって、アクセシビリティを向上させ、高度な比較配列、構造およびdyナミックス分析。さらに、Bio3D-webサービスには、効率的な分析にしばしば必要となる分子構造の準備、キュレーション、アノテーションおよびクリーンアップが含まれています。さらに、最新のWebブラウザから開始および制御できる多くの構造の大規模な分析を可能にする当社のサーバーインスタンスによって、可能な計算リソースに対するこのような分析を実行することの制限が緩和されます。

Bio3D-webのオープンな開発は継続中です(https://bitbucket.org/Grantlab/bio3dを参照)。新しい分析機能を追加し、既存の方法を改善し続けます。将来の開発は、距離マトリックスベースのPCAおよびねじれPCAの追加、系統発生成分、アンサンブル結合部位の同定、およびタンパク質ファミリーにわたる動的ネットワーク解析のための新しいアプローチを含むより広範な配列保存アプローチに焦点を当てる。この点で、現在のWebアプリケーションは開始点を表していますユーザーが定義した実験構造セットの再現可能で共有可能なステップを可能にすることにより、他の多くの共同構造的なバイオインフォマティクス分析ワークフローのために設計されています。我々はまた、PDB構造の非対称単位からの個々のおよび複数の鎖に加えて、再構成された生物学的単位座標セットの将来のサポートを計画する。追加機能には、共同作業領域の保存とロードの強化と、取り消しの可能性が含まれます。

Bio3D-webは、生体分子構造データのインタラクティブな分析のためのオンラインアプリケーションです。 Bio3D-webは、最新のWebブラウザ上で動作し、以下の機能を提供します。(1)関連するタンパク質構造の類似性の特定の閾値に対する識別。 (2)それらの複数のアラインメントおよび構造の重ね合わせ; (3)配列および構造保存分析; (4)主成分分析との相互コンター関係マッピング、および(5)アンサンブルによる予測内部ダイナミクスの比較マルモード分析。この統合された機能性は、タンパク質ファミリーおよびスーパーファミリー内の配列 – 構造 – 動的関係の調査のための完全なワークフローを提供する。 Bio3D-webは、パラメータやメソッドの選択肢の効果を調べるのに便利な使いやすいダイナミックインターフェイスに加えて、ユーザーセッションの完全なユーザー入力とその後のグラフィカルな結果も記録します。これにより、ユーザーは結果を作成した一連の分析ステップを簡単に共有して再現することができます.Bio3D-webは、R言語で完全に実装されており、Bio3DおよびShiny Rパッケージに基づいています。当社のオンラインサーバーから実行することも、Rを実行している任意のコンピュータにローカルにインストールすることもできます。これには、カスタマイズされたマルチユーザーインスタンスに医薬品業界で一般的な構造データセット完全なソースコードと豊富なドキュメントは、http://thegrantlab.orgのGPL-3オープンソースライセンスの下で提供されています。/ bio3d / webapps

開示

The authors have nothing to disclose.

Acknowledgements

Guido Scarabelli博士とHongyang Li博士は、Bio3DユーザーコミュニティおよびBergen大学の構造バイオインフォマティクスワークショップ参加者だけでなく、このアプリケーションを改善したフィードバックやコメントについて、開発中の広範囲にわたるテストに感謝します。

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

参考文献

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. バイオインフォマティクス. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. バイオインフォマティクス. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. バイオインフォマティクス. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

記事を引用
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video