Bio3D-webを用いたタンパク質配列 – 構造 – 動態関係のオンライン調査のためのプロトコールを提示する。
我々は、生体分子構造データの対話的分析のためのBio3D-webの使用法を実証します。 Bio3D-webアプリケーションは、以下の目的でオンライン機能を提供します。(1)ユーザーが指定した類似性の閾値に関連するタンパク質構造の識別。 (2)それらの複数のアラインメントおよび構造の重ね合わせ; (3)配列および構造保存分析; (4)主成分分析との相互コンター関係マッピング、および(5)アンサンブルノーマルモード分析による予測内部ダイナミクスの比較。この統合された機能は、タンパク質ファミリーおよびスーパーファミリー内の配列 – 構造 – 動的関係を調べるための完全なオンラインワークフローを提供します。
現在、タンパク質データバンク(PDB)には120,000を超えるタンパク質構造が含まれています。その多くは同じタンパク質ファミリーであるが、異なる実験条件下で解明されています。これらの複数の構造は、タンパク質の形態と機能の複雑さを理解する上で貴重なリソースです。例えば、これらの構造アンサンブルの厳密な比較は重要な分子機構1、2、3を明らかにすることができるし、リガンド結合、酵素触媒および二分子認識4、5、6、7を含むプロセスに関与するコンホメーション力学に通知します。タンパク質ファミリーの配列、構造および動態の詳細な大規模分析から、しばしば新しい洞察を得ることができます。しかしながら、これは、典型的には、かなりのバイオイン研究の対象となるタンパク質システムに精通した上で、例えば、そのようなBio3D、ProDyとMavenのようなソフトウェアパッケージは、R、PythonとMatlabの、それぞれ8、9、10にプログラミングを必要とします。逆に、構造的柔軟性を分析するためのオンラインツールは、一般的に個々の構造11、12の調査に限定されています。この点に関する例外として、最近開発されたWebNM @サーバーがあります。これにより、事前調整されたいくつかのユーザー指定構造13の標準モード解析(NMA)から得られた柔軟性パターンを比較できます。しかし、このサーバーには、NMAを超えた比較、その整列、またはそれ以上の分析のための構造の識別のための自動化された手順が欠けています。もう1つの最近の貢献は、オンラインPDBFlexデータベースで、プレc95%以上の配列同一14を共有するPDB構造のomputed分析。しかし、より多様な構造セットの分析は現在利用できません。
我々は以前Bio3Dウェブを提示している-タンパク質配列-構造-動的な関係15の分析のためのWebアプリケーションを使用して簡単にできます。 Bio3D-webは、大規模な同種構造セットのオンライン同定、比較、詳細解析に使いやすい統合機能を提供する点でユニークです。ここでは、Bio3D-webを用いたタンパク質配列 – 構造 – 動態関係のオンライン調査のための詳細なプロトコルを紹介します。 Bio3D-webは、 図1に示すデータ分析の5つの主要なステップをサポートするためのさまざまな機能を提供し、以下で詳しく説明します。これらのステップは、問合せシーケンスまたは構造入力から、複数レベルの順序構造動的解析、要約までのワークフローを構成しますyレポート生成。結果は、広範なブラウザ内のビジュアライゼーションおよびプロッティング・デバイスを介して、および一般的に使用されるフォーマットで結果ファイルをダウンロードすることによって、すぐに利用可能です。 Bio3D-webは、パラメータやメソッドの選択肢の効果を調べるための便利で使いやすいダイナミックインターフェイスに加えて、PDF、DOC、HTML形式の共有可能な再現可能なレポートとして、ユーザーセッションの完全なユーザー入力とそれに続くグラフィカルな結果を記録します。ユーザセッションは将来保存され、再ロードされ、ユーザのローカルマシン上のBio3D Rパッケージによって完全な結果がダウンロードされ、さらに解釈される。
Bio3Dウェブは生体分子の構造、配列及び分子シミュレーションデータ8、16の分析のためBio3D Rパッケージによって供給されます。特に、リジッドコア識別のためのBio3Dアルゴリズム 8 、重ね合わせ、主成分分析(PCA) 8およびアンサンブル標準モード解析(eNMA) 16は、アプリケーションの基礎を形成する。また、関連するタンパク質構造の同定のためにpHMMER 17に依存するBio3Dプロトコール、および多重配列アラインメントのためのMUSCLE 18を利用する。構造および配列の注釈は、RCSB PDB 19およびPFAMデータベース20からBio3Dユーティリティを介して得られる。 Bio3D-webは、当社のオンラインサーバーから実行することも、Rを実行する任意のコンピュータにローカルにインストールすることもできます。Bio3D-webは、すべてのユーザーに開放されており、http:// thegrantlabからGPL-3オープンソースライセンスで無償で提供されます。 org / bio3d / webapps
Bio3D-webは、利用可能な結晶学的構造からタンパク質の構造的、動的および機能的状態をインタラクティブに探索およびマッピングするために使用することができる。さらに、NMAおよびPCAに基づくクラスタリング結果は、アノテーションおよびシーケンスベースの分析とともに、アンサンブル小分子ドッキングまたは分子動力学シミュレーションなどのより時間のかかる分析のための代表的な構造の選択に特に有用であり得る。 Bio3D-webは、技術的専門知識の必要レベルを下げることにより、幅広い研究者に高度な構造バイオインフォマティクス解析を容易にします。 Bio3D-webの現在のデザインは、完全なスタンドアローンのBio3Dパッケージで利用可能な多くの分析方法を網羅的に含める上での単純さを強調しています。多くの場合、研究者は、タンパク質ファミリーまたはスーパーファミリーの一般的な傾向を理解するためにBio3D-webを使用し、より専門的な分析を行うことが想定されています。 Bio3D-webは生体分子構造のデータセットを迅速に探索し、仮説生成ツールとして機能するように設計されています。再現性のあるレポートにサンプルのBio3Dコードを提供することにより、ユーザーがデータをさらに詳しく調べることをお勧めします。このコードには、すべてのクエリの詳細と分析結果も保存されます。
上記の代表的なプロトコールでは、Ad3kの機能的構造変化の構造的特徴を明らかにするBio3D-webの能力を示す。 Bio3D-webの追加アプリケーションには、ユーザーがアップロードしたPDB構造の構造と動力学解析が含まれます。例えば、ユーザは新しい構造または実際に分析のためのタンパク質配列をアップロードすることができる。先に述べた分析ステップ、特にeNMAステップは、タンパク質運動の局所的および全体的な傾向を明らかにすることができ、集合的な動きは機能的に重要である。アポ構造との比較は、結合していないコンホメーションへの移行の特徴を明らかにすることもできる。適用の追加例さまざまなタンパク質ファミリーがオンラインで提供されています。
すべてのタンパク質は柔軟で動的な実体であるが、すべてのタンパク質が異なる状態の範囲( 例えば 、活性状態および不活性状態)で利用可能な原子分解構造を有するわけではない。したがって、タンパク質構造の空間に関する我々の見解は限られており、したがって、Bio3D-webのようなツールから得られる洞察は、必然的に特定のタンパク質にも限られている。しかし、現在の技術的進歩と構造ゲノミクスの新しいイニシアチブで、ここに提示されたプロトコールは、重要な構造 – 機能関係への洞察を得るための重要な経路になりつつあります。重要なステップは、より遠くに関連するタンパク質を分析する場合に特に重要ですが、ALIGNタブでアライメントエラーが発生する可能性があります。配列の類似性が30%以下に低下した場合、配列誤差は必然的に発生し、そのような場合には配列アライメントを二重に確認して修正する必要があります[整列]タブに表示されます。アラインメントエラーは、FITタブ内の誤った重ね合わされた構造をもたらし、後続のPCAのために最も関連性のあるコンフォメーション変化をマスクする可能性がある。さらに、現在のインプリメンテーションのように、選択されたPDB構造内に欠けている残基があることに注意する必要があります。PCAは、すべての構造に対応する炭素アルファ原子が解明されたタンパク質残基に対してのみ実行できます。その結果、選択されたPDBがタンパク質の特定の領域について未解明残基を有する場合、この領域はPCAから省略される。
Bio3D-webは現在、一本鎖PDB構造の解析に限定されています。したがって、現在のプロトコルを使用して、四次レベルで発生する機能的な動きを調べることはできません。我々は現在、Bio3D-webにこのような分析を含めるための新しいアルゴリズムを開発していますが、現在の唯一の選択肢は従来のBio3Dの使用によるものです。
Bio3D-webは唯一のオンラインアプリですイオンは、構造セットを照会および同定し、シーケンスパターンおよび構造可変性を解釈し、その構造可塑性の分析および予測の両方からメカニズム情報を抽出することを可能にする。幅広い分子視覚化ツールとオンラインサーバーにより、研究者は個々の生体分子構造を探索し分析することができます。しかし、大規模な異種タンパク質ファミリーの配列、構造および動態を分析するための既存のツールは、しばしば重要な計算の専門知識を必要とし、通常、関連するプログラミングスキルを有するユーザーのみがアクセス可能である。 Bio3Dパッケージは、R 8が必要例えば、ProDyは、Pythonを必要とMavenは、MATLAB知識9、10を必要とします。対照的に、Bio3D-webはプログラミング知識を必要とせず、したがって、アクセシビリティを向上させ、高度な比較配列、構造およびdyナミックス分析。さらに、Bio3D-webサービスには、効率的な分析にしばしば必要となる分子構造の準備、キュレーション、アノテーションおよびクリーンアップが含まれています。さらに、最新のWebブラウザから開始および制御できる多くの構造の大規模な分析を可能にする当社のサーバーインスタンスによって、可能な計算リソースに対するこのような分析を実行することの制限が緩和されます。
Bio3D-webのオープンな開発は継続中です(https://bitbucket.org/Grantlab/bio3dを参照)。新しい分析機能を追加し、既存の方法を改善し続けます。将来の開発は、距離マトリックスベースのPCAおよびねじれPCAの追加、系統発生成分、アンサンブル結合部位の同定、およびタンパク質ファミリーにわたる動的ネットワーク解析のための新しいアプローチを含むより広範な配列保存アプローチに焦点を当てる。この点で、現在のWebアプリケーションは開始点を表していますユーザーが定義した実験構造セットの再現可能で共有可能なステップを可能にすることにより、他の多くの共同構造的なバイオインフォマティクス分析ワークフローのために設計されています。我々はまた、PDB構造の非対称単位からの個々のおよび複数の鎖に加えて、再構成された生物学的単位座標セットの将来のサポートを計画する。追加機能には、共同作業領域の保存とロードの強化と、取り消しの可能性が含まれます。
Bio3D-webは、生体分子構造データのインタラクティブな分析のためのオンラインアプリケーションです。 Bio3D-webは、最新のWebブラウザ上で動作し、以下の機能を提供します。(1)関連するタンパク質構造の類似性の特定の閾値に対する識別。 (2)それらの複数のアラインメントおよび構造の重ね合わせ; (3)配列および構造保存分析; (4)主成分分析との相互コンター関係マッピング、および(5)アンサンブルによる予測内部ダイナミクスの比較マルモード分析。この統合された機能性は、タンパク質ファミリーおよびスーパーファミリー内の配列 – 構造 – 動的関係の調査のための完全なワークフローを提供する。 Bio3D-webは、パラメータやメソッドの選択肢の効果を調べるのに便利な使いやすいダイナミックインターフェイスに加えて、ユーザーセッションの完全なユーザー入力とその後のグラフィカルな結果も記録します。これにより、ユーザーは結果を作成した一連の分析ステップを簡単に共有して再現することができます.Bio3D-webは、R言語で完全に実装されており、Bio3DおよびShiny Rパッケージに基づいています。当社のオンラインサーバーから実行することも、Rを実行している任意のコンピュータにローカルにインストールすることもできます。これには、カスタマイズされたマルチユーザーインスタンスに医薬品業界で一般的な構造データセット完全なソースコードと豊富なドキュメントは、http://thegrantlab.orgのGPL-3オープンソースライセンスの下で提供されています。/ bio3d / webapps
The authors have nothing to disclose.
Guido Scarabelli博士とHongyang Li博士は、Bio3DユーザーコミュニティおよびBergen大学の構造バイオインフォマティクスワークショップ参加者だけでなく、このアプリケーションを改善したフィードバックやコメントについて、開発中の広範囲にわたるテストに感謝します。
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |