生体分子モデリングの重要なスキルは、タンパク質中の活性部位の表示とコメント付けです。この技術は、高分子視覚化のための4つの一般的なフリープログラムを使用して実証されています: iCn3D, Jmol, PyMOL, および UCSF ChimeraX.
生体分子可視化技術は、構造機能関係や分子相互作用など、生物科学の主要な概念を理解する上で最も重要です。様々なプログラムにより、学習者は3D構造を操作することができ、生体分子モデリングはアクティブな学習を促進し、計算能力を構築し、2次元の教科書画像と生命の3次元の間のギャップを埋めます。この分野の重要なスキルは、タンパク質活性部位をモデル化し、結合相互作用を示す方法で、小分子、またはリガンドと相互作用できる高分子の部分を表示することです。このプロトコルでは、このプロセスを、iCn3D、Jmol/JSmol、PyMOL、UCSF ChimeraXの4つの自由に利用できる高分子モデリングプログラムを用いて記述します。このガイドは、特定のプログラムの基礎を学ぶ学生と、カリキュラムに生体分子モデリングを組み込んだ講師を対象としています。このプロトコルを使用すると、ユーザーは特定の視覚化プログラムを使用してアクティブなサイトをモデル化したり、利用可能なフリープログラムのいくつかをサンプリングしたりできます。このプロトコルで選ばれたモデルは、解糖の第一段階を触媒する酵素ヘキソキナーゼのアイソフォームであるヒトグルコキナーゼです。酵素は、その基質の1つと非反応性基質アナログに結合し、触媒複合体における相互作用を分析することを可能にする。
分子世界の表現を理解することは、生体分子科学1の専門家になるために重要である。高分子の紹介は、通常、細胞膜、小器官、高分子などの2次元教科書画像の形で紹介されますが、生物学的現実は、これらは3次元構造であり、その特性を理解するには3Dモデルから意味を視覚化して抽出する方法が必要です。
したがって、上位部門の分子ライフサイエンスコースにおける生体分子視覚リテラシーの発達が注目を集めており、ビジュアライゼーションスキル1、3、4、5、7、8、9の教育と評価の重要性と難度を報告する記事が数多くあります。 .これらの記事に対する反応は、教室の介入の数が増加しており、通常は単一の機関で1学期以内に、分子可視化プログラムとモデルを使用して困難な概念2、10、11、13、14、15をターゲットにしています。 .さらに、研究者たちは、学生が生体分子可視化プログラムおよび/またはモデルを使用して特定のトピック16、17、18、19にアプローチする方法を特徴付けようとしました。私たち自身のグループBioMolVizは、視覚リテラシーのテーマを学習目標と目標に細分化して、そのような介入を導く目標と目的に細分化するフレームワークを説明し、視覚リテラシースキルを測定するための評価の後方設計においてフレームワークを使用するように教員を訓練するワークショップを主導しています。
この研究の中心にあるのは、生体分子可視化のためのプログラムを使用して高分子の構造を操作する能力という重要なスキルです。これらのツールは、さまざまなプラットフォームを使用して個別に開発されました。したがって、操作と使用において、かなりユニークなことができます。このため、プログラム固有の命令が必要となり、ユーザーが使い慣れやすいプログラムを識別することが、継続的な実装を容易に行うことが重要です。
3Dで構造を操作する(モデルの回転、選択、変更)の非常に基本的な点を超えて、タンパク質の活性部位をモデル化することが大きな目標です。このプロセスにより、学習者は、バイオモルヴィズフレームワークによって記述された3つの包括的なテーマ(分子相互作用、リガンド/修飾、および構造機能関係20,21)において理解を深めることを可能にする。
生体分子可視化のためのプログラムの4つの一般的な選択肢は、次のとおりです: Jmol/ JSmol23、 iCn3D24、 PyMOL25、および UCSF キメラ26,27.我々は、キメラに新しい人々がUCSF ChimeraX、プログラムの現在サポートされているバージョンであるキメラ分子可視化プログラムの次世代を使用することをお勧めします。
本プロトコルでは、これら4つのプログラムのそれぞれを用いて、結合基板アナログ複合体(PDB ID:3FGU)を有するヒトグルコキナーゼの活性部位をモデル化し、特定の結合相互作用を示す測定値を表示する方法を示す。モデルは酵素の触媒複合体を表す。触媒前の状態で活性部位を捕捉するために、ATPの非加水分解可能なアナログをグルコキナーゼ活性部位に結合した。このホスホアミノホスホン酸アデニルエステル(ANP)は、この位置で通常のリンと酸素の結合の代わりにリンと窒素の結合を含んでいます。活性部位には、グルコース(モデル内で示されるBCG)およびマグネシウム(MGと表記)も含まれています。また、この構造にはカリウムイオン(K)があり、結晶化溶媒に使用される塩化カリウムから生じる。このイオンは生物学的機能に重要ではなく、活性部位の外側に位置しています。
図1: ATP/ANP構造体 アデノシン三リン酸(ATP)構造と比較してホスホアミノホスホン酸アデニル酸アデニル酸エステル(ANP)。 この図の大きなバージョンを表示するには、ここをクリックしてください。
このプロトコルは、基質アナログ複合体の結合リガンドの選択と結合複合体の5Å内の活性サイト残基の同定を実証し、疎水性およびファンデルワールス相互作用を含む関連する分子相互作用を行うことができるアミノ酸および水分子を捕捉する。
ディスプレイは、最初は漫画表現でタンパク質の大部分を示すために操作され、活性部位アミノ酸残基は、タンパク質の関連する原子を示し、分子相互作用を強調するためにスティック表現で。各プログラムのプロトコルのステップ3の後、これらの表現が適用され、タンパク質のビューはプログラム間で類似しています(図2)。プロトコルの最後に、タンパク質の漫画は、ビューを簡素化し、アクティブなサイトに焦点を当てるために非表示になります。
図2: プログラム間の構造比較 「表現の調整」ステップ(各プロトコルのステップ2または3)に続く各プログラムにおける3FGUの構造の比較。 この図の大きなバージョンを表示するには、ここをクリックしてください。
CPK着色は、活性部位アミノ酸および結合リガンド29、30に適用される。この着色スキームは、ライン、スティック、ボールとスティック、およびスペース充填表現で示される分子モデルにおける異なる化学元素の原子を区別します。水素は白、窒素は青、酸素は赤、硫黄は黄色、リンはCPKの着色スキームではオレンジ色です。伝統的に、黒はカーボンに使用されていますが、現代ではカーボンカラーリングが異なる場合があります。
水素原子は結晶構造では見えませんが、これらのプログラムはそれぞれその位置を予測することができます。大きな高分子構造に水素原子を加えることは、ビューをあいまいにすることができるため、このプロトコルには表示されません。したがって、水素結合は、これらの構造における2つのヘテロ原子(例えば、酸素から酸素、酸素から窒素へ)の中心から測定することによって示される。
プログラムの概要
ダウンロード可能なグラフィカル ユーザ インターフェイス(GUI): PyMOL (バージョン 2.4.1)、キメラX (バージョン 1.2.5)、および Jmol (バージョン 1.8.0_301) は GUI ベースの分子モデリングツールです。これらの 3 つのインターフェイスは、入力型付きコードのコマンド ラインを備えています。同じ機能の多くは、GUI のメニューとボタンを通じて使用できます。これらのプログラムのコマンド ラインの一般的な機能は、キーボードの上下方向キーを使用して、以前のコマンドを読み込んで再実行する場合です。
Webベースの GUI:iCn3D(I-see-in-3D)は、Web上で3次元の高分子構造や化学物質をインタラクティブに表示するためのWebGLベースのビューアで、別のアプリケーションをインストールする必要はありません。完全な Web バージョンは編集可能なコマンド ログを備えていますが、コマンド ラインは使用しません。JSmol は、Web サイトや Web ブラウザ ウィンドウで使用する JavaScript または HTML5 バージョンの Jmol であり、Jmol との動作に非常に類似しています。JSmol は、アニメーションを含むオンライン チュートリアルを作成するために使用できます。
プロテオペディア31、32、Jmol33の最初の視線、およびミルウォーキーバイオ分子モデリング工学センターのJSmolウェブインターフェース(JUDE)は、Jmolベースのオンライン設計環境34の例である。プロテオペディアウィキは、ユーザーが高分子構造をモデル化し、ウェブサイト35内でこれらのモデルをフィーチャーしたページを作成することを可能にする教育ツールです。JSmolを使用して構築されたプロテオペディアシーンオーサリングツールは、Jmol GUIでは利用できない追加機能を備えたGUIを統合します。
Jmol および iCn3D は Java プログラミング言語に基づいています。JSmol は Java または HTML5 を使用し、PyMOL と ChimeraX は Python プログラミング言語に基づいています。これらの各プログラムは、4桁の英数字PDB ID36、37の下でRCSBタンパク質データバンクからダウンロードすることができるタンパク質データバンクファイルをロードします。最も一般的なファイルの種類は、.pdb拡張子を含むタンパク質データバンク(PDB)ファイルと.cif拡張子を含む結晶学的情報ファイル(CIFまたはmmCIF)です。CIF は、プロテイン データ バンクの既定のファイルタイプとして PDB に置き換わりましたが、両方のファイル形式がこれらのプログラムで機能します。PDBファイルとは対照的に、CIFを使用する場合のシーケンス/構造の表示方法に若干の違いがあります。ただし、ファイルは同様に機能し、相違点についてはここでは詳しく説明しません。分子モデリングデータベース(MMDB)は、国立バイオテクノロジー情報センター(NCBI)の産物であり、カテゴリ情報が関連付けられているPDB構造のサブセット(例えば、生物学的特徴、保存タンパク質ドメイン)38である。iCn3D は、NCBI の製品で、MMDB データを含む PDB ファイルをロードすることができます。
モデルを表示するには、ユーザーは、構造の専用のタンパク質データバンクページから目的のファイルをダウンロードし(例えば、https://www.rcsb.org/structure/3FGU)、その後、プログラムのドロップダウンファイル メニューを使用して構造を開くことができます。すべてのプログラムは、インターフェイスを通じて直接構造ファイルをロードする機能があり、そのメソッドはプロトコル内で詳細に説明されています。
キメラX、Jmol、PyMOL の各 GUI には、コーナーをドラッグしてサイズを変更できるコンソールの 1 つ以上のウィンドウが含まれています。iCn3D と JSmol は完全に Web ブラウザに含まれています。iCn3D を使用する場合、ユーザーは画面のサイズと解像度に応じて、ポップアップ ウィンドウ内をスクロールしてすべてのメニュー項目を表示する必要があります。
ここで詳述するプロトコルは、各プログラムを用いて酵素の活性部位を表示する簡単な方法を提供する。なお、各プログラムでステップを実行する方法は複数ある。たとえば、ChimeraX では、ドロップダウン メニュー、上部のツールバー、またはコマンド ラインを使用して同じタスクを実行できます。特定のプログラムを詳細に学習することに興味があるユーザーは、これらのプログラム39、40、41、42、43、44、45、46で利用可能なオンラインチュートリアル、マニュアル、Wikiを探索することをお勧めします。
これらのプログラムの既存のマニュアルやチュートリアルでは、このプロトコルの項目を個別のタスクとして示します。アクティブなサイトを表示するには、ユーザーはさまざまなマニュアルやチュートリアルから必要な操作を合成する必要があります。この原稿は、分子相互作用を持つラベル付きアクティブサイトをモデリングするための線形プロトコルを提示することによって利用可能な既存のチュートリアルを増強し、他のモデルやプログラムに適用できるアクティブなサイトモデリングのためのロジックをユーザーに提供します。
図3:キメラックスGUI ドロップダウンメニュー、ツールバー、ストラクチャービューア、コマンドラインにラベルが付いたChimeraX GUIインタフェース。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図 4: iCn3D GUI. iCn3D の GUI インターフェイスドロップダウン メニュー、ツールバー、構造ビューアー、コマンド ログ、選択セットのポップアップ、およびシーケンスと注釈のポップアップ メニューのラベルが付いています。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図5: Jmol GUI ドロップダウンメニュー、ツールバー、ストラクチャービューア、ポップアップメニュー、コンソール/コマンドラインがラベル付けされたJmol GUIインタフェース。 この図の大きなバージョンを表示するには、ここをクリックしてください。
図6:PyMOL GUI ドロップダウンメニュー、ストラクチャービューア、名前/オブジェクトパネル、マウスコントロールメニュー、コマンドラインラベル付きPyMOL GUIインタフェース。 この図の大きなバージョンを表示するには、ここをクリックしてください。
このプロトコルは、生体分子モデリングのための4つの一般的なプログラムに適用される酵素活性部位のモデリングのための10段階のプロセスを概説する。プロトコルの重要なステップは、活性部位のリガンドを同定し、活性部位を定義するために5Å内の残基を選択し、活性部位リガンドと酵素の相互作用を示す。これは、リガンドを結合する役割を果たすことができる5Å内のアミノ酸残基を定義することを可能にするので、生物学的機能に関連するリガンドを区別することが最も重要です。最後に、プログラムを使用して分子相互作用を表示することで、結合を促進する分子相互作用を理解するために必要なスキルを開発することができます。
コンピュータベースの分子モデリングプロトコルの制限は、特定のコマンドと構文への依存です。生化学的プロトコルは、手順の小さな変化に耐性があるかもしれませんが、手順が密接に付着していない場合、コンピュータベースの調査は大きく異なる最終製品をもたらす可能性があります。これは、特定の出力を実現するためにプログラム固有の構文が必要な場合に、コマンド行インターフェースを使用する場合に特に重要であり、一見意味が少ない句読点または大文字/時表記の変更によってコマンドが失敗する可能性があります。プログラムごとにさまざまな Wiki とマニュアルがあり、ユーザーはコマンドライン入力を検索してトラブルシューティングできます。ユーザーは、コマンド構文の詳細に注意する必要があります。ほとんどの分子可視化プログラムには、インターフェイスの複雑さから Undo コマンドが含まれていますが、undo コマンドは、最後に実行されたステップを常に忠実に逆にしません。したがって、特に新規ユーザーには、現在の稼働状態を保存することが推奨されます。
モデル自体の作成に使用されるデータに、さらに制限が生じる可能性があります。タンパク質データバンクに固有の標準は一定の一貫性を保証しますが、分子可視化プログラムのユーザーはタンパク質レンダリングで予期しない影響を受けることがよくあります。まず、ほとんどの構造は、タンパク質の単一のモデルを提供するX線結晶学を使用して決定されます。ただし、NMR 構造は、一度に 1 つずつ視覚化できる複数のモデルで構成されることがよくあります。第二に、結晶学または極低温電子顕微鏡実験から決定された構造は、その位置を解明できない原子を含み、タンパク質の特定の表現におけるギャップとして現れることである。タンパク質構造は、サイドチェーンの別の立体構造を有し、スティックレンダリングで表示すると、同じアミノ酸骨格から突き出た2つのグループとして現れる。バックボーンの短い部分でさえ、このような代替立体構造を有し、かつ、リガンドが複数の結合構造において活性部位に重ね合わされることがある。
結晶構造の場合、堆積した3D座標は非対称単位のすべての成分を含み、タンパク質結晶の繰り返し単位を再現するのに十分な情報を提供する。時には、この構造は、タンパク質の生物学的に活性な形態と比較して付加的なタンパク質鎖を含むことになる(例えば、胎児ヘモグロビン変異体、PDB ID:4MQK)。逆に、一部のプログラムは、生物学的活性ユニットのすべての鎖を自動的にロードしない場合がある。例えば、SARS-CoV2主プロテアーゼ(PDB ID:6Y2E)は、ChimeraX、PyMOL、およびJmolのこのプロトコルで説明されているコマンドを使用して取り出した場合、生物学的に活性なダイマー(2つのタンパク質鎖で構成される)の半分をロードします。コマンドのわずかな変更は生物学的に活性なダイマーをロードしますが、この検討は初心者のモデリングプログラムユーザーにとって簡単ではないかもしれません。発生する可能性のある別の問題は、活性部位または基板自体の同定にある。結晶学的実験は、様々な分子を用いて行われ、これを最終構造にモデル化してもよい。例えば、硫酸塩分子は、活性部位のリン酸結合部位に結合し得るか、あるいは、そのメカニズムに関係のない他の領域に結合してもよい。これらの分子は、活性部位自体の正しい同定をあいまいにし、それらがメカニズムの一部であることを学生に示唆する可能性さえある。
おそらく、ユーザーはこの手順を他のアクティブ/バインド サイトに適用します。新しいタンパク質活性部位の解析を含む今後の作業でこのプロトコルを適用するには、結合リガンドのどれが機能に関連するかを特定する必要があります。一部のリガンドはタンパク質機能に関連せず、代わりに実験を行うために使用される溶媒または結晶化条件の結果である(例えば、3FGUモデルに存在するカリウムイオン)。主なリガンドは、原稿を参考にして特定する必要があります。実際には、必要に応じて、行コマンド構文を理解すれば、ユーザーは任意の酵素活性部位に目的のモデリングプログラムのプロトコルを適用し、選択した他の高分子をモデル化することができます。
結合基質およびリガンドの同定と分析は、分子機構および構造ベースの薬物設計努力の解明の中心であり、後天性免疫不全症候群(AIDS)およびCOVID-19 47、48、49、50、51、52を含む疾患の治療の改善に直接つながっている.個々の分子可視化プログラムは異なるインターフェースとユーザーエクスペリエンスを提供しますが、ほとんどのプログラムは同等の機能を提供します。バイオ分子可視化リテラシーの開発には、上位レベルの生化学の学生が構造の可視化と、そのような画像4、20、53を生成するためのツールに精通することが重要です。これにより、学生は教科書や雑誌記事の2次元画像の解釈を超えて、構造データ54から独自の仮説をより簡単に開発することができ、将来の公衆衛生問題に対処し、生化学的プロセスの理解を深めるために科学者を育成する準備をします。
要約すると、このプロトコルは、4つの主要な無料の高分子モデリングプログラムを使用して、アクティブなサイトモデリングを詳述しています。私たちのコミュニティBioMolVizは、生体分子モデリングに非ソフトウェア固有のアプローチを採用しています。プログラムの特徴を批判したり比較したりすることを特に避けたが、各プログラムをサンプリングするユーザーは、あるプログラムと別のプログラムで高分子モデリングの特定の側面を好む可能性が高い。本プロトコルで対象となる生体分子可視化ベースの学習目標と目的を詳述したBioMolViz Frameworkを活用し、http://biomolviz.org のBioMolVizコミュニティウェブサイトを通じて生体分子可視化を教え、学習するためのリソースを探求するよう読者に勧めます。
The authors have nothing to disclose.
この研究のための資金は、国立科学財団によって提供されています:
学部STEM教育助成金の向上(賞#1712268)
学部生物学教育学部における研究連携ネットワーク(賞#1920270)
私たちは、Jmolに関する有益な議論のために、ウェストフィールド大学博士のカルステン・テイスに感謝しています。
ChimeraX (Version 1.2.5) https://www.rbvi.ucsf.edu/chimerax/ | |||
Computer | Any | ||
iCn3D (web-based only: https://www.ncbi.nlm.nih.gov/Structure/icn3d/full.html) | |||
Java (for Jmol) https://java.com/en/download/ | |||
Jmol (Version 1.8.0_301) http://jmol.sourceforge.net/ | |||
Mouse (optional) | Any | ||
PyMOL (Version 2.4.1 – educational): https://pymol.org/2 educational use only version: https://pymol.org/edu/?q=educational |