Summary

化学架橋質量分析による第四次構造モデリング:TX-MSジュピターレポートの拡張

Published: October 20, 2021
doi:

Summary

標的架橋質量分析は、最大3つの異なる取得プロトコルを使用して取得した質量分析データを使用して、第4級タンパク質構造モデルを作成します。Cheetah-MS Webサーバーで簡略化されたワークフローとして実行すると、結果はJupyter Notebookに報告されます。ここでは、Jupyter ノートブックを拡張してより詳細な分析を行う方法の技術的な側面を示します。

Abstract

タンパク質間相互作用は、研究が困難な場合がありますが、生物学的システムがどのように機能するかについての洞察を提供します。標的架橋質量分析(TX-MS)は、第四級タンパク質構造モデリングと化学架橋質量分析を組み合わせた方法であり、複雑な未分画サンプルから得られたデータを使用して高精度の構造モデルを作成します。これにより、目的のタンパク質を大量に精製する必要がなくなるため、タンパク質複合体構造解析における大きな障害の1つが取り除かれます。Cheetah-MSウェブサーバーは、プロトコルの簡略化されたバージョンをコミュニティにとってよりアクセスしやすくするために開発されました。タンデムMS/MSデータを考慮して、Cheetah-MSは最も重要な分析結果を要約したグラフィカルレポートであるJupyter Notebookを生成します。Jupyter ノートブックを拡張すると、より詳細な洞察が得られ、モデルとそれをサポートする質量分析データをよりよく理解できます。ここで紹介する技術プロトコルは、最も一般的な拡張機能のいくつかを示し、どのような情報を得ることができるかを説明します。これには、タンデムMS/MS集録データと、検出されたXLが報告された第4次モデルに対する全体的な影響を分析するのに役立つブロックが含まれています。このような解析の結果は、NGLView を使用してノートブックに埋め込まれた構造モデルに適用できます。

Introduction

タンパク質間相互作用は、生体系の構造と機能を支えています。タンパク質の4次構造にアクセスできると、2つ以上のタンパク質がどのように相互作用して高次構造を形成するかについての洞察を得ることができます。残念ながら、第四次構造を取得することは依然として困難です。これは、2つ以上のポリペプチドを含む比較的少数のタンパク質データバンク(PDB)エントリ1に反映されている。タンパク質間相互作用は、X線結晶構造解析、NMR、クライオEMなどの技術で研究することができますが、これらの方法を適用できる条件下で十分な量の精製タンパク質を得るには時間がかかることがあります。

化学架橋質量分析法は、質量分析法を使用して任意の複雑なサンプルに関するデータを取得することができるため、サンプル調製の制限の少ないタンパク質間相互作用に関する実験データを得るために開発されました23456789.しかし、データ分析の組み合わせの性質と架橋ペプチドの数が比較的少ないため、分析前にサンプルを分画する必要があります。この欠点に対処するために、我々は、計算モデリングと化学架橋質量分析法10を組み合わせた方法であるTX-MSを開発しました。TX-MSは、任意に複雑なサンプルに使用でき、以前の方法と比較して有意に高感度である10。これは、各MSスペクトルを独立して解釈するのではなく、所与のタンパク質間相互作用に関連するすべてのデータをセットとしてスコアリングすることによってこれを達成する。TX-MSはまた、高分解能MS1(hrMS1)、データ依存集録(DDA)、およびデータ非依存集録(DIA)の最大3つの異なるMS取得プロトコルを使用し、複数の観察を組み合わせることによって架橋ペプチドを同定する機会をさらに提供します。TX-MS の計算ワークフローは、いくつかの理由で複雑です。まず、複数のMS解析ソフトウェアプログラム11、1213に依存してタンパク質構造モデル1415を作成する。第二に、データ量は相当な量になる可能性があります。第 3 に、モデリング ステップは、コンピューターの処理能力を大量に消費する可能性があります。

したがって、TX−MSは、コンピュータクラウドまたはクラスタなどの大規模な計算インフラストラクチャ上で動作するCheetah−MSウェブサーバ16を介して、自動化された単純化された計算ワークフローとして最もよく使用される。結果の解釈を容易にするために、我々はインタラクティブなJupyter Notebook17を作成した。ここでは、Jupyter Notebook レポートを拡張して、特定の結果のより詳細な分析を行う方法を示します。

Protocol

1. https://txms.org でワークフローを送信します。 https://txms.org に移動し、「チーターMSを使用」をクリックします。 ワークフローを送信するには、2 つの PDB ファイルと 1 つの MS/MS mzML または MGF ファイルを指定する必要があります。「サンプルデータの読み込み」をクリックして、ワークフローのデモ版を表示することもできます。注: ジョブのサブミット方法の詳細については、ウェブサーバーのマニュアルページを参照してください。ウェブサーバーは、さまざまな非切断性架橋剤、最大12の翻訳後修飾(PTM)、計算モデリングおよびMSデータ分析に関連するオプションをサポートしています。小さなヘルプボタンも送信ページに設計されており、各オプションに関する詳細情報を表示します。 2.チーターMSを実行します。 メモ: ProteoWizard MSConvert ソフトウェア19 を使用して、ベンダー固有の形式を mzML または MGF に変換します。 MS データを https://txms.org にアップロードします。次に、「ファイルを選択」をクリックして、mzML / MGFデータ形式18でなければならないMSデータを選択します。メモ: サンプルデータは https://txms.org で入手できます。これらのデータは、zenodo.org DOI 10.5281/zenodo.3361621 から直接アクセスすることもできます。 2 つの PDB ファイルを https://txms.org にアップロードします。「ファイルを選択」をクリックし、アップロードするPDBファイルを選択します。メモ: 実験構造が存在しない場合は、例えば、ホモログ構造が利用可能な場合は SWISS-MODEL20、または de novo 構造予測用の trRosetta 21,22 または Robetta 23,24 ウェブサーバーを使用してモデルを作成します。 新しいワークフローを送信します。「送信」をクリックすると、ジョブ識別子タグが届きます。次に、このタグを使用してフォームに従って結果セクションに移動します。注: 結果の計算には時間がかかるため、ワークフローが終了するまで待ってから、ジョブ識別子タグを保存して結果ページに戻ってください。計算は、リモートの計算インフラストラクチャ上で実行されます。TX-MSをローカルで実行したい場合は、Hauri et al.10を参照してください。 Jupyter ノートブック レポートをオンライン ビューアーを使用して調べます。次に、ジョブ識別子タグを使用して、結果セクションの「レポート」までスクロールダウンします。 3. JupyterHub をインストールします。 https://docs.docker.com/install/ の指示に従ってドッカーをインストールします。 Jupyter openBIS25 拡張機能を含む JupyterHub ドッカーコンテナをダウンロードします。一般的なコマンドは “docker pull malmstroem/jove:latest,” ですが、他のプラットフォームでは異なる場合があります。注: コンテナーのダウンロード方法に関する一般的な説明については、「https://www.docker.com/get-started」を参照してください。zenodo.org DOI 10.5281/zenodo.3361621 からコンテナをダウンロードすることも可能です。注: Jupyter openBIS 拡張ソースコードは、https://pypi.org/project/jupyter-openbis-extension/ から入手できます。 ドッカーコンテナを起動します: docker run -p 8178:8000 malmstroem/jove:latest.メモ: JupyterHub がデフォルトで使用するポートは 8000 です。このポートは設定可能であり、上記のコマンドは変更に応じて調整する必要があります。ポート 8178 は任意の選択であり、変更できます。以下に示す URL の例は、それに応じて調整する必要があります。 次のアドレスに移動します: http://127.0.0.1:8178。ユーザー名 “user” とパスワード “user” を使用してログインします。メモ: アドレス http://127.0.0.1 は、docker コンテナがローカルコンピュータで実行されていることを意味します。ドッカーコンテナがサーバー上で実行されている場合は、サーバーのIPアドレスまたはURL(https://example.com など)を使用します。ドッカーコンテナは、Ubuntu Bionic 18.04、JupyterHub 0.9.6、およびJupyter openBIS拡張0.2に基づいています。これを他のオペレーティングシステムにインストールすることは可能ですが、これはテストされていません。 4. レポートをダウンロードします。 [新規] をクリックして新しいノートブックを作成 |ページの右上近くにあるメニューを使用するPython 3。これにより、 Untitled (または同様のもの)というノートブックを含む新しいタブが開きます。 ジュピターツールメニューの「openBIS接続の設定」をクリックします。 名前を入力します: txms;URL: https://txms.org;ユーザー: ゲスト;パスワード: ゲストパス wd. 「接続」をクリックします。 新しい接続を選択し、「接続を選択」をクリックします。 レポートテンプレート (/CHEETAH/WF70 など) を検索し、[ ダウンロード] をクリックします。注: Cheetah-MS Web サーバーでジョブを実行して取得した結果とレポートに基づいて、レポート テンプレートを調整する必要があります。 [セル |] をクリックしてレポートを再実行します。 すべて実行。 5. レポートを拡張します。 下部に新しいセルを追加する: セル|下に挿入します。 必要なコードを入力します。例については、以下の「代表的な結果」セクションを参照してください。 「Shift-Enter」を押してセルを実行します。

Representative Results

TX-MSは、MS由来の実験的制約によって支持される構造出力を提供する。これは、異なるMSデータ集録タイプと計算モデリングを組み合わせることによって機能します。したがって、各 MS データを個別に解析し、出力構造を視覚化すると便利です。 補足データ 1 には、TX-MS 出力として生成された DDA および DIA データを解析できるノートブックの例が含まれています。ユーザーは目的の XL を選択できます。ノートブックを実行することにより、そのXLのMS2スペクトルが表示され、異なる色が第1のペプチド、第2のペプチド、および組み合わせ断片イオンに関連する断片を区別するのに役立ちます。XLは、Jupyterノートブックに埋め込まれたNGLViewウィジェットを使用して構造にマップすることもできます。 このノートブックの別のセルは、ユーザーが DIA データを解析して視覚化するのに役立ちます。ただし、DIAデータの視覚化は、分析されたデータを正しい形式で準備する必要があるため、より困難です。 図1 は、M1とアルブミンの構造例を示しており、その構造上にトップXLがマッピングされています。TX-MSはhrMS1、DDA、DIAデータを解析した後にすべてのXLを取得し、RosettaDockプロトコルは計算モデルを提供しました。 このレポートは Jupyter ノートブックであるため、有効な Python コードを新しいノートブック セルに追加できます。たとえば、次のコードは、MS2 カウントに対してヒストグラムを作成し、基になるデータによって各クロスリンクがどの程度サポートされているかを示します。SENとしてシーボーンをインポートするsns.distplot(ms2[‘count’]); 図1:ストレプトコッカス・ピオゲネスM1タンパク質とヒトアルブミンの構造モデルとXLsを構造上にマッピングした。 M1タンパク質は灰色で示され、ホモ二量体を構成する。6つのアルブミン分子は、青色の様々な色合いで対として提示される。クロスリンクと距離は赤で、黒のテキストで示されます。この図の拡大版を表示するには、ここをクリックしてください。 補足ファイル。ジュピター ノートブック データ。このファイルをダウンロードするには、ここをクリックしてください。

Discussion

現代の計算ワークフローは、多くの場合、多くの異なるベンダーの複数のツール、複雑な相互依存関係、大量のデータ、および多面的な結果により、複雑です。その結果、結果を得るために必要なすべてのステップを正確に文書化することがますます困難になり、与えられた結果を再現することが困難になっています。ここでは、汎用レポートを生成する自動化ワークフローの自動化と容易さと、レポートを再現可能な方法でカスタマイズする柔軟性を組み合わせた一般的な戦略を示します。

プロトコールが機能するためには、3つの要件を満たす必要があります:まず、分析のために選択されたタンパク質は、化学架橋実験が質量分析計によって検出されるのに十分な高濃度で架橋種を産生することができるような方法で相互作用する必要があります。異なる質量分析計は、異なる検出レベルを有し、また、取得プロトコルおよび架橋試薬の選択に依存する。TX-MSプロトコルの現在のバージョンでは、リジン-リジンホモ二官能性架橋試薬であるDSSのみが可能です。それでも、この制限は、主に、機械学習ステップを他の試薬用に調整する必要がある可能性によるものです。Cheetah-MS Webサーバーでは、さらに2つの架橋試薬が考えられるため、この制限が改善されましたが、3つはすべて非切断可能な試薬です。第二に、2つのタンパク質は、実験的に決定された構造を有するか、比較モデリング技術または de novo 技術を用いてモデル化される必要がある。すべてのタンパク質をモデル化できるわけではありませんが、改良されたソフトウェアとPDB内の実験構造の絶え間ない沈着の組み合わせにより、モデル化できるタンパク質の数が増加します。第三に、相互作用するタンパク質は、TX-MSおよびチーター-MSによって使用されているドッキングアルゴリズムがスコアリングを可能にするために適切な品質の第四次構造を作成できるように、結合状態および非結合状態において十分に類似したままであるべきである。許容可能な品質はシステム依存性が高く、既知の構造の小さなタンパク質は一般に未知の構造の大きなタンパク質よりも比較が容易であるため、この要件は比較的曖昧です。

陰性の結果の場合、まずTX-MSが同じポリペプチド鎖の一部である残基間のイントラリンク、架橋を発見したことを確認する。何も発見されない場合、最も可能性の高い説明は、サンプル調製またはデータ収集に何らかの問題があったことです。複数の距離拘束がモデルをサポートしていない場合は、モデルを視覚的に検査して、コンフォメーションが架橋残基によってサポートされていることを確認します。少なくとも 1 つの架橋を中断することなく、インターアクターの 1 つをピボットする明白な方法はありません。所与の架橋試薬に対して許容距離よりも長い架橋がある場合、架橋データを組み込むことによってインターアクターのモデリングを改善しようとする。

選択したソフトウェアの感度がTX-MSの感度に匹敵する限り、代替ソフトウェアアプリケーションを使用して同等の結果を達成することができます。たとえば、RosettaDock、HADDOCK などのオンライン バージョンがあります。また、xQuest/xProphet 5,6、plink7、および SIM-XL26 を使用して化学架橋データを解析することもできます。

TX-MSとチーター-MSを新規プロジェクト272829に継続的に適用し、これらのアプローチによって作成されたレポートを改善しレポートを大きくすることなく結果のより詳細な分析を可能にします。

Divulgaciones

The authors have nothing to disclose.

Acknowledgements

この研究は、Knut and Alice Wallenberg財団(助成金番号2016.0023)とスイス国立科学財団(助成金番号。P2ZHP3_191289)。さらに、チューリッヒ大学S3ITの計算インフラと技術サポートに感謝します。

Materials

Two Protein DataBank files of the proteins of interest. N/A N/A Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621
An mzML data file acquired on a sample where the proteins of interest were crosslinked. N/A N/A Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621

Referencias

  1. Berman, H. M., et al. The Protein Data Bank. Acta Crystallographica Section D: Biological Crystallography. 58 (6), 899-907 (2002).
  2. Herzog, F., et al. Structural Probing of a Protein Phosphatase 2A Network by Chemical Cross-Linking and Mass Spectrometry. Science. 337 (6100), 1348-1352 (2012).
  3. Hoopmann, M. R., et al. Kojak: efficient analysis of chemically cross-linked protein complexes. Journal of Proteome Research. 14 (5), 2190-2198 (2015).
  4. Seebacher, J., et al. Protein cross-linking analysis using mass spectrometry, isotope-coded cross-linkers, and integrated computational data processing. Journal of Proteome Research. 5 (9), 2270-2282 (2006).
  5. Rinner, O., et al. Identification of cross-linked peptides from large sequence databases. Nature Methods. 5 (4), 315-318 (2008).
  6. Walzthoeni, T., et al. False discovery rate estimation for cross-linked peptides identified by mass spectrometry. Nature Methods. 9 (9), 901-903 (2012).
  7. Yang, B., et al. Identification of cross-linked peptides from complex samples. Nature Methods. 9 (9), 904-906 (2012).
  8. Chu, F., Baker, P. R., Burlingame, A. L., Chalkley, R. J. Finding Chimeras: a Bioinformatics Strategy for Identification of Cross-linked Peptides. Molecular & Cellular Proteomics. 9 (1), 25-31 (2010).
  9. Holding, A. N., Lamers, M. H., Stephens, E., Skehel, J. M. Hekate: Software Suite for the Mass Spectrometric Analysis and Three-Dimensional Visualization of Cross-Linked Protein Samples. Journal of Proteome Research. 12 (12), 5923-5933 (2013).
  10. Hauri, S., et al. Rapid determination of quaternary protein structures in complex biological samples. Nature Communications. 10 (1), 192 (2019).
  11. Röst, H. L., et al. OpenSWATH enables automated, targeted analysis of data-independent acquisition MS data. Nature Biotechnology. 32 (3), 219-223 (2014).
  12. Röst, H. L., et al. OpenMS: a flexible open-source software platform for mass spectrometry data analysis. Nature Methods. 13 (9), 741-748 (2016).
  13. Quandt, A., et al. Using synthetic peptides to benchmark peptide identification software and search parameters for MS/MS data analysis. EuPA Open Proteomics. 5, 21-31 (2014).
  14. Bradley, P., et al. Free modeling with Rosetta in CASP6. Proteins: Structure, Function, and Bioinformatics. 61 (S7), 128-134 (2005).
  15. Gray, J. J. High-resolution protein-protein docking. Current Opinion in Structural Biology. 16 (2), 183-193 (2006).
  16. Khakzad, H., et al. Cheetah-MS: a web server to model protein complexes using tandem cross-linking mass spectrometry data. Bioinformatics. , (2021).
  17. Malmström, L. Chapter 15: Computational Proteomics with Jupyter and Python. Methods in Molecular Biology. 15, 237-248 (1977).
  18. Martens, L., et al. mzML–a community standard for mass spectrometry data. Molecular & Cellular Proteomics. 10 (1), (2011).
  19. Chambers, M. C., et al. A cross-platform toolkit for mass spectrometry and proteomics. Nature Biotechnology. 30 (10), 918-920 (2012).
  20. Waterhouse, A., et al. SWISS-MODEL: homology modelling of protein structures and complexes. Nucleic Acids Research. 46 (W1), W296-W303 (2018).
  21. Yang, J., et al. Improved protein structure prediction using predicted interresidue orientations. Proceedings of the National Academy of Sciences. 117 (3), 1496-1503 (2020).
  22. Koehler Leman, J., et al. Macromolecular modeling and design in Rosetta: recent methods and frameworks. Nature Methods. 17 (7), 665-680 (2020).
  23. Chivian, D., et al. Prediction of CASP6 structures using automated Robetta protocols. Proteins: Structure, Function, and Bioinformatics. 61 (S7), 157-166 (2005).
  24. Chivian, D., et al. Automated prediction of CASP-5 structures using the Robetta server. Proteins: Structure, Function, and Bioinformatics. 53 (S6), 524-533 (2003).
  25. Bauch, A., et al. openBIS: a flexible framework for managing and analyzing complex data in biology research. BMC Bioinformatics. 12, 468 (2011).
  26. Lima, D. B., et al. SIM-XL: A powerful and user-friendly tool for peptide cross-linking analysis. Journal of Proteomics. 129, 51-55 (2015).
  27. Happonen, L., et al. A quantitative Streptococcus pyogenes-human protein-protein interaction map reveals localization of opsonizing antibodies. Nature Communications. 10, 2727 (2019).
  28. Khakzad, H., et al. Structural determination of Streptococcus pyogenes M1 protein interactions with human immunoglobulin G using integrative structural biology. PLOS Computational Biology. 17 (1), E1008169 (2021).
  29. Khakzad, H., et al. In vivo cross-linking MS of the complement system MAC assembled on live Gram-positive bacteria. Frontiers in Genetics. 11, (2020).

Play Video

Citar este artículo
Khakzad, H., Vermeul, S., Malmström, L. Quaternary Structure Modeling Through Chemical Cross-Linking Mass Spectrometry: Extending TX-MS Jupyter Reports. J. Vis. Exp. (176), e60311, doi:10.3791/60311 (2021).

View Video