標的架橋質量分析は、最大3つの異なる取得プロトコルを使用して取得した質量分析データを使用して、第4級タンパク質構造モデルを作成します。Cheetah-MS Webサーバーで簡略化されたワークフローとして実行すると、結果はJupyter Notebookに報告されます。ここでは、Jupyter ノートブックを拡張してより詳細な分析を行う方法の技術的な側面を示します。
タンパク質間相互作用は、研究が困難な場合がありますが、生物学的システムがどのように機能するかについての洞察を提供します。標的架橋質量分析(TX-MS)は、第四級タンパク質構造モデリングと化学架橋質量分析を組み合わせた方法であり、複雑な未分画サンプルから得られたデータを使用して高精度の構造モデルを作成します。これにより、目的のタンパク質を大量に精製する必要がなくなるため、タンパク質複合体構造解析における大きな障害の1つが取り除かれます。Cheetah-MSウェブサーバーは、プロトコルの簡略化されたバージョンをコミュニティにとってよりアクセスしやすくするために開発されました。タンデムMS/MSデータを考慮して、Cheetah-MSは最も重要な分析結果を要約したグラフィカルレポートであるJupyter Notebookを生成します。Jupyter ノートブックを拡張すると、より詳細な洞察が得られ、モデルとそれをサポートする質量分析データをよりよく理解できます。ここで紹介する技術プロトコルは、最も一般的な拡張機能のいくつかを示し、どのような情報を得ることができるかを説明します。これには、タンデムMS/MS集録データと、検出されたXLが報告された第4次モデルに対する全体的な影響を分析するのに役立つブロックが含まれています。このような解析の結果は、NGLView を使用してノートブックに埋め込まれた構造モデルに適用できます。
タンパク質間相互作用は、生体系の構造と機能を支えています。タンパク質の4次構造にアクセスできると、2つ以上のタンパク質がどのように相互作用して高次構造を形成するかについての洞察を得ることができます。残念ながら、第四次構造を取得することは依然として困難です。これは、2つ以上のポリペプチドを含む比較的少数のタンパク質データバンク(PDB)エントリ1に反映されている。タンパク質間相互作用は、X線結晶構造解析、NMR、クライオEMなどの技術で研究することができますが、これらの方法を適用できる条件下で十分な量の精製タンパク質を得るには時間がかかることがあります。
化学架橋質量分析法は、質量分析法を使用して任意の複雑なサンプルに関するデータを取得することができるため、サンプル調製の制限の少ないタンパク質間相互作用に関する実験データを得るために開発されました2、3、4、5、6、7、8、9.しかし、データ分析の組み合わせの性質と架橋ペプチドの数が比較的少ないため、分析前にサンプルを分画する必要があります。この欠点に対処するために、我々は、計算モデリングと化学架橋質量分析法10を組み合わせた方法であるTX-MSを開発しました。TX-MSは、任意に複雑なサンプルに使用でき、以前の方法と比較して有意に高感度である10。これは、各MSスペクトルを独立して解釈するのではなく、所与のタンパク質間相互作用に関連するすべてのデータをセットとしてスコアリングすることによってこれを達成する。TX-MSはまた、高分解能MS1(hrMS1)、データ依存集録(DDA)、およびデータ非依存集録(DIA)の最大3つの異なるMS取得プロトコルを使用し、複数の観察を組み合わせることによって架橋ペプチドを同定する機会をさらに提供します。TX-MS の計算ワークフローは、いくつかの理由で複雑です。まず、複数のMS解析ソフトウェアプログラム11、12、13に依存してタンパク質構造モデル14、15を作成する。第二に、データ量は相当な量になる可能性があります。第 3 に、モデリング ステップは、コンピューターの処理能力を大量に消費する可能性があります。
したがって、TX−MSは、コンピュータクラウドまたはクラスタなどの大規模な計算インフラストラクチャ上で動作するCheetah−MSウェブサーバ16を介して、自動化された単純化された計算ワークフローとして最もよく使用される。結果の解釈を容易にするために、我々はインタラクティブなJupyter Notebook17を作成した。ここでは、Jupyter Notebook レポートを拡張して、特定の結果のより詳細な分析を行う方法を示します。
現代の計算ワークフローは、多くの場合、多くの異なるベンダーの複数のツール、複雑な相互依存関係、大量のデータ、および多面的な結果により、複雑です。その結果、結果を得るために必要なすべてのステップを正確に文書化することがますます困難になり、与えられた結果を再現することが困難になっています。ここでは、汎用レポートを生成する自動化ワークフローの自動化と容易さと、レポートを再現可能な方法でカスタマイズする柔軟性を組み合わせた一般的な戦略を示します。
プロトコールが機能するためには、3つの要件を満たす必要があります:まず、分析のために選択されたタンパク質は、化学架橋実験が質量分析計によって検出されるのに十分な高濃度で架橋種を産生することができるような方法で相互作用する必要があります。異なる質量分析計は、異なる検出レベルを有し、また、取得プロトコルおよび架橋試薬の選択に依存する。TX-MSプロトコルの現在のバージョンでは、リジン-リジンホモ二官能性架橋試薬であるDSSのみが可能です。それでも、この制限は、主に、機械学習ステップを他の試薬用に調整する必要がある可能性によるものです。Cheetah-MS Webサーバーでは、さらに2つの架橋試薬が考えられるため、この制限が改善されましたが、3つはすべて非切断可能な試薬です。第二に、2つのタンパク質は、実験的に決定された構造を有するか、比較モデリング技術または de novo 技術を用いてモデル化される必要がある。すべてのタンパク質をモデル化できるわけではありませんが、改良されたソフトウェアとPDB内の実験構造の絶え間ない沈着の組み合わせにより、モデル化できるタンパク質の数が増加します。第三に、相互作用するタンパク質は、TX-MSおよびチーター-MSによって使用されているドッキングアルゴリズムがスコアリングを可能にするために適切な品質の第四次構造を作成できるように、結合状態および非結合状態において十分に類似したままであるべきである。許容可能な品質はシステム依存性が高く、既知の構造の小さなタンパク質は一般に未知の構造の大きなタンパク質よりも比較が容易であるため、この要件は比較的曖昧です。
陰性の結果の場合、まずTX-MSが同じポリペプチド鎖の一部である残基間のイントラリンク、架橋を発見したことを確認する。何も発見されない場合、最も可能性の高い説明は、サンプル調製またはデータ収集に何らかの問題があったことです。複数の距離拘束がモデルをサポートしていない場合は、モデルを視覚的に検査して、コンフォメーションが架橋残基によってサポートされていることを確認します。少なくとも 1 つの架橋を中断することなく、インターアクターの 1 つをピボットする明白な方法はありません。所与の架橋試薬に対して許容距離よりも長い架橋がある場合、架橋データを組み込むことによってインターアクターのモデリングを改善しようとする。
選択したソフトウェアの感度がTX-MSの感度に匹敵する限り、代替ソフトウェアアプリケーションを使用して同等の結果を達成することができます。たとえば、RosettaDock、HADDOCK などのオンライン バージョンがあります。また、xQuest/xProphet 5,6、plink7、および SIM-XL26 を使用して化学架橋データを解析することもできます。
TX-MSとチーター-MSを新規プロジェクト27、28、29に継続的に適用し、これらのアプローチによって作成されたレポートを改善し、レポートを大きくすることなく、結果のより詳細な分析を可能にします。
The authors have nothing to disclose.
この研究は、Knut and Alice Wallenberg財団(助成金番号2016.0023)とスイス国立科学財団(助成金番号。P2ZHP3_191289)。さらに、チューリッヒ大学S3ITの計算インフラと技術サポートに感謝します。
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |