クライオ電子顕微鏡の高度な粒子選択方法であるCryoSieveは、実世界のデータセットへの適用を通じて実証されているように、最終スタックの粒子の大部分を除去することにより、密度マップの解像度を向上させます。
過去10年間で、極低温電子顕微鏡(クライオEM)の単粒子分析(SPA)の分野における技術と方法論の進歩により、生体高分子の高分解能構造検査の能力が大幅に向上しました。この進歩により、分子の洞察の新時代が到来し、X線結晶構造解析が主要な方法に取って代わり、生物学における長年の疑問に対する答えがもたらされました。クライオ電子顕微鏡は、X線結晶構造解析の大きな制限である結晶化に依存しないため、さまざまな品質の粒子を捕捉します。したがって、選択した粒子の品質は再構築された密度マップの解像度に直接影響するため、粒子の選択は非常に重要です。CryoSieveと呼ばれる粒子選択のための革新的な反復アプローチは、最終スタック内の粒子の数を効果的に減らすことにより、再構築された密度マップの品質を大幅に向上させます。実験的な証拠によると、この方法により、最終スタックの粒子の大部分を除去でき、密度マップの品質が大幅に向上します。この記事では、このアプローチの詳細なワークフローの概要を説明し、実際のデータセットでのその適用を紹介します。
極低温電子顕微鏡(クライオEM)単粒子分析(SPA)は、生体高分子の高解像度3次元密度マップを決定するための主要な方法となっています。一連の技術革新1,2,3,4,5,6、すなわち分解能革命7により、クライオ電子顕微鏡は、前例のない速度で原子分解能まで生体高分子の構造を決定する能力を持っています。このブレークスルーは、分子洞察の新時代の幕開けであり、X線結晶構造解析を抜いて主要な技術となり、長年の生物学的な疑問に答えるものです。
クライオEM SPAは、生体高分子の結晶化を必要としないため、X線結晶構造解析とは異なります。代わりに、標的の生体高分子を含む溶液は、ガラス質の氷中で急速に凍結されます。次に、電子ビームでイメージングして一連の顕微鏡写真を作成し、結晶化の必要性を回避します8。続いて、粒子ピッキングアルゴリズムを利用して、これらの顕微鏡写真4、9、10、11、12から個々の生粒子を抽出する。クライオ電子顕微鏡は結晶化に依存しないため、抽出された粒子が主に損傷を受けたり、望ましくないコンフォメーション状態にあるのは当然であり、高解像度の密度マップを得るためには、粒子選択を複数回行う必要があります。したがって、クライオEM SPA画像処理では、高解像度の密度マップ13を得るために粒子の選択が重要です。
クライオ電子顕微鏡SPAでは、標準的な粒子選択方法には、2次元(2D)および3次元(3D)分類14が含まれます。2D 分類では、粒子が事前定義された数のグループに分類され、各クラスの平均画像と推定 2D 解像度が得られます。その後、研究者はこれらのクラスを目視で検査し、低解像度のグループから粒子を取り除き、残りの粒子を高解像度の再構築に使用できます。リファインメントアルゴリズムを使用して粒子のポーズが確立されると、研究者は粒子を複数のクラスにクラスタリングする3D分類を進めます。これにより、各クラスの再構築された密度マップを目視で検査でき、望ましくない粒子、たとえば望ましくない粒子を除外できます。複数回の分類ラウンドの後、比較的高品質の粒子を含む最終スタックが得られます。これらの最終スタックは、原子または原子に近い解像度の密度マップを作成するのに役立ちます。
Zhu氏と彼女の同僚は、これらの最終スタック15でさらなる粒子選択を行うことができることを実証しました。粒子選択のための革新的な反復方法であるCryoSieve15は、粒子の数を大幅に減らすことにより、最終的な密度マップの品質を向上させるために適用できます。正規化相互相関(NCC)法16、角度グラフ一貫性(AGC)アプローチ17、および非アライメント分類5などの他の粒子選別基準およびソフトウェアが現在、この分野で使用されていますが、この方法は、有効性の点でこれらのアルゴリズムよりも優れていることが示されています。
この研究では、プロセス全体の詳細なガイドを提供します。ケーススタディとして、この新しい方法をインフルエンザ赤血球凝集素三量体(EMPIARエントリ:10097)18のデータセットに適用しました。このデータセットには、最終スタックに130,000個の粒子が含まれています。私たちの手順では、このデータセットの最終スタックからパーティクルの約73.8%を無事に破棄し、再構築された密度マップの解像度を4.11 Åから3.62 Åに向上させました。インフルエンザ赤血球凝集素三量体に加えて、複数のデータセットの結果が以前の出版物15に示されており、生体分子のさまざまな解像度と分子量が示されています。
クライオ電子顕微鏡は、生体分子の構造を解明するための極めて重要な技術です。このプロセスでは、顕微鏡によるデータ収集後、顕微鏡写真から粒子を抽出し、その後、複数の段階で分類して最終的なスタックをまとめることが不可欠です。一般的な課題は、損傷した粒子や望ましくない粒子が優勢であることであり、高解像度の密度マップを得るためには、粒子選択を繰り返す必要があることが強調されています。そのため、クライオ電子顕微鏡スパでは、粒子選択が高品質の密度マップを実現するための重要なステップとなります。既存の粒子選択技術には、統計的非傾斜検証アルゴリズム22、zスコアベースのアプローチ23、および角度精度推定方法24が含まれる。
CryoSieveは、このコンテキストで貴重なツールとして浮上しており、最終的なスタックからかなりの数の無関係な粒子を排除することに長けています。この削減により、再構成の計算効率が向上するだけでなく、プロセスが合理化されます。これは、粒子選択のための包括的なスイートを提供し、粒子の破棄の程度とそれに伴う解像度の向上は、初期データ品質とデータ処理に採用される方法論に大きく依存します。
本稿では、インフルエンザ赤血球凝集素三量体(EMPIARエントリー:10097)の実例データセットを用いた粒子ふるい分けの完全なワークフローを紹介しました。ここで取り上げて説明する手順は、粒子ふるい分けと姿勢の再推定として要約できます。最終的な3D再構成ボリュームは3.62 Åの解像度を達成し、アルファヘリックスの側鎖は、公開された密度マップと比較して、後処理されたボリュームでより明確になりました。
CryoSieveは、GitHub(https://github.com/mxhulab/cryosieve)で公開されているオープンソースの方法です。詳細なチュートリアルは、ホームページでも見つけることができます。ユーザーは、チュートリアルに従ってインストールして使用できます。さらに、cryosieve-csrefineとcryosieve-csrhbfactorの2つのモジュールが提供されます。cryosieve-csrefineモジュールは、CryoSPARC(補足ファイル5)内のさまざまな操作の逐次実行を自動化するために特別に作成されています。これらの操作には、パーティクル スタックのインポートや、 ab initio、均質なリファインメント、または不均一なリファインメント ジョブの実行が含まれます。一方、cryosieve-csrhbfactor モジュールは、cryosieve-csrefine の機能を活用して Rosenthal-Henderson B-factor の決定を自動化するように設計されています (補足ファイル 6)。
現在、この手法の適用は単一のコンフォメーションシナリオに限定されています。したがって、粒子が複数のコンフォメーションを表す場合、その能力は制限されます。ユーザーは、最初に3D分類に従事して、異なるコンフォメーションの粒子を分離してから、それを精製された粒子の選択に使用することをお勧めします。さらに、この方法は、最終スタックから粒子の50%以上をろ過することに熟練していることを示していますが、これらの廃棄された粒子の起源と、それらが再構築品質にほとんど寄与しない根本的な理由は不明のままです。この理解のギャップは、この制限に包括的に対処し、潜在的に修正するために追加の研究を必要とします。
粒子選別または粒子ふるい分けには、3つの既存の方法があります。まず第一に、cisTEM4は3Dリファインメント後の各単一粒子画像のスコアを報告できます。ユーザーは、cisTEMスコアを使用して粒子を分類し、粒子を破棄できます。角度グラフ一貫性(AGC)アプローチ17は、位置がずれた粒子を破棄する方法でもある。さらに、非アライメント分類5は、3D分類を使用して粒子を破棄する従来の方法です。これらの方法で保持される粒子の品質をCryoSieveと比較したところ、CryoSieveの保持粒子はより高品質であることがわかりました15。ここで紹介する方法は、他の方法を大幅に上回り、同じ解像度で最小数の粒子を達成します。
この結果で示されたように、クライオ電子顕微鏡の最終スタック内の粒子の大部分は、密度マップの再構築に寄与しません。言い換えれば、画像取得中に収集されたすべての粒子のうち、選択された少数の粒子、つまり最も細かいサブセットのみが、最終的な再構成に実際に貢献します。したがって、収集された粒子の総数に対するこの最終サブセットの比率は、サンプルの品質を評価するための定量的な指標として役立つ可能性があります。この比率が高いほど、サンプルの品質は向上します。技術の進歩により、構造生物学者がクライオ電子顕微鏡をより利用しやすくなったにもかかわらず、サンプル調製は依然としてワークフローの大きなボトルネックとなっています。したがって、科学者とエンジニアは、この課題に力を注いでいます25。単粒子分析(SPA)では、サンプル調製は、サンプルの最適化とグリッド調製という2つの重要なステップで構成されています。前者は、試料を最適な生化学的状態を維持しながら精製することです。後者では、グリッドの化学的またはプラズマ処理、サンプルの堆積、ガラス化など、顕微鏡での分析のためにサンプルを準備します。高分子の不安定性に対処するために数多くの技術が提案されてきたが、あるアプローチが他のアプローチよりも有効かどうかは、サンプルの特性に依存する25,26。現在、グリッド調製の結果はユーザーの専門知識と経験に大きく影響されるため、プロセスが時間がかかり、困難になる可能性があります27,28。サンプルとグリッドの準備で遭遇する多数の変数は、研究者が顕微鏡を使用して分子レベルでしかサンプルを評価できないため、因果関係を確立する上で課題を提起します。その結果、異なるサンプルおよびグリッド調製プロトコルの比較による定量的統計はまだ不足しており、傾向を調査し、サンプル挙動の基本的なメカニズムを理解するための体系的なアプローチが必要である29。
The authors have nothing to disclose.
本研究は、Shenzhen Academy of Research and Translation(M.H.氏)、Advanced Innovation Center for Structural Biology(M.H.氏)、Beijing Frontier Research Center for Biological Structure(M.H.氏)、National Key R&D Program of China(No.2021YFA1001300)(C.B.氏)、National Natural Science Foundation of China(No.12271291)(C.B.氏)、 中国国家自然科学基金会(No.12071244)(Z.S.へ)。
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |