Une méthode avancée de sélection de particules pour la cryo-EM, à savoir CryoSieve, améliore la résolution de la carte de densité en supprimant la majorité des particules dans les piles finales, comme le démontre son application sur un ensemble de données du monde réel.
Au cours de la dernière décennie, les progrès technologiques et méthodologiques dans le domaine de la microscopie électronique cryogénique (cryo-EM) et de l’analyse de particules uniques (SPA) ont considérablement amélioré notre capacité d’examen structurel à haute résolution des macromolécules biologiques. Cette avancée a inauguré une nouvelle ère de connaissances moléculaires, remplaçant la cristallographie aux rayons X comme méthode dominante et fournissant des réponses à des questions de longue date en biologie. Étant donné que la cryo-EM ne dépend pas de la cristallisation, ce qui est une limitation importante de la cristallographie aux rayons X, elle capture des particules de qualité variable. Par conséquent, la sélection des particules est cruciale, car la qualité des particules sélectionnées influence directement la résolution de la carte de densité reconstruite. Une approche itérative innovante pour la sélection des particules, appelée CryoSieve, améliore considérablement la qualité des cartes de densité reconstruites en réduisant efficacement le nombre de particules dans la pile finale. Des preuves expérimentales montrent que cette méthode peut éliminer la majorité des particules dans les piles finales, ce qui entraîne une amélioration notable de la qualité des cartes de densité. Cet article décrit le flux de travail détaillé de cette approche et présente son application sur un ensemble de données du monde réel.
L’analyse de particules uniques (SPA) par microscopie électronique cryogénique (cryo-EM) est devenue une méthode dominante pour déterminer des cartes de densité tridimensionnelles à haute résolution de macromolécules biologiques. Grâce à une série d’innovations technologiques 1,2,3,4,5,6, appelées révolution de résolution 7, la cryo-EM a la capacité de déterminer les structures de macromolécules biologiques avec une résolution atomique allant jusqu’à un rythme sans précédent. Cette percée marque le début d’une nouvelle ère dans les connaissances moléculaires, dépassant la cristallographie aux rayons X en tant que technique prédominante et répondant à des questions biologiques de longue date.
La Cryo-EM SPA s’écarte de la cristallographie aux rayons X en ne nécessitant pas la cristallisation de macromolécules biologiques. Au lieu de cela, une solution contenant les macromolécules biologiques cibles est rapidement congelée dans de la glace vitrée. Il est ensuite imagé à l’aide d’un faisceau d’électrons pour produire une série de micrographies, en contournant le besoin de cristallisation8. Par la suite, des algorithmes de sélection de particules sont utilisés pour extraire des particules brutes individuelles de ces micrographies 4,9,10,11,12. Comme la cryo-EM ne dépend pas de la cristallisation, il est naturel que les particules extraites soient principalement endommagées ou dans des états conformationnels indésirables, ce qui nécessite plusieurs cycles de sélection de particules pour obtenir une carte de densité à haute résolution. Dans le traitement d’images cryo-EM SPA, la sélection des particules est donc cruciale pour obtenir des cartes de densité à haute résolution13.
Dans la cryo-EM SPA, les méthodes standard de sélection des particules comprennent la classification bidimensionnelle (2D) et tridimensionnelle (3D)14. La classification 2D catégorise les particules en un nombre prédéfini de groupes, ce qui permet d’obtenir une image moyenne et une résolution 2D estimée pour chaque classe. Les chercheurs peuvent ensuite inspecter visuellement ces classes, en supprimant les particules des groupes à faible résolution pour utiliser les autres dans des reconstructions visant à atteindre une résolution plus élevée. Une fois que les poses des particules auront été établies à l’aide d’algorithmes de raffinement, les chercheurs procéderont à la classification 3D, en regroupant les particules en plusieurs classes. Cela permet une inspection visuelle de la carte de densité reconstruite pour chaque classe, ce qui permet d’exclure les particules indésirables, telles que celles provenant de conformations indésirables. Après plusieurs cycles de classification, on obtient un dernier empilement comprenant des particules de qualité relativement élevée. Ces empilements finaux jouent un rôle déterminant dans la production de cartes de densité à résolution atomique ou quasi atomique.
Zhu et ses collègues ont démontré qu’une sélection supplémentaire de particules peut être effectuée sur ces empilements finaux15. CryoSieve15, une méthode itérative innovante pour la sélection des particules, peut être appliquée pour améliorer la qualité de la carte de densité finale en réduisant considérablement le nombre de particules. Bien que d’autres critères et logiciels de tri des particules, tels que la méthode de corrélation croisée normalisée (NCC)16, l’approche de cohérence de graphe angulaire (AGC)17 et la classification de non-alignement5, soient actuellement utilisés sur le terrain, il a été démontré que cette méthode surpasse ces algorithmes en termes d’efficacité.
Dans cette étude, nous présentons un guide détaillé de l’ensemble du processus. À titre d’étude de cas, nous avons appliqué cette nouvelle méthode à l’ensemble de données du trimère d’hémagglutinine de la grippe (entrée EMPIAR : 10097)18, qui comprend 130 000 particules dans sa pile finale. Notre procédure a réussi à éliminer environ 73,8 % des particules de la dernière pile de cet ensemble de données, améliorant ainsi la résolution de la carte de densité reconstruite de 4,11 Å à 3,62 Å. En plus du trimère de l’hémagglutinine de la grippe, les résultats de plusieurs ensembles de données sont présentés dans une publication antérieure15, mettant en évidence une variété de résolutions et de poids moléculaires de biomolécules.
La cryo-EM est une technique essentielle pour élucider les structures des molécules biologiques. Dans ce processus, après la collecte des données par microscopie, l’extraction des particules à partir des micrographies est essentielle, suivie de leur classification en plusieurs étapes pour compiler la pile finale. Un défi courant est la prédominance de particules endommagées ou non conformées de manière indésirable, ce qui souligne la nécessité d’une sélection répétée des particules pour obtenir des cartes de densité à haute résolution. La sélection des particules est donc une étape critique de la cryo-EM SPA pour obtenir des cartes de densité de haute qualité. Les techniques de sélection de particules existantes comprennent l’algorithme de validation statistique sans inclinaison22, l’approche basée sur le score z23 et la méthode d’estimation de la précision angulaire24.
CryoSieve apparaît comme un outil précieux dans ce contexte, capable d’éliminer un nombre important de particules étrangères de la pile finale. Cette réduction améliore non seulement l’efficacité de calcul de la reconstruction, mais rationalise également le processus. Il offre une suite complète pour la sélection des particules, où l’ampleur des rejets de particules et l’amélioration conséquente de la résolution dépendent en grande partie de la qualité initiale des données et des méthodologies employées dans le traitement des données.
Dans ce manuscrit, nous avons présenté un flux complet de criblage de particules à l’aide de l’ensemble de données de cas réels de trimère d’hémagglutinine de grippe (entrée EMPIAR : 10097). Les étapes couvertes et discutées ici peuvent être résumées comme le tamisage des particules et la réestimation de la pose. Le volume final reconstruit en 3D a atteint une résolution de 3,62 Å, et les chaînes latérales en hélices alpha étaient plus claires dans le volume post-traité par rapport à la carte de densité publiée.
CryoSieve est une méthode open-source qui est disponible sur GitHub (https://github.com/mxhulab/cryosieve). Un tutoriel détaillé peut également être trouvé sur sa page d’accueil. Les utilisateurs peuvent l’installer et l’utiliser en suivant le tutoriel. De plus, deux modules, cryosieve-csrefine et cryosieve-csrhbfactor, sont fournis. Le module cryosieve-csrefine est spécialement conçu pour automatiser l’exécution séquentielle de diverses opérations au sein de CryoSPARC (Fichier supplémentaire 5). Ces opérations comprennent l’importation d’empilements de particules et la réalisation de travaux de raffinement ab initio, homogènes ou non uniformes. D’autre part, le module cryosieve-csrhbfactor est conçu pour automatiser la détermination du facteur B de Rosenthal-Henderson en exploitant les capacités de cryosieve-csrefine (Fichier supplémentaire 6).
À l’heure actuelle, l’application de cette méthode est limitée aux scénarios de conformation unique. Par conséquent, dans les cas où les particules représentent plusieurs conformations, leurs capacités sont limitées. Il est conseillé aux utilisateurs de s’engager d’abord dans la classification 3D pour séparer les particules de conformations disparates avant de l’utiliser pour une sélection raffinée des particules. De plus, bien que la méthode démontre sa capacité à filtrer plus de 50 % des particules de la pile finale, l’origine de ces particules rejetées et les raisons sous-jacentes de leur contribution négligeable à la qualité de la reconstruction restent incertaines. Cette lacune dans la compréhension nécessite des recherches supplémentaires pour aborder de manière exhaustive et éventuellement rectifier cette limitation.
Il existe trois méthodes possibles de tri ou de tamisage des particules. Tout d’abord, cisTEM4 peut rapporter un score pour chaque image de particule après raffinement 3D. Les utilisateurs pouvaient trier les particules à l’aide du score cisTEM pour éliminer les particules. L’approche AGC (Angular Graph Consistency)17 est également une méthode pour éliminer les particules mal alignées. De plus, la classification de non-alignement5 est une méthode traditionnelle d’élimination des particules à l’aide de la classification 3D. Nous avons comparé la qualité des particules retenues par ces méthodes avec CryoSieve et avons constaté que les particules retenues de CryoSieve sont de meilleure qualité15. La méthode présentée ici surpasse considérablement les méthodes alternatives et permet d’obtenir le plus petit nombre de particules à la même résolution.
Comme le démontre le résultat, la majorité des particules d’une pile finale cryo-EM ne contribuent pas à la reconstruction de la carte de densité. En d’autres termes, parmi toutes les particules recueillies lors de l’acquisition de l’image, seules quelques-unes, à savoir le sous-ensemble le plus fin, contribuent réellement à la reconstruction finale. Par conséquent, le rapport entre ce dernier sous-ensemble et le nombre total de particules collectées pourrait servir de mesure quantitative pour évaluer la qualité de l’échantillon. Plus ce rapport est élevé, meilleure est la qualité de l’échantillon. Malgré les progrès techniques qui ont rendu la cryo-EM plus accessible aux biologistes structurels, la préparation des échantillons reste un goulot d’étranglement majeur dans le flux de travail. Les scientifiques et les ingénieurs concentrent donc leurs efforts sur ce défi25. Dans l’analyse des particules uniques (SPA), la préparation des échantillons se compose de deux étapes cruciales : l’optimisation des échantillons et la préparation de la grille. La première consiste à purifier l’échantillon tout en maintenant son état biochimique optimal. Ce dernier implique la préparation de l’échantillon pour l’analyse au microscope, y compris le traitement chimique ou plasma de la grille, le dépôt de l’échantillon et la vitrification. De nombreuses techniques ont été proposées pour traiter l’instabilité macromoléculaire, mais l’efficacité d’une approche par rapport à une autre dépend des caractéristiques de l’échantillon25,26. À l’heure actuelle, les résultats de la préparation du réseau sont fortement influencés par l’expertise et l’expérience de l’utilisateur, ce qui peut rendre le processus long et difficile27,28. Les nombreuses variables rencontrées dans la préparation de l’échantillon et de la grille posent des défis pour établir des relations de cause à effet, car les chercheurs ne peuvent évaluer l’échantillon au niveau moléculaire qu’à l’aide du microscope. En conséquence, les statistiques quantitatives provenant de comparaisons de différents protocoles de préparation d’échantillons et de grilles font toujours défaut, et une approche systématique est nécessaire pour étudier les tendances et comprendre les mécanismes fondamentaux du comportement de l’échantillon29.
The authors have nothing to disclose.
Ce travail a été soutenu par l’Académie de recherche et de traduction de Shenzhen (à M.H.), le Centre d’innovation avancée pour la biologie structurale (à M.H.), le Beijing Frontier Research Center for Biological Structure (à M.H.), le National Key R&D Program of China (n° 2021YFA1001300) (à C.B.), la National Natural Science Foundation of China (n° 12271291) (à C.B.), et la Fondation nationale des sciences naturelles de Chine (n° 12071244) (à Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |