Eine fortschrittliche Partikelauswahlmethode für Kryo-EM, nämlich CryoSieve, verbessert die Auflösung der Dichtekarte, indem sie einen Großteil der Partikel in den endgültigen Stapeln entfernt, wie ihre Anwendung auf einem realen Datensatz zeigt.
In den letzten zehn Jahren haben technologische und methodische Fortschritte auf dem Gebiet der kryogenen Elektronenmikroskopie (Kryo-EM) und der Einzelteilchenanalyse (SPA) unsere Fähigkeit zur hochauflösenden Strukturuntersuchung biologischer Makromoleküle erheblich verbessert. Dieser Fortschritt hat eine neue Ära molekularer Erkenntnisse eingeläutet, die die Röntgenkristallographie als dominierende Methode abgelöst und Antworten auf langjährige Fragen in der Biologie gegeben hat. Da die Kryo-EM nicht von der Kristallisation abhängt, die eine wesentliche Einschränkung der Röntgenkristallographie darstellt, werden Partikel unterschiedlicher Qualität eingefangen. Daher ist die Auswahl der Partikel entscheidend, da die Qualität der ausgewählten Partikel die Auflösung der rekonstruierten Dichtekarte direkt beeinflusst. Ein innovativer iterativer Ansatz für die Partikelauswahl, genannt CryoSieve, verbessert die Qualität der rekonstruierten Dichtekarten erheblich, indem er die Anzahl der Partikel im endgültigen Stapel effektiv reduziert. Experimentelle Beweise zeigen, dass diese Methode die Mehrheit der Partikel in den endgültigen Stapeln eliminieren kann, was zu einer bemerkenswerten Verbesserung der Qualität der Dichtekarten führt. In diesem Artikel wird der detaillierte Workflow dieses Ansatzes beschrieben und seine Anwendung auf ein reales Dataset vorgestellt.
Kryogene Elektronenmikroskopie (Kryo-EM) Die Einzelpartikelanalyse (SPA) hat sich zu einer dominierenden Methode zur Bestimmung hochauflösender dreidimensionaler Dichtekarten biologischer Makromoleküle entwickelt. Aufgrund einer Reihe von technologischen Innovationen 1,2,3,4,5,6, genannt Auflösungsrevolution 7, ist die Kryo-EM in der Lage, die Strukturen biologischer Makromoleküle mit bis zu atomarer Auflösung in einer noch nie dagewesenen Geschwindigkeit zu bestimmen. Dieser Durchbruch markiert den Beginn einer neuen Ära molekularer Erkenntnisse, die die Röntgenkristallographie als vorherrschende Technik ablöste und langjährige biologische Fragen beantwortete.
Die Kryo-EM SPA unterscheidet sich von der Röntgenkristallographie, da sie keine Kristallisation biologischer Makromoleküle erfordert. Stattdessen wird eine Lösung, die die biologischen Zielmakromoleküle enthält, schnell in glasartigem Eis eingefroren. Es wird dann mit einem Elektronenstrahl abgebildet, um eine Reihe von Mikroskopaufnahmen zu erstellen, wobei die Notwendigkeit einer Kristallisationumgeht 8. Anschließend werden Particle-Picking-Algorithmen verwendet, um einzelne Rohpartikel aus diesen Mikroaufnahmen zu extrahieren 4,9,10,11,12. Da die Kryo-EM nicht von der Kristallisation abhängt, ist es natürlich, dass extrahierte Partikel überwiegend beschädigt sind oder sich in unerwünschten Konformationszuständen befinden, was mehrere Partikelauswahlrunden erforderlich macht, um eine hochauflösende Dichtekarte zu erhalten. In der Kryo-EM-SPA-Bildverarbeitung ist die Partikelselektion daher entscheidend für die Erstellung hochauflösender Dichtekarten13.
Zu den Standardmethoden der Partikelauswahl bei der Kryo-EM gehören die zweidimensionale (2D) und die dreidimensionale (3D) Klassifizierung14. Die 2D-Klassifizierung kategorisiert Partikel in eine vordefinierte Anzahl von Gruppen, was zu einem durchschnittlichen Bild und einer geschätzten 2D-Auflösung für jede Klasse führt. Forscher können diese Klassen dann visuell inspizieren und Partikel aus Gruppen mit niedrigerer Auflösung entfernen, um die verbleibenden in Rekonstruktionen zu verwenden, um eine höhere Auflösung zu erreichen. Sobald die Partikelposen mithilfe von Verfeinerungsalgorithmen festgelegt sind, fahren die Forscher mit der 3D-Klassifizierung fort und gruppieren die Partikel in mehrere Klassen. Dies ermöglicht eine visuelle Inspektion der rekonstruierten Dichtekarte für jede Klasse, wodurch unerwünschte Partikel, wie z. B. solche aus unerwünschten Konformationen, ausgeschlossen werden können. Nach mehreren Klassifizierungsrunden wird ein endgültiger Stapel erhalten, der aus relativ hochwertigen Partikeln besteht. Diese finalen Stacks sind maßgeblich an der Erstellung von Dichtekarten mit atomarer oder nahezu atomarer Auflösung beteiligt.
Zhu und ihre Kollegen haben gezeigt, dass auf diesen finalen Stacks15 eine weitere Partikelselektion durchgeführt werden kann. CryoSieve15, eine innovative iterative Methode zur Partikelselektion, kann eingesetzt werden, um die Qualität der endgültigen Dichtekarte zu verbessern, indem die Anzahl der Partikel erheblich reduziert wird. Während andere Kriterien und Software für die Partikelsortierung, wie z. B. die normierte Kreuzkorrelationsmethode (NCC)16, der Angular Graph Consistency (AGC)-Ansatz17 und die Non-Alignment-Klassifizierung5, derzeit in diesem Bereich verwendet werden, hat sich gezeigt, dass diese Methode diese Algorithmen in Bezug auf die Wirksamkeit übertrifft.
In dieser Studie stellen wir Ihnen einen detaillierten Leitfaden für den gesamten Prozess vor. Als Fallstudie haben wir diese neue Methode auf den Datensatz des Influenza-Hämagglutinin-Trimers (EMPIAR-Eintrag: 10097)18 angewendet, der 130.000 Partikel in seinem endgültigen Stapel enthält. Unser Verfahren verwarf erfolgreich etwa 73,8% der Partikel aus dem letzten Stapel dieses Datensatzes, wodurch die Auflösung der rekonstruierten Dichtekarte von 4,11 Å auf 3,62 Å verbessert wurde. Zusätzlich zum Influenza-Hämagglutinin-Trimer werden in der früheren Veröffentlichung15 Ergebnisse aus mehreren Datensätzen vorgestellt, die eine Vielzahl von Auflösungen und Molekulargewichten von Biomolekülen zeigen.
Die Kryo-EM gilt als zentrale Technik zur Aufklärung der Strukturen biologischer Moleküle. In diesem Prozess ist nach der Datenerfassung mittels Mikroskopie die Extraktion von Partikeln aus Mikroskopbildern unerlässlich, gefolgt von deren Klassifizierung in mehreren Schritten, um den endgültigen Stapel zusammenzustellen. Eine häufige Herausforderung ist das Vorherrschen von beschädigten oder unerwünscht konformen Partikeln, was die Notwendigkeit einer wiederholten Partikelauswahl unterstreicht, um hochauflösende Dichtekarten zu erhalten. Dies macht die Partikelauswahl zu einem entscheidenden Schritt in der Kryo-EM-SPA, um qualitativ hochwertige Dichtekarten zu erhalten. Zu den bestehenden Partikelauswahltechniken gehören der statistische Nicht-Kipp-Validierungsalgorithmus22, der auf Z-Scoresbasierende Ansatz 23 und das Verfahren zur Schätzung der Winkelgenauigkeit24.
CryoSieve erweist sich in diesem Zusammenhang als wertvolles Werkzeug, das in der Lage ist, eine beträchtliche Anzahl von Fremdpartikeln aus dem endgültigen Stapel zu eliminieren. Diese Reduzierung erhöht nicht nur die Recheneffizienz der Rekonstruktion, sondern rationalisiert auch den Prozess. Es bietet eine umfassende Suite für die Partikelauswahl, bei der das Ausmaß des Partikelverwurfs und die daraus resultierende Verbesserung der Auflösung weitgehend von der anfänglichen Datenqualität und den bei der Datenverarbeitung verwendeten Methoden abhängen.
In diesem Manuskript haben wir einen vollständigen Arbeitsablauf der Partikelsiebung unter Verwendung des realen Falldatensatzes von Influenza-Hämagglutinin-Trimer vorgestellt (EMPIAR-Eintrag: 10097). Die hier behandelten und diskutierten Schritte können als Partikelsiebung und Neuschätzung der Pose zusammengefasst werden. Das endgültige 3D-rekonstruierte Volumen erreichte eine Auflösung von 3,62 Å, und die Seitenketten in Alpha-Helices waren im nachbearbeiteten Volumen im Vergleich zur veröffentlichten Dichtekarte klarer.
CryoSieve ist eine Open-Source-Methode, die auf GitHub (https://github.com/mxhulab/cryosieve) verfügbar ist. Ein ausführliches Tutorial finden Sie auch auf der Homepage. Benutzer können es installieren und verwenden, indem sie dem Tutorial folgen. Zusätzlich werden zwei Module, cryosieve-csrefine und cryosieve-csrhbfactor, bereitgestellt. Das Modul cryosieve-csrefine wurde speziell entwickelt, um die sequentielle Ausführung verschiedener Vorgänge innerhalb von CryoSPARC zu automatisieren (Ergänzende Datei 5). Zu diesen Vorgängen gehören das Importieren von Partikelstapeln und das Ausführen von Ab-initio-, homogenen oder ungleichmäßigen Verfeinerungsaufträgen. Auf der anderen Seite wurde das Kryosieve-csrhbfactor-Modul entwickelt, um die Bestimmung des Rosenthal-Henderson-B-Faktors zu automatisieren, indem es die Fähigkeiten von cryosieve-csrefine nutzt (Supplementary File 6).
Derzeit ist die Anwendung dieser Methode auf einzelne Konformationsszenarien beschränkt. Folglich sind in Fällen, in denen Partikel mehrere Konformationen darstellen, ihre Fähigkeiten eingeschränkt. Anwendern wird empfohlen, zunächst eine 3D-Klassifizierung durchzuführen, um Partikel unterschiedlicher Konformationen zu trennen, bevor sie sie für eine verfeinerte Partikelauswahl verwenden. Obwohl die Methode in der Lage ist, über 50 % der Partikel aus dem endgültigen Stapel herauszufiltern, bleiben die Herkunft dieser weggeworfenen Partikel und die zugrunde liegenden Gründe für ihren vernachlässigbaren Beitrag zur Rekonstruktionsqualität unklar. Diese Verständnislücke erfordert zusätzliche Forschung, um diese Einschränkung umfassend anzugehen und möglicherweise zu beheben.
Es gibt drei mögliche Methoden der Partikelsortierung oder Partikelsiebung. Zunächst einmal kann cisTEM4 für jedes einzelne Partikelbild nach der 3D-Verfeinerung eine Punktzahl melden. Benutzer können Partikel mithilfe des cisTEM-Scores sortieren, um Partikel zu verwerfen. Der Winkelgraph-Konsistenz-Ansatz (AGC)17 ist auch ein Verfahren zum Verwerfen falsch ausgerichteter Partikel. Darüber hinaus ist die Nichtausrichtungsklassifizierung5 eine traditionelle Methode, um Partikel mithilfe der 3D-Klassifizierung zu verwerfen. Wir verglichen die Qualität der mit diesen Methoden zurückgehaltenen Partikel mit CryoSieve und stellten fest, dass die zurückgehaltenen Partikel von CryoSieve von höherer Qualität sind15. Das hier vorgestellte Verfahren übertrifft alternative Verfahren deutlich und erreicht die geringste Anzahl von Partikeln bei gleicher Auflösung.
Wie das Ergebnis zeigt, trägt die Mehrheit der Partikel in einem Kryo-EM-Endstapel nicht zur Rekonstruktion der Dichtekarte bei. Mit anderen Worten, unter allen Partikeln, die während der Bildaufnahme gesammelt werden, tragen nur einige wenige, nämlich die feinste Teilmenge, tatsächlich zur endgültigen Rekonstruktion bei. Folglich könnte das Verhältnis dieser letzten Teilmenge zur Gesamtzahl der gesammelten Partikel als quantitative Metrik für die Beurteilung der Probenqualität dienen. Je höher dieses Verhältnis, desto besser ist die Probenqualität. Trotz technischer Fortschritte, die die Kryo-EM für Strukturbiologen zugänglicher gemacht haben, bleibt die Probenvorbereitung ein großer Engpass im Arbeitsablauf. Naturwissenschaftler und Ingenieure konzentrieren sich daher auf diese Herausforderung25. Bei der Einzelpartikelanalytik (SPA) besteht die Probenvorbereitung aus zwei entscheidenden Schritten: der Probenoptimierung und der Gittervorbereitung. Ersteres beinhaltet die Reinigung der Probe unter Beibehaltung ihres optimalen biochemischen Zustands. Letzteres beinhaltet die Vorbereitung der Probe für die Analyse im Mikroskop, einschließlich chemischer oder Plasmabehandlung des Gitters, Probenabscheidung und Vitrifizierung. Zahlreiche Techniken wurden vorgeschlagen, um makromolekulare Instabilität zu beheben, aber die Wirksamkeit eines Ansatzes gegenüber einem anderen hängt von den Eigenschaften der Probe ab25,26. Derzeit werden die Ergebnisse der Netzvorbereitung stark von der Expertise und Erfahrung des Benutzers beeinflusst, was den Prozess zeitaufwändig und herausfordernd machen kann27,28. Die zahlreichen Variablen, die bei der Proben- und Gittervorbereitung auftreten, stellen eine Herausforderung bei der Feststellung von Ursache-Wirkungs-Beziehungen dar, da die Forscher die Probe nur auf molekularer Ebene mit dem Mikroskop beurteilen können. Infolgedessen fehlen noch quantitative Statistiken aus Vergleichen verschiedener Proben- und Gittervorbereitungsprotokolle, und ein systematischer Ansatz ist notwendig, um Trends zu untersuchen und die grundlegenden Mechanismen des Probenverhaltens zu verstehen29.
The authors have nothing to disclose.
Diese Arbeit wurde unterstützt von der Shenzhen Academy of Research and Translation (an M.H.), dem Advanced Innovation Center for Structural Biology (an M.H.), dem Beijing Frontier Research Center for Biological Structure (an M.H.), dem National Key R&D Program of China (Nr. 2021YFA1001300) (an C.B.), der National Natural Science Foundation of China (Nr. 12271291) (an C.B.), und die National Natural Science Foundation of China (Nr. 12071244) (an Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |