Die Einzelpartikelanalyse in der Kryo-Elektronenmikroskopie ist eine der wichtigsten Techniken, um die Struktur biologischer Ensembles mit hoher Auflösung zu bestimmen. Scipion bietet die Werkzeuge, um die gesamte Pipeline zu erstellen, um die vom Mikroskop erfassten Informationen zu verarbeiten und eine 3D-Rekonstruktion der biologischen Probe zu erreichen.
Die Kryo-Elektronenmikroskopie ist zu einem der wichtigsten Werkzeuge in der biologischen Forschung geworden, um die Strukturinformationen von Makromolekülen mit nahezu atomarer Auflösung aufzudecken. Bei der Einzelpartikelanalyse wird die verglaste Probe durch einen Elektronenstrahl abgebildet und die Detektoren am Ende der Mikroskopsäule produzieren Filme dieser Probe. Diese Filme enthalten Tausende von Bildern identischer Partikel in zufälligen Orientierungen. Die Daten müssen einen Bildverarbeitungs-Workflow mit mehreren Schritten durchlaufen, um das endgültige rekonstruierte 3D-Volumen zu erhalten. Ziel des Bildverarbeitungs-Workflows ist es, die Erfassungsparameter zu identifizieren, um die untersuchte Probe rekonstruieren zu können. Scipion stellt alle Werkzeuge zur Verfügung, um diesen Workflow mit mehreren Bildverarbeitungspaketen in einem integrativen Rahmen zu erstellen, was auch die Rückverfolgbarkeit der Ergebnisse ermöglicht. In diesem Artikel wird der gesamte Bildverarbeitungsablauf in Scipion vorgestellt und mit Daten aus einem echten Testfall diskutiert, der alle details enthält, die notwendig sind, um von den vom Mikroskop erhaltenen Filmen zu einer hochauflösenden endgültigen 3D-Rekonstruktion zu gelangen. Außerdem wird die Leistungsfähigkeit der Verwendung von Konsenswerkzeugen diskutiert, die es ermöglichen, Methoden zu kombinieren und Ergebnisse in jedem Schritt des Workflows zu bestätigen, wodurch die Genauigkeit der erhaltenen Ergebnisse verbessert wird.
In der Kryo-Elektronenmikroskopie (Kryo-EM) ist die Einzelpartikelanalyse (SPA) von vitrifizierten gefrorenen hydratisierten Proben eine der am weitesten verbreiteten und erfolgreichsten Varianten der Bildgebung für biologische Makromoleküle, da sie es ermöglicht, molekulare Wechselwirkungen und die Funktion biologischer Ensembles zu verstehen1. Dies ist den jüngsten Fortschritten in dieser Bildgebungstechnik zu verdanken, die zur “Auflösungsrevolution”2 geführt haben und die erfolgreiche Bestimmung biologischer 3D-Strukturen mit nahezu atomarer Auflösung ermöglicht haben. Derzeit betrug die höchste Auflösung, die in SPA-Kryo-EM erreicht wurde, 1,15 Å für Apoferritin3 (EMDB-Eintrag: 11668). Diese technologischen Fortschritte umfassen Verbesserungen in der Probenvorbereitung4, der Bildaufnahme5 und den Bildverarbeitungsmethoden6. Dieser Artikel konzentriert sich auf diesen letzten Punkt.
Kurz gesagt, das Ziel der Bildverarbeitungsmethoden ist es, alle Erfassungsparameter zu identifizieren, um den Bildgebungsprozess des Mikroskops umzukehren und die 3D-Struktur der untersuchten biologischen Probe wiederherzustellen. Diese Parameter sind der Gewinn der Kamera, die strahlinduzierte Bewegung, die Aberrationen des Mikroskops (hauptsächlich die Defokussierung), die 3D-Winkelorientierung und -verschiebung jedes Partikels und der Konformationszustand im Falle einer Probe mit Konformationsänderungen. Die Anzahl der Parameter ist jedoch sehr hoch und Kryo-EM erfordert die Verwendung von niedrig dosierten Bildern, um Strahlenschäden zu vermeiden, was das Signal-Rausch-Verhältnis (SNR) der aufgenommenen Bilder erheblich reduziert. Somit kann das Problem nicht eindeutig gelöst werden und alle zu berechnenden Parameter können nur Schätzungen sein. Entlang des Bildverarbeitungs-Workflows sollten die richtigen Parameter identifiziert und die verbleibenden verworfen werden, um schließlich eine hochauflösende 3D-Rekonstruktion zu erhalten.
Die vom Mikroskop erzeugten Daten werden in Frames gesammelt. Vereinfacht ausgedrückt enthält ein Rahmen die Anzahl der Elektronen, die an einer bestimmten Position (Pixel) im Bild angekommen sind, wenn Elektronenzähldetektoren verwendet werden. In einem bestimmten Sichtfeld werden mehrere Frames gesammelt und dies wird als Film bezeichnet. Da niedrige Elektronendosen verwendet werden, um Strahlenschäden zu vermeiden, die die Probe zerstören könnten, ist der SNR sehr niedrig und die Rahmen, die demselben Film entsprechen, müssen gemittelt werden, um ein Bild zu erhalten, das strukturelle Informationen über die Probe enthüllt. Es wird jedoch nicht nur ein einfacher Mittelwert angewendet, die Probe kann während der Bildgebungszeit aufgrund der strahlinduzierten Bewegung, die kompensiert werden muss, Verschiebungen und andere Arten von Bewegungen erleiden. Die shift-kompensierten und gemittelten Frames stammen aus einer Mikroaufnahme.
Sobald die Mikroaufnahmen erhalten sind, müssen wir die vom Mikroskop für jeden von ihnen eingeführten Aberrationen abschätzen, die als Kontrasttransferfunktion (CTF) bezeichnet werden und die die Änderungen des Kontrasts der Mikroaufnahme als Funktion der Frequenz darstellen. Dann können die Partikel ausgewählt und extrahiert werden, was als Partikelpicking bezeichnet wird. Jedes Partikel sollte ein kleines Bild sein, das nur eine Kopie der untersuchten Probe enthält. Es gibt drei Familien von Algorithmen für die Partikelauswahl: 1) diejenigen, die nur eine grundlegende Parametrisierung des Aussehens des Partikels verwenden, um sie in der gesamten Menge von Mikroaufnahmen (z. B. Partikelgröße) zu finden, 2) diejenigen, die lernen, wie die Partikel vom Benutzer oder einem vortrainierten Satz aussehen, und 3) diejenigen, die Bildvorlagen verwenden. Jede Familie hat unterschiedliche Eigenschaften, die später angezeigt werden.
Der extrahierte Satz von Partikeln, die in den Mikroaufnahmen gefunden wurden, wird in einem 2D-Klassifizierungsprozess verwendet, der zwei Ziele verfolgt: 1) Reinigung des Partikelsatzes durch Verwerfen der Teilmenge, die reine Rauschbilder, überlappende Partikel oder andere Artefakte enthält, und 2) die gemittelten Partikel, die jede Klasse darstellen, könnten als Ersteinformation zur Berechnung eines 3D-Anfangsvolumens verwendet werden.
Die 3D-Anfangsvolumenberechnung ist der nächste entscheidende Schritt. Das Problem, die 3D-Struktur zu erhalten, kann als Optimierungsproblem in einer mehrdimensionalen Lösungslandschaft angesehen werden, in der das globale Minimum das beste 3D-Volumen ist, das die ursprüngliche Struktur darstellt, aber mehrere lokale Minima, die suboptimale Lösungen darstellen, gefunden werden können und wo es sehr leicht ist, gefangen zu werden. Das Anfangsvolumen stellt den Ausgangspunkt für den Suchprozess dar, so dass eine schlechte anfängliche Volumenschätzung uns daran hindern könnte, das globale Minimum zu finden. Vom Anfangsvolumen aus hilft ein 3D-Klassifikationsschritt, verschiedene Konformationszustände zu entdecken und den Partikelsatz erneut zu reinigen. Ziel ist es, eine strukturell homogene Population von Partikeln zu erhalten. Danach ist ein 3D-Verfeinerungsschritt dafür verantwortlich, die Winkel- und Translationsparameter für jedes Partikel zu verfeinern, um das bestmögliche 3D-Volumen zu erhalten.
Schließlich kann in den letzten Schritten die erhaltene 3D-Rekonstruktion geschärft und poliert werden. Das Schärfen ist ein Prozess der Steigerung der hohen Frequenzen des rekonstruierten Volumens, und das Polieren ist ein Schritt, um einige Parameter wie CTF oder strahlinduzierte Bewegungskompensation auf der Ebene von Partikeln weiter zu verfeinern. Außerdem könnten einige Validierungsverfahren verwendet werden, um die erreichte Auflösung am Ende des Workflows besser zu verstehen.
Nach all diesen Schritten werden die Tracing- und Docking-Prozesse7 dazu beitragen, der erhaltenen 3D-Rekonstruktion eine biologische Bedeutung zu verleihen, indem atomare Modelle de novo gebaut oder bestehende Modelle angepasst werden. Wenn eine hohe Auflösung erreicht wird, werden uns diese Prozesse die Positionen der biologischen Strukturen, sogar der verschiedenen Atome, in unserer Struktur mitteilen.
Scipion8 ermöglicht es, den gesamten Workflow zu erstellen und die relevantesten Bildverarbeitungspakete auf integrative Weise zu kombinieren. Xmipp9, Relion10, CryoSPARC11, Eman12, Spider13, Cryolo14, Ctffind15, CCP416, Phenix17 und viele weitere Pakete können in Scipion enthalten sein. Darüber hinaus enthält es alle notwendigen Werkzeuge, um die Integration, Interoperabilität, Rückverfolgbarkeit und Reproduzierbarkeit zu unterstützen, um eine vollständige Verfolgung des gesamten Bildverarbeitungs-Workflows zu ermöglichen8.
Eines der mächtigsten Werkzeuge, die Scipion uns ermöglicht, ist der Konsens, was bedeutet, die Ergebnisse mit mehreren Methoden in einem Schritt der Verarbeitung zu vergleichen und eine Kombination der durch verschiedene Methoden vermittelten Informationen zu erstellen, um eine genauere Ausgabe zu erzeugen. Dies könnte dazu beitragen, die Leistung zu steigern und die erreichte Qualität in den geschätzten Parametern zu verbessern. Beachten Sie, dass ein einfacherer Workflow ohne die Verwendung von Konsensmethoden erstellt werden kann. Wir haben jedoch die Leistungsfähigkeit dieses Tools gesehen22,25 und der in diesem Manuskript vorgestellte Workflow wird es in mehreren Schritten verwenden.
Alle Schritte, die in den vorherigen Absätzen zusammengefasst wurden, werden im folgenden Abschnitt ausführlich erläutert und mit Scipion in einem kompletten Workflow zusammengefasst. Außerdem wird gezeigt, wie die Konsensus-Tools verwendet werden können, um eine höhere Übereinstimmung in den generierten Ergebnissen zu erzielen. Dazu wurde der Beispieldatensatz des Plasmodium falciparum 80S Ribosoms ausgewählt (EMPIAR-Eintrag: 10028, EMDB-Eintrag: 2660). Der Datensatz besteht aus 600 Filmen mit 16 Bildern der Größe 4096×4096 Pixel bei einer Pixelgröße von 1,34 Å, die an einer FEI POLARA 300 mit einer FEI FALCON II-Kamera aufgenommen wurden, wobei die gemeldete Auflösung bei EMDB 3,2 Å18 beträgt.
Derzeit ist Kryo-EM ein Schlüsselwerkzeug, um die 3D-Struktur biologischer Proben aufzudecken. Wenn gute Daten mit dem Mikroskop gesammelt werden, können wir mit den verfügbaren Verarbeitungswerkzeugen eine 3D-Rekonstruktion des untersuchten Makromoleküls erhalten. Die Kryo-EM-Datenverarbeitung ist in der Lage, eine nahezu atomare Auflösung zu erreichen, die für das Verständnis des funktionellen Verhaltens eines Makromoleküls von entscheidender Bedeutung ist und auch für die Wirkstoffforschung von entscheidender Bedeutung ist.
Scipion ist eine Software, die es ermöglicht, den gesamten Workflow zu erstellen und die relevantesten Bildverarbeitungspakete auf integrative Weise zu kombinieren, was die Rückverfolgbarkeit und Reproduzierbarkeit des gesamten Bildverarbeitungsworkflows unterstützt. Scipion bietet einen sehr vollständigen Satz von Werkzeugen, um die Verarbeitung durchzuführen; Die Erzielung hochauflösender Rekonstruktionen hängt jedoch vollständig von der Qualität der erfassten Daten und der Art und Weise ab, wie diese Daten verarbeitet werden.
Um eine hochauflösende 3D-Rekonstruktion zu erhalten, ist die erste Voraussetzung, gute Filme aus dem Mikroskop zu erhalten, die strukturelle Informationen auf hoher Auflösung erhalten. Ist dies nicht der Fall, kann der Workflow keine hochauflösenden Informationen aus den Daten extrahieren. Dann sollte ein erfolgreicher Verarbeitungsworkflow in der Lage sein, Partikel zu extrahieren, die wirklich der Struktur entsprechen, und die Orientierungen dieser Partikel im 3D-Raum zu finden. Wenn einer der Schritte im Workflow fehlschlägt, verschlechtert sich die Qualität des rekonstruierten Volumes. Scipion ermöglicht die Verwendung verschiedener Pakete in jedem der Verarbeitungsschritte, was dazu beiträgt, den am besten geeigneten Ansatz zur Verarbeitung der Daten zu finden. Darüber hinaus können dank der Verfügbarkeit vieler Pakete Konsenswerkzeuge verwendet werden, die die Genauigkeit erhöhen, indem sie eine Übereinstimmung in den geschätzten Ergebnissen verschiedener Methoden finden. Außerdem wurden im Abschnitt Repräsentative Ergebnisse mehrere Validierungstools ausführlich diskutiert und wie man genaue und ungenaue Ergebnisse in jedem Schritt des Workflows identifiziert, potenzielle Probleme erkennt und versucht, sie zu lösen. Es gibt mehrere Prüfpunkte entlang des Protokolls, die helfen können zu erkennen, ob das Protokoll ordnungsgemäß ausgeführt wird oder nicht. Einige der relevantesten sind: Kommissionierung, 2D-Klassifizierung, anfängliche Volumenschätzung und 3D-Ausrichtung. Das Überprüfen der Eingaben, das Wiederholen des Schritts mit einer anderen Methode oder das Verwenden eines Konsenses sind Optionen, die in Scipion verfügbar sind, mit denen der Benutzer Lösungen finden kann, wenn Probleme auftreten.
In Bezug auf die bisherigen Ansätze zur Paketintegration im Cryo-EM-Bereich ist Appion31 der einzige, der eine echte Integration verschiedener Softwarepakete ermöglicht. Appion ist jedoch eng mit Leginon32 verbunden, einem System zur automatisierten Erfassung von Elektronenmikroskopen. Der Hauptunterschied zu Scipion besteht darin, dass Datenmodell und Speicher weniger gekoppelt sind. Um ein neues Protokoll in Scipion zu erstellen, muss nur ein Python-Skript entwickelt werden. In Appion muss der Entwickler jedoch das Skript schreiben und die zugrunde liegende Datenbank ändern. Zusammenfassend lässt sich sagen, dass Scipion entwickelt wurde, um die Wartung und Erweiterbarkeit zu vereinfachen.
Wir haben in diesem Manuskript einen vollständigen Workflow für die Kryo-EM-Verarbeitung vorgestellt, der den realen Falldatensatz des Plasmodium falciparum 80S Ribosoms (EMPIAR-Eintrag: 10028, EMDB-Eintrag: 2660) verwendet. Die hier behandelten und diskutierten Schritte können als Filmausrichtung, CTF-Schätzung, Partikelauswahl, 2D-Klassifizierung, anfängliche Kartenschätzung, 3D-Klassifizierung, 3D-Verfeinerung, Bewertung und Nachbearbeitung zusammengefasst werden. Verschiedene Pakete wurden verwendet und Konsensus-Tools wurden in mehreren dieser Schritte angewendet. Das endgültige rekonstruierte 3D-Volumen erreichte eine Auflösung von 3 Å und im nachbearbeiteten Volumen können einige Sekundärstrukturen unterschieden werden, wie Alpha-Helices, was hilft zu beschreiben, wie Atome im Raum angeordnet sind.
Der in diesem Manuskript vorgestellte Workflow zeigt, wie Scipion verwendet werden kann, um verschiedene Cryo-EM-Pakete auf einfache und integrative Weise zu kombinieren, um die Verarbeitung zu vereinfachen und gleichzeitig ein zuverlässigeres Ergebnis zu erzielen.
In Zukunft wird die Entwicklung neuer Methoden und Pakete weiter wachsen und Software wie Scipion, um sie alle einfach zu integrieren, wird für die Forscher noch wichtiger sein. Konsensansätze werden auch dann relevanter sein, wenn viele Methoden mit unterschiedlicher Basis zur Verfügung stehen werden, die dazu beitragen, genauere Schätzungen aller Parameter zu erhalten, die am Rekonstruktionsprozess in Cryo-EM beteiligt sind. Tracking und Reproduzierbarkeit sind der Schlüssel im Forschungsprozess und dank eines gemeinsamen Frameworks für die Ausführung kompletter Workflows mit Scipion einfacher zu erreichen.
The authors have nothing to disclose.
Die Autoren danken der wirtschaftlichen Unterstützung von: Dem spanischen Ministerium für Wissenschaft und Innovation durch Zuschüsse: PID2019-104757RB-I00/AEI/10.13039/501100011033, der “Comunidad Autónoma de Madrid” durch Zuschuss: S2017/BMD-3817, Instituto de Salud Carlos III, PT17/0009/0010 (ISCIII-SGEFI/EFRE), Europäische Union (EU) und Horizon 2020 durch Zuschuss: INSTRUCT – ULTRA (INFRADEV-03-2016-2017, Vorschlag: 731005), EOSC Life (INFRAEOSC-04-2018, Vorschlag: 824087), iNEXT – Discovery (Vorschlag: 871037) und HighResCells (ERC – 2018 – SyG, Vorschlag: 810057). Das Projekt, das zu diesen Ergebnissen führte, wurde von der Stiftung “la Caixa” (ID 100010434) mit einem Stipendium unterstützt. Der Stipendiencode lautet LCF/BQ/DI18/11660021. Dieses Projekt wurde aus dem Forschungs- und Innovationsprogramm Horizon 2020 der Europäischen Union im Rahmen der Marie-Skłodowska-Curie-Finanzhilfevereinbarung Nr. 713673 gefördert. Die Autoren würdigen die Unterstützung und den Einsatz von Ressourcen von Instruct, einem Landmark ESFRI-Projekt.