Een geavanceerde deeltjesselectiemethode voor cryo-EM, namelijk CryoSieve, verbetert de resolutie van de dichtheidskaart door een meerderheid van de deeltjes in de uiteindelijke stapels te verwijderen, zoals aangetoond door de toepassing ervan op een real-world dataset.
In het afgelopen decennium heeft de vooruitgang in technologie en methodologie op het gebied van cryogene elektronenmicroscopie (cryo-EM) single-particle analysis (SPA) onze capaciteit voor structureel onderzoek van biologische macromoleculen met hoge resolutie aanzienlijk verbeterd. Deze vooruitgang heeft een nieuw tijdperk van moleculaire inzichten ingeluid, waarbij röntgenkristallografie wordt vervangen als de dominante methode en antwoorden worden gegeven op al lang bestaande vragen in de biologie. Omdat cryo-EM niet afhankelijk is van kristallisatie, wat een belangrijke beperking is van röntgenkristallografie, vangt het deeltjes van verschillende kwaliteit op. Daarom is de selectie van deeltjes cruciaal, aangezien de kwaliteit van de geselecteerde deeltjes direct van invloed is op de resolutie van de gereconstrueerde dichtheidskaart. Een innovatieve iteratieve benadering voor deeltjesselectie, genaamd CryoSieve, verbetert de kwaliteit van gereconstrueerde dichtheidskaarten aanzienlijk door het aantal deeltjes in de uiteindelijke stapel effectief te verminderen. Experimenteel bewijs toont aan dat deze methode de meerderheid van de deeltjes in de uiteindelijke stapels kan elimineren, wat resulteert in een opmerkelijke verbetering van de kwaliteit van dichtheidskaarten. Dit artikel schetst de gedetailleerde workflow van deze aanpak en toont de toepassing ervan op een real-world dataset.
Cryogene elektronenmicroscopie (cryo-EM) en analyse van enkelvoudige deeltjes (SPA) zijn een dominante methode geworden om driedimensionale dichtheidskaarten met hoge resolutie van biologische macromoleculen te bepalen. Dankzij een reeks technologische innovaties 1,2,3,4,5,6, genaamd resolutierevolutie 7, heeft cryo-EM de mogelijkheid om de structuren van biologische macromoleculen te bepalen met een maximale atomaire resolutie met een ongekende snelheid. Deze doorbraak markeert het begin van een nieuw tijdperk in moleculaire inzichten, waarbij röntgenkristallografie wordt ingehaald als de overheersende techniek en al lang bestaande biologische vragen worden beantwoord.
Cryo-EM SPA wijkt af van röntgenkristallografie door geen kristallisatie van biologische macromoleculen te vereisen. In plaats daarvan wordt een oplossing die de biologische doelmacromoleculen bevat, snel bevroren in glasachtig ijs. Het wordt vervolgens afgebeeld met een elektronenbundel om een reeks microfoto’s te produceren, waarbij de noodzaak van kristallisatie wordt omzeild8. Vervolgens worden algoritmen voor het kiezen van deeltjes gebruikt om individuele ruwe deeltjes uit deze microfoto’s te extraheren 4,9,10,11,12. Aangezien cryo-EM niet afhankelijk is van kristallisatie, is het normaal dat geëxtraheerde deeltjes overwegend beschadigd zijn of zich in ongewenste conformationele toestanden bevinden, waardoor meerdere rondes van deeltjesselectie nodig zijn om een dichtheidskaart met hoge resolutie te verkrijgen. Bij cryo-EM SPA-beeldverwerking is de selectie van deeltjes daarom cruciaal voor het verkrijgen van dichtheidskaarten met hoge resolutie13.
In cryo-EM SPA omvatten de standaard deeltjesselectiemethoden tweedimensionale (2D) en driedimensionale (3D) classificatie14. 2D-classificatie categoriseert deeltjes in een vooraf bepaald aantal groepen, wat een gemiddeld beeld en een geschatte 2D-resolutie voor elke klasse oplevert. Onderzoekers kunnen deze klassen vervolgens visueel inspecteren, waarbij deeltjes uit groepen met een lagere resolutie worden verwijderd om de resterende te gebruiken in reconstructies die gericht zijn op het bereiken van een hogere resolutie. Zodra de deeltjeshoudingen zijn vastgesteld met behulp van verfijningsalgoritmen, zullen onderzoekers doorgaan met 3D-classificatie, waarbij deeltjes in meerdere klassen worden geclusterd. Dit maakt visuele inspectie van de gereconstrueerde dichtheidskaart voor elke klasse mogelijk, waardoor ongewenste deeltjes, zoals die van ongewenste conformaties, kunnen worden uitgesloten. Na meerdere classificatierondes wordt een uiteindelijke stapeling verkregen die bestaat uit deeltjes van relatief hoge kwaliteit. Deze laatste stapels zijn van groot belang voor het produceren van atomaire of bijna-atomaire resolutiedichtheidskaarten.
Zhu en haar collega’s hebben aangetoond dat verdere deeltjesselectie kan worden uitgevoerd op deze laatste stapels15. CryoSieve15, een innovatieve iteratieve methode voor deeltjesselectie, kan worden toegepast om de kwaliteit van de uiteindelijke dichtheidskaart te verbeteren door het aantal deeltjes aanzienlijk te verminderen. Hoewel andere criteria en software voor het sorteren van deeltjes, zoals de genormaliseerde kruiscorrelatie (NCC) methode16, de hoekgrafiekconsistentie (AGC) benadering17 en niet-uitlijning classificatie5, momenteel in gebruik zijn binnen het veld, is aangetoond dat deze methode beter presteert dan deze algoritmen in termen van effectiviteit.
In deze studie presenteren we een gedetailleerde gids voor het hele proces. Als casestudy hebben we deze nieuwe methode toegepast op de dataset van het influenzahemagglutininetrimeer (EMPIAR-invoer: 10097)18, die 130.000 deeltjes in de uiteindelijke stapel bevat. Onze procedure heeft met succes ongeveer 73,8% van de deeltjes uit de uiteindelijke stapel van deze dataset weggegooid, waardoor de resolutie van de gereconstrueerde dichtheidskaart is verbeterd van 4,11 Å naar 3,62 Å. Naast het influenza-hemagglutininetrimeer worden de resultaten van meerdere datasets gepresenteerd in eerdere publicatie15, met een verscheidenheid aan resoluties en molecuulgewichten van biomoleculen.
Cryo-EM staat als een cruciale techniek voor het ophelderen van de structuren van biologische moleculen. In dit proces is, na het verzamelen van gegevens via microscopie, deeltjesextractie uit microfoto’s essentieel, gevolgd door hun classificatie in meerdere fasen om de uiteindelijke stapel samen te stellen. Een veel voorkomende uitdaging is het overwicht van beschadigde of ongewenst gevormde deeltjes, wat de noodzaak onderstreept van herhaalde deeltjesselectie om dichtheidskaarten met hoge resolutie te bereiken. Dit maakt deeltjesselectie een cruciale stap in cryo-EM SPA voor het bereiken van dichtheidskaarten van hoge kwaliteit. Bestaande technieken voor deeltjesselectie zijn onder meer het statistische niet-kantelvalidatie-algoritme22, de op z-score gebaseerde benadering23 en de methode voor het schatten van hoeknauwkeurigheid24.
CryoSieve komt in deze context naar voren als een waardevol hulpmiddel, bedreven in het elimineren van een aanzienlijk aantal externe deeltjes uit de uiteindelijke stapel. Deze reductie verbetert niet alleen de rekenefficiëntie van de reconstructie, maar stroomlijnt ook het proces. Het biedt een uitgebreide suite voor deeltjesselectie, waarbij de mate van deeltjesverwijdering en de daaruit voortvloeiende verbetering van de resolutie grotendeels afhangen van de initiële gegevenskwaliteit en de methodologieën die worden gebruikt bij gegevensverwerking.
In dit manuscript hebben we een volledige workflow van het zeven van deeltjes gepresenteerd met behulp van de echte dataset van influenzahemagglutininetrimeer (EMPIAR-invoer: 10097). De stappen die hier worden behandeld en besproken, kunnen worden samengevat als deeltjeszeven en herschatting van de houding. Het uiteindelijke 3D-gereconstrueerde volume bereikte een resolutie van 3,62 Å, en zijketens in alfa-helices waren duidelijker in het nabewerkte volume in vergelijking met de gepubliceerde dichtheidskaart.
CryoSieve is een open-source methode die beschikbaar is op GitHub (https://github.com/mxhulab/cryosieve). Een gedetailleerde tutorial is ook te vinden op de startpagina. Gebruikers kunnen het installeren en gebruiken door de tutorial te volgen. Daarnaast zijn er twee modules, cryosieve-csrefine en cryosieve-csrhbfactor, beschikbaar. De cryosieve-csrefine-module is speciaal ontworpen om de sequentiële uitvoering van verschillende bewerkingen binnen CryoSPARC (aanvullend bestand 5) te automatiseren. Deze bewerkingen omvatten het importeren van deeltjesstapels en het uitvoeren van ab initio, homogene verfijning of niet-uniforme verfijningstaken. Aan de andere kant is de cryosieve-csrhbfactor-module ontworpen om de bepaling van de Rosenthal-Henderson B-factor te automatiseren door gebruik te maken van de mogelijkheden van cryosieve-csrefine (aanvullend bestand 6).
Momenteel is de toepassing van deze methode beperkt tot enkelvoudige conformatiescenario’s. Bijgevolg zijn hun mogelijkheden beperkt in gevallen waarin deeltjes meerdere conformaties vertegenwoordigen. Gebruikers wordt geadviseerd om in eerste instantie deel te nemen aan 3D-classificatie om deeltjes van ongelijksoortige conformaties te scheiden voordat ze deze gebruiken voor verfijnde deeltjesselectie. Bovendien, hoewel de methode bekwaam is in het filteren van meer dan 50% van de deeltjes uit de uiteindelijke stapel, blijven de oorsprong van deze afgedankte deeltjes en de onderliggende redenen voor hun verwaarloosbare bijdrage aan de reconstructiekwaliteit onduidelijk. Deze lacune in begrip vereist aanvullend onderzoek om deze beperking volledig aan te pakken en mogelijk te corrigeren.
Er zijn drie mogelijke bestaande methoden voor het sorteren of zeven van deeltjes. Allereerst kan cisTEM4 een score rapporteren voor elk afzonderlijk deeltjesbeeld na 3D-verfijning. Gebruikers kunnen deeltjes sorteren met behulp van de cisTEM-score om deeltjes weg te gooien. De hoekgrafiekconsistentie (AGC) benadering17 is ook een methode om verkeerd uitgelijnde deeltjes weg te gooien. Bovendien is de niet-uitlijningsclassificatie5 een traditionele manier om deeltjes weg te gooien met behulp van 3D-classificatie. We vergeleken de kwaliteit van de deeltjes die door deze methoden worden vastgehouden met CryoSieve en ontdekten dat de vastgehouden deeltjes van CryoSieve van hogere kwaliteit zijn15. De hier gepresenteerde methode presteert aanzienlijk beter dan alternatieve methoden en bereikt het kleinste aantal deeltjes met dezelfde resolutie.
Zoals aangetoond in het resultaat, dragen de meeste deeltjes in een cryo-EM eindstapel niet bij aan de reconstructie van de dichtheidskaart. Met andere woorden, van alle deeltjes die tijdens de beeldacquisitie worden verzameld, draagt slechts een select aantal, namelijk de fijnste subset, daadwerkelijk bij aan de uiteindelijke reconstructie. Bijgevolg zou de verhouding van deze uiteindelijke subset tot het totale aantal verzamelde deeltjes kunnen dienen als een kwantitatieve maatstaf voor het beoordelen van de monsterkwaliteit. Hoe hoger deze verhouding, hoe beter de monsterkwaliteit. Ondanks technische vooruitgang die cryo-EM toegankelijker heeft gemaakt voor structurele biologen, blijft monstervoorbereiding een groot knelpunt in de workflow. Wetenschappers en ingenieurs richten hun inspanningen dus op deze uitdaging25. Bij single-particle analysis (SPA) bestaat de monstervoorbereiding uit twee cruciale stappen: monsteroptimalisatie en roostervoorbereiding. De eerste omvat het zuiveren van het monster met behoud van de optimale biochemische toestand. Dit laatste omvat het voorbereiden van het monster voor analyse in de microscoop, inclusief chemische of plasmabehandeling van het rooster, monsterafzetting en vitrificatie. Er zijn tal van technieken voorgesteld om macromoleculaire instabiliteit aan te pakken, maar de doeltreffendheid van de ene benadering ten opzichte van de andere hangt af van de kenmerken van de steekproef25,26. Momenteel worden de resultaten van de voorbereiding van het raster sterk beïnvloed door de expertise en ervaring van de gebruiker, wat het proces tijdrovend en uitdagend kan maken27,28. De talrijke variabelen die worden aangetroffen bij de voorbereiding van monsters en roosters vormen uitdagingen bij het vaststellen van oorzaak-gevolgrelaties, aangezien onderzoekers het monster alleen op moleculair niveau kunnen beoordelen met behulp van de microscoop. Als gevolg hiervan ontbreken kwantitatieve statistieken uit vergelijkingen van verschillende monster- en rastervoorbereidingsprotocollen nog steeds, en is een systematische aanpak nodig om trends te onderzoeken en de fundamentele mechanismen van monstergedrag te begrijpen29.
The authors have nothing to disclose.
Dit werk werd ondersteund door Shenzhen Academy of Research and Translation (naar M.H.), het Advanced Innovation Center for Structural Biology (naar M.H.), het Beijing Frontier Research Center for Biological Structure (naar M.H.), het National Key R&D Program of China (No.2021YFA1001300) (naar C.B.), de National Natural Science Foundation of China (No.12271291) (naar C.B.), en de National Natural Science Foundation of China (nr. 12071244) (naar Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |