Summary

Verbetering van dichtheidskaarten door het verwijderen van de meerderheid van de deeltjes in de uiteindelijke stapels van cryogene elektronenmicroscopie met één deeltje

Published: May 10, 2024
doi:

Summary

Een geavanceerde deeltjesselectiemethode voor cryo-EM, namelijk CryoSieve, verbetert de resolutie van de dichtheidskaart door een meerderheid van de deeltjes in de uiteindelijke stapels te verwijderen, zoals aangetoond door de toepassing ervan op een real-world dataset.

Abstract

In het afgelopen decennium heeft de vooruitgang in technologie en methodologie op het gebied van cryogene elektronenmicroscopie (cryo-EM) single-particle analysis (SPA) onze capaciteit voor structureel onderzoek van biologische macromoleculen met hoge resolutie aanzienlijk verbeterd. Deze vooruitgang heeft een nieuw tijdperk van moleculaire inzichten ingeluid, waarbij röntgenkristallografie wordt vervangen als de dominante methode en antwoorden worden gegeven op al lang bestaande vragen in de biologie. Omdat cryo-EM niet afhankelijk is van kristallisatie, wat een belangrijke beperking is van röntgenkristallografie, vangt het deeltjes van verschillende kwaliteit op. Daarom is de selectie van deeltjes cruciaal, aangezien de kwaliteit van de geselecteerde deeltjes direct van invloed is op de resolutie van de gereconstrueerde dichtheidskaart. Een innovatieve iteratieve benadering voor deeltjesselectie, genaamd CryoSieve, verbetert de kwaliteit van gereconstrueerde dichtheidskaarten aanzienlijk door het aantal deeltjes in de uiteindelijke stapel effectief te verminderen. Experimenteel bewijs toont aan dat deze methode de meerderheid van de deeltjes in de uiteindelijke stapels kan elimineren, wat resulteert in een opmerkelijke verbetering van de kwaliteit van dichtheidskaarten. Dit artikel schetst de gedetailleerde workflow van deze aanpak en toont de toepassing ervan op een real-world dataset.

Introduction

Cryogene elektronenmicroscopie (cryo-EM) en analyse van enkelvoudige deeltjes (SPA) zijn een dominante methode geworden om driedimensionale dichtheidskaarten met hoge resolutie van biologische macromoleculen te bepalen. Dankzij een reeks technologische innovaties 1,2,3,4,5,6, genaamd resolutierevolutie 7, heeft cryo-EM de mogelijkheid om de structuren van biologische macromoleculen te bepalen met een maximale atomaire resolutie met een ongekende snelheid. Deze doorbraak markeert het begin van een nieuw tijdperk in moleculaire inzichten, waarbij röntgenkristallografie wordt ingehaald als de overheersende techniek en al lang bestaande biologische vragen worden beantwoord.

Cryo-EM SPA wijkt af van röntgenkristallografie door geen kristallisatie van biologische macromoleculen te vereisen. In plaats daarvan wordt een oplossing die de biologische doelmacromoleculen bevat, snel bevroren in glasachtig ijs. Het wordt vervolgens afgebeeld met een elektronenbundel om een reeks microfoto’s te produceren, waarbij de noodzaak van kristallisatie wordt omzeild8. Vervolgens worden algoritmen voor het kiezen van deeltjes gebruikt om individuele ruwe deeltjes uit deze microfoto’s te extraheren 4,9,10,11,12. Aangezien cryo-EM niet afhankelijk is van kristallisatie, is het normaal dat geëxtraheerde deeltjes overwegend beschadigd zijn of zich in ongewenste conformationele toestanden bevinden, waardoor meerdere rondes van deeltjesselectie nodig zijn om een dichtheidskaart met hoge resolutie te verkrijgen. Bij cryo-EM SPA-beeldverwerking is de selectie van deeltjes daarom cruciaal voor het verkrijgen van dichtheidskaarten met hoge resolutie13.

In cryo-EM SPA omvatten de standaard deeltjesselectiemethoden tweedimensionale (2D) en driedimensionale (3D) classificatie14. 2D-classificatie categoriseert deeltjes in een vooraf bepaald aantal groepen, wat een gemiddeld beeld en een geschatte 2D-resolutie voor elke klasse oplevert. Onderzoekers kunnen deze klassen vervolgens visueel inspecteren, waarbij deeltjes uit groepen met een lagere resolutie worden verwijderd om de resterende te gebruiken in reconstructies die gericht zijn op het bereiken van een hogere resolutie. Zodra de deeltjeshoudingen zijn vastgesteld met behulp van verfijningsalgoritmen, zullen onderzoekers doorgaan met 3D-classificatie, waarbij deeltjes in meerdere klassen worden geclusterd. Dit maakt visuele inspectie van de gereconstrueerde dichtheidskaart voor elke klasse mogelijk, waardoor ongewenste deeltjes, zoals die van ongewenste conformaties, kunnen worden uitgesloten. Na meerdere classificatierondes wordt een uiteindelijke stapeling verkregen die bestaat uit deeltjes van relatief hoge kwaliteit. Deze laatste stapels zijn van groot belang voor het produceren van atomaire of bijna-atomaire resolutiedichtheidskaarten.

Zhu en haar collega’s hebben aangetoond dat verdere deeltjesselectie kan worden uitgevoerd op deze laatste stapels15. CryoSieve15, een innovatieve iteratieve methode voor deeltjesselectie, kan worden toegepast om de kwaliteit van de uiteindelijke dichtheidskaart te verbeteren door het aantal deeltjes aanzienlijk te verminderen. Hoewel andere criteria en software voor het sorteren van deeltjes, zoals de genormaliseerde kruiscorrelatie (NCC) methode16, de hoekgrafiekconsistentie (AGC) benadering17 en niet-uitlijning classificatie5, momenteel in gebruik zijn binnen het veld, is aangetoond dat deze methode beter presteert dan deze algoritmen in termen van effectiviteit.

In deze studie presenteren we een gedetailleerde gids voor het hele proces. Als casestudy hebben we deze nieuwe methode toegepast op de dataset van het influenzahemagglutininetrimeer (EMPIAR-invoer: 10097)18, die 130.000 deeltjes in de uiteindelijke stapel bevat. Onze procedure heeft met succes ongeveer 73,8% van de deeltjes uit de uiteindelijke stapel van deze dataset weggegooid, waardoor de resolutie van de gereconstrueerde dichtheidskaart is verbeterd van 4,11 Å naar 3,62 Å. Naast het influenza-hemagglutininetrimeer worden de resultaten van meerdere datasets gepresenteerd in eerdere publicatie15, met een verscheidenheid aan resoluties en molecuulgewichten van biomoleculen.

Protocol

1. Installatie Controleer en configureer de GPU-versnellingsomgevingOpen de terminal en voer de opdracht in: nvidia-smi. Zorg ervoor dat de opdracht alle informatie over de GPU-kaart(en) weergeeft en dat de CUDA-versie hoger is dan 10.2. Voer het commando uit: conda -V om te controleren of Conda is geïnstalleerd (aanvullende afbeelding 1). Virtuele omgeving configurerenVoer de volgende opdracht in om de virtuele omgeving in te stellen en vervang CRYOSIEVE_ENV door de gewenste omgevingsnaam: conda create -n CRYOSIEVE_ENV python=3.8 cudatoolkit=10.2 cupy=10.0 pytorch=1.10 -c pytorch -c conda-forge. Wacht een paar minuten totdat de omgeving met succes is geconfigureerd (aanvullende afbeelding 2).OPMERKING: Gebruikers hebben de flexibiliteit om de naam van de omgeving naar behoefte te wijzigen. De verstrekte opdracht is specifiek voor CUDA 10.2. Als een andere CUDA-versie gewenst is, pas dan het versienummer voor cudatoolkit aan. Installeer CryoSieveActiveer de omgeving door het commando uit te voeren: conda activeer CRYOSIEVE_ENV. Installeer de software door het volgende uit te voeren: pip install cryosieve of conda install -c mxhulab cryosieve (aanvullende afbeelding 3). Voer cryosieve -h in en zorg ervoor dat de hulpinformatie correct wordt weergegeven (aanvullende afbeelding 4). 2. Deeltjes zeven Haal de gegevens opDownload de EMPIAR-10097 final stack dataset van EMPIAR (zie Materiaaltabel). Download het sterbestand, het maskerbestand (mask.mrc) en het initiële model (voor de herschattingsstap; initial.mrc) van Github (zie Materiaaltabel). Plaats al deze bestanden samen in een map (aanvullende figuur 5).OPMERKING: De repository op https://github.com/mxhulab/cryosieve-demos maakt gebruik van Git Large File Storage (Git LFS). Het installeren van Git LFS is essentieel voor het klonen van de hele repository. U kunt het bestand ook openen via de GitHub-link en op de knop Raw-bestand downloaden klikken om een afzonderlijk bestand te downloaden. Proces deeltjeszeefOpen de terminal en gebruik het commando: cd FILEPATH om naar de map te navigeren waar de dataset zich bevindt. Activeer de Conda-omgeving door: conda activeer CRYOSIEVE_ENV. Voer het volgende commando in om ons experiment met het zeven van deeltjes te starten: cryozeef –reconstruct_software relion_reconstruct –postprocess_software relion_postprocess –i T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star –o output/ –mask mask.mrc –angpix 1.3099979 –num_iters 10 –frequency_start 40 –frequency_end 3 –retention_ratio 0.8 –sym C3 –num_gpus 1 –balans (aanvullende figuur 5). Tijdens de uitvoering geeft de terminal de uitvoerlogboeken voor elke iteratie weer.OPMERKING: Gedetailleerde instructies voor elke optie zijn te vinden in aanvullend bestand 1. De verwerkingstijd en de minimumvereisten voor uitvoering worden gedetailleerd beschreven in aanvullend dossier 2. T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star werd verfijnd door CryoSPARC van T40_HA_130K-Equalized_run-data.star (gedownload van EMPIAR) om de effecten te verzachten die worden veroorzaakt door vooruitgang in oriëntatieschattingstechnieken. 3. Het vinden van de optimale iteratie Resoluties controlerenGebruik het commando: grep “+ FINAL RESOLUTION:” output/_postprocess*.txt om resolutieresultaten af te drukken voor de 10 iteraties van zeven (Figuur 1). Aangezien de deeltjesstapel die in de 7eiteratie wordt gefilterd de hoogste resolutie heeft met de minste deeltjes, zal deze waarschijnlijk het optimale resultaat opleveren.OPMERKING: Om onbedoelde informatieoverdracht van weggegooide naar achtergebleven deeltjes15 te voorkomen en om ervoor te zorgen dat de deeltjesstapel die de 7e iteratie plaatst inderdaad optimaal is, moeten gebruikers een herschattingsstap uitvoeren voor iteraties in de buurt. In dit protocol worden iteraties 4, 5, 6, 7 en 8 ter verificatie onderworpen. Gezeefde deeltjes importerenOpen de CryoSPARC-webinterface en volg deze stappen: Voer een werkruimte in en klik op de knop Builder rechtsboven in het paneel. Selecteer en klik in het paneel op de optie Deeltjesstapel importeren . Geef in de sectie Parameters van het deelvenster Deeltjesstapel importeren het metapad van het deeltje op als het _iter{n}.star-bestand dat zich bevindt in de uitvoermap van de voltooide resultaten en het deeltjesgegevenspad naar de map waarin het mrcs-bestand is opgeslagen. Klik op de knop Taak in wachtrij plaatsen en klik vervolgens op de knop Wachtrij om het proces te starten. Gebruik dezelfde manier om de resterende iteraties te importeren die opnieuw moeten worden geschat (aanvullende afbeelding 6A). Initieel model importerenKlik op de knop Builder in de rechterbovenhoek van het paneel. Selecteer en klik in het paneel op de optie 3D-volumes importeren . Geef het pad voor volumegegevens op als het bestand initial.mrc. Klik op de knop Wachtrijtaak en klik vervolgens op de knop Wachtrij om het proces te starten (aanvullende afbeelding 6B).OPMERKING: Het initiële model kan ook worden gegenereerd door middel van ab initio-reconstructie (aanvullend bestand 3). Homogene verfijning (Bouwtaak)Klik op de knop Builder in de rechterbovenhoek van het paneel. Selecteer en klik in het paneel op de optie Homogene verfijning .OPMERKING: Niet-uniforme verfijning is ook van toepassing. Homogene verfijning (Importdeeltjes)Open in het hoofdpaneel aan de linkerkant de taak voor het importeren van de deeltjesstapel van de 5eiteratie (of de gewenste iteratie). Sleep de module met geïmporteerde deeltjes vanaf de rechterkant van het hoofdpaneel en zet deze neer in de sectie Deeltjesstapels van de Builder aan de rechterkant. Sluit de taak Import Particle Stack door op de rode X in de rechterbovenhoek van het hoofdpaneel te klikken. Open de taak voor het importeren van 3D-volumes. Sleep de module voor geïmporteerde volumes vanaf de rechterkant van het hoofdpaneel en plaats deze in de sectie Initieel volume van de Builder aan de rechterkant. Homogene verfijning (Wijzig de parameters)Zoek onder de vouw Parameters de optie Symmetrie en stel deze in op C3. Zoek de optie GS split geforceerd opnieuw uitvoeren en schakel deze uit. Klik op de knop Wachtrijtaak en klik vervolgens op de knop Wachtrij om de homogene verfijning te starten. Voer homogene verfijning uit voor de resterende iteraties met behulp van dezelfde methode (aanvullende figuur 6C-D).OPMERKING: De optie GS-splitsing geforceerd opnieuw uitvoeren is van cruciaal belang. Het uitschakelen van deze optie zorgt ervoor dat CryoSPARC de gouden standaard splitsing behoudt die door het sterbestand wordt gegeven, waardoor overfitting wordt vermeden. Een gedetailleerde reden voor het uitschakelen van Force Re-do GS Split is te vinden in aanvullend bestand 4. Wacht tot alle taken zijn voltooid om de resultaten te verkrijgen. Op basis van de resultaten wordt bevestigd dat de deeltjesstapel die in de 6e iteratie is gefilterd, het werkelijke optimale resultaat is.OPMERKING: Het is normaal dat de verkregen resultaten kleine willekeurige afwijkingen vertonen van de resultaten in dit protocol. Deze afwijkingen hebben geen invloed op de algemene conclusie.

Representative Results

In dit protocol hebben we de dataset van influenzahemagglutininetrimeer (EMPIAR-invoer: 10097) gebruikt als een demonstratie van de werkzaamheid van dit proces. Vanwege de voorkeursoriëntatie van het monster vereiste de gegevensverzameling een kanteling van 40°. Het eiwit vertoont C3-symmetrie en heeft een molecuulgewicht van 150 kDa. We hebben het eerder beschreven protocol geïmplementeerd om de uiteindelijke deeltjesstapel te verwerken. Het verwijderde geleidelijk 20% van de deeltjes in elke iteratie, wat resulteerde in een retentieratio van 80,0%, 64,0%, 51,2% enzovoort. Zoals weergegeven in figuur 1 en figuur 2, verbeterde de resolutie van de vastgehouden deeltjes aanvankelijk, maar nam uiteindelijk af. Van de iteraties werd de 6eiteratie geïdentificeerd als de meest optimale subset, met de minste deeltjes en toch met de hoogste resolutie. Ons algoritme heeft met succes een subset van deeltjes geïdentificeerd die slechts 26,2% van de oorspronkelijke stapel uitmaakten, wat resulteerde in een verbeterde resolutie van 4,19 Å tot 3,62 Å (opnieuw geschat door CryoSPARC), weergegeven in figuur 2. Verder werden dichtheidskaarten voor en na het gebruik van CryoSieve vergeleken in Figuur 3. Model-to-map Fourier Shell Correlation (FSC) curve en half-maps FSC-curve van de gereconstrueerde dichtheidskaarten voor en na de methode worden ook getoond (Figuur 3A-B). Ruwe dichtheidskaarten en verkregen scherpe dichtheidskaarten werden ook vergeleken, waarbij het equivalente contourniveau werd toegepast (figuur 3C). De zijketens van scherpe dichtheidskaarten werden vergeleken, wat de verbetering van gereconstrueerde dichtheidskaarten liet zien. De geschatte Rosenthal-Henderson B-factor werd ook aangenomen voor de criteria van deeltjeskwaliteit19. Na het verwijderen van de meerderheid van de deeltjes in de uiteindelijke stapel, steeg de Rosenthal-Henderson B-factor van 226,9 Å2 naar 146,2 Å2 (Figuur 3D). Lokale resolutie, lokale B-factor20 en ResLog21 werden ook gebruikt voor vergelijking, wat aangeeft dat CryoSieve inderdaad zowel de kwaliteit van de dichtheidskaarten als de deeltjes verbetert (Figuur 4).  Figuur 1: Resoluties van elke iteratie. Resoluties die zijn gemeld, zijn gemarkeerd in rode vakken. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 2: Resoluties van elke iteratie. Resoluties die worden geïdentificeerd door homogene verfijningstaken, worden gemarkeerd in rode vakken. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 3: Dichtheidskaarten. (A) Vergelijking van model-to-map FSC-curve van gereconstrueerde dichtheidskaarten voor en na gebruik van CryoSieve. De y-as staat voor FSC, terwijl de x-as staat voor resolutie. De rode stippellijn markeert de drempel van 0,5 voor de FSC. De verticale stippellijn illustreert de resolutie van de dichtheidskaarten die zijn verkregen onder een drempel van 0,5. (B) Halve kaarten FSC-curve werden verkregen uit gereconstrueerde dichtheidskaarten voor en na het gebruik van CryoSieve via CryoSPARC. De y-as staat voor FSC, terwijl de x-as staat voor resolutie. (C) Ruwe dichtheidskaarten en scherpe dichtheidskaarten werden getoond voor zowel de CryoSieve-behouden deeltjes als de volledige set deeltjes in de uiteindelijke stapels. Het equivalente contourniveau van 0,65 werd toegepast voor ruwe dichtheidskaarten. Het equivalente contourniveau van 0,84 werd toegepast voor kaarten met scherpe dichtheid. Scherpe dichtheidskaarten werden rechtstreeks verkregen door CryoSPARC. De kaarten met scherpe dichtheid werden automatisch nabewerkt, eerst FSC-gewogen (gebaseerd op FSC’s gegeven door CryoSPARC). Vervolgens werd de B-factor aangescherpt met behulp van de automatisch bepaalde B-factoren (232,0 Å2 voor alle deeltjes in de uiteindelijke stapel en 160,8 Å2 voor CryoSieve). De zijketens in de kaarten met scherpe dichtheid werden vergeleken, waarbij atomaire modellen ter referentie werden gebruikt. Rode pijlen markeren de verbeterde regio’s. (D) De geschatte Rosenthal-Henderson B-factor werd getoond voor zowel de CryoSieve-behouden deeltjes als de volledige set deeltjes in de uiteindelijke stapels. De y-as vertegenwoordigt het aantal gebruikte deeltjes en de x-as vertegenwoordigt het omgekeerde van het kwadraat van de resolutie. Van boven naar beneden beweegt elk punt de helft van de deeltjes van het vorige. De resoluties werden bepaald door verfijning. B-factoren werden bepaald met behulp van een kleinste-kwadratenbenadering van de gemeten punten, zoals weergegeven door de pascurves. De geschatte B-factoren van Rosenthal en Henderson worden aangegeven in de legendes: oranje staat voor deeltjes die door CryoSieve worden vastgehouden, terwijl blauw alle deeltjes in de uiteindelijke stapel aangeeft. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 4: Vergelijking van verschillende metrieken van dichtheidskaarten. (A) Vergelijking van lokale resolutiekaarten voor en na het gebruik van CryoSieve verkregen door CryoSPARC. De lokale resolutie varieert tussen 7 Å (rood) en 3,5 Å (blauw). (B) Vergelijking van dichtheidskaarten voor en na gebruik van CryoSieve, gekleurd met de lokale B-factorkaart verkregen door LocBFactor met een resolutiebereik van [20-3.5] Å. (C), Vergelijking van ResLog-plots voor en na gebruik van CryoSieve verkregen door CryoSPARC. Klik hier om een grotere versie van deze figuur te bekijken. Aanvullende afbeelding 1: Commando’s nvidia-smi en conda -V gebruiken om de vereisten te verifiëren. Als aan de vereisten is voldaan, wordt bij het typen van de opdracht nvidia-smi de GPU-driverversie, de CUDA-versie en de status van de GPU-kaarten weergegeven. Op dezelfde manier zou het invoeren van het commando conda -V de geïnstalleerde versie van Conda correct moeten weergeven. Klik hier om dit bestand te downloaden. Aanvullende figuur 2: Het proces van het creëren van nieuwe GPU-versnellingsomgevingen. Het scherm geeft de uitvoer weer die is gegenereerd door de opdracht die is gebruikt om de Conda-omgeving te maken. Klik hier om dit bestand te downloaden. Aanvullende figuur 3: Installatie van CryoSieve in de GPU-versnellingsomgeving. Na het activeren van de nieuw gecreëerde Conda-omgeving, toont het scherm de output die het resultaat is van het uitvoeren van de opdracht om CryoSieve te installeren met behulp van Pip. Klik hier om dit bestand te downloaden. Aanvullende afbeelding 4: Help-informatie. Klik hier om dit bestand te downloaden. Aanvullende afbeelding 5: Lopend proces. Bij het uitvoeren van CryoSieve via de opdrachtregel, geeft het scherm informatie weer over het lopende proces. Klik hier om dit bestand te downloaden. Aanvullende figuur 6: De configuratie van de taken van CryoSPARC. (A) Deeltjesstapel importeren. (B) Importeer 3D-volumes. (C-D) Homogene verfijning. Klik hier om dit bestand te downloaden. Aanvullend bestand 1: Opties van CryoSieve. Klik hier om dit bestand te downloaden. Aanvullend bestand 2: Verwerkingstijd en minimale vereiste voor het uitvoeren van Cryosieve. Klik hier om dit bestand te downloaden. Aanvullend bestand 3: Genereren van het eerste model door CryoSPARC. Klik hier om dit bestand te downloaden. Aanvullend bestand 4: Reden voor het uitschakelen van de kracht om de GS-splitsing opnieuw uit te voeren. Klik hier om dit bestand te downloaden. Aanvullend bestand 5: Opties van cryosieve-csrefine. Klik hier om dit bestand te downloaden. Aanvullend bestand 6: Opties van cryosieve-csrhbfactor. Klik hier om dit bestand te downloaden.

Discussion

Cryo-EM staat als een cruciale techniek voor het ophelderen van de structuren van biologische moleculen. In dit proces is, na het verzamelen van gegevens via microscopie, deeltjesextractie uit microfoto’s essentieel, gevolgd door hun classificatie in meerdere fasen om de uiteindelijke stapel samen te stellen. Een veel voorkomende uitdaging is het overwicht van beschadigde of ongewenst gevormde deeltjes, wat de noodzaak onderstreept van herhaalde deeltjesselectie om dichtheidskaarten met hoge resolutie te bereiken. Dit maakt deeltjesselectie een cruciale stap in cryo-EM SPA voor het bereiken van dichtheidskaarten van hoge kwaliteit. Bestaande technieken voor deeltjesselectie zijn onder meer het statistische niet-kantelvalidatie-algoritme22, de op z-score gebaseerde benadering23 en de methode voor het schatten van hoeknauwkeurigheid24.

CryoSieve komt in deze context naar voren als een waardevol hulpmiddel, bedreven in het elimineren van een aanzienlijk aantal externe deeltjes uit de uiteindelijke stapel. Deze reductie verbetert niet alleen de rekenefficiëntie van de reconstructie, maar stroomlijnt ook het proces. Het biedt een uitgebreide suite voor deeltjesselectie, waarbij de mate van deeltjesverwijdering en de daaruit voortvloeiende verbetering van de resolutie grotendeels afhangen van de initiële gegevenskwaliteit en de methodologieën die worden gebruikt bij gegevensverwerking.

In dit manuscript hebben we een volledige workflow van het zeven van deeltjes gepresenteerd met behulp van de echte dataset van influenzahemagglutininetrimeer (EMPIAR-invoer: 10097). De stappen die hier worden behandeld en besproken, kunnen worden samengevat als deeltjeszeven en herschatting van de houding. Het uiteindelijke 3D-gereconstrueerde volume bereikte een resolutie van 3,62 Å, en zijketens in alfa-helices waren duidelijker in het nabewerkte volume in vergelijking met de gepubliceerde dichtheidskaart.

CryoSieve is een open-source methode die beschikbaar is op GitHub (https://github.com/mxhulab/cryosieve). Een gedetailleerde tutorial is ook te vinden op de startpagina. Gebruikers kunnen het installeren en gebruiken door de tutorial te volgen. Daarnaast zijn er twee modules, cryosieve-csrefine en cryosieve-csrhbfactor, beschikbaar. De cryosieve-csrefine-module is speciaal ontworpen om de sequentiële uitvoering van verschillende bewerkingen binnen CryoSPARC (aanvullend bestand 5) te automatiseren. Deze bewerkingen omvatten het importeren van deeltjesstapels en het uitvoeren van ab initio, homogene verfijning of niet-uniforme verfijningstaken. Aan de andere kant is de cryosieve-csrhbfactor-module ontworpen om de bepaling van de Rosenthal-Henderson B-factor te automatiseren door gebruik te maken van de mogelijkheden van cryosieve-csrefine (aanvullend bestand 6).

Momenteel is de toepassing van deze methode beperkt tot enkelvoudige conformatiescenario’s. Bijgevolg zijn hun mogelijkheden beperkt in gevallen waarin deeltjes meerdere conformaties vertegenwoordigen. Gebruikers wordt geadviseerd om in eerste instantie deel te nemen aan 3D-classificatie om deeltjes van ongelijksoortige conformaties te scheiden voordat ze deze gebruiken voor verfijnde deeltjesselectie. Bovendien, hoewel de methode bekwaam is in het filteren van meer dan 50% van de deeltjes uit de uiteindelijke stapel, blijven de oorsprong van deze afgedankte deeltjes en de onderliggende redenen voor hun verwaarloosbare bijdrage aan de reconstructiekwaliteit onduidelijk. Deze lacune in begrip vereist aanvullend onderzoek om deze beperking volledig aan te pakken en mogelijk te corrigeren.

Er zijn drie mogelijke bestaande methoden voor het sorteren of zeven van deeltjes. Allereerst kan cisTEM4 een score rapporteren voor elk afzonderlijk deeltjesbeeld na 3D-verfijning. Gebruikers kunnen deeltjes sorteren met behulp van de cisTEM-score om deeltjes weg te gooien. De hoekgrafiekconsistentie (AGC) benadering17 is ook een methode om verkeerd uitgelijnde deeltjes weg te gooien. Bovendien is de niet-uitlijningsclassificatie5 een traditionele manier om deeltjes weg te gooien met behulp van 3D-classificatie. We vergeleken de kwaliteit van de deeltjes die door deze methoden worden vastgehouden met CryoSieve en ontdekten dat de vastgehouden deeltjes van CryoSieve van hogere kwaliteit zijn15. De hier gepresenteerde methode presteert aanzienlijk beter dan alternatieve methoden en bereikt het kleinste aantal deeltjes met dezelfde resolutie.

Zoals aangetoond in het resultaat, dragen de meeste deeltjes in een cryo-EM eindstapel niet bij aan de reconstructie van de dichtheidskaart. Met andere woorden, van alle deeltjes die tijdens de beeldacquisitie worden verzameld, draagt slechts een select aantal, namelijk de fijnste subset, daadwerkelijk bij aan de uiteindelijke reconstructie. Bijgevolg zou de verhouding van deze uiteindelijke subset tot het totale aantal verzamelde deeltjes kunnen dienen als een kwantitatieve maatstaf voor het beoordelen van de monsterkwaliteit. Hoe hoger deze verhouding, hoe beter de monsterkwaliteit. Ondanks technische vooruitgang die cryo-EM toegankelijker heeft gemaakt voor structurele biologen, blijft monstervoorbereiding een groot knelpunt in de workflow. Wetenschappers en ingenieurs richten hun inspanningen dus op deze uitdaging25. Bij single-particle analysis (SPA) bestaat de monstervoorbereiding uit twee cruciale stappen: monsteroptimalisatie en roostervoorbereiding. De eerste omvat het zuiveren van het monster met behoud van de optimale biochemische toestand. Dit laatste omvat het voorbereiden van het monster voor analyse in de microscoop, inclusief chemische of plasmabehandeling van het rooster, monsterafzetting en vitrificatie. Er zijn tal van technieken voorgesteld om macromoleculaire instabiliteit aan te pakken, maar de doeltreffendheid van de ene benadering ten opzichte van de andere hangt af van de kenmerken van de steekproef25,26. Momenteel worden de resultaten van de voorbereiding van het raster sterk beïnvloed door de expertise en ervaring van de gebruiker, wat het proces tijdrovend en uitdagend kan maken27,28. De talrijke variabelen die worden aangetroffen bij de voorbereiding van monsters en roosters vormen uitdagingen bij het vaststellen van oorzaak-gevolgrelaties, aangezien onderzoekers het monster alleen op moleculair niveau kunnen beoordelen met behulp van de microscoop. Als gevolg hiervan ontbreken kwantitatieve statistieken uit vergelijkingen van verschillende monster- en rastervoorbereidingsprotocollen nog steeds, en is een systematische aanpak nodig om trends te onderzoeken en de fundamentele mechanismen van monstergedrag te begrijpen29.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dit werk werd ondersteund door Shenzhen Academy of Research and Translation (naar M.H.), het Advanced Innovation Center for Structural Biology (naar M.H.), het Beijing Frontier Research Center for Biological Structure (naar M.H.), het National Key R&D Program of China (No.2021YFA1001300) (naar C.B.), de National Natural Science Foundation of China (No.12271291) (naar C.B.), en de National Natural Science Foundation of China (nr. 12071244) (naar Z.S.).

Materials

CryoSPARC Structura Biotechnology Inc. Toronto, Canada CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data.
EMPIAR-10097 Dataset https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy.
initial.mrc https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097
mask.mrc https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097
RELION 4.0-beta-2 RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface.
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 Metadata file for the final stack of particles from EMPIAR-10097

References

  1. Bai, X. C., Fernandez, I. S., Mcmullan, G., Scheres, S. H. Ribosome structures to near-atomic resolution from thirty thousand cryo-em particles. elife. 2, 00461 (2013).
  2. Campbell, M. G., et al. Movies of ice-embedded particles enhance resolution in electron cryo-microscopy. Structure. 20 (11), 1823-1828 (2012).
  3. Li, X., et al. Electron counting and beam-induced motion correction enable near-atomic-resolution single-particle cryo-em. Nat Meth. 10 (6), 584-590 (2013).
  4. Grant, T., Rohou, A., Grigorieff, N. Cis tem, user-friendly software for single-particle image processing. eLife. 7, e35383 (2018).
  5. Scheres, S. H. Relion: Implementation of a bayesian approach to cryo-em structure determination. J Str Biol. 180 (3), 519-530 (2012).
  6. Punjani, A., Rubinstein, J. L., Fleet, D. J., Brubaker, M. A. Cryosparc: Algorithms for rapid unsupervised cryo-em structure determination. Nat Meth. 14 (3), 290-296 (2017).
  7. Kühlbrandt, W. The resolution revolution. Science. 343 (6178), 1443-1444 (2014).
  8. Dubochet, J., et al. Cryo-electron microscopy of vitrified specimens. Quart Rev Biophys. 21 (2), 129-228 (1988).
  9. Wagner, T., et al. Sphire-cryolo is a fast and accurate fully automated particle picker for cryo-EM. Comm Biol. 2 (1), 218 (2019).
  10. Bepler, T., et al. Positive-unlabeled convolutional neural networks for particle picking in cryo-electron micrographs. Nat Meth. 16 (11), 1153-1160 (2019).
  11. Wang, F., et al. Deeppicker: A deep learning approach for fully automated particle picking in cryo-em. J Str Biol. 195 (3), 325-336 (2016).
  12. Heimowitz, A., Andén, J., Singer, A. Apple picker: Automatic particle picking, a low-effort cryo-em framework. J Str Biol. 204 (2), 215-227 (2018).
  13. Glaeser, R. M. How good can single-particle cryo-em become? What remains before it approaches its physical limits. Ann Rev Biophys. 48, 45-61 (2019).
  14. Diiorio, M. C., Kulczyk, A. W. A robust single-particle cryo-electron microscopy (cryo-em) processing workflow with cryosparc, relion, and scipion. J Vis Exp. (179), e63387 (2022).
  15. Zhu, J., et al. A minority of final stacks yields superior amplitude in single-particle cryo-em. Nat Comm. 14 (1), 7822 (2023).
  16. Zhou, Y., Moscovich, A., Bendory, T., Bartesaghi, A. Unsupervised particle sorting for high-resolution single-particle cryo-em. Inv Probl. 36 (4), 044002 (2020).
  17. Méndez, J., Garduno, E., Carazo, J. M., Sorzano, C. O. S. Identification of incorrectly oriented particles in cryo-em single particle analysis. J Str Biol. 213 (3), 107771 (2021).
  18. Tan, Y. Z., et al. Addressing preferred specimen orientation in single-particle cryo-em through tilting. Nat Meth. 14 (8), 793-796 (2017).
  19. Rosenthal, P. B., Henderson, R. Optimal determination of particle orientation, absolute hand, and contrast loss in single-particle electron cryomicroscopy. J Mol Biol. 333 (4), 721-745 (2003).
  20. Kaur, S., et al. Local computational methods to improve the interpretability and analysis of cryo-em maps. Nat Comm. 12 (1), 1240 (2021).
  21. Stagg, S. M., Noble, A. J., Spilman, M., Chapman, M. S. Reslog plots as an empirical metric of the quality of cryo-em reconstructions. J Str Biol. 185 (3), 418-426 (2014).
  22. Vargas, J., Otón, J., Marabini, R., Carazo, J. M., Sorzano, C. Particle alignment reliability in single particle electron cryomicroscopy: A general approach. Sci Rep. 6 (1), 21626 (2016).
  23. Vargas, J., et al. Particle quality assessment and sorting for automatic and semiautomatic particle-picking techniques. J Str Biol. 183 (3), 342-353 (2013).
  24. Vargas, J., Melero, R., Gomez-Blanco, J., Carazo, J. -. M., Sorzano, C. O. S. Quantitative analysis of 3d alignment quality: Its impact on soft-validation, particle pruning and homogeneity analysis. Sci Rep. 7 (1), 6307 (2017).
  25. Carragher, B., et al. Current outcomes when optimizing ‘standard’sample preparation for single-particle cryo-em. J Microsc. 276 (1), 39-45 (2019).
  26. Drulyte, I., et al. Approaches to altering particle distributions in cryo-electron microscopy sample preparation. Acta Crystallographica Sec D: Str Biol. 74 (6), 560-571 (2018).
  27. Glaeser, R. M. How good can cryo-em become. Nat Meth. 13 (1), 28-32 (2016).
  28. Kim, L. Y., et al. Benchmarking cryo-em single particle analysis workflow. Front Mol Biosci. 5, 50 (2018).
  29. Weissenberger, G., Henderikx, R. J., Peters, P. J. Understanding the invisible hands of sample preparation for cryo-em. Nat Meth. 18 (5), 463-471 (2021).

Play Video

Cite This Article
Cai, M., Zhu, J., Zhang, Q., Xu, Y., Shi, Z., Bao, C., Hu, M. Enhancing Density Maps by Removing the Majority of Particles in Single Particle Cryogenic Electron Microscopy Final Stacks. J. Vis. Exp. (207), e66617, doi:10.3791/66617 (2024).

View Video