Summary

Cryo-EM en single-particle analyse met Scipion

Published: May 29, 2021
doi:

Summary

Analyse van één deeltje in cryo-elektronenmicroscopie is een van de belangrijkste technieken die worden gebruikt om de structuur van biologische ensembles met hoge resolutie te bepalen. Scipion biedt de tools om de hele pijplijn te creëren om de informatie die door de microscoop wordt verkregen te verwerken en een 3D-reconstructie van het biologische specimen te bereiken.

Abstract

Cryo-elektronenmicroscopie is een van de belangrijkste hulpmiddelen in biologisch onderzoek geworden om de structurele informatie van macromoleculen met een bijna atomaire resolutie te onthullen. Bij analyse met één deeltje wordt het verglaasde monster in beeld gebracht door een elektronenbundel en de detectoren aan het einde van de microscoopkolom produceren films van dat monster. Deze films bevatten duizenden afbeeldingen van identieke deeltjes in willekeurige oriëntaties. De gegevens moeten een beeldverwerkingsworkflow doorlopen met meerdere stappen om het uiteindelijke 3D-gereconstrueerde volume te verkrijgen. Het doel van de beeldverwerkingsworkflow is om de acquisitieparameters te identificeren om het bestudeerde monster te kunnen reconstrueren. Scipion biedt alle tools om deze workflow te creëren met behulp van verschillende beeldverwerkingspakketten in een integratief kader, waardoor ook de traceerbaarheid van de resultaten mogelijk is. In dit artikel wordt de hele beeldverwerkingsworkflow in Scipion gepresenteerd en besproken met gegevens afkomstig van een echte testcase, die alle details geeft die nodig zijn om van de films verkregen door de microscoop naar een uiteindelijke 3D-reconstructie met hoge resolutie te gaan. Ook wordt de kracht besproken van het gebruik van consensustools die het combineren van methoden en het bevestigen van resultaten tijdens elke stap van de workflow mogelijk maken, waardoor de nauwkeurigheid van de verkregen resultaten wordt verbeterd.

Introduction

In cryo-elektronenmicroscopie (cryo-EM) is single particle analysis (SPA) van verglaasde bevroren gehydrateerde monsters een van de meest gebruikte en succesvolle varianten van beeldvorming voor biologische macromoleculen, omdat het moleculaire interacties en de functie van biologische ensembles kan begrijpen1. Dit is te danken aan de recente vooruitgang in deze beeldvormingstechniek die aanleiding gaf tot de “resolutierevolutie”2 en die de succesvolle bepaling van biologische 3D-structuren met bijna atomaire resolutie mogelijk heeft gemaakt. Momenteel was de hoogste resolutie bereikt in SPA cryo-EM 1,15 Å voor apoferritin3 (EMDB-vermelding: 11668). Deze technologische vooruitgang omvat verbeteringen in de monstervoorbereiding4, de beeldacquisitie5 en de beeldverwerkingsmethoden6. Dit artikel is gericht op dit laatste punt.

Kortom, het doel van de beeldverwerkingsmethoden is om alle acquisitieparameters te identificeren om het beeldvormingsproces van de microscoop om te keren en de 3D-structuur van het bestudeerde biologische monster te herstellen. Deze parameters zijn de versterking van de camera, de door de bundel geïnduceerde beweging, de aberraties van de microscoop (voornamelijk de onscherpte), de 3D-hoekoriëntatie en vertaling van elk deeltje en de conformatietoestand in het geval van een monster met conformatieveranderingen. Het aantal parameters is echter zeer hoog en cryo-EM vereist het gebruik van lage dosisbeelden om stralingsschade te voorkomen, wat de signaal-ruisverhouding (SNR) van de verkregen beelden aanzienlijk vermindert. Het probleem kan dus niet ondubbelzinnig worden opgelost en alle te berekenen parameters kunnen alleen schattingen zijn. Tijdens de beeldverwerkingsworkflow moeten de juiste parameters worden geïdentificeerd, waarbij de resterende worden weggegooid om uiteindelijk een 3D-reconstructie met hoge resolutie te verkrijgen.

De gegevens die door de microscoop worden gegenereerd, worden verzameld in frames. Simpel gezegd, een frame bevat het aantal elektronen dat op een bepaalde positie (pixel) in het beeld is aangekomen, wanneer elektronenteldetectoren worden gebruikt. In een bepaald gezichtsveld worden verschillende frames verzameld en dit wordt een film genoemd. Omdat lage elektronendoses worden gebruikt om stralingsschade te voorkomen die het monster zou kunnen vernietigen, is de SNR erg laag en moeten de frames die overeenkomen met dezelfde film worden gemiddeld om een beeld te verkrijgen dat structurele informatie over het monster onthult. Er wordt echter niet alleen een eenvoudig gemiddelde toegepast, het monster kan tijdens de beeldvormingstijd verschuivingen en andere soorten bewegingen ondergaan als gevolg van de door de bundel geïnduceerde beweging die moet worden gecompenseerd. De shift-gecompenseerde en gemiddelde frames zijn afkomstig van een micrograaf.

Zodra de micrografieën zijn verkregen, moeten we de aberraties schatten die door de microscoop voor elk van hen worden geïntroduceerd, de contrastoverdrachtfunctie (CTF) genoemd, die de veranderingen in het contrast van de micrograaf als functie van de frequentie vertegenwoordigt. Vervolgens kunnen de deeltjes worden geselecteerd en geëxtraheerd, wat deeltjesplukken wordt genoemd. Elk deeltje moet een kleine afbeelding zijn die slechts één kopie van het bestudeerde monster bevat. Er zijn drie families van algoritmen voor deeltjesselectie: 1) degenen die alleen een basisparametrisatie van het uiterlijk van het deeltje gebruiken om ze te vinden in de hele set micrografieën (bijv. Deeltjesgrootte), 2) degenen die leren hoe de deeltjes eruit zien van de gebruiker of een voorgetrainde set, en 3) degenen die afbeeldingssjablonen gebruiken. Elke familie heeft andere eigenschappen die later worden getoond.

De geëxtraheerde set deeltjes in de micrografieën zal worden gebruikt in een 2D-classificatieproces dat twee doelen heeft: 1) het reinigen van de set deeltjes door de subset met zuivere ruisbeelden, overlappende deeltjes of andere artefacten weg te gooien, en 2) de gemiddelde deeltjes die elke klasse vertegenwoordigen, kunnen worden gebruikt als eerste informatie om een 3D-initieel volume te berekenen.

De 3D initiële volumeberekening is de volgende cruciale stap. Het probleem van het verkrijgen van de 3D-structuur kan worden gezien als een optimalisatieprobleem in een multidimensionaal oplossingslandschap, waar het globale minimum het beste 3D-volume is dat de oorspronkelijke structuur vertegenwoordigt, maar er verschillende lokale minima kunnen worden gevonden die suboptimale oplossingen vertegenwoordigen en waar het heel gemakkelijk is om gevangen te raken. Het initiële volume vertegenwoordigt het startpunt voor het zoekproces, dus een slechte initiële volumeschatting kan ons verhinderen om het globale minimum te vinden. Vanaf het eerste volume zal een 3D-classificatiestap helpen om verschillende conformatietoestanden te ontdekken en de set deeltjes opnieuw te reinigen; het doel is om een structureel homogene populatie van deeltjes te verkrijgen. Daarna zal een 3D-verfijningsstap verantwoordelijk zijn voor het verfijnen van de hoek- en translatieparameters voor elk deeltje om het best mogelijke 3D-volume te krijgen.

Ten slotte kan in de laatste stappen de verkregen 3D-reconstructie worden geslepen en gepolijst. Slijpen is een proces van het stimuleren van de hoge frequenties van het gereconstrueerde volume, en het polijsten is een stap om sommige parameters, zoals CTF of beam-geïnduceerde bewegingscompensatie, op het niveau van deeltjes verder te verfijnen. Ook kunnen sommige validatieprocedures worden gebruikt om de bereikte oplossing aan het einde van de workflow beter te begrijpen.

Na al deze stappen zullen de traceer- en koppelingsprocessen7 helpen om een biologische betekenis te geven aan de verkregen 3D-reconstructie, door atoommodellen de novo te bouwen of bestaande modellen aan te passen. Als een hoge resolutie wordt bereikt, zullen deze processen ons de posities van de biologische structuren, zelfs van de verschillende atomen, in onze structuur vertellen.

Met Scipion8 kunt u de hele workflow creëren door de meest relevante beeldverwerkingspakketten op een integratieve manier te combineren. Xmipp9, Relion10, CryoSPARC11, Eman12, Spider13, Cryolo14, Ctffind15, CCP416, Phenix17 en nog veel meer pakketten kunnen worden opgenomen in Scipion. Het bevat ook alle benodigde tools om de integratie, interoperabiliteit, traceerbaarheid en reproduceerbaarheid ten goede te komen om de volledige beeldverwerkingsworkflow volledig te volgen8.

Een van de krachtigste tools die Scipion ons in staat stelt te gebruiken, is de consensus, wat betekent dat we de resultaten die zijn verkregen met verschillende methoden in één stap van de verwerking kunnen vergelijken, waardoor een combinatie van de informatie wordt gemaakt die door verschillende methoden wordt overgebracht om een nauwkeurigere uitvoer te genereren. Dit kan helpen om de prestaties te verbeteren en de bereikte kwaliteit in de geschatte parameters te verbeteren. Merk op dat een eenvoudigere workflow kan worden gebouwd zonder het gebruik van consensusmethoden; we hebben echter de kracht van deze tool gezien22,25 en de workflow die in dit manuscript wordt gepresenteerd, zal deze in verschillende stappen gebruiken.

Alle stappen die in de vorige paragrafen zijn samengevat, worden in de volgende sectie in detail uitgelegd en gecombineerd in een volledige workflow met behulp van Scipion. Ook zal worden getoond hoe de consensustools kunnen worden gebruikt om een hogere overeenstemming in de gegenereerde outputs te bereiken. Daartoe is gekozen voor de voorbeelddataset van het Plasmodium falciparum 80S Ribosoom (EMPIAR entry: 10028, EMDB entry: 2660). De dataset wordt gevormd door 600 films van 16 frames van grootte 4096×4096 pixels bij een pixelgrootte van 1,34Å genomen bij een FEI POLARA 300 met een FEI FALCON II-camera, met een gerapporteerde resolutie bij EMDB is 3,2Å18 .

Protocol

1. Een project aanmaken in Scipion en de data importeren Open Scipion en klik op Project maken, geef de naam voor het project op en de locatie waar het wordt opgeslagen (aanvullende afbeelding 1). Scipion opent het projectvenster met een canvas met aan de linkerkant een paneel met een lijst met beschikbare methoden, elk van hen vertegenwoordigt één beeldverwerkingstool die kan worden gebruikt om gegevens te beheren.OPMERKING: Ctrl+F kan worden gebruikt om een methode te vinden als deze niet in de lijst voorkomt. Om de films te importeren die door de microscoop zijn gemaakt, selecteert u de pwem – importeer films in het linkerdeelvenster (of typ deze wanneer u op Ctrl + F drukt). Er wordt een nieuw venster geopend (aanvullende figuur 2). Neem daar het pad naar de gegevens en de acquisitieparameters op. Gebruik in dit voorbeeld de volgende instellingen: Microscoopspanning 300 kV, Sferische aberratie 2,0 mm, Amplitudecontrast 0,1, Vergrotingssnelheid 50000, Bemonsteringsfrequentiemodus naar Van afbeelding en Pixelgrootte 1,34 Å. Wanneer alle parameters in het formulier zijn ingevuld, klikt u op de knop Uitvoeren .OPMERKING: Wanneer een methode wordt gestart, verschijnt er een vak in het canvas in de gele kleur met het label Running. Wanneer een methode is voltooid, verandert het vak in groen en wordt het label gewijzigd in voltooid. In het geval van een fout tijdens de uitvoering van een methode, verschijnt het vak rood, gelabeld als mislukt. Controleer in dat geval het onderste deel van het canvas, op het tabblad Uitvoerlogboek verschijnt een uitleg van de fout. Wanneer de methode is voltooid, controleert u de resultaten in het onderste gedeelte van het canvas op het tabblad Samenvatting. Hier worden de uitvoer die door de methode wordt gegenereerd, gepresenteerd, in dit geval de set films. Klik op de knop Resultaten analyseren en er verschijnt een nieuw venster met de lijst met films. 2. Filmuitlijning: van films tot microfoto’s Gebruik de methode xmipp3 – optische uitlijning die optische stroom implementeert19. Gebruik de volgende parameters om het formulier in te vullen (aanvullende afbeelding 3): de invoerfilms zijn de films die zijn verkregen in stap 1, het bereik in frames om uit te lijnen is van 2 tot 13, de andere opties blijven bij de standaardwaarden. Voer het programma uit.OPMERKING: De vetgedrukte parameters in een formulier moeten altijd worden ingevuld. De andere hebben een standaardwaarde of zijn niet verplicht. In het bovenste gedeelte van het formuliervenster zijn de velden te vinden waarin de rekenresources zijn gedistribueerd, als threads, MPIs of GPU’s. Klik op Resultaten analyseren om de verkregen microfoto’s en het traject van de geschatte verschuivingen te controleren (figuur 1). Voor elke micrograaf die wordt gezien: kijk naar de vermogensspectrale dichtheid (PSD), de trajecten die worden verkregen om de film uit te lijnen (één punt per frame) in cartesische en polaire coördinaten, en de bestandsnaam van de verkregen micrograaf (erop klikkend, kan de micrograaf worden geïnspecteerd). Merk op dat de deeltjes van het monster veel beter zichtbaar zijn in de micrograaf, in vergelijking met een enkel frame van de film. 3. CTF-schatting: berekening van de afwijkingen van de microscoop Gebruik eerst de methode grigoriefflab – ctffind15. De opstelling is: de Input Micrographs zijn de uitgang van stap 2, de Manual CTF Downsampling factor is ingesteld op 1.5 en het resolutiebereik gaat van 0.06 tot 0.42. Stel bovendien in de geavanceerde opties (die u kunt vinden door deze keuze te selecteren in het expertniveau van het formulier) de venstergrootte in op 256. De overige parameters blijven bij de standaardwaarden (aanvullende figuur 4).OPMERKING: In de meeste methoden in Scipion toont de optie Geavanceerd meer configuratieparameters. Gebruik deze opties zorgvuldig, wanneer het te starten programma volledig bekend is en de betekenis van de parameters wordt begrepen. Sommige parameters kunnen moeilijk in te vullen zijn zonder de gegevens te bekijken; in dat geval toont Scipion aan de rechterkant een toverstaf die een tovenaarsvenster toont (aanvullende figuur 5). In het veld Resolutie van dit formulier is het bijvoorbeeld bijzonder handig, omdat deze waarden moeten worden geselecteerd om ongeveer het gebied van de eerste nul tot de laatste merkbare ring van de PSD te dekken. Klik op Uitvoeren en op Resultaten analyseren (figuur 2) wanneer de methode is voltooid. Controleer of de geschatte CTF overeenkomt met de experimentele. Kijk daartoe naar de PSD en vergelijk de geschatte ringen in de hoek met die uit de gegevens. Controleer ook de verkregen onscherptewaarden om onverwachte waarden te vinden en de respectieve micrografieën kunnen worden weggegooid of opnieuw worden berekend. In dit voorbeeld kan de hele set micrografieën worden gebruikt.OPMERKING: Gebruik de knoppen in het onderste deel van het venster om een subset van micrografieën te maken (met de rode knop Micrographs ) en om een CTF opnieuw te berekenen (met de rode knop CTFs herberekenen ), in geval van nood. Om de vorige schatting te verfijnen, gebruikt u xmipp3 – ctf schatting20. Selecteer als Input Micrographs de uitvoer van stap 2, selecteer de optie Gebruik defoci uit een eerdere CTF-schatting, omdat Vorige CTF-schatting de uitvoer van grigoriefflab – ctffind kiest en wijzig in het geavanceerde niveau de venstergrootte in 256 (aanvullende figuur 6). Voer het uit. Klik op Resultaten analyseren om de verkregen CTF’s te controleren. Met deze methode worden meer gegevens geschat en weergegeven in enkele extra kolommen. Omdat geen van hen onjuiste geschatte waarden vertoont, worden alle micrografieën in de volgende stappen gebruikt. 4. Deeltjesplukken: deeltjes vinden in de microfoto’s Voordat u met het plukken begint, voert u een voorbewerking van de micrografieën uit. Open xmipp3 – micrografen voorbewerken, stel als invoermicrografen in die verkregen in stap 2 en selecteer de opties Slechte pixels verwijderen? met Multiple van Stddev tot 5, en Downsample-micrografen? met een Downsampling-factor van 2 (aanvullende figuur 7). Klik op Uitvoeren en controleer of de grootte van de resulterende micrografieën is verkleind. Gebruik voor het picken xmipp3 – handmatige picking (stap 1) en xmipp3 – auto-picking (stap 2)21. De handmatige picking maakt het mogelijk om handmatig een set deeltjes voor te bereiden waarmee de auto-picking stap zal leren en de volledige set deeltjes zal genereren. Voer eerst xmipp3 uit – handmatige picking (stap 1) met Input Micrographs als de micrografieën die in het vorige voorproces zijn verkregen. Klik op Uitvoeren en er verschijnt een nieuw interactief venster (figuur 3). In dit venster wordt een lijst met de micrografieën (figuur 3a) en andere opties gepresenteerd. Verander grootte (px) in 150, dit is de grootte van de doos die elk deeltje bevat. De geselecteerde micrograaf verschijnt in een groter venster. Kies een gebied en kies alle zichtbare deeltjes erin (figuur 3b). Klik vervolgens op Training activeren om het leren te starten. De overige gebieden van de micrograaf worden automatisch gekozen (figuur 3c). Controleer de geplukte deeltjes en voeg meer toe door erop te klikken, of verwijder de onjuiste deeltjes met shift + klikken, indien nodig. Selecteer de volgende micrograaf in het eerste venster. De micrograaf wordt automatisch geplukt. Controleer opnieuw om indien nodig enkele deeltjes op te nemen of te verwijderen. Herhaal deze stap met ongeveer 5 microfoto’s om een representatieve trainingsset te maken. Zodra dit is gebeurd, klikt u op Coördinaten in het hoofdvenster om de coördinaten van alle geplukte deeltjes op te slaan. De trainingsset van deeltjes is klaar om naar de automatische picking te gaan om het proces voor alle micrografieën te voltooien. Open xmipp3 – auto-picking (stap 2) die aangeeft in Xmipp particle picking voer de vorige handmatige picking uit, en Micrographs om te picken als Same as supervised. Klik op Uitvoeren. Deze methode genereert als uitvoer een set van ongeveer 100000 coördinaten. Pas een consensusbenadering toe, dus voer een tweede pickingmethode uit om de deeltjes te selecteren waarin beide methoden overeenkomen. Open sphire – cryolo picking14 en selecteer de voorbewerkte micrografieën als Input Micrographs, Use general model? naar Yes, met een betrouwbaarheidsdrempel van 0,3 en een Box Size van 150 (Aanvullende figuur 8). Voer het uit. Deze methode moet ook ongeveer 100000 coördinaten genereren. Voer xmipp3 uit – diepe consensus picking22. Aangezien invoercoördinaten de uitvoer van sphire – cryolo picking (stap 4.7) en xmipp3 – auto-picking (stap 4.6) omvatten, stelt u Select modeltype in op Pretrained en slaat u training over en scoort u rechtstreeks met voorgetraind model? Aan Ja (aanvullende figuur 9). Voer het uit. Klik op Resultaten analyseren en in het nieuwe venster op het oogpictogram naast Deeltjes/coördinaten selecteren met hoge ‘zScoreDeepLearning1’-waarden. Er wordt een nieuw venster geopend met een lijst van alle deeltjes (figuur 4). De zScore waarden in de kolom geven inzicht in de kwaliteit van een deeltje, lage waarden betekenen slechte kwaliteit. Klik op het etiket_xmipp_zScoreDeepLearning om de deeltjes van de hoogste naar de laagste zScore te ordenen. Selecteer de deeltjes met een zScore hoger dan 0,75 en klik op Coördinaten om de nieuwe subset te maken. Hiermee moet een deelverzameling worden gemaakt met ongeveer 50000 coördinaten. Open xmipp3 – diepe micrograafreiniger. Selecteer als Input coördineert de subset verkregen in de vorige stap, Micrographs bron als hetzelfde als coördinaten, en houd Drempel op 0,75. Voer het uit. Controleer op het tabblad Samenvatting of het aantal coördinaten is verminderd, hoewel in dit geval slechts enkele coördinaten zijn verwijderd.OPMERKING: Deze stap kan de set coördinaten bovendien opschonen en kan zeer nuttig zijn bij het opschonen van andere gegevenssets met meer filmartefacten als koolstofzones of grote onzuiverheden. Run xmipp3 – extract deeltjes (aanvullende figuur 10). Geef aan als Input coördinaten de coördinaten verkregen na de vorige stap, Micrographs bron als andere, Input micrographs als de output van stap 2, CTF schatting als de output van de xmipp3 – ctf schatting, Downsampling factor naar 3, en Deeltjes doos grootte naar 100. Selecteer op het tabblad Voorbewerking van het formulier ja voor iedereen . Voer het uit. Controleer of de uitvoer de deeltjes moet bevatten met een kleinere grootte van 100×100 pixels en een pixelgrootte van 4,02Å/px. Voer opnieuw xmipp3 uit – extraheer deeltjes die de volgende parameters veranderen: Downsamplingfactor naar 1 en deeltjesdoosgrootte naar 300. Controleer of de uitvoer dezelfde set deeltjes is, maar nu op de volledige resolutie. 5. 2D-classificatie: vergelijkbare deeltjes groeperen Open de methode cryosparc2 – 2d classificatie11 met inputdeeltjes als die verkregen in stap 4.11 en, in het tabblad 2D-classificatie, het aantal klassen tot 128, houd alle andere parameters met de standaardwaarden. Voer het uit. Klik op Resultaten analyseren en vervolgens op het oogpictogram naast Deeltjesklassen weergeven met Scipion (figuur 5). Deze classificatie zal helpen om de set deeltjes schoon te maken, omdat verschillende klassen luidruchtig of met artefacten zullen lijken. Selecteer de klassen met goede weergaven. Klik op Deeltjes (rode knop in het onderste deel van het venster) om de schonere subset te maken. Open nu xmipp3 – cl2d23 en stel als invoerafbeeldingen de afbeeldingen in die in de vorige stap zijn verkregen en aantal klassen in op 128. Klik op Uitvoeren.OPMERKING: Deze tweede classificatie wordt gebruikt als extra reinigingsstap van de set deeltjes. Meestal is het handig om zoveel mogelijk luidruchtige deeltjes te verwijderen. Als echter een eenvoudigere workflow gewenst is, kan slechts één 2D-classificatiemethode worden gebruikt. Wanneer de methode is voltooid, controleert u de 128 gegenereerde klassen door te klikken op Resultaten analyseren en op Wat u wilt weergeven: klassen. De meeste gegenereerde klassen tonen een projectie van het macromolecuul met een bepaald detailniveau. Sommigen van hen lijken echter luidruchtig (in dit voorbeeld ongeveer 10 klassen). Selecteer alle goede klassen en klik op de knop Klassen om een nieuwe subset te genereren met alleen de goede. Deze subset wordt gebruikt als invoer voor een van de methoden om een initieel volume te genereren. Klik met dezelfde geselecteerde klassen op Deeltjes om een schonere subset te maken na het verwijderen van die van de slechte klassen. Open pwem – deelverzameling met Volledige verzameling items als de uitgang van 4,13 (alle deeltjes op de volledige grootte), Maak willekeurige deelverzameling op Nee, Andere verzameling als de deelverzameling van deeltjes die in de vorige stap zijn gemaakt en Stel de werking in als snijpunt in. Dit zal de vorige deelverzameling op volledige resolutie uit de deeltjes halen. 6. Initiële volumeschatting: het bouwen van de eerste schatting van het 3D-volume Schat in deze stap twee initiële volumes met verschillende methoden en gebruik vervolgens een consensustool om het uiteindelijke geschatte 3D-volume te genereren. Open xmipp3 – reconstrueer significant24-methode met invoerklassen als die verkregen na stap 5, Symmetriegroep als c1, en houd de resterende parameters bij hun standaardwaarden (aanvullende figuur 11). Voer het uit. Klik op Resultaten analyseren. Controleer of een volume met een lage resolutie van 100x100x100 pixels en een pixelgrootte van 4,02Å/px wordt verkregen. Open xmipp3 – volumes bijsnijden/verkleinen (aanvullende figuur 12) met als invoervolumes het volume dat in de vorige stap is verkregen, Volume wijzigen? naar Ja, de optie Formaat wijzigen in Bemonsteringsfrequentie en Het formaat van de bemonsteringsfrequentie wijzigen tot 1,34 Å/px. Voer het uit. Controleer op het tabblad Samenvatting of het uitvoervolume de juiste grootte heeft. Maak nu het tweede eerste volume. Open relion – 3D initieel model10, aangezien inputdeeltjes de goede deeltjes op volledige resolutie gebruiken (output van 5,5) en de diameter van het deeltjesmasker instellen op 402Å, houdt u de resterende parameters bij de standaardwaarden. Voer het uit. Klik op Resultaten analyseren en vervolgens in Weergavevolume met: segmenten. Controleer of een volume met een lage resolutie, maar met de hoofdvorm van de structuur, wordt verkregen (aanvullende figuur 13). Open nu pwem – join sets om de twee gegenereerde initiële volumes te combineren om de input voor de consensusmethode te creëren. Geef volumes aan als invoertype en selecteer de twee initiële volumes in invoerset. Voer het uit. De uitvoer moet een set zijn met twee items met beide volumes. De consensustool is degene die is opgenomen in xmipp3 – zwermconsensus25. Open het. Gebruik als Afbeeldingen op ware grootte de goede deeltjes op volledige resolutie (uitvoer van 5,5), als Initiële volumes de set met twee items gegenereerd in de vorige stap, en zorg ervoor dat symmetriegroep c1 is. Klik op Uitvoeren. Klik op Resultaten analyseren. Controleer of een gedetailleerder uitvoervolume wordt verkregen (figuur 6). Hoewel er meer ruis rond de structuur is, zal het hebben van meer details in de structuurkaart de volgende verfijningsstappen helpen om lokale minima te vermijden.OPMERKING: Als UCSF Chimera26 beschikbaar is, gebruikt u het laatste pictogram in het bovenste gedeelte van het venster om een 3D-visualisatie van het verkregen volume te maken. Open en voer relion uit – 3D auto-refine10 om een eerste 3D-hoektoewijzing van de deeltjes te maken. Selecteer als invoerdeeltjes de uitvoer van 5,5 en stel de diameter van het deeltjesmasker in op 402Å. Selecteer op het tabblad Referentie 3D-kaart als invoervolume het volume dat in de vorige stap is verkregen, Symmetrie als c1 en Initieel laagdoorlaatfilter tot 30Å (aanvullende figuur 14). Klik op Resultaten analyseren. Selecteer in het nieuwe venster definitief als Volume om te visualiseren en klik op Volume weergeven met: segmenten om het verkregen volume te zien. Controleer ook de Fourier shell correlatie (FSC) door te klikken op Display resolution plots in het resultatenvenster en de hoekdekking in Display angular distribution: 2D plot (Figuur 7). Het gereconstrueerde volume bevat veel meer details (waarschijnlijk met enkele wazige gebieden in het buitenste deel van de structuur) en de FSC overschrijdt de drempel van 0,143 rond 4,5 Å. De hoekige dekking beslaat de hele 3D-sfeer. 7.3D classificatie: het ontdekken van conformatietoestanden Met behulp van een consensusbenadering kunnen verschillende conformatietoestanden in de gegevens worden ontdekt. Open relion – 3D classificatie10 (Aanvullende figuur 15). Als input deeltjes gebruik die zojuist verkregen in 6.10, en stel deeltjesmasker diameter in op 402Å. Gebruik op het tabblad Referentie 3D-kaart het volume dat is verkregen na stap 6.10, stel Symmetrie in op c1 en Initieel laagdoorlaatfilter op 15Å. Stel ten slotte op het tabblad Optimalisatie het aantal klassen in op 3. Voer het uit. Controleer de resultaten door op Resultaten analyseren te klikken, selecteer Classificatie weergeven in Scipion. De drie gegenereerde klassen en enkele interessante metingen worden getoond. De eerste twee klassen moeten een vergelijkbaar aantal toegewezen afbeeldingen hebben (kolom met grootte ) en er erg op lijken, terwijl de derde minder afbeeldingen en een waziger uiterlijk heeft. Ook de rlnAccuracyRotations en rlnAccuracyTranslations zouden duidelijk beter moeten zijn voor de eerste twee klassen. Selecteer de twee beste klassen en klik op de knop Klassen om een subset te genereren die ze bevat. Herhaal stap 7.1 en 7.2 om een tweede groep goede klassen te genereren. Beide zullen de input zijn van de consensustool. Open en voer xmipp3 – consensusklassen 3D uit en selecteer als invoerklassen de twee subsets die in de vorige stappen zijn gegenereerd. Klik op Resultaten analyseren. Het aantal samenvallende deeltjes tussen klassen wordt gepresenteerd: de eerste waarde is het aantal samenvallende deeltjes in de eerste klasse van deelverzameling 1 en de eerste klasse van deelverzameling 2, de tweede waarde is het aantal samenvallende deeltjes in de eerste klasse van deelverzameling 1 en de tweede klasse van deelverzameling 2, enz. Controleer of de deeltjes willekeurig zijn toegewezen aan klassen één of twee, wat betekent dat de 3D-classificatiemethode geen conformatieveranderingen kan vinden. Gezien dit resultaat zal de hele set deeltjes worden gebruikt om de verwerking voort te zetten. 8.3D verfijning: verfijning van hoektoewijzingen van een homogene populatie Nogmaals, pas in deze stap een consensusbenadering toe. Open en voer eerst pwem – subset uit met Volledige set items als de uitvoer van 6.9, Maak willekeurige subset naar Ja en Aantal elementen naar 5000. Hiermee wordt een subset van afbeeldingen met een eerdere uitlijning gemaakt om de methode te trainen die in de volgende stap wordt gebruikt. Open xmipp3 – diepe uitlijning, stel invoerafbeeldingen in als de uitvoer van goede deeltjes verkregen in 5.5, volume als degene die is verkregen na 6.10, invoertraining ingesteld als degene die in de vorige stap is gemaakt, doelresolutie tot 10Å en houd de resterende parameters bij de standaardwaarden (aanvullende figuur 16). Klik op Uitvoeren. Klik op Resultaten analyseren om de verkregen hoekverdeling te controleren, waarbij er geen ontbrekende aanwijzingen zijn en de hoekdekking enigszins verbetert ten opzichte van die van 6,10 (figuur 8). Open en voer xmipp3 uit – vergelijk hoeken en selecteer als Input deeltjes 1 de output van 6.9 en Input particles 2 de output van 8.2, zorg ervoor dat de Symmetry groep c1 is. Deze methode berekent de overeenkomst tussen xmipp3 – deep align en relion – 3D auto refine. Klik op Resultaten analyseren, de lijst met deeltjes, met de verkregen verschillen in verschuivingen en hoeken, wordt weergegeven. Klik op het balkpictogram in het bovenste deel van het venster, er wordt een ander venster geopend waarmee u de berekende variabelen kunt plotten. Selecteer _xmipp_angleDiff en klik op Plot om een weergave van de hoekverschillen per deeltje te zien. Doe hetzelfde met _xmipp_shiftDiff. In deze cijfers komen ongeveer in de helft van de deeltjes beide methoden overeen (figuur 9). Selecteer de deeltjes met hoekverschillen lager dan 10º en maak een nieuwe subset. Open nu xmipp3 – highres27 om een lokale verfijning van de toegewezen hoeken te maken. Selecteer eerst als Afbeeldingen op ware grootte de afbeeldingen die in de vorige stap zijn verkregen en als Initiële volumes de uitvoer van 6,9, stel Straal van deeltje in op 150 pixels en Symmetriegroep als c1. Stel op het tabblad Hoektoewijzing de afbeeldingsuitlijning in op Lokaal, Aantal iteraties op 1 en Max. Doelresolutie als 5Å/px (aanvullende figuur 17). Voer het uit. Controleer op het tabblad Samenvatting of het uitvoervolume kleiner is dan 300x300x300 pixels en een iets hogere pixelgrootte heeft. Klik op Resultaten analyseren om de verkregen resultaten te bekijken. Klik op Weergaveresolutieplots om de FSC te zien en op Weergavevolume: Gereconstrueerd om het verkregen volume te zien (aanvullende figuur 18). Een goed resolutievolume in de buurt van 4-3,5 Å wordt verkregen. Klik op Uitvoerdeeltjes weergeven en klik in het venster met de lijst met deeltjes op het staafpictogram. Selecteer in het nieuwe venster Type als histogram met 100 vakken, selecteer _xmipp_cost label en druk ten slotte op Plot (aanvullende afbeelding 19). Op deze manier wordt het histogram van het kostenlabel gepresenteerd, dat de correlatie van het deeltje met de daarvoor geselecteerde projectierichting bevat. In dit geval wordt een unimodale dichtheidsfunctie verkregen, wat een teken is van het niet hebben van verschillende populaties in de verzameling deeltjes. Ze zullen dus allemaal worden gebruikt om de verfijning voort te zettenOPMERKING: In het geval van het zien van een multimodale dichtheidsfunctie, moet de set deeltjes die tot het hogere maximum behoort, worden geselecteerd om de workflow alleen met hen voort te zetten. Openen en opnieuw uitvoeren xmipp3 – highres met Doorgaan van een vorige run? op Ja, stel de afbeeldingen op ware grootte in die zijn verkregen na 8.5 en Selecteer vorige uitvoering met de vorige uitvoering van Xmipp Highres. Stel op het tabblad Hoektoewijzing de afbeeldingsuitlijning in op Lokaal, met 1 iteratie en 2,6 Å/px als doelresolutie (volledige resolutie). Nu moet de uitvoer een volume met volledige resolutie bevatten (grootte 300x300x300 pixels). Klik op Resultaten analyseren om het verkregen volume en de FSC opnieuw te controleren, die nu een volume met een hoge resolutie van ongeveer 3Å zou moeten zijn (figuur 10). 9. Evaluatie en nabewerking Open xmipp3 – lokale MonoRes28. Met deze methode wordt de resolutie lokaal berekend. Stel als invoervolume het volume in dat na 8.10 is verkregen, stel Wilt u halve volumes gebruiken? in op Ja en Resolutiebereik van 1 tot 10Å. Voer het uit. Klik op Resultaten analyseren en selecteer Toon resolutie histogram en Toon gekleurde segmenten (Figuur 11). De resolutie in de verschillende delen van het volume wordt weergegeven. De meeste voxels van het centrale deel van de structuur moeten resoluties rond 3Å presenteren, terwijl de slechtste resoluties in de buitenste delen worden bereikt. Ook wordt een histogram van de resoluties per voxel getoond met een piek rond (zelfs onder) 3Å. Open en voer xmipp3 – localdeblur slijpen29 uit om een verscherping toe te passen. Selecteer als invoertoewijzing degene die is verkregen in 8.10 en als resolutiekaart degene die is verkregen in de vorige stap met MonoRes. Klik op Resultaten analyseren om de verkregen volumes te controleren. Open de laatste, die overeenkomt met de laatste iteratie van het algoritme. Het wordt aanbevolen om het volume te openen met andere hulpmiddelen, zoals UCSF Chimera26, om de kenmerken van het volume in 3D beter te zien (figuur 12). Open ten slotte de validatietool in xmipp3 – valideer overfitting30 die laat zien hoe de resolutie verandert met het aantal deeltjes. Open het en neem als invoerdeeltjes de deeltjes op die zijn verkregen in stap 8.5, stel Bereken de ruis die is gebonden aan resolutie? in op Ja, met initieel 3D-referentievolume als uitvoer van 8,10. Stel in Geavanceerde opties het aantal deeltjes in op “500 1000 1500 2000 3000 5000 10000 15000 20000” (aanvullende figuur 20). Voer het uit. Klik op Resultaten analyseren. Er verschijnen twee plots (figuur 13) met de evolutie van de resolutie, in de groene lijn, naarmate het aantal deeltjes dat in de reconstructie wordt gebruikt, groeit. De rode lijn vertegenwoordigt de resolutie die is bereikt met een reconstructie van uitgelijnde Gaussische ruis. De resolutie verbetert met het aantal deeltjes en er wordt een groot verschil waargenomen tussen de reconstructie van deeltjes ten opzichte van die van ruis, wat een indicator is van het hebben van deeltjes met goede structurele informatie. Op basis van de vorige resultaten kon een model in het nabewerkte volume worden aangebracht, waardoor de biologische structuren van het macromolecuul konden worden ontdekt.

Representative Results

We hebben de dataset van het Plasmodium falciparum 80S Ribosoom (EMPIAR-vermelding: 10028, EMDB-vermelding: 2660) gebruikt om de test uit te voeren en, met het Scipion-protocol dat in de vorige sectie is gepresenteerd, is een 3D-gereconstrueerd volume met hoge resolutie van het macromolecuul in dit specifieke voorbeeld bereikt, te beginnen met de informatie verzameld door de microscoop die bestaat uit zeer luidruchtige beelden met 2D-projecties in elke oriëntatie van het monster. De belangrijkste resultaten die zijn verkregen na het uitvoeren van het hele protocol zijn weergegeven in figuur 10, figuur 11 en figuur 12. Figuur 10 geeft het verkregen 3D-volume voor nabewerking weer. In figuur 10a is een FSC van 3 Å te zien, dat deze zeer dicht bij de Nyquist-limiet ligt (met gegevens met een pixelgrootte van 1,34 Å is de Nyquist-limiet 2,6 Å). Figuur 10b toont enkele segmenten van het gereconstrueerde 3D-volume met hoge niveaus van details en goed gedefinieerde structuren. In figuur 11 worden de resultaten na lokaal analyseren van de resolutie van het verkregen 3D-volume gepresenteerd. Het is te zien dat de meeste voxels in de structuur een resolutie van minder dan 3 Å bereiken, voornamelijk die in het centrale deel van de structuur. Het buitenste deel toont echter slechtere resoluties, wat consistent is met de vervaging die in die gebieden in de segmenten van figuur 10b verschijnt. Figuur 12 toont dezelfde 3D-kaart na nabewerking die in staat is om de hogere frequenties van het volume te markeren, meer details te onthullen en de weergave te verbeteren, wat vooral te zien is in de 3D-presentatie in figuur 12c. In figuur 14 werd Chimera26 gebruikt om een 3D-weergave te zien van het verkregen volume (figuur 14a), het nabewerkte (figuur 14b) en de resolutiekaart (figuur 14c), gekleurd met de kleurcode van de lokale resoluties. Dit kan nog meer informatie geven over de verkregen structuur. Deze tool is erg handig om inzicht te krijgen in de kwaliteit van het verkregen volume, omdat zeer kleine details in de hele 3D-context van de structuur te zien zijn. Wanneer de bereikte resolutie voldoende is, kunnen zelfs enkele biochemische delen van de structuur worden gevonden (bijv. Alfa-helices in figuur 14d. In deze figuur moet de hoge resolutie worden benadrukt die wordt bereikt in alle centrale delen van de 3D-structuur, die kunnen worden gezien als de donkerblauwe gebieden in figuur 14c. Alle voorgaande resultaten werden bereikt dankzij een goede uitvoering van het hele protocol, maar dit is misschien niet het geval. Er zijn verschillende manieren om slecht gedrag te identificeren. In het meest algemene geval gebeurt dit wanneer de verkregen structuur een lage resolutie heeft en deze niet in staat is om naar een betere te evolueren. Een voorbeeld hiervan is te zien in figuur 15. Een wazig volume (figuur 15c) resulteert in een lage FSC, wat te zien is in de FSC-curve (figuur 15a) en het histogram van de lokale schatting (figuur 15b). Dit voorbeeld is gegenereerd met behulp van een 3D-verfijningsmethode met onjuiste invoergegevens, omdat het enkele specifieke eigenschappen verwachtte in de invoerset van deeltjes waaraan ze niet voldoen. Zoals te zien is, is het altijd erg belangrijk om te weten hoe de verschillende methoden verwachten de gegevens te ontvangen en deze goed voor te bereiden. Over het algemeen kan er een probleem zijn in de verwerkingsworkflow of de onderliggende gegevens wanneer een uitvoer zoals die in figuur 15 wordt verkregen. Er zijn verschillende controlepunten in de workflow die kunnen worden geanalyseerd om te weten of het protocol goed evolueert of niet. Bijvoorbeeld, direct na het plukken, kunnen verschillende van de eerder besproken methoden de deeltjes rangschikken en een score geven voor elk van hen. In het geval van slechte deeltjes, maken deze methoden het mogelijk om ze te identificeren en te verwijderen. Ook kan de 2D-classificatie een goede indicator zijn voor het hebben van een slechte set deeltjes. Figuur 16 toont een voorbeeld van zo’n slechte set. In figuur 16a worden goede klassen getoond die enkele details van de structuur bevatten, terwijl figuur 16b slechte klassen toont, die luidruchtig of ongecentreerd zijn, in dit laatste geval kan worden gezien dat de pick onjuist was en twee deeltjes samen lijken te verschijnen. Een ander controlepunt is de initiële volumeschatting, figuur 17 toont een voorbeeld van goede (figuur 17a) en slechte (figuur 17b) initiële schattingen. De slechte schatting is gemaakt met behulp van een onjuiste instelling voor de methode. Er moet rekening mee worden gehouden dat alle opstellingen zorgvuldig moeten worden uitgevoerd, waarbij elke parameter op de juiste manier moet worden gekozen op basis van de gegevens die worden geanalyseerd. In het geval van het ontbreken van een kaart met wat minimale structurele informatie, zal de volgende verfijning geen goede reconstructie kunnen verkrijgen. Wanneer het probleem een slechte acquisitie is, waarbij de films geen structurele informatie bewaren, zal het onmogelijk zijn om er goede deeltjes uit te halen en een succesvolle verwerking te krijgen. In dat geval moeten er meer films worden verzameld om een hoge resolutie 3D-reconstructie te krijgen. Maar als dit niet het geval is, zijn er verschillende manieren om problemen tijdens de verwerkingsworkflow te beheren. Als het plukken niet goed genoeg is, zijn er verschillende manieren om te proberen het te repareren, bijvoorbeeld het plukken herhalen, verschillende methoden gebruiken of proberen handmatig meer deeltjes te plukken om de methoden te helpen ervan te leren. Als tijdens de 2D-classificatie slechts een paar klassen goed zijn, overweeg dan ook om het pickproces te herhalen. Probeer bij de eerste volumeschatting verschillende methoden te gebruiken als sommige onnauwkeurige resultaten gaven. Hetzelfde geldt voor de 3D-verfijning. Naar aanleiding van deze redenering zijn in dit manuscript verschillende consensustools gepresenteerd, die zeer nuttig kunnen zijn om problemen te voorkomen en de verwerking met nauwkeurige gegevens voort te zetten. Dankzij het gebruik van een consensus tussen verschillende methoden, kunnen we gegevens weggooien die moeilijk te kiezen, classificeren, uitlijnen, enz. Zijn, wat waarschijnlijk een indicator is van slechte gegevens. Als echter verschillende methoden het eens kunnen worden in de gegenereerde uitvoer, bevatten deze gegevens waarschijnlijk waardevolle informatie waarmee de verwerking kan worden voortgezet. We moedigen de lezer aan om meer datasets te downloaden en te proberen ze te verwerken volgens de aanbevelingen in dit manuscript en om een vergelijkbare workflow te creëren die verwerkingspakketten combineert met behulp van Scipion. Proberen een dataset te verwerken is de beste manier om de kracht te leren van de verwerkingstools die beschikbaar zijn in de state-of-the-art in Cryo-EM, om de beste regels te kennen om de mogelijke nadelen die tijdens de verwerking verschijnen te overwinnen en om de prestaties van de beschikbare methoden in elke specifieke testcase te verbeteren. Figuur 1. Resultaat filmuitlijning. (a) Het hoofdvenster van de resultaten, met een lijst van alle gegenereerde micrografieën en aanvullende informatie: de spectrale vermogensdichtheid, het traject van de geschatte uitlijning in poolcoördinaten, hetzelfde in cartesische coördinaten, de bestandsnaam van de gegenereerde micrograaf. b) Het uitlijningstraject weergegeven in cartesische coördinaten. c) De gegenereerde micrograaf. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 2. CTF schatting met Ctffind resultaat. Het hoofdvenster met de resultaten bevat een figuur met de geschatte PSD (in een hoek) samen met de PSD afkomstig van de gegevens en verschillende onscherpteparams. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 3. Handmatige picking vensters met Xmipp. (a) Het hoofdvenster met de lijst met te verwerken micrografen en enkele andere parameters. b) Het handmatig plukken van deeltjes in een gebied van een micrograaf. (c) en (d) Automatisch geplukte deeltjes die onder toezicht moeten worden gehouden om een set trainingsdeeltjes te maken voor de automatische Xmipp-pickingmethode. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 4. Diepe consensus picking met Xmipp resultaat. De parameter zScoreDeepLearning geeft gewicht aan de goedheid van een deeltje en het is de sleutel tot het ontdekken van slechte deeltjes. (a) De laagste zScores-waarden zijn gekoppeld aan artefacten. (b) De hoogste zScores worden geassocieerd met deeltjes die het macromolecuul bevatten. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 5. 2D classificatie met Cryosparc resultaat. De gegenereerde klassen (gemiddelden van deelverzamelingen van deeltjes die uit dezelfde oriëntatie komen) worden weergegeven. Verschillende goede klassen geselecteerd in rood (met enig detailniveau) en sommige slechte klassen niet-geselecteerd (luidruchtige en ongecentreerde klassen). Klik hier om een grotere versie van deze figuur te bekijken. Figuur 6. 3D initieel volume met zwerm consensus resultaat. Een weergave van het 3D-initiële volume verkregen na het uitvoeren van de consensustool xmipp3 – zwermconsensus, met behulp van de eerdere 3D-initiële volumeschattingen van Xmipp en Relion. (a) Het volume wordt weergegeven door segmenten. b) 3D-visualisatie van het volume. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 7. Verfijning van een 3D initieel volume met Relion resultaat. a) verkregen FSC-curve, waarbij de drempel bij een 4,5 Å bij benadering wordt overschreden. b) Hoekdekking weergegeven als bovenste weergave van de 3D-bol. In dit geval, omdat er geen symmetrie is, moeten de toegewezen deeltjes de hele bol bedekken. c) Verfijnd volume weergegeven door segmenten. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 8. 3D-uitlijning op basis van deep learning met Xmipp-resultaat. De resultaten gegenereerd door xmipp3 – deep align methode voor 3D uitlijning. (a) De hoektoewijzing voor elk deeltje in de vorm van transformatiematrix. b) De hoekdekking. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 9. Resultaat van de consensus voor 3D-uitlijning. a) Lijst van deeltjes met de verkregen verschillen in verschuivings- en hoekparameters. b) Plot van de hoekverschillen per deeltje. c) Plot van het verschuivingsverschil per deeltje. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 10. Eind iteratie van 3D verfijning resultaat. a) FSC-curve. b) Verkregen volume bij volledige resolutie per segment. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 11. Lokale resolutie analyse met Xmipp resultaat. Resultaten van de methode xmipp3 – lokale MonoRes. (a) Enkele representatieve segmenten gekleurd met de resolutiewaarde per voxel, zoals aangegeven in de kleurcode. b) Histogram van de plaatselijke resolutie. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 12. Slijpen met Xmipp resultaat. Resultaten van xmipp3 – localdeblur slijpmethode . a) Lijst van de verkregen volumes per iteratie. b) 3D-volume verkregen na de laatste iteratie vertegenwoordigd door plakjes. c) Een 3D-weergave van het uiteindelijke volume. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 13. Valideer overfitting tool in Xmipp resultaat. Resultaten van xmipp3 – validatie overfitting. De groene lijn komt overeen met reconstructie uit gegevens, de rode lijn uit ruis. (a) Omgekeerde van de kwadraatresolutie met de logaritme van het aantal deeltjes. b) Resolutie met het aantal deeltjes. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 14. Verschillende 3D-representaties van het verkregen volume. a) Voorbewerkt volume. b) Nabewerkt volume. (c) Lokale resolutie, donkerblauwe voxels zijn die met een hogere resolutie (2,75Å) en donkerrode voxels zijn voxels met een lagere resolutie (10,05Å). d) Zoom in op het nabewerkte volume waar een alfa-helix (rood ovaal) te zien is. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 15. Voorbeeld van een slechte 3D reconstructie. a) FSC-curve met een scherpe daling en het overschrijden van de drempel bij lage resolutie. b) Histogram van de plaatselijke resolutie. c) 3D-volume per segment. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 16. Voorbeeld van 2D-klassen. (a) Goede klassen met een zekere mate van detail. b) Slechte klassen die ruis en artefacten bevatten (bovenste deel verkregen met Xmipp, onderste met CryoSparc). Klik hier om een grotere versie van deze figuur te bekijken. Figuur 17. Voorbeeld van een 3D-initieel volume met verschillende kwaliteiten. (a) Goed beginvolume waar de vorm van het macromolecuul kan worden waargenomen. b) Slecht beginvolume waarbij de verkregen vorm volledig afwijkt van de verwachte vorm. Klik hier om een grotere versie van deze figuur te bekijken. Aanvullende figuur 1. Het creëren van een Scipion project. Venster weergegeven door Scipion waar een oud project kan worden geselecteerd of een nieuw project kan worden gemaakt met een naam en een locatie voor dat project. Klik hier om dit bestand te downloaden. Aanvullende figuur 2. Methode Films importeren. Venster weergegeven door Scipion wanneer pwem – import films is geopend. Hier moeten de belangrijkste acquisitieparameters worden opgenomen om de beschikbare films in Scipion te laten verwerken. Klik hier om dit bestand te downloaden. Aanvullende figuur 3. Methode voor filmuitlijning. Venster weergegeven door Scipion wanneer xmipp3 – optische uitlijning wordt gebruikt. De invoerfilms, het bereik van frames die in aanmerking komen voor uitlijning en enkele andere parameters om de films te verwerken, moeten worden gevuld. Klik hier om dit bestand te downloaden. Aanvullende figuur 4. CTF schattingsmethode met Ctffind. Het formulier in Scipion met alle benodigde velden om het programma Ctffind uit te voeren. Klik hier om dit bestand te downloaden. Aanvullende figuur 5. Wizard in Scipion. Een wizard om de gebruiker te helpen bij het invullen van enkele parameters in het formulier. In dit geval moet de wizard het resolutieveld in de methode grigoriefflab – ctffind voltooien. Klik hier om dit bestand te downloaden. Aanvullende figuur 6. CTF verfijningsmethode met Xmipp. De vorm van xmipp3 – ctf schatting met alle parameters om een verfijning te maken van een eerder geschatte CTF. Klik hier om dit bestand te downloaden. Aanvullende figuur 7. Preprocess micrographs methode. De vorm van xmipp3 – voorbewerkt micrografieën die het mogelijk maken om sommige bewerkingen over hen uit te voeren. In dit voorbeeld zijn Verwijder slechte pixels en Downsample micrografieën de nuttige. Klik hier om dit bestand te downloaden. Aanvullende figuur 8. Plukmethode met Cryolo. Het formulier om de Cryolo-pickingmethode uit te voeren met behulp van een voorgetraind netwerk. Klik hier om dit bestand te downloaden. Aanvullende figuur 9. Consensus picking methode met Xmipp. De vorm van xmipp3 – diepe consensus picking op basis van deep learning om een consensus van coördinaten te berekenen, met behulp van een voorgetraind netwerk over verschillende sets coördinaten verkregen met verschillende pickmethoden. Klik hier om dit bestand te downloaden. Aanvullende figuur 10. Extract deeltjes methode. Invoer- en voorbewerkingstabbladen van xmipp3 – extraheer deeltjes. Klik hier om dit bestand te downloaden. Aanvullende figuur 11.3D initiële volumemethode met Xmipp. De vorm van de methode xmipp3 – reconstrueren significant om een eerste 3D-kaart te verkrijgen. De tabbladen Invoer en Criteria worden weergegeven. Klik hier om dit bestand te downloaden. Aanvullende figuur 12. Volumegrootte wijzigen methode. De vorm voor het maken van een bijsnijding of het formaat van een volume. In dit voorbeeld wordt deze methode gebruikt om een volume van volledige grootte te genereren na xmipp3 – significant reconstrueren. Klik hier om dit bestand te downloaden. Aanvullende figuur 13.3D eerste volume met Relion resultaat. Een weergave van het verkregen 3D initiële volume met relion – 3D initiële modelmethode per plak. Klik hier om dit bestand te downloaden. Aanvullende figuur 14. Verfijning van het eerste deel met Relion. De vorm van de methode relion – 3D auto-refine. In dit voorbeeld werd het gebruikt om een initieel volume te verfijnen dat na consensus werd geschat. De tabbladen Invoer en Referentie 3D-kaart worden weergegeven. Klik hier om dit bestand te downloaden. Aanvullende figuur 15.3D classificatiemethode. Vorm van relion – 3D-classificatie. De tabbladen Invoer, Referentie 3D-kaart en Optimalisatie worden weergegeven. Klik hier om dit bestand te downloaden. Aanvullende figuur 16.3D alignment op basis van een deep learning methode. Het formulier geopend voor de methode xmipp3 – diepe uitlijning. Hier is het noodzakelijk om een netwerk te trainen met een trainingsset, dan zal dat netwerk de hoektoewijzing per deeltje voorspellen. Klik hier om dit bestand te downloaden. Aanvullende figuur 17.3D verfijningsmethode. Vorm van de xmipp3 – highres-methode . Tabbladen Invoer en Hoektoewijzing worden weergegeven. Klik hier om dit bestand te downloaden. Aanvullende figuur 18. Eerste iteratie van 3D verfijning resultaat. a) FSC-curve. b) Verkregen volume (kleiner dan de volledige resolutie) weergegeven als segmenten. Klik hier om dit bestand te downloaden. Aanvullende figuur 19. Eerste iteratie van 3D verfijning correlatie analyse. Er verschijnt een nieuw venster door op het balkpictogram in het bovenste deel van het venster met de lijst met deeltjes te klikken. In het venster Kolommen plot kan een histogram van de gewenste geschatte parameter worden gemaakt. Klik hier om dit bestand te downloaden. Aanvullende figuur 20. Validatie overfitting tool. Vorm van xmipp3 – valideer de overfitting-methode . Klik hier om dit bestand te downloaden.

Discussion

Momenteel is cryo-EM een belangrijk hulpmiddel om de 3D-structuur van biologische monsters te onthullen. Wanneer goede gegevens met de microscoop worden verzameld, zullen de beschikbare verwerkingstools ons in staat stellen om een 3D-reconstructie van het bestudeerde macromolecuul te verkrijgen. Cryo-EM-gegevensverwerking is in staat om een bijna atomaire resolutie te bereiken, wat de sleutel is tot het begrijpen van het functionele gedrag van een macromolecuul en ook cruciaal is bij het ontdekken van geneesmiddelen.

Scipion is een software die het mogelijk maakt om de hele workflow te creëren door de meest relevante beeldverwerkingspakketten op een integratieve manier te combineren, wat de traceerbaarheid en reproduceerbaarheid van de volledige beeldverwerkingsworkflow ten goede komt. Scipion biedt een zeer complete set tools om de verwerking uit te voeren; het verkrijgen van hoge resolutie reconstructies hangt echter volledig af van de kwaliteit van de verkregen gegevens en hoe deze gegevens worden verwerkt.

Om een 3D-reconstructie met hoge resolutie te krijgen, is de eerste vereiste om goede films van de microscoop te verkrijgen, die structurele informatie tot hoge resolutie bewaren. Als dit niet het geval is, kan de workflow geen high-definition informatie uit de gegevens extraheren. Vervolgens moet een succesvolle verwerkingsworkflow in staat zijn om deeltjes te extraheren die echt overeenkomen met de structuur en om de oriëntaties van deze deeltjes in de 3D-ruimte te vinden. Als een van de stappen in de workflow mislukt, gaat de kwaliteit van het gereconstrueerde volume achteruit. Scipion maakt het mogelijk om verschillende pakketten te gebruiken in een van de verwerkingsstappen, wat helpt om de meest adequate aanpak te vinden om de gegevens te verwerken. Bovendien kunnen, dankzij het beschikbaar hebben van vele pakketten, consensustools worden gebruikt, die de nauwkeurigheid vergroten door overeenstemming te vinden in de geschatte outputs van verschillende methoden. Ook is het in detail besproken in de sectie Representatieve resultaten verschillende validatietools en hoe u nauwkeurige en onnauwkeurige resultaten in elke stap van de workflow kunt identificeren, potentiële problemen kunt detecteren en hoe u kunt proberen ze op te lossen. Er zijn verschillende checkpoints langs het protocol die kunnen helpen om te beseffen of het protocol goed werkt of niet. Enkele van de meest relevante zijn: picking, 2D-classificatie, initiële volumeschatting en 3D-uitlijning. Het controleren van de invoer, het herhalen van de stap met een andere methode of het gebruik van consensus zijn beschikbare opties in Scipion die de gebruiker kan gebruiken om oplossingen te vinden wanneer er problemen optreden.

Met betrekking tot de vorige benaderingen van pakketintegratie in het Cryo-EM-veld, is Appion31 de enige die echte integratie van verschillende softwarepakketten mogelijk maakt. Appion is echter nauw verbonden met Leginon32, een systeem voor het geautomatiseerd verzamelen van beelden van elektronenmicroscopen. Het belangrijkste verschil met Scipion is dat datamodel en opslag minder gekoppeld zijn. Op deze manier hoeft er voor het maken van een nieuw protocol in Scipion alleen een Python-script te worden ontwikkeld. In Appion moet de ontwikkelaar echter het script schrijven en de onderliggende database wijzigen. Samenvattend is Scipion ontwikkeld om onderhoud en uitbreidbaarheid te vereenvoudigen.

We hebben in dit manuscript een complete workflow voor Cryo-EM verwerking gepresenteerd, met behulp van de real case dataset van het Plasmodium falciparum 80S Ribosoom (EMPIAR entry: 10028, EMDB entry: 2660). De stappen die hier worden behandeld en besproken, kunnen worden samengevat als filmuitlijning, CTF-schatting, deeltjesselectie, 2D-classificatie, initiële kaartschatting, 3D-classificatie, 3D-verfijning, evaluatie en nabewerking. Er zijn verschillende pakketten gebruikt en in verschillende van deze stappen zijn consensustools toegepast. Het uiteindelijke 3D gereconstrueerde volume bereikte een resolutie van 3 Å en in het nabewerkte volume kunnen enkele secundaire structuren worden onderscheiden, zoals alfa-helices, die helpen beschrijven hoe atomen in de ruimte zijn gerangschikt.

De workflow die in dit manuscript wordt gepresenteerd, laat zien hoe Scipion kan worden gebruikt om verschillende Cryo-EM-pakketten op een eenvoudige en integratieve manier te combineren om de verwerking te vereenvoudigen en tegelijkertijd een betrouwbaarder resultaat te verkrijgen.

In de toekomst zal de ontwikkeling van nieuwe methoden en pakketten blijven groeien en software zoals Scipion om ze allemaal gemakkelijk te integreren zal nog belangrijker zijn voor de onderzoekers. Consensusbenaderingen zullen zelfs dan relevanter zijn, wanneer er veel methoden met verschillende basis beschikbaar zullen zijn, waardoor nauwkeurigere schattingen kunnen worden verkregen van alle parameters die betrokken zijn bij het reconstructieproces in Cryo-EM. Tracking en reproduceerbaarheid zijn de sleutel in het onderzoeksproces en gemakkelijker te bereiken met Scipion dankzij het hebben van een gemeenschappelijk kader voor de uitvoering van volledige workflows.

Disclosures

The authors have nothing to disclose.

Acknowledgements

De auteurs willen graag economische steun erkennen van: Het Spaanse ministerie van Wetenschap en Innovatie door middel van subsidies: PID2019-104757RB-I00 / AEI / 10.13039 / 501100011033, de “Comunidad Autónoma de Madrid” via Grant: S2017 / BMD-3817, Instituto de Salud Carlos III, PT17 / 0009 / 0010 (ISCIII-SGEFI / EFRO), Europese Unie (EU) en Horizon 2020 door middel van subsidie: INSTRUCT – ULTRA (INFRADEV-03-2016-2017, Voorstel: 731005), EOSC Life (INFRAEOSC-04-2018, Voorstel: 824087), iNEXT – Discovery (Voorstel: 871037) en HighResCells (ERC – 2018 – SyG, Voorstel: 810057). Het project dat aanleiding gaf tot deze resultaten kreeg de steun van een fellowship van “la Caixa” Foundation (ID 100010434). De fellowshipcode is LCF/BQ/DI18/11660021. Dit project heeft financiering ontvangen van het Horizon 2020 onderzoeks- en innovatieprogramma van de Europese Unie in het kader van de Marie Skłodowska-Curie-subsidieovereenkomst nr. 713673. De auteurs erkennen de steun en het gebruik van middelen van Instruct, een Landmark ESFRI-project.

Materials

no material is used in this article

References

  1. Nogales, E. The development of cryo-EM into a mainstream structural biology technique. Nature Methods. 13 (1), 24-27 (2016).
  2. Kühlbrandt, W. The Resolution Revolution. Science. 343 (6178), 1443-1444 (2014).
  3. . 1.15 A structure of human apoferritin obtained from Titan Mono- BCOR microscope Available from: https://www.rcsb.org/structure/7A6A (2021)
  4. Arnold, S. A., et al. Miniaturizing EM Sample Preparation: Opportunities, Challenges, and “Visual Proteomics”. PROTEOMICS. 18 (5-6), 1700176 (2018).
  5. Faruqi, A. R., McMullan, G. Direct imaging detectors for electron microscopy. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment. 878, 180-190 (2018).
  6. Vilas, J. L., et al. Advances in image processing for single-particle analysis by electron cryomicroscopy and challenges ahead. Current Opinion in Structural Biology. 52, 127-145 (2018).
  7. Martinez, M., et al. Integration of Cryo-EM Model Building Software in Scipion. Journal of Chemical Information and Modeling. 60, 2533-2540 (2020).
  8. de la Rosa-Trevín, J. M., et al. Scipion: A software framework toward integration, reproducibility and validation in 3D electron microscopy. Journal of Structural Biology. 195, 93-99 (2016).
  9. de la Rosa-Trevín, J. M., et al. Xmipp 3.0: an improved software suite for image processing in electron microscopy. Journal of Structural Biology. 184, 321-328 (2013).
  10. Scheres, S. H. W. . Methods in Enzymology. The Resolution Revolution: Recent Advances In cryoEM. , 125-157 (2016).
  11. Punjani, A., Rubinstein, J. L., Fleet, D. J., Brubaker, M. A. cryoSPARC: algorithms for rapid unsupervised cryo-EM structure determination. Nature Methods. 14, 290-296 (2017).
  12. Ludtke, S. J. 3-D structures of macromolecules using single-particle analysis in EMAN. Methods in Molecular Biology. 673, 157-173 (2010).
  13. Shaikh, T. R., et al. SPIDER image processing for single-particle reconstruction of biological macromolecules from electron micrographs. Nature Protocols. 3, 1941-1974 (2008).
  14. Wagner, T., et al. SPHIRE-crYOLO is a fast and accurate fully automated particle picker for cryo-EM. Communications Biology. 2, (2019).
  15. Mindell, J. A., Grigorieff, N. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology. 142, 334-347 (2003).
  16. Winn, M. D., et al. Overview of the CCP4 suite and current developments. Acta crystallographica. Section D, Biological crystallography. 67, 235-242 (2011).
  17. Liebschner, D., et al. Macromolecular structure determination using X-rays, neutrons and electrons: recent developments in Phenix. Acta Crystallographica Section D. 75, 861-887 (2019).
  18. Wong, W., et al. Cryo-EM structure of the Plasmodium falciparum 80S ribosome bound to the anti-protozoan drug emetine. eLife. 3, 03080 (2014).
  19. Abrishami, V., et al. Alignment of direct detection device micrographs using a robust Optical Flow approach. Journal of Structural Biology. 189, 163-176 (2015).
  20. Sorzano, C. O. S., Jonic, S., Nunez Ramirez, R., Boisset, N., Carazo, J. M. Fast, robust and accurate determination of transmission electron microscopy contrast transfer function. Journal of Structural Biology. 160, 249-262 (2007).
  21. Abrishami, V., et al. A pattern matching approach to the automatic selection of particles from low-contrast electron micrographs. Bioinformatics. 29, 2460-2468 (2013).
  22. Sanchez-Garcia, R., Segura, J., Maluenda, D., Carazo, J. M., Sorzano, C. O. S. Deep Consensus, a deep learning-based approach for particle pruning in cryo-electron microscopy. IUCrJ. 5, 854-865 (2018).
  23. Sorzano, C. O. S., et al. A clustering approach to multireference alignment of single-particle projections in electron microscopy. Journal of Structural Biology. 171, 197-206 (2010).
  24. Sorzano, C. O. S., et al. A statistical approach to the initial volume problem in Single Particle Analysis by Electron Microscopy. Journal of Structural Biology. 189, 213-219 (2015).
  25. Sorzano, C. O. S., et al. Swarm optimization as a consensus technique for Electron Microscopy Initial Volume. Applied Analysis and Optimization. 2, 299-313 (2018).
  26. Pettersen, E. F., et al. UCSF Chimera–a visualization system for exploratory research and analysis. Journal of computational chemistry. 25, 1605-1612 (2004).
  27. Sorzano, C. O. S., et al. A new algorithm for high-resolution reconstruction of single particles by electron microscopy. Journal of Structural Biology. 204, 329-337 (2018).
  28. Vilas, J. L., et al. MonoRes: Automatic and Accurate Estimation of Local Resolution for Electron Microscopy Maps. Structure. 26, 337-344 (2018).
  29. Ramirez-Aportela, E., et al. Automatic local resolution-based sharpening of cryo-EM maps. Bioinformatics. 36, 765-772 (2020).
  30. Heymann, J. B. Validation of 3D EM Reconstructions: The Phantom in the Noise. AIMS Biophys. 2, 21-35 (2015).
  31. Lander, G. C., et al. Appion: An integrated, database-drive pipeline to facilitate EM image processing. Journal of Structural Biology. 166, 95-102 (2009).
  32. Suloway, C., et al. Automated molecular microscopy: The new Leginon system. Journal of Structural Biology. 151, 41-60 (2005).

Play Video

Cite This Article
Jiménez-Moreno, A., del Caño, L., Martínez, M., Ramírez-Aportela, E., Cuervo, A., Melero, R., Sánchez-García, R., Strelak, D., Fernández-Giménez, E., de Isidro-Gómez, F., Herreros, D., Conesa, P., Fonseca, Y., Maluenda, D., Jiménez de la Morena, J., Macías, J., Losana, P., Marabini, R., Carazo, J., Sorzano, C. Cryo-EM and Single-Particle Analysis with Scipion. J. Vis. Exp. (171), e62261, doi:10.3791/62261 (2021).

View Video