Un metodo avanzato di selezione delle particelle per la crio-EM, ovvero CryoSieve, migliora la risoluzione della mappa di densità rimuovendo la maggior parte delle particelle nelle pile finali, come dimostrato dalla sua applicazione su un set di dati del mondo reale.
Nell’ultimo decennio, i progressi tecnologici e metodologici nel campo della microscopia elettronica criogenica (cryo-EM) e dell’analisi di singole particelle (SPA) hanno notevolmente migliorato la nostra capacità di esaminare le macromolecole biologiche ad alta risoluzione. Questo progresso ha inaugurato una nuova era di intuizioni molecolari, sostituendo la cristallografia a raggi X come metodo dominante e fornendo risposte a domande di lunga data in biologia. Poiché la crio-EM non dipende dalla cristallizzazione, che è una limitazione significativa della cristallografia a raggi X, cattura particelle di qualità variabile. Di conseguenza, la selezione delle particelle è fondamentale, poiché la qualità delle particelle selezionate influenza direttamente la risoluzione della mappa di densità ricostruita. Un innovativo approccio iterativo per la selezione delle particelle, denominato CryoSieve, migliora significativamente la qualità delle mappe di densità ricostruite riducendo efficacemente il numero di particelle nella pila finale. L’evidenza sperimentale mostra che questo metodo può eliminare la maggior parte delle particelle nelle pile finali, con conseguente notevole miglioramento della qualità delle mappe di densità. Questo articolo descrive il flusso di lavoro dettagliato di questo approccio e ne illustra l’applicazione su un set di dati del mondo reale.
La microscopia elettronica criogenica (cryo-EM) e l’analisi di singole particelle (SPA) sono diventate un metodo dominante per determinare mappe di densità tridimensionali ad alta risoluzione di macromolecole biologiche. Grazie a una serie di innovazioni tecnologiche 1,2,3,4,5,6, denominate rivoluzionea risoluzione 7, la crio-EM ha la capacità di determinare le strutture di macromolecole biologiche con risoluzione fino a quella atomica a un ritmo senza precedenti. Questa scoperta segna l’inizio di una nuova era nelle intuizioni molecolari, superando la cristallografia a raggi X come tecnica predominante e rispondendo a domande biologiche di lunga data.
Cryo-EM SPA si discosta dalla cristallografia a raggi X non richiedendo la cristallizzazione di macromolecole biologiche. Invece, una soluzione contenente le macromolecole biologiche bersaglio viene rapidamente congelata nel ghiaccio vitreo. Viene quindi ripreso con un fascio di elettroni per produrre una serie di micrografie, bypassando la necessità di cristallizzazione8. Successivamente, vengono utilizzati algoritmi di prelievo delle particelle per estrarre singole particelle grezze da queste micrografie 4,9,10,11,12. Poiché la crio-EM non dipende dalla cristallizzazione, è naturale che le particelle estratte siano prevalentemente danneggiate o in stati conformazionali indesiderati, il che richiede più cicli di selezione delle particelle per ottenere una mappa di densità ad alta risoluzione. Nell’elaborazione delle immagini cryo-EM SPA, la selezione delle particelle è quindi fondamentale per ottenere mappe di densità ad alta risoluzione13.
Nella cryo-EM SPA, i metodi standard di selezione delle particelle includono la classificazione bidimensionale (2D) e tridimensionale (3D)14. La classificazione 2D classifica le particelle in un numero predefinito di gruppi, ottenendo un’immagine media e una risoluzione 2D stimata per ciascuna classe. I ricercatori possono quindi ispezionare visivamente queste classi, rimuovendo le particelle dai gruppi a risoluzione più bassa per utilizzare quelle rimanenti nelle ricostruzioni volte a ottenere una risoluzione più elevata. Una volta stabilite le pose delle particelle utilizzando algoritmi di raffinamento, i ricercatori procederanno con la classificazione 3D, raggruppando le particelle in più classi. Ciò consente l’ispezione visiva della mappa di densità ricostruita per ciascuna classe, consentendo l’esclusione di particelle indesiderate, come quelle provenienti da conformazioni indesiderate. Dopo diversi cicli di classificazione, si ottiene una pila finale comprendente particelle di qualità relativamente elevata. Queste pile finali sono strumentali nella produzione di mappe di densità a risoluzione atomica o quasi atomica.
Zhu e i suoi colleghi hanno dimostrato che un’ulteriore selezione delle particelle può essere condotta su queste pile finali15. CryoSieve15, un metodo iterativo innovativo per la selezione delle particelle, può essere applicato per migliorare la qualità della mappa di densità finale riducendo significativamente il numero di particelle. Mentre altri criteri e software di smistamento delle particelle, come il metodo di correlazione incrociata normalizzata (NCC)16, l’approccio di coerenza del grafo angolare (AGC)17 e la classificazione di non allineamento5, sono attualmente in uso nel campo, questo metodo ha dimostrato di superare questi algoritmi in termini di efficacia.
In questo studio, presentiamo una guida dettagliata all’intero processo. Come caso di studio, abbiamo applicato questo nuovo metodo al set di dati del trimero dell’emoagglutinina dell’influenza (voce EMPIR: 10097)18, che include 130.000 particelle nel suo stack finale. La nostra procedura ha scartato con successo circa il 73,8% delle particelle dalla pila finale di questo set di dati, migliorando la risoluzione della mappa di densità ricostruita da 4,11 Å a 3,62 Å. Oltre al trimero di emoagglutinina dell’influenza, i risultati di più set di dati sono presentati nella precedente pubblicazione15, che mostra una varietà di risoluzioni e pesi molecolari delle biomolecole.
La crio-EM rappresenta una tecnica fondamentale per chiarire le strutture delle molecole biologiche. In questo processo, dopo la raccolta dei dati tramite microscopia, è essenziale l’estrazione delle particelle dalle micrografie, seguita dalla loro classificazione in più fasi per compilare lo stack finale. Una sfida comune è la predominanza di particelle danneggiate o non conformate in modo indesiderabile, sottolineando la necessità di una selezione ripetuta delle particelle per ottenere mappe di densità ad alta risoluzione. Ciò rende la selezione delle particelle un passaggio fondamentale nella cryo-EM SPA per ottenere mappe di densità di alta qualità. Le tecniche di selezione delle particelle esistenti includono l’algoritmo di convalida statistica non-tilt22, l’approccio basato sullo z-score23 e il metodo di stima dell’accuratezza angolare24.
CryoSieve emerge come uno strumento prezioso in questo contesto, abile nell’eliminare un numero significativo di particelle estranee dalla pila finale. Questa riduzione non solo migliora l’efficienza computazionale della ricostruzione, ma semplifica anche il processo. Offre una suite completa per la selezione delle particelle, in cui l’entità degli scarti di particelle e il conseguente miglioramento della risoluzione dipendono in gran parte dalla qualità iniziale dei dati e dalle metodologie impiegate nell’elaborazione dei dati.
In questo manoscritto, abbiamo presentato un flusso di lavoro completo di setacciatura delle particelle utilizzando il set di dati del caso reale del trimero dell’emoagglutinina dell’influenza (voce EMPIAR: 10097). I passaggi trattati e discussi qui possono essere riassunti come setacciatura delle particelle e ri-stima della posa. Il volume finale ricostruito in 3D ha raggiunto una risoluzione di 3,62 Å e le catene laterali nelle alfa-eliche erano più chiare nel volume post-elaborato rispetto alla mappa di densità pubblicata.
CryoSieve è un metodo open source disponibile su GitHub (https://github.com/mxhulab/cryosieve). Un tutorial dettagliato è disponibile anche sulla sua homepage. Gli utenti possono installarlo e utilizzarlo seguendo il tutorial. Inoltre, vengono forniti due moduli, cryosieve-csrefine e cryosieve-csrhbfactor. Il modulo cryosieve-csrefine è stato creato appositamente per automatizzare l’esecuzione sequenziale di varie operazioni all’interno di CryoSPARC (Supplementary File 5). Queste operazioni includono l’importazione di pile di particelle e l’esecuzione di lavori di ab initio, raffinazione omogenea o raffinazione non uniforme. D’altra parte, il modulo cryosieve-csrhbfactor è progettato per automatizzare la determinazione del fattore B di Rosenthal-Henderson sfruttando le capacità di cryosieve-csrefine (File supplementare 6).
Attualmente, l’applicazione di questo metodo è limitata a scenari di singola conformazione. Di conseguenza, nei casi in cui le particelle rappresentano più conformazioni, le loro capacità sono limitate. Si consiglia agli utenti di impegnarsi inizialmente nella classificazione 3D per segregare le particelle di conformazioni disparate prima di utilizzarla per una selezione raffinata delle particelle. Inoltre, sebbene il metodo dimostri competenza nel filtrare oltre il 50% delle particelle dalla pila finale, le origini di queste particelle scartate e le ragioni alla base del loro trascurabile contributo alla qualità della ricostruzione rimangono poco chiare. Questa lacuna nella comprensione richiede ulteriori ricerche per affrontare in modo completo e potenzialmente correggere questa limitazione.
Esistono tre possibili metodi di selezione delle particelle o setacciamento delle particelle. Prima di tutto, cisTEM4 può riportare un punteggio per ogni singola immagine di particella dopo il raffinamento 3D. Gli utenti potevano ordinare le particelle utilizzando il punteggio cisTEM per scartare le particelle. L’approccio di coerenza angolare del grafo (AGC)17 è anche un metodo per scartare le particelle disallineate. Inoltre, la classificazione di non allineamento5 è un modo tradizionale per scartare le particelle utilizzando la classificazione 3D. Abbiamo confrontato la qualità delle particelle trattenute con questi metodi con CryoSieve e abbiamo scoperto che le particelle trattenute di CryoSieve sono di qualità superiore15. Il metodo qui presentato supera significativamente i metodi alternativi e raggiunge il minor numero di particelle alla stessa risoluzione.
Come dimostrato nel risultato, la maggior parte delle particelle in una pila finale di crio-EM non contribuisce alla ricostruzione della mappa di densità. In altre parole, tra tutte le particelle raccolte durante l’acquisizione dell’immagine, solo poche selezionate, vale a dire il sottoinsieme più fine, contribuiscono effettivamente alla ricostruzione finale. Di conseguenza, il rapporto tra questo sottoinsieme finale e il numero totale di particelle raccolte potrebbe fungere da metrica quantitativa per valutare la qualità del campione. Più alto è questo rapporto, migliore è la qualità del campione. Nonostante i progressi tecnici che hanno reso la crio-EM più accessibile ai biologi strutturali, la preparazione dei campioni rimane un grosso collo di bottiglia nel flusso di lavoro. Scienziati e ingegneri stanno quindi concentrando i loro sforzi su questa sfida25. Nell’analisi di singole particelle (SPA), la preparazione del campione consiste in due fasi cruciali: l’ottimizzazione del campione e la preparazione della griglia. Il primo consiste nel purificare il campione mantenendo il suo stato biochimico ottimale. Quest’ultimo comporta la preparazione del campione per l’analisi al microscopio, compreso il trattamento chimico o al plasma della griglia, la deposizione del campione e la vetrificazione. Sono state proposte numerose tecniche per affrontare l’instabilità macromolecolare, ma l’efficacia di un approccio rispetto ad un altro dipende dalle caratteristiche del campione 25,26. Attualmente, i risultati della preparazione della rete sono fortemente influenzati dalla competenza e dall’esperienza dell’utente, il che può rendere il processo lungo e impegnativo27,28. Le numerose variabili incontrate nella preparazione del campione e della griglia pongono sfide nello stabilire relazioni di causa-effetto, poiché i ricercatori possono valutare il campione solo a livello molecolare utilizzando il microscopio. Di conseguenza, mancano ancora statistiche quantitative derivanti dal confronto di diversi protocolli di preparazione del campione e della griglia ed è necessario un approccio sistematico per indagare le tendenze e comprendere i meccanismi fondamentali del comportamento del campione29.
The authors have nothing to disclose.
Questo lavoro è stato sostenuto dall’Accademia di ricerca e traduzione di Shenzhen (a M.H.), dal Centro di innovazione avanzata per la biologia strutturale (a M.H.), dal Centro di ricerca di frontiera di Pechino per la struttura biologica (a M.H.), dal National Key R&D Program of China (No.2021YFA1001300) (a C.B.), dalla National Natural Science Foundation of China (No.12271291) (a C.B.), e la National Natural Science Foundation of China (No.12071244) (alla Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |