Summary

Análisis crio-EM y de partículas individuales con Scipion

Published: May 29, 2021
doi:

Summary

El análisis de partículas individuales en microscopía crioelectrónica es una de las principales técnicas utilizadas para determinar la estructura de conjuntos biológicos a alta resolución. Scipion proporciona las herramientas para crear toda la tubería para procesar la información adquirida por el microscopio y lograr una reconstrucción en 3D del espécimen biológico.

Abstract

La microscopía crioelectrónica se ha convertido en una de las herramientas más importantes en la investigación biológica para revelar la información estructural de las macromoléculas a una resolución casi atómica. En el análisis de una sola partícula, la muestra vitrificada es fotografiada por un haz de electrones y los detectores al final de la columna del microscopio producen películas de esa muestra. Estas películas contienen miles de imágenes de partículas idénticas en orientaciones aleatorias. Los datos deben pasar por un flujo de trabajo de procesamiento de imágenes con múltiples pasos para obtener el volumen final reconstruido en 3D. El objetivo del flujo de trabajo de procesamiento de imágenes es identificar los parámetros de adquisición para poder reconstruir el espécimen en estudio. Scipion proporciona todas las herramientas para crear este flujo de trabajo utilizando varios paquetes de procesamiento de imágenes en un marco integrador, lo que también permite la trazabilidad de los resultados. En este artículo se presenta y discute todo el flujo de trabajo de procesamiento de imágenes en Scipion con datos procedentes de un caso de prueba real, dando todos los detalles necesarios para pasar de las películas obtenidas por el microscopio a una reconstrucción 3D final de alta resolución. Además, se discute el poder de usar herramientas de consenso que permiten combinar métodos y confirmar resultados a lo largo de cada paso del flujo de trabajo, mejorando la precisión de los resultados obtenidos.

Introduction

En la microscopía crioelectrónica (crio-EM), el análisis de partículas individuales (SPA) de especímenes vitrificados congelados-hidratados es una de las variantes de imagen más utilizadas y exitosas para macromoléculas biológicas, ya que permite comprender las interacciones moleculares y la función de los conjuntos biológicos1. Esto es gracias a los recientes avances en esta técnica de imagen que dieron lugar a la “revolución de la resolución”2 y han permitido la determinación exitosa de estructuras biológicas 3D con resolución casi atómica. Actualmente, la resolución más alta alcanzada en SPA cryo-EM fue de 1,15 Å para apoferritina3 (entrada EMDB: 11668). Estos avances tecnológicos comprenden mejoras en la preparación de muestras4, la adquisición de imágenes5 y los métodos de procesamiento de imágenes6. Este artículo se centra en este último punto.

Brevemente, el objetivo de los métodos de procesamiento de imágenes es identificar todos los parámetros de adquisición para invertir el proceso de imagen del microscopio y recuperar la estructura 3D del espécimen biológico en estudio. Estos parámetros son la ganancia de la cámara, el movimiento inducido por el haz, las aberraciones del microscopio (principalmente el desenfoque), la orientación angular 3D y la traslación de cada partícula, y el estado conformacional en caso de tener un ejemplar con cambios conformacionales. Sin embargo, el número de parámetros es muy alto y la crio-EM requiere el uso de imágenes de dosis bajas para evitar el daño por radiación, lo que reduce significativamente la relación señal-ruido (SNR) de las imágenes adquiridas. Por lo tanto, el problema no se puede resolver inequívocamente y todos los parámetros a calcular solo pueden ser estimaciones. A lo largo del flujo de trabajo de procesamiento de imágenes, se deben identificar los parámetros correctos, descartando los restantes para finalmente obtener una reconstrucción 3D de alta resolución.

Los datos generados por el microscopio se recogen en marcos. Simplificando, un marco contiene el número de electrones que han llegado a una posición particular (píxel) en la imagen, siempre que se utilicen detectores de conteo de electrones. En un campo de visión particular, se recopilan varios fotogramas y esto se llama película. Como se utilizan dosis bajas de electrones para evitar daños por radiación que podrían destruir la muestra, el SNR es muy bajo y los fotogramas correspondientes a la misma película deben promediarse para obtener una imagen que revele información estructural sobre la muestra. Sin embargo, no solo se aplica un promedio simple, la muestra puede sufrir cambios y otros tipos de movimientos durante el tiempo de imagen debido al movimiento inducido por el haz que deben compensarse. Los fotogramas compensados por desplazamiento y promediados originan una micrografía.

Una vez obtenidas las micrografías, necesitamos estimar las aberraciones introducidas por el microscopio para cada una de ellas, llamada Función de Transferencia de Contraste (CTF), que representa los cambios en el contraste de la micrografía en función de la frecuencia. Luego, las partículas se pueden seleccionar y extraer, lo que se denomina recolección de partículas. Cada partícula debe ser una pequeña imagen que contenga solo una copia de la muestra en estudio. Hay tres familias de algoritmos para la selección de partículas: 1) los que solo utilizan cierta parametrización básica de la apariencia de la partícula para encontrarlos en todo el conjunto de micrografías (por ejemplo, el tamaño de partícula), 2) los que aprenden cómo se ven las partículas del usuario o un conjunto preentrenado, y 3) los que usan plantillas de imágenes. Cada familia tiene diferentes propiedades que se mostrarán más adelante.

El conjunto extraído de partículas que se encuentran en las micrografías se utilizará en un proceso de clasificación 2D que tiene dos objetivos: 1) limpiar el conjunto de partículas descartando el subconjunto que contiene imágenes de ruido puro, partículas superpuestas u otros artefactos, y 2) las partículas promediadas que representan cada clase podrían usarse como información inicial para calcular un volumen inicial 3D.

El cálculo del volumen inicial en 3D es el siguiente paso crucial. El problema de obtener la estructura 3D puede verse como un problema de optimización en un panorama de soluciones multidimensionales, donde el mínimo global es el mejor volumen 3D que representa la estructura original, pero se pueden encontrar varios mínimos locales que representan soluciones subóptimas, y donde es muy fácil quedar atrapado. El volumen inicial representa el punto de partida para el proceso de búsqueda, por lo que una mala estimación del volumen inicial podría impedirnos encontrar el mínimo global. A partir del volumen inicial, un paso de clasificación 3D ayudará a descubrir diferentes estados conformacionales y a limpiar nuevamente el conjunto de partículas; el objetivo es obtener una población estructuralmente homogénea de partículas. Después de eso, un paso de refinamiento 3D se encargará de refinar los parámetros angulares y de traslación para cada partícula para obtener el mejor volumen 3D posible.

Finalmente, en los últimos pasos, la reconstrucción 3D obtenida se puede afilar y pulir. El afilado es un proceso de aumento de las altas frecuencias del volumen reconstruido, y el pulido es un paso para refinar aún más algunos parámetros, como CTF o compensación de movimiento inducida por haz, a nivel de partículas. Además, se podrían utilizar algunos procedimientos de validación para comprender mejor la resolución lograda al final del flujo de trabajo.

Después de todos estos pasos, los procesos de trazado y acoplamiento7 ayudarán a dar un significado biológico a la reconstrucción 3D obtenida, mediante la construcción de modelos atómicos de novo o el ajuste de modelos existentes. Si se logra una alta resolución, estos procesos nos dirán las posiciones de las estructuras biológicas, incluso de los diferentes átomos, en nuestra estructura.

Scipion8 permite crear todo el flujo de trabajo combinando los paquetes de procesamiento de imágenes más relevantes de forma integradora. Xmipp9, Relion10, CryoSPARC11, Eman12, Spider13, Cryolo14, Ctffind15, CCP416, Phenix17 y muchos más paquetes se pueden incluir en Scipion. Además, incorpora todas las herramientas necesarias para beneficiar la integración, interoperabilidad, trazabilidad y reproducibilidad para realizar un seguimiento completo de todo el flujo de trabajo de procesamiento de imágenes8.

Una de las herramientas más poderosas que Scipion nos permite utilizar es el consenso, que significa comparar los resultados obtenidos con varios métodos en un paso del procesamiento, haciendo una combinación de la información transmitida por diferentes métodos para generar una salida más precisa. Esto podría ayudar a aumentar el rendimiento y mejorar la calidad alcanzada en los parámetros estimados. Tenga en cuenta que se puede crear un flujo de trabajo más simple sin el uso de métodos de consenso; sin embargo, hemos visto el poder de esta herramienta22,25 y el flujo de trabajo presentado en este manuscrito la utilizará en varios pasos.

Todos los pasos que se han resumido en los párrafos anteriores se explicarán en detalle en la siguiente sección y se combinarán en un flujo de trabajo completo utilizando Scipion. Asimismo, se mostrará cómo utilizar las herramientas de consenso para lograr un mayor acuerdo en los outputs generados. Con ese fin, se ha elegido el conjunto de datos de ejemplo del ribosoma Plasmodium falciparum 80S (entrada EMPIAR: 10028, entrada EMDB: 2660). El conjunto de datos está formado por 600 películas de 16 fotogramas de tamaño 4096×4096 píxeles a un tamaño de píxel de 1.34Å tomadas en una FEI POLARA 300 con una cámara FEI FALCON II, con una resolución reportada en EMDB es 3.2Å18.

Protocol

1. Crear un proyecto en Scipion e importar los datos Abra Scipion y haga clic en Crear proyecto, especifique el nombre del proyecto y la ubicación donde se guardará (Figura suplementaria 1). Scipion abrirá la ventana del proyecto mostrando un lienzo con, en el lado izquierdo, un panel con una lista de métodos disponibles, cada uno de ellos representa una herramienta de procesamiento de imágenes que se puede utilizar para administrar datos.Nota : Ctrl + F se puede utilizar para buscar un método si no aparece en la lista. Para importar las películas tomadas por el microscopio, seleccione el pwem – importar películas en el panel izquierdo (o escríbalo presionando Ctrl + F). Se abrirá una nueva ventana (Figura suplementaria 2). Allí, incluya la ruta a los datos y los parámetros de adquisición. En este ejemplo, utilice la siguiente configuración: Voltaje del microscopio 300 kV, Aberración esférica 2,0 mm, Contraste de amplitud 0,1, Tasa de aumento 50000, Modo de frecuencia de muestreo a Desde imagen y Tamaño de píxel 1,34 Å. Cuando se completen todos los parámetros del formulario, haga clic en el botón Ejecutar .Nota : cuando se inicia un método, aparece un cuadro en el lienzo en color amarillo etiquetado como en ejecución. Cuando finaliza un método, el cuadro cambia a verde y la etiqueta cambia a terminado. En caso de error durante la ejecución de un método, el cuadro aparecerá en rojo, etiquetado como fallido. En ese caso, verifique la parte inferior del lienzo, en la pestaña Registro de salida aparecerá una explicación del error. Cuando finalice el método, compruebe los resultados en la parte inferior del lienzo en la pestaña Resumen . Aquí, se presentan las salidas generadas por el método, en este caso, el conjunto de películas. Haga clic en el botón Analizar resultados y aparecerá una nueva ventana con la lista de películas. 2. Alineación de películas: de películas a micrografías Utilice el método xmipp3 – alineación óptica que implementa flujo óptico19. Utilice los siguientes parámetros para rellenar el formulario (Figura suplementaria 3): las películas de entrada son las obtenidas en el paso 1, el rango en fotogramas para ALINEAR es de 2 a 13, las otras opciones se quedan con los valores predeterminados. Ejecute el programa.NOTA: Los parámetros en negrita en un formulario deben rellenarse siempre. Los demás tendrán un valor predeterminado o no serán obligatorios. En la parte superior de la ventana de formulario, se pueden encontrar los campos donde se distribuyen los recursos computacionales, como subprocesos, MPIs o GPU. Haga clic en Analizar resultados para comprobar las micrografías obtenidas y la trayectoria de los desplazamientos estimados (Figura 1). Para cada micrografía vista: observe la densidad espectral de potencia (PSD), las trayectorias obtenidas para alinear la película (un punto por fotograma) en coordenadas cartesianas y polares, y el nombre de archivo de la micrografía obtenida (haciendo clic en ella, se puede inspeccionar la micrografía). Observe que las partículas de la muestra son mucho más visibles en la micrografía, en comparación con un solo fotograma de la película. 3. Estimación CTF: cálculo de las aberraciones del microscopio Primero, use el método grigoriefflab – ctffind15. La configuración es: las micrografías de entrada son la salida del paso 2, el factor de muestreo descendente CTF manual se establece en 1.5 y el rango de resolución va de 0.06 a 0.42. Además, en las opciones avanzadas (que se pueden encontrar seleccionando esta opción en el nivel experto del formulario), establezca el tamaño de la ventana en 256. Los parámetros restantes permanecen con los valores predeterminados (Figura suplementaria 4).NOTA: En la mayoría de los métodos de Scipion, la opción Avanzado muestra más parámetros de configuración. Utilice estas opciones con cuidado, cuando el programa a lanzar se conozca completamente y se entienda el significado de los parámetros. Algunos parámetros pueden ser difíciles de completar sin echar un vistazo a los datos; en ese caso, Scipion muestra una varita mágica en el lado derecho que mostrará una ventana del asistente (Figura suplementaria 5). Por ejemplo, en el campo Resolución de este formulario es especialmente útil, ya que estos valores deben seleccionarse para cubrir aproximadamente la región desde el primer cero hasta el último anillo notable de la DSP. Haga clic en Ejecutar y en Analizar resultados (Figura 2) cuando finalice el método. Compruebe que el CTF estimado coincide con el experimental. Con ese fin, mire el PSD y compare los anillos estimados en la esquina con los que provienen de los datos. También verifique los valores de desenfoque obtenidos para encontrar valores inesperados y las micrografías respectivas se pueden descartar o volver a calcular. En este ejemplo, se puede utilizar todo el conjunto de micrografías.NOTA: Utilice los botones en la parte inferior de la ventana para hacer un subconjunto de micrografías (con el botón rojo Micrographs ) y para recalcular un CTF (con el botón rojo Recalcular CTFs ), en caso de necesidad. Para refinar la estimación anterior, utilice xmipp3 – ctf estimation20. Seleccione como Micrografías de entrada la salida del paso 2, seleccione la opción Usar defoci de una estimación CTF anterior, como Estimación CTF anterior elija la salida de grigoriefflab – ctffind y, en el nivel Avanzado, cambie el tamaño de la ventana a 256 (Figura suplementaria 6). Ejecútalo. Haga clic en Analizar resultados para comprobar los CTF obtenidos. Con este método, se estiman más datos y se representan en algunas columnas adicionales. Como ninguno de ellos muestra valores estimados incorrectos, todas las micrografías se utilizarán en los siguientes pasos. 4. Selección de partículas: encontrar partículas en las micrografías Antes de comenzar la recolección, realice un preproceso de las micrografías. Abra xmipp3 – preprocesar micrografías, establezca como micrografías de entrada las obtenidas en el paso 2 y seleccione las opciones ¿Eliminar píxeles defectuosos? con Múltiplo de Stddev a 5, y ¿Micrografías de muestra descendente? con un factor de muestreo descendente de 2 (Figura suplementaria 7). Haga clic en Ejecutar y compruebe que se ha reducido el tamaño de las micrografías resultantes. Para el picking use xmipp3 – selección manual (paso 1) y xmipp3 – selección automática (paso 2)21. El picking manual permite preparar manualmente un conjunto de partículas con las que el paso de auto-picking aprenderá y generará el conjunto completo de partículas. Primero, ejecute xmipp3 – selección manual (paso 1) con micrografías de entrada como las micrografías obtenidas en el preproceso anterior. Haga clic en Ejecutar y aparecerá una nueva ventana interactiva (Figura 3). En esta ventana se presenta una lista de las micrografías (Figura 3a) y otras opciones. Cambie el tamaño (px) a 150, este será el tamaño de la caja que contiene cada partícula. La micrografía seleccionada aparece en una ventana más grande. Elija una región y elija todas las partículas visibles en ella (Figura 3b). Luego, haga clic en Activar capacitación para iniciar el aprendizaje. Las regiones restantes de la micrografía se seleccionan automáticamente (Figura 3c). Verifique las partículas seleccionadas e incluya más haciendo clic en ellas, o elimine las incorrectas con mayús + clic, si es necesario. Seleccione la siguiente micrografía en la primera ventana. La micrografía se seleccionará automáticamente. Verifique nuevamente para incluir o eliminar algunas partículas, si es necesario. Repita este paso con, aproximadamente, 5 micrografías para crear un conjunto de entrenamiento representativo. Una vez hecho esto, haga clic en Coordenadas en la ventana principal para guardar las coordenadas de todas las partículas seleccionadas. El conjunto de partículas de entrenamiento está listo para ir a la selección automática para completar el proceso de todas las micrografías. Open xmipp3 – auto-picking (paso 2) indicando en Xmipp particle picking ejecutar el picking manual anterior, y Micrographs to pick as Same as supervised. Haga clic en Ejecutar. Este método generará como salida un conjunto de alrededor de 100000 coordenadas. Aplique un enfoque de consenso, así que lleve a cabo un segundo método de selección para seleccionar las partículas en las que ambos métodos están de acuerdo. Abra el esfín – criolo picking14 y seleccione las micrografías preprocesadas como Micrografías de entrada, ¿Usar modelo general? a Sí, con un umbral de confianza de 0,3 y un tamaño de caja de 150 (Figura suplementaria 8). Ejecútalo. Este método debe generar también alrededor de 100000 coordenadas. Ejecute xmipp3 – selección de consenso profundo22. Como las coordenadas de entrada incluyen la salida de esfín – criolóque (paso 4.7) y xmipp3 – selección automática (paso 4.6), establezca Seleccionar tipo de modelo en Preentrenado y Omitir entrenamiento y puntuar directamente con el modelo preentrenado? Al sí (Figura suplementaria 9). Ejecútalo. Haga clic en Analizar resultados y, en la nueva ventana, en el icono del ojo junto a Seleccionar partículas/coordenadas con valores altos de ‘zScoreDeepLearning1’. Se abrirá una nueva ventana con una lista de todas las partículas (Figura 4). Los valores de zScore en la columna dan una idea de la calidad de una partícula, los valores bajos significan mala calidad. Haga clic en la etiqueta_xmipp_zScoreDeepLearning para ordenar las partículas de mayor a menor zScore. Seleccione las partículas con zScore superior a 0,75 y haga clic en Coordenadas para crear el nuevo subconjunto. Esto debería crear un subconjunto con aproximadamente 50000 coordenadas. Open xmipp3 – limpiador de micrografía profunda. Seleccione como coordenadas de entrada el subconjunto obtenido en el paso anterior, micrografías obtiene el mismo que las coordenadas y mantenga el umbral en 0,75. Ejecútalo. Compruebe en la ficha Resumen que se ha reducido el número de coordenadas, aunque en este caso, solo se eliminan unas pocas coordenadas.NOTA: Este paso es capaz de limpiar adicionalmente el conjunto de coordenadas y podría ser muy útil en la limpieza de otros conjuntos de datos con más artefactos de película como zonas de carbono o grandes impurezas. Ejecutar xmipp3 – extraer partículas (Figura suplementaria 10). Indique como coordenadas de entrada las coordenadas obtenidas después del paso anterior, Micrographs source como otra, Input micrographs como la salida del paso 2, CTF estimation como la salida de la estimación xmipp3 – ctf, Downsampling factor a 3 y Particle box size a 100. En la pestaña Preprocesar del formulario, seleccione Sí a todos. Ejecútalo. Compruebe que la salida debe contener las partículas en un tamaño reducido de 100×100 píxeles y un tamaño de píxel de 4,02Å/px. Ejecute de nuevo xmipp3: extraiga partículas cambiando los siguientes parámetros: Factor de reducción de muestreo a 1 y Tamaño de caja de partículas a 300. Compruebe que la salida es el mismo conjunto de partículas, pero ahora a la resolución completa. 5. Clasificación 2D: agrupar partículas similares Abra el método cryosparc2 – 2d classification11 con partículas de entrada como las obtenidas en el paso 4.11 y, en la pestaña Clasificación 2D, el Número de clases a 128, mantenga todos los demás parámetros con los valores predeterminados. Ejecútalo. Haga clic en Analizar resultados y luego en el icono del ojo junto a Mostrar clases de partículas con Scipion (Figura 5). Esta clasificación ayudará a limpiar el conjunto de partículas, ya que varias clases aparecerán ruidosas o con artefactos. Seleccione las clases que contengan buenas vistas. Haga clic en Partículas (botón rojo en la parte inferior de la ventana) para crear el subconjunto más limpio. Ahora, abra xmipp3 – cl2d23 y establezca como imágenes de entrada las imágenes obtenidas en el paso anterior y Número de clases como 128. Haga clic en Ejecutar.NOTA: Esta segunda clasificación se utiliza como paso de limpieza adicional del conjunto de partículas. Por lo general, es útil para eliminar tantas partículas ruidosas como sea posible. Sin embargo, si se desea un flujo de trabajo más simple, solo se puede utilizar un método de clasificación 2D. Cuando finalice el método, verifique las 128 clases generadas haciendo clic en Analizar resultados y en Qué mostrar: clases. La mayoría de las clases generadas muestran una proyección de la macromolécula con cierto nivel de detalle. Sin embargo, algunos de ellos parecen ruidosos (en este ejemplo aproximadamente 10 clases). Seleccione todas las clases buenas y haga clic en el botón Clases para generar un nuevo subconjunto con solo las buenas. Este subconjunto se utilizará como entrada a uno de los métodos para generar un volumen inicial. Con las mismas clases seleccionadas, haga clic en Partículas para crear un subconjunto más limpio después de eliminar las que pertenecen a las clases incorrectas. Open pwem – subconjunto con conjunto completo de elementos como la salida de 4.13 (todas las partículas en el tamaño completo), Hacer subconjunto aleatorio a No, Otro conjunto como el subconjunto de partículas creadas en el paso anterior y Establecer operación como intersección. Esto extraerá el subconjunto anterior de las partículas a resolución completa. 6. Estimación inicial del volumen: construyendo la primera suposición del volumen 3D En este paso, estime dos volúmenes iniciales con diferentes métodos y luego use una herramienta de consenso para generar el volumen 3D estimado final. Open xmipp3 – reconstruya el método significant24 con clases Input como las obtenidas después del paso 5, symmetry group as c1, y mantenga los parámetros restantes con sus valores predeterminados (Figura suplementaria 11). Ejecutarlo. Haga clic en Analizar resultados. Compruebe que se obtiene un volumen de baja resolución de tamaño 100x100x100 píxeles y un tamaño de píxel de 4.02Å/px. Abrir xmipp3 – recortar/cambiar el tamaño de los volúmenes (Figura suplementaria 12) utilizando como volúmenes de entrada el obtenido en el paso anterior, ¿Cambiar el tamaño de los volúmenes? a Sí, Cambiar el tamaño de la opción a la frecuencia de muestreo y Cambiar el tamaño de la frecuencia de muestreo a 1,34 Å/px. Ejecútalo. Compruebe en la ficha Resumen que el volumen de salida tiene el tamaño correcto. Ahora, cree el segundo volumen inicial. Relion abierto – Modelo inicial 3D10, ya que las partículas de entrada usan las partículas buenas a resolución completa (salida de 5.5) y establecen el diámetro de la máscara de partículas en 402Å, mantenga los parámetros restantes con los valores predeterminados. Ejecútalo. Haga clic en Analizar resultados y luego en Mostrar volumen con: sectores. Comprobar que se obtiene un volumen de baja resolución pero con la forma principal de la estructura (Figura Suplementaria 13). Ahora, abra pwem – unir conjuntos para combinar los dos volúmenes iniciales generados para crear la entrada al método de consenso. Simplemente indique Volúmenes como tipo de entrada y seleccione los dos volúmenes iniciales en el conjunto de entrada. Ejecútalo. La salida debe ser un conjunto que contenga dos elementos con ambos volúmenes. La herramienta de consenso es la que se incluye en xmipp3 – swarm consensus25. Ábrela. Utilice como imágenes de tamaño completo las partículas buenas a resolución completa (salida de 5.5), como volúmenes iniciales el conjunto con dos elementos generados en el paso anterior, y asegúrese de que el grupo de simetría es c1. Haga clic en Ejecutar. Haga clic en Analizar resultados. Compruebe que se obtiene un volumen de salida más detallado (Figura 6). Aunque hay más ruido alrededor de la estructura, tener más detalles en el mapa de la estructura ayudará a los siguientes pasos de refinamiento para evitar mínimos locales.NOTA: Si UCSF Chimera26 está disponible, utilice el último icono en la parte superior de la ventana para realizar una visualización 3D del volumen obtenido. Abra y ejecute relion – 3D auto-refine10 para hacer una primera asignación angular 3D de las partículas. Seleccione como partículas de entrada la salida de 5,5 y establezca el diámetro de la máscara de partículas en 402Å. En la pestaña Mapa 3D de referencia, seleccione como volumen de entrada el obtenido en el paso anterior, Simetría como c1 y Filtro inicial de paso bajo a 30Å (Figura suplementaria 14). Haga clic en Analizar resultados. En la nueva ventana seleccione final como Volumen para visualizar y haga clic en Mostrar volumen con: sectores para ver el volumen obtenido. Compruebe también la correlación de shell de Fourier (FSC) haciendo clic en Gráficos de resolución de pantalla en la ventana de resultados y la cobertura angular en Mostrar distribución angular: gráfico 2D (Figura 7). El volumen reconstruido contiene muchos más detalles (probablemente con algunas áreas borrosas en la parte exterior de la estructura), y el FSC cruza el umbral de 0.143 alrededor de 4.5Å. La cobertura angular cubre toda la esfera 3D. 7.3D clasificación: descubriendo estados conformacionales Utilizando un enfoque de consenso, si hay diferentes estados conformacionales en los datos se pueden descubrir. Open relion – Clasificación 3D10 (Figura suplementaria 15). Como partículas de entrada, use las que se acaban de obtener en 6.10 y establezca el diámetro de la máscara de partículas en 402Å. En la ficha Referencia de mapa 3D, utilice como volumen de entrada el obtenido después del paso 6.10, establezca Simetría en c1 y Filtro inicial de paso bajo en 15Å. Finalmente, en la pestaña Optimización, establezca el Número de clases en 3. Ejecútalo. Verifique los resultados haciendo clic en Analizar resultados, seleccione Mostrar clasificación en Scipion. Se muestran las tres clases generadas y algunas medidas interesantes. Las dos primeras clases deben tener un número similar de imágenes asignadas (columna de tamaño ) y verse muy similares, mientras que la tercera tiene menos imágenes y una apariencia más borrosa. Además, rlnAccuracyRotations y rlnAccuracyTranslations deberían ser claramente mejores para las dos primeras clases. Seleccione las dos mejores clases y haga clic en el botón Clases para generar un subconjunto que las contenga. Repita los pasos 7.1 y 7.2 para generar un segundo grupo de buenas clases. Ambos serán el insumo de la herramienta de consenso. Abra y ejecute xmipp3 – clases de consenso 3D y seleccione como clases de entrada los dos subconjuntos generados en los pasos anteriores. Haga clic en Analizar resultados. Se presenta el número de partículas coincidentes entre clases: el primer valor es el número de partículas coincidentes en la primera clase del subconjunto 1 y la primera clase del subconjunto 2, el segundo valor es el número de partículas coincidentes en la primera clase del subconjunto 1 y la segunda clase del subconjunto 2, etc. Compruebe que las partículas se asignan aleatoriamente a las clases uno o dos, lo que significa que el método de clasificación 3D no es capaz de encontrar cambios conformacionales. Dado este resultado, todo el conjunto de partículas se utilizará para continuar el procesamiento. 8.3D refinamiento: refinamiento de asignaciones angulares de una población homogénea Una vez más, aplique un enfoque de consenso en este paso. Primero, abra y ejecute pwem – subconjunto con conjunto completo de elementos como salida de 6.9, Hacer subconjunto aleatorio a Sí y Número de elementos a 5000. Con esto, se crea un subconjunto de imágenes con una alineación previa para entrenar el método utilizado en el siguiente paso. Abrir xmipp3 – alineación profunda, establecer imágenes de entrada como la salida de partículas buenas obtenidas en 5.5, Volumen como el obtenido después de 6.10, Entrenamiento de entrada establecido como el creado en el paso anterior, Resolución de destino a 10Å, y mantener los parámetros restantes con los valores predeterminados (Figura suplementaria 16). Haga clic en Ejecutar. Haga clic en Analizar resultados para comprobar la distribución angular obtenida, donde no faltan direcciones y la cobertura angular mejora ligeramente en comparación con la de 6.10 (Figura 8). Abra y ejecute xmipp3: compare ángulos y seleccione como partículas de entrada 1 la salida de 6.9 y partículas de entrada 2 la salida de 8.2, asegúrese de que el grupo de simetría sea c1. Este método calcula la concordancia entre xmipp3 – deep align y relion – 3D auto refine. Haga clic en Analizar resultados, se muestra la lista de partículas, con las diferencias obtenidas en desplazamientos y ángulos. Haga clic en el icono de la barra en la parte superior de la ventana, se abrirá otra ventana que permite hacer gráficos de las variables calculadas. Seleccione _xmipp_angleDiff y haga clic en Trazar para ver una representación de las diferencias angulares por partícula. Haz lo mismo con _xmipp_shiftDiff. En estas cifras, aproximadamente en la mitad de las partículas ambos métodos coinciden (Figura 9). Selecciona las partículas con diferencias angulares inferiores a 10º y crea un nuevo subconjunto. Ahora, abra xmipp3 – highres27 para hacer un refinamiento local de los ángulos asignados. Primero, seleccione como Imágenes de tamaño completo las imágenes obtenidas en el paso anterior, y como Volúmenes iniciales la salida de 6.9, establezca Radio de partícula en 150 píxeles y Grupo de simetría como c1. En la pestaña Asignación angular, establezca la alineación de la imagen en Local, Número de iteraciones en 1 y Máx. Resolución objetivo como 5Å/px (Figura suplementaria 17). Ejecútalo. En la pestaña Resumen , compruebe que el volumen de salida es inferior a 300x300x300 píxeles y con un tamaño de píxel ligeramente superior. Haga clic en Analizar resultados para ver los resultados obtenidos. Haga clic en Gráficos de resolución de pantalla para ver el FSC, y en Volumen de pantalla: Reconstruido para ver el volumen obtenido (Figura suplementaria 18). Se obtiene un volumen de buena resolución cercano a 4-3.5Å. Haga clic en Mostrar partículas de salida y, en la ventana con la lista de partículas, haga clic en el icono de la barra. En la nueva ventana, seleccione Tipo como histograma, con 100 contenedores, seleccione _xmipp_cost etiqueta y, finalmente, presione Trazar (Figura suplementaria 19). De esta manera, se presenta el histograma de la etiqueta de costo , que contiene la correlación de la partícula con la dirección de proyección seleccionada para ella. En este caso, se obtiene una función de densidad unimodal, que es un signo de no tener poblaciones diferentes en el conjunto de partículas. Por lo tanto, todos ellos se utilizarán para continuar el refinamiento.NOTA: En caso de ver una función de densidad multimodal, se debe seleccionar el conjunto de partículas pertenecientes al máximo más alto para continuar el flujo de trabajo solo con ellas. Abrir y ejecutar de nuevo xmipp3 – highres con Continue de una ejecución anterior? a Sí, establezca como Imágenes de tamaño completo las obtenidas después de 8.5 y Seleccione la ejecución anterior con la ejecución anterior de Xmipp Highres. En la pestaña Asignación angular , establezca la alineación de la imagen en Local, con 1 iteración y 2,6Å/px como resolución de destino (resolución completa). Ahora la salida debe contener un volumen a resolución completa (tamaño 300x300x300 píxeles). Haga clic en Analizar resultados para verificar nuevamente el volumen obtenido y el FSC, que ahora debería ser un volumen de alta resolución en alrededor de 3Å (Figura 10). 9. Evaluación y post-procesamiento Abra xmipp3 – MonoRes28 local. Este método calculará la resolución localmente. Establezca como Volumen de entrada el obtenido después de 8.10, establezca ¿Le gustaría usar medios volúmenes? a Sí, y Rango de resolución de 1 a 10Å. Ejecútalo. Haga clic en Analizar resultados y seleccione Mostrar histograma de resolución y Mostrar sectores de color (Figura 11). Se muestra la resolución en las diferentes partes del volumen. La mayoría de los vóxeles de la parte central de la estructura deben presentar resoluciones alrededor de 3Å, mientras que las peores resoluciones se logran en las partes exteriores. Además, se muestra un histograma de las resoluciones por vóxel con un pico alrededor (incluso por debajo) de 3Å. Abra y ejecute xmipp3 – localdeblur sharpening29 para aplicar un afilado. Seleccione como Mapa de Entrada el obtenido en 8.10, y como Mapa de Resolución el obtenido en el paso anterior con MonoRes. Haga clic en Analizar resultados para comprobar los volúmenes obtenidos. Abra el último, correspondiente a la última iteración del algoritmo. Se recomienda abrir el volumen con otras herramientas, como UCSF Chimera26, para ver mejor las características del volumen en 3D (Figura 12). Finalmente, abra la herramienta de validación incluida en xmipp3 – validate overfitting30 que mostrará cómo cambia la resolución con el número de partículas. Ábralo e incluya como partículas de entrada las partículas obtenidas en el paso 8.5, establezca ¿Calcular el ruido vinculado a la resolución? a Sí, con el volumen de referencia 3D inicial como la salida de 8.10. En Opciones avanzadas, establezca el número de partículas en “500 1000 1500 2000 3000 5000 10000 15000 20000” (Figura suplementaria 20). Ejecútalo. Haga clic en Analizar resultados. Aparecerán dos gráficos (Figura 13) con la evolución de la resolución, en la línea verde, a medida que crezca el número de partículas utilizadas en la reconstrucción. La línea roja representa la resolución lograda con una reconstrucción del ruido gaussiano alineado. La resolución mejora con el número de partículas y se observa una gran diferencia de la reconstrucción a partir de partículas respecto a la del ruido, que es un indicador de tener partículas con buena información estructural. A partir de los resultados anteriores, se podría realizar un ajuste de un modelo en el volumen postprocesado, lo que permitiría descubrir las estructuras biológicas de la macromolécula.

Representative Results

Hemos utilizado el conjunto de datos del Plasmodium falciparum 80S Ribosoma (entrada EMPIAR: 10028, entrada EMDB: 2660) para realizar la prueba y, con el protocolo Scipion presentado en la sección anterior, se ha logrado un volumen reconstruido en 3D de alta resolución de la macromolécula en este ejemplo en particular, comenzando con la información recopilada por el microscopio que consiste en imágenes muy ruidosas que contienen proyecciones 2D en cualquier orientación de la muestra. Los principales resultados obtenidos después de ejecutar todo el protocolo se presentan en la Figura 10, figura 11 y Figura 12. La Figura 10 representa el volumen 3D obtenido antes del post-procesamiento. En la Figura 10a, se puede ver un FSC de 3 Å, que está muy cerca del límite de Nyquist (con datos con un tamaño de píxel de 1.34 Å, el límite de Nyquist es 2.6 Å). La Figura 10b muestra algunas rebanadas del volumen 3D reconstruido con altos niveles de detalles y estructuras bien definidas. En la Figura 11 se presentan los resultados después de analizar localmente la resolución del volumen 3D obtenido. Se puede observar que la mayoría de los vóxeles de la estructura alcanzan una resolución inferior a 3 Å, principalmente los situados en la parte central de la estructura. Sin embargo, la parte exterior muestra peores resoluciones, lo que es consistente con el desenfoque que aparece en esas áreas en las rebanadas de la Figura 10b. La Figura 12 muestra el mismo mapa 3D después del post-procesamiento que es capaz de resaltar las frecuencias más altas del volumen, revelando más detalles y mejorando la representación, lo que se puede ver especialmente en la presentación 3D en la Figura 12c. En la Figura 14, Chimera26 se utilizó para ver una representación 3D del volumen obtenido (Figura 14a), el postprocesado (Figura 14b) y el mapa de resolución (Figura 14c), coloreado con el código de color de las resoluciones locales. Esto puede dar aún más información sobre la estructura obtenida. Esta herramienta es muy útil para obtener una idea de la calidad del volumen obtenido, ya que se pueden ver detalles muy pequeños en todo el contexto 3D de la estructura. Cuando la resolución alcanzada es suficiente, incluso se pueden encontrar algunas partes bioquímicas de la estructura (por ejemplo, alfa-hélices en la Figura 14d. En esta figura, hay que destacar la alta resolución alcanzada en todas las partes centrales de la estructura 3D, que se puede ver como las zonas azul oscuro de la Figura 14c. Todos los resultados anteriores se lograron gracias a un buen rendimiento de todo el protocolo, pero este podría no ser el caso. Hay varias maneras de identificar un mal comportamiento. En el caso más general, esto sucede cuando la estructura obtenida tiene baja resolución y no es capaz de evolucionar a una mejor. Un ejemplo de esto se presenta en la Figura 15. Un volumen borroso (Figura 15c) da como resultado un FSC bajo, que se puede ver en la curva FSC (Figura 15a) y el histograma de la estimación local (Figura 15b). Este ejemplo se generó utilizando un método de refinamiento 3D con datos de entrada incorrectos, ya que esperaba algunas propiedades específicas en el conjunto de partículas de entrada que no cumplen. Como se puede ver, siempre es muy importante saber cómo esperan los diferentes métodos recibir los datos y prepararlos adecuadamente. En general, cuando se obtiene una salida como la de la Figura 15 , puede haber un problema en el flujo de trabajo de procesamiento o en los datos subyacentes. Hay varios puntos de control a lo largo del flujo de trabajo que se pueden analizar para saber si el protocolo evoluciona correctamente o no. Por ejemplo, justo después de la recolección, varios de los métodos discutidos anteriormente pueden clasificar las partículas y dar una puntuación para cada una de ellas. En el caso de tener partículas malas, estos métodos permiten identificarlas y eliminarlas. Además, la clasificación 2D puede ser un buen indicador de tener un mal conjunto de partículas. La Figura 16 muestra un ejemplo de un conjunto tan malo. En la Figura 16a, se muestran las clases buenas que contienen algunos detalles de la estructura, mientras que la Figura 16b muestra las clases malas, que son ruidosas o descentradas, en este último caso se puede ver que la recolección fue incorrecta y dos partículas parecen aparecer juntas. Otro punto de control es la estimación inicial del volumen, la Figura 17 muestra un ejemplo de estimaciones iniciales buenas (Figura 17a) y malas (Figura 17b). La estimación incorrecta se creó utilizando una configuración incorrecta para el método. Hay que tener en cuenta que todas las configuraciones deben hacerse con cuidado, eligiendo adecuadamente cada parámetro según los datos que se están analizando. En caso de no tener un mapa con alguna información estructural mínima, el siguiente refinamiento no podrá obtener una buena reconstrucción. Cuando el problema es una mala adquisición, en la que las películas no conservan información estructural, será imposible extraer partículas buenas de ellas y obtener un procesamiento exitoso. En ese caso, se deben recopilar más películas para obtener una reconstrucción 3D de alta resolución. Pero, si este no es el caso, hay varias formas de gestionar los problemas a lo largo del flujo de trabajo de procesamiento. Si la recolección no es lo suficientemente buena, hay varias maneras de tratar de solucionarla, por ejemplo, repitiendo la recolección, usando diferentes métodos o tratando de recoger manualmente más partículas para ayudar a los métodos a aprender de ellas. Durante la clasificación 2D, si solo unas pocas clases son buenas, considere también repetir el proceso de selección. En la estimación inicial del volumen, trate de utilizar varios métodos si algunos de ellos dieron resultados inexactos. Lo mismo se aplica al refinamiento 3D. Siguiendo este razonamiento, en este manuscrito se han presentado varias herramientas de consenso, que podrían ser muy útiles para evitar problemas y continuar el procesamiento con datos precisos. Gracias al uso de un consenso entre varios métodos, podemos descartar datos que son difíciles de seleccionar, clasificar, alinear, etc., lo que probablemente sea un indicador de datos deficientes. Sin embargo, si varios métodos son capaces de ponerse de acuerdo en la salida generada, probablemente estos datos contengan información valiosa con la que continuar procesando. Alentamos al lector a descargar más conjuntos de datos e intentar procesarlos siguiendo las recomendaciones presentadas en este manuscrito y crear un flujo de trabajo similar combinando paquetes de procesamiento utilizando Scipion. Intentar procesar un conjunto de datos es la mejor manera de aprender el poder de las herramientas de procesamiento disponibles en el estado del arte en Cryo-EM, conocer las mejores reglas para superar los posibles inconvenientes que aparecen durante el procesamiento y aumentar el rendimiento de los métodos disponibles en cada caso de prueba específico. Figura 1. Resultado de alineación de películas. (a) La ventana principal de los resultados, con una lista de todas las micrografías generadas e información adicional: la densidad espectral de potencia, la trayectoria de la alineación estimada en coordenadas polares, lo mismo en coordenadas cartesianas, el nombre de archivo de la micrografía generada. b) La trayectoria de alineación representada en coordenadas cartesianas. c) La micrografía generada. Haga clic aquí para ver una versión más grande de esta figura. Figura 2. Estimación de CTF con resultado de Ctffind. La ventana principal con los resultados incluye una figura con la PSD estimada (en una esquina) junto con la PSD que proviene de los datos, y varios parámetros de desenfoque. Haga clic aquí para ver una versión más grande de esta figura. Figura 3. Ventanas de picking manual con Xmipp. (a) La ventana principal con la lista de micrografías a procesar y algunos otros parámetros. b) Recoger manualmente partículas dentro de una región de una micrografía. (c) y (d) Partículas seleccionadas automáticamente para ser supervisadas para crear un conjunto de partículas de entrenamiento para el método de recolección automática Xmipp. Haga clic aquí para ver una versión más grande de esta figura. Figura 4. Selección de consenso profundo con el resultado de Xmipp. El parámetro zScoreDeepLearning da peso a la bondad de una partícula y es clave para descubrir partículas malas. (a) Los valores más bajos de zScores están asociados con artefactos. b) Los zScores más altos están asociados con partículas que contienen la macromolécula. Haga clic aquí para ver una versión más grande de esta figura. Figura 5. Clasificación 2D con resultado Cryosparc. Se muestran las clases generadas (promedios de subconjuntos de partículas procedentes de la misma orientación). Varias clases buenas seleccionadas en rojo (con cierto nivel de detalle) y algunas clases malas no seleccionadas (clases ruidosas y descentradas). Haga clic aquí para ver una versión más grande de esta figura. Figura 6. Volumen inicial 3D con resultado de consenso de enjambre. Una vista del volumen inicial 3D obtenido después de ejecutar la herramienta de consenso xmipp3 – swarm consensus, utilizando las estimaciones de volumen inicial 3D anteriores de Xmipp y Relion. a) El volumen está representado por rebanadas. (b) Visualización 3D del volumen. Haga clic aquí para ver una versión más grande de esta figura. Figura 7. Refinamiento de un volumen inicial 3D con resultado Relion. a) Curva FSC obtenida, cruzando el umbral a 4,5Å, aproximadamente. (b) Cobertura angular mostrada como vista superior de la esfera 3D. En este caso, como no hay simetría, las partículas asignadas deben cubrir toda la esfera. c) Volumen refinado representado por rebanadas. Haga clic aquí para ver una versión más grande de esta figura. Figura 8. Alineación 3D basada en deep learning con resultado Xmipp. Los resultados generados por xmipp3 – método de alineación profunda para la alineación 3D. a) La asignación angular de cada partícula en forma de matriz de transformación. b) La cobertura angular. Haga clic aquí para ver una versión más grande de esta figura. Figura 9. Resultado del consenso de alineación 3D. a) Lista de partículas con las diferencias obtenidas en los parámetros de desplazamiento y ángulos. b) Trazado de las diferencias angulares por partícula. c) Gráfico de la diferencia de desplazamiento por partícula. Haga clic aquí para ver una versión más grande de esta figura. Figura 10. Iteración final del resultado de refinamiento 3D. a) Curva FSC. b) Volumen obtenido a resolución completa por rebanadas. Haga clic aquí para ver una versión más grande de esta figura. Figura 11. Análisis de resolución local con resultado Xmipp. Resultados del método xmipp3 – Local MonoRes. (a) Algunas rebanadas representativas coloreadas con el valor de resolución por vóxel, como se indica en el código de color. b) Histograma de resolución local. Haga clic aquí para ver una versión más grande de esta figura. Figura 12. Afilado con resultado Xmipp. Resultados de xmipp3 – método de afilado localdeblur. a) Lista de volúmenes obtenidos por iteración. b) Volumen 3D obtenido después de la última iteración representada por sectores. c) Una representación en 3D del volumen final. Haga clic aquí para ver una versión más grande de esta figura. Figura 13. Valide la herramienta de sobreajuste en el resultado de Xmipp. Resultados de xmipp3 – validación de sobreajuste. La línea verde corresponde a la reconstrucción a partir de datos, la línea roja a partir de ruido. a) Inversa de la resolución al cuadrado con el logaritmo del número de partículas. b) Resolución con el número de partículas. Haga clic aquí para ver una versión más grande de esta figura. Figura 14. Varias representaciones 3D del volumen obtenido. a) Volumen preprocesado. b) Volumen postelaborado. (c) Resolución local, los vóxeles azul oscuro son aquellos con mayor resolución (2.75Å) y los vóxeles rojo oscuro son aquellos con menor resolución (10.05Å). (d) Zoom en el volumen post-procesado donde se puede ver una hélice alfa (óvalo rojo). Haga clic aquí para ver una versión más grande de esta figura. Figura 15. Ejemplo de una mala reconstrucción 3D. a) Curva FSC con una fuerte caída y cruzando el umbral a baja resolución. b) Histograma de resolución local. c) Volumen 3D por rodajas. Haga clic aquí para ver una versión más grande de esta figura. Figura 16. Ejemplo de clases 2D. (a) Buenas clases que muestren cierto nivel de detalle. (b) Clases malas que contienen ruido y artefactos (parte superior obtenida con Xmipp, inferior con CryoSparc). Haga clic aquí para ver una versión más grande de esta figura. Figura 17. Ejemplo de volumen inicial 3D con diferentes calidades. a) Buen volumen inicial donde se pueda observar la forma de la macromolécula. b) Volumen inicial incorrecto cuando la forma obtenida sea completamente diferente de la esperada. Haga clic aquí para ver una versión más grande de esta figura. Figura suplementaria 1. Creación de un proyecto Scipion. Ventana mostrada por Scipion donde se puede seleccionar un proyecto antiguo o se puede crear uno nuevo que da un nombre y una ubicación para ese proyecto. Haga clic aquí para descargar este archivo. Figura suplementaria 2. Método de importación de películas. Ventana mostrada por Scipion cuando pwem – importar películas está abierta. Aquí, se deben incluir los principales parámetros de adquisición para permitir que las películas disponibles se procesen en Scipion. Haga clic aquí para descargar este archivo. Figura suplementaria 3. Método de alineación de películas. Ventana mostrada por Scipion cuando se utiliza xmipp3 – alineación óptica . Las películas de entrada, el rango de fotogramas considerados para la alineación y algunos otros parámetros para procesar las películas deben llenarse. Haga clic aquí para descargar este archivo. Figura suplementaria 4. Método de estimación CTF con Ctffind. El formulario en Scipion con todos los campos necesarios para ejecutar el programa Ctffind. Haga clic aquí para descargar este archivo. Figura suplementaria 5. Asistente en Scipion. Un asistente para ayudar al usuario a rellenar algunos parámetros del formulario. En este caso, el asistente debe completar el campo de resolución en el método grigoriefflab – ctffind . Haga clic aquí para descargar este archivo. Figura suplementaria 6. Método de refinamiento CTF con Xmipp. La forma de estimación xmipp3 – ctf con todos los parámetros para hacer un refinamiento de un CTF estimado previamente. Haga clic aquí para descargar este archivo. Figura suplementaria 7. Método de micrografías de preproceso. La forma de xmipp3 – micrografías de preproceso que permite realizar algunas operaciones sobre ellas. En este ejemplo, Eliminar píxeles defectuosos y las micrografías de muestra descendente son las útiles. Haga clic aquí para descargar este archivo. Figura suplementaria 8. Método de picking con Cryolo. Formulario para ejecutar el método de selección Cryolo mediante una red previamente entrenada. Haga clic aquí para descargar este archivo. Figura suplementaria 9. Método de selección por consenso con Xmipp. La forma de xmipp3 – selección de consenso profundo basada en el aprendizaje profundo para calcular un consenso de coordenadas, utilizando una red preentrenada sobre varios conjuntos de coordenadas obtenidas con diferentes métodos de selección. Haga clic aquí para descargar este archivo. Figura suplementaria 10. Método de extracción de partículas. Pestañas de entrada y preproceso de xmipp3 – extraer partículas. Haga clic aquí para descargar este archivo. Figura suplementaria 11.3D método de volumen inicial con Xmipp. La forma del método xmipp3 – reconstruir significativo para obtener un mapa 3D inicial. Se muestran las fichas Entrada y Criterios . Haga clic aquí para descargar este archivo. Figura suplementaria 12. Método de cambio de tamaño de volumen. La forma de hacer un recorte o cambiar el tamaño de un volumen. En este ejemplo, este método se utiliza para generar un volumen de tamaño completo después de xmipp3 – reconstruir significativo. Haga clic aquí para descargar este archivo. Figura suplementaria 13.3D volumen inicial con el resultado de Relion. Una vista del volumen inicial 3D obtenido con relion – método de modelo inicial 3D por segmentos. Haga clic aquí para descargar este archivo. Figura suplementaria 14. Refinamiento del volumen inicial con Relion. La forma del método relion – 3D auto-refine. En este ejemplo, se utilizó para refinar un volumen inicial estimado después del consenso. Se muestran las fichas Mapa 3D de entrada y referencia. Haga clic aquí para descargar este archivo. Figura suplementaria 15.3D método de clasificación. Forma de relion – clasificación 3D. Se muestran las pestañas Entrada, Mapa 3D de referencia y Optimización . Haga clic aquí para descargar este archivo. Figura suplementaria 16.3D alineación basada en un método de aprendizaje profundo. El formulario se abrió para el método xmipp3 – deep align. Aquí es necesario entrenar una red con un conjunto de entrenamiento, luego esa red predecirá la asignación angular por partícula. Haga clic aquí para descargar este archivo. Figura suplementaria 17.3D método de refinamiento. Forma del método xmipp3 – highres . Se muestran las pestañas Entrada y Asignación angular . Haga clic aquí para descargar este archivo. Figura suplementaria 18. Resultado de la primera iteración del refinamiento 3D. a) Curva FSC. b) Volumen obtenido (de un tamaño inferior a la resolución completa) representado como rebanadas. Haga clic aquí para descargar este archivo. Figura suplementaria 19. Primera iteración del análisis de correlación de refinamiento 3D. Aparece una nueva ventana haciendo clic en el icono de la barra en la parte superior de la ventana con la lista de partículas. En la ventana Trazar columnas se puede crear un histograma del parámetro estimado deseado. Haga clic aquí para descargar este archivo. Figura suplementaria 20. Herramienta de sobreajuste de validación. Forma de xmipp3 – validar el método de sobreajuste. Haga clic aquí para descargar este archivo.

Discussion

Actualmente, la crio-EM es una herramienta clave para revelar la estructura 3D de las muestras biológicas. Cuando se recogen buenos datos con el microscopio, las herramientas de procesamiento disponibles nos permitirán obtener una reconstrucción 3D de la macromolécula en estudio. El procesamiento de datos cryo-EM es capaz de lograr una resolución casi atómica, que es clave para comprender el comportamiento funcional de una macromolécula y también es crucial en el descubrimiento de fármacos.

Scipion es un software que permite crear todo el flujo de trabajo combinando los paquetes de procesamiento de imágenes más relevantes de forma integradora, lo que ayuda a la trazabilidad y reproducibilidad de todo el flujo de trabajo de procesamiento de imágenes. Scipion proporciona un conjunto muy completo de herramientas para llevar a cabo el procesamiento; sin embargo, la obtención de reconstrucciones de alta resolución depende completamente de la calidad de los datos adquiridos y de cómo se procesan estos datos.

Para obtener una reconstrucción 3D de alta resolución, el primer requisito es obtener buenas películas del microscopio, que conserven la información estructural a alta resolución. Si este no es el caso, el flujo de trabajo no podrá extraer información de alta definición de los datos. Luego, un flujo de trabajo de procesamiento exitoso debería poder extraer partículas que realmente correspondan a la estructura y encontrar las orientaciones de estas partículas en el espacio 3D. Si se produce un error en alguno de los pasos del flujo de trabajo, la calidad del volumen reconstruido se degradará. Scipion permite utilizar diferentes paquetes en cualquiera de los pasos de procesamiento, lo que ayuda a encontrar el enfoque más adecuado para procesar los datos. Además, gracias a tener muchos paquetes disponibles, se pueden utilizar herramientas de consenso que aumentan la precisión al encontrar un acuerdo en los resultados estimados de diferentes métodos. Además, se han discutido en detalle en la sección de Resultados Representativos varias herramientas de validación y cómo identificar resultados precisos e inexactos en cada paso del flujo de trabajo, para detectar problemas potenciales y cómo tratar de resolverlos. Hay varios puntos de control a lo largo del protocolo que podrían ayudar a darse cuenta de si el protocolo se está ejecutando correctamente o no. Algunos de los más relevantes son: picking, clasificación 2D, estimación inicial de volumen y alineación 3D. Comprobar las entradas, repetir el paso con un método diferente, o utilizar el consenso, son opciones disponibles en Scipion que el usuario puede utilizar para encontrar soluciones cuando aparecen problemas.

Con respecto a los enfoques anteriores para la integración de paquetes en el campo Cryo-EM, Appion31 es el único que permite la integración real de diferentes paquetes de software. Sin embargo, Appion está estrechamente conectado con Leginon32, un sistema para la recopilación automatizada de imágenes de microscopios electrónicos. La principal diferencia con Scipion es que el modelo de datos y el almacenamiento están menos acoplados. De tal manera, para crear un nuevo protocolo en Scipion, solo se necesita desarrollar un script de Python. Sin embargo, en Appion, el desarrollador debe escribir el script y cambiar la base de datos subyacente. En resumen, Scipion fue desarrollado para simplificar el mantenimiento y la extensibilidad.

Hemos presentado en este manuscrito un flujo de trabajo completo para el procesamiento cryo-EM, utilizando el conjunto de datos de casos reales del plasmodium falciparum 80S Ribosoma (entrada EMPIAR: 10028, entrada EMDB: 2660). Los pasos cubiertos y discutidos aquí se pueden resumir como alineación de películas, estimación de CTF, selección de partículas, clasificación 2D, estimación de mapas iniciales, clasificación 3D, refinamiento 3D, evaluación y post-procesamiento. Se han utilizado diferentes paquetes y se han aplicado herramientas de consenso en varios de estos pasos. El volumen final reconstruido en 3D alcanzó una resolución de 3 Å y, en el volumen postprocesado, se pueden distinguir algunas estructuras secundarias, como las hélices alfa, lo que ayuda a describir cómo se organizan los átomos en el espacio.

El flujo de trabajo presentado en este manuscrito muestra cómo Scipion se puede utilizar para combinar diferentes paquetes Cryo-EM de una manera directa e integradora para simplificar el procesamiento y obtener resultados más confiables al mismo tiempo.

En el futuro, el desarrollo de nuevos métodos y paquetes seguirá creciendo y el software como Scipion para integrar fácilmente todos ellos será aún más importante para los investigadores. Los enfoques de consenso serán más relevantes incluso entonces, cuando haya muchos métodos con diferentes bases disponibles, lo que ayudará a obtener estimaciones más precisas de todos los parámetros involucrados en el proceso de reconstrucción en Cryo-EM. El seguimiento y la reproducibilidad son claves en el proceso de investigación y más fáciles de lograr con Scipion gracias a tener un marco común para la ejecución de flujos de trabajo completos.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Los autores desean agradecer el apoyo económico de: El Ministerio de Ciencia e Innovación de España a través de Subvenciones: PID2019-104757RB-I00/AEI/10.13039/501100011033, la “Comunidad Autónoma de Madrid” a través de la Subvención: S2017/BMD-3817, Instituto de Salud Carlos III, PT17/0009/0010 (ISCIII-SGEFI/FEDER), Unión Europea (UE) y Horizonte 2020 a través de la subvención: INSTRUCT – ULTRA (INFRADEV-03-2016-2017, Propuesta: 731005), EOSC Life (INFRAEOSC-04-2018, Propuesta: 824087), iNEXT – Discovery (Propuesta: 871037) y HighResCells (ERC – 2018 – SyG, Propuesta: 810057). El proyecto que dio lugar a estos resultados recibió el apoyo de una beca de la Fundación “la Caixa” (ID 100010434). El código de la beca es LCF/BQ/DI18/11660021. Este proyecto ha recibido financiación del programa de investigación e innovación Horizonte 2020 de la Unión Europea en el marco del acuerdo de subvención Marie Skłodowska-Curie n.º 713673. Los autores reconocen el apoyo y el uso de los recursos de Instruct, un proyecto de Landmark ESFRI.

Materials

no material is used in this article

References

  1. Nogales, E. The development of cryo-EM into a mainstream structural biology technique. Nature Methods. 13 (1), 24-27 (2016).
  2. Kühlbrandt, W. The Resolution Revolution. Science. 343 (6178), 1443-1444 (2014).
  3. . 1.15 A structure of human apoferritin obtained from Titan Mono- BCOR microscope Available from: https://www.rcsb.org/structure/7A6A (2021)
  4. Arnold, S. A., et al. Miniaturizing EM Sample Preparation: Opportunities, Challenges, and “Visual Proteomics”. PROTEOMICS. 18 (5-6), 1700176 (2018).
  5. Faruqi, A. R., McMullan, G. Direct imaging detectors for electron microscopy. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment. 878, 180-190 (2018).
  6. Vilas, J. L., et al. Advances in image processing for single-particle analysis by electron cryomicroscopy and challenges ahead. Current Opinion in Structural Biology. 52, 127-145 (2018).
  7. Martinez, M., et al. Integration of Cryo-EM Model Building Software in Scipion. Journal of Chemical Information and Modeling. 60, 2533-2540 (2020).
  8. de la Rosa-Trevín, J. M., et al. Scipion: A software framework toward integration, reproducibility and validation in 3D electron microscopy. Journal of Structural Biology. 195, 93-99 (2016).
  9. de la Rosa-Trevín, J. M., et al. Xmipp 3.0: an improved software suite for image processing in electron microscopy. Journal of Structural Biology. 184, 321-328 (2013).
  10. Scheres, S. H. W. . Methods in Enzymology. The Resolution Revolution: Recent Advances In cryoEM. , 125-157 (2016).
  11. Punjani, A., Rubinstein, J. L., Fleet, D. J., Brubaker, M. A. cryoSPARC: algorithms for rapid unsupervised cryo-EM structure determination. Nature Methods. 14, 290-296 (2017).
  12. Ludtke, S. J. 3-D structures of macromolecules using single-particle analysis in EMAN. Methods in Molecular Biology. 673, 157-173 (2010).
  13. Shaikh, T. R., et al. SPIDER image processing for single-particle reconstruction of biological macromolecules from electron micrographs. Nature Protocols. 3, 1941-1974 (2008).
  14. Wagner, T., et al. SPHIRE-crYOLO is a fast and accurate fully automated particle picker for cryo-EM. Communications Biology. 2, (2019).
  15. Mindell, J. A., Grigorieff, N. Accurate determination of local defocus and specimen tilt in electron microscopy. Journal of Structural Biology. 142, 334-347 (2003).
  16. Winn, M. D., et al. Overview of the CCP4 suite and current developments. Acta crystallographica. Section D, Biological crystallography. 67, 235-242 (2011).
  17. Liebschner, D., et al. Macromolecular structure determination using X-rays, neutrons and electrons: recent developments in Phenix. Acta Crystallographica Section D. 75, 861-887 (2019).
  18. Wong, W., et al. Cryo-EM structure of the Plasmodium falciparum 80S ribosome bound to the anti-protozoan drug emetine. eLife. 3, 03080 (2014).
  19. Abrishami, V., et al. Alignment of direct detection device micrographs using a robust Optical Flow approach. Journal of Structural Biology. 189, 163-176 (2015).
  20. Sorzano, C. O. S., Jonic, S., Nunez Ramirez, R., Boisset, N., Carazo, J. M. Fast, robust and accurate determination of transmission electron microscopy contrast transfer function. Journal of Structural Biology. 160, 249-262 (2007).
  21. Abrishami, V., et al. A pattern matching approach to the automatic selection of particles from low-contrast electron micrographs. Bioinformatics. 29, 2460-2468 (2013).
  22. Sanchez-Garcia, R., Segura, J., Maluenda, D., Carazo, J. M., Sorzano, C. O. S. Deep Consensus, a deep learning-based approach for particle pruning in cryo-electron microscopy. IUCrJ. 5, 854-865 (2018).
  23. Sorzano, C. O. S., et al. A clustering approach to multireference alignment of single-particle projections in electron microscopy. Journal of Structural Biology. 171, 197-206 (2010).
  24. Sorzano, C. O. S., et al. A statistical approach to the initial volume problem in Single Particle Analysis by Electron Microscopy. Journal of Structural Biology. 189, 213-219 (2015).
  25. Sorzano, C. O. S., et al. Swarm optimization as a consensus technique for Electron Microscopy Initial Volume. Applied Analysis and Optimization. 2, 299-313 (2018).
  26. Pettersen, E. F., et al. UCSF Chimera–a visualization system for exploratory research and analysis. Journal of computational chemistry. 25, 1605-1612 (2004).
  27. Sorzano, C. O. S., et al. A new algorithm for high-resolution reconstruction of single particles by electron microscopy. Journal of Structural Biology. 204, 329-337 (2018).
  28. Vilas, J. L., et al. MonoRes: Automatic and Accurate Estimation of Local Resolution for Electron Microscopy Maps. Structure. 26, 337-344 (2018).
  29. Ramirez-Aportela, E., et al. Automatic local resolution-based sharpening of cryo-EM maps. Bioinformatics. 36, 765-772 (2020).
  30. Heymann, J. B. Validation of 3D EM Reconstructions: The Phantom in the Noise. AIMS Biophys. 2, 21-35 (2015).
  31. Lander, G. C., et al. Appion: An integrated, database-drive pipeline to facilitate EM image processing. Journal of Structural Biology. 166, 95-102 (2009).
  32. Suloway, C., et al. Automated molecular microscopy: The new Leginon system. Journal of Structural Biology. 151, 41-60 (2005).

Play Video

Cite This Article
Jiménez-Moreno, A., del Caño, L., Martínez, M., Ramírez-Aportela, E., Cuervo, A., Melero, R., Sánchez-García, R., Strelak, D., Fernández-Giménez, E., de Isidro-Gómez, F., Herreros, D., Conesa, P., Fonseca, Y., Maluenda, D., Jiménez de la Morena, J., Macías, J., Losana, P., Marabini, R., Carazo, J., Sorzano, C. Cryo-EM and Single-Particle Analysis with Scipion. J. Vis. Exp. (171), e62261, doi:10.3791/62261 (2021).

View Video