Summary

Análisis de los datos de la SEC-SAXS a través de la desconvolución y dispersión de EFA

Published: January 28, 2021
doi:

Summary

Las mediciones SEC-BioSAXS de macromoléculas biológicas son un enfoque estándar para determinar la estructura de la solución de las macromoléculas y sus complejos. Aquí, analizamos los datos de SEC-BioSAXS a partir de dos tipos de trazas SEC comúnmente encontradas: cromatogramas con picos completamente resueltos y parcialmente resueltos. Demostramos el análisis y la desconvolución utilizando scatter y BioXTAS RAW.

Abstract

BioSAXS es una técnica popular utilizada en biología molecular y estructural para determinar la estructura de la solución, el tamaño y la forma de las partículas, la relación superficie-volumen y los cambios conformacionales de macromoléculas y complejos macromoleculares. Un dataset SAXS de alta calidad para el modelado estructural debe ser de muestras monodispersas y homogéneas y esto a menudo sólo se alcanza mediante una combinación de cromatografía en línea y medición SAXS inmediata. Más comúnmente, la cromatografía de exclusión de tamaño se utiliza para separar muestras y excluir contaminantes y agregaciones de la partícula de interés, lo que permite realizar mediciones SAXS a partir de un pico cromatográfico bien resuelto de una sola especie proteica. Sin embargo, en algunos casos, incluso la purificación en línea no es una garantía de muestras monodispersas, ya sea porque varios componentes están demasiado cerca uno del otro en tamaño o cambios en la forma inducidas a través de la unión alteran el tiempo de elución percibido. En estos casos, puede ser posible desconvolucionar los datos SAXS de una mezcla para obtener las curvas SAXS idealizadas de componentes individuales. Aquí, mostramos cómo se logra esto y el análisis práctico de los datos de SEC-SAXS se realiza en muestras ideales y difíciles. Específicamente, mostramos el análisis SEC-SAXS de la exonucleasa de ADN polimerasa de ADN vaccinia E9 menos mutante.

Introduction

Las macromoléculas biológicas son demasiado pequeñas para ser vistas incluso con los mejores microscopios de luz. Los métodos actuales para determinar sus estructuras generalmente implican cristalizar la proteína o mediciones en un gran número de moléculas idénticas al mismo tiempo. Mientras que la cristalografía proporciona información a nivel atómico, representa un entorno de muestra artificial, dado que la mayoría de las macromoléculas no se presentan en forma cristalina en la célula. Durante los últimos dos años, la microscopía crioelectrómica entregó estructuras similares de alta resolución de grandes macromoléculas / complejos macromoleculares, pero aunque las muestras están más cerca de la condición fisiológica, todavía están congeladas, por lo tanto inmóviles y estáticas. La dispersión de rayos X de ángulo bioquemez (BioSAXS) proporciona una medición estructural de la macromolécula, en condiciones que son relevantes para la biología. Este estado se puede visualizar como una forma 3D de baja resolución determinada en escala nanómetro y captura todo el espacio conformacional de la macromolécula en solución. Los experimentos BioSAXS evalúan eficientemente el estado oligomérico, el dominio y los arreglos complejos, así como la flexibilidad entre los dominios1,2,3. El método es preciso, en su mayoría no destructivo y por lo general requiere sólo un mínimo de preparación y tiempo de la muestra. Sin embargo, para una mejor interpretación de los datos, las muestras deben ser monodispersas. Esto es un reto; las moléculas biológicas son a menudo susceptibles a las contaminaciones, la mala purificación y la agregación, por ejemplo, de la descongelación por congelación4. El desarrollo de la cromatografía en línea seguida de la medición inmediata de SAXS ayuda a mitigar estos efectos. La cromatografía de exclusión de tamaño separa las muestras por tamaño, excluyendo así la mayoría de los contaminantes y agregaciones5,6,7,8,9,10. Sin embargo, en algunos casos incluso SEC-SAXS no es suficiente para producir una muestra monodispersa, ya que la mezcla puede consistir en componentes que son demasiado cercanos en tamaño o sus propiedades físicas o su dinámica rápida conducen a picos superpuestos en la traza UV SEC. En estos casos, un paso de desconvolución basado en software de los datos SAXS obtenidos podría dar lugar a una curva SAXS idealizada del componente individual5,11,12. Por ejemplo, en la sección 2 del protocolo, mostramos el análisis sec-SAXS estándar de la exonucleasa de ADN polimerasa de ADN vaccinia E9 menos mutante (E9 exomenos) en complejo con ADN. La vacuna representa el organismo modelo de los Poxviridae, una familia que contiene varios patógenos, por ejemplo el virus de la viruela humana. Se demostró que la polimerasa se une firmemente al ADN en enfoques bioquímicos, con la estructura del complejo recientemente resuelto por cristalografía de rayos X13.

La mayoría de las instalaciones de sincrotrón proporcionarán una canalización de procesamiento de datos automatizada que realizará la normalización e integración de datos produciendo un conjunto de marcos no insertados. Pero el enfoque descrito en este manuscrito también podría ser utilizado con una fuente de laboratorio siempre que se realice SEC-SAXS. Además, puede haber automatización adicional disponible que rechazará los fotogramas dañados por la radiación y realizará la resta de búfer14. Mostraremos cómo realizar análisis de datos primarios sobre datos preprocesados y aprovechar al máximo los datos disponibles en la sección 2.

En la sección 3, mostramos cómo desconvolucionar los datos de SEC-SAXS y analizar las curvas de manera eficiente. Si bien existen varios métodos de desconvolución, como la desconvolución de pico gaussiana, implementada en US-SOMO15 y el método de máxima probabilidad optimizado Guinier, implementado en el software DELA16,estos generalmente requieren un modelo para la forma de pico12. El tamaño finito de los picos individuales que estamos investigando permite el uso del análisis de factores en evolución (EFA), como una forma mejorada de descomposición de valor singular (SVD) para desconvoluntar picos superpuestos, sin depender de la forma de pico o perfil de dispersión5,11. Puede encontrar una implementación específica de SAXS en BioXTAS RAW17. EFA se utilizó por primera vez en datos de cromatografía cuando los datos de matriz de diodos 2D permitieron que las matrices se formara a partir de la absorbancia contra el tiempo de retención y los datos de longitud de onda18. Donde la EFA sobresale es que se centra en el carácter evolutiva de los valores singulares, cómo cambian con la aparición de nuevos componentes, con la salvedia de que hay un orden inherente en la adquisición10. Afortunadamente, los datos de SEC-SAXS proporcionan todos los datos de adquisición ordenados necesarios en matrices de datos 2D organizadas, prestándose muy bien a la técnica EFA.

En la sección 4, demostraremos los conceptos básicos del análisis SAXS independiente del modelo a partir de la curva SAXS restada de fondo de búfer. El análisis independiente del modelo determina el radio de giro de la partícula (Rg), el volumen de correlación (Vc), el volumen de Porod (Vp) y Porod-Debye Exponent (PE). El análisis proporciona una evaluación semicuantitativa del estado termodinámico de la partícula en términos de compactación o flexibilidad a través de la parcela Kratky sin dimensiones2,4,19.

Por último, los datos SAXS se miden en unidades de espacio recíproco y mostraremos cómo transformar los datos SAXS en espacio real para recuperar la función de distribución pair-distance, P(r). La distribución P(r) es el conjunto de todas las distancias que se encuentran dentro de la partícula e incluye la dimensión máxima de la partícula, dmax. Dado que se trata de una medición termodinámica, la distribución P(r) representa el espacio físico ocupado por el espacio conformacional de las partículas. El análisis adecuado de un conjunto de datos SAXS puede proporcionar información sobre el estado de la solución que complementa la información de alta resolución de la cristalografía y la crio-EM.

Protocol

1. La expresión de proteínas, la purificación y la medición SEC-SAXS se basan en el protocolo13 publicado Siga el protocolo de recopilación de datos SEC-SAXS en línea (Brennich et al.6) en breve. Equilibre la columna SEC con al menos 2 volúmenes de columna del búfer de ejecución SEC (20 mM Tris-HCl, pH 7.5, 100 mM NaCl). Preparar 50 ml de muestra de E9 exomenos a 8-u201210 mg/ml con un exceso molar del 20% de un dsDNA parcial (TCAGGAAGATAACAGCTTTTTAGCC y GGCTAAACCGCTGTTATCTT). E9 exomenos se une con un KD de 12 ± 6 nM (ver Datos Suplementarios). Inyectar 50 l de esta mezcla en una columna SEC (S200 Increase) en línea con la celda de flujo para mediciones SAXS a 0,3 ml/min. Recoger 1000 fotogramas a 1 s de exposición cada uno.NOTA: En la línea de haz de BioSAXS BM29, en la Instalación Europea de Sincrotrón (ESRF) las tramas individuales se procesan de forma automática e independiente dentro del marco EDNA14. Después de la recopilación de datos, abra la base de datos ISPyB20 y, en la pestaña Adquisición de datos, pulse el botón Ir para acceder al conjunto de datos y a los resultados del análisis automático21. Descargue los datos. 2. Análisis de datos primarios Abra el programa basado en Java Dispersión IV (ver el Tabla de materiales) y realizar una resta de fondo para los datos de cromatografía de exclusión de tamaño (SEC).Abra la pestaña SEC. Arrastre y suelte los archivos de datos reducidos (*.dat) en la ventana “Drop Data below”. Establezca el directorio de salida “Out Dir ::” haciendo clic en el botón Dir de salida con etiqueta azul.NOTA: Si sus datos se recopilaron en nm-1, será necesario marcar una casilla de conversión (abajo a la izquierda del panel) al colocar archivos en la ventana o la pestaña de resta. Edite los detalles experimentales, utilice el botón Editar detalles y rellene tantos campos como sea posible, estos incluyen secciones en las que se utilizó source/beamline para recopilar datos, los parámetros de recopilación y los detalles de la muestra. Estos se guardarán con los datos y permitirán rellenar más fácilmente la sección “Parámetros de recopilación de datos” en futuras publicaciones. Escriba el nombre del ejemplo en el cuadro Guardar como. Haga clic en TRACE.NOTA: Esto tiene dos efectos. En primer lugar, creará un archivo *.sec para los datos. Se trata de un único archivo de texto que recopilará todas las observaciones experimentales de los archivos *.dat independientes. Además, el archivo *.sec contiene el conjunto promediado de fotogramas que es el fondo de búfer, todas las tramas utilizadas en el promedio, así como las tramas restadas de fondo de búfer en todo el experimento SEC-SAXS. En segundo lugar, se crea una gráfica de señal que traza el número de fotograma frente a la relación integral con el fondo. Esto muestra los fotogramas seleccionados (grises) que se promediaron para la resta de búfer. Los puntos para el búfer promedio se determinan a partir de todo el rango de los datos. Sin embargo, es aconsejable elegir manualmente los marcos de búfer para promediar como un fondo mal definido puede ocurrir debido a columnas mal equilibradas o sucias o ensuciamiento capilar22. Seleccione los marcos de búfer manualmente. Haga clic en Borrar zonas de influencia y, a continuación, vuelva a seleccionar una región de búfer con un clic y arrastre izquierdo en la curva de seguimiento. Idealmente, debe ser una región plana antes del volumen vacío de la columna SEC de aproximadamente 100 fotogramas. Haga clic en SET BUFFER y, a continuación, en Update para volver a calcular el archivo *.sec, que puede tardar unos minutos. Identificar una región de interés (ROI). En la gráfica de señal, seleccione la región del pico de interés, con un clic y arrastre izquierdo.NOTA: Esto rellena tres parcelas en el panel derecho. Las dos gráficas superiores están vinculadas con el punto de mira moviéndose entre ellas, una segunda gráfica de señal (arriba a la derecha) muestra sólo el ROI seleccionado, con la intensidad de cada fotograma en azul y el Rg correspondiente de cada fotograma en rojo y un mapa de calor correspondiente a continuación, mostrando los residuos para cada fotograma coloreados de acuerdo con el análisis de correlación automática Durbin-Watson. Las regiones de alta similitud son de color cian (Durbin-Watson, d x 2) mientras que los marcos diferentes seguirán los azules más oscuros a los rosas y finalmente a los rojos dependiendo de la gravedad de la diferencia (d > 2). El trazado inferior es una curva restada I versus q para el marco central seleccionado (también denotado por una línea vertical). Las teclas de flecha se pueden utilizar para navegar a través de los marcos restados. La gráfica I versus q demostrará la calidad de los fotogramas restados del experimento SEC. Seleccione los fotogramas que desea fusionar. Haga clic en el punto de mira en el trazado del mapa de calor para seleccionar el subconjunto de fotogramas que se utilizará para la fusión. El punto de mira identificará un área triangular de predominantemente cian que cae al lado inferior derecho del punto de mira. Utilice un clic del ratón para establecer estos fotogramas como seleccionados y resaltar los fotogramas en el área correspondiente del trazado señal anterior. Estos marcos deben destacar idealmente una región con un Rg estable.NOTA: Según sea necesario, haga zoom en el mapa de calor con un clic izquierdo de arrastrar y alejar con un dedo hacia la derecha. Cuando esté satisfecho con los fotogramas seleccionados, haga clic en MERGE. Esto combinará los marcos restados y los presentará en la pestaña ANALISIS. 3. Desconvolución de datos Abra el programa de desconvolución (por ejemplo, BioXTAS Raw 2.0.0). En el programa de desconvolución, cargue el conjunto de datos, en la pestaña Archivos, en el Panel de control, utilice el símbolo foldether para localizar los datos o copiar y pegar la ubicación en la barra de direcciones.NOTA: Asegúrese de que la carpeta contiene solo los archivos *.dat sin procesar y sin archivos de datos procesados o promedios. Resalte todos los archivos *.dat, pulse el botón Serie de gráfica, se dibujará una gráfica de intensidad integrada frente al número de fotograma en la “Gráfica de serie”. En el Panel de control, seleccione la ficha Serie y, a continuación, haga clic para resaltar la curva. Abra la ventana emergente Análisis de LC con el botón situado en la base del panel de control. Esta ventana da acceso a varias opciones, como seleccionar diferentes tipos de moléculas (proteína o ARN). También permite al usuario seleccionar la región de búfer para el trazado. En la primera instancia, haga clic en Automático; esto debería seleccionar una región de búfer adecuada.NOTA: Si se produce un error, posiblemente debido a una línea base inestable, entonces “Agregar región” para optimizar la región de búfer. Esto rellena el cuadro Zona de influencia con un cuadro más pequeño en el que se pueden agregar manualmente los números de fotograma que se utilizarán para el búfer. Alternativamente, haga clic en “Seleccionar” para dar la opción de seleccionar un área en el trazado. Localice el área, haga clic con el botón izquierdo una vez para la posición inicial, mueva el cursor a la siguiente posición y haga clic con el botón izquierdo de nuevo. Puede ser necesario agregar más de una ubicación de búfer. Haga clic en Establecer búfer y las curvas se restarán y el Rg se calculará a través del pico SEC. Si aparece un cuadro emergente, haga clic en Aceptar. Para iniciar el Análisis de Factores en Evolución (EFA), haga clic con el botón derecho en el archivo resaltado en la parte inferior de la Control Panel y luego seleccionar Ept del menú.Compruebe que se abre una ventana emergente que muestra la descomposición de valor único (SVD) del conjunto de datos. En la casilla de control, active la casilla Usar fotogramas para que toda el área de pico a desconvolucionar esté cubierta en la gráfica de intensidad. La gráfica “Valores singulares”, arriba a la derecha, muestra la intensidad de los valores singulares (picos/especies separados) por encima de la línea de base.NOTA: El número de puntos presentes por encima de la línea de base representa el número de especies de dispersión presentes. Con la advertencia de que es la magnitud relativa del valor singular para el área plana/línea de base lo que importa. Para ayudar a validar el número de valores únicos, utilice el trazado de Autocorrelación inferior. Esto muestra los vectores de correlación individual derecho e izquierdo. Haga clic en Siguiente.NOTA: Estos representan esencialmente perfiles de dispersión o concentración para el vector en la solución. Donde el tamaño absoluto representa la importancia del vector. Un componente significativo tendrá una autocorrelación cerca de 1 (una regla de corte de regla general es >0.6-u20120.7). RAW calcula útilmente esto y se muestra en el cuadro #Significant SVs, abajo a la izquierda, aunque puede cambiar esto si es necesario. Si hay varios valores individuales (por ejemplo, 4+), puede ser necesario mirar sólo 2 o 3 de los componentes solamente, alterando el rango de los datos utilizados. Cuanto menor sea el número de componentes, más fácil será el análisis de EFA, pero a costa de utilizar menos datos. En situaciones complejas, donde los vectores singulares izquierdo y derecho, que deben ser similares, no coinciden reducen el número significativo de SV y disminuyen el número de fotogramas utilizados hasta que los vectores singulares izquierdo y derecho sean similares. Compruebe que el EFA se calcula generando trazados en las direcciones hacia delante y hacia atrás para cada vector. Estos trazados muestran cuándo los componentes inician (trazado hacia delante) y salen (trazado hacia atrás) el perfil de solución para los datos SEC-SAXS seleccionados. RAW intenta identificar estos rangos; cambiarlos usando las flechas junto a los contadores para que cada círculo esté al comienzo de un punto de inflexión que suba o caiga a la línea de base. Haga clic en Siguiente.NOTA: La última etapa de la EFA convierte los vectores SVD de nuevo en curvas de dispersión. A la izquierda de la ventana, los rangos definidos anteriormente se trazan en la parte superior. Estos rangos son las restricciones para definir dónde rotar los vectores singulares de nuevo en curvas de dispersión. El panel derecho muestra estos perfiles de curva de dispersión correspondientes, para cada pico separado. Una gráfica para la concentración de cada pico, que debe ser representativa de los perfiles de elución y una gráfica para el error medio ponderado chi2. La gráfica chi2 mide el conjunto de datos de desconvolución al conjunto de datos original. Idealmente, esto será plano, sin embargo, los picos a menudo se pueden ver. Intente reducir o eliminar picos modificando los controles de rango de componentes, primero identifique aproximadamente qué fotograma corresponde al pico (de la gráfica chi2) y, a continuación, en los controles de rango, qué componente contiene este fotograma (podría ser más de uno), utilizando las flechas, mueva hacia arriba o hacia abajo el rango correspondiente.NOTA: Esto debería producir una respuesta, aumentando o disminuyendo el pico. Si el fotograma de pico estaba presente en más de un componente, puede ser necesario un pequeño ensayo y error entre cada componente. Cuando se ha logrado un chi2 mínimo, realice una comprobación de validación haciendo clic hacia atrás, aparece la ventana anterior para permitir la comprobación de si los cambios realizados han cambiado drásticamente los trazados EFA originales. Si todavía parecen válidos, haga clic en Siguiente. Haga clic en Guardar datos EFA para guardar los trazados y, a continuación, haga clic en Listo; para cerrar la ventana EFA.NOTA: Una segunda validación consiste en hacer clic en la casilla de verificación situada junto a cada intervalo de componentes, a su vez. Estos proporcionan una restricción de concentración positiva para cada componente y desactivar comprobará si afectan significativamente al conjunto de datos. Si no se ve ningún cambio en la gráfica de concentración, los datos son válidos. En la ventana RAW, haga clic en la pestaña Perfiles del Panel de control para ver las curvas y, en la pestaña Manipulación del Panel de control,manipule las curvas más o guarde las curvas como *.dat archivos haciendo clic con el botón derecho en el archivo y seleccionando Guardar archivos seleccionados en el menú emergente. Guarde el archivo. Utilice Scatter IV para un análisis posterior.NOTA: Más información e instrucciones sobre la desconvolución y EFA BioXTAS RAW se encuentra en https://bioxtas-raw.readthedocs.io/en/latest/ 4. Determinar las propiedades de SAXS NOTA: En Bioisis.net encontrará un tutorial detallado para la determinación de SAXS. Aquí mostramos un enfoque básico paso a paso, resaltando los botones más útiles en Scatter. En la pestaña Análisis de dispersión, pulse el botón G para la herramienta de análisis manual guinier, a la derecha de cada archivo de muestra. La gráfica que se abre muestra el ln[I(q)] versus q2 en el cuadro superior y los residuos correspondientes en el cuadro inferior. Añada o elimine puntos de forma que los residuos no tengan una función de “sonrisa” o “ceño fruncido”. Los datos seleccionados en el ajuste Guinier no deben exceder el límite máximo q x Rg de 1.3. Pulse el botón Kratky normalizado; la gráfica que aparece proporciona una evaluación semicuantitativa del estado estructural de la macromolécula, normalizada para la masa y la concentración.NOTA: El punto de mira designa el punto Guinier-Kratky en (√3, 1.1)19. Una proteína esférica compacta mostrará un único pico con el valor máximo en el punto Guinier-Kratky. Un biopolímero intrínsecamente desordenado o cilíndrico tendría un máximo mayor que el punto de mira y no disminuiría. Una proteína que tenía dominios plegados y regiones no estructuradas alargadas durante mucho tiempo podría presentar un mayor máximo a través del punto de mira, pero también mostraría una tendencia decreciente obvia en q x Rg más alto. Haga clic en el botón Vc (Volumen de correlación), que muestra dos gráficas, la intensidad total dispersa y un área integrada de la intensidad dispersa total en función de q. Las gráficas se utilizan como referencia rápida para validar la calidad de la curva de dispersión.NOTA: La intensidad total dispersa es sensible a la I(0) y si esto no se ha medido correctamente, la gráfica no mostrará una línea continua. La parcela de área integrada, idealmente, debe mostrar una línea sigmoidal con una meseta extendida para cada curva SAXS. Si hay discordancia/resta de búfer, agregación o interferencia interpartícula en la muestra, se observará una pendiente nítida en valores q más altos. Pulse el botón Flexibilidad para iniciar el análisis de flexibilidad. Esto abrirá una ventana con cuatro paneles y un control deslizante en la parte inferior. Cada panel abierto muestra una trama que explota una relación potencia-ley que existe entre biopolímeros compactos y alargados/flexibles23. Para usar, mueva el control deslizante en la parte inferior del cuadro de derecha a izquierda con el botón izquierdo del ratón presionado. Siga moviéndose lentamente hacia la izquierda hasta que se alcance una meseta en una de las parcelas.NOTA: Si la meseta se ve en la parcela Porod-Debye, entonces la muestra es de naturaleza compacta, que debe ser consistente con un solo pico en el punto Guinier-Kratky en una parcela Kratky normalizada. Si la meseta se alcanza primero en la parcela Kratky-Debye, entonces la muestra es probablemente alargada o flexible. Si la gráfica SIBYLS es primero a la meseta, entonces la muestra probablemente contiene áreas de compactación y flexibilidad, una partícula con estados mixtos. La teoría de esta relación de flexibilidad con la Ley Porod-Debye se aborda exquisitamente en Rambo, etal. Haga clic en Volumen. La determinación del volumen debe realizarse inmediatamente después del análisis de flexibilidad de arriba. Cuando se abre después del análisis de flexibilidad, se genera una ventana emergente con tres gráficos más. En la esquina inferior, la esquina izquierda de la gráfica Porod-Debye recuerda dónde se dejó el control deslizante de la gráfica de flexibilidad, mostrando el área meseta. Para calcular el volumen de la partícula, mueva el inicio y los puntos finales utilizando los botones de flecha o escriba en los cuadros, de modo que la línea azul del trazado se ajuste a la región meseta. Para un resultado imparcial, los residuos en la parte superior derecha porod-Debye exponente fuerza-ley ajuste, no debe mostrar ningún patrón. Pulse la pestaña P(r). La distribución del espacio real se encuentra en el panel izquierdo y la curva de dispersión de la muestra en el panel derecho. El objetivo es crear una representación en el espacio real de la muestra a partir de la curva SAXS del espacio recíproco. Idealmente, la curva de distribución será suave sin ondas presentes y simplemente debe besar suavemente el eje X.NOTA: Es posible que el rango q medido del instrumento no sea totalmente utilizable debido a la mala coincidencia de búferes, la agregación, el daño por radiación, los tiempos de exposición subóptimo y las bajas concentraciones de partículas. El paso de determinación P(r) determinará fundamentalmente el rango qmínimo y qmáximo utilizable del dataset SAXS y debe ser este rango de datos que se utiliza para cualquier modelado o empalme posterior. Haga clic con el botón derecho en el nombre del ejemplo y, a continuación, haga clic en Buscar DMAX para abrir una nueva ventana. Los límites para el dmax están preconfigurados con el qmax sugerido (puntos de datos máximos utilizados), límitesd máximos inferiores y superiores y una puntuación alfa inferior y superior. Se pueden elegir tres modelos (L1-norm, Legendre y Moore) y el uso del fondo incluido. Deje estos sin cambios en la primera instancia. Pulse el botón Inicio. Se crea una distribución compuesta en el panel izquierdo con el nivel dmax y alfa sugerido escrito debajo. Si esto parece aceptable, cierre la ventana y vuelva a la pestaña P(r). La gráfica espacial recíproca se habrá recortado para que coincida con el qmaxsugerido. Elija el modelo Moore, haga clic en Fondo y luego establezca el nivel alfa y dmax a los valores sugeridos en el cuadro emergente. Pulse el botón refinar. Aparecerá una gráfica de validación cruzada si los puntos tenían que ser rechazados, marcados en rojo. Si sólo hay unos pocos puntos rechazados y la distribución se ve bien, entonces el modelo es bueno.NOTA: La gráfica de validación cruzada resaltará las regiones de los datos que son incompatibles con la distribución P(r) determinada. Si la región rechazada se encuentra principalmente en la región de baja q, es decir, la región cercana al eje Y, esto probablemente sugiere un dmax que es demasiado corto, presencia de agregación o oligómeros de orden superior. Destaca una incoherencia entre la información de resolución superior y inferior. Aquí, dmax y qmin (aumentando el valor inicial) deben ajustarse mediante un enfoque manual de prueba y error. Del mismo modo, si la región rechazada se encuentra principalmente en la región de alta q, esto puede indicar un problema con la resta de fondo o que la señal es demasiado débil para ser explicada significativamente por la distribución P(r) determinada. En este caso, qmax debe truncarse (decreciente final) hasta que no se rechacen datos adicionales. Idealmente, los puntos rechazados deben distribuirse aleatoriamente y conformar menos del 5% de los datos utilizables. Un qmincorrectamente definido, qmax y “dmax”producirán una distribución suave donde el dmax besa el eje X. Sin embargo, no aumente este valor tanto que elimina por completo la región de Guinier. Este punto se encuentra fácilmente marcando la casilla q x l(q) (a la izquierda del panel sobre la tabla). La curva de dispersión se sustituye por la “gráfica de intensidad dispersa total”, en esta curva todos los puntos antes de que la inflexión máxima formen parte de la región Guinier. Después de eliminar los puntos, intente de nuevo aumentar/disminuir el “dmax”y luego refinar una vez más. Si los problemas persisten, especialmente cuando se rechazan muchos puntos desde el inicio de la curva de validación, esto sugiere encarecidamente que los datos no son ideales para el modelado estructural. Para imprimir un informe, vuelva a la pestaña Análisis, haga clic con el botón izquierdo para resaltar el ejemplo y, a continuación, haga clic con el botón derecho en el nombre del ejemplo y vaya a Crear informe desde un único conjunto de datos en el menú. Se abre un cuadro de texto para permitir que se agreguen comentarios. Se genera un documento PDF que muestra todas las cifras y valores generados.

Representative Results

La ventaja de utilizar la desconvolución sobre la selección clásica defotogramas 13 es eliminar la influencia de las especies unas sobre otras, produciendo una señal de dispersión monodispersa. Esto también se sigue a menudo con una mejor relación señal-ruido. Cuando E9 exominus se enlaza al ADN y se ejecuta con SEC-SAXS, se observan dos picos (Figura 1). El primer pico grande (aproximadamente fotogramas 420-u2012475) es el complejo E9 exomenos-DNA el segundo (aproximadamente fotogramas 475-u2012540), el estado sin enlazar (consulte Datos suplementarios: Figura 2). Mientras que el enfoque clásico de la selección de marcos proporciona un Rg estable del complejo en el primer pico (ver Datos Suplementarios: Figura 3), el segundo pico se fusiona claramente y el Rg a través de la gráfica muestra que el segundo pico de interés no tiene un Rg estable, debido a la contaminación de pico cruzado. Sólo se podían utilizar 5 fotogramas que mostraban un Rg semiestable, cuando se restaron, le dieron un Rg a 36,3o(Figura 2,verde). Cuando los picos fueron desconvolucionados usando EFA, la curva correspondiente para el segundo pico(Figura 2, azul) se superpuso con el original y mostró una clara disminución de la señal al ruido, y se registró un Rg inferior, 34.1. La gráfica Kratky (Figura 3) muestra que el complejo con el pico desconvolucionado (azul) es más globular. Esto es confirmado por la curva P(r) (Figura 4) que da un dmax 108.5 á para la curva desconvolución (azul) mientras que el no-desconvolucionado es más alargado con un dmax 120o (verde), esto es más probable debido a la heterogeneidad derivada del exoinconvenienteno atados. Figura 1: Gráfica de señal de E9 exomenos solo y con ADN en complejo.El panel superior muestra un trazado de la relación integral con respecto al fondo para cada fotograma de una ejecución SEC-SAXS (azul claro). Los puntos rojos muestran el Rg en cada fotograma sobre el pico. El panel inferior muestra el mapa de calor correspondiente que muestra los residuos de cada fotograma coloreados de acuerdo con el análisis de correlación automática Durbin-Watson, las regiones de alta similitud son de color cian de color, mientras que los marcos diferentes siguen azules más oscuros a rosas y finalmente a rojo dependiendo de la gravedad de la diferencia. Haga clic aquí para ver una versión más grande de esta figura. Figura 2: Gráfica de intensidad frente a vector de dispersión.Una superposición de los datos SAXS restados forman el exo E9menos . En verde 5 cuadros (marco 517-u2012522) promediado y restado de un área de Rg semiestable y en azul la curva de dispersión representativa derivada de la desconvolución EFA del pico SEC-SAXS. Haga clic aquí para ver una versión más grande de esta figura. Figura 3: Curva Kratky sin dimensiones.La superposición de la curva Kratky desconrevolada (azul) y no desconvolución (verde) que muestra E9 exomenos es globular. Haga clic aquí para ver una versión más grande de esta figura. Figura 4: Curva P(r).La superposición de las curvas desconrevoladas (azul) y no desconvolucionadas (verde) para el E9 exomenos. Haga clic aquí para ver una versión más grande de esta figura. Datos Complementarios. Por favor, haga clic aquí para descargar este archivo 

Discussion

Se desea tener una muestra monodispersa antes de iniciar un experimento SAXS, pero en realidad, muchas colecciones de datos no satisfacen esto y deben mejorarse combinando la medición con la cromatografía en línea, SEC en la mayoría de los casos. Sin embargo, ni siquiera se garantiza la escasez de tiempo entre la monodispersidad de la purificación y la adquisición de datos de la muestra. Normalmente, esto se aplica a experimentos en los que los componentes tienen un tamaño demasiado cercano o en sus propiedades físicas para separarse o son propensos a dinámicas rápidas. Aquí, hemos proporcionado un protocolo que combina la descomposición de un solo valor con el análisis de factores en evolución para eliminar la influencia de DNAbound E9 exomenos de su unboundform creando un perfil de dispersión monodisperso que luego pudimos analizar con el paquete SAXS Scatter IV.

SVD con EFA de datos SEC-SAXS son métodos muy potentes desarrollados para desconvolucionar datos SAXS y mejorar el análisis, pero sí tienen limitaciones. Requieren que el ruido o la deriva en la línea base del búfer del SEC-SAXS se mantenga al mínimo. Esto puede implicar un equilibrio de columna adicional (mejor usar más de 3 volúmenes de columna, dependiendo del búfer) antes de la carga de la muestra. Sin embargo, el paso más crítico es la elección del número de valores singulares y el rango de datos utilizados, ya que esto afectará en gran medida a la precisión de la desconvolución. Es por esta razón que los resultados no deben tomarse por sí solos, sino analizarse más a fondo utilizando técnicas como la ultracentrifugación analítica (AUC) o la dispersión de luz láser multi-ángulo (MALLS) para su interpretación biológica.

Scatter IV es un nuevo paquete de software, gratuito para la investigación y el uso industrial con una interfaz de usuario intuitiva que permite incluso a los no expertos analizar sus datos. Scatter IV tiene varias características nuevas que ayudan a mejorar el análisis de los datos SEC-SAXS, como el mapa de calor vinculado a la gráfica de señal, lo que permite una mayor precisión con la selección de fotogramas. En el análisis de datos primarios, el análisis de Guinier Peak y la gráfica de validación cruzada asociada con el análisis P(r) ofrecen una capacidad de solución de problemas integrada en el software.

Cabe mencionar que muchos otros programas se pueden utilizar para el análisis de datos primarios; estos contienen las mismas características básicas y también se actualizan regularmente, como BioXTAS RAW17 ATSAS paquete24 y US-SOMO15, por nombrar algunos.

Pero independientemente del paquete SAXS que se utilice para el análisis, las principales limitaciones son comunes: la preparación de la muestra, antes de la recolección y el análisis. En el ejemplo E9 exomenos mostrado, es claro ver la mejora en la relación señal-ruido y con una reducción en el Rg el dmax asociado con una muestra monodispersa. Esto ayudará en gran medida a un mayor procesamiento de los datos, como el ajuste o el modelado con estructuras de alta resolución conocidas.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Reconocemos el apoyo financiero al proyecto de la subvención francesa REPLIPOX ANR-13-BSV8-0014 y a las becas de investigación del Servicio de Santé des Armées y la Délégation Générale pour l’Armement. Estamos agradecidos a la ESRF por el tiempo de haz SAXS. Este trabajo utilizó las plataformas del centro Grenoble Instruct-ERIC (ISBG; UMS 3518 CNRS-CEA-UGA-EMBL) dentro de la Asociación Grenoble para la Biología Estructural (PSB), con el apoyo de FRISBI (ANR-10-INBS-05-02) y GRAL, financiado dentro de la escuela de posgrado University Grenoble Alpes (Ecoles Universitaires de Recherche) CBH-EUR-GS (ANR-17-EURE-0003). IbS reconoce la integración en el Instituto de Investigación Interdisciplinaria de Grenoble (IRIG, CEA). Agradecemos a Wim P. Burmeister y al P.édéric Iseni por su apoyo financiero y científico y también agradecemos al Dr. Jesse Hopkins de BioCAT en la APS por su ayuda y por el desarrollo de BioXTAS RAW.

Materials

Beamline control software BsXCuBE ESRF Pernot et al. (2013), J. Synchrotron Rad. 20, 660-664 local development
BioXTAS Raw 1.2.3. MacCHESS http://bioxtas-raw.readthedocs.io/en/latest/index.html First developed in 2008 by Soren Skou as part of the biological x-ray total analysis system (BioXTAS) project. Since then it has been extensively developed, with recent work being done by Jesse B. Hopkins
HPLC program LabSolutions Shimadzu n.a.
ISPyB ESRF De Maria Antolinos et al. (2015). Acta Cryst. D71, 76-85. local development
NaCl VWR Chemicals (BDH Prolabo) 27808.297
Scatter Diamond Light Source Ltd http://www.bioisis.net/tutorial/9 Supported by SIBYLS beamline (ALS berkeley, Ca) and Bruker Cororation (Karlsruhe, Germany)
Superdex 200 Increase 5/150 GL column GE Healthcare 28990945 SEC-SAXS column used
Tris base Euromedex 26-128-3094-B

References

  1. Pelikan, M., Hura, G., Hammel, M. Structure and flexibility within proteins as identified through small angle X-ray scattering. General Physiology and Biophysics. 28 (2), 174-189 (2009).
  2. Brosey, C. A., Tainer, J. A. Evolving SAXS versatility: solution X-ray scattering for macromolecular architecture, functional landscapes, and integrative structural biology. Current Opinion in Structural Biology. 58, 197-213 (2019).
  3. Gräwert, M., Svergun, D. A beginner’s guide to solution small-angle X-ray scattering (SAXS). The Biochemist. 42 (1), 36-42 (2020).
  4. Putnam, C. D., Hammel, M., Hura, G. L., Tainer, J. A. X-ray solution scattering (SAXS) combined with crystallography and computation: defining accurate macromolecular structures, conformations and assemblies in solution. Quarterly reviews of biophysics. 40 (03), 191-285 (2007).
  5. Meisburger, S. P., et al. Domain Movements upon Activation of Phenylalanine Hydroxylase Characterized by Crystallography and Chromatography-Coupled Small-Angle X-ray Scattering. Journal of the American Chemical Society. 138 (20), 6506-6516 (2016).
  6. Brennich, M. E., Round, A. R., Hutin, S. Online Size-exclusion and Ion-exchange Chromatography on a SAXS Beamline. Journal of Visualized Experiments. (119), e54861 (2017).
  7. Watanabe, Y., Inoko, Y. Size-exclusion chromatography combined with small-angle X-ray scattering optics. Journal of Chromatography A. 1216 (44), 7461-7465 (2009).
  8. Graewert, M. A., et al. Automated Pipeline for Purification, Biophysical and X-Ray Analysis of Biomacromolecular Solutions. Scientific reports. 5, (2015).
  9. David, G., Pérez, J. Combined sampler robot and high-performance liquid chromatography: a fully automated system for biological small-angle X-ray scattering experiments at the Synchrotron SOLEIL SWING beamline. Journal of applied crystallography. 42 (5), 892-900 (2009).
  10. Ryan, T. M., et al. An optimized SEC-SAXS system enabling high X-ray dose for rapid SAXS assessment with correlated UV measurements for biomolecular structure analysis. Journal of Applied Crystallography. 51 (1), 97-111 (2018).
  11. Gampp, H., Maeder, M., Meyer, C. J., Zuberbühler, A. D. Calculation of equilibrium constants from multiwavelength spectroscopic data-III: Model-free analysis of spectrophotometric and ESR titrations. Talanta. 32 (12), 1133-1139 (1985).
  12. Maeder, M., Neuhold, Y. M. . Practical Data Analysis in Chemistry. , (2007).
  13. Tarbouriech, N., et al. The vaccinia virus DNA polymerase structure provides insights into the mode of processivity factor binding. Nature Communications. 8 (1), (2017).
  14. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), (2016).
  15. Brookes, E., Rocco, M. Recent advances in the UltraScan SOlution MOdeller (US-SOMO) hydrodynamic and small-angle scattering data analysis and simulation suite. European Biophysics Journal. 47 (7), 855-864 (2018).
  16. Malaby, A. W., et al. Methods for analysis of size-exclusion chromatography-small-angle X-ray scattering and reconstruction of protein scattering. Journal of Applied Crystallography. 48 (4), 1102-1113 (2015).
  17. Hopkins, J. B., Gillilan, R. E., Skou, S. BioXTAS RAW: improvements to a free open-source program for small-angle X-ray scattering data reduction and analysis. Journal of Applied Crystallography. 50 (5), 1545-1553 (2017).
  18. Maeder, M. Evolving factor analysis for the resolution of overlapping chromatographic peaks. Analytical Chemistry. 59 (3), 527-530 (1987).
  19. Durand, D., et al. NADPH oxidase activator p67phox behaves in solution as a multidomain protein with semi-flexible linkers. Journal of Structural Biology. 169 (1), 45-53 (2010).
  20. De Maria Antolinos, A., et al. ISPyB for BioSAXS, the gateway to user autonomy in solution scattering experiments. Acta Crystallographica Section D. 71 (1), 76-85 (2015).
  21. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), 203-212 (2016).
  22. Kirby, N., et al. Improved radiation dose efficiency in solution SAXS using a sheath flow sample environment. Acta Crystallographica Section D Structural Biology. 72 (12), 1254-1266 (2016).
  23. Rambo, R. P., Tainer, J. A. Characterizing flexible and intrinsically unstructured biological macromolecules by SAS using the Porod-Debye law. Biopolymers. 95 (8), 559-571 (2011).
  24. Franke, D., et al. ATSAS 2.8: a comprehensive data analysis suite for small-angle scattering from macromolecular solutions. Journal of Applied Crystallography. 50 (4), 1212-1225 (2017).

Play Video

Cite This Article
Tully, M. D., Tarbouriech, N., Rambo, R. P., Hutin, S. Analysis of SEC-SAXS data via EFA deconvolution and Scatter. J. Vis. Exp. (167), e61578, doi:10.3791/61578 (2021).

View Video