Aquí, presentamos cómo la dispersión de rayos-x en ángulo pequeño (SAXS) pueden ser utilizados para obtener información en sobres baja representación de las estructuras macromoleculares. Cuando se utiliza en conjunción con alta resolución estructurales técnicas como la cristalografía de rayos x y resonancia magnética Nuclear, SAXS puede proporcionar penetraciones detalladas en dominios múltiples proteínas y complejos macromoleculares en solución.
Interacciones de proteínas con proteínas con dominios globulares múltiples presentan desafíos técnicos para determinar cómo forman complejos y cómo los dominios posicionado/orientado. Aquí, se describe un protocolo con el potencial para la aclaración de que dominios específicos median interacciones sistema multicomponente mediante modelado ab initio . Un método para el cálculo de las estructuras de solución de macromoléculas y sus asambleas es condición implica la integración de datos de dispersión de rayos-x de pequeño ángulo (SAXS), cromatografía y estructuras de resolución atómica en un enfoque híbrido. Un ejemplo concreto es el del complejo de larga duración nidogen-1, que reúne a las proteínas de matriz extracelular y forma una nanoestructura extendido, curvado. Uno de sus dominios globulares une a laminina γ-1, que las estructuras de la membrana basal. Esto proporciona una base para la determinación de estructuras precisas de complejos de proteína del multidomain flexible y está habilitado por sincrotrón fuentes juntadas con sistemas de cromatografía de automatización robótica y tamaño de exclusión. Esta combinación permite un análisis rápido en el que varios Estados oligoméricos se separan justo antes de la recolección de datos SAXS. El análisis obtiene información sobre el radio de giro, dimensión de partícula, forma molecular y del maridaje entre dominios. También se da el protocolo para la generación de modelos 3D de complejos por montaje de estructuras de alta resolución de las proteínas del componente.
Las células contienen intrincadas redes de proteínas que actúan como máquinas moleculares para llevar a cabo las funciones celulares tales como cascadas de señalización y mantenimiento de la integridad estructural. Las formas en que estos diferentes componentes moverán e interactuan en un espacio tridimensional da lugar a las funciones específicas de las macromoléculas. La importancia de la estructura de las proteínas, dinámica e interacciones en la determinación de la función ha proporcionado la necesidad de continuamente cambiantes, complejas técnicas medir estas propiedades. De estos, resonancia magnética Nuclear (RMN), Cristalografía de rayos x (XRC) y más recientemente, microscopia del Cryo-electrón (CEM) proporciona información estructural de alta resolución. Sin embargo, XRC CEM producen estructuras de uno de los muchos Estados biomolecular y carecen de información sobre la dinámica de la estructura de la proteína, mientras que la determinación de la estructura 3D por RMN es típicamente limitada a pequeñas proteínas globulares. Una manera de superar estas limitaciones es utilizar la dispersión de rayos-x de ángulo pequeño (SAXS) para generar sobres moleculares de sistemas grandes, multidominio o complejados y combinar las estructuras macromoleculares rígidas alta resolución para dilucidar el mundial arquitectura y características dinámicas.
SAXS produce baja resolución sobres de complejos macromoleculares con una resolución de aproximadamente 10-20 Å 1, dando la penetración no sólo en la estructura sino también las características dinámicas que muestra el complejo. Aunque SAXS utiliza rayos x para descubrir la estructura molecular, es a diferencia de XRC que la orientación isotrópica al azar de las partículas en solución no conduce a la difracción, sino a la dispersión, que no puede ceder a resolución atómica. En cambio, se genera un electrón “envolvente” de la macromolécula que representa un promedio de las conformaciones que muestra de la macromolécula. Esta información puede utilizarse en conexión directa de las estructuras previamente solucionadas resolución atómica para inferir las regiones de flexibilidad en una sola proteína o subunidad organización y dinámica en un complejo más grande, Multi-proteína. Se recogen datos SAXS en sincrotrones con alta energía rayos x monocromáticos o de fuentes internas, que ofrecen una fuente de rayos x más débil que requieren horas en lugar de segundos de tiempo de exposición de la muestra (figura 1). Datos SAXS se recogen a menudo de varias muestras con una sola instalación experimental y buffer, que requieren un período de tiempo para recopilar una serie de datos útiles en un sistema. Las muestras deben, por lo tanto, ser estable y no agregando durante al menos unas horas basadas en métodos de control de calidad verificables tales como dispersión ligera dinámica (DLS) o análisis de la ultracentrífuga analítica (AUC) para obtener datos de saxos de alta calidad2 , 3. aquí proporcionamos una descripción práctica de SAXS, los principios detrás de su uso, beneficios, limitaciones y preparación de la muestra y recolección de datos fuertemente en objetivo y análisis, junto con tocar brevemente en ab initio modelando con la matriz extracelular proteínas nidogen-1 y laminina γ-1 como ejemplo experimental.
Principios, ventajas y limitaciones de saxos:
La guía principle(s) detrás de SAXS es relativamente simple: una solución de la preparación de la generación de macromolecule(s) de interés se coloca dentro de un tubo capilar y se expone a un haz de rayos x monocromático de alta energía. Los fotones provocan electrones de la cáscara atómica para comenzar oscilante, dando por resultado una onda esférica se emite la misma energía y longitud de onda. Puesto que cada electrón oscilará, se logrará un fondo constante y la densidad del electrón que resulta de la macromolécula se contrapone a un segundo plano. La intensidad de dispersión resultante se recoge en función de la dispersión de ángulo, 2Θ (figura 1).
Mientras que otras técnicas como XRC, RMN y CEM proporcionan información estructural a nivel atómico, hay múltiples beneficios a saxos que otras técnicas no pueden ofrecer. SAXS puede realizarse en casi cualquier tampón y no requiere ninguna preparación especial. Esto es particularmente importante en el estudio de la conducta y la estructura de macromoléculas bajo condiciones variables, como la presencia o ausencia de mono – o cationes divalentes o cambios en el pH4,5. SAXS tiene la capacidad para proporcionar información sobre las regiones flexibles de una macromolécula6, algo las otras técnicas mencionadas pueden luchar con. Por lo tanto, SAXS puede ser utilizado como una técnica conexión fuerte con la parte estable de una macromolécula que estudió con XRC, MRN o CEM y la macromolécula entera o complejo analizado en baja resolución con saxos y combinado utilizando diversas herramientas de análisis tales FoXSDock7 o8de CRYSOL. Como SAXS es una técnica de solución, a menudo se utiliza para confirmar si estructuras estáticas como los obtenidos de XRC son constantes en la solución6. SAXS también tiene la ventaja de ser una técnica que requiere una cantidad relativamente pequeña de la inversión (típicamente 50-100 μL) de muestra y una cantidad relativamente pequeña de tiempo del experimento (30 min – 1 h).
La limitación más grande de SAXS es la vulnerabilidad a la agregación de muestra o degradación, que puede conducir a predicciones estructurales incorrectas. Una agregación, incluso tan baja como 5%, puede dispersar la luz en cantidades muy altas, conduce a una sobreestimación de la dimensión de partícula máxima (Dmax) y el radio de giro (Rg). Por otro lado, la degradación de la muestra puede conducir a una subestimación de propiedades moleculares. Esta vulnerabilidad surge de SAXS siendo una técnica promedio, lo que significa que la homogeneidad de la muestra es fundamental para lograr resultados confiables y reproducibles. Cualquier muestra que debe ser analizado por SAXS debe, por lo tanto, experimentar varios métodos de purificación y control de homogeneidad, como nativa y desnaturalización electroforesis en gel, cromatografía por exclusión de tamaño, luz dinámica, dispersión, análisis ultracentrifugación. A menudo, líneas de SAXS se ejecutarán paso a través de cromatografía líquida de alto rendimiento como un control de calidad final antes de SAXS (S-SAXS)3,9. Deben recogerse datos SAXS en múltiples concentraciones y deben compararse los Rg de cada conjunto de datos, asegurando una semejanza cercana para evitar interacciones entre partículas y agregación, que resulta en una sobreestimación de la partícula dimensiones, lleva al análisis de los datos inexactos y modelado. Puesto que la dispersión depende de la concentración y tamaño, macromoléculas más pequeñas pueden requerir una optimización más específica de la gama de concentración. Esto es debido a Teorema de la reciprocidad, donde grandes tamaños dispersión hacia ángulos pequeños y tamaños pequeños a grandes ángulos. Esto se manifiesta en la recogida de datos, dondeO es proporcional a R6, donde R es el radio de la partícula. Una limitación final de SAXS es el potencial de daño por radiación a la muestra durante la exposición, que puede conducir a la distorsión de los datos. Es una buena práctica para comparar la calidad de la muestra antes y después de la exposición de muestra SAXS para que esto no está ocurriendo.
Los pasos críticos del análisis de los datos SAXS descritos en la sección de protocolo de este papel incluyen buffer de la substracción, análisis de Guinier, Kratky análisis, fusión de datos y distribución de reinicio. El modelamiento ab initio del grano es demasiado extenso para ser cubierto aquí en detalle y por lo tanto se cubre sólo brevemente.
En sincrotrones (e.g. DESY en Alemania, diamante en el Reino Unido y ESRF en Francia), es posible recoger datos SAXS para una fracción muy pequeña (~ pocos μL) de cada muestra como las fracciones son ser eluida de la columna s es conectado en línea (ver figura 1 de ). Los datos SAXS elásticamente dispersos radialmente es un promedio utilizando los paquetes proporcionados por el fabricante del instrumento o por el sincrotrón antes resta de buffer puede ocurrir. Los datos resultantes de 1D representan la cantidad de luz dispersada (en (q)) en Y-eje y ángulo de dispersión (q= 4πsinθ/λ, donde λ es la longitud de onda incidente X-rayos) y se describe en la figura 1. El programa PRIMUS/qt12 se utiliza para restar directamente cualquier fondo debido a la amortiguación y se describe en el punto 1.1. Otros programas tales como; ScÅtter43 (descarga disponible en www.bioisis.net) con un tutorial disponible en https://www.youtube.com/channel/UCvFatdC5HcZOLv6OSjblfeAy bioXtas crudo44 (disponible en https:// bioxtas-raw.readthedocs.io/en/Latest/index.html) puede ser utilizada como una alternativa al paquete ATSAS.
El análisis de Guinier proporciona información sobre la agregación de la muestra y homogeneidad así el radio de giro (Rg) para la macromolécula de interés basándose en los datos SAXS de la región de baja s 14. Una parcela se construye con PRIMUS/qt para datos SAXS obtenidos en cada concentración, seguida por la curva con el rango máximo de hasta 1.30 para q x Rg. Preparación de la muestra de una generación debería proporcionar una parcela de Guinier lineal en esta región (Figura 2D), mientras que el resultado de la agregación en un no lineal Guinier parcela15,16. Si el análisis de Guinier es lineal, puede observarse el grado de “unfoldedness” de una macromolécula de interés con la trama Kratky, que es útil al decidir si realizar modelado de cuerpo rígido o construir conjuntos de modelos de baja resolución. Una proteína globular aparecerá en un Kratky parcela tener una curva en forma de campana, mientras que amplió las moléculas o péptidos desplegadas aparecerán a la meseta o incluso aumento de la gama más grande de q y carecen de la forma de campana (figura 2).
Obtener el Rg de Guinier análisis considera solamente los puntos de datos de la región de bajo q de la parcela 1D de dispersión (Figura 2D), sin embargo, es posible utilizar casi todo conjunto de datos para realizar una transformación de Fourier indirecta para convertir la información de espacio recíproco de ln (I (q)) vs (q) en una función de distribución del distancia espacio real (P(r)) que proporciona información sobre max D y Rg (Figura 2B) La forma de la parcela P(r) representa la conformación de solución bruta de la macromolécula de interés18,19. la conversión de datos de espacio recíproco a los datos del espacio real es un paso fundamental pero no es una descripción detallada dentro del alcance de este documento. Por lo tanto, hacer referencia a un artículo Svergun20 entender cada parámetro.
Una vez que resta el búfer de datos en concentraciones individuales se procesan a través de Guinier análisis con un valor constante de Rg, seguido por investigar su patrón plegable usando análisis Kratky, pueden combinar estos datos. Los datos combinados para nidogen-1, laminin γ-1 y su complejo se procesaron como se describió anteriormente y el consiguiente reinicio parcelas se presentan en la figura 2B. Idealmente, se debe calcular también la función de distribución de par-distancia reinicio para cada concentración para determinar si datos SAXS obtenidos para cada concentración proporcionan similares Rg y valores Dmax . Si la Rg y Dmax permanecen similares en una amplia gama de concentraciones, el usuario debe proceder. Cabe señalar que dependiendo de la señal, los datos pueden truncarse antes de la fusión de datos. Esto a menudo es el caso si la concentración o peso molecular de las macromoléculas bajo investigación es baja.
Análisis de la forma de baja resolución usando DAMMIN puede realizarse de varios modos (por ejemplo, rápida, lenta, modos de expertos, etc.). El modo rápido es un primer paso ideal para evaluar si la trama de reinicio ofrece modelos de buena calidad. Por lo general, deben obtenerse al menos 10 modelos para que cada parcela de reinicio comprobar si se obtienen resultados reproducibles, en cuanto a la estructura de baja resolución, con una baja de bondad de ajuste parámetro χ (un valor de 0.5-1.0 se considera buena basado en nuestra amplia labor ), un valor que describe un acuerdo entre datos SAXS experimentalmente y datos derivados de la modelo. Para propósito de la publicación, normalmente uso modo lento o experto y calcular por lo menos 15 modelos. Además DAMMIN, una versión más rápida de él, DAMMIF37, así como GASBOR38 también son alternativas. Además, para estudiar proteínas o complejos de ácidos nucleicos proteínas, es posible utilizar la MONSA programa35, que facilita la colocación simultánea de los datos SAXS individuales para macromoléculas, así como su complejo. Para más detalles sobre los cálculos modelo de alta resolución, así como para estudios de interacciones RNA-proteína, referencia a un artículo reciente por Patel et al3.
SAXS es teóricamente simple, pero, sin duda, un método altamente complementario con otras herramientas de la biología estructural y resultados en baja resolución datos estructurales que pueden utilizarse por sí sola o en conjunción con técnicas de alta resolución para aclarar información sobre la estructura macromolecular y dinámica. Como se puede obtener una preparación de generación de macromoléculas y sus complejos, SAXS puede ser utilizada para estudiar la estructura en solución y las interacciones de cualquier tipo de macromolécula biológica. En el caso del complejo aquí, cabe destacar que menos del 10% de la superficie total accesible de nitrógeno-1 y laminina 1 γ está enterrado en este complejo, mientras que el resto de los dominios de ambas proteínas son libremente accesibles para interactuar con otros proteínas en la matriz extracelular para mantener su rigidez estructural (figura 3). Obtención de dicha información para un complejo con ~ 240kDa sería muy difícil utilizar otras técnicas de biología estructural, tales como Cristalografía de rayos x, RMN y microscopia del Cryo-EM.
Descubrir estructura de las proteínas mediante Cristalografía de rayos x o NMR es un proceso inherentemente lento. Este cuello de botella en la determinación de la estructura es un área donde SAXS muestra su fuerza como una técnica estructural; adquisición de datos para un experimento único de SAXS puede tomar menos de una hora y con la ayuda de software de Análisis aerodinámico, puede realizar un análisis rápido y eficiente. SAXS tiene el potencial para aumentar rendimiento de estudios estructurales como una técnica autónoma, porque ofrece un modelo de baja resolución de la estructura macromolecular antes de datos de alta resolución están disponibles. Una barrera a otras técnicas estructurales es el requisito para una muestra muy pura, concentrada para adquisición de datos, que exige un alto nivel de expresión de la proteína y la estabilidad durante un largo período de tiempo. Mientras SAXS muestras también deben ser puros y concentrados, los volúmenes de la muestra están aproximadamente 100 μl haciendo SAXS un método relativamente barato de análisis en comparación con otras técnicas estructurales. Por otra parte, SAXS acoplada con Cromatografía por exclusión de tamaño se está volviendo cada vez más común que proporciona un paso adicional de control de calidad. Recientemente ha habido avances fuertes en la combinación de datos NMR y SAXS utilizando el método de optimización de conjunto (MOE)45,46 aclarar sistemas flexibles. En un reciente artículo de Mertens y Svergun47, los autores describen varios ejemplos recientes de SAXS EOM en combinación con RMN, junto con muchos otros ejemplos de los datos SAXS se utiliza en conjunción con NMR. Continuamente se hacen avances en el campo de SAXS, y nuevas técnicas están siendo desarrollados por SAXS ser utilizado en conjunción con, no sólo complementario a otras técnicas estructurales. En consecuencia, creemos que la demanda de SAXS sólo aumentará con el tiempo, especialmente en conjunción con NMR para caracterizar sistemas dinámicos donde las funciones se definen por la flexibilidad.
The authors have nothing to disclose.
Este proyecto ha sido apoyado por NSERC RGPIN-2018-04994, programa de innovación Campus Alberta (RCP-12-002 C) e Instituto de investigación de Alberta del prión / becas de Alberta Innova Bio Solutions (201600018) concedidos a M.O. TRP es una Cátedra de investigación de Canadá en el ARN y Biofísica de proteínas (201704) y reconoce la concesión del descubrimiento de NSERC (RGPIN-2017-04003). TM está financiado por la beca NSERC descubrimiento a TRP.
HEK 293 EBNA Cell Line | In-Lab availability | – | Cell line used to overexpress protein(s) |
Ni Sepharose High Performance histidine-tagged protein purification resin | GE Healthcare | 17524801 | Affinity protein purification resin |
Superdex 200 Increase 10/300 | GE Healthcare | 28990944 | SEC Column |
ÄKTA Pure FPLC | GE Healthcare | – | FPLC System |
Nanodrop | Nanodrop | – | Spectrophotometer |
Basic Reagents (NaCl, Tris-HCl etc.) | |||
S-MAX3000 | Rigaku | – | SAXS Pinhole Camera System |
Zetasizer Nano-S | Malvern Instruments Ltd | – | Dynamic Light Scattering instrument |
0.1µm Filter | Millipore | JVWP04700 | Used to Concentrate Sample Prior to DLS |
Thrombin cleavage kit | abcam | ab207000 | Thrombin cleavage to remove His tag |
Strep-Tactin Sepharose Column | IBA | 2-1201-010 | Strep-Tag Affinity Purification |
D-desthiobiotin | Sigma-Aldrich | 533-48-2 | Elution of Strep Tag Protein |
Software | |||
SAXGUI | Rigaku | – | Data Collection for SAXS and data reduction |
ATSAS Suit | Franke et al., 2017 | – | SAXS Data Analysis Software program suite |
PRIMUS | Konarev et al., 2003 | – | Buffer Subtraction |
GNOM | Svergun, 1992 | – | Rg, Dmax and p(r) Calculation |
DAMMIF | Franke and Svergun, 2009 | – | Ab initio model calculation |
DAMAVER | Volkov and Svergun, 2003 | – | Averaged Solution Conformation calculations |
MONSA | Svergun, 1999 | – | Simultaneous model fitting for the complex |
GASBOR | Svergun et al., 2001 | – | Alternative Ab initio model calculations |
DTS Software V6.20 | Malvern Instruments Ltd | – | DLS supplied instrument software |
PyMOL | Schrodinger, LLC. | – | The PyMOL Molecular Graphics System V2.0 |
The Protein Data Bank | Berman et al., 2000 | – | PDB ID: 1NPE |