Summary

Análise dos dados da SEC-SAXS via desconvolução e dispersão da EFA

Published: January 28, 2021
doi:

Summary

As medições SEC-BioSAXS de macromoléculas biológicas são uma abordagem padrão para determinar a estrutura de soluções de macromoléculas e seus complexos. Aqui, analisamos os dados da SEC-BioSAXS de dois tipos de traços SEC comumente encontrados — cromatógramas com picos totalmente resolvidos e parcialmente resolvidos. Demonstramos a análise e a desconvolução utilizando dispersão e BioXTAS RAW.

Abstract

BioSAXS é uma técnica popular usada em biologia molecular e estrutural para determinar a estrutura da solução, tamanho e forma de partículas, relação superfície-volume e alterações conformais de macromoléculas e complexos macromoleculares. Um conjunto de dados SAXS de alta qualidade para modelagem estrutural deve ser de amostras monodisperse, homogêneas e isso muitas vezes só é alcançado por uma combinação de cromatografia inlina e medição imediata do SAXS. Mais comumente, a cromatografia de exclusão de tamanho é usada para separar amostras e excluir contaminantes e agregações da partícula de interesse, permitindo que as medidas de SAXS sejam feitas a partir de um pico cromatográfico bem resolvido de uma única espécie de proteína. Ainda assim, em alguns casos, mesmo a purificação inline não é uma garantia de amostras monodispersas, seja porque vários componentes estão muito próximos um do outro em tamanho ou mudanças de forma induzidas pelo tempo de eluição percebida por alterações de ligação. Nestes casos, pode ser possível desconvoluir os dados saxs de uma mistura para obter as curvas de SAXS idealizadas de componentes individuais. Aqui, mostramos como isso é alcançado e a análise prática dos dados da SEC-SAXS é realizada em amostras ideais e difíceis. Especificamente, mostramos a análise SEC-SAXS da vaccinia E9 DNA polimerase exonuclease menos mutante.

Introduction

Macromoléculas biológicas são muito pequenas para serem vistas mesmo com os melhores microscópios de luz. Os métodos atuais para determinar suas estruturas geralmente envolvem cristalizar a proteína ou medições em um grande número de moléculas idênticas ao mesmo tempo. Embora a cristalografia forneça informações sobre o nível atômico, ela representa um ambiente de amostra artificial, dado que a maioria das macromoléculas não são apresentadas de forma cristalina na célula. Durante os últimos dois anos, a microscopia crio-elétron forneceu estruturas semelhantes de alta resolução de grandes macromoléculas / complexos macromoleculares, mas embora as amostras estejam mais próximas da condição fisiológica, elas ainda estão congeladas, portanto imóveis e estáticos. A dispersão de raios-X de ângulo bio-pequeno (BioSAXS) fornece uma medição estrutural da macromolécula, em condições relevantes para a biologia. Este estado pode ser visualizado como uma forma 3D de baixa resolução determinada na escala de nanômetros e captura todo o espaço conformacional da macromolécula em solução. Os experimentos biosaxs avaliam eficientemente o estado oligomerico, domínio e arranjos complexos, bem como flexibilidade entre os domínios1,2,3. O método é preciso, em sua maioria não destrutivo e geralmente requer apenas um mínimo de preparação e tempo da amostra. No entanto, para a melhor interpretação dos dados, as amostras precisam ser monodisperses. Isso é desafiador; moléculas biológicas são frequentemente suscetíveis a contaminações, má purificação e agregação, por exemplo, do congelamento do descongelamento4. O desenvolvimento da cromatografia inline seguida da medição imediata do SAXS ajuda a mitigar esses efeitos. A cromatografia de exclusão de tamanho separa as amostras por tamanho, excluindo assim a maioria dos contaminantes e agregações5,6,7,8,9,10. No entanto, em alguns casos, mesmo o SEC-SAXS não é suficiente para produzir uma amostra monodisperse, porque a mistura pode consistir de componentes que estão muito próximos em tamanho ou suas propriedades físicas ou sua dinâmica rápida levam a picos sobrepostos no traço SEC UV. Nestes casos, uma etapa de desconvolução baseada em software dos dados saxs obtidos pode levar a uma curva DE SAXS idealizada do componente individual5,11,12. Como exemplo, na seção de protocolo 2, mostramos a análise padrão SEC-SAXS da exonuclease de DNA da vaccinia E9 exonuclease menos mutante (E9 exomenos) em complexo com DNA. A vaccinia representa o organismo modelo da Poxviridae, uma família que contém vários patógenos, por exemplo, o vírus da varíola humana. A polimerase mostrou-se ligar firmemente ao DNA em abordagens bioquímicas, com a estrutura do complexo recentemente resolvida pela cristalografia de raios-X13.

A maioria das instalações síncrotrons fornecerá um pipeline automatizado de processamento de dados que executará a normalização e integração de dados produzindo um conjunto de quadros nãoubtratados. Mas a abordagem descrita neste manuscrito também poderia ser usada com uma fonte de laboratório desde que a SEC-SAXS seja realizada. Além disso, pode-se estar disponível uma automação adicional que rejeite quadros danificados por radiação e realize a subtração do buffer14. Mostraremos como realizar a análise de dados primários em dados pré-processados e aproveitar ao máximo os dados disponíveis na seção 2.

Na seção 3, mostramos como desconvoluir os dados do SEC-SAXS e analisar as curvas de forma eficiente. Embora existam vários métodos de desconvolução, como a desconvolução do pico gaussiano, implementado no US-SOMO15 e o método de máxima probabilidade otimizado guinier, implementado no software DELA16,estes geralmente requerem um modelo para a forma máxima12. O tamanho finito dos picos individuais que estamos investigando permite o uso da análise de fatores em evolução (EFA), como uma forma aprimorada de decomposição de valor singular (SVD) para desconvolutar picos sobrepostos, sem depender da forma de pico ou do perfil de dispersão5,11. Uma implementação específica do SAXS pode ser encontrada no BioXTAS RAW17. O EFA foi usado pela primeira vez em dados de cromatografia quando os dados do array 2D diodo permitiram que as matrizes fossem formadas a partir da absorção contra o tempo de retenção e os dados de comprimento de onda18. Quando a EFA se destaca é que ela se concentra no caráter em evolução dos valores singulares, como eles mudam com a aparência de novos componentes, com a ressalva de que há uma ordem inerente na aquisição10. Felizmente, os dados da SEC-SAXS fornecem todos os dados de aquisição ordenados necessários em matrizes de dados 2D organizados, emprestando-se bem à técnica EFA.

Na seção 4, demonstraremos o básico da análise SAXS independente do modelo a partir da curva SAXS subtraída de fundo tampão. A análise de forma independente do modelo determina o raio de giro (Rg) da partícula, o volume de correlação (Vc), o Volume de Porod (Vp) e o Expoente porod-Debye (PE). A análise fornece uma avaliação semi-quantitativa do estado termodinâmico da partícula em termos de compactação ou flexibilidade através do gráfico kratky indimensionado2,4,19.

Finalmente, os dados do SAXS são medidos em unidades espaciais recíprocas e mostraremos como transformar os dados do SAXS em espaço real para recuperar a função de distribuição de par-distância, P(r). A distribuição P(r)é o conjunto de todas as distâncias encontradas dentro da partícula e inclui a dimensão máxima da partícula, dmax. Por se trata de uma medição termodinâmica, a distribuição P(r) representa o espaço físico ocupado pelo espaço conformacional das partículas. A análise adequada de um conjunto de dados SAXS pode fornecer insights de estado de solução que complementam informações de alta resolução da cristalografia e crio-EM.

Protocol

1. A expressão proteica, purificação e medição SEC-SAXS baseia-se no protocolo publicado13 Siga o protocolo de coleta de dados SEC-SAXS inline (Brennich et al.6) em breve. Equilibre a coluna SEC com pelo menos 2 volumes de coluna de buffer de execução SEC (20 mM Tris-HCl, pH 7.5, 100 mM NaCl). Prepare 50 μL de amostra de E9 exomenos a 8\u201210 mg/mL com 20% de excesso molar de um dsDNA parcial (TCAGGAAGATAACAGCGGTTTAGCC e GGCTAAACCGCTGTTATCTT). E9 exomenos liga com um KD de 12 ± 6 nM (ver Dados Complementares). Injete 50 μL desta mistura em uma coluna SEC (S200 Increase) em linha com a célula de fluxo para medições de SAXS a 0,3 mL/min. Colete 1000 quadros a 1 s de exposição cada.NOTA: No BioSAXS beamline BM29, na European Synchrotron Facility (ESRF) os quadros individuais são processados automaticamente e independentemente dentro da estrutura EDNA14. Após a coleta de dados, abra o banco de dados ISPyB20 e sob a guia de aquisição de dados pressione o botão Go para acessar o conjunto de dados e os resultados da análise automática21. Baixe os dados. 2. Análise de dados primários Abra o programa baseado em Java Dispersão IV (veja o Tabela de Materiais) e realizar uma subtração de fundo para dados de cromatografia de exclusão de tamanho (SEC).Abra a guia SEC. Arraste e solte os arquivos de dados reduzidos(*.dat) na janela “Dados de queda abaixo”. Defina o diretório de saída “Out Dir ::” clicando no botão De saída dir com rótulo azul.NOTA: Se seus dados foram coletados em nm-1,uma caixa de conversão precisará ser verificada (inferior esquerda do painel) ao soltar arquivos na janela ou na guia de subtração. Edite os detalhes experimentais, use o botão Editar detalhes e preencha o maior número possível de campos, estes incluem seções em que a fonte/linha de feixe foi usada para coletar dados, parâmetros de coleta e detalhes da amostra. Estes serão salvos com os dados e permitirão preencher mais facilmente a seção “Parâmetros de coleta de dados” em publicações futuras. Digite o nome da amostra na caixa Salvar como caixa. Clique em TRACE.NOTA: Isso tem dois efeitos. Em primeiro lugar, criará um arquivo *.sec para os dados. Este é um único arquivo de texto que reunirá todas as observações experimentais dos arquivos separados de *.dat. Além disso, o arquivo *.sec contém o conjunto médio de quadros que é o buffer-fundo, todos os quadros usados na média, bem como os quadros subtraídos de fundo tampão em todo o experimento SEC-SAXS. Em segundo lugar, é criado um gráfico de sinal que plota o número do quadro versus a razão integral para o fundo. Isso mostra os quadros selecionados (cinza) que foram mediados para a subtração do buffer. Os pontos para o buffer médio são determinados a partir de toda a gama de dados. No entanto, é aconselhável escolher manualmente os quadros tampão para uma média de fundo, pois um fundo mal definido pode ocorrer devido a colunas mal equilibradas ou sujas ou falta capilar22. Selecione quadros tampão manualmente. Clique em Limpar buffers e resele uma região tampão com um clique esquerdo de arrasto, na curva de rastreamento. Idealmente, esta deve ser uma região plana antes do volume vazio da coluna SEC de aproximadamente 100 quadros. Clique em SET BUFFER e, em seguida, atualize para recalcular o arquivo *.sec que pode levar alguns minutos. Identificar uma região de interesse (ROI). No gráfico de sinal, selecione a região do pico de interesse, com um clique-drag esquerdo.NOTA: Isso preenche três parcelas no painel direito. As duas parcelas superiores estão ligadas com a mira movendo-se entre eles, uma segunda trama de sinal (canto superior direito) mostra apenas o ROI selecionado, com a intensidade de cada quadro em azul e o Rg correspondente de cada quadro em vermelho e um mapa de calor correspondente abaixo, mostrando os resíduos para cada quadro colorido de acordo com a análise de correlação automática durbin-watson. Regiões de alta similaridade são cianos coloridos (Durbin-Watson, d = 2) enquanto quadros diferentes seguirão o azul mais escuro aos rosas e, finalmente, aos vermelhos, dependendo da gravidade da diferença (d > 2). O plot inferior é uma curva I versus q subtraída para o quadro selecionado central (também denotado por uma linha vertical). As teclas de seta podem ser usadas para navegar através dos quadros subtraídos. O gráfico I versus q demonstrará a qualidade dos quadros subtraídos do experimento SEC. Selecione quadros para mesclar. Clique na mira no gráfico do mapa de calor para selecionar o subconjunto de quadros que serão usados para fusão. A mira identificará uma área triangular de ciano predominantemente ciano que cai para o lado inferior direito da mira. Use um mouse-click para definir esses quadros como selecionados e destaque os quadros na área correspondente do gráfico Sinal acima. Esses quadros devem destacar idealmente uma região com Rg estável.NOTA: Conforme necessário, amplie o mapa de calor com um arrasto de clique esquerdo e amplie com um deslize de clique esquerdo para a direita. Quando satisfeito com os quadros selecionados clique em MESCL. Isso irá mesclar os quadros subtraídos e apresentá-los na guia ANÁLISE. 3. Desconvolução de dados Abra o programa de desconvolução (por exemplo, BioXTAS Raw 2.0.0). No programa de desconvolução, carregue o conjunto de dados, na guia Arquivos, no Painel de Controle,use o símbolo dobrável para localizar os dados ou copiar e cole o local na barra de endereços.NOTA: Certifique-se de que a pasta contém apenas os arquivos brutos *.dat e nenhum arquivo de dados processado ou médio. Destaque todos os arquivos *.dat, aperte o botão Plot Series, um gráfico de intensidade integrada versus número de quadro será sorteado no “Plot de Série”. No Painel de Controle selecione a guia Série e clique para destacar a curva. Abra a janela pop-up LC Analysis usando o botão na base do painel de controle. Esta janela dá acesso a várias opções, como selecionar diferentes tipos de moléculas (proteína ou RNA). Ele também permite que o usuário selecione a região tampão para o plot. Em primeiro lugar clique em Auto; este deve selecionar uma região de buffer adequada.NOTA: Se isso falhar, possivelmente devido a uma linha de base instável, então “Adicionar região” para otimizar a região tampão. Isso preenche a caixa Buffer com uma caixa menor na qual se pode adicionar manualmente os números de quadros para usar no buffer. Como alternativa, clique em “Escolher” para dar a opção de selecionar uma área no plot. Localize a área, clique à esquerda uma vez para a posição inicial, mova o cursor para a próxima posição e clique à esquerda novamente. Pode ser necessário adicionar mais de um local de buffer. Clique em Definir buffer e as curvas serão subtraídas e o Rg calculado através do pico SEC. Se uma caixa pop-up aparecer, clique em OK. Para iniciar a Análise de Fatores Em Evolução (EFA), clique com o botão direito do mouse no arquivo destacado na parte inferior do Painel de Controle e, em seguida, selecionar Efa do menu.Verifique se abre uma janela pop-up que mostra a decomposição de valor único (SVD) do conjunto de dados. Na caixa de controles, verifique a caixa Use Frames para que toda a área de pico desconvolute seja coberta pelo gráfico de intensidade. A trama “Valores Singulares”, no canto superior direito, mostra a intensidade dos valores singulares (picos/espécies separadas) acima da linha de base.NOTA: O número de pontos presentes acima da linha de base representa o número de espécies dispersas presentes. Com a ressalva de que é a magnitude relativa do valor singular para a área plana/linha de base que importa. Para ajudar a validar o número de valores únicos, use o gráfico de autocorrelação inferior. Isso mostra os vetores de correlação único e direito e esquerdo. Clique em Next.NOTA: Estes representam essencialmente perfis de dispersão ou concentração para o vetor da solução. Onde o tamanho absoluto representa a importância do vetor. Um componente significativo terá uma correção automática perto de 1 (uma regra de corte de polegar é >0.6\u20120.7). RAW calcula isso com ajuda e é mostrado na caixa de SVs #Significant, inferior esquerdo, embora você possa alterá-lo se necessário. Se houver vários valores únicos (por exemplo, 4+), pode ser necessário olhar apenas para 2 ou 3 dos componentes, alterando o intervalo dos dados utilizados. Quanto menor o número de componentes, mais fácil será a análise do EFA, mas ao custo do uso de menos dados. Em situação complexa, onde os vetores singulares esquerdo e direito, que deveriam ser semelhantes, não correspondem a reduzir o número significativo de SV e diminuir o número de quadros usados até que os vetores singulares esquerdo e direito sejam semelhantes. Verifique se o EFA é calculado gerando parcelas nas direções para frente e para trás para cada vetor. Esses plots mostram quando os componentes iniciam (plot para frente) e saem (plot para trás) o perfil de solução para os dados SEC-SAXS selecionados. RAW tenta identificar essas faixas; alterá-las usando as setas ao lado dos contadores de modo que cada círculo esteja no início de um ponto de inflexão subindo ou caindo para a linha de base. Clique em Next.NOTA: A última etapa do EFA transforma os vetores SVD de volta em curvas de dispersão. À esquerda da janela, as faixas previamente definidas são traçadas na parte superior. Essas faixas são as restrições para definir onde girar os vetores singulares de volta em curvas de dispersão. O painel da mão direita mostra esses perfis correspondentes de curva de dispersão, para cada pico separado. Um enredo para a concentração de cada pico, que deve ser representativo de perfis de elução e um enredo para o erro médio ponderado chi2. O gráfico chi2 está medindo os dados de desconvolução definidos para o conjunto de dados original. Idealmente, isso será plano, porém picos podem ser vistos muitas vezes. Tente reduzir ou eliminar os picos alterando os Controles de Alcance de Componentes,primeiro identificar aproximadamente qual quadro corresponde ao espeto (da trama chi2) e, em seguida, nos Controles de Alcance, que componente contém este quadro (pode ser mais de um), usando as setas, mova-se para cima ou para baixo na faixa correspondente.NOTA: Isso deve produzir uma resposta, aumentando ou diminuindo o pico. Se o quadro de espeto estava presente em mais de um componente, então pode ser necessário um pequeno erro de tentativa e erro entre cada componente. Quando um chi2 mínimo for alcançado, realize uma verificação de validação clicando para trás,a janela anterior parece permitir verificar se as alterações feitas alteraram drasticamente os plots originais do EFA. Se eles ainda parecerem válidos, clique em Next. Clique em Salvar dados do EFA para salvar os gráficos e, em seguida, clique em Feito; para fechar a janela EFA.NOTA: Uma segunda validação é clicar na caixa de seleção ao lado de cada faixa de componente, por sua vez. Estes fornecem uma restrição de concentração positiva para cada componente e o desligo verificará se estes afetam significativamente o conjunto de dados. Se nenhuma alteração for vista no gráfico de concentração, os dados ão válidos. De volta à janela RAW, clique na guia Perfis no Painel de Controle para visualizar as curvas e na guia Manipulação do Painel de Controle,manipule as curvas ainda mais ou salve as curvas como *.dat arquivos clicando com o botão direito do mouse no arquivo e selecionando salvar arquivos selecionados do menu aparecer. Salve o arquivo. Use Scatter IV para análise posterior.NOTA: Mais informações e instruções sobre desconvolução e EFA BioXTAS RAW são encontradas em https://bioxtas-raw.readthedocs.io/en/latest/ 4. Determine as propriedades do SAXS NOTA: Um tutorial aprofundado para determinação do SAXS é encontrado em Bioisis.net. Aqui mostramos uma abordagem básica passo a passo, destacando os botões mais úteis em Scatter. Na guia Análise de dispersão, pressione o botão G para a ferramenta de análise Manual Guinier, à direita de cada arquivo de amostra. O enredo que abre mostra a ln[I(q)] contra o q2 na caixa superior e os resíduos correspondentes na caixa inferior. Adicione ou remova pontos de tal forma que os resíduos não tenham um recurso “sorriso” ou “carrancudo”. Os dados selecionados no ajuste Guinier não devem exceder o limite máximo q x Rg de 1,3. Pressione o botão Kratky Normalizado; o enredo que aparece fornece uma avaliação semi-quantitativa do estado estrutural da macromolécula, normalizada para massa e concentração.NOTA: A mira designa o ponto Guinier-Kratky em (√3, 1.1)19. Uma proteína compacta e esférica mostrará um único pico com o valor máximo no ponto Guinier-Kratky. Um biopolímero intrinsecamente desordenado ou cilíndrico teria um máximo maior que a mira e não diminuiria. Uma proteína que tinha domínios dobrados e regiões longas e alongadas não estruturadas poderia apresentar um máximo aumentado através da mira, mas também mostraria uma tendência óbvia de diminuição em q x Rg mais longo. Clique no botão Vc (Volume de correlação), que traz dois lotes, a intensidade total dispersa e uma área integrada da intensidade total dispersa em função de q. As parcelas são usadas como uma referência rápida para validar a qualidade da curva de dispersão.NOTA: A intensidade total dispersa é sensível ao I(0) e se isso não tiver sido medido corretamente, então a trama não mostrará uma linha contínua. O enredo de área integrada, idealmente, deve mostrar uma linha sigmoidal com um platô estendido para cada curva SAXS. Se houver incompatibilidade/subtração tampão, a agregação ou interferência interpartícula na amostra será observada uma inclinação acentuada em valores q mais altos. Pressione o botão Flexibilidade para iniciar a análise de flexibilidade. Isso abrirá uma janela com quatro painéis e um controle deslizante na parte inferior. Cada painel aberto mostra um enredo explorando uma relação poder-lei que existe entre biopolímeros compactos e alongados/flexíveis23. Para usar, mova o controle deslizante na parte inferior da caixa da direita para a esquerda com o botão esquerdo do mouse pressionado. Continue se movendo lentamente para a esquerda até que um platô em uma das parcelas seja alcançado.NOTA: Se o planalto é visto no enredo de Porod-Debye, então a amostra é compacta na natureza, o que deve ser consistente com um único pico no ponto Guinier-Kratky em uma trama kratky normalizada. Se o planalto for alcançado primeiro no enredo de Kratky-Debye, então a amostra é provavelmente alongada ou flexível. Se o enredo SIBYLS é primeiro para planalto, então a amostra provavelmente contém áreas de compactação e flexibilidade, uma partícula com estados mistos. A teoria dessa relação de flexibilidade com a Lei Porod-Debye é requintadamente abordada em Rambo, et al.23 Clique em Volume. A determinação do volume deve ser realizada imediatamente após a análise de flexibilidade de cima. Quando aberto após a análise de flexibilidade, um pop-up com mais três gráficos é gerado. Na parte inferior, canto esquerdo, o enredo de Porod-Debye lembra onde um deixou o controle deslizante da trama de flexibilidade, mostrando a área platômada. Para calcular o volume da partícula, mova os pontos de partida e os pontos finais usando os botões de seta ou digite as caixas, de modo que a linha azul na trama se encaixe na região platô. Para um resultado imparcial, os resíduos no canto superior direito porod-Debye expoente poder-lei ajuste, não devem mostrar nenhum padrão. Pressione a guia P(r). A distribuição do espaço real está no painel esquerdo e na curva de dispersão para a amostra no painel da direita. O objetivo é criar uma representação real da amostra a partir da curva saxs espacial recíproca. Idealmente, a curva de distribuição será suave sem ondas presentes e deve apenas beijar suavemente o eixo x.NOTA: O q-range medido do instrumento pode não ser inteiramente utilizado devido à má correspondência de buffer, agregação, dano de radiação, tempos de exposição abaixo do ideal e baixas concentrações de partículas. A etapa de determinação P(r)determinará fundamentalmente a faixa de qmin e qmais útil do conjunto de dados SAXS e deve ser essa gama de dados que é usada para qualquer modelagem ou montagem subsequente. Clique com o botão direito do mouse no nome da amostra e clique em Encontrar DMAX para abrir uma nova janela. Os limites para od max são pré-definidos com o q max sugerido (pontosde dados máximos utilizados), limitesmáximos d inferiores e superiores e um escore alfa inferior e superior. Três modelos podem ser escolhidos (L1-norm, Legendre e Moore) e o uso de fundo incluído. Deixe-os inalterados em primeira instância. Pressione o botão Iniciar. Uma distribuição composta é criada no painel esquerdo com o nível dmax e alfa sugeridos escritos por baixo. Se isso parecer aceitável, feche a janela e retorne à guia P(r). A trama espacial recíproca terá sido cortada para coincidir com o qmaxsugerido . Escolha o modelo Moore,clique em Plano de Fundo e, em seguida, defina o nível alfa e dmáximo para os valores sugeridos da caixa pop-up. Pressione o botão de refinar. Um enredo de validação cruzada aparecerá aparecendo se algum ponto tiver que ser rejeitado, marcado em vermelho. Se houver apenas alguns pontos rejeitados e a distribuição parecer boa, então o modelo é bom.NOTA: O enredo de validação cruzada destacará regiões dos dados que são inconsistentes com a distribuição P(r) determinada. Se a região rejeitada está principalmente na região de baixo q, que é a região próxima ao eixo y, isso provavelmente sugere umd max que é muito curto, presença de agregação ou oligômeros de ordem superior. Destaca uma inconsistência entre as informações de maior e menor resolução. Aqui, dmax e qmin (aumento do valor inicial) devem ser ajustados usando uma abordagem manual, de tentativa e erro. Da mesma forma, se a região rejeitada estiver principalmente na região de alto q, isso pode indicar um problema com a subtração de fundo ou que o sinal é muito fraco para ser explicado significativamente pela determinada distribuição P(r) . Neste caso, qmax deve ser truncado (final decrescente) até que nenhum dado adicional seja rejeitado. Idealmente, os pontos rejeitados devem ser distribuídos aleatoriamente e compõem menos de 5% dos dados de uso. Um qmindevidamente definido, qmax e “dmax”produzirá uma distribuição suave onde o dmax beija o eixo x. No entanto, não aumente tanto esse valor que ele remove completamente a região de Guinier. Este ponto é facilmente encontrado verificando a caixa q x l(q) (à esquerda do painel acima da tabela). A curva de dispersão é substituída pelo “gráfico de intensidade dispersa total”, nesta curva todos os pontos antes da inflexão máxima fazem parte da região de Guinier. Depois de remover pontos tente novamente aumentar/diminuir o “dmax”e, em seguida, refinar mais uma vez. Se os problemas persistirem, especialmente quando muitos pontos estão sendo rejeitados desde o início da curva de validação, isso sugere fortemente que os dados não são ideais para modelagem estrutural. Para imprimir um relatório, navegue de volta para a guia Análise, clique à esquerda para destacar a amostra e clique com o botão direito do mouse no nome da amostra e mude para Criar relatório a partir de um único conjunto de dados no menu. Uma caixa de texto é aberta para permitir que comentários sejam adicionados. Um documento PDF é produzido mostrando todos os números e valores gerados.

Representative Results

A vantagem do uso da desconvolução sobre a seleção clássica de quadros13 é remover a influência das espécies entre si, produzindo um sinal de dispersão monodisperse. Isso também é frequentemente seguido com uma melhor relação sinal/ruído. Quando o E9 exomenos é vinculado ao DNA e executado usando SEC-SAXS, dois picos são observados(Figura 1). O primeiro pico grande (aproximadamente quadros 420\u2012475) é o complexo E9 exomenos-DNA o segundo (aproximadamente quadros 475\u2012540), o estado desvinculado (ver Dados Complementares: Figura 2). Enquanto a abordagem clássica de selecionar quadros fornece um Rg estável do complexo no primeiro pico (ver Dados Suplementares: Figura 3), o segundo pico é claramente mesclado e o Rg em toda a trama mostra que o segundo pico de interesse não tem um Rg estável, devido à contaminação entre picos. Apenas 5 quadros poderiam ser utilizados que mostrassem um Rg semi-estável, quando subtraídos eles deram um Rg = 36,3 Å(Figura 2, verde). Quando os picos foram desconvoluídos usando EFA, a curva correspondente para o segundo pico(Figura 2, azul) foi sobreposta com o original e mostrou uma clara diminuição no sinal para ruído, e um Rg inferior, 34,1 Å foi registrado. A trama de Kratky(Figura 3)mostra que o complexo com o pico desconvolucido (azul) é mais globular. Isso é confirmado pela curva P(r) (Figura 4) que dá um dmáximo 108,5 Å para a curva desconvolucida (azul) enquanto o não-desconvolutado é mais alongado com um dmáximo 120 Å (verde), isso é mais provável devido à heterogeneidade decorrente do exo E9 não ligadomenos. Figura 1: Gráfico de sinal de E9 exomenos sozinho e com DNA em complexo.O painel superior mostra um gráfico da razão integral para o fundo para cada quadro de uma execução SEC-SAXS (azul claro). Os pontos vermelhos mostram o Rg em cada quadro sobre o pico. O painel inferior mostra o mapa de calor correspondente mostrando os resíduos de cada quadro colorido de acordo com a análise de auto-correlação de Durbin-Watson, regiões de alta similaridade são cianos coloridos enquanto quadros diferentes seguem azuis mais escuros para rosas e, finalmente, vermelho, dependendo da gravidade da diferença. Clique aqui para ver uma versão maior desta figura. Figura 2: Parcela de intensidade versus vetor de dispersão.Uma sobreposição dos dados saxs subtraídos formam o exo E9menos . Em 5 quadros verdes (quadro 517\u2012522) médios e subtraídos de uma área de Rg semi-estável e em azul a curva de dispersão representativa derivada da desconvolução da EFA do pico SEC-SAXS. Clique aqui para ver uma versão maior desta figura. Figura 3: Curva kratky sem dimensão.Sobreposição da curva kratky desconvoluida (azul) e não desconvoluida (verde) mostrando E9 exomenos é globular. Clique aqui para ver uma versão maior desta figura. Figura 4: Curva P(r).A sobreposição das curvas desconvolutadas (azul) e não desconvoluidas (verdes) para o exo E9menos. Clique aqui para ver uma versão maior desta figura. Dados Complementares. Clique aqui para baixar este arquivo 

Discussion

Deseja-se ter uma amostra monodisperse antes de iniciar um experimento de SAXS, mas, na realidade, muitas coleções de dados não satisfazem isso e devem ser melhoradas combinando a medição com cromatografia inlina — SEC na maioria dos casos. No entanto, nem mesmo a escassez de tempo entre purificação e aquisição de dados da amostra não é garantida. Mais comumente, isso se aplica a experimentos onde os componentes são muito próximos em tamanho ou em suas propriedades físicas para serem separados ou são propensos a dinâmicas rápidas. Aqui, fornecemos um protocolo que combina a decomposição de valor único com a análise de fatores em evolução para remover a influência do DNAbound E9 exomenos de sua forma nãoboundform criando um perfil de dispersão monodisperse que então fomos capazes de analisar com o pacote SAXS Scatter IV.

SVD com EFA de dados SEC-SAXS são métodos muito poderosos desenvolvidos para desconvoluir os dados do SAXS e melhorar a análise, mas eles têm limitações. Eles exigem que o ruído ou a deriva na linha de base tampão do SEC-SAXS seja mantido ao mínimo. Isso pode envolver equilíbrio extra da coluna (melhor usar mais de 3 volumes de coluna, dependendo do buffer) antes do carregamento da amostra. No entanto, o passo mais crítico é a escolha do número dos valores singulares e da gama de dados utilizados, pois isso afetará muito a precisão da desconvolução. É por essa razão que os resultados não devem ser tomados por conta própria, mas ainda mais analisados usando técnicas como ultracentrifugação analítica (AUC) ou multi-ângulo-laser-light-scattering (MALLS) para interpretação biológica.

Scatter IV é um novo pacote de software, gratuito para pesquisa e uso industrial com uma interface de usuário intuitiva que permite até mesmo não-especialistas analisar seus dados. O Scatter IV tem vários novos recursos que ajudam a melhorar a análise dos dados SEC-SAXS, como o mapa de calor ligado ao gráfico de sinal, permitindo maior precisão com a escolha da seleção de quadros. Na análise dos dados primários, a análise do Pico Guinier e o gráfico de validação cruzada associados à análise P(r) oferecem uma capacidade integrada de solução de problemas no software.

Deve-se mencionar que muitos outros programas podem ser usados para análise de dados primários; estes contêm os mesmos recursos básicos e também são atualizados regularmente, como BioXTAS RAW17 pacoteATSAS 24 e US-SOMO15 para citar alguns.

Mas independentemente de qual pacote SAXS é usado para análise, as principais limitações são comuns: a preparação da amostra, antes da coleta e análise. No exemplo E9 exomenos mostrado, é claro ver a melhora na relação sinal-ruído e com uma redução no Rg omáximo d associado a uma amostra monodisperse. Isso ajudará muito no processamento dos dados, como a montagem ou modelagem com estruturas conhecidas de alta resolução.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Reconhecemos o apoio financeiro ao projeto da subvenção francesa REPLIPOX ANR-13-BSV8-0014 e por bolsas de pesquisa do Serviço de Santé des Armées e da Délégation Générale pour l’Armement. Somos gratos ao ESRF pelo tempo de feixe de SAXS. Este trabalho utilizou as plataformas do centro Grenoble Instruct-ERIC (ISBG; UMS 3518 CNRS-CEA-UGA-EMBL) dentro da Grenoble Partnership for Structural Biology (PSB), apoiada pela FRISBI (ANR-10-INBS-05-02) e GRAL, financiados dentro da escola de pós-graduação Da Universidade Grenoble Alpes (Ecoles Universitaires de Recherche) CBH-EUR-GS (ANR-17-EURE-0003). O IBS reconhece a integração ao Instituto de Pesquisa Interdisciplinar de Grenoble (IRIG, CEA). Agradecemos a Wim P. Burmeister e ao Padreédéric Iseni pelo apoio financeiro e científico e também agradecemos ao Dr. Jesse Hopkins da BioCAT na APS por sua ajuda e pelo desenvolvimento do BioXTAS RAW.

Materials

Beamline control software BsXCuBE ESRF Pernot et al. (2013), J. Synchrotron Rad. 20, 660-664 local development
BioXTAS Raw 1.2.3. MacCHESS http://bioxtas-raw.readthedocs.io/en/latest/index.html First developed in 2008 by Soren Skou as part of the biological x-ray total analysis system (BioXTAS) project. Since then it has been extensively developed, with recent work being done by Jesse B. Hopkins
HPLC program LabSolutions Shimadzu n.a.
ISPyB ESRF De Maria Antolinos et al. (2015). Acta Cryst. D71, 76-85. local development
NaCl VWR Chemicals (BDH Prolabo) 27808.297
Scatter Diamond Light Source Ltd http://www.bioisis.net/tutorial/9 Supported by SIBYLS beamline (ALS berkeley, Ca) and Bruker Cororation (Karlsruhe, Germany)
Superdex 200 Increase 5/150 GL column GE Healthcare 28990945 SEC-SAXS column used
Tris base Euromedex 26-128-3094-B

References

  1. Pelikan, M., Hura, G., Hammel, M. Structure and flexibility within proteins as identified through small angle X-ray scattering. General Physiology and Biophysics. 28 (2), 174-189 (2009).
  2. Brosey, C. A., Tainer, J. A. Evolving SAXS versatility: solution X-ray scattering for macromolecular architecture, functional landscapes, and integrative structural biology. Current Opinion in Structural Biology. 58, 197-213 (2019).
  3. Gräwert, M., Svergun, D. A beginner’s guide to solution small-angle X-ray scattering (SAXS). The Biochemist. 42 (1), 36-42 (2020).
  4. Putnam, C. D., Hammel, M., Hura, G. L., Tainer, J. A. X-ray solution scattering (SAXS) combined with crystallography and computation: defining accurate macromolecular structures, conformations and assemblies in solution. Quarterly reviews of biophysics. 40 (03), 191-285 (2007).
  5. Meisburger, S. P., et al. Domain Movements upon Activation of Phenylalanine Hydroxylase Characterized by Crystallography and Chromatography-Coupled Small-Angle X-ray Scattering. Journal of the American Chemical Society. 138 (20), 6506-6516 (2016).
  6. Brennich, M. E., Round, A. R., Hutin, S. Online Size-exclusion and Ion-exchange Chromatography on a SAXS Beamline. Journal of Visualized Experiments. (119), e54861 (2017).
  7. Watanabe, Y., Inoko, Y. Size-exclusion chromatography combined with small-angle X-ray scattering optics. Journal of Chromatography A. 1216 (44), 7461-7465 (2009).
  8. Graewert, M. A., et al. Automated Pipeline for Purification, Biophysical and X-Ray Analysis of Biomacromolecular Solutions. Scientific reports. 5, (2015).
  9. David, G., Pérez, J. Combined sampler robot and high-performance liquid chromatography: a fully automated system for biological small-angle X-ray scattering experiments at the Synchrotron SOLEIL SWING beamline. Journal of applied crystallography. 42 (5), 892-900 (2009).
  10. Ryan, T. M., et al. An optimized SEC-SAXS system enabling high X-ray dose for rapid SAXS assessment with correlated UV measurements for biomolecular structure analysis. Journal of Applied Crystallography. 51 (1), 97-111 (2018).
  11. Gampp, H., Maeder, M., Meyer, C. J., Zuberbühler, A. D. Calculation of equilibrium constants from multiwavelength spectroscopic data-III: Model-free analysis of spectrophotometric and ESR titrations. Talanta. 32 (12), 1133-1139 (1985).
  12. Maeder, M., Neuhold, Y. M. . Practical Data Analysis in Chemistry. , (2007).
  13. Tarbouriech, N., et al. The vaccinia virus DNA polymerase structure provides insights into the mode of processivity factor binding. Nature Communications. 8 (1), (2017).
  14. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), (2016).
  15. Brookes, E., Rocco, M. Recent advances in the UltraScan SOlution MOdeller (US-SOMO) hydrodynamic and small-angle scattering data analysis and simulation suite. European Biophysics Journal. 47 (7), 855-864 (2018).
  16. Malaby, A. W., et al. Methods for analysis of size-exclusion chromatography-small-angle X-ray scattering and reconstruction of protein scattering. Journal of Applied Crystallography. 48 (4), 1102-1113 (2015).
  17. Hopkins, J. B., Gillilan, R. E., Skou, S. BioXTAS RAW: improvements to a free open-source program for small-angle X-ray scattering data reduction and analysis. Journal of Applied Crystallography. 50 (5), 1545-1553 (2017).
  18. Maeder, M. Evolving factor analysis for the resolution of overlapping chromatographic peaks. Analytical Chemistry. 59 (3), 527-530 (1987).
  19. Durand, D., et al. NADPH oxidase activator p67phox behaves in solution as a multidomain protein with semi-flexible linkers. Journal of Structural Biology. 169 (1), 45-53 (2010).
  20. De Maria Antolinos, A., et al. ISPyB for BioSAXS, the gateway to user autonomy in solution scattering experiments. Acta Crystallographica Section D. 71 (1), 76-85 (2015).
  21. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), 203-212 (2016).
  22. Kirby, N., et al. Improved radiation dose efficiency in solution SAXS using a sheath flow sample environment. Acta Crystallographica Section D Structural Biology. 72 (12), 1254-1266 (2016).
  23. Rambo, R. P., Tainer, J. A. Characterizing flexible and intrinsically unstructured biological macromolecules by SAS using the Porod-Debye law. Biopolymers. 95 (8), 559-571 (2011).
  24. Franke, D., et al. ATSAS 2.8: a comprehensive data analysis suite for small-angle scattering from macromolecular solutions. Journal of Applied Crystallography. 50 (4), 1212-1225 (2017).

Play Video

Cite This Article
Tully, M. D., Tarbouriech, N., Rambo, R. P., Hutin, S. Analysis of SEC-SAXS data via EFA deconvolution and Scatter. J. Vis. Exp. (167), e61578, doi:10.3791/61578 (2021).

View Video