Summary

Analisi dei dati SEC-SAXS tramite deconvoluzione EFA e Scatter

Published: January 28, 2021
doi:

Summary

Le misurazioni SEC-BioSAXS delle macromolecole biologiche sono un approccio standard per determinare la struttura della soluzione delle macromolecole e dei loro complessi. Qui analizziamo i dati SEC-BioSAXS da due tipi di tracce SEC comunemente incontrate: cromatogrammi con picchi completamente risolti e parzialmente risolti. Dimostriamo l’analisi e la deconvoluzione utilizzando scatter e BioXTAS RAW.

Abstract

BioSAXS è una tecnica popolare utilizzata in biologia molecolare e strutturale per determinare la struttura della soluzione, la dimensione e la forma delle particelle, il rapporto superficie-volume e i cambiamenti conformazionali delle macromolecole e dei complessi macromolecolari. Un set di dati SAXS di alta qualità per la modellazione strutturale deve essere da campioni monodispersi e omogenei e questo è spesso raggiunto solo da una combinazione di cromatografia in linea e misurazione immediata saxs. Più comunemente, la cromatografia ad esclusione di dimensioni viene utilizzata per separare campioni ed escludere contaminanti e aggregazioni dalla particella di interesse permettendo alle misurazioni SAXS di essere effettuate da un picco cromatografico ben risolto di una singola specie proteica. Tuttavia, in alcuni casi, anche la purificazione in linea non è una garanzia di campioni monodispersi, sia perché più componenti sono troppo vicini l’uno all’altro per dimensioni o cambiamenti di forma indotti attraverso il legame alterano il tempo di eluizione percepito. In questi casi, può essere possibile deconvolutare i dati SAXS di una miscela per ottenere le curve SAXS idealizzate dei singoli componenti. Qui, mostriamo come ciò viene raggiunto e l’analisi pratica dei dati SEC-SAXS viene eseguita su campioni ideali e difficili. Nello specifico, mostriamo l’analisi SEC-SAXS dell’esonucleasi della DNA polimerasi vaccinia E9 meno mutante.

Introduction

Le macromolecole biologiche sono troppo piccole per essere viste anche con i migliori microscopi a luce. I metodi attuali per determinare le loro strutture generalmente comportano la cristallizzazione della proteina o misurazioni su un gran numero di molecole identiche allo stesso tempo. Mentre la cristallografia fornisce informazioni a livello atomico, rappresenta un ambiente campione artificiale, dato che la maggior parte delle macromolecole non sono presentate in una forma cristallina nella cellula. Negli ultimi due anni la microscopia crioelet elettronica ha fornito strutture simili ad alta risoluzione di grandi macromolecole / complessi macromolecolari, ma sebbene i campioni siano più vicini alle condizioni fisiologiche, sono ancora congelati, quindi immobili e statici. Lo scattering a raggi X ad angolo bio-piccolo (BioSAXS) fornisce una misurazione strutturale della macromolecola, in condizioni rilevanti per la biologia. Questo stato può essere visualizzato come una forma 3D a bassa risoluzione determinata su scala nanometrica e cattura l’intero spazio conformazionale della macromolecola in soluzione. Gli esperimenti BioSAXS valutano in modo efficiente lo stato oligomerico, il dominio e le disposizioni complesse, nonchéla flessibilità tra i domini 1,2,3. Il metodo è accurato, per lo più non distruttivo e di solito richiede solo un minimo di preparazione e tempo del campione. Tuttavia, per la migliore interpretazione dei dati, i campioni devono essere monodispersi. Questo è impegnativo; le molecole biologiche sono spesso suscettibili a contaminazioni, scarsa purificazione e aggregazione, ad esempio dal congelamento scongelamento4. Lo sviluppo della cromatografia in linea seguito dalla misurazione immediata del SAXS aiuta a mitigare questi effetti. La cromatografia ad esclusione di dimensioni separa i campioni per dimensione, escludendo così la maggior parte dei contaminanti e delle aggregazioni5,6,7,8,9,10. Tuttavia, in alcuni casi anche SEC-SAXS non è sufficiente per produrre un campione monodisperso, perché la miscela può consistere in componenti di dimensioni troppo vicine o le loro proprietà fisiche o la loro dinamica veloce portano a picchi sovrapposti nella traccia UV SEC. In questi casi, una fase di deconvoluzione basata su software dei dati SAXS ottenuti potrebbe portare a una curva SAXS idealizzatadel singolo componente 5,11,12. Ad esempio, nella sezione 2 del protocollo, mostriamo l’analisi SEC-SAXS standard dell’esonucleasi della DNA polimerasi vaccinia E9 meno mutante (E9 exomeno) in complesso con DNA. Vaccinia rappresenta l’organismo modello dei Poxviridae, una famiglia contenente diversi agenti patogeni, ad esempio il virus del vaiolo umano. È stato dimostrato che la polimerasi si lega strettamente al DNA negli approcci biochimici, con la struttura del complesso recentemente risolta dalla cristallografia a raggi X13.

La maggior parte delle strutture di sincrotrone fornirà una pipeline di elaborazione dati automatizzata che eseguirà la normalizzazione e l’integrazione dei dati producendo un set di frame non subtratti. Ma l’approccio descritto in questo manoscritto potrebbe anche essere usato con una fonte di laboratorio a condizione che SEC-SAXS venga eseguito. Inoltre, potrebbe essere disponibile un’automazione aggiuntiva che respingerà i fotogrammi danneggiati dalle radiazioni ed eseguirà la sottrazionetampone 14. Mostreremo come eseguire l’analisi dei dati primari sui dati pre-elaborati e sfruttare al meglio i dati disponibili nella sezione 2.

Nella sezione 3, mostriamo come deconvolutare i dati SEC-SAXS e analizzare le curve in modo efficiente. Mentre ci sono diversi metodi di deconvoluzione come la deconvoluzione del picco gaussiano, implementata in US-SOMO15 e il metodo di massima verosimiglianza ottimizzato Guinier, implementato nel software DELA16, questi generalmente richiedono un modello per la forma dipicco 12. La dimensione finita dei singoli picchi che stiamo studiando consente l’uso dell’analisi dei fattori in evoluzione (EFA), come forma migliorata di decomposizione del valore singolare (SVD) per deconvolgere i picchi sovrapposti, senza fare affidamento sulla forma del picco o sul profilo didispersione 5,11. Un’implementazione specifica di SAXS è disponibile in BioXTAS RAW17. L’EFA è stato utilizzato per la prima volta sui dati della cromatografia quando i dati dell’array di diodi 2D hanno permesso di formare matrici dall’assorbanza contro i dati del tempo di conservazione e della lunghezzad’onda 18. Dove L’EFA eccelle è che si concentra sul carattere in evoluzione dei valori singolari, su come cambiano con l’aspetto di nuovi componenti, con l’avvertenza che c’è un ordine intrinseco nell’acquisizione10. Fortunatamente, i dati SEC-SAXS forniscono tutti i dati di acquisizione ordinati necessari in array di dati 2D organizzati, prestandosi bene alla tecnica EFA.

Nella sezione 4, dimostreremo le basi dell’analisi SAXS indipendente dal modello dalla curva SAXS sottratta in background buffer. L’analisi indipendente dal modello determina il raggio di rotazione della particella (Rg), il volume di correlazione (Vc), il volume di Porod (Vp) e l’esponente porod-debye (PE). L’analisi fornisce una valutazione semi-quantitativa dello stato termodinamico della particella in termini di compattezza o flessibilità attraverso il grafico di Kratkyadimensionale 2,4,19.

Infine, i dati SAXS sono misurati in unità spaziali reciproche e mostreremo come trasformare i dati SAXS nello spazio reale per recuperare la funzione di distribuzione pair-distance, P(r). La distribuzione P(r) è l’insieme di tutte le distanze trovate all’interno della particella e include la dimensione massima della particella, dmax. Poiché si tratta di una misura termodinamica, la distribuzione P(r) rappresenta lo spazio fisico occupato dallo spazio conformazionale delle particelle. Un’analisi corretta di un set di dati SAXS può fornire informazioni sullo stato della soluzione che integrano le informazioni ad alta risoluzione dalla cristallografia e dalla crio-EM.

Protocol

1. L’espressione proteica, la purificazione e la misurazione SEC-SAXS si basano sul protocollon. 13 pubblicato Segui in breve il protocollo di raccolta dati SEC-SAXS in linea (Brennich et al.6). Equilibrare la colonna SEC con almeno 2 volumi di colonna di buffer di esecuzione SEC (20 mM Tris-HCl, pH 7.5, 100 mM NaCl). Preparare 50 μL di campione di E9 exomeno a 8\u201210 mg/mL con un eccesso molare del 20% di dsDNA parziale (TCAGGAAGATAACAGCGGTTTAGCC e GGCTAAACCGCTGTTATCTT). E9 exominus si lega ad un KD di 12 ± 6 nM (vedi Dati supplementari). Iniettare 50 μL di questa miscela su una colonna SEC (S200 Increase) in linea con la cella di flusso per le misurazioni SAXS a 0,3 mL/min. Raccogli 1000 fotogrammi a 1 s di esposizione ciascuno.NOTA: Sulla linea di fascio BioSAXS BM29, presso l’European Synchrotron Facility (ESRF) i singoli telai vengono elaborati automaticamente e indipendentemente all’interno del framework EDNA14. Dopo la raccolta dei dati, aprire il database ISPyB20 e nella scheda Acquisizione dati premere il pulsante Vai per accedere al set di dati e i risultati dell’analisi automatica21. Scarica i dati. 2. Analisi dei dati primari Aprire il programma basato su Java Dispersione IV (vedere la Tavola dei materiali) ed eseguire una sottrazione di fondo per i dati sec (Size Exclusion Chromatography).Aprire la scheda SEC. Trascinare i file di dati ridotti (*.dat) nella finestra “Rilascia dati sotto”. Impostare la directory di output “Out Dir ::” facendo clic sul pulsante Dir output con etichetta blu.NOTA: se i dati sono stati raccolti in nm-1, sarà necessario selezionare una casella di conversione (in basso a sinistra del pannello) quando si rilasciano file nella finestra o nella scheda di sottrazione. Modificare i dettagli sperimentali, utilizzare il pulsante Modifica dettagli e compilare il maggior numero possibile di campi, tra cui sezioni su cui è stata utilizzata la linea di origine/trave per raccogliere dati, i parametri di raccolta e i dettagli di esempio. Questi verranno salvati con i dati e permetteranno di popolare più facilmente la sezione “Parametri di raccolta dati” nelle pubblicazioni future. Immettere il nome dell’esempio nella casella Salva con nome. Fare clic su TRACE.NOTA: Questo ha due effetti. In primo luogo, creerà un file *.sec per i dati. Questo è un singolo file di testo che raccoglierà tutte le osservazioni sperimentali dai file *.dat separati. Inoltre, il file *.sec contiene il set medio di frame che è lo sfondo del buffer, tutti i frame utilizzati nella media e i frame sottratti sullo sfondo del buffer nell’intero esperimento SEC-SAXS. In secondo luogo, viene creato un plottaggio del segnale che traccia il numero di fotogramma rispetto al rapporto integrale con lo sfondo. In questo modo vengono mostrati i fotogrammi selezionati (grigi) che sono stati calcolati in media per la sottrazione del buffer. I punti per il buffer medio vengono determinati dall’intero intervallo di dati. Tuttavia, è consigliabile scegliere manualmente i frame tampone per la media in quanto può verificarsi uno sfondo mal definito a causa di colonne scarsamente equilibrate o sporche o incrostazioni capillari22. Selezionare manualmente i frame del buffer. Fate clic su Cancella buffer (Clear Buffers), quindi riselezionate un’area buffer con un clic sinistro trascinato sulla curva di traccia. Idealmente, questa dovrebbe essere una regione piatta prima del volume vuoto della colonna SEC di circa 100 fotogrammi. Fare clic su SET BUFFER, quindi su Aggiorna per ricalcolare il file *.sec che potrebbe richiedere alcuni minuti. Identificare una regione di interesse (ROI). Nel plottaggio del segnale, selezionare la regione del picco di interesse, con un clic sinistro.NOTA: questo popola tre grafici nel pannello di destra. I primi due grafici sono collegati con il mirino che si muove tra di loro, un secondo grafico del segnale (in alto a destra) mostra solo il ROI selezionato, con l’intensità di ogni fotogramma in blu e il corrispondente Rg di ogni fotogramma in rosso e una corrispondente mappa termica sottostante, mostrando i residui per ogni fotogramma colorato secondo l’analisi di autocorrelazione Durbin-Watson. Le regioni ad alta somiglianza sono ciano colorato (Durbin-Watson, d = 2) mentre le cornici dissimili seguiranno il blu più scuro ai rosa e infine ai rossi a seconda della gravità della dissimilarità (d > 2). Il grafico inferiore è una curva I contro q sottratta per il fotogramma centrale selezionato (indicato anche da una linea verticale). I tasti di direzione possono essere utilizzati per navigare tra i fotogrammi sottratti. Il plottaggio I contro q dimostrerà la qualità dei fotogrammi sottratti dall’esperimento SEC. Selezionate i fotogrammi da unire. Fate clic sul mirino nel plottaggio della mappa termica per selezionare il sottoinsieme di fotogrammi che verranno utilizzati per l’unione. Il mirino identificherà un’area triangolare di cian prevalentemente che cade sul lato in basso a destra del mirino. Utilizzate un clic del mouse per impostare questi fotogrammi come selezionati ed evidenziare i fotogrammi nell’area corrispondente del plottaggio segnale sopra. Questi fotogrammi dovrebbero idealmente evidenziare una regione con un Rg stabile.NOTA: se necessario, ingrandisci la mappa termica con un trascinamento con un clic sinistro del mouse e rimpipidisci con un clic sinistro a destra. Se soddisfatti dei fotogrammi selezionati, fate clic su UNISCI (MERGE). In questo modo i fotogrammi sottratti verranno uniti e vengono presenti nella scheda ANALISI. 3. Deconvoluzione dei dati Aprire il programma di deconvoluzione (ad esempio, BioXTAS Raw 2.0.0). Nel programma di deconvoluzione caricare il dataset, in Scheda File, nel Pannello di controlloutilizzare il simbolo foldether per individuare i dati o copiare e incollare la posizione nella barra degli indirizzi.NOTA: assicurarsi che la cartella contenga solo i file *.dat non elaborati e nessun file di dati elaborato o medio. Evidenzia tutti i file *.dat, premi il pulsante Serie trama, un grafico di intensità integrata rispetto al numero di fotogramma verrà disegnato nel “Plot di serie”. Nel Pannello di controllo selezionare la scheda Serie e quindi fare clic per evidenziare la curva. Aprire la finestra popup LC Analysis utilizzando il pulsante alla base del pannello di controllo. Questa finestra dà accesso a diverse opzioni, come la selezione di diversi tipi di molecole (proteine o RNA). Consente inoltre all’utente di selezionare l’area buffer per il plottaggio. In prima istanza fare clic su Auto; questa dovrebbe selezionare un’area buffer adatta.NOTA: se questo non riesce, probabilmente a causa di una linea di base instabile, “Aggiungi area” per ottimizzare l’area del buffer. In questo modo la casella Buffer viene popolata con una casella più piccola in cui è possibile aggiungere manualmente i numeri di fotogramma da utilizzare per il buffer. In alternativa, fate clic su “Scegli” per dare la possibilità di selezionare un’area nel plottaggio. Individuare l’area, fare clic con il pulsante sinistro del mouse una volta per la posizione iniziale, spostare il cursore nella posizione successiva e fare di nuovo clic con il pulsante sinistro del mouse. Potrebbe essere necessario aggiungere più di una posizione buffer. Fate clic su Imposta buffer (Set buffer) e le curve verranno sottratte e il Rg calcolato attraverso il picco SEC. Se viene visualizzata una casella popup, fare clic su OK. Per avviare l’Evolving Factor Analysis (EFA), fare clic con il pulsante destro del mouse sul file evidenziato nella parte inferiore Pannello di controllo quindi selezionare Efa dal menu.Verificare che si apra una finestra popup che mostri la scomposizione del singolo valore (SVD) del set di dati. Nella casella controlli, selezionare la casella Usa fotogrammi in modo che l’intera area di picco da deconvolutare sia coperta nel tracciato di intensità. Il grafico “Valori singolari”, in alto a destra, mostra l’intensità dei valori singolari (picchi/specie separate) sopra la linea di base.NOTA: Il numero di punti presenti al di sopra della linea di base rappresenta il numero di specie di dispersione presenti. Con l’avvertenza che è la grandezza relativa del valore singolare per l’area piatta / linea di base che conta. Per convalidare il numero di singoli valori, utilizzate il plottaggio di correzione automatica inferiore. Questo mostra i vettori di correlazione singola destra e sinistra. Fare clic su Avanti.NOTA: Questi rappresentano essenzialmente profili di dispersione o concentrazione per il vettore nella soluzione. Dove la dimensione assoluta rappresenta il significato del vettore. Un componente significativo avrà una correzione automatica vicino a 1 (una regola di taglio del pollice è >0,6\u20120.7). RAW calcola volontariamente questo ed è mostrato nella casella #Significant SUV, in basso a sinistra, anche se è possibile modificarlo se necessario. Se ci sono più valori singoli (ad esempio 4+), potrebbe essere necessario esaminare solo 2 o 3 dei soli componenti, alterando l’intervallo dei dati utilizzati. Quanto più basso è il numero di componenti, tanto più facile sarà l’analisi dell’EFA, ma a costo di utilizzare meno dati. In situazioni complesse, dove i vettori singolari sinistro e destro, che dovrebbero essere simili, non corrispondono a ridurre il numero significativo di SV e diminuire il numero di fotogrammi usati fino a quando i vettori singolari sinistro e destro sono simili. Controllare che l’EFA sia calcolato generando grafici nelle direzioni avanti e indietro per ogni vettore. Questi grafici mostrano quando i componenti iniziano (plottaggio in avanti) e escono (plottaggio all’indietro) il profilo della soluzione per i dati SEC-SAXS selezionati. RAW cerca di identificare questi intervalli; cambiarli usando le frecce accanto ai contatori in modo che ogni cerchio sia all’inizio di un punto di flessione che sale da o scende alla linea di base. Fare clic su Avanti.NOTA: L’ultimo stadio dell’EFA riporta i vettori SVD in curve di dispersione. A sinistra della finestra, gli intervalli definiti in precedenza vengono tracciati nella parte superiore. Questi intervalli sono i vincoli per definire dove ruotare di nuovo i vettori singolari in curve di dispersione. Il pannello di destra mostra questi corrispondenti profili di curva di dispersione, per ogni picco separato. Un appezzamento per la concentrazione di ogni picco, che dovrebbe essere rappresentativo dei profili di eluizione e un grafico per l’errore medio ponderato chi2. Il grafico chi2 sta misurando i dati di deconvoluzione impostati sul set di dati originale. Idealmente, questo sarà piatto, tuttavia i picchi possono spesso essere visti. Provare a ridurre o eliminare i picchi modificando i controlli intervallo dicomponenti , identificare prima approssimativamente quale fotogramma corrisponde al picco (dal tracciato chi2) e quindi, nei controlli intervallo, quale componente contiene questo fotogramma (potrebbe essere più di uno), utilizzando le frecce, spostarsi verso l’alto o verso il basso nell’intervallo corrispondente.NOTA: Questo dovrebbe produrre una risposta, aumentando o diminuendo il picco. Se il frame spike era presente in più di un componente, potrebbe essere necessaria una piccola prova ed errore tra ogni componente. Una volta raggiunto un minimo di chi2, eseguire un controllo di convalida facendo clic indietro, la finestra precedente sembra consentire di verificare se le modifiche apportate hanno modificato drasticamente i grafici EFA originali. Se sembrano ancora validi, fare clic su Avanti. Fate clic su Salva dati EFA (Save EFA Data) per salvare i tracciati, quindi selezionate Fatto (Done). per chiudere la finestra EFA.NOTA: una seconda convalida è fare clic sulla casella di controllo accanto a ciascun intervallo di componenti, a sua volta. Questi forniscono un vincolo di concentrazione positivo per ogni componente e la disattivazione controllerà se questi influenzano significativamente il set di dati. Se non si vede alcuna modifica nel grafico di concentrazione, i dati sono validi. Di nuovo nella finestra RAW, fate clic sulla scheda Profili nel Pannello di controllo per visualizzare le curve e nella scheda Manipolazione del Pannello di controllo, manipolate ulteriormente le curve o salvate le curve come file *.dat facendo clic con il pulsante destro del mouse sul file e selezionando salva file selezionati dal menu. Salvare il file. Utilizzare Scatter IV per ulteriori analisi.NOTA: Ulteriori informazioni e istruzioni sulla deconvoluzione e su EFA BioXTAS RAW sono disponibili all’https://bioxtas-raw.readthedocs.io/en/latest/ 4. Determinare le proprietà SAXS NOTA: Un tutorial approfondito per la determinazione saxs si trova a Bioisis.net. Qui mostriamo un approccio passo dopo passo di base, evidenziando i pulsanti più utili in Scatter. Nella scheda Analisi dispersione premere il tasto G per lo strumento manuale di analisi Guinier, a destra di ogni file di esempio. Il grafico che si apre mostra ln[I(q)] rispetto a q2 nella casella superiore e i residui corrispondenti nella casella inferiore. Aggiungere o rimuovere punti in modo che i residui non abbiano una funzione “sorriso” o “cipiglio”. I dati selezionati nella vestibilità Guinier non devono superare il limite massimo q x Rg di 1,3. Premere il pulsante Kratky normalizzato; la trama che si apre fornisce una valutazione semi-quantitativa dello stato strutturale della macromolecola, normalizzata per massa e concentrazione.NOTA: I mirini designano il punto di Guinier-Kratky a (√3, 1.1)19. Una proteina sferica compatta mostrerà un singolo picco con il valore massimo nel punto di Guinier-Kratky. Un biopolimero intrinsecamente disordinato o cilindrico avrebbe un massimo maggiore del mirino e non diminuirebbe. Una proteina che avesse sia domini piegati che lunghe regioni non strutturate allungate potrebbe presentare un aumento massimo attraverso il mirino, ma mostrerebbe anche un’ovvia tendenza al ribasso a q x Rg più alto. Fare clic sul tasto Vc (Volume di correlazione), che riporta due grafici, l’intensità totale diffusa e un’area integrata dell’intensità totale diffusa in funzione di q. I grafici vengono utilizzati come riferimento rapido per convalidare la qualità della curva di dispersione.NOTA: L’intensità totale diffusa è sensibile all’I(0) e se questo non è stato misurato correttamente, il grafico non mostrerà una linea continua. La trama dell’area integrata, idealmente, dovrebbe mostrare una linea sigmoidale con un plateau esteso per ogni curva SAXS. Se nel campione sono presente interferenze di non corrispondenza/sottrazione del buffer, aggregazione o interparticella, si osserverà una pendenza nitida a valori q più elevati. Premere il pulsante Flessibilità per avviare l’analisi della flessibilità. Questo aprirà una finestra con quattro pannelli e un cursore nella parte inferiore. Ogni pannello aperto mostra una trama che sfrutta una relazione di legge di potenza che esiste tra biopolimeri compatti e allungati / flessibili23. Per usare, spostare il dispositivo di scorrimento nella parte inferiore della casella da destra a sinistra con il pulsante sinistro del mouse premuto. Continuare a muoversi lentamente a sinistra fino a raggiungere un altopiano in uno dei appezzamenti.NOTA: Se l’altopiano è visto nella trama di Porod-Debye, allora il campione è di natura compatta, che dovrebbe essere coerente con un singolo picco nel punto di Guinier-Kratky in un appezzamento kratky normalizzato. Se l’altopiano viene raggiunto per primo nella trama di Kratky-Debye, il campione è molto probabilmente allungato o flessibile. Se il plottaggio SIBYLS è il primo a stabilizzarsi, allora il campione molto probabilmente contiene aree di compattezza e flessibilità, una particella con stati misti. La teoria di questo rapporto di flessibilità con la legge porod-debye è squisitamente affrontata in Rambo, etal. Fare clic su Volume. La determinazione del volume deve essere eseguita immediatamente dopo l’analisi della flessibilità dall’alto. Quando viene aperto dopo l’analisi della flessibilità, viene generato un pop-up con altri tre grafici. Nell’angolo in basso, a sinistra, la trama Porod-Debye ricorda dove uno ha lasciato il cursore dalla trama di flessibilità, mostrando l’area plateaued. Per calcolare il volume della particella, spostare l’inizio e i punti finali utilizzando i pulsanti freccia o digitare le caselle, in modo che la linea blu sul tracciato si adatti alla regione plateau. Per un risultato imparziale, i residui nella legge di potenza dell’esponente Porod-Debye in alto a destra, non dovrebbero mostrare alcun modello. Premere la scheda P(r). La distribuzione dello spazio reale si trova nel pannello sinistro e la curva di dispersione per il campione nel pannello di destra. L’obiettivo è quello di creare una rappresentazione dello spazio reale del campione dalla curva SAXS dello spazio reciproco. Idealmente, la curva di distribuzione sarà liscia senza onde presenti e dovrebbe semplicemente baciare delicatamente l’asse x.NOTA: l’intervallo q misurato dello strumento potrebbe non essere del tutto utilizzabile a causa della scarsa corrispondenza del buffer, dell’aggregazione, dei danni da radiazioni, dei tempi di esposizione non ottimali e delle basse concentrazioni di particelle. Il passaggio di determinazione P(r) determinerà fondamentalmente l’intervallo qmin e q max utilizzabile del set di dati SAXS e dovrebbe essere questo intervallo di dati utilizzato per qualsiasi modellazione o raccordo successivo. Fare clic con il pulsante destro del mouse sul nome dell’esempio, quindi scegliere Trova DMAX per aprire una nuova finestra. I limiti per il dmax sono pre-impostati con il qmax suggerito (punti dati massimi utilizzati), i limiti massimi dinferiori e superiori e un punteggio alfa inferiore e superiore. È possibile scegliere tre modelli (L1-norm, Legendre e Moore) e l’uso dello sfondo incluso. Lasciate questi invariati in prima istanza. Premere il pulsante Start. Una distribuzione composita viene creata nel pannello sinistro con il livello dmax e alfa suggerito scritto sotto. Se questo sembra accettabile, chiudere la finestra e tornare alla scheda P(r). La trama spaziale reciproca sarà stata ritagliata per corrispondere al qmax suggerito. Selezionate il modello Moore, fate clic su Sfondo (Background), quindi impostate il livello alfa e dmax sui valori suggeriti dalla casella popup. Premere il pulsante di affinare. Verrà visualizzato un grafico di convalida incrociata che mostra se alcuni punti devono essere rifiutati, contrassegnati in rosso. Se ci sono solo pochi punti rifiutati e la distribuzione sembra buona, il modello è buono.NOTA: il grafico di convalida incrociata evidenzierà le aree dei dati che non sono coerenti con la distribuzione P(r) determinata. Se la regione respinta si trova principalmente nella regione low-q, cioè nella regione vicino all’asse y, ciò suggerisce probabilmente un d max troppobreve, presenza di aggregazione o oligomeri di ordine superiore. Evidenzia un’incoerenza tra le informazioni a risoluzione più alta e inferiore. Qui, dmax e qmin (aumentando il valore iniziale) dovrebbero essere regolati utilizzando un approccio manuale di prova ed errore. Allo stesso modo, se la regione respinta si trova principalmente nella regione high-q, questo può indicare un problema con la sottrazione di fondo o che il segnale è troppo debole per essere spiegato in modo significativo dalla determinata distribuzione P(r). In questo caso, qmax deve essere troncato (fine decrescente) fino a quando non vengono rifiutati dati aggiuntivi. Idealmente, i punti rifiutati dovrebbero essere distribuiti casualmente e covare meno del 5% dei dati utilizzabili. Un qmin, q maxe “dmax” correttamente definitoprodurrà una distribuzione fluida in cui il dmax bacia l’asse x. Tuttavia, non aumentare questo valore così tanto che rimuove completamente la regione di Guinier. Questo punto si trova facilmente selezionando la casella q x l(q) (a sinistra del pannello sopra la tabella). La curva di dispersione è sostituita dal “plot Intensità totale sparsa”, su questa curva tutti i punti prima dell’inflessione massima fanno parte della regione di Guinier. Dopo aver rimosso i punti, riprovare ad aumentare/diminuire la “dmax”e quindi perfezionare ancora una volta. Se i problemi persistono, specialmente quando molti punti vengono rifiutati dall’inizio della curva di convalida, ciò suggerisce fortemente che i dati non sono ideali per la modellazione strutturale. Per stampare un report, tornare alla scheda Analisi, fare clic con il pulsante sinistro del mouse per evidenziare l’esempio, quindi fare clic con il pulsante destro del mouse sul nome dell’esempio e passare a Crea report da un singolo set di dati nel menu. Verrà visualizzata una casella di testo per consentire l’aggiunta di commenti. Viene prodotto un documento PDF che mostra tutte le cifre e i valori generati.

Representative Results

Il vantaggio di usare la deconvoluzione rispetto alla classica selezionedei fotogrammi 13 è quello di rimuovere l’influenza delle specie l’una sull’altra, producendo un segnale di dispersione monodisperso. Questo è anche spesso seguito con un migliore rapporto segnale/rumore. Quando E9 exominus è legato al DNA ed eseguito utilizzando SEC-SAXS, si osservano due picchi (Figura 1). Il primo, grande picco (circa fotogrammi 420\u2012475) è il complesso E9 exomeno-DNA il secondo (circa fotogrammi 475\u2012540), lo stato non associato (vedi Dati supplementari: Figura 2). Mentre l’approccio classico della selezione dei fotogrammi fornisce un Rg stabile del complesso nel primo picco (vedi Dati supplementari: Figura 3), il secondo picco è chiaramente unito e il Rg attraverso la trama mostra che il secondo picco di interesse non ha un Rg stabile, a causa della contaminazione cross-peak. Solo 5 fotogrammi potevano essere usati che mostravano un Rg semi-stabile, quando sottratti davano un Rg = 36.3 Å (Figura 2, verde). Quando i picchi sono stati deconvoluti usando l’EFA, la curva corrispondente per il secondo picco(Figura 2, blu) è stata sovrapposta all’originale e ha mostrato una chiara diminuzione del segnale al rumore, ed è stato registrato un Rg inferiore, 34.1 Å. La trama di Kratky (Figura 3) mostra che il complesso con il picco deconvoluto (blu) è più globulare. Ciò è confermato dalla curva P(r) (Figura 4) che dà un dmax 108.5 Å per la curva decontorta (blu) mentre il non deconvoluto è più allungato con un dmax 120 Å (verde), questo è molto probabilmente dovuto all’eterogeneità derivante dall’exo non legato E9meno. Figura 1: Grafico del segnale di E9 exominus da solo e con DNA in complesso.Il pannello superiore mostra un grafico del rapporto integrale con lo sfondo per ogni fotogramma di una corsa SEC-SAXS (azzurro). I punti rossi mostrano il Rg ad ogni fotogramma sopra il picco. Il pannello inferiore mostra la mappa termica corrispondente che mostra i residui per ogni fotogramma colorato secondo l’analisi di autocorrelazione Durbin-Watson, le regioni ad alta somiglianza sono colorate ciano mentre i fotogrammi dissimili seguono il blu più scuro ai rosa e infine al rosso a seconda della gravità della dissimilarità. Clicca qui per visualizzare una versione più grande di questa figura. Figura 2: Grafico dell’intensità rispetto al vettore di dispersione.Una sovrapposizione dei dati SAXS sottratti forma l’eso esoE9 meno . In verde 5 fotogrammi (fotogramma 517\u2012522) mediati e sottratti da un’area di Rg semi-stabile e in blu la curva di scattering rappresentativa derivata dalla deconvoluzione EFA del picco SEC-SAXS. Clicca qui per visualizzare una versione più grande di questa figura. Figura 3: Curva di Kratky adimensionata.La sovrapposizione della curva kratky deconvoluta (blu) e non deconvoluta (verde) che mostra E9 exominus è globulare. Clicca qui per visualizzare una versione più grande di questa figura. Figura 4: Curva P(r).Sovrapposizione delle curve deconvoluta (blu) e non deconvoluta (verde) per l’exo E9meno. Clicca qui per visualizzare una versione più grande di questa figura. Dati supplementari. Clicca qui per scaricare questo file 

Discussion

Si desidera avere un campione monodisperso prima di iniziare un esperimento SAXS, ma in realtà molte raccolte di dati non soddisfano questo e devono essere migliorate combinando la misurazione con la cromatografia in linea – SEC nella maggior parte dei casi. Tuttavia, anche la mancanza di tempo tra la purificazione e la monodispersità di acquisizione dei dati del campione non è garantita. Più comunemente, questo vale per gli esperimenti in cui i componenti sono di dimensioni troppo vicine o nelle loro proprietà fisiche per essere separati o sono inclini a dinamiche veloci. Qui, abbiamo fornito un protocollo che combina la decomposizione di un singolo valore con l’analisi dei fattori in evoluzione per rimuovere l’influenza di DNAbound E9 exominus dalla sua forma non legata creando un profilo di scattering monodisperso che siamo stati quindi in grado di analizzare con il pacchetto SAXS Scatter IV.

SVD con EFA di dati SEC-SAXS sono metodi molto potenti sviluppati per deconvolutare i dati SAXS e migliorare l’analisi, ma hanno dei limiti. Richiedono che il rumore o la deriva nella linea di base tampone del SEC-SAXS sia mantenuta al minimo. Ciò può comportare un’ulteriore equilibrazione delle colonne (meglio usare più di 3 volumi di colonna, a seconda del buffer) prima del caricamento del campione. Tuttavia, il passaggio più critico è la scelta del numero dei valori singolari e dell’intervallo di dati utilizzati, in quanto ciò influenzerà notevolmente l’accuratezza della deconvoluzione. È per questo motivo che i risultati non dovrebbero essere presi da soli, ma ulteriormente analizzati utilizzando tecniche come l’ultracentrifugazione analitica (AUC) o la diffusione multi-angolo-laser-luce (MALLS) per l’interpretazione biologica.

Scatter IV è un nuovo pacchetto software, gratuito per la ricerca e l’uso industriale con un’interfaccia utente intuitiva che consente anche ai non esperti di analizzare i propri dati. Scatter IV ha diverse nuove funzionalità che aiutano a migliorare l’analisi dei dati SEC-SAXS, come la mappa termica collegata al grafico del segnale, consentendo una maggiore precisione con la scelta della selezione del fotogramma. Nell’analisi dei dati primari, l’analisi Guinier Peak e il grafico di convalida incrociata associato all’analisi P(r) offrono una capacità di risoluzione dei problemi integrata nel software.

Va detto che molti altri programmi possono essere utilizzati per l’analisi dei dati primari; questi contengono le stesse caratteristiche di base e vengono aggiornati regolarmente come BioXTAS RAW17 ATSASpacchetto 24 e US-SOMO15 per citane alcuni.

Ma indipendentemente dal pacchetto SAXS utilizzato per l’analisi, le principali limitazioni sono comuni: la preparazione del campione, prima della raccolta e dell’analisi. Nell’esempio E9 exominus mostrato, è chiaro vedere il miglioramento del rapporto segnale/rumore e con una riduzione del Rg il dmax associato a un campione di monodisperso. Ciò contribuirà notevolmente all’ulteriore elaborazione dei dati, come l’installazione o la modellazione con strutture note ad alta risoluzione.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Riconosciamo il sostegno finanziario al progetto da parte della sovvenzione francese REPLIPOX ANR-13-BSV8-0014 e da sovvenzioni alla ricerca del Service de Santé des Armées e della Délégation Générale pour l’Armement. Siamo grati all’ESRF per il tempo del fascio SAXS. Questo lavoro utilizzava le piattaforme del centro Grenoble Instruct-ERIC (ISBG; UMS 3518 CNRS-CEA-UGA-EMBL) nell’ambito del Grenoble Partnership for Structural Biology (PSB), sostenuto da FRISBI (ANR-10-INBS-05-02) e GRAL, finanziato nell’ambito della scuola di specializzazione Dell’Università Grenoble Alpes (Ecoles Universitaires de Recherche) CBH-EUR-GS (ANR-17-EURE-0003). IBS riconosce l’integrazione nell’Istituto di Ricerca Interdisciplinare di Grenoble (IRIG, CEA). Ringraziamo Wim P. Burmeister e P é déric Iseni per il supporto finanziario e scientifico e ringraziamo anche il Dr. Jesse Hopkins di BioCAT presso l’APS per il suo aiutoeper lo sviluppo di BioXTAS RAW.

Materials

Beamline control software BsXCuBE ESRF Pernot et al. (2013), J. Synchrotron Rad. 20, 660-664 local development
BioXTAS Raw 1.2.3. MacCHESS http://bioxtas-raw.readthedocs.io/en/latest/index.html First developed in 2008 by Soren Skou as part of the biological x-ray total analysis system (BioXTAS) project. Since then it has been extensively developed, with recent work being done by Jesse B. Hopkins
HPLC program LabSolutions Shimadzu n.a.
ISPyB ESRF De Maria Antolinos et al. (2015). Acta Cryst. D71, 76-85. local development
NaCl VWR Chemicals (BDH Prolabo) 27808.297
Scatter Diamond Light Source Ltd http://www.bioisis.net/tutorial/9 Supported by SIBYLS beamline (ALS berkeley, Ca) and Bruker Cororation (Karlsruhe, Germany)
Superdex 200 Increase 5/150 GL column GE Healthcare 28990945 SEC-SAXS column used
Tris base Euromedex 26-128-3094-B

References

  1. Pelikan, M., Hura, G., Hammel, M. Structure and flexibility within proteins as identified through small angle X-ray scattering. General Physiology and Biophysics. 28 (2), 174-189 (2009).
  2. Brosey, C. A., Tainer, J. A. Evolving SAXS versatility: solution X-ray scattering for macromolecular architecture, functional landscapes, and integrative structural biology. Current Opinion in Structural Biology. 58, 197-213 (2019).
  3. Gräwert, M., Svergun, D. A beginner’s guide to solution small-angle X-ray scattering (SAXS). The Biochemist. 42 (1), 36-42 (2020).
  4. Putnam, C. D., Hammel, M., Hura, G. L., Tainer, J. A. X-ray solution scattering (SAXS) combined with crystallography and computation: defining accurate macromolecular structures, conformations and assemblies in solution. Quarterly reviews of biophysics. 40 (03), 191-285 (2007).
  5. Meisburger, S. P., et al. Domain Movements upon Activation of Phenylalanine Hydroxylase Characterized by Crystallography and Chromatography-Coupled Small-Angle X-ray Scattering. Journal of the American Chemical Society. 138 (20), 6506-6516 (2016).
  6. Brennich, M. E., Round, A. R., Hutin, S. Online Size-exclusion and Ion-exchange Chromatography on a SAXS Beamline. Journal of Visualized Experiments. (119), e54861 (2017).
  7. Watanabe, Y., Inoko, Y. Size-exclusion chromatography combined with small-angle X-ray scattering optics. Journal of Chromatography A. 1216 (44), 7461-7465 (2009).
  8. Graewert, M. A., et al. Automated Pipeline for Purification, Biophysical and X-Ray Analysis of Biomacromolecular Solutions. Scientific reports. 5, (2015).
  9. David, G., Pérez, J. Combined sampler robot and high-performance liquid chromatography: a fully automated system for biological small-angle X-ray scattering experiments at the Synchrotron SOLEIL SWING beamline. Journal of applied crystallography. 42 (5), 892-900 (2009).
  10. Ryan, T. M., et al. An optimized SEC-SAXS system enabling high X-ray dose for rapid SAXS assessment with correlated UV measurements for biomolecular structure analysis. Journal of Applied Crystallography. 51 (1), 97-111 (2018).
  11. Gampp, H., Maeder, M., Meyer, C. J., Zuberbühler, A. D. Calculation of equilibrium constants from multiwavelength spectroscopic data-III: Model-free analysis of spectrophotometric and ESR titrations. Talanta. 32 (12), 1133-1139 (1985).
  12. Maeder, M., Neuhold, Y. M. . Practical Data Analysis in Chemistry. , (2007).
  13. Tarbouriech, N., et al. The vaccinia virus DNA polymerase structure provides insights into the mode of processivity factor binding. Nature Communications. 8 (1), (2017).
  14. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), (2016).
  15. Brookes, E., Rocco, M. Recent advances in the UltraScan SOlution MOdeller (US-SOMO) hydrodynamic and small-angle scattering data analysis and simulation suite. European Biophysics Journal. 47 (7), 855-864 (2018).
  16. Malaby, A. W., et al. Methods for analysis of size-exclusion chromatography-small-angle X-ray scattering and reconstruction of protein scattering. Journal of Applied Crystallography. 48 (4), 1102-1113 (2015).
  17. Hopkins, J. B., Gillilan, R. E., Skou, S. BioXTAS RAW: improvements to a free open-source program for small-angle X-ray scattering data reduction and analysis. Journal of Applied Crystallography. 50 (5), 1545-1553 (2017).
  18. Maeder, M. Evolving factor analysis for the resolution of overlapping chromatographic peaks. Analytical Chemistry. 59 (3), 527-530 (1987).
  19. Durand, D., et al. NADPH oxidase activator p67phox behaves in solution as a multidomain protein with semi-flexible linkers. Journal of Structural Biology. 169 (1), 45-53 (2010).
  20. De Maria Antolinos, A., et al. ISPyB for BioSAXS, the gateway to user autonomy in solution scattering experiments. Acta Crystallographica Section D. 71 (1), 76-85 (2015).
  21. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), 203-212 (2016).
  22. Kirby, N., et al. Improved radiation dose efficiency in solution SAXS using a sheath flow sample environment. Acta Crystallographica Section D Structural Biology. 72 (12), 1254-1266 (2016).
  23. Rambo, R. P., Tainer, J. A. Characterizing flexible and intrinsically unstructured biological macromolecules by SAS using the Porod-Debye law. Biopolymers. 95 (8), 559-571 (2011).
  24. Franke, D., et al. ATSAS 2.8: a comprehensive data analysis suite for small-angle scattering from macromolecular solutions. Journal of Applied Crystallography. 50 (4), 1212-1225 (2017).

Play Video

Cite This Article
Tully, M. D., Tarbouriech, N., Rambo, R. P., Hutin, S. Analysis of SEC-SAXS data via EFA deconvolution and Scatter. J. Vis. Exp. (167), e61578, doi:10.3791/61578 (2021).

View Video