Summary

Analyse van SEC-SAXS-gegevens via EFA-deconvolution en Scatter

Published: January 28, 2021
doi:

Summary

SEC-BioSAXS metingen van biologische macromoleculen zijn een standaardbenadering voor het bepalen van de oplossingsstructuur van macromoleculen en hun complexen. Hier analyseren we SEC-BioSAXS-gegevens van twee soorten vaak aangetroffen SEC-sporen: chromatogrammen met volledig opgeloste en gedeeltelijk opgeloste pieken. We tonen de analyse en deconvolutie met behulp van scatter en BioXTAS RAW.

Abstract

BioSAXS is een populaire techniek die wordt gebruikt in de moleculaire en structurele biologie om de oplossingsstructuur, deeltjesgrootte en -vorm, oppervlakte-volumeverhouding en conformatieveranderingen van macromoleculen en macromoleculaire complexen te bepalen. Een hoogwaardige SAXS-gegevensset voor structurele modellering moet afkomstig zijn van monodisperse, homogene monsters en dit wordt vaak alleen bereikt door een combinatie van inline chromatografie en onmiddellijke SAXS-meting. Meestal wordt chromatografie van grootte-uitsluiting gebruikt om monsters te scheiden en verontreinigingen en aggregaties uit te sluiten van het deeltje van belang, waardoor SAXS-metingen kunnen worden uitgevoerd vanaf een goed opgeloste chromatografische piek van één eiwitsoort. Toch is in sommige gevallen zelfs inline zuivering geen garantie voor monodisperse monsters, hetzij omdat meerdere componenten te dicht bij elkaar in grootte of veranderingen in vorm veroorzaakt door bindende alter waargenomen elution tijd. In deze gevallen kan het mogelijk zijn om de SAXS-gegevens van een mengsel te deconvolutelen om de geïdealiseerde SAXS-curven van afzonderlijke componenten te verkrijgen. Hier laten we zien hoe dit wordt bereikt en wordt de praktische analyse van SEC-SAXS-gegevens uitgevoerd op ideale en moeilijke monsters. Concreet tonen we de SEC-SAXS analyse van de vaccinia E9 DNA polymerase exonuclease minus mutant.

Introduction

Biologische macromoleculen zijn te klein om gezien te worden, zelfs met de beste lichtmicroscopen. De huidige methoden om hun structuren te bepalen omvatten over het algemeen het kristalliseren van het eiwit of de metingen op enorme aantallen identieke moleculen tegelijkertijd. Hoewel kristallografie informatie geeft over het atomaire niveau, vertegenwoordigt het een kunstmatige monsteromgeving, aangezien de meeste macromoleculen niet in een kristallijne vorm in de cel worden gepresenteerd. Gedurende de laatste paar jaar cryo-elektronen microscopie geleverd soortgelijke hoge resolutie structuren van grote macromoleculen / macromoleculaire complexen, maar hoewel de monsters zijn dichter bij fysiologische toestand, ze zijn nog steeds bevroren, vandaar onbeweeglijk en statisch. Bio-kleine hoek Röntgenverstrooiing (BioSAXS) biedt een structurele meting van het macromolecuul, in omstandigheden die relevant zijn voor de biologie. Deze toestand kan worden gevisualiseerd als een lage resolutie 3D-vorm bepaald op nanometerschaal en vangt de volledige conformatieruimte van het macromolecuul in oplossing. BioSAXS-experimenten beoordelen efficiënt oligomeric staat, domein en complexeregelingen, evenalsflexibiliteit tussen domeinen 1,2,3. De methode is nauwkeurig, meestal niet-destructief en vereist meestal slechts een minimum aan monstervoorbereiding en tijd. Voor de beste interpretatie van de gegevens moeten de monsters echter monodisperse zijn. Dit is een uitdaging; biologische moleculen zijn vaak gevoelig voor verontreinigingen, slechte zuivering en aggregatie, bijvoorbeeld van vriesdooi4. De ontwikkeling van inline chromatografie gevolgd door onmiddellijke SAXS-meting helpt deze effecten te verzachten. De chromatografie van de grootte-uitsluiting scheidt de monsters naar grootte , zodat de meeste verontreinigingen en aggregaties5,6,7,8,9,10worden uitgesloten . In sommige gevallen is zelfs SEC-SAXS echter niet voldoende om een monodisperse monster te produceren, omdat het mengsel kan bestaan uit componenten die te dicht in grootte of hun fysieke eigenschappen of hun snelle dynamiek leiden tot overlappende pieken in de SEC UV-trace. In deze gevallen kan een op software gebaseerde deconvolutiestap van de verkregen SAXS-gegevens leiden tot een geïdealiseerde SAXS-curve van de afzonderlijke component5,11,12. Als voorbeeld, in protocol sectie 2, tonen we de standaard SEC-SAXS analyse van de vaccinia E9 DNA polymerase exonuclease minus mutant (E9 exominus)in complex met DNA. Vaccinia vertegenwoordigt het modelorganisme van de Poxviridae, een familie die verschillende ziekteverwekkers bevat, bijvoorbeeld het menselijke pokkenvirus. De polymerase bleek zich strak te binden aan DNA in biochemische benaderingen, waarbij de structuur van het complex onlangs is opgelost door röntgenkristallografie13.

De meeste synchronisatiefaciliteiten bieden een geautomatiseerde pijplijn voor gegevensverwerking die gegevensnormalisatie en integratie uitvoert en een set niet-geëertraceerde frames oplevert. Maar de in dit manuscript beschreven aanpak kan ook worden gebruikt met een laboratoriumbron, mits SEC-SAXS wordt uitgevoerd. Bovendien kan er extra automatisering beschikbaar zijn die stralingsbeschadigde frames afstoot en de bufferaftrekken14uitvoert . We laten zien hoe primaire gegevensanalyses op vooraf verwerkte gegevens kunnen worden uitgevoerd en hoe we de beschikbare gegevens in sectie 2 optimaal benutten.

In sectie 3 laten we zien hoe we SEC-SAXS-gegevens kunnen deconvolutelen en de curven efficiënt analyseren. Hoewel er verschillende deconvolutiemethoden zijn, zoals de Gaussische piekdeconvolutie, geïmplementeerd in US-SOMO15 en de Guinier geoptimaliseerde maximale waarschijnlijkheidsmethode, geïmplementeerd in de DELA-software16,vereisen deze over het algemeen een model voor de piekvorm12. De eindige grootte van individuele pieken die we onderzoeken maakt het gebruik van evoluerende factoranalyse (EFA) mogelijk, als een verbeterde vorm van singular value decomposition (SVD) om overlappende pieken te deconvolutelen, zonder te vertrouwen op de piekvorm of het verstrooiingsprofiel5,11. Een SAXS-specifieke implementatie is te vinden in BioXTAS RAW17. EFA werd voor het eerst gebruikt op chromatografie gegevens toen 2D diode array gegevens toegestaan matrices worden gevormd uit absorptie tegen retentie tijd en golflengte gegevens18. Waar EFA uitblinkt is dat het zich richt op het evoluerende karakter van enkelvoud waarden, hoe ze veranderen met het uiterlijk van nieuwe componenten, met het voorbehoud dat er een inherente volgorde in de overname10. Gelukkig, SEC-SAXS gegevens biedt alle nodige geordende acquisitie gegevens in georganiseerde 2D data arrays, lenen zich mooi aan de EFA techniek.

In sectie 4 zullen we de basisprincipes van modelonafhankelijke SAXS-analyse aantonen vanuit de afgetrokken SAXS-curve op de bufferachtergrond. Modelonafhankelijke analyse bepaalt de straal-van-gyratie van het deeltje (Rg), volume-van-correlatie (Vc), Porod Volume (Vp), en Porod-Debye Exponent (PE). De analyse biedt een semi-kwantitatieve beoordeling van de thermodynamische toestand van het deeltje in termen van compactheid of flexibiliteit via het dimensieloze Kratky-perceel2,4,19.

Ten slotte worden SAXS-gegevens gemeten in wederzijdse ruimte-eenheden en laten we zien hoe we de SAXS-gegevens kunnen transformeren naar echte ruimte om de distributiefunctie van de paarafstand, P(r), te herstellen. De P(r)-verdeling is de verzameling van alle afstanden die zich in het deeltje bevinden en omvat de maximale afmeting van het deeltje, dmax. Aangezien dit een thermodynamische meting is, vertegenwoordigt de P(r)-verdeling de fysieke ruimte die wordt ingenomen door de conformatieruimte van de deeltjes. Een goede analyse van een SAXS-gegevensset kan oplossingen bieden die een aanvulling vormen op informatie met hoge resolutie uit kristallografie en cryo-EM.

Protocol

1. Eiwitexpressie, zuivering en SEC-SAXS-meting is gebaseerd op het gepubliceerde protocol13 Volg het inline SEC-SAXS dataverzamelingsprotocol (Brennich et al.6)in het kort. Equilibrate de SEC-kolom met ten minste 2 kolom volumes van SEC lopende buffer (20 mM Tris-HCl, pH 7.5, 100 mM NaCl). Bereid 50 μL van monster van E9 exominus op 8\u201210 mg/mL met 20% molaire overmaat van een gedeeltelijke dsDNA (TCAGGAAGATAACAGCGGTTTAGCC en GGCTAAACCGCTGTTATCTT). E9 exominus bindt met een KD van 12 ± 6 nM (zie Aanvullende gegevens). Injecteer 50 μL van deze mix op een SEC-kolom (S200 Increase) in lijn met de stroomcel voor SAXS metingen op 0,3 mL/min. Verzamel 1000 frames bij 1 s belichting per stuk.LET OP: Op BioSAXS-beamline BM29 worden in de European Synchrotron Facility (ESRF) de afzonderlijke frames automatisch en onafhankelijk verwerkt binnen het EDNA-kader14. Open na het verzamelen van gegevens de ISPyB-database20 en druk onder het tabblad Gegevensacquisitie op de Go-knop om toegang te krijgen tot de gegevensset en de resultaten van de automatische analyse21. Download de gegevens. 2. Primaire gegevensanalyse Open het java-programma Strooi IV (zie de Tabel van materialen) en voer een achtergrondaftrekking uit voor sec-gegevens (size exclusion chromatografie).Open het tabblad SEC. Sleep en drop de gereduceerde gegevensbestanden (*.dat) in het venster ‘Gegevens neerzetten hieronder’. Stel uitvoermap “Out Dir::” in door op de knop Uitvoer dir met blauw label te klikken.OPMERKING: Als uw gegevens zijn verzameld in nm-1,moet een conversievak worden aangevinkt (linksonder van het deelvenster) wanneer u bestanden in het venster of het aftrekkentabblad laat vallen. Bewerk de experimentele details, gebruik de knop Details bewerken en vul zoveel mogelijk velden in, deze omvatten secties waarop bron/beamline is gebruikt om gegevens te verzamelen, de verzamelingsparameters en voorbeelddetails. Deze worden opgeslagen met de gegevens en maken het mogelijk om gemakkelijker de sectie “Gegevensverzamelingsparameters” in toekomstige publicaties te vullen. Voer de voorbeeldnaam in het vak Opslaan als in. Klik op TRACE.LET OP: Dit heeft twee effecten. Ten eerste zal het een *.sec-bestand voor de gegevens maken. Dit is een enkel tekstbestand dat alle experimentele waarnemingen uit de afzonderlijke * .dat bestanden zal verzamelen. Bovendien bevat het *.sec-bestand de gemiddelde set frames die de bufferachtergrond is, alle frames die worden gebruikt in het gemiddelde en de afgetrokken frames op de bufferachtergrond in het hele SEC-SAXS-experiment. Ten tweede wordt een signaalplot gemaakt waarin het framenummer versus Integrale verhouding naar de achtergrond wordt gecompleteerd. Dit toont de geselecteerde frames (grijs) die gemiddeld zijn voor de bufferaftrekken. De punten voor de gemiddelde buffer worden bepaald aan de hand van het hele bereik van de gegevens. Het is echter raadzaam om handmatig de bufferframes te kiezen voor gemiddelding, omdat een slecht gedefinieerde achtergrond kan optreden als gevolg van slecht geëquilibreerde of vuile kolommen of capillaire vervuiling22. Selecteer handmatig bufferframes. Klik op Buffers wissen en selecteert een buffergebied opnieuw met een klik-sleepknop links op de traceercurve. Idealiter moet dit een vlak gebied zijn vóór het lege volume van de SEC-kolom van ongeveer 100 frames. Klik op BUFFER instellen en vervolgens bijwerken om het bestand *.sec opnieuw te berekenen, wat enkele minuten kan duren. Identificeer een regio van belang (ROI). Selecteer op het signaalplot het gebied van de piek van belang, met een klik-sleep naar links.OPMERKING: Hiermee worden drie percelen in het rechterpaneel gevuld. De bovenste twee percelen zijn gekoppeld aan crosshairs bewegen tussen hen, een tweede signaal plot (rechtsboven) toont alleen de ROI geselecteerd, met de intensiteit van elk frame in het blauw en de overeenkomstige Rg van elk frame in het rood en een overeenkomstige warmtekaart hieronder, met de resten voor elk frame gekleurd volgens de Durbin-Watson auto-correlatie analyse. Regio’s met een hoge gelijkenis zijn gekleurde cyaan (Durbin-Watson, d = 2), terwijl verschillende frames donkerder blauw volgen tot roze en tenslotte tot rood, afhankelijk van de ernst van de ongelijkheden (d > 2). De onderste plot is een afgetrokken I versus q curve voor het centrale geselecteerde frame (ook aangeduid met een verticale lijn). De pijltoetsen kunnen worden gebruikt om door de afgetrokken frames te navigeren. De I versus q plot zal de kwaliteit van de afgetrokken frames van de SEC experiment aan te tonen. Selecteer frames die u wilt samenvoegen. Klik op het vizier in de heat map plot om de subset van frames die zullen worden gebruikt voor het samenvoegen te selecteren. Het vizier zal een driehoekig gebied van overwegend cyaan identificeren dat aan de onderkant rechts van het vizier valt. Gebruik een muisklik om deze frames in te stellen als geselecteerd en markeer de frames in het overeenkomstige gebied van het bovenstaande signaalplot. Deze frames moeten idealiter een regio met een stabiele Rg markeren.OPMERKING: Zoom indien nodig in op de heatmap met een linkse klik op slepen en zoom uit met een veegbeweging naar links naar rechts. Wanneer u tevreden bent met de geselecteerde frames, klikt u op SAMENVOEGen. Hiermee worden de afgetrokken frames samengevoegd en weergegeven op het tabblad ANALYSE. 3. Open het deconvolutieprogramma (bijvoorbeeld BioXTAS Raw 2.0.0). Laad in het deconvolution-programma de gegevensset onder tabblad Bestanden in het Configuratiescherm, gebruik foldether-symbool om de gegevens te zoeken of de locatie in de adresbalk te kopiëren en te plakken.OPMERKING: Zorg ervoor dat de map alleen de raw *.dat-bestanden bevat en geen verwerkte of gemiddelde gegevensbestanden. Markeer alle *.dat bestanden, druk op de plotserieknop, een plot van geïntegreerde intensiteit versus framenummer wordt getekend in de “Series Plot”. Selecteer in het Configuratiescherm het tabblad Reeks en klik vervolgens om de curve te markeren. Open het pop-upvenster van DE LC-analyse met de knop aan de basis van het bedieningspaneel. Dit venster geeft toegang tot verschillende opties, zoals het selecteren van verschillende moleculen (eiwit of RNA). Het stelt de gebruiker ook in staat om het buffergebied voor het perceel te selecteren. Klik in eerste instantie op Automatisch; hiermee moet u een geschikt buffergebied selecteren.OPMERKING: Als dit mislukt, mogelijk als gevolg van een instabiele basislijn, dan “Regio toevoegen” om het buffergebied te optimaliseren. Hiermee wordt het vak Buffer gevuld met een kleiner vak waarin handmatig de framenummers kunnen worden toegevoegd die voor de buffer moeten worden gebruikt. U ook op ‘Kiezen’ klikken om de optie te geven een gebied op het plot te selecteren. Zoek het gebied, klik één keer links voor de startpositie, verplaats de cursor naar de volgende positie en klik opnieuw naar links. Het kan nodig zijn om meer dan één bufferlocatie toe te voegen. Klik op Buffer instellen en de curven worden afgetrokken en de Rg berekend over de SEC-piek. Als er een pop-upvak wordt weergegeven, klikt u op OK. Als u de Evolving Factor Analysis (EFA) wilt starten, klikt u met de rechtermuisknop op het gemarkeerde bestand onder aan de Configuratiescherm en selecteer vervolgens Efa van het menu.Controleer of er een pop-upvenster wordt geopend waarin de SVD (Single Value Decomposition) van de gegevensset wordt weergegeven. Schakel in het selectievakje Frames gebruiken in, zodat het hele piekgebied dat moet worden gedeconvolvoed, wordt afgedekt in het intensiteitsplot. De plot “Enkelvoudswaarden”, rechtsboven, toont de intensiteit van de enkelvoudswaarden (afzonderlijke pieken/soorten) boven de basislijn.OPMERKING: Het aantal punten boven de basislijn staat voor het aantal aanwezige verstrooiingssoorten. Met het voorbehoud dat het de relatieve omvang van de bijzondere waarde aan het vlakke gebied / baseline die zaken. Gebruik de onderste plot AutoCorrrelatie om het aantal afzonderlijke waarden te valideren. Dit toont de rechter en linker enkele correlatie vectoren. Klik op Volgende.OPMERKING: Deze vertegenwoordigen in wezen verstrooiings- of concentratieprofielen voor de vector in de oplossing. Waar de absolute grootte de betekenis van de vector vertegenwoordigt. Een belangrijk onderdeel heeft een autocorrelatie in de buurt van 1 (een vuistregel cutoff is >0,6\u20120.7). RAW berekent dit behulpzaam en wordt weergegeven in het vak #Significant SUV’s, linksonder, maar u dit indien nodig wijzigen. Als er meerdere waarden zijn (bijvoorbeeld 4+), kan het nodig zijn om slechts 2 of 3 van de componenten te bekijken, waardoor het bereik van de gebruikte gegevens wordt gewijzigd. Hoe lager het aantal componenten hoe gemakkelijker de EFA-analyse zal zijn, maar ten koste van het gebruik van minder gegevens. In complexe situatie, waar de linker en juiste enkelvoudvectoren, die gelijkaardig zouden moeten zijn, niet overeenkomen verminderen significant AANTAL SV en het aantal gebruikte kaders verminderen tot de linker en juiste enkelvoudvectoren gelijkaardig zijn. Controleer of de EFA wordt berekend door percelen in de voorwaartse en achterwaartse richtingen voor elke vector te genereren. Deze plots tonen wanneer componenten beginnen (forward plot) en exit (backwards plot) het oplossingsprofiel voor de geselecteerde SEC-SAXS-gegevens. RAW probeert deze bereiken te identificeren; deze te wijzigen met behulp van de pijlen naast de tellers, zodat elke cirkel aan het begin van een buigpunt stijgt van of vallen naar baseline. Klik op Volgende.OPMERKING: De laatste fase van de EFA verandert de SVD-vectoren weer in verstrooiingscurven. Aan de linkerkant van het venster worden de eerder gedefinieerde bereiken bovenaan uitgezet. Deze bereiken zijn de beperkingen om te definiëren waar de enkelvoudsvectoren terug moeten draaien naar verstrooiingscurven. Het rechterpaneel toont deze overeenkomstige verstrooiingscurveprofielen, voor elke gescheiden piek. Een perceel voor de concentratie van elke piek, dat representatief moet zijn voor elutieprofielen en een plot voor de gemiddelde fout gewogen chi2. De chi2 plot meet de deconvolution data set naar de originele dataset. Idealiter zal dit vlak zijn, maar spikes kunnen vaak worden gezien. Probeer pieken te verminderen of te elimineren door de componentbereikbesturingselementente wijzigen, identificeer eerst ongeveer welk frame overeenkomt met de piek (van chi2-plot) en vervolgens in de bereikbesturingselementen, welke component dit frame bevat (het kan meer dan één zijn), met behulp van de pijlen, omhoog of omlaag het overeenkomstige bereik.OPMERKING: Dit moet een reactie opleveren, waardoor de piek toeneemt of vermindert. Als het spike frame aanwezig was in meer dan een component dan een beetje trial and error tussen elk onderdeel kan nodig zijn. Wanneer een minimum chi2 is bereikt, voert u een validatiecontrole uit door terugte klikken, het vorige venster lijkt het mogelijk te maken te controleren of de aangebrachte wijzigingen de oorspronkelijke EFA-percelen drastisch hebben gewijzigd. Als ze er nog steeds geldig uitzien, klikt u op Volgende. Klik op EFA-gegevens opslaan om de plots op te slaan en klik vervolgens op Gereed; om het EFA-venster te sluiten.OPMERKING: Een tweede validatie is om op zijn beurt op het selectievakje naast elk componentbereik te klikken. Deze bieden een positieve concentratiebeperking voor elk onderdeel en het uitschakelen zal controleren of deze aanzienlijk van invloed op de gegevensset. Als er geen verandering wordt gezien in de concentratie plot dan zijn de gegevens geldig. Klik terug in het RAW-venster op het tabblad Profielen in het Configuratiescherm om de curven weer te geven en op het tabblad Manipulatie van het Configuratiescherm,manipuleer de curven verder of sla de curven op als *.dat bestanden door met de rechtermuisknop op het bestand te klikken en geselecteerde bestands(en) op te slaan in de pop-up van het menu. Sla het bestand op. Gebruik Scatter IV voor verdere analyse.LET OP: Meer informatie en instructies over deconvolutie en EFA BioXTAS RAW vindt u op https://bioxtas-raw.readthedocs.io/en/latest/ 4. Bepaal SAXS-eigenschappen OPMERKING: Een diepgaande tutorial voor SAXS bepaling is te vinden op Bioisis.net. Hier tonen we een eenvoudige stap voor stap aanpak, met de nadruk op de meest nuttige knoppen in Scatter. Druk op het tabblad Analyse van spreiding op de G-knop voor het handmatige Guinier-analysegereedschap rechts van elk voorbeeldbestand. Het plot dat opent toont de ln[I(q)versus q2 in de bovenste doos en de bijbehorende resten in de onderste doos. Voeg of verwijder punten zodanig dat de resten niet over een “glimlach” of “frons” functie. De geselecteerde gegevens in de Guinier-pasvorm mogen de maximale q x Rg-limiet van 1,3 niet overschrijden. Druk op de genormaliseerde Kratky-knop; het plot dat opduikt biedt een semi-kwantitatieve beoordeling van de structurele toestand van macromolecuul, genormaliseerd voor massa en concentratie.LET OP: De vizieren wijzen het Guinier-Kratky punt aan op (√3, 1.1)19. Een compact, bolvormig eiwit toont een enkele piek met de maximale waarde op het Guinier-Kratky punt. Een intrinsiek wanordelijk of cilindrisch biopolymeer zou een maximum hebben dat groter is dan het vizier en zou niet afnemen. Een eiwit met zowel gevouwen domeinen als langwerpige ongestructureerde gebieden zou door het vizier een verhoogd maximum kunnen opleveren, maar zou ook een duidelijke dalende trend laten zien bij hogere q x Rg. Klik op de Vc-knop (Volume-of-correlation), die twee percelen, de totale verspreide intensiteit en een geïntegreerd gebied van de totale verspreide intensiteit als functie van q brengt. De percelen worden gebruikt als een snelle referentie om de kwaliteit van de verstrooiingscurve te valideren.OPMERKING: De totale verspreide intensiteit is gevoelig voor de I(0) en als dit niet correct is gemeten, wordt er geen doorlopende lijn weergegeven. Het geïntegreerde gebiedsperceel moet idealiter een sigmoïdale lijn met een uitgebreid plateau voor elke SAXS-curve weergeven. Als er buffermismatch/aftrekking, aggregatie of interdeeltjesinterferentie in het monster is, wordt een scherpe helling waargenomen bij hogere q-waarden. Druk op de knop Flexibiliteit om de flexibiliteitsanalyse te starten. Dit opent een venster met vier panelen en een schuifregelaar aan de onderkant. Elk geopend paneel toont een plot dat gebruik maakt van een machtsrechtelijke relatie die bestaat tussen compacte en langgerekte/flexibele biopolymeren23. Als u wilt gebruiken, verplaatst u de schuifregelaar onder aan het vak van rechts naar links met de linkermuisknop ingedrukt. Blijf langzaam naar links bewegen tot een plateau in een van de percelen is bereikt.OPMERKING: Als het plateau wordt gezien in de Porod-Debye plot, dan is het monster compact van aard, wat in overeenstemming moet zijn met een enkele piek op het Guinier-Kratky-punt in een genormaliseerd Kratky-plot. Als het plateau eerst wordt bereikt in de Kratky-Debye plot dan is het monster waarschijnlijk langwerpig of flexibel. Als de SIBYLS-plot eerst naar het plateau gaat, bevat het monster waarschijnlijk gebieden van zowel compactheid als flexibiliteit, een deeltje met gemengde toestanden. De theorie voor deze flexibiliteitsrelatie met de Wet Porod-Debye wordt prachtig behandeld in Rambo, et al.23 Klik op Volume. De volumebepaling moet onmiddellijk na de flexibiliteitsanalyse van bovenaf worden uitgevoerd. Wanneer geopend na de flexibiliteitsanalyse, wordt een pop-up met drie meer grafieken gegenereerd. In de linkerhoek onthoudt het porod-Debye-plot waar men de schuifregelaar verliet van het flexibiliteitsperceel, met het plateaugebied. Als u het volume van het deeltje wilt berekenen, verplaatst u de begin- en eindpunten met behulp van de pijlknoppen of typt u in de vakken, zodat de blauwe lijn op het perceel in het plateaugebied past. Voor een onbevooroordeeld resultaat, de restanten in de rechterbovenhoek Porod-Debye exponent power-law fit, mag geen patroon te tonen. Druk op het tabblad P(r). De verdeling in de reële ruimte bevindt zich in het linkerpaneel en de verstrooiingscurve voor het monster in het rechterpaneel. Het doel is om een real-space representatie van het monster te maken van de wederzijdse ruimte SAXS curve. Idealiter zal de verdeling curve glad zijn zonder golven aanwezig en moet gewoon zachtjes kus de x-as.OPMERKING: Het gemeten q-bereik van het instrument is mogelijk niet volledig bruikbaar vanwege slechte buffermatching, aggregatie, stralingsschade, suboptimale blootstellingstijden en lage deeltjesconcentraties. De P(r)-bepalingsstap bepaalt fundamenteel het bruikbare qmin- en qmax-bereik van de SAXS-gegevensset en het zou dit bereik van gegevens moeten zijn dat wordt gebruikt voor eventuele latere modellering of montage. Klik met de rechtermuisknop op de voorbeeldnaam en klik vervolgens op DMAX zoeken om een nieuw venster te openen. Limieten voor de dmax zijn vooraf ingesteld met de voorgestelde qmax (maximale gebruikte gegevenspunten), lagere en hogere dmax limieten en een lagere en hogere alpha-score. Er kunnen drie modellen gekozen worden (L1-norm, Legendre en Moore) en het gebruik van de achtergrond inbegrepen. Laat deze in eerste instantie ongewijzigd. Druk op de knop Start. Een samengestelde verdeling wordt gemaakt in het linkerpaneel met de voorgestelde dmax en alfa niveau geschreven eronder. Als dit er acceptabel uitziet, sluit u het venster en keert u terug naar het tabblad P(r). De wederzijdse ruimte plot zal zijn bijgesneden om de voorgestelde qmaxwedstrijd . Kies het model Moore, klik op Achtergrond en stel vervolgens het alfaniveau en dmax in op de voorgestelde waarden uit het pop-upvak. Druk op de verfijnenknop. Er verschijnt een plot voor cross-validatie dat wordt weergegeven als er punten moesten worden afgewezen, gemarkeerd in het rood. Als er slechts een paar punten afgewezen en de verdeling ziet er goed uit dan is het model goed.OPMERKING: In het plot voor crossvalidatie worden gebieden van de gegevens markeren die niet in overeenstemming zijn met de bepaalde P(r)-distributie. Als de afgewezen regio zich voornamelijk in de regio low-q bevindt, dat is het gebied in de buurt van de y-as, suggereert dit waarschijnlijk een dmax die te kort is, aanwezigheid van aggregatie of oligomers met een hogere orde. Het benadrukt een inconsistentie tussen de hogere en lagere resolutie informatie. Hier moeten dmax en qmin (toenemende startwaarde) worden aangepast met behulp van een handmatige, trial-and-error benadering. Evenzo kan dit, als het afgewezen gebied zich voornamelijk in het hoog-q-gebied bevindt, wijzen op een probleem met de achtergrondaftrekking of dat het signaal te zwak is om zinvol te worden verklaard door de bepaalde P(r)-verdeling. In dit geval moet qmax worden afgekapt (afnemend einde) totdat er geen extra gegevens worden afgewezen. In het ideale gewijs moeten afgewezen punten willekeurig worden verdeeld en minder dan 5% van de bruikbare gegevens uitmaken. Een goed gedefinieerde qmin,qmax en “dmax”zal een soepele verdeling produceren waar de dmax de x-as kust. Echter, niet verhogen deze waarde zo veel dat het volledig verwijdert de Guinier regio. Dit punt is gemakkelijk te vinden door het vakje q x l(q) aan tevinken (links van het paneel boven de tabel). De verstrooiingscurve wordt vervangen door het plot “Total Scattered Intensity”, op deze curve maken alle punten vóór de maximale verbuiging deel uit van het Guinier-gebied. Na het verwijderen van punten probeer opnieuw te verhogen / verlagen van de “dmax”en vervolgens weer verfijnen. Als er problemen blijven bestaan, vooral wanneer veel punten worden afgewezen vanaf het begin van de validatiecurve, suggereert dit sterk dat de gegevens niet ideaal zijn voor structurele modellering. Als u een rapport wilt afdrukken, gaat u terug naar het tabblad Analyse, klikt u met de linkerhand om het voorbeeld te markeren en klikt u met de rechtermuisknop op de voorbeeldnaam en gaat u naar Rapport maken vanuit één gegevensset in het menu. Er wordt een tekstvak geopend om opmerkingen toe te voegen. Er wordt een PDF-document gemaakt met alle gegenereerde cijfers en waarden.

Representative Results

Het voordeel van het gebruik van deconvolutie ten opzichte van klassieke frame selectie13 is het verwijderen van de invloed van soorten op elkaar, het produceren van een monodisperse verstrooiing signaal. Dit wordt ook vaak gevolgd met een betere signaal-ruisverhouding. Wanneer E9 exominus is gebonden aan DNA en uitgevoerd met behulp van SEC-SAXS, twee pieken worden waargenomen (figuur 1). De eerste, grote piek (ongeveer frames 420\u2012475) is het E9 exominus-DNA complex de tweede (ongeveer frames 475\u2012540), de niet-gebonden toestand (zie Aanvullende gegevens: figuur 2). Terwijl de klassieke benadering van het selecteren van frames een stabiele Rg van het complex in de eerste piek biedt (zie Aanvullende gegevens: figuur 3),wordt de tweede piek duidelijk samengevoegd en toont de Rg over het perceel aan dat de tweede piek van belang geen stabiele Rg heeft, als gevolg van kruispiekbesmetting. Slechts 5 frames konden worden gebruikt die een semi-stabiele Rg toonde, wanneer afgetrokken gaven ze een Rg = 36.3 Å (Figuur 2, groen). Toen de toppen werden gedeconvoluteerd met behulp van EFA werd de overeenkomstige curve voor de tweede piek(figuur 2, blauw) bedekt met het origineel en toonde een duidelijke daling van het signaal naar ruis, en een lagere Rg, 34,1 Å werd geregistreerd. De Kratky plot (Figuur 3) toont het complex met de gedeconvoluted piek (blauw) is meer bolvormig. Dit wordt bevestigd door de P(r) curve (Figuur 4) die een dmax 108,5 Å geeft voor de gedeconvoluteerde curve (blauw), terwijl de niet-gedeconvoluteerde meer langwerpig is met een dmax 120 Å (groen), dit is waarschijnlijk te wijten aan heterogeniteit als gevolg van de niet-begrensde E9 exominus. Figuur 1: Signaalplot van E9 exominus alleen en met DNA in complex.Het bovenste paneel toont een plot van de integrale verhouding tot de achtergrond voor elk frame van een SEC-SAXS-run (lichtblauw). De rode punten tonen de Rg bij elk frame over de piek. Het onderste paneel toont de bijbehorende warmtekaart met de restanten voor elk frame gekleurd volgens de Durbin-Watson auto-correlatie analyse, regio’s met een hoge gelijkenis zijn gekleurde cyaan, terwijl ongelijke frames volgen donkerder blauw tot roze en ten slotte naar rood, afhankelijk van de ernst van de ongelijksoortigheid. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 2: Plot van intensiteit versus verstrooiingsvector.Een overlay van de afgetrokken SAXS-gegevens vormen de E9 exominus . In groene 5 frames (frame 517\u2012522) gemiddeld en afgetrokken van een gebied van semi-stabiele Rg en in het blauw de representatieve verstrooiing curve afgeleid van de EFA deconvolution van de SEC-SAXS piek. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 3: Dimensieloze Kratky curve.Overlay van de gedeconvoluteerde (blauw) en niet-gedeconvoluteerde (groene) Kratky curve met E9 exominus is bolvormig. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 4: P(r) curve.De overlay van de gedeconvoluteerde (blauw) en niet-gedeconvoluteerde (groene) krommen voor de E9 exominus. Klik hier om een grotere versie van dit cijfer te bekijken. Aanvullende gegevens. Klik hier om dit bestand te downloaden 

Discussion

Het is gewenst om een monodisperse monster te hebben voordat u een SAXS-experiment start, maar in werkelijkheid voldoen veel gegevensverzamelingen hier niet aan en moeten ze worden verbeterd door de meting te combineren met inline chromatografie— SEC in de meeste gevallen. Zelfs het gebrek aan tijd tussen zuivering en gegevensverwerving is echter niet gegarandeerd. Meestal geldt dit voor experimenten waarbij componenten te dicht in grootte of in hun fysieke eigenschappen zijn om te worden gescheiden of gevoelig zijn voor snelle dynamiek. Hier hebben we een protocol dat single value-afbraak combineert met evoluerende factoranalyse om de invloed van DNAbound E9 exominus uit zijn ongebonden vorm te verwijderen, waardoor een monodisperse verstrooiingsprofiel ontstaat dat we vervolgens konden analyseren met het SAXS-pakket Scatter IV.

SVD met EFA van SEC-SAXS-gegevens zijn zeer krachtige methoden ontwikkeld om SAXS-gegevens te deconvolute en de analyse te verbeteren, maar ze hebben wel beperkingen. Ze vereisen dat ruis of drift in de bufferbasislijn van de SEC-SAXS tot een minimum wordt beperkt. Dit kan extra kolomevenwicht (beter om meer dan 3 kolomvolumes te gebruiken, afhankelijk van de buffer) voor het laden van monsters. De meest kritieke stap is echter de keuze van het aantal enkelvoudswaarden en het bereik van de gebruikte gegevens, omdat dit de nauwkeurigheid van de deconvolutie sterk zal beïnvloeden. Het is om deze reden dat de resultaten niet op zichzelf moeten worden genomen, maar verder moeten worden geanalyseerd met behulp van technieken zoals analytische ultracentrifugatie (AUC) of multi-angle-laser-light-scattering (MALLS) voor biologische interpretatie.

Scatter IV is een nieuw, softwarepakket, gratis voor onderzoek en industrieel gebruik met een intuïtieve gebruikersinterface waarmee zelfs niet-experts hun gegevens kunnen analyseren. Scatter IV heeft een aantal nieuwe functies die helpen om de analyse van SEC-SAXS-gegevens te verbeteren, zoals de heat map gekoppeld aan het signaal plot, waardoor een grotere nauwkeurigheid met de keuze van frame selectie. In primaire gegevensanalyse bieden de Guinier Peak-analyse en de cross-validatieplot die is gekoppeld aan de P(r)-analyse een geïntegreerde probleemoplossingsmoertie in de software.

Het moet worden vermeld dat veel andere programma’s kunnen worden gebruikt voor primaire gegevensanalyse; deze bevatten dezelfde basisfuncties en worden ook regelmatig bijgewerkt, zoals BioXTAS RAW17 ATSAS-pakket24 en US-SOMO15 om er maar een paar te noemen.

Maar ongeacht welk SAXS-pakket wordt gebruikt voor analyse, de belangrijkste beperkingen zijn gebruikelijk: de monstervoorbereiding, vóór het verzamelen en analyseren. In het getoonde voorbeeld van E9 exominus is het duidelijk om de verbetering van de signaal-ruisverhouding te zien en met een vermindering van de Rg de dmax geassocieerd met een monodisperse monster. Dit zal sterk helpen bij de verdere verwerking van de gegevens, zoals montage of modellering met bekende structuren met hoge resolutie.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wij erkennen de financiële steun voor het project van de Franse subsidie REPLIPOX ANR-13-BSV8-0014 en door onderzoekssubsidies van de Dienst de Santé des Armées en de Délégation Générale pour l’Armement. We zijn de ESRF dankbaar voor de SAXS beam tijd. Dit werk gebruikte de platforms van het Centrum Grenoble Instruct-ERIC (ISBG; UMS 3518 CNRS-CEA-UGA-EMBL) binnen het Grenoble Partnership for Structural Biology (PSB), ondersteund door FRISBI (ANR-10-INBS-05-02) en GRAL, gefinancierd binnen de University Grenoble Alpes graduate school (Ecoles Universitaires de Recherche) CBH-EUR-GS (ANR-17-EURE-0003). IBS erkent integratie in het Interdisciplinair Onderzoeksinstituut van Grenoble (IRIG, CEA). Wij danken Wim P. Burmeister en Frédéric Iseni voor financiële en wetenschappelijke steun en we danken dr. Jesse Hopkins van BioCAT bij de APS voor zijn hulp en voor de ontwikkeling van BioXTAS RAW.

Materials

Beamline control software BsXCuBE ESRF Pernot et al. (2013), J. Synchrotron Rad. 20, 660-664 local development
BioXTAS Raw 1.2.3. MacCHESS http://bioxtas-raw.readthedocs.io/en/latest/index.html First developed in 2008 by Soren Skou as part of the biological x-ray total analysis system (BioXTAS) project. Since then it has been extensively developed, with recent work being done by Jesse B. Hopkins
HPLC program LabSolutions Shimadzu n.a.
ISPyB ESRF De Maria Antolinos et al. (2015). Acta Cryst. D71, 76-85. local development
NaCl VWR Chemicals (BDH Prolabo) 27808.297
Scatter Diamond Light Source Ltd http://www.bioisis.net/tutorial/9 Supported by SIBYLS beamline (ALS berkeley, Ca) and Bruker Cororation (Karlsruhe, Germany)
Superdex 200 Increase 5/150 GL column GE Healthcare 28990945 SEC-SAXS column used
Tris base Euromedex 26-128-3094-B

References

  1. Pelikan, M., Hura, G., Hammel, M. Structure and flexibility within proteins as identified through small angle X-ray scattering. General Physiology and Biophysics. 28 (2), 174-189 (2009).
  2. Brosey, C. A., Tainer, J. A. Evolving SAXS versatility: solution X-ray scattering for macromolecular architecture, functional landscapes, and integrative structural biology. Current Opinion in Structural Biology. 58, 197-213 (2019).
  3. Gräwert, M., Svergun, D. A beginner’s guide to solution small-angle X-ray scattering (SAXS). The Biochemist. 42 (1), 36-42 (2020).
  4. Putnam, C. D., Hammel, M., Hura, G. L., Tainer, J. A. X-ray solution scattering (SAXS) combined with crystallography and computation: defining accurate macromolecular structures, conformations and assemblies in solution. Quarterly reviews of biophysics. 40 (03), 191-285 (2007).
  5. Meisburger, S. P., et al. Domain Movements upon Activation of Phenylalanine Hydroxylase Characterized by Crystallography and Chromatography-Coupled Small-Angle X-ray Scattering. Journal of the American Chemical Society. 138 (20), 6506-6516 (2016).
  6. Brennich, M. E., Round, A. R., Hutin, S. Online Size-exclusion and Ion-exchange Chromatography on a SAXS Beamline. Journal of Visualized Experiments. (119), e54861 (2017).
  7. Watanabe, Y., Inoko, Y. Size-exclusion chromatography combined with small-angle X-ray scattering optics. Journal of Chromatography A. 1216 (44), 7461-7465 (2009).
  8. Graewert, M. A., et al. Automated Pipeline for Purification, Biophysical and X-Ray Analysis of Biomacromolecular Solutions. Scientific reports. 5, (2015).
  9. David, G., Pérez, J. Combined sampler robot and high-performance liquid chromatography: a fully automated system for biological small-angle X-ray scattering experiments at the Synchrotron SOLEIL SWING beamline. Journal of applied crystallography. 42 (5), 892-900 (2009).
  10. Ryan, T. M., et al. An optimized SEC-SAXS system enabling high X-ray dose for rapid SAXS assessment with correlated UV measurements for biomolecular structure analysis. Journal of Applied Crystallography. 51 (1), 97-111 (2018).
  11. Gampp, H., Maeder, M., Meyer, C. J., Zuberbühler, A. D. Calculation of equilibrium constants from multiwavelength spectroscopic data-III: Model-free analysis of spectrophotometric and ESR titrations. Talanta. 32 (12), 1133-1139 (1985).
  12. Maeder, M., Neuhold, Y. M. . Practical Data Analysis in Chemistry. , (2007).
  13. Tarbouriech, N., et al. The vaccinia virus DNA polymerase structure provides insights into the mode of processivity factor binding. Nature Communications. 8 (1), (2017).
  14. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), (2016).
  15. Brookes, E., Rocco, M. Recent advances in the UltraScan SOlution MOdeller (US-SOMO) hydrodynamic and small-angle scattering data analysis and simulation suite. European Biophysics Journal. 47 (7), 855-864 (2018).
  16. Malaby, A. W., et al. Methods for analysis of size-exclusion chromatography-small-angle X-ray scattering and reconstruction of protein scattering. Journal of Applied Crystallography. 48 (4), 1102-1113 (2015).
  17. Hopkins, J. B., Gillilan, R. E., Skou, S. BioXTAS RAW: improvements to a free open-source program for small-angle X-ray scattering data reduction and analysis. Journal of Applied Crystallography. 50 (5), 1545-1553 (2017).
  18. Maeder, M. Evolving factor analysis for the resolution of overlapping chromatographic peaks. Analytical Chemistry. 59 (3), 527-530 (1987).
  19. Durand, D., et al. NADPH oxidase activator p67phox behaves in solution as a multidomain protein with semi-flexible linkers. Journal of Structural Biology. 169 (1), 45-53 (2010).
  20. De Maria Antolinos, A., et al. ISPyB for BioSAXS, the gateway to user autonomy in solution scattering experiments. Acta Crystallographica Section D. 71 (1), 76-85 (2015).
  21. Brennich, M. E., et al. Online data analysis at the ESRF bioSAXS beamline, BM29. Journal of Applied Crystallography. 49 (1), 203-212 (2016).
  22. Kirby, N., et al. Improved radiation dose efficiency in solution SAXS using a sheath flow sample environment. Acta Crystallographica Section D Structural Biology. 72 (12), 1254-1266 (2016).
  23. Rambo, R. P., Tainer, J. A. Characterizing flexible and intrinsically unstructured biological macromolecules by SAS using the Porod-Debye law. Biopolymers. 95 (8), 559-571 (2011).
  24. Franke, D., et al. ATSAS 2.8: a comprehensive data analysis suite for small-angle scattering from macromolecular solutions. Journal of Applied Crystallography. 50 (4), 1212-1225 (2017).

Play Video

Cite This Article
Tully, M. D., Tarbouriech, N., Rambo, R. P., Hutin, S. Analysis of SEC-SAXS data via EFA deconvolution and Scatter. J. Vis. Exp. (167), e61578, doi:10.3791/61578 (2021).

View Video