Gerichte cross-linking massaspectrometrie creëert quaternaire eiwitstructuurmodellen met behulp van massaspectrometriegegevens die zijn verkregen met behulp van maximaal drie verschillende acquisitieprotocollen. Wanneer de resultaten worden uitgevoerd als een vereenvoudigde workflow op de Cheetah-MS-webserver, worden ze gerapporteerd in een Jupyter Notebook. Hier demonstreren we de technische aspecten van hoe de Jupyter Notebook kan worden uitgebreid voor een meer diepgaande analyse.
Eiwit-eiwit interacties kunnen een uitdaging zijn om te bestuderen, maar toch inzicht geven in hoe biologische systemen functioneren. Targeted cross-linking mass spectrometry (TX-MS), een methode die quaternaire eiwitstructuurmodellering en chemische cross-linking massaspectrometrie combineert, creëert zeer nauwkeurige structuurmodellen met behulp van gegevens verkregen uit complexe, niet-gefractioneerde monsters. Dit neemt een van de belangrijkste obstakels voor eiwitcomplexstructuuranalyse weg, omdat de eiwitten van belang niet langer in grote hoeveelheden hoeven te worden gezuiverd. Cheetah-MS webserver is ontwikkeld om de vereenvoudigde versie van het protocol toegankelijker te maken voor de gemeenschap. Rekening houdend met de tandem MS/MS-gegevens genereert Cheetah-MS een Jupyter Notebook, een grafisch rapport met een samenvatting van de belangrijkste analyseresultaten. Het uitbreiden van de Jupyter Notebook kan meer diepgaande inzichten opleveren en het model en de massaspectrometriegegevens die het ondersteunen beter begrijpen. Het hier gepresenteerde technische protocol demonstreert enkele van de meest voorkomende extensies en legt uit welke informatie kan worden verkregen. Het bevat blokken om tandem MS /MS-acquisitiegegevens en de algehele impact van de gedetecteerde XL’s op de gerapporteerde quaternaire modellen te helpen analyseren. Het resultaat van dergelijke analyses kan worden toegepast op structurele modellen die met BEHULP VAN NGLView in het notitieboek zijn ingebed.
Eiwit-eiwit interacties ondersteunen de structuur en functie van biologische systemen. Toegang hebben tot quaternaire structuren van eiwitten kan inzicht geven in hoe twee of meer eiwitten op elkaar inwerken om structuren van hoge orde te vormen. Helaas blijft het verkrijgen van quaternaire structuren een uitdaging; dit komt tot uiting in het relatief kleine aantal Protein DataBank (PDB) entries1 dat meer dan één polypeptide bevat. Eiwit-eiwitinteracties kunnen worden bestudeerd met technologieën zoals röntgenkristallografie, NMR en cryo-EM, maar het verkrijgen van een voldoende hoeveelheid gezuiverd eiwit onder omstandigheden waarin de methoden kunnen worden toegepast, kan tijdrovend zijn.
Chemische cross-linking massaspectrometrie werd ontwikkeld om experimentele gegevens te verkrijgen over eiwit-eiwitinteracties met minder beperkingen op monstervoorbereiding, aangezien massaspectrometrie kan worden gebruikt om gegevens te verkrijgen over willekeurig complexe monsters 2,3,4,5,6,7,8,9 . Het combinatorische karakter van de data-analyse en het relatief kleine aantal verknoopte peptiden vereisen echter dat de monsters vóór de analyse worden gefractioneerd. Om deze tekortkoming aan te pakken, hebben we TX-MS ontwikkeld, een methode die computationele modellering combineert met chemische cross-linking massaspectrometrie10. TX-MS kan worden gebruikt op willekeurig complexe monsters en is aanzienlijk gevoeliger in vergelijking met eerdere methoden10. Het bereikt dit door alle gegevens die verband houden met een bepaalde eiwit-eiwitinteractie als een set te scoren in plaats van elk MS-spectrum onafhankelijk te interpreteren. TX-MS maakt ook gebruik van maximaal drie verschillende MS-acquisitieprotocollen: hoge resolutie MS1 (hrMS1), data-afhankelijke acquisitie (DDA) en data-onafhankelijke acquisitie (DIA), wat verder mogelijkheden biedt om een cross-linked peptide te identificeren door meerdere observaties te combineren. De TX-MS computationele workflow is om verschillende redenen complex. Ten eerste vertrouwt het op meerdere MS-analysesoftwareprogramma’s 11,12,13 om eiwitstructuurmodellen 14,15 te maken. Ten tweede kan de hoeveelheid gegevens aanzienlijk zijn. Ten derde kan de modelleringsstap aanzienlijke hoeveelheden computerverwerkingskracht verbruiken.
Daarom kan TX-MS het beste worden gebruikt als een geautomatiseerde, vereenvoudigde computationele workflow via Cheetah-MS webserver16 die draait op grote computationele infrastructuren zoals computerclouds of clusters. Om de interpretatie van de resultaten te vergemakkelijken, hebben we een interactieve Jupyter Notebook17 geproduceerd. Hier laten we zien hoe het Jupyter Notebook-rapport kan worden uitgebreid om een meer diepgaande analyse van een bepaald resultaat te verkrijgen.
Moderne computationele workflows zijn vaak complex, met meerdere tools van veel verschillende leveranciers, complexe onderlinge afhankelijkheden, hoge datavolumes en veelzijdige resultaten. Bijgevolg wordt het steeds moeilijker om alle stappen die nodig zijn om een resultaat te verkrijgen nauwkeurig te documenteren, waardoor het moeilijk wordt om het gegeven resultaat te reproduceren. Hier demonstreren we een algemene strategie die de automatisering en het gemak van een geautomatiseerde workflow combineert die een generiek rapport produceert, met de flexibiliteit om het rapport op een reproduceerbare manier aan te passen.
Er moet aan drie vereisten worden voldaan om het protocol te laten werken: ten eerste moeten de voor analyse geselecteerde eiwitten zodanig op elkaar inwerken dat het chemische crosslinking-experiment verknoopte soorten kan produceren in een voldoende hoge concentratie om door de massaspectrometer te worden gedetecteerd; verschillende massaspectrometers hebben verschillende detectieniveaus en zijn ook afhankelijk van het acquisitieprotocol en de keuze van cross-linking reagens. De huidige versie van het TX-MS-protocol staat alleen DSS toe, een lysine-lysine homobifunctioneel cross-linking reagens. Toch is deze beperking voornamelijk te wijten aan de mogelijkheid dat de machine learning-stap zou moeten worden aangepast voor andere reagentia. Deze beperking is verbeterd in de Cheetah-MS webserver omdat nog twee cross-linking reagentia kunnen worden overwogen, maar alle drie zijn niet-kleefbare reagentia. Ten tweede moeten de twee eiwitten een experimenteel bepaalde structuur hebben of worden gemodelleerd met behulp van vergelijkende modelleringstechnieken of de novo-technieken . Niet alle eiwitten kunnen worden gemodelleerd, maar een combinatie van verbeterde software en een constante afzetting van experimentele structuren in de VOB breidt het aantal eiwitten dat kan worden gemodelleerd uit. Ten derde moeten de interagerende eiwitten voldoende vergelijkbaar blijven in hun gebonden en ongebonden toestanden, zodat de koppelingsalgoritmen die door TX-MS en Cheetah-MS worden gebruikt, quaternaire structuren van voldoende kwaliteit kunnen creëren om scoring mogelijk te maken. Deze eis is relatief vaag, omdat de aanvaardbare kwaliteit sterk systeemafhankelijk is, waarbij kleinere eiwitten met een bekende structuur over het algemeen gemakkelijker te vergelijken zijn dan grotere eiwitten met een onbekende structuur.
In het geval van een negatief resultaat, controleer eerst of TX-MS intra-links heeft gevonden, dwarsverbanden tussen residuen die deel uitmaken van dezelfde polypeptideketen. Als er geen worden ontdekt, is de meest waarschijnlijke verklaring dat er iets mis is gegaan met de monstervoorbereiding of de gegevensverzameling. Als meerdere afstandsbeperkingen de modellen niet ondersteunen, inspecteer de modellen dan visueel om ervoor te zorgen dat de conformatie wordt ondersteund door verknoopte residuen. Er is geen voor de hand liggende manier om een van de interactoren te draaien zonder ten minste één dwarsverbinding te verstoren. Als er cross-links zijn die langer zijn dan de toegestane afstand voor het gegeven cross-linking reagens, probeer dan de modellering van de interactoren te verbeteren door cross-linking data op te nemen.
Het is mogelijk om alternatieve softwaretoepassingen te gebruiken om gelijkwaardige resultaten te bereiken, op voorwaarde dat de gevoeligheid van de gekozen software vergelijkbaar is met de gevoeligheid van TX-MS. Er zijn bijvoorbeeld online versies van RosettaDock, HADDOCK en anderen. Het is ook mogelijk om chemische cross-linking data te analyseren via xQuest/xProphet 5,6, plink7 en SIM-XL26.
We passen TX-MS en Cheetah-MS voortdurend toe op nieuwe projecten 27,28,29, waardoor de rapporten die door deze benaderingen worden geproduceerd, worden verbeterd om een meer gedetailleerde analyse van de resultaten mogelijk te maken zonder de rapporten groter te maken.
The authors have nothing to disclose.
Dit werk werd ondersteund door de Stichting van Knut en Alice Wallenberg (subsidienr. 2016.0023) en de Zwitserse National Science Foundation (subsidienr. P2ZHP3_191289). Daarnaast bedanken we S3IT, Universiteit van Zürich, voor zijn computationele infrastructuur en technische ondersteuning.
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |