Hedeflenen çapraz bağlama kütle spektrometresi, üç farklı edinme protokolü kullanılarak elde edilen kütle spektrometresi verilerini kullanarak kuaterner protein yapı modelleri oluşturur. Cheetah-MS web sunucusunda basitleştirilmiş bir iş akışı olarak yürütüldüğünde, sonuçlar bir Jupyter Not Defterinde raporlanır. Burada, Jupyter Notebook daha derinlemesine bir analiz için nasıl genişletilebileceğinin teknik yönlerini gösteriyoruz.
Protein-protein etkileşimlerini incelemek zor olabilir, ancak biyolojik sistemlerin nasıl çalıştığına dair içgörüler sağlar. Kuaterner protein yapı modellemesini ve kimyasal çapraz bağlamalı kütle spektrometrisini birleştiren bir yöntem olan hedefli çapraz bağlama kütle spektrometresi (TX-MS), karmaşık, fraksiyone edilmemiş numunelerden elde edilen verileri kullanarak yüksek hassasiyetli yapı modelleri oluşturur. Bu, protein kompleks yapı analizinin önündeki en büyük engellerden birini ortadan kaldırır, çünkü ilgilenilen proteinlerin artık büyük miktarlarda saflaştırılmasına gerek yoktur. Cheetah-MS web sunucusu, protokolün basitleştirilmiş sürümünü topluluk için daha erişilebilir hale getirmek için geliştirilmiştir. Tandem MS / MS verilerini göz önünde bulundurarak, Cheetah-MS, en önemli analiz sonuçlarını özetleyen grafiksel bir rapor olan bir Jupyter Notebook oluşturur. Jupyter Dizüstü Bilgisayarını genişletmek, daha derinlemesine içgörüler sağlayabilir ve modeli ve onu destekleyen kütle spektrometresi verilerini daha iyi anlayabilir. Burada sunulan teknik protokol, en yaygın uzantılardan bazılarını gösterir ve hangi bilgilerin elde edilebileceğini açıklar. Tandem MS / MS toplama verilerini ve tespit edilen XL’lerin bildirilen kuaterner modeller üzerindeki genel etkisini analiz etmeye yardımcı olacak bloklar içerir. Bu tür analizlerin sonucu, NGLView kullanılarak dizüstü bilgisayara gömülü yapısal modellere uygulanabilir.
Protein-protein etkileşimleri, biyolojik sistemlerin yapısını ve işlevini destekler. Proteinlerin kuaterner yapılarına erişebilmek, iki veya daha fazla proteinin yüksek dereceli yapılar oluşturmak için nasıl etkileşime girdiğine dair fikir verebilir. Ne yazık ki, kuaterner yapıların elde edilmesi zor olmaya devam etmektedir; bu, birden fazla polipeptit içeren nispeten az sayıda Protein DataBank (PDB) girişi1’e yansır. Protein-protein etkileşimleri, X-ışını kristalografisi, NMR ve kriyo-EM gibi teknolojilerle incelenebilir, ancak yöntemlerin uygulanabileceği koşullar altında yeterli miktarda saflaştırılmış protein elde etmek zaman alıcı olabilir.
Kimyasal çapraz bağlama kütle spektrometrisi, protein-protein etkileşimleri hakkında deneysel veriler elde etmek için geliştirilmiştir ve kütle spektrometresi keyfi olarak karmaşık numuneler hakkında veri elde etmek için kullanılabilir 2,3,4,5,6,7,8,9 . Bununla birlikte, veri analizinin kombinatoryal doğası ve nispeten az sayıda çapraz bağlı peptit, numunelerin analizden önce parçalanmasını gerektirir. Bu eksikliği gidermek için, hesaplamalı modellemeyi kimyasal çapraz bağlama kütle spektrometresi10 ile birleştiren bir yöntem olan TX-MS’yi geliştirdik. TX-MS, keyfi olarak karmaşık numunelerde kullanılabilir ve önceki yöntemlere kıyasla önemli ölçüde daha hassastır10. Bunu, her MS spektrumunu bağımsız olarak yorumlamak yerine, belirli bir protein-protein etkileşimi ile ilişkili tüm verileri bir set olarak puanlayarak gerçekleştirir. TX-MS ayrıca üç farklı MS edinme protokolü kullanır: yüksek çözünürlüklü MS1 (hrMS1), veriye bağımlı edinme (DDA) ve veriden bağımsız edinme (DIA), birden fazla gözlemi birleştirerek çapraz bağlı bir peptidi tanımlamak için fırsatlar sunar. TX-MS hesaplamalı iş akışı çeşitli nedenlerden dolayı karmaşıktır. İlk olarak, protein yapı modelleri14,15 oluşturmak için birden fazla MS analiz yazılımı programı 11,12,13’e dayanır. İkincisi, veri miktarı önemli olabilir. Üçüncüsü, modelleme adımı önemli miktarda bilgisayar işlem gücü tüketebilir.
Sonuç olarak, TX-MS en iyi şekilde, bilgisayar bulutları veya kümeleri gibi büyük hesaplama altyapılarında çalışan Cheetah-MS web sunucusu16 aracılığıyla otomatik, basitleştirilmiş bir hesaplama iş akışı olarak kullanılır. Sonuçların yorumlanmasını kolaylaştırmak için interaktif bir Jupyter Notebook17 hazırladık. Burada, Jupyter Notebook raporunun, belirli bir sonucun daha derinlemesine bir analizini sağlamak için nasıl genişletilebileceğini gösteriyoruz.
Modern hesaplamalı iş akışları, birçok farklı satıcıdan birden çok araç, karmaşık karşılıklı bağımlılıklar, yüksek veri hacimleri ve çok yönlü sonuçlarla genellikle karmaşıktır. Sonuç olarak, bir sonuç elde etmek için gereken tüm adımları doğru bir şekilde belgelemek giderek zorlaşmakta ve verilen sonucun çoğaltılmasını zorlaştırmaktadır. Burada, genel bir rapor üreten otomatik bir iş akışının otomasyonunu ve kolaylığını, raporu yeniden üretilebilir bir şekilde özelleştirme esnekliğiyle birleştiren genel bir strateji gösteriyoruz.
Protokolün çalışması için üç gereksinimin yerine getirilmesi gerekir: Birincisi, analiz için seçilen proteinlerin, kimyasal çapraz bağlama deneyinin, kütle spektrometresi tarafından tespit edilecek kadar yüksek bir konsantrasyonda çapraz bağlı türler üretebileceği şekilde etkileşime girmesi gerekir; Farklı kütle spektrometreleri farklı algılama seviyelerine sahiptir ve ayrıca edinme protokolüne ve çapraz bağlama reaktifinin seçimine de bağlıdır. TX-MS protokolünün mevcut sürümü yalnızca lizin-lizin homobifonksiyonel çapraz bağlama reaktifi olan DSS’ye izin verir. Yine de, bu sınırlama öncelikle makine öğrenimi adımının diğer reaktifler için ayarlanması gerekme olasılığından kaynaklanmaktadır. Bu sınırlama, Cheetah-MS web sunucusunda iki çapraz bağlama reaktifi daha düşünülebildiği için geliştirilmiştir, ancak üçü de bölünemeyen reaktiflerdir. İkincisi, iki proteinin ya deneysel olarak belirlenmiş bir yapıya sahip olması ya da karşılaştırmalı modelleme teknikleri veya de novo teknikler kullanılarak modellenmesi gerekir. Tüm proteinler modellenemez, ancak geliştirilmiş yazılımın ve PDB’deki deneysel yapıların sürekli birikmesinin bir kombinasyonu, modellenebilecek protein sayısını genişletir. Üçüncüsü, etkileşen proteinler bağlı ve bağlanmamış hallerinde yeterince benzer kalmalıdır, böylece TX-MS ve Cheetah-MS tarafından kullanılan yerleştirme algoritmaları, puanlamayı sağlamak için yeterli kalitede kuaterner yapılar oluşturabilir. Bu gereklilik nispeten belirsizdir, çünkü kabul edilebilir kalite oldukça sisteme bağımlıdır, burada bilinen yapıdaki daha küçük proteinlerin karşılaştırılması genellikle bilinmeyen yapıya sahip daha büyük proteinlerden daha kolaydır.
Negatif bir sonuç durumunda, önce TX-MS’nin aynı polipeptit zincirinin bir parçası olan kalıntılar arasında iç bağlantılar, çapraz bağlantılar bulduğunu kontrol edin. Hiçbiri keşfedilmediyse, en olası açıklama, numune hazırlama veya veri toplama işleminde bir şeylerin ters gittiğindir. Birden fazla mesafe kısıtlaması modelleri desteklemiyorsa, konformasyonun çapraz bağlı kalıntılar tarafından desteklendiğinden emin olmak için modelleri görsel olarak inceleyin. En az bir çapraz bağlantıyı bozmadan interaktörlerden birini döndürmenin açık bir yolu yoktur. Verilen çapraz bağlama reaktifi için izin verilen mesafeden daha uzun çapraz bağlantılar varsa, çapraz bağlama verilerini dahil ederek ara aktörlerin modellemesini geliştirmeye çalışın.
Seçilen yazılımın hassasiyetinin TX-MS’in hassasiyeti ile karşılaştırılabilir olması koşuluyla eşdeğer sonuçlar elde etmek için alternatif yazılım uygulamaları kullanmak mümkündür. Örneğin, RosettaDock, HADDOCK ve diğerlerinin çevrimiçi sürümleri vardır. Kimyasal çapraz bağlama verilerini xQuest/xProphet5,6, plink7 ve SIM-XL26 aracılığıyla analiz etmek de mümkündür.
TX-MS ve Cheetah-MS’iyeni projeler 27,28,29’a sürekli olarak uyguluyoruz, böylece bu yaklaşımlarla üretilen raporları, raporları büyütmeden sonuçların daha ayrıntılı bir analizini sağlayacak şekilde geliştiriyoruz.
The authors have nothing to disclose.
Bu çalışma Knut ve Alice Wallenberg Vakfı (hibe no. 2016.0023) ve İsviçre Ulusal Bilim Vakfı (hibe no. P2ZHP3_191289). Ayrıca, Zürih Üniversitesi S3IT’ye hesaplama altyapısı ve teknik desteği için teşekkür ederiz.
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |