La spectrométrie de masse à réticulation ciblée crée des modèles de structure protéique quaternaire à l’aide de données de spectrométrie de masse acquises à l’aide de jusqu’à trois protocoles d’acquisition différents. Lorsqu’ils sont exécutés en tant que flux de travail simplifié sur le serveur Web Cheetah-MS, les résultats sont signalés dans un bloc-notes Jupyter. Ici, nous démontrons les aspects techniques de la façon dont le Jupyter Notebook peut être étendu pour une analyse plus approfondie.
Les interactions protéine-protéine peuvent être difficiles à étudier tout en fournissant des informations sur le fonctionnement des systèmes biologiques. La spectrométrie de masse à réticulation ciblée (TX-MS), une méthode combinant la modélisation de la structure des protéines quaternaires et la spectrométrie de masse à réticulation chimique, crée des modèles de structure de haute précision à l’aide de données obtenues à partir d’échantillons complexes et non fractionnés. Cela élimine l’un des principaux obstacles à l’analyse de la structure des complexes protéiques, car les protéines d’intérêt n’ont plus besoin d’être purifiées en grande quantité. Le serveur Web Cheetah-MS a été développé pour rendre la version simplifiée du protocole plus accessible à la communauté. Compte tenu des données MS/MS en tandem, Cheetah-MS génère un Jupyter Notebook, un rapport graphique résumant les résultats d’analyse les plus importants. L’extension du Jupyter Notebook peut fournir des informations plus approfondies et mieux comprendre le modèle et les données de spectrométrie de masse qui le soutiennent. Le protocole technique présenté ici présente certaines des extensions les plus courantes et explique quelles informations peuvent être obtenues. Il contient des blocs pour aider à analyser les données d’acquisition MS/MS en tandem et l’impact global des XL détectées sur les modèles quaternaires rapportés. Le résultat de ces analyses peut être appliqué aux modèles structurels intégrés dans l’ordinateur portable à l’aide de NGLView.
Les interactions protéine-protéine sous-tendent la structure et la fonction des systèmes biologiques. Avoir accès aux structures quaternaires des protéines peut fournir des informations sur la façon dont deux protéines ou plus interagissent pour former des structures d’ordre élevé. Malheureusement, l’obtention de structures quaternaires reste difficile; cela se reflète dans le nombre relativement faible d’entrées1 de la banque de données sur les protéines (PDB) contenant plus d’un polypeptide. Les interactions protéine-protéine peuvent être étudiées avec des technologies telles que la cristallographie aux rayons X, la RMN et la cryo-EM, mais l’obtention d’une quantité suffisante de protéines purifiées dans des conditions où les méthodes peuvent être appliquées peut prendre beaucoup de temps.
La spectrométrie de masse à réticulation chimique a été développée pour obtenir des données expérimentales sur les interactions protéine-protéine avec moins de restrictions sur la préparation des échantillons, car la spectrométrie de masse peut être utilisée pour acquérir des données sur des échantillons arbitrairement complexes 2,3,4,5,6,7,8,9 . Cependant, la nature combinatoire de l’analyse des données et le nombre relativement faible de peptides réticulés exigent que les échantillons soient fractionnés avant l’analyse. Pour remédier à cette lacune, nous avons développé TX-MS, une méthode qui combine la modélisation informatique avec la spectrométrie de masse de réticulation chimique10. TX-MS peut être utilisé sur des échantillons arbitrairement complexes et est significativement plus sensible par rapport aux méthodesprécédentes 10. Il y parvient en notant toutes les données associées à une interaction protéine-protéine donnée sous forme d’ensemble au lieu d’interpréter chaque spectre de SEP indépendamment. TX-MS utilise également jusqu’à trois protocoles d’acquisition de SEP différents : MS1 haute résolution (hrMS1), acquisition dépendante des données (DDA) et acquisition indépendante des données (DIA), offrant ainsi la possibilité d’identifier un peptide réticulé en combinant plusieurs observations. Le flux de travail de calcul TX-MS est complexe pour plusieurs raisons. Premièrement, il s’appuie sur plusieurs logiciels d’analyse de la SEP 11,12,13 pour créer des modèles de structure protéique14,15. Deuxièmement, la quantité de données peut être considérable. Troisièmement, l’étape de modélisation peut consommer des quantités importantes de puissance de traitement informatique.
Par conséquent, TX-MS est mieux utilisé comme un flux de travail de calcul automatisé et simplifié via le serveur Web Cheetah-MS16 qui s’exécute sur de grandes infrastructures de calcul telles que des nuages informatiques ou des clusters. Pour faciliter l’interprétation des résultats, nous avons produit un Jupyter Notebook17 interactif. Ici, nous montrons comment le rapport Jupyter Notebook peut être étendu pour produire une analyse plus approfondie d’un résultat donné.
Les flux de travail informatiques modernes sont souvent complexes, avec de multiples outils de nombreux fournisseurs différents, des interdépendances complexes, des volumes de données élevés et des résultats à multiples facettes. Par conséquent, il est de plus en plus difficile de documenter avec précision toutes les étapes nécessaires pour obtenir un résultat, ce qui rend difficile la reproduction du résultat donné. Ici, nous démontrons une stratégie générale qui combine l’automatisation et la facilité d’un flux de travail automatisé qui produit un rapport générique, avec la flexibilité de personnaliser le rapport de manière reproductible.
Trois conditions doivent être remplies pour que le protocole fonctionne: premièrement, les protéines sélectionnées pour l’analyse doivent interagir de manière à ce que l’expérience de réticulation chimique puisse produire des espèces réticulées à une concentration suffisamment élevée pour être détectées par le spectromètre de masse; différents spectromètres de masse ont différents niveaux de détection et dépendent également du protocole d’acquisition ainsi que du choix du réactif de réticulation. La version actuelle du protocole TX-MS ne permet que le DSS, un réactif de réticulation homobifonctionnel lysine-lysine. Néanmoins, cette limitation est principalement due à la possibilité que l’étape d’apprentissage automatique doive être ajustée pour d’autres réactifs. Cette limitation a été améliorée dans le serveur Web Cheetah-MS car deux autres réactifs de réticulation peuvent être envisagés, mais tous les trois sont des réactifs non clivables. Deuxièmement, les deux protéines doivent soit avoir une structure déterminée expérimentalement, soit être modélisées à l’aide de techniques de modélisation comparative ou de techniques de novo . Toutes les protéines ne peuvent pas être modélisées, mais une combinaison de logiciels améliorés et d’un dépôt constant de structures expérimentales dans l’APB augmente le nombre de protéines pouvant être modélisées. Troisièmement, les protéines en interaction doivent rester suffisamment similaires dans leurs états liés et non liés pour que les algorithmes d’amarrage utilisés par TX-MS et Cheetah-MS puissent créer des structures quaternaires de qualité adéquate pour permettre la notation. Cette exigence est relativement vague, car la qualité acceptable dépend fortement du système, où les protéines plus petites de structure connue sont généralement plus faciles à comparer que les protéines plus grandes de structure inconnue.
En cas de résultat négatif, vérifiez d’abord que TX-MS a trouvé des intra-liens, des réticulations entre résidus qui font partie de la même chaîne polypeptidique. Si aucun n’est découvert, l’explication la plus probable est que quelque chose s’est mal passé avec la préparation de l’échantillon ou l’acquisition des données. Si plusieurs contraintes de distance ne prennent pas en charge les modèles, inspectez visuellement les modèles pour vous assurer que la conformation est soutenue par des résidus réticulés. Il n’y a pas de moyen évident de faire pivoter l’un des interacteurs sans perturber au moins une liaison croisée. S’il y a des réticulations plus longues que la distance autorisée pour le réactif de réticulation donné, essayez d’améliorer la modélisation des interacteurs en incorporant des données de réticulation.
Il est possible d’utiliser d’autres applications logicielles pour obtenir des résultats équivalents à condition que la sensibilité du logiciel choisi soit comparable à la sensibilité de TX-MS. Par exemple, il existe des versions en ligne de RosettaDock, HADDOCK et autres. Il est également possible d’analyser des données de réticulation chimique via xQuest/xProphet 5,6, plink7 et SIM-XL26.
Nous appliquons continuellement TX-MS et Cheetah-MS aux nouveaux projets 27,28,29, améliorant ainsi les rapports produits par ces approches pour permettre une analyse plus détaillée des résultats sans agrandir les rapports.
The authors have nothing to disclose.
Ce travail a été soutenu par la Fondation de Knut et Alice Wallenberg (subvention n° 2016.0023) et le Fonds national suisse de la recherche scientifique (subvention n° 2016.0023) P2ZHP3_191289). En outre, nous remercions S3IT, Université de Zurich, pour son infrastructure informatique et son support technique.
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |