ينشئ قياس الطيف الكتلي المستهدف المتقاطع نماذج بنية البروتين الرباعية باستخدام بيانات قياس الطيف الكتلي التي تم الحصول عليها باستخدام ما يصل إلى ثلاثة بروتوكولات اكتساب مختلفة. عند التنفيذ كسير عمل مبسط على خادم الويب Cheetah-MS ، يتم الإبلاغ عن النتائج في دفتر ملاحظات Jupyter. هنا ، نوضح الجوانب الفنية لكيفية توسيع Jupyter Notebook لإجراء تحليل أكثر تعمقا.
يمكن أن تكون التفاعلات بين البروتين والبروتين صعبة الدراسة ولكنها توفر رؤى حول كيفية عمل الأنظمة البيولوجية. يعمل قياس الطيف الكتلي المستهدف المتقاطع (TX-MS) ، وهو طريقة تجمع بين نمذجة بنية البروتين الرباعية وقياس الطيف الكتلي الكيميائي المتقاطع ، على إنشاء نماذج بنية عالية الدقة باستخدام البيانات التي تم الحصول عليها من عينات معقدة وغير مجزأة. هذا يزيل واحدة من العقبات الرئيسية أمام تحليل بنية البروتين المعقدة لأن البروتينات ذات الأهمية لم تعد بحاجة إلى تنقيتها بكميات كبيرة. تم تطوير خادم الويب Cheetah-MS لجعل النسخة المبسطة من البروتوكول أكثر سهولة للمجتمع. بالنظر إلى بيانات MS / MS جنبا إلى جنب ، يقوم Cheetah-MS بإنشاء دفتر ملاحظات Jupyter ، وهو تقرير رسومي يلخص أهم نتائج التحليل. يمكن أن يؤدي توسيع Jupyter Notebook إلى الحصول على رؤى أكثر تعمقا وفهم أفضل للنموذج وبيانات قياس الطيف الكتلي التي تدعمه. يوضح البروتوكول التقني المعروض هنا بعض الامتدادات الأكثر شيوعا ويشرح المعلومات التي يمكن الحصول عليها. وهو يحتوي على كتل للمساعدة في تحليل بيانات اكتساب MS / MS جنبا إلى جنب والتأثير العام ل XLs المكتشفة على النماذج الرباعية المبلغ عنها. يمكن تطبيق نتيجة هذه التحليلات على النماذج الهيكلية المضمنة في دفتر الملاحظات باستخدام NGLView.
تدعم التفاعلات بين البروتين والبروتين بنية ووظيفة الأنظمة البيولوجية. يمكن أن يوفر الوصول إلى الهياكل الرباعية للبروتينات رؤى حول كيفية تفاعل بروتينين أو أكثر لتشكيل هياكل عالية الترتيب. ومما يؤسف له أن الحصول على هياكل رباعية لا يزال يشكل تحديا؛ وينعكس هذا في العدد الصغير نسبيا من إدخالات بنك بيانات البروتين (PDB)1 التي تحتوي على أكثر من بولي ببتيد واحد. يمكن دراسة التفاعلات بين البروتين والبروتين باستخدام تقنيات مثل علم البلورات بالأشعة السينية والرنين المغناطيسي النووي و cryo-EM ، ولكن الحصول على كمية كافية من البروتين النقي في ظل الظروف التي يمكن فيها تطبيق الطرق يمكن أن يستغرق وقتا طويلا.
تم تطوير قياس الطيف الكتلي الكيميائي المتقاطع للحصول على بيانات تجريبية عن تفاعلات البروتين والبروتين مع قيود أقل على إعداد العينات حيث يمكن استخدام مطياف الكتلة للحصول على بيانات عن عينات معقدة بشكل تعسفي2،3،4،5،6،7،8،9 . ومع ذلك، فإن الطبيعة التوافقية لتحليل البيانات والعدد الصغير نسبيا من الببتيدات المترابطة تتطلب تجزئة العينات قبل التحليل. لمعالجة هذا القصور ، قمنا بتطوير TX-MS ، وهي طريقة تجمع بين النمذجة الحسابية وقياس الطيف الكتلي الكيميائي المتقاطع10. يمكن استخدام TX-MS على عينات معقدة بشكل تعسفي وهو أكثر حساسية بكثير مقارنة بالطرق السابقة10. وهو يحقق ذلك عن طريق تسجيل جميع البيانات المرتبطة بتفاعل معين بين البروتين والبروتين كمجموعة بدلا من تفسير كل طيف MS بشكل مستقل. يستخدم TX-MS أيضا ما يصل إلى ثلاثة بروتوكولات مختلفة لاكتساب MS: MS1 عالي الدقة (hrMS1) ، والاستحواذ المعتمد على البيانات (DDA) ، والاستحواذ المستقل عن البيانات (DIA) ، مما يوفر فرصا لتحديد الببتيد المتقاطع من خلال الجمع بين ملاحظات متعددة. سير العمل الحسابي TX-MS معقد لعدة أسباب. أولا ، يعتمد على برامج تحليل MS متعددة11،12،13 لإنشاء نماذج بنية البروتين14،15. ثانيا ، يمكن أن تكون كمية البيانات كبيرة. ثالثا ، يمكن أن تستهلك خطوة النمذجة كميات كبيرة من قوة معالجة الكمبيوتر.
وبالتالي ، من الأفضل استخدام TX-MS كسير عمل حسابي تلقائي ومبسط من خلال خادم الويب Cheetah-MS16 الذي يعمل على البنى التحتية الحسابية الكبيرة مثل سحب الكمبيوتر أو المجموعات. لتسهيل تفسير النتائج ، أنتجنا دفتر Jupyter Notebook17 التفاعلي. هنا ، نوضح كيف يمكن توسيع تقرير Jupyter Notebook لتقديم تحليل أكثر تعمقا لنتيجة معينة.
غالبا ما تكون مهام سير العمل الحسابية الحديثة معقدة ، مع أدوات متعددة من العديد من البائعين المختلفين ، والاعتماد المتبادل المعقد ، وأحجام البيانات العالية ، والنتائج متعددة الأوجه. ونتيجة لذلك، أصبح من الصعب على نحو متزايد توثيق جميع الخطوات المطلوبة للحصول على نتيجة بدقة مما يجعل من الصعب استنساخ النتيجة المعطاة. هنا ، نعرض استراتيجية عامة تجمع بين أتمتة وسهولة سير العمل الآلي الذي ينتج تقريرا عاما ، مع المرونة في تخصيص التقرير بطريقة قابلة للتكرار.
ويلزم الوفاء بثلاثة متطلبات لكي يعمل البروتوكول: أولا، تحتاج البروتينات المختارة للتحليل إلى التفاعل بطريقة تمكن تجربة الربط المتبادل الكيميائي من إنتاج أنواع متقاطعة بتركيز عال بما فيه الكفاية ليتم اكتشافها بواسطة مطياف الكتلة؛ وثانيا، ينبغي أن تتفاعل البروتينات المختارة للتحليل بطريقة تمكن تجربة الربط المتبادل الكيميائي من إنتاج أنواع مترابطة بتركيز عال بما فيه الكفاية بحيث يمكن أن يكتشفها مطياف الكتلة؛ وثانيا، ينبغي أن تتفاعل البروتينات المختارة للتحليل بطريقة تمكن تجربة الربط المتبادل الكيميائية من إنتاج أنواع مترابطة بتركيز عال بما فيه الكفاية بحيث يمكن كشفها بواسطة مطياف الكتلة؛ وثانيا، ينبغي أن تتفاعل البروتينات المختارة للتحليل بطريقة تمكن تجربة الربط المتبادل الكيميائي من إنتاج أنواع مترابطة بتركيز عال بما فيه الكفاية بحيث يمكن كشف تحتوي أجهزة قياس الطيف الكتلي المختلفة على مستويات مختلفة من الكشف وتعتمد أيضا على بروتوكول الاكتساب بالإضافة إلى اختيار الكاشف المتبادل. يسمح الإصدار الحالي من بروتوكول TX-MS فقط ب DSS ، وهو كاشف ربط متجانس بين ليسين وليسين ومتعدد الوظائف. ومع ذلك ، فإن هذا القيد يرجع في المقام الأول إلى احتمال أن خطوة التعلم الآلي ستحتاج إلى تعديل للكواشف الأخرى. تم تحسين هذا القيد في خادم الويب Cheetah-MS حيث يمكن النظر في كاشفين آخرين متقاطعين ، ولكن الثلاثة كلها كواشف غير قابلة للانقسام. ثانيا ، يحتاج البروتينان إما إلى بنية محددة تجريبيا أو أن يتم نمذجتهما باستخدام تقنيات النمذجة المقارنة أو تقنيات de novo . لا يمكن نمذجة جميع البروتينات ، ولكن مزيجا من البرامج المحسنة والترسب المستمر للهياكل التجريبية في PDB يوسع عدد البروتينات التي يمكن نمذجتها. ثالثا ، يجب أن تظل البروتينات المتفاعلة متشابهة بما فيه الكفاية في حالاتها المرتبطة وغير المرتبطة بحيث يمكن لخوارزميات الالتحام المستخدمة من قبل TX-MS و Cheetah-MS إنشاء هياكل رباعية ذات جودة كافية لتمكين التسجيل. هذا الشرط غامض نسبيا ، حيث أن الجودة المقبولة تعتمد بشكل كبير على النظام ، حيث تكون البروتينات الأصغر ذات البنية المعروفة أسهل عموما في المقارنة من البروتينات الأكبر ذات البنية غير المعروفة.
في حالة وجود نتيجة سلبية ، تحقق أولا من أن TX-MS وجد روابط داخلية ، روابط متقاطعة بين المخلفات التي تشكل جزءا من نفس سلسلة polypeptide. إذا لم يتم اكتشاف أي منها ، فإن التفسير الأكثر ترجيحا هو أن هناك خطأ ما حدث في إعداد العينة أو الحصول على البيانات. إذا كانت قيود المسافة المتعددة لا تدعم النماذج، فقم بفحص النماذج بصريا للتأكد من أن التشكيل مدعوم ببقايا متقاطعة. لا توجد طريقة واضحة لمحور أحد الجهات الفاعلة دون تعطيل رابط متقاطع واحد على الأقل. إذا كانت هناك روابط متقاطعة أطول من المسافة المسموح بها للكاشف المتقاطع المحدد ، فحاول تحسين نمذجة الجهات الفاعلة البينية من خلال دمج بيانات الربط المتبادل.
من الممكن استخدام تطبيقات برمجية بديلة لتحقيق نتائج مكافئة بشرط أن تكون حساسية البرنامج المختار قابلة للمقارنة مع حساسية TX-MS. على سبيل المثال ، هناك إصدارات عبر الإنترنت من RosettaDock و HADDOCK وغيرها. من الممكن أيضا تحليل بيانات الربط الكيميائي من خلال xQuest / xProphet 5,6 و plink7 و SIM-XL26.
نحن نطبق باستمرار TX-MS و Cheetah-MS على المشاريع الجديدة27،28،29 ، وبالتالي تحسين التقارير التي تنتجها هذه الأساليب للسماح بتحليل أكثر تفصيلا للنتائج دون جعل التقارير أكبر.
The authors have nothing to disclose.
تم دعم هذا العمل من قبل مؤسسة كنوت وأليس والنبرغ (رقم المنحة 2016.0023) والمؤسسة الوطنية السويسرية للعلوم (رقم المنحة. P2ZHP3_191289). بالإضافة إلى ذلك ، نشكر S3IT ، جامعة زيورخ ، على بنيتها التحتية الحاسوبية ودعمها الفني.
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |