Summary

تحليلات البروتيوميات الجماعي القائم على قياس الطيف الكتلي باستخدام قاعدة البيانات أوبينبروت لكشف النقاب عن البروتينات رواية مترجمة من إطارات القراءة المفتوحة غير متعارف عليه

Published: April 11, 2019
doi:

Summary

أوبينبروت هي قاعدة بيانات يمكن الوصول إليها بحرية يفرض نموذجا بوليسيسترونيك الجينومات حقيقية النواة. نقدم هنا، على بروتوكول لاستخدام قواعد البيانات أوبينبروت عند استجواب datasets الكتلي. أوبينبروت باستخدام قاعدة البيانات لتحليل التجارب البروتين يسمح باكتشاف الرواية والبروتينات يمكن الكشف عنها سابقا.

Abstract

الشرح الجينوم المركزي لبحوث البروتين اليوم كما أنه يرسم الخطوط العريضة للمناظر الطبيعية البروتين. النماذج التقليدية لفتح قراءة التعليق التوضيحي الإطار (ORF) فرض معايير تعسفية اثنين: طول أدنى من 100 codons و ORF واحد كل نسخة. إلا أن عدد متزايد من الدراسات تقرير تعبير البروتينات من يزعم أن الترميز غير المناطق، تحدي دقة الحالية الجينوم الشروح. هذه الرواية تم العثور على البروتينات المشفرة أما داخل الترميز غير الكشف، 5 ‘أو 3’ المناطق غير مترجمة (تحيلها) مرناس، أو تداخل في تسلسل ترميز معروفة (CDS) في بديل ORF. أوبينبروت هو أول قاعدة بيانات التي تفرض نموذج بوليسيسترونيك للجينوم حقيقية النواة، مما يسمح الشرح Orf متعددة كل نسخة. أوبينبروت يمكن الوصول إليها بحرية وعروض الأسبوعية المخصصة لتسلسل البروتين عبر الأنواع 10. أوبينبروت باستخدام قاعدة بيانات لإجراء التجارب على البروتين يمكن اكتشاف البروتينات الرواية ويسلط الضوء على طبيعة الجينات حقيقية النواة بوليسيسترونيك. حجم قاعدة بيانات أوبينبروت (توقع جميع البروتينات) كبيرة وتحتاج إلى أن تؤخذ في الاعتبار للتحليل. ومع ذلك، مع إعدادات معدل (FDR) اكتشاف كاذبة المناسبة أو استخدام قاعدة بيانات أوبينبروت المقيدة، سيكتسب المستخدمين نظرة أكثر واقعية للمناظر الطبيعية البروتين. وعموما، أوبينبروت هو أداة متاحة بحرية تعزز الاكتشافات البروتين.

Introduction

العقود الماضية، أصبحت البروتيوميات الكتلي (MS-) على أساس أسلوب الذهبي لفك بروتيوميس للخلايا حقيقية النواة1،2،3،،من45. يعتمد هذا الأسلوب على شروح الجينوم الحالية لإنشاء قاعدة بيانات تسلسل بروتين مرجعية التي تحدد نطاق إمكانيات6،،من78. ومع ذلك، عقد الجينوم الشروح معايير تعسفية للشرح ORF، كحد أدنى لطول 100 codons و ORF واحد كل نسخة9،10. عدد متزايد من الدراسات تحدي نموذج التعليق التوضيحي الحالي وتقرير الاكتشافات أونانوتاتيد Orf الوظيفية في جينومات التوكسينات8،11،،من1213، 14. تم العثور على الكشف يزعم أن الترميز غير مرمز في هذه البروتينات رواية، في 5 ‘أو 3’ أهمل المناطق (UTR) مرناس، أو تداخل تسلسل الترميز المتعارف عليه (توخي) في إطار بديل. على الرغم من أن معظم هذه الاكتشافات قد سار، فإنها تظهر التحذيرات الحالية الجينوم الشروح وطبيعة الجينات التوكسينات8بوليسيسترونيك.

وهنا نسلط الضوء على استخدام قواعد البيانات أوبينبروت للبروتينات على أساس مرض التصلب العصبي المتعدد. أوبينبروت هو أول قاعدة بيانات لإجراء نموذج توضيحي بوليسيسترونيك ترانسكريبتوميس حقيقية النواة. متاحة بحرية في www.openprot.org15. وتوقع نسبة هذه Orf ستكون عشوائية وغير وظيفية، وهذا هو السبب أوبينبروت يتراكم الأدلة التجريبية والوظيفية لزيادة الثقة. وتشمل الأدلة التجريبية التعبير البروتين (بواسطة MS) وترجمة الأدلة (بالتنميط الريبوسوم)15. وتشمل الأدلة الفنية أورثولوجي البروتين (مع المذعور في مثل النهج) والمجال الوظيفي التنبؤ15.

أوبينبروت يوفر إمكانية تحميل العديد من قواعد البيانات، من التي تحتوي على فقط من البروتينات مدعمة على نحو جيد بقواعد بيانات مصنوعة خصيصا. وسوف نقدم هنا، خط أنابيب لاستخدام قواعد البيانات أوبينبروت وسوف نقدم أفكاراً في أي قاعدة بيانات لاختيار دراسة تجريبية والهدف. خط الأنابيب تحليل البروتيوميات المعروضة هنا معتمد من قبل إطار غالاكسي الوصول المفتوح وسهلة الاستخدام، ولكن قواعد البيانات التي يمكن أن تعمل مع أي سير العمل16،،من1718. وسوف نقدم أيضا كيفية استخدام موقع أوبينبروت لجمع المزيد من المعلومات عن رواية البروتينات الكشف عنها بواسطة السيدة أوبينبروت استخدام قواعد البيانات سيتم تقديم عرض أكثر شمولاً من المناظر الطبيعية البروتين وسوف تعزز الاكتشافات البروتيوميات والمؤشرات الحيوية في بطريقة أكثر انتظاما من الطرق الحالية.

يبرز هذا البروتوكول استعمال قواعد البيانات أوبينبروت15 عند استجواب MS مجموعات البيانات؛ أنها لن تعيد النظر في التصميم التجربة نفسها، والتي كانت شاملة استعرض20،،من2122في أماكن أخرى. في محاولة منها لتبقى مفتوحة المصدر تماما، هو البروتوكول متاح بحرية (S1 المواد التكميليةS4). لتسهيل القراءة، يتم تعريف جميع المصطلحات المستخدمة في أوبينبروت، وهنا في جميع أنحاء هذا البروتوكول في الجدول 1.

Protocol

1-أوبينبروت تحميل قاعدة البيانات ملاحظة: قواعد بيانات مخصصة استناداً إلى بيانات تسلسل الحمض النووي الريبي على سبيل المثال يمكن أيضا الحصول عليها، وهو الإجراء بالتفصيل في القسم الثاني من هذا البروتوكول. إذا كانت هناك حاجة إلى قاعدة بيانات مخصصة، يرجى الانتقال إلى القسم التالي. انتقل إلى موقع الويب أوبينبروت: www.openprot.org وفتح الصفحة الأسبوعية باستخدام الارتباط من القائمة أعلى الصفحة. انقر فوق أنواع الفائدة استناداً إلى تحليل البيانات التجريبية. انقر فوق نوع البروتين المطلوب.ملاحظة: أوبينبروت ويوفر التصنيفات الثلاث: ريفبروت، إيسوفورمس، والتبروت. كما هو مبين في الشكل 1، سوف تختلف هذه المعلمة على هدف البحث. انقر فوق ريفبروت وحدها لإنشاء الملفات التي تحتوي على بروتينات معروفة فقط. انقر فوق التبروت وإيسوفورمس لإنشاء الملفات التي تحتوي على بروتينات رواية فقط-أما isoforms الرواية من البروتينات المعروفة (إيسوفورمس) أو ترميز ببديل ORF (التبروتس). يرجى ملاحظة أن أوبينبروت يفرض حد أدنى لطول ORF 30 codons15. انقر فوق التبروتس وإيسوفورمس وريفبروتس لإنشاء ملفات تحتوي على جميع أنواع البروتين الموجودة في قاعدة البيانات أوبينبروت-البروتينات المعروفة ورواية. إذا كان متوفراً، انقر فوق التعليق التوضيحي من البروتين التي يتم رسمها في تسلسل.ملاحظة: يقدم أوبينبروت المناظر الطبيعية البروتين أكثر شمولاً عن طريق الجمع بين شروح متعددة. شروح الترنسكربيتوم يكون تداخل الحد أدنى؛ وهكذا التعليق التوضيحي المحدد يمكن أن تؤثر تأثيراً كبيرا على15،الشخصية تصور البروتين23. انقر فوق مستوى دعم الأدلة اللازمة للنظر في البروتين. كما هو مبين في الشكل 1، سوف تختلف هذه المعلمة على هدف البحث. انقر فوق الحد الأدنى من الببتيدات فريدة من نوعها اثنين تم الكشف عن لإنشاء الملفات التي تحتوي على فقط البروتينات الأكثر ثقة.ملاحظة: يعتبر معياراً لاثنين من الببتيدات فريدة من نوعها حاليا إلى معيار الذهب في البروتينات للتعبير البروتين. إذا كان تجريبي يهدف إلى الكشف عن البروتينات المعروفة ومدعمة على نحو جيد، من المستحسن استخدام هذه المعلمة. انقر فوق الحد الأدنى من الببتيدات فريدة من نوعها واحدة كشف لإنشاء الملفات التي تحتوي على البروتينات التي سبق وقد شوهدت مرة واحدة على الأقل بين التجارب الكتلي إعادة تحليلها بواسطة أوبينبروت.ملاحظة: هذا يسمح للنظر في مدة أقصر من التبروتس واحتمال أن البعض منهم قد تحتوي على8،الببتيد تريبتيك فريد واحد فقط11. انقر فوق كل توقع لإنشاء الملفات التي تحتوي على كل من التنبؤات أوبينبروت.ملاحظة: من المستحسن استخدام هذا الإعداد فقط إذا كان تجريبي يهدف إلى اكتشاف البروتينات رواية (الشكل 1). بعد ذلك الزيادة الكبيرة في مساحة البحث ويدعو أنبوب تكييف تحليل كما هو مبين أدناه7،15. انقر فوق تنسيق الملف المطلوب التحميل. لتحليل البروتين، اختر الملف فاستا (البروتين). يحتوي الملف التمهيدي على جميع المعلومات اللازمة بشأن تنسيق الملف. 2-مخصص تحميل قاعدة البيانات أوبينبروت ملاحظة: هذا المقطع تفاصيل كيفية الحصول على قاعدة بيانات مخصصة. إذا كانت هناك حاجة إلى لا قاعدة بيانات مخصصة، انتقل إلى المقطع التالي. اذهب إلى موقع أوبينبروت (www.openprot.org) وفتح صفحة البحث باستخدام الارتباط من القائمة أعلى الصفحة. انقر فوق أنواع الفائدة استناداً إلى البيانات التجريبية التي تم تحليلها. أدخل قائمة بالجينات أو النصوص للفائدة. عند استخدام قائمة بالجينات، أدخله في المربع الاستعلام الجينات . عند استخدام قائمة النصوص، إدخال في مربع نص الاستعلام. في الخانة أي أنه ينطبق على قاعدة البيانات المطلوبة. لا تنقر فوق أي مربع للحصول على جدول يحتوي على جميع أنواع البروتينات التي يدعمها أوبينبروت: ريفبروت، إيسوفورمس، والتبروتس. انقر فوق إظهار فقط من البروتينات مع الأدلة التجريبية للحصول على جدول يحتوي على جميع أنواع البروتينات (ريفبروتس وإيسوفورمس والتبروتس) التي تم الكشف عنها مرة واحدة على الأقل بمرض التصلب العصبي المتعدد و/أو للترجمة التي جمعت أدلة من الريبوسوم بيانات التعريف. وبالمثل، انقر فوق إظهار فقط البروتينات الكشف عنها بواسطة MS أو على إظهار فقط البروتينات الكشف عنها بواسطة التنميط الريبوسوم للحصول على جدول يحتوي على جميع أنواع البروتينات التي تم الكشف عنها مرة واحدة على الأقل بمرض التصلب العصبي المتعدد أو بواسطة الريبوسوم التنميط على التوالي. انقر فوق إظهار فقط التبروتس أو على إظهار فقط إيسوفورمس للحصول على جدول يتضمن فقط التبروتس أو إيسوفورمس فقط على التوالي. انقر فوق إظهار فقط التبروتس و إظهار فقط إيسوفورمس للحصول على جدول يحتوي على كلا النوعين من البروتينات.ملاحظة: كافة تركيبات من عوامل التصفية الممكنة. بمجرد أن يتم تعيين كافة المعلمات المطلوبة، انقر فوق بحث. سوف يظهر الإخراج الجدول أدناه حقول استعلام البحث. انقر فوق الزر تنزيل Fasta في الركن العلوي الأيمن لجدول الإخراج. سيؤدي هذا إلى إنشاء ملف فاستا يحتوي على جميع البروتينات الناتجة عن القائمة المستعلم عنها الجينات أو المحاضر. يرجى ملاحظة أنه لأسباب حسابية، يحمل أوبينبروت أقصى قدر عناصر 2,000 أن تساءل (الجينات أو محاضر) في وقت واحد. في حالة قائمة فوق هذا الحد، يمكن أن تولد fasta عدة ومتصلا ثم (كما هو مفصل أدناه)؛ أو ببساطة تحميل قاعدة البيانات أوبينبروت بأكملها وتصفية الملفات التي يتم الحصول عليها كما هو مطلوب. بن قائمة كاملة من الجينات أو المحاضر إلى القوائم الفرعية إدخالات 2,000 أو أقل. لكل قائمة فرعية، تحميل ملف فاستا كما هو موضح أعلاه (الخطوة 3، 3 إلى 3، 6). تسجيل الدخول إلى مثيل “غالاكسي الأوروبية” (أو أي حالة أخرى حيث تتوفر أدوات البروتيوميات)، https://usegalaxy.eu/. إنشاء محفوظات جديدة واستيراد كافة قواعد البيانات أوبينبروت التي تم تنزيلها (واحد لكل قائمة فرعية من الجينات أو المحاضر) بالنقر فوق الشعار تحميل في الجزء العلوي الأيسر من الشاشة. استخدام أداة Fasta دمج الملفات وتصفية تسلسل فريدة من نوعها وضعت من قبل المطورين جالاكسيب (https://github.com/galaxyproteomics/). حدد خيار دمج جميع فاستا وإدخال كافة قواعد البيانات أوبينبروت التي تم استيرادها.ملاحظة: كل أداة يمكن البحث باستخدام مربع الاستعلام على الجانب الأيسر من الشاشة حدد الخيار الانضمام فقط لتقييم الوحدة تسلسل ونسخ القاعدة الظاهر معرف أوبينبروت (>(.*) \ |)، ثم انقر فوق Execute. لاحظ أن كافة الملفات قد تم متصلاً ضمن ملف Fasta فريدة من نوعها مع لا التكرار الذي يظهر الآن في لوحة التاريخ على الجانب الأيمن من الشاشة. وهذا يشكل قاعدة بيانات العمل. 3. التعامل مع قاعدة البيانات ملاحظة: من الآن فصاعدا، سيتم استخدام منصة غالاكسي، ولكن يمكن تطبيق نفس المبادئ على البرامج الأخرى من البروتين. تسجيل الدخول إلى مثيل “غالاكسي الأوروبية” (أو أي حالة أخرى حيث تتوفر أدوات البروتيوميات)، https://usegalaxy.eu/. إنشاء محفوظات جديدة واستيراد قاعدة البيانات أوبينبروت التي تم تنزيلها بالنقر على الشعار تحميل في الجزء العلوي الأيسر من الشاشة. انتقل إلى صفحة سير العمل واستيراد سير العمل “معالجة قاعدة البيانات” (S1 المواد التكميلية) بالنقر فوق الشعار تحميل في الجزء العلوي الأيسر من لوحة الأوسط. انقر فوق تشغيل سير العمل ، وحدد قاعدة البيانات أوبينبروت المستوردة كإدخال.ملاحظة: سيتم إلحاقها بالمستودع كرابومي فاستا أوبينبروت سير العمل هذا وتوليد شرك تسلسل (تسلسل عكسي)24. إذا كان المطلوب هو قائمة شرك المراوغة، فإنه يمكن أن يتم عن طريق تغيير هذه المعلمة على أداة ديكويداتاباسي. إعادة تسمية الملف فاستا التي تم الحصول عليها إلى شيء مفيد. قاعدة البيانات جاهزة للاستخدام لتحليل البروتينات. 4-الكتلي ملف إعداد ملاحظة: معظم الأدوات المتاحة في حالات غالاكسي البروتيوميات استخدام تنسيق مزمل، ومحركات البحث الببتيد تفضل البيانات في وضع centroid. افتح أداة مسكونفيرت متاحة بحرية من جناح بروتيوويزارد وتحميل ملف البيانات ليتم تحليلها25. اختر الدليل من أجل الإخراج وتنسيق الملف المطلوب إلى مزمل. تعيين ذروة اختيار عامل تصفية باستخدام خوارزمية المويجات على أساس (CWT) على الصعيدين MS1 و MS2، والبدء في تحويل26. 5-الببتيد والبروتين الهوية/الكمي ملاحظة: هذا الجزء من خط الأنابيب يستخدم أدوات من جناح أوبينمس، إطار تنوعاً وسهلة الاستخدام18. تسجيل الدخول إلى مثيل “غالاكسي الأوروبية” (أو أي حالة أخرى حيث تتوفر أدوات البروتيوميات)، https://usegalaxy.eu/. إنشاء تاريخ جديد ونقل قاعدة البيانات التي تم إنشاؤها مسبقاً (الخطوة 3، 5) إلى هذا التاريخ الجديد مع سحب وإفلات. استيراد ملف البيانات المحولة مزمل (الخطوة 4، 3) بالنقر فوق الشعار تحميل في الجزء العلوي الأيسر من الشاشة. انتقل إلى صفحة سير العمل واستيراد سير العمل المطلوب بالنقر على الشعار تحميل في الجزء العلوي الأيسر من لوحة الأوسط.ملاحظة: يتم بطريقة مختلفة تصميم تجارب مرض التصلب العصبي المتعدد استناداً إلى الإخراج النهائي المطلوب. مهام سير العمل منصوص عليها هنا تصميمين متكررة: تحديد البروتين والبروتين الكمي استناداً إلى النظائر المستقرة وسم (SIL). ومع ذلك، مثيل المجرة تحتوي على العديد من الأدوات الأخرى التي من شأنها دعم أنواع أخرى من البروتين تحليلات27،28. لتصميم تحديد بروتين، استيراد سير العمل المنصوص عليه في S2 المواد التكميلية. عند استخدام سير العمل هذا، يرجى عدم استخدام ضغط زليب عند تحويل الملفات الخاصة بك (الخطوة 4، 2) من أجل إجراء تقييم كمي بروتين على أساس تصميم التوسيم النظائر المستقرة، استيراد سير العمل المنصوص عليه في العنوان S3 المواد التكميلية. حدد تشغيل سير العمل واستعراض معلمات مختلفة. حدد ملف البيانات المستوردة مزمل كمدخلات، وقاعدة البيانات التي تم إنشاؤها مسبقاً (الخطوة 3، 5) كملف قاعدة البيانات فاستا. نظراً لسير العمل يستخدم X! البحث جنبا إلى جنب المحرك، واستيراد X! جنبا إلى جنب الافتراضي تكوين الملف (المتوفر في S4 المواد التكميلية)29 بالنقر فوق الشعار تحميل في الجزء العلوي الأيسر من الشاشة. سير العمل يستخدم محركات البحث متعددة (MS-GF + و X! جنبا إلى جنب). إلحاق محركات البحث الأخرى، أو اختيار واحد ببساطة عن طريق إضافة أو إزالة الأدوات من30،سير العمل31.ملاحظة: باستخدام محركات البحث متعددة يوصي بحيث أنه يزيد من حساسية وحساسية من تحليل32. من أجل مراعاة للزيادة الكبيرة في حجم عند استخدام قاعدة البيانات بأكملها أوبينبروت، استخدام فرانكلين روزفلت صرامة15. بشكل افتراضي، يتم تعيين سير العمل المتوفرة لنسبة 0.001% فرانكلين روزفلت، كافية لاستخدام قاعدة البيانات أوبينبروت بأكملها. لقواعد البيانات الأخرى، وهذا يمكن أن تعدل لأي القيمة المطلوبة.ملاحظة: تأكد من التكيف مع المعلمات من أدوات مختلفة اعتماداً على مطياف كتلة المستخدمة والبروتوكول التجريبي (خطأ أيون ويفتت السلائف، ثابتة والتعديلات متغير، إنزيم المستخدمة، إلخ.). بشكل اختياري، تحميل الإخراج لكل خطوة من خطوات سير العمل لتخزين أو تحليل مراقبة الجودة قبل النقر فوق الخطوة المختارة من لوحة السيرة، ثم النقر فوق حفظ الشعار الذي يظهر أسفل. 6-مراقبة الجودة ملاحظة: نظراً لأن البروتيوميات المستندة إلى MS هو نتيجة لعملية معقدة حيث كل خطوة يجب أن يكون الأمثل لإنتاج نتائج استنساخه، مراقبة الجودة إجراء ضروري في سير العمل33. قياسات عدة هي المعيار الموحد للأداء، مثل العدد من المباريات الطيف الببتيد (PSM)، العدد من الببتيدات التي تم تحديدها والبروتينات. تشغيل أداة معلومات الملف على الإخراج إيدفيلتير (مشار إليها باللون الأخضر في الشكل 2) لتوفير مثل هذه المقاييس. رغم أن ذلك لا ينطبق على كل تحديد، لا سيما مع مجموعات البيانات الكبيرة، ينبغي دائماً أن تقييم تقارير بروتينات رواية بعناية. التفتيش على نقاط البروتين وتغطية تسلسل والأطياف دعم إيجاد ذو أهمية حيوية. استخدام أداة توبفيو من إطار أوبينمس للقيام بذلك؛ وهي متاحة بحرية وموثقة توثيقاً جيدا18،،من3435. 7-أوبينبروت قاعدة البيانات التعدين ملاحظة: بمجرد تعريف ثقة بروتين الرواية التي تنبأت بها أوبينبروت (أرقام الانضمام بدءاً IP_ التبروتس و II_ لرواية Isoforms)، يمكن جمع المعلومات البيولوجية أكثر من موقع أوبينبروت15. انتقل إلى موقع الويب أوبينبروت: www.openprot.org وفتح صفحة البحث باستخدام الارتباط في القائمة أعلى الصفحة. انقر على هذه أنواع الفوائد (نفس واحد التي تم فيها تحديد البروتين) وأدخل رقم الانضمام البروتين في مربع الاستعلام البروتين . انقر فوق البحث وسوف يظهر جدول يحتوي على معلومات أساسية عن البروتين المستعلم عنها. خصائص الجدول: طول البروتين (بحمض أميني) والوزن الجزيئي (كاتشين) ونقطة isoelectric، دعم الأدلة التجريبية بمرض التصلب العصبي المتعدد أو الريبوسوم التنميط (ترجمة الأدلة، الشركة المصرية للاتصالات)، والتوقعات الوظيفية مثل توقع المجالات والبروتين أورثولوجي (عبر 10 الأنواع التي يدعمها أوبينبروت، v1.3). كما يتضمن الجدول معلومات عن الجينات ذات الصلة ونسخة وإضفاء الطابع المحلي على البروتين داخل النص. انقر على الرابط التفاصيل لجمع مزيد من المعلومات. حيث افتتح حديثا تحتوي الصفحة على مستعرض جينوم الذي يتركز على البروتين المستعلم عنها، ومعلومات مثل الجينوم والاحداثيات ترانسكريبتوميك ووجود كوزاك أو الترجمة ذات الكفاءة العالية الشروع في الموقع (TIS) عزر36، 37. انقر فوق الروابط من علامة التبويب معلومات، الحصول على البروتين أو تسلسل الحمض النووي على التوالي على البروتين أو الحمض النووي . تصفح معلومات مفصلة حول مرض التصلب العصبي المتعدد الأدلة، الريبوسوم التنميط الكشف وحفظها ونطاقات البروتين التي تم تحديدها بالنقر على علامات التبويب أعلى15.

Representative Results

تم تطبيق سير العمل المذكورة أعلاه إلى dataset MS متاح في38،مستودع فخر39. الدراسة الأصلية وضعت طريقة (إيميكسبرو)، باستخدام النظائر المستقرة وسم من الأحماض الأمينية في الخلية والثقافة (سيلك)، للقضاء على إيجابيات كاذبة من MS تنقية تقارب تجارب (AP-MS)38. وباختصار، تجربة AP-MS يتكون من استخدام الأجسام المضادة الخرز زمنياً لجلب بروتين الفائدة (الطعم) وفي التمثيلات (يفترس). ثم يهضم البروتينات التي تم جمعها وإعدادها لمرض التصلب العصبي المتعدد. طريقة إعداد العينة وإعدادات الأداة موصوفة في الدراسة الأصلية وعلى المستودع فخر (PXD004246). تحديا في هذه التجارب هو وفرة إيجابيات كاذبة، لا سيما من البروتينات ملزمة الخرز ولكن ليس الطعم. وهنا استخدمنا سيلاك لتوليد نسب النظائر المختلفة بين يفترس الحقيقية والمغلوطة: 3 مراقبة العينات (لا الطعم) المزروع في المتوسطة الخفيفة و 1 العينة معربا عن الطعم المزروع في المتوسطة الخفيفة 1 العينة معربا عن الطعم المزروع في متوسطة ثقيلة معالجة مع الخرز وكذلك تحليل الطيف الكتلي. مع هذا التصميم، والبروتينات غير محددة ملزمة الخرز سيكون نسبة 1:4؛ الثقيلة إلى النور عندما يفترس الحقيقي سيكون بنسبة 1:138. قمنا بإعادة تحليل بياناتها AP-مرض التصلب العصبي المتعدد باستخدام قاعدة بيانات أوبينبروت؛ الطعوم وشملت ثلاثة بروتينات الذاتية (PTPN14 و JIP3 و IQGAP1)، واثنين من البروتينات (RAF1 و RNF41) أعرب عن الإفراط. نظراً للتجارب التي تستخدم سيلك، تم استخدام سير العمل غالاكسي لتقدير البروتين (S3 المواد التكميلية، الشكل 2). وكان تشغيل سير العمل باستخدام قاعدة أوبينبروت كله (OpenProt_all) أو قاعدة بيانات أوبينبروت محدودة (OpenProt_2pep، بما في ذلك فقط البروتينات التي سبق الكشف عنها مع الحد ني الببتيدات فريدة من نوعها اثنين). والبروتين التحديد الكمي كانت جيدة واستنساخه عبر مختلف قواعد البيانات المستخدمة. كما هو موضح في الشكل 3، حددت معظم البروتينات المحددة في الورقة الأصلية أيضا في استخدام قاعدة البيانات OpenProt_2pep أو OpenProt_all (قائمة مفصلة متاحة في S5 المواد التكميلية). هذه النتيجة تبين أن خط الأنابيب الموصوفة هنا وأوبينبروت قواعد البيانات قادرة على إنتاج بروتين تحديد وتقدير حجم مماثل للإجراءات الحالية التي تستند إلى قواعد بيانات أونيبروتكب40. ومع ذلك، باستخدام قواعد البيانات أوبينبروت ميزة فريدة من نوعها تتيح الكشف عن الرواية والبروتينات يمكن الكشف عنها مسبقاً، كما هو موضح في هذه الحالة دراسة. وتم تحديد 11 مدعمة على نحو جيد من البروتينات (1 Isoform و 10 التبروتس)، ولكن حاليا لا المشروح في قواعد البيانات، عبر جميع مجموعات البيانات، مع ثقة من الببتيدات، استخدام قاعدة OpenProt_2pep (جميع البروتينات الانضمام، جنبا إلى جنب مع العدد من دعم الببتيدات، تتوفر في S5 المواد التكميلية). وتتيح قاعدة البيانات هذه الاستخدام % 1 التقليدية ما زالت فرانكلين روزفلت كزيادة مساحة البحث معتدلة. لم يتم تحديد هذه البروتينات 11 في الدراسة الأصلية كما كانت غائبة من قاعدة البيانات. تم اكتشاف البروتينات رواية 29 (16 isoforms و 13 التبروتس) عبر جميع مجموعات البيانات، مع ثقة من الببتيدات، استخدام قاعدة البيانات OpenProt_all (جميع الدول المنضمة في البروتين، جنبا إلى جنب مع العدد من دعم الببتيدات، هي S6 المواد التكميلية المتاحة في ). كما هو موضح في الشكل 3، فرانكلين صارمة الموصى به لا يؤثر في تعريفات البروتين الأكثر ثقة، على الرغم من أنه إنقاص العدد الإجمالي للبروتينات التي تم تحديدها. نسبيا لقاعدة البيانات OpenProt_2pep، عدد أكبر من البروتينات رواية يمكن ثقة تحديد. كل من هذه البروتينات رواية غائبة من قاعدة البيانات OpenProt_2pep. وهذا يسلط الضوء على الدور الحاسم لقاعدة البيانات الذي اخترته البروتيوميات المستندة إلى MS. تم اكتشاف البروتين رواية واحدة إينتيراكتور من البروتين RAF1 (IP_637643). استخدام هذا الموقع أوبينبروت، واحدة يمكن أن نرى أنه لم يتم اكتشاف هذا البروتين لا بمرض التصلب العصبي المتعدد ولا الريبوسوم التنميط حتى الآن (أوبينبروت v1.3). البروتين الأحماض الأمينية 46 طويلة ويمكن أن تعطي فقط هما الببتيدات فريدة عند الهضم تريبتيك. الببتيد اكتشفت في RAF1 AP-MS dataset (جزء 18) كان طائفة ذات نوعية جيدة، كما هو مبين في الشكل 4، وعرض نسبة الثقيلة إلى النور 1,09. يتم ترميز البروتين في الجينات NANOGNBP1 ، وبسيودوجيني من نانوجنب. تم الكشف عن النسخة (ENST00000448444)، المشروح حاليا كغير الترميز، عبر الأنسجة عدة وفقا للمدخل جت40. البروتين: يحتوي على مجال وظيفي المتوقعة المرتبطة بالحمض النووي ملزم (انتقال الجينات علم الوجود: 0003677)41. الشكل 1 : قاعدة بيانات الاختيار بالنسبة للمخطط تحليلات البروتيوميات. تحليلات البيانات مرض التصلب العصبي المتعدد، ولا سيما اختيار قاعدة البيانات، يعتمد على أهداف البحث. وترد ثلاثة أهداف مشتركة في الزرقاء (خط أنابيب البروتين الكلاسيكية) والأخضر (البروتين حصرية البحث) والبرتقالي (اكتشاف البروتين). كل هدف من الأهداف يعتمد على قاعدة بيانات مناسبة وخطوط الأنابيب. يمكن أن تستخدم أداة تعريف واحد البروتيوميات حصرية وكلاسيكية خطوط الأنابيب. لخط الأنابيب اكتشاف البروتين، نوصي بشدة باستخدام محركات متعددة في تحديد الهوية. يتم الإشارة إلى FDRs الموصى بها باللون الأحمر، وأحجام قاعدة بيانات البروتين في مربعات رمادية. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم- الشكل 2 : تمثيل رسومي لسير العمل غالاكسي المستخدمة. التمثيل خطوة بخطوة لسير العمل تحليل البروتين المستخدمة لتحليل جديد ل بيانات ايكرمان et al.38. يتم الإشارة إلى ملفات الإدخال والبحث الببتيد والبروتين القياس الكمي بمربعات البرتقال. مربعات زرقاء تتوافق مع الأدوات المستخدمة ومربعات رمادية تتوافق مع ملفات الإخراج التي تم إنشاؤها. محركات بحث مختلفة (MS-GF + و X! Tandem) ترد بألوان مختلفة (الأحمر والأرجواني على التوالي)، فضلا عن الأسهم التي تشير إلى تلك المدخلات اللازمة والنواتج. المربع الأخضر يسلط الضوء على أداة توليد قائمة تعريفات البروتين. عندما يتم إنشاء نواتج متعددة، تتم الإشارة إلى المستخدم للخطوات النهائية كأقرب إلى السهم. يتوفر سير العمل هذا بحرية في S2 المواد التكميلية. X! يتوفر ملف تكوين المعلمات الافتراضية جنبا إلى جنب في S4 المواد التكميلية. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم- الشكل 3 : مقارنة لتحديد إينتيراكتور كل الطعم باستخدام قواعد بيانات مختلفة- مخططات متداخل من تعريفات البروتين باستخدام أوبينبروت الأكثر ثقة قاعدة البيانات (في أورانج، دعم أدلة الببتيدات فريدة 2 الحد الأدنى، OpenProt_2pep) بنسبة % 1 فرانكلين روزفلت، أو أوبينبروت كله قاعدة البيانات (باللون الأزرق، OpenProt_all) بنسبة 0.001% فرانكلين روزفلت، أو كما ورد في ورقة (باللون الرمادي) الأصلي38. يتوافق مع كل رسم تخطيطي للتمثيلات التي تم تحديدها للطعم المذكورة: RAF1، RNF41، PTPN14، JIP3، و IQGAP1. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم- الشكل 4 : تحديد الطيف MS/MS من مدنلواك(6 13) الببتيد من البروتين رواية IP_637643- الكثافة النسبية (0 إلى 100%). يتم الإشارة إلى قمم المحددة باللون الأحمر، y أيونات التعليقات التوضيحية في الظلام شروح أيونات الأحمر وب باللون الأخضر. المستخرجة من برمجيات توبفيو34. خطأ السلائف = 2.70 جزء في المليون، نقاط بيب = 0.12. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم- مصطلح تعريف مرجع ORF البديلة (الترف) ORF غير المتعارف عليه حاليا لا المشروح في شروح الجينوم، ولكن المشروح في أوبينبروت. 15 مرجع ORF (ريفورف) ORF الكنسي المشروح في الشروح الجينوم وأوبينبروت. 15 بديل البروتين (التبروت) رواية البروتين ترميز الترف، مع لا تشابه كبير مع ريفبروت. بادئة الانضمام: IP_. 15 مرجع البروتين (ريفبروت) البروتين المشروح حاليا في قواعد تسلسل البروتين مثل أونيبروتكب أو انسيمبل ريفسيق نكبي، وأيضا في أوبينبروت. 15 رواية إيسوفورم رواية البروتين مشفرة التورف، مع تشابه كبير مع ريفبروت. بادئة الانضمام: II_. 15 قاعدة بيانات OpenProt_2pep يحتوي على تسلسل جميع ريفبروتس والبروتينات الرواية التي تنبأت بها أوبينبروت، الكشف عن الفعل مع حد أدنى من 2 الببتيدات فريدة من نوعها. 15 قاعدة بيانات OpenProt_1pep يحتوي على تسلسل جميع ريفبروتس والبروتينات الرواية التي تنبأت بها أوبينبروت، الكشف عن الفعل مع حد أدنى من 1 الببتيد فريدة من نوعها. 15 قاعدة بيانات OpenProt_all يحتوي على تسلسل جميع ريفبروتس والبروتينات الرواية التي تنبأت بها أوبينبروت. 15 الجدول 1: تعريف المصطلحات المستخدمة في أوبينبروت وفي البروتوكول S1 المواد التكميلية: سير عمل نظام غالاكسي للتعامل مع قاعدة البيانات- هذا سيتم إلحاق تسلسل كرابومي وشرك (عكس) إلى قاعدة بيانات الإدخال. الإخراج ملف Fasta. اضغط هنا لتحميل- S2 المواد التكميلية: غالاكسي سير العمل لتحديد البروتين. وسيحدد هذا البروتين من ملف بيانات الطيف الكتلي باستخدام اثنين من محركات البحث (MS-GF + و X! جنبا إلى جنب). يمكن ضبطها كل معلمة حسب المطلوب قبل تشغيل سير العمل. اضغط هنا لتحميل- S3 المواد التكميلية: سير العمل غالاكسي للقياس الكمي البروتين باستخدام النظائر المستقرة وسم (SIL). هذا سوف تحديد وقياس البروتينات من ملف بيانات الطيف الكتلي باستخدام اثنين من محركات البحث (MS-GF + و X! جنبا إلى جنب). يمكن ضبطها كل معلمة حسب المطلوب قبل تشغيل سير العمل. اضغط هنا لتحميل- S4 المواد التكميلية: X! ملف تكوين المعلمات الافتراضية جنبا إلى جنب. XML هذا الملف ضروري لتشغيل X! أداة تانديمادابتير على منصة المجرة. اضغط هنا لتحميل- S5 المواد التكميلية: كمية البروتينات من مجموعات البيانات إيميكسبرو- ملفات البيانات من ايكرمان et al. عام 201638 تم معالجتها باستخدام قواعد البيانات أوبينبروت والبروتينات الكمية المذكورة لكل حالة. الطعوم هي PTPN14، JIP3، IQGAP1، RAF1، و RNF41. تتطابق أسماء الجينات هو مبين باللون الأخضر مع البروتينات كما حددت في الورقة الأصلية38. أسماء الجينات المبينة في أورانج تناظر التمثيلات المعروفة وفقا بيوجريد التي لم يتم الإبلاغ عنها في هذه الورقة الأصلية. أسماء الجينات المبينة في الضوء الأزرق تتوافق مع رواية البروتينات المحددة التمثيلات (عدد الانضمام البروتين المقابل هو بين قوسين). وأشارت إلى أسماء الجينات في رمادي فاتح ومائل تتوافق مع الملوثات المحتمل (بروتينات الكيراتين). اضغط هنا لتحميل- S6 المواد التكميلية: تحديد البروتينات رواية من مجموعات البيانات إيميكسبرو- ملفات البيانات من ايكرمان et al. عام 201638 تم معالجتها باستخدام قواعد البيانات أوبينبروت ويتم سرد رواية البروتينات التي تم تحديدها لكل حالة. الطعوم هي PTPN14، JIP3، IQGAP1، RAF1، و RNF41. يتم سرد أرقام الانضمام البروتين، بدءاً II_ لرواية isoforms البروتين المعروفة، ومع IP_ للبروتينات رواية من ORF بديلة (التبروت). العدد من دعم الببتيدات ترد بين قوسين معقوفين. اضغط هنا لتحميل-

Discussion

عند تحليل البيانات من المطيافات الشامل، يعتمد نوعية تحديد البروتين جزئيا على دقة قاعدة البيانات المستخدمة من6،20. النهج الحالي عادة استخدام قواعد البيانات أونيبروتكب، ولكن هذه دعم نموذج توضيحي الجينوم ORF واحد كل نسخة، والحد أدنى لطول 100 codons (باستثناء الأمثلة الواضحة سابقا)40. دراسات متعددة تتعلق بأوجه القصور في قواعد البيانات هذه مع اكتشاف Orf الوظيفية من يزعم أن الترميز غير المناطق8،11،،من1213. الآن، يسمح أوبينبروت لتحديد البروتين أكثر شمولاً كما أنه يرسم تسلسل البروتين من شروح الترنسكربيتوم متعددة. استرداد أوبينبروت “نكبي ريفسيق” (GRCh38.p7) وترانسكريبتوميس انسيمبل (GRCh38.83) وشروح أونيبروتكب (أونيبروتكب-سويسبروت، 2017-09-27)40،،من4243. أوبينبروت حسب تقديم شروح الحالي تداخل قليلاً، وبالتالي يعرض نظرة أشمل للبروتين المناظر الطبيعية المحتملة من عندما يقتصر على تعليق توضيحي واحد15.

وعلاوة على ذلك، كما يفرض أوبينبروت نموذج بوليسيسترونيك، أنها تسمح لعدة شروح البروتين كل نسخة. لا يزال يحمل أوبينبروت لأسباب الإحصائية والحسابية، عتبة الحد أدنى لطول 30 codons15. حتى الآن، فإنه يتنبأ بآلاف تسلسل الرواية البروتين، وبالتالي توسيع نطاق إمكانيات لتحديد البروتين. مع هذا النهج، يدعم أوبينبروت الاكتشافات البروتين بطريقة أكثر منهجية.

كما يمكن أن تتأثر نوعية البروتين تحديد المعلمات التي يتم استخدامها. عادة إجراء التحليلات المستندة إلى MS البروتيوميات بروتين 1% فرانكلين روزفلت. ومع ذلك، قاعدة البيانات بأكملها أوبينبروت يحتوي على إدخالات حوالي 6 مرات أكثر (الشكل 1). لحساب هذه الزيادة الكبيرة في مساحة البحث، نوصي باستخدام فرانكلين روزفلت أكثر صرامة من 0.001 في المائة. هذه المعلمة الأمثل باستخدام دراسات مرجعية ودليل تقييم الأطياف مختارة عشوائياً15. على الرغم من إيجابية كاذبة لا يزال احتمالاً، ونحن نشجع تفتيش دقيق والتحقق من صحة الأدلة لبروتين رواية الداعمة. يمكن أن يكون معيار الموصى بها تحديد نسبة البروتين من اثنين تشغيل MS مختلفة، كما تختلف البيانات الخلفية والمغلوطة بين مجموعات البيانات15.

يمكن تعديل خط الأنابيب المتوفرة هنا والمستخدمة لدراسة الحالة السرور لتناسب التصميم التجريبي والمعلمات. أننا نوصي باستخدام محركات البحث متعددة كما أنه يزيد من حساسية وحساسية من الببتيد تحديد32. وعلاوة على ذلك، فإننا نشجع استخدام قاعدة تناظر أفضل هدف التجريبية (الشكل 1). كاستخدام أوبينبروت كله قاعدة يأتي مع فرانكلين صرامة، قد تضيع هوية حقيقية. وهكذا، ينبغي أن يقصد بها قاعدة البيانات بأكملها لاكتشاف البروتينات الرواية، حين التنميط البروتيوميات الكلاسيكية يجب أن تستخدم قواعد البيانات أوبينبروت الأصغر حجماً (مثل OpenProt_2pep المستخدمة في دراسة الحالة الواردة أعلاه).

وتتنبأ أوبينبروت حاليا تسلسل بدءاً كودون ATG، بينما أبرزت عدة دراسات بدء الترجمة في سائر codons44،45. وعندما يتم تحديد بروتين رواية بواحدة أو عدة من الببتيدات فريدة من نوعها، فمن الممكن كودون البدء الحقيقي ليس ATG المفترضة. المستخدمين البحث عن أدلة الترجمة على موقع أوبينبروت. أوبينبروت حاليا، فقط تقارير الأحداث الترجمة إذا كانت تتعلق بالتسلسل (تداخل 100 ٪) البروتين توقع كامل15. وهكذا، نظراً لغياب الأدلة ترجمة لا يعني لا تتم ترجمة البروتين، ولكن ذلك قد لا يكون كودون بدء ATG المزعومة.

على الرغم من أن القيود الحالية، يقدم أوبينبروت نظرة أكثر شمولاً لإمكانات الترميز الجينومات حقيقية النواة. تعزيز قواعد البيانات أوبينبروت الاكتشافات البروتين البشري وفهم وظائف البروتين والتفاعلات. سوف تشمل التطورات المستقبلية لقاعدة البيانات أوبينبروت شرح أنواع الأخرى، ترجمة الأدلة من غير ATG تبدأ كودون وتطوير خط أنابيب لتشمل البروتينات الرواية في الجينوم كله وعزمي تسلسل الدراسات.

Disclosures

The authors have nothing to disclose.

Acknowledgements

ونحن نشكر فيفيان Delcourt للتعليمات والمناقشات وتقديم المشورة بشأن هذا العمل. X.R. عضو في “صندوق البحوث” دو du فرقس الصحة كيبيك دعم مركز لبحوث المركز الاستشفائي الجامعي دي شيربروك. وأيد هذا البحث “كرسي أبحاث كندا” في البروتيوميات الوظيفية واكتشاف البروتينات رواية لمنحه X.R. واستوفوا 137056 اجتماع الأطراف. ونشكر فريق العمل في الإطار كيبيك وكندا لحساب لدعمها باستخدام mp2 العملاق من جامعة شيربروك دي. تشغيل الحاسوب العملاق mp2 ويمول بكندا مؤسسة للابتكار (CFI)، وزارة le دي l ‘ الاقتصاد، العلوم de la et du مكلف دي كيبيك (ميسي) و les Fonds de بحوث كيبيك-طبيعة et التكنولوجيات (فرق-NT). خادم نظام غالاكسي الذي تم استخدامه لبعض الحسابات البروتيوميات تموله جزئيا التعاونية أبحاث المركز 992 الطبية اللاجيني (منحة DFG SFB 2012 992/1) والوزارة الألمانية الاتحادية للتعليم والبحوث (الفدرالية منح 031 “ربك” A538A/A538C، 031L0101B /031L0101C دي. مبادرة حوض النيل-برنامج التحصين الموسع، ل 031 0106 دي. درج (دي. مبادرة حوض النيل)).

Materials

OpenProt website open source n/a www.openprot.org
Galaxy Server open source n/a https://usegalaxy.eu/
TOPPview software open source n/a www.openms.de

References

  1. Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
  2. Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
  3. Hein, M. Y., et al. A human interactome in three quantitative dimensions organized by stoichiometries and abundances. Cell. 163 (3), 712-723 (2015).
  4. Huttlin, E. L., et al. The BioPlex Network: A Systematic Exploration of the Human Interactome. Cell. 162 (2), 425-440 (2015).
  5. Huttlin, E. L., et al. Architecture of the human interactome defines protein communities and disease networks. Nature. 545 (7655), 505-509 (2017).
  6. Kumar, D., Yadav, A. K., Dash, D. Choosing an Optimal Database for Protein Identification from Tandem Mass Spectrometry Data. Proteome Bioinformatics. , 17-29 (2017).
  7. Jeong, K., Kim, S., Bandeira, N. False discovery rates in spectral identification. BMC Bioinformatics. 13 (Suppl 16), (2012).
  8. Brunet, M. A., Levesque, S. A., Hunting, D. J., Cohen, A. A., Roucou, X. Recognition of the polycistronic nature of human genes is critical to understanding the genotype-phenotype relationship. Genome Research. , (2018).
  9. Brent, M. R. Genome annotation past, present, and future: how to define an ORF at each locus. Genome Research. 15 (12), 1777-1786 (2005).
  10. Harrow, J., et al. GENCODE: The reference human genome annotation for The ENCODE Project. Genome Research. 22 (9), 1760-1774 (2012).
  11. Samandi, S., et al. Deep transcriptome annotation enables the discovery and functional characterization of cryptic small proteins. eLife. 6, e27860 (2017).
  12. Saghatelian, A., Couso, J. P. Discovery and characterization of smORF-encoded bioactive polypeptides. Nature Chemical Biology. 11 (12), 909-916 (2015).
  13. Delcourt, V., Staskevicius, A., Salzet, M., Fournier, I., Roucou, X. Small Proteins Encoded by Unannotated ORFs are Rising Stars of the Proteome, Confirming Shortcomings in Genome Annotations and Current Vision of an mRNA. Proteomics. , (2017).
  14. Plaza, S., Menschaert, G., Payre, F. In Search of Lost Small Peptides. Annual Review of Cell and Developmental Biology. 33 (1), (2017).
  15. Brunet, M. A., et al. OpenProt: a more comprehensive guide to explore eukaryotic coding potential and proteomes. Nucleic Acids Research. , (2018).
  16. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Nucleic Acids Research. 44 (W1), W3-W10 (2016).
  17. Afgan, E., et al. The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2018 update. Nucleic Acids Research. 46, W537-W544 (2018).
  18. Sturm, M., et al. OpenMS – An open-source software framework for mass spectrometry. BMC Bioinformatics. 9 (1), 163 (2008).
  19. Carithers, L. J., et al. A Novel Approach to High-Quality Postmortem Tissue Procurement: The GTEx Project. Biopreservation and Biobanking. 13 (5), 311-319 (2015).
  20. Aebersold, R., Mann, M. Mass spectrometry-based proteomics. Nature. 422 (6928), 6928 (2003).
  21. Domon, B., Aebersold, R. Mass Spectrometry and Protein Analysis. Science. 312 (5771), 212-217 (2006).
  22. Hu, J., Coombes, K. R., Morris, J. S., Baggerly, K. A. The importance of experimental design in proteomic mass spectrometry experiments: Some cautionary tales. Briefings in Functional Genomics. 3 (4), 322-331 (2005).
  23. Wu, P. Y., Phan, J. H., Wang, M. D. Assessing the impact of human genome annotation choice on RNA-seq expression estimates. BMC Bioinformatics. 14 (11), S8 (2013).
  24. Mellacheruvu, D., et al. The CRAPome: a contaminant repository for affinity purification-mass spectrometry data. Nature Methods. 10 (8), 730-736 (2013).
  25. Adusumilli, R., Mallick, P. Data Conversion with ProteoWizard msConvert. Proteomics: Methods and Protocols. , 339-368 (2017).
  26. French, W. R., et al. Wavelet-Based Peak Detection and a New Charge Inference Procedure for MS/MS Implemented in ProteoWizard’s msConvert. Journal of Proteome Research. 14 (2), 1299-1307 (2015).
  27. Kuenzi, B. M., et al. APOSTL: An Interactive Galaxy Pipeline for Reproducible Analysis of Affinity Proteomics Data. Journal of Proteome Research. 15 (12), 4747-4754 (2016).
  28. Hoekman, B., Breitling, R., Suits, F., Bischoff, R., Horvatovich, P. msCompare: a framework for quantitative analysis of label-free LC-MS data for comparative candidate biomarker studies. Molecular & Cellular Proteomics: MCP. 11 (6), (2012).
  29. Bjornson, R. D., et al. X!!Tandem, an improved method for running X!tandem in parallel on collections of commodity computers. Journal of Proteome Research. 7 (1), 293-299 (2008).
  30. Kim, S., Pevzner, P. A. MS-GF+ makes progress towards a universal database search tool for proteomics. Nature Communications. 5, 5277 (2014).
  31. Vaudel, M., Barsnes, H., Berven, F. S., Sickmann, A., Martens, L. SearchGUI: An open-source graphical user interface for simultaneous OMSSA and X!Tandem searches. Proteomics. 11 (5), 996-999 (2011).
  32. Shteynberg, D., Nesvizhskii, A. I., Moritz, R. L., Deutsch, E. W. Combining results of multiple search engines in proteomics. Molecular & Cellular Proteomics: MCP. 12 (9), 2383-2393 (2013).
  33. Bittremieux, W., et al. Quality control in mass spectrometry-based proteomics. Mass Spectrometry Reviews. 37 (5), 697-711 (2018).
  34. Bertsch, A., Gröpl, C., Reinert, K., Kohlbacher, O. OpenMS and TOPP: Open Source Software for LC-MS Data Analysis. Data Mining in Proteomics: From Standards to Applications. , 353-367 (2011).
  35. Pfeuffer, J., et al. OpenMS – A platform for reproducible analysis of mass spectrometry data. Journal of Biotechnology. 261, 142-148 (2017).
  36. Kozak, M. Pushing the limits of the scanning mechanism for initiation of translation. Gene. 299 (1-2), 1-34 (2002).
  37. Noderer, W. L., et al. Quantitative analysis of mammalian translation initiation sites by FACS-seq. Molecular Systems Biology. 10, 748 (2014).
  38. Eyckerman, S., et al. Intelligent Mixing of Proteomes for Elimination of False Positives in Affinity Purification-Mass Spectrometry. Journal of Proteome Research. 15 (10), 3929-3937 (2016).
  39. Vizcaíno, J. A., et al. 2016 update of the PRIDE database and its related tools. Nucleic Acids Research. 44 (D1), D447-D456 (2016).
  40. Bateman, A., et al. UniProt: the universal protein knowledgebase. Nucleic Acids Research. 45 (D1), D158-D169 (2017).
  41. The Gene Ontology Consortium Expansion of the Gene Ontology knowledgebase and resources. Expansion of the Gene Ontology knowledgebase and resources. Nucleic Acids Research. 45 (D1), D331-D338 (2017).
  42. O’Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, D733-D745 (2016).
  43. Zerbino, D. R., et al. Ensembl 2018. Nucleic Acids Research. 46 (D1), D754-D761 (2018).
  44. Andreev, D. E., et al. Translation of 5’ leaders is pervasive in genes resistant to eIF2 repression. eLife. 4, e03971 (2015).
  45. Jackson, R., et al. The translation of non-canonical open reading frames controls mucosal immunity. Nature. 564, 434-438 (2018).

Play Video

Cite This Article
Brunet, M. A., Roucou, X. Mass Spectrometry-Based Proteomics Analyses Using the OpenProt Database to Unveil Novel Proteins Translated from Non-Canonical Open Reading Frames. J. Vis. Exp. (146), e59589, doi:10.3791/59589 (2019).

View Video