أوبينبروت هي قاعدة بيانات يمكن الوصول إليها بحرية يفرض نموذجا بوليسيسترونيك الجينومات حقيقية النواة. نقدم هنا، على بروتوكول لاستخدام قواعد البيانات أوبينبروت عند استجواب datasets الكتلي. أوبينبروت باستخدام قاعدة البيانات لتحليل التجارب البروتين يسمح باكتشاف الرواية والبروتينات يمكن الكشف عنها سابقا.
الشرح الجينوم المركزي لبحوث البروتين اليوم كما أنه يرسم الخطوط العريضة للمناظر الطبيعية البروتين. النماذج التقليدية لفتح قراءة التعليق التوضيحي الإطار (ORF) فرض معايير تعسفية اثنين: طول أدنى من 100 codons و ORF واحد كل نسخة. إلا أن عدد متزايد من الدراسات تقرير تعبير البروتينات من يزعم أن الترميز غير المناطق، تحدي دقة الحالية الجينوم الشروح. هذه الرواية تم العثور على البروتينات المشفرة أما داخل الترميز غير الكشف، 5 ‘أو 3’ المناطق غير مترجمة (تحيلها) مرناس، أو تداخل في تسلسل ترميز معروفة (CDS) في بديل ORF. أوبينبروت هو أول قاعدة بيانات التي تفرض نموذج بوليسيسترونيك للجينوم حقيقية النواة، مما يسمح الشرح Orf متعددة كل نسخة. أوبينبروت يمكن الوصول إليها بحرية وعروض الأسبوعية المخصصة لتسلسل البروتين عبر الأنواع 10. أوبينبروت باستخدام قاعدة بيانات لإجراء التجارب على البروتين يمكن اكتشاف البروتينات الرواية ويسلط الضوء على طبيعة الجينات حقيقية النواة بوليسيسترونيك. حجم قاعدة بيانات أوبينبروت (توقع جميع البروتينات) كبيرة وتحتاج إلى أن تؤخذ في الاعتبار للتحليل. ومع ذلك، مع إعدادات معدل (FDR) اكتشاف كاذبة المناسبة أو استخدام قاعدة بيانات أوبينبروت المقيدة، سيكتسب المستخدمين نظرة أكثر واقعية للمناظر الطبيعية البروتين. وعموما، أوبينبروت هو أداة متاحة بحرية تعزز الاكتشافات البروتين.
العقود الماضية، أصبحت البروتيوميات الكتلي (MS-) على أساس أسلوب الذهبي لفك بروتيوميس للخلايا حقيقية النواة1،2،3،،من45. يعتمد هذا الأسلوب على شروح الجينوم الحالية لإنشاء قاعدة بيانات تسلسل بروتين مرجعية التي تحدد نطاق إمكانيات6،،من78. ومع ذلك، عقد الجينوم الشروح معايير تعسفية للشرح ORF، كحد أدنى لطول 100 codons و ORF واحد كل نسخة9،10. عدد متزايد من الدراسات تحدي نموذج التعليق التوضيحي الحالي وتقرير الاكتشافات أونانوتاتيد Orf الوظيفية في جينومات التوكسينات8،11،،من1213، 14. تم العثور على الكشف يزعم أن الترميز غير مرمز في هذه البروتينات رواية، في 5 ‘أو 3’ أهمل المناطق (UTR) مرناس، أو تداخل تسلسل الترميز المتعارف عليه (توخي) في إطار بديل. على الرغم من أن معظم هذه الاكتشافات قد سار، فإنها تظهر التحذيرات الحالية الجينوم الشروح وطبيعة الجينات التوكسينات8بوليسيسترونيك.
وهنا نسلط الضوء على استخدام قواعد البيانات أوبينبروت للبروتينات على أساس مرض التصلب العصبي المتعدد. أوبينبروت هو أول قاعدة بيانات لإجراء نموذج توضيحي بوليسيسترونيك ترانسكريبتوميس حقيقية النواة. متاحة بحرية في www.openprot.org15. وتوقع نسبة هذه Orf ستكون عشوائية وغير وظيفية، وهذا هو السبب أوبينبروت يتراكم الأدلة التجريبية والوظيفية لزيادة الثقة. وتشمل الأدلة التجريبية التعبير البروتين (بواسطة MS) وترجمة الأدلة (بالتنميط الريبوسوم)15. وتشمل الأدلة الفنية أورثولوجي البروتين (مع المذعور في مثل النهج) والمجال الوظيفي التنبؤ15.
أوبينبروت يوفر إمكانية تحميل العديد من قواعد البيانات، من التي تحتوي على فقط من البروتينات مدعمة على نحو جيد بقواعد بيانات مصنوعة خصيصا. وسوف نقدم هنا، خط أنابيب لاستخدام قواعد البيانات أوبينبروت وسوف نقدم أفكاراً في أي قاعدة بيانات لاختيار دراسة تجريبية والهدف. خط الأنابيب تحليل البروتيوميات المعروضة هنا معتمد من قبل إطار غالاكسي الوصول المفتوح وسهلة الاستخدام، ولكن قواعد البيانات التي يمكن أن تعمل مع أي سير العمل16،،من1718. وسوف نقدم أيضا كيفية استخدام موقع أوبينبروت لجمع المزيد من المعلومات عن رواية البروتينات الكشف عنها بواسطة السيدة أوبينبروت استخدام قواعد البيانات سيتم تقديم عرض أكثر شمولاً من المناظر الطبيعية البروتين وسوف تعزز الاكتشافات البروتيوميات والمؤشرات الحيوية في بطريقة أكثر انتظاما من الطرق الحالية.
يبرز هذا البروتوكول استعمال قواعد البيانات أوبينبروت15 عند استجواب MS مجموعات البيانات؛ أنها لن تعيد النظر في التصميم التجربة نفسها، والتي كانت شاملة استعرض20،،من2122في أماكن أخرى. في محاولة منها لتبقى مفتوحة المصدر تماما، هو البروتوكول متاح بحرية (S1 المواد التكميلية–S4). لتسهيل القراءة، يتم تعريف جميع المصطلحات المستخدمة في أوبينبروت، وهنا في جميع أنحاء هذا البروتوكول في الجدول 1.
عند تحليل البيانات من المطيافات الشامل، يعتمد نوعية تحديد البروتين جزئيا على دقة قاعدة البيانات المستخدمة من6،20. النهج الحالي عادة استخدام قواعد البيانات أونيبروتكب، ولكن هذه دعم نموذج توضيحي الجينوم ORF واحد كل نسخة، والحد أدنى لطول 100 codons (باستثناء الأمثلة الواضحة سابقا)40. دراسات متعددة تتعلق بأوجه القصور في قواعد البيانات هذه مع اكتشاف Orf الوظيفية من يزعم أن الترميز غير المناطق8،11،،من1213. الآن، يسمح أوبينبروت لتحديد البروتين أكثر شمولاً كما أنه يرسم تسلسل البروتين من شروح الترنسكربيتوم متعددة. استرداد أوبينبروت “نكبي ريفسيق” (GRCh38.p7) وترانسكريبتوميس انسيمبل (GRCh38.83) وشروح أونيبروتكب (أونيبروتكب-سويسبروت، 2017-09-27)40،،من4243. أوبينبروت حسب تقديم شروح الحالي تداخل قليلاً، وبالتالي يعرض نظرة أشمل للبروتين المناظر الطبيعية المحتملة من عندما يقتصر على تعليق توضيحي واحد15.
وعلاوة على ذلك، كما يفرض أوبينبروت نموذج بوليسيسترونيك، أنها تسمح لعدة شروح البروتين كل نسخة. لا يزال يحمل أوبينبروت لأسباب الإحصائية والحسابية، عتبة الحد أدنى لطول 30 codons15. حتى الآن، فإنه يتنبأ بآلاف تسلسل الرواية البروتين، وبالتالي توسيع نطاق إمكانيات لتحديد البروتين. مع هذا النهج، يدعم أوبينبروت الاكتشافات البروتين بطريقة أكثر منهجية.
كما يمكن أن تتأثر نوعية البروتين تحديد المعلمات التي يتم استخدامها. عادة إجراء التحليلات المستندة إلى MS البروتيوميات بروتين 1% فرانكلين روزفلت. ومع ذلك، قاعدة البيانات بأكملها أوبينبروت يحتوي على إدخالات حوالي 6 مرات أكثر (الشكل 1). لحساب هذه الزيادة الكبيرة في مساحة البحث، نوصي باستخدام فرانكلين روزفلت أكثر صرامة من 0.001 في المائة. هذه المعلمة الأمثل باستخدام دراسات مرجعية ودليل تقييم الأطياف مختارة عشوائياً15. على الرغم من إيجابية كاذبة لا يزال احتمالاً، ونحن نشجع تفتيش دقيق والتحقق من صحة الأدلة لبروتين رواية الداعمة. يمكن أن يكون معيار الموصى بها تحديد نسبة البروتين من اثنين تشغيل MS مختلفة، كما تختلف البيانات الخلفية والمغلوطة بين مجموعات البيانات15.
يمكن تعديل خط الأنابيب المتوفرة هنا والمستخدمة لدراسة الحالة السرور لتناسب التصميم التجريبي والمعلمات. أننا نوصي باستخدام محركات البحث متعددة كما أنه يزيد من حساسية وحساسية من الببتيد تحديد32. وعلاوة على ذلك، فإننا نشجع استخدام قاعدة تناظر أفضل هدف التجريبية (الشكل 1). كاستخدام أوبينبروت كله قاعدة يأتي مع فرانكلين صرامة، قد تضيع هوية حقيقية. وهكذا، ينبغي أن يقصد بها قاعدة البيانات بأكملها لاكتشاف البروتينات الرواية، حين التنميط البروتيوميات الكلاسيكية يجب أن تستخدم قواعد البيانات أوبينبروت الأصغر حجماً (مثل OpenProt_2pep المستخدمة في دراسة الحالة الواردة أعلاه).
وتتنبأ أوبينبروت حاليا تسلسل بدءاً كودون ATG، بينما أبرزت عدة دراسات بدء الترجمة في سائر codons44،45. وعندما يتم تحديد بروتين رواية بواحدة أو عدة من الببتيدات فريدة من نوعها، فمن الممكن كودون البدء الحقيقي ليس ATG المفترضة. المستخدمين البحث عن أدلة الترجمة على موقع أوبينبروت. أوبينبروت حاليا، فقط تقارير الأحداث الترجمة إذا كانت تتعلق بالتسلسل (تداخل 100 ٪) البروتين توقع كامل15. وهكذا، نظراً لغياب الأدلة ترجمة لا يعني لا تتم ترجمة البروتين، ولكن ذلك قد لا يكون كودون بدء ATG المزعومة.
على الرغم من أن القيود الحالية، يقدم أوبينبروت نظرة أكثر شمولاً لإمكانات الترميز الجينومات حقيقية النواة. تعزيز قواعد البيانات أوبينبروت الاكتشافات البروتين البشري وفهم وظائف البروتين والتفاعلات. سوف تشمل التطورات المستقبلية لقاعدة البيانات أوبينبروت شرح أنواع الأخرى، ترجمة الأدلة من غير ATG تبدأ كودون وتطوير خط أنابيب لتشمل البروتينات الرواية في الجينوم كله وعزمي تسلسل الدراسات.
The authors have nothing to disclose.
ونحن نشكر فيفيان Delcourt للتعليمات والمناقشات وتقديم المشورة بشأن هذا العمل. X.R. عضو في “صندوق البحوث” دو du فرقس الصحة كيبيك دعم مركز لبحوث المركز الاستشفائي الجامعي دي شيربروك. وأيد هذا البحث “كرسي أبحاث كندا” في البروتيوميات الوظيفية واكتشاف البروتينات رواية لمنحه X.R. واستوفوا 137056 اجتماع الأطراف. ونشكر فريق العمل في الإطار كيبيك وكندا لحساب لدعمها باستخدام mp2 العملاق من جامعة شيربروك دي. تشغيل الحاسوب العملاق mp2 ويمول بكندا مؤسسة للابتكار (CFI)، وزارة le دي l ‘ الاقتصاد، العلوم de la et du مكلف دي كيبيك (ميسي) و les Fonds de بحوث كيبيك-طبيعة et التكنولوجيات (فرق-NT). خادم نظام غالاكسي الذي تم استخدامه لبعض الحسابات البروتيوميات تموله جزئيا التعاونية أبحاث المركز 992 الطبية اللاجيني (منحة DFG SFB 2012 992/1) والوزارة الألمانية الاتحادية للتعليم والبحوث (الفدرالية منح 031 “ربك” A538A/A538C، 031L0101B /031L0101C دي. مبادرة حوض النيل-برنامج التحصين الموسع، ل 031 0106 دي. درج (دي. مبادرة حوض النيل)).
OpenProt website | open source | n/a | www.openprot.org |
Galaxy Server | open source | n/a | https://usegalaxy.eu/ |
TOPPview software | open source | n/a | www.openms.de |