والهدف من هذا البروتوكول هو وضع مرجع للبروتينات المختلفة في مجموعة التي تفتقر إلى معايير متسقة للتسمية والتصنيف. هذا المرجع سوف تيسر تحليل ومناقشة للمجموعة ككل ويمكن استخدامها بالإضافة إلى أسماء ثابتة.
البروتينات ذات الصلة التي درست في مختبرات مختلفة باستخدام الكائنات المختلفة قد تفتقر إلى نظام موحد للتسمية والتصنيف، مما يجعل من الصعب مناقشة المجموعة ككل ووضع تسلسل جديد في السياق المناسب. وضع إشارة أن يعطي الأولوية لميزات تسلسل هامة تتعلق بهيكل و/أو يمكن استخدام النشاط بالإضافة إلى أسماء ثابتة لإضافة بعض الاتساق إلى مجموعة متنوعة من البروتينات. يستخدم هذا الورق سيستين استقرت فوق (CS-αβ) الحلزون ألفا عائلة كمثال لإظهار كيف مرجع الذي تم إنشاؤه في برنامج جدول بيانات يمكن توضيح العلاقات بين البروتينات الموجودة في فوق عائلة، فضلا عن تسهيل الإضافة جديدة تسلسل. ويبين أيضا كيف يمكن أن تساعد الإشارة صقل تسلسل التحالفات التي تم إنشاؤها في برامج شائعة الاستخدام، مما يؤثر في صحة تحليلات النشوء والتطور. استخدام مرجع سيكون مفيداً للغاية للبروتين المجموعات التي تتضمن متواليات متباينة جداً من مجموعة واسعة من الأصناف، مع الميزات التي لم يتم التقاطها بشكل كاف بالتحليلات الجزيئية على الأرجح.
يجب أن تعكس اسم البروتين خصائصها وعلاقتها بغيرها من البروتينات. ولسوء الحظ، يتم تعيين أسماء عموما في وقت اكتشاف، ويستمر البحث، قد تغير فهم السياق الأوسع. وهذا يمكن أن يؤدي إلى أسماء متعددة إذا كان بروتين بشكل مستقل وحددت أكثر من مختبر، والتغييرات في التسمية أو في خصائص الفكر أن تكون نهائية عند تعيين الاسم، واسم التفريق لم يعد بما فيه الكفاية البروتين من الآخرين.
ديفينسينس اللافقاريات تقدم مثالاً جيدا للانحطاط في التسمية والتصنيف. أبلغ defensins اللافقارية أول من الحشرات، واقترح اسم “حشرة ديفينسين” استناداً إلى التماثل المتصورة للثدييات ديفينسينس1،2. ديفينسين الأجل يزال يستخدم، على الرغم من أن من الواضح الآن أن defensins اللافقاريات والثدييات لا نشاطر جد مشترك3،4. تبعاً للأنواع، قد اللافقاريات “ديفينسين” سيستينيس ستة أو ثمانية (التي تشكل ثلاثة أو أربعة سندات ثنائي كبريتيد) ومجموعة متنوعة من الأنشطة المضادة للميكروبات. إلى تعقيد الوضع، البروتينات مع نفس الخصائص كما تسمى “ديفينسينس،” ليس دائماً defensins مثل كريميسينس التي تم تحديدها مؤخرا من ريماني كاينورهابديتيس5. وباﻹضافة إلى ذلك، اللافقاريات ديفينسينس كبيرة من المرجح أن تقحم تتصل بالفقاريات β-ديفينسينس من ديفينسينس اللافقاريات الأخرى6. وبالرغم من ذلك، في بعض الأحيان الباحثين الاعتماد على الاسم “ديفينسين” عند تحديد تسلسلات التي ينبغي أن تدرج في تحليل.
كشفت دراسات الهيكلية التشابه بين ديفينسينس الحشرات و السموم العقرب7، وإضعاف CS αβ أنشئ فيما بعد كسمة مميزة الهيكلي للحشرات ديفينسينس8. إضعاف هذا يعرف العقرب مثل السمية (CS-αβ) فوق عائلة في تصنيف البروتينات الهيكلية (SCOP) قاعدة بيانات9، التي تضم حاليا الأسر الخمس: defensins الحشرات والسموم العقرب سلسلة قصيرة والسموم العقرب سلسلة طويلة، 1 مليون جالون يوميا (من الرخوي)، ومصنع ديفينسينس. هذا فوق عائلة مرادف لوصف مؤخرا رابطة الدول المستقلة-ديفينسينس4 وفوق عائلة 3.30.30.10 في10،11قاعدة بيانات ثلاثية الأبعاد قسطرة/الجينات. دراسات من مجموعة متنوعة من الأنواع اللافقارية والنباتات والفطريات وتظهر أن أسماء البروتينات التي تحتوي على إضعاف هذا لا وضوح تتصل بعدد سيستين أو نمط الترابط، ونشاط مضادات الميكروبات، أو التاريخ التطوري12.
الافتقار إلى الاتساق ومعايير واضحة تجعل من التحدي لتسمية وتصنيف تسلسل المحددة حديثا في هذا فوق عائلة. يشكل عقبة رئيسية أمام مقارنة البروتينات في هذا فوق عائلة هو أن يتم ترقيم سيستينيس فيما يتعلق بكل فردية التسلسل (سيستين الأولى في كل تسلسل C1)، مع عدم وجود طريقة لحساب الدور الهيكلي. وهذا يعني أنه يمكن مقارنة تسلسل فقط مع نفس العدد من سيستينيس. وهناك القليل حفظ تسلسل خلاف سيستينيس تشكيل إضعاف CS αβ، مما يجعل من الصعب التحالفات وتحليلات النشوء والتطور. بوضع نظام ترقيم الذي يعطي الأولوية للسمات الهيكلية، يمكن بسهولة أكثر مقارنة تسلسل فوق عائلة والانحياز. ميزات مصانة، فضلا عن تلك التي تحدد فئات فرعية، يمكن تصور بسرعة، وتسلسل جديد يمكن وضعها بسهولة أكبر في السياق المناسب.
تستخدم هذه الورقة برنامج جدول بيانات (مثل Excel) لتوليد إشارة ترقيم نظام لفوق عائلة CS αβ. ويبين كيف هذا يوضح المقارنات بين متواليات ويطبق على تسلسلات CS-αβ الجديدة المحددة من تارديجراديس. استخدام فوق عائلة αβ CS–على سبيل مثال، كتب في البروتوكول لتوفير التوجيه عند استخدام تسلسل اهتمام؛ ومع ذلك، فليس المقصود على وجه التحديد هذا فوق عائلة أو تسلسلات سيستين الغنية. هذا الأسلوب سيكون على الأرجح الأكثر فائدة لمجموعات من البروتينات التي قد تم بحثها بشكل مستقل في الأنواع المختلفة و/أو لديها القليل من عموما تسلسل التماثل، مع خصائص منفصلة قد لا يسهل التعرف عليه بواسطة برنامج التحليل الجزيئي. يتطلب هذا الأسلوب بعض القرارات مسبقاً فيما يتعلق بالميزات الهامة، حيث أنها ستكون ذات فائدة محدودة إذا تم تحديد لا من السمات الهامة. والهدف الأساسي لإظهار كيف يمكن أن يتحقق تصور بسيط لعلاقات التسلسل. يمكن ثم استخدام هذا لإعلام تسلسل المحاذاة وتحليل، ولكن إذا كانت المحاذاة وتحليل الأهداف الأولية، طريقة باركود سيكون بديل مناسب له قدرة أكبر لأتمتة13. الطريقة الحالية لعرض ميزات كل الببتيد في شكل خطي، حيث أنها لن تكون مفيدة للتصور مباشرة من بنية ثلاثية الأبعاد.
ينبغي أن تكون المعايير المتعلقة بتسمية بروتين ضمن مجموعة واضحة، ولكن هذا ليس هو الحال دائماً. وقد درست تسلسلات التي لديها خدمات العملاء-αβ أمثال في مختبرات عديدة باستخدام مجموعة متنوعة من الكائنات الحية، وأسفر عن أنظمة مختلفة من التسميات، فضلا عن اختلاف مستويات توصيف. محاولة فرض إلى مصطل…
The authors have nothing to disclose.
البحوث الجارية الببتيد الميكروبات tardigrade يدعمه التمويل الداخلية من “مكتب بحوث جامعة الغرب الأوسط” ورعاية البرامج (أورسب). وقد أورسب أي دور في تصميم الدراسة أو جمع البيانات، والتحليل، وتفسير أو إعداد مخطوطة.
BLAST webpage | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
EditSeq (Lasergene suite) | DNASTAR | https://www.dnastar.com/t-allproducts.aspx | |
Excel 2013 | Microsoft | ||
FigTree | http://tree.bio.ed.ac.uk/software/figtree/ | ||
MEGA | www.megasoftware.net | ||
MrBayes | http://mrbayes.sourceforge.net/ | ||
SCOP database | http://scop.mrc-lmb.cam.ac.uk/scop/ |