ويرد وصف المبادئ التوجيهية للكمبيوتر يستند توصيف الهيكلية والوظيفية للبروتين باستخدام خط أنابيب I – TASSER. بدءا من تسلسل البروتين الاستعلام ، يتم إنشاؤها باستخدام نماذج 3D التحالفات خيوط متعددة ومتكررة المحاكاة التجمع الهيكلي. بعد ذلك يتم رسمها بناء على الاستدلالات وظيفية للبروتينات مباريات مع هيكل معروف ووظائفها.
وقد مشفر مشاريع تسلسل الجينوم الملايين من تسلسل البروتين ، والتي تتطلب معرفة هيكلها وظيفة لتحسين فهم دورها البيولوجي. على الرغم من الأساليب التجريبية يمكن أن توفر معلومات مفصلة عن جزء صغير من هذه البروتينات ، لا بد من النمذجة الحاسوبية لمعظم جزيئات البروتينات التي uncharacterized تجريبيا. خادم I – TASSER هو طاولة العمل على الخط لصالح عالية الدقة نمذجة بنية البروتين ووظيفته. تسلسل معين من البروتين ، وإخراج نموذجية من خادم I – TASSER يتضمن بنية التنبؤ الثانوية ، وتوقع الوصول المذيبات من كل رواسب والبروتينات قالب مثلي الكشف عنها بواسطة خيوط والتحالفات الهيكل ، ما يصل الى خمسة كامل طول نماذج هيكلية التعليم العالي ، وهيكل قائم على شروحه للتصنيف الوظيفي الانزيم ، حيث أنتولوجيا الجينات والبروتينات ويجند مواقع الربط. يتم تمييزها عن التوقعات بنتيجة الثقة التييروي مدى دقة التوقعات من دون الاطلاع على البيانات التجريبية. لتسهيل الطلبات الخاصة للمستخدمين النهائيين ، والخادم توفر قنوات لقبول المحددة من قبل المستخدم بين بقايا المسافة والاتصال لتغيير الخرائط بشكل تفاعلي النمذجة I – TASSER ، بل يسمح أيضا للمستخدمين لتحديد أي البروتينات والقالب ، أو لاستبعاد أي قالب البروتينات خلال محاكاة هيكل التجمع. يمكن جمع المعلومات الهيكلية من قبل المستخدمين على أساس الأدلة التجريبية أو رؤى البيولوجية بهدف تحسين نوعية I – TASSER التنبؤات. تم تقييم الملقم كما أفضل البرامج لبنية البروتين والتنبؤات وظيفة في التجارب الأخيرة CASP المجتمع ككل. هناك حاليا> 20000 مسجل من العلماء أكثر من 100 دولة الذين يستخدمون على الخط I – TASSER الخادم.
بروتوكول الواردة أعلاه هو توجيهي عام لهيكل والنمذجة الدالة باستخدام ملقم I – TASSER. على الرغم من أن هذا الإجراء الآلي يعمل بشكل جيد جدا بالنسبة لمعظم البروتينات ، والتدخلات البشرية غالبا ما يساعد بشكل كبير على تحسين دقة النمذجة ، وخاصة بالنسبة للبروتينات التي تفتقر إلى القوالب وثيقة في مكتبة PDB. يمكن للمستخدمين التدخل خلال النمذجة I – TASSER في الطرق التالية : (أ) تقسيم المجال متعددة البروتينات ، (ب) توفير القيود الخارجية لتحسين هيكل التجمع ، و (ج) إزالة القوالب خلال النمذجة.
تقسيم متعددة المجالات البروتين :
العديد من سلاسل طويلة تحتوي على البروتين في كثير من الأحيان مجالات متعددة وفقا للمناطق المربوطة رابط مرنة ، مما يجعل من الصعب توضيح هيكلها على حد سواء باستخدام التقنيات التجريبية والحاسوبية. ومع ذلك ، والمجالات هي كيانات مستقلة قابلة للطي ويمكن أن تؤدي وظيفة الجزيئية متميزة ، بل هو مرغوب فيه لتقسيم طويلة متعددة المجال البروتينات ونموذج كل مجال على حدة. مجالات النمذجة وليس فرديا فقط سرعة وتيرة عملية التنبؤ ، لكنه يزيد أيضا نوعية الاستعلام قالب المحاذاة ، مما أدى إلى هيكل أكثر موثوقية والتنبؤات وظيفة.
ويمكن توقع حدود المجال في تسلسل البروتين باستخدام برامج متاحة مجانا على الانترنت الخارجية مثل CDD NCBI 24 ، 25 أو PFAM InterProScan 26. أيضا ، إذا LOMETS التحالفات الترابط متوفرة للاستعلام البروتين ، يمكن أن تكون موجودة من خلال تحديد نطاق حدود البصر فترات طويلة من مخلفات الصغيرة المحايدة في قوالب والترابط العلوي (انظر الخطوة 5.4). تقابل هذه المناطق الصغيرة المحايدة في الغالب إلى مناطق رابط المجال. إذا كان المجال قوالب متعددة متوفرة بالفعل في مكتبة قالب PDB مع جميع المجالات الاستعلام الانحياز ، ومن ثم يمكن للبروتين غرار الاستعلام كما الكامل طول.
توفير القيود الخارجية
<p الطبقة = "jove_content"> وتسترشد أساسا محاكاة هيكل التجمع في TASSER – I القيود المكانية التي تم جمعها من خيوط LOMETS القوالب. الاستعلام عن البروتينات التي ضربت خيوط جيدة (درجة Norm. Z -> 1) في مكتبة القالب ، والقيود المكانية مستمدة في معظمها من الدقة العالية وI – TASSER سوف تولد نماذج عالية الدقة الهيكلي لهذه البروتينات. النقيض من ذلك ، الاستعلام عن البروتينات التي بلغت ضعف أو عدم الترابط (Z – Norm. درجة <1) ، والقيود المكانية التي تم جمعها غالبا ما تحتوي على أخطاء بسبب عدم التيقن من القالب والمحاذاة. لهذه الأهداف من البروتين ، يمكن للمستخدم تحديد المعلومات المكانية أن تكون مفيدة جدا لتحسين نوعية نموذج التنبؤ بها. يمكن للمستخدمين توفير القيود الخارجية لخادم I – TASSER بطريقتين :ألف حدد الاتصال / المسافة القيود
تتميز تجريبيا بين بقايا اتصالات / المسافات ، على سبيل المثال من الرنين المغناطيسي أوعبر الربط بين التجارب ، يمكن تحديد عن طريق تحميل ملف ضبط النفس. ويظهر ملف سبيل المثال في الشكل 8 ، حيث العمود 1 يحدد نوع من ضبط النفس ، أي "DIST" أو "الاتصال". لضبط النفس بعد (DIST) ، والأعمدة 2 و 4 مواقع تحتوي على مخلفات (ط ، ي) ، والأعمدة 3 و 5 تحتوي على ذرة وأنواع المخلفات في العمود 6 وتحدد المسافة بين الذرات المحددين. لقيود الاتصال (الاتصال) ، والأعمدة 2 و 3 تحتوي على مواقف (ط ، ي) من مخلفات التي ينبغي أن تكون على اتصال. تقرر المسافة بين الجانب سلاسل وسط بقايا هذه الأزواج بالاتصال على أساس المسافات التي لوحظت في الهياكل المعروفة في PDB. I – TASSER سوف احاول ان اضع هذه الأزواج ذرة بالقرب من المسافة المحددة خلال المحاكاة صقل الهيكل.
باء تحديد قالب بنية البروتين
LOMETS برامج الترابط استخدام المكتبة للعثور على ممثل PDB طيات المعقول البروتوكول الاضافي للاستعلامعين. على الرغم من استخدام مكتبة هيكل ممثل يساعد على تقليل الوقت اللازم لحساب التحالفات تسلسل الهيكل ، فمن الممكن أن يكون غاب عن البروتين قالب جيدة في المكتبة أو قد لا القالب تم تحديدها من قبل برامج LOMETS الترابط ، حتى ولو كان موجودة في المكتبة. في هذه الحالات ، يجب على المستخدم تحديد بنية البروتين المطلوب كقالب.
لتحديد بنية البروتين بمثابة قالب إضافية ، يمكن للمستخدمين تحميل إما ملف PDB هيكل تنسيق أو تحديد هوية PDB من بنية البروتين المودعة في مكتبة PDB. سوف I – TASSER توليد محاذاة الاستعلام القالب باستخدام برنامج حشد 23 و سيجمع القيود المكانية من المستخدم على حد سواء قالب محدد وLOMETS قوالب للاسترشاد بها في محاكاة هيكل التجمع. لأن دقة القيود LOMETS يختلف عن أهداف مختلفة ، وثقل القيود LOMETS أقوى في تا (مثلي) سهلrgets من ذلك في الأهداف الثابتة (غير المتماثلة) ، والتي تم ضبطها بشكل منهجي في تدريبنا القياسي.
يمكن للمستخدمين أيضا تحديد الخاصة بهم الاستعلام قالب التحالفات. الخادم يقبل المحاذاة في شكلين : الشكل FASTA (الشكل 9A) وشكل 3D (الشكل 9B). تنسيق FASTA هو معيار وصفها في http://zhanglab. ccmb.med.umich.edu / FASTA / . شكل 3D مشابه لتنسيق PDB القياسية ( http://www.wwpdb.org/documentation/format32/sect9.html ) ، ولكن تضاف عمودين إضافية مشتقة من قوالب لسجلات ATOM (انظر الشكل 9B) :
أعمدة 1-30 : اتوم (C – ألفا فقط) وبقايا أسماء لتسلسل الاستعلام.
الأعمدة 31-54 : إحداثيات C – ذرات ألفا من الاستعلام نسخ من ذرات المناظرة في القالب.
الأعمدة 55-59 : عدد بقايا الموافق في القالب على أساس التوافق
الأعمدة 60-64 : اسم بقايا الموافق في القالب
استبعاد القوالب البروتينات
البروتينات هي جزيئات مرنة ويمكن أن تتبنى الدول متعلق بتكوين عدة لتغيير نشاطهم البيولوجي. على سبيل المثال ، قد حلت هياكل تحركات البروتينات وكثير من البروتينات في الغشاء التشكل على حد سواء نشطة وغير نشطة. كما يمكن وجود أو غياب الالتزام يجند تسبب تحركات هيكلية كبيرة. في حين أن جميع الدول بتكوين جزئي من القالب على حد سواء لبرامج الترابط ، فمن المستحسن أن نموذج الاستعلام باستخدام القوالب في دولة واحدة فقط خاصة. خيار جديد على الخادم يسمح للمستخدم لاستبعاد البروتينات قالب خلال النمذجة هيكل. وهذه الميزة تسمح للمستخدم أيضا اختيار مستوى التماثل من القوالب لاستخدامها للنمذجة. يمكن للمستخدمين قالب استبعاد البروتينات الابام المكتبة I – TASSER من قبل :
أ تحديد هوية قطع تسلسل
يمكن للمستخدمين استخدام هذا الخيار لاستبعاد البروتينات مثلي من مكتبة قالب I – TASSER. يتم تعيين مستوى التماثل على أساس تسلسل قطع الهوية ، أي عدد من بقايا متطابقة بين الاستعلام والبروتين قالب مقسوما على طول تسلسل تسلسل الاستعلام. على سبيل المثال ، إذا كان المستخدم في أنواع "70 ٪" في شكل المقدمة ، قوالب جميع البروتينات التي لها هوية تسلسل> 70 ٪ من البروتين الاستعلام I – سيتم استبعادها من مكتبة قالب I – TASSER.
باء استبعاد البروتينات قالب معين
ويمكن استبعاد البروتينات قالب معين من مكتبة قالب I – TASSER عن طريق تحميل قائمة تحتوي على معرفات PDB الهياكل سيتم استبعادها. ويظهر ملف سبيل المثال في الشكل 10. كما يمكن للبروتين موجود نفس كإدخالات متعددة في مكتبة PDB ، I – TASSER حد ذاتهاسوف rver افتراضيا استبعاد قوالب معينة (في Column1) ، فضلا عن جميع القوالب الأخرى من المكتبة التي تحتوي على هوية> 90 ٪ لقوالب معينة. يمكن للمستخدمين أيضا تحديد قطع هوية مختلفة ، على سبيل المثال 70 ٪ ، حيث سيتم استبعاد كافة القوالب مع الحفاظ على الهوية> 70 ٪ من البروتينات قالب محدد.
The authors have nothing to disclose.
ويدعم هذا المشروع جزئيا من قبل ألفريد سلون مؤسسة P. ، جائزة شهادة NSF (DBI 1027394) ، والمعهد الوطني للعلوم الطبية العامة (GM083107 ، GM084222).