Summary

وITS2 قاعدة البيانات

Published: March 12, 2012
doi:

Summary

قاعدة بيانات ITS2 هو طاولة العمل للاستدلال تسلسل النشوء والتطور في وقت واحد والنظر في هيكل الثانوي هل من نسخها الداخلية (2). وهذا يشمل جمع البيانات مع شرح دقيق، والتنبؤ بنية، متعددة محاذاة تسلسل البنية وسريع الحساب شجرة. باختصار، هذا يبسط تحليل النشوء والتطور طاولة العمل الأولى لعدد قليل من النقرات.

Abstract

وقد استخدم هل الداخلية المحولة 2 (ITS2) كعلامة النشوء والتطور لأكثر من عقدين من الزمن. كما ITS2 ركز البحث بشكل رئيسي على تسلسل ITS2 متغير جدا، وتقتصر هذه العلامة على مستوى منخفض phylogenetics فقط. ومع ذلك، فإن الجمع بين تسلسل ITS2 وهيكلها الثانوي حفظا للغاية يحسن قرار النشوء والتطور (1) ويسمح للاستدلال النشوء والتطور في صفوف التصنيفية متعددة، بما في ذلك ترسيم الحدود الأنواع 2-8.

قاعدة بيانات ITS2 9 يقدم بيانات شاملة الداخلية المحولة متواليات 2 هل من بنك الجينات NCBI 11 reannotated بدقة 10. بعد تعليق توضيحي من قبل نماذج ماركوف المخفية الشخصي (HMMs)، يتوقع أن هيكل الثانوية من كل تسلسل. الأول، هو اختبار ما إذا كان الحد الأدنى للطاقة استنادا أضعاف 12 (أضعاف المباشر) النتائج في الصحيح، والتشكل حلزون الأربعة. إذا لم تكن هذه هي الحالة، هو هيكلوتوقع من قبل النمذجة تناظر 13. وكان هيكل الذي الثانوية في نمذجة تناظر، يتم نقل بنية معروفة بالفعل الثانوية إلى آخر تسلسل ITS2، لم يتمكن من اضعاف بشكل صحيح في حظيرة مباشرة.

قاعدة بيانات ITS2 ليست فقط قاعدة بيانات لتخزين واسترجاع الهياكل تسلسل ITS2. كما يوفر العديد من الأدوات لمعالجة الخاص بك ITS2 متواليات، بما في ذلك التنبؤ، شرح الهيكلية، وكشف عزر وتفجير 14 البحث على معلومات تسلسل هيكل مجتمعة. وعلاوة على ذلك، أنه يدمج الإصدارات قلصت من 4SALE 15،16 و ProfDistS (17) لحساب العديد من محاذاة تسلسل هيكل والجار الالتحاق بالعمل 18 شجرة إعادة الإعمار. معا أنها تشكل خط أنابيب تحليل متماسك من مجموعة أولية من متواليات لنسالة على أساس تسلسل وهيكل ثانوي.

باختصار، هذه طاولة العمل يبسط تحليل النشوء والتطور الأولى إلى فقطبضع نقرات الماوس، في الوقت الذي توفر بالإضافة إلى الأدوات والبيانات للتحليلات واسعة النطاق شاملة.

Protocol

1. الشرح الصحيح من ITS2 تسلسل الوصول إلى قاعدة البيانات نسالة ITS2 طاولة العمل هنا: http://its2.bioapps.biozentrum.uni-wuerzburg.de يبدأ تحليل بالضغط على "علق" رمز في المقطع "أدوات". ثم اكتب أو لصق التسلسل الخاص بك في المحرر تسلسل في الجزء العلوي من الموقع. المحرر تسلسل يتحقق تلقائيا، سواء متواليات الخاص ITS2 صالحة. اختيار نموذج HMM مناسبة لمتواليات الخاص بك (على سبيل المثال Viridiplantae للنباتات). بدء عملية بالنقر على "علق". بواسطة تحوم فوق رمز "هجن" يمكنك عرض صورة لل5.8S و28S هجين الريباسي تأكيدا من دقة هذا الشرح HMM ل. انقر على علامة زائد الخضراء من تسلسل ITS2 الناتج لتحديد طريقك من التنبؤ بنية ثانوية: لتوقع هيكل دون templat معروفه، انقر على "توقع هيكل". إذا كنت ترغب في استخدام قالب خاص بك لنمذجة التماثل، انقر على زر "هيكل النموذجي." 2. الثانوية الهيكل التنبؤ التنبؤ يتم لصق تلقائيا تسلسل ITS2 المشروح في المحرر تسلسل. لبدء التنبؤ هيكل ثانوي مع الإعدادات الافتراضية، انقر على "توقع هياكل" الزر. حفظ التسلسل ITS2 الناتجة بما في ذلك هيكل الثانوي على غرار إلى تجمع البيانات من خلال النقر على علامة زائد الخضراء ومن ثم "إضافة إلى حوض السباحة". بدلا من ذلك، يمكنك إضافته إلى تجمع البيانات الخاصة بك عن طريق السحب والإسقاط (الشكل 1). إذا كان تسلسل لا يمكن طيها مباشرة، وتظهر على أفضل النتائج من النماذج التماثل. حفظ مناسبة معظم تسلسل هيكل خلال السحب والإفلات إلى تجمع البيانات. بدلا من ذلك، حفظ تسلسل هيكل إلى تجمع البيانات بنقرة واليمين ومن ثم النقر على "إضافة إلى حوض السباحة". عرف النمذجة نوع أو عجينة واحدة أو متعددة القوالب (مع هيكل معروف) في المحرر تسلسل العليا. نوع أو لصق متواليات هدف واحد أو عدة (بدون الهيكل) في المحرر أدنى تسلسل. انقر على "توقع أفضل قالب (ق)" لبدء النمذجة التماثل مع الإعدادات الافتراضية. وتظهر أفضل قالب مجموعات المستهدفة في القائمة الناتجة. انقاذ على غرار تسلسل هيكل (ق) من اختيارك إما عن طريق السحب والإفلات إلى تجمع البيانات أو من خلال نقرة والحق والنقر على "إضافة إلى حوض السباحة". 3. عزر البحث اكتب أو لصق تسلسل الاستعلام الخاص بك (ق) في المحرر تسلسل في الجزء العلوي من الموقع. اختيار النموذج الصحيح HMM (على سبيل المثال Viridiplantae للنباتات). 3.3. انقر على "البحث عن الحافز" لبدء العملية. ITS2 متواليات بزخارف هي أبرز illustraتيد في الجزء السفلي من هذا الموقع. انقر على أيقونة بجانب رأس تسلسل لعرض أبرز الزخارف في هيكل الثانوية. 4. بحث وتصفح البحث اكتب إما اسم الأصناف أو معرف بنك الجينات (GI) في حقل البحث في الجزء العلوي من الموقع. ويدعم البحث عن طريق اسم الأصناف من قبل صندوق حية للبحث في الظهور. يمكنك إجراء بحث متعددة بفواصل فصل الاستعلامات. انقر على زر "بحث" لتنفيذ البحث. تظهر قائمة النتائج الخاصة بك في علامة تبويب جديدة. انقر على اسم العمود لفرز النتائج وفقا لعمود خاص. يمكنك أيضا إضافة أو إزالة الأعمدة التي تختارها مع القائمة العمود. يمكن إدخالها في القائمة عمود مع الضغط على أيقونة السهم الظهور ضمن اسم العمود. انقر على "عرض التفاصيل" لعرض تفاصيل عن هيكل التسلسل. </ لى> حفظ تسلسل هيكل (ق) من اختيارك إما عن طريق السحب والإفلات إلى تجمع البيانات أو من خلال نقرة والحق والنقر على "إضافة إلى حوض السباحة". لحفظ النتائج إلى ملف خارجي، انقر على "حفظ التحديد" أو "حفظ جميع". تصفح تصفح قاعدة البيانات ITS2 من خلال التنقل من خلال هيكل شجرة تشبه في الجهة اليسرى من الموقع. انقر على علامة زائد لعرض أصناف من مستوى أدنى. انقر على اسم الأصناف لفتح علامة تبويب جديدة تحتوي على كل تسلسل هيكل من الأصناف. انقر على "عرض التفاصيل" لعرض تفاصيل عن زوج تسلسل هيكل. حفظ تسلسل هيكل (ق) من اختيارك إما عن طريق السحب والإفلات إلى تجمع البيانات أو من خلال نقرة والحق والنقر على "إضافة إلى حوض السباحة". لحفظ النتائج إلى ملف خارجي، انقر على "حفظ التحديد" أو "حفظ جميع". 5. ITS2 انفجار اكتب أو الصق سلاسل الاستعلام واحدة أو متعددة في المحرر تسلسل. قد متواليات الخاص بك أن تكون إما سلاسل النكليوتيد عادي أو أزواج تسلسل هيكل. يمكنك أيضا كتابة الهياكل الثانوية عدة دون سلسلة واحدة. عن طريق التحقق من مربع "تسلسل متواليات XXFASTA" وتستخدم هذه الهياكل في وقت لاحق كما الاستعلامات الفردية. لبدء الانفجار مع الإعدادات الافتراضية، انقر على "الانفجار". تبعا لطبيعة الاستعلام الخاص بك، إما BLASTN مشترك أو ITS2 BLAST تسلسل هيكل يتم تنفيذ. يتم فتح علامة تبويب فرعية لكل تسلسل الاستعلام ضمن علامة التبويب التي تظهر "النتائج الانفجار"، وكذلك لمحة عامة عن عمليات التفتيش المنفذة. انقر على "الأحلاف عرض" لعرض التحالفات BLAST محسوب. حفظ يضرب انفجار اختيارك إما عن طريق السحب والإفلات إلى تجمع البيانات أو من خلال نقرة والحق والنقر على "إضافة إلى حوض السباحة". لحفظ النتائج إلى ملف خارجي، انقر على اختيار حفظ ""أو" حفظ جميع ". 6. متعددة تسلسل هيكل محاذاة نلقي نظرة على تجمع البيانات الخاصة بك بالنقر على "إدارة البيانات" ثم رمز العدسة المكبرة بجوار عدد من تسلسل في حوض السباحة الخاص بك. بدلا من ذلك، يمكنك النقر على علامة تجمع البيانات في الجزء السفلي الأيسر من الموقع. انقر على زوج تسلسل هيكل في تجمع البيانات الخاصة بك لعرض التفاصيل الخاصة به. لإنشاء العديد من تسلسل هيكل محاذاة جميع أزواج تسلسل هيكل في حوض السباحة الخاص بك، انقر على "بيانات تحليل" ثم "وتسلسل الهيكل". الآن يطلب منك تحديد وضع الرسومات من محاذاة الخاص بك. إذا محاذاة الخاص بك يحتوي فقط على تسلسلات قليلة، ورفض وضع سليم بالنقر على "لا". إلا اختيار واسطة ضئيلة الرسم بالنقر على "نعم". في لحظات قليلة، ويظهر التوافق الخاص بك في علامة تبويب جديدة (الشكل 2). وعلاوة على ذلك، يتم حفظ تلقائيا إلى تجمع البيانات. لحفظمحاذاة إلى ملف خارجي، انقر على "حفظ المحاذاة". 7. شجرة المحتد لحساب الجار تسلسل البنية القائمة على الالتحاق بالعمل شجرة من محاذاة الخاص بك متعددة، انقر على "مجموعة بيانات تحليل" ثم "الجار الالتحاق بالعمل". ويتضح من شجرة مما أدى إلى علامة تبويب جديدة (الشكل 3). تسلق شجرة الخاص بحرية مع شريط التمرير "شجرة بسهولة." Reroot بك شجرة من خلال النقر على عقدة أو ورقة من شجرة ثم "Reroot في هذه العقدة". إذا كنت تريد إزالة الأصناف من تجمع البيانات الخاصة بك، انقر على ورقة واختر "إزالة هذه العقدة من حوض السباحة." يمكنك الآن إعادة حساب التوافق الخاص بك، وشجرة مع أخذ عينات الأصناف المخفضة. انقر على "شجرة حفظ" لحفظ شجرة النشوء والتطور الخاص نتيجة النهائية للتحليل الخاص بك إلى ملف NEWICK الخارجية. 8. برامج إضافية انقر على "الانترنت عن هذا" – "أدوات" للعثور على مزيد إعلامأوجه حول 4SALE أدوات قائمة بذاتها وProfDistS. بجانب محاذاة وظيفة الجار الالتحاق بالعمل المقدمة من قبل واجهة قاعدة البيانات على شبكة الإنترنت ITS2، يمكنك الآن الوصول إلى وظائف جديدة عدة، مثل ترسيم الحدود الأنواع على أساس التغييرات قاعدة التعويضية (CBCs). 9. ممثل النتائج وقد تم بنجاح سير العمل كما هو موضح أعلاه تطبق في العديد من المسوحات وصول مفتوحة 3،4. يمكن الاطلاع على أمثلة من خلال الروابط التالية: http://www.plosone.org/article/info 3Adoi٪٪٪ 2F10.1371 2Fjournal.pone.0016931 http://www.biomedcentral.com/1756-0500/3/320 في هذه الدراسات على نطاق واسع، لكننا تمكنا من حل نسالة من كلوروفيتا فضلا عن Hypnales (Bryophyta) ثارتفاع القرار إيث. في كلتا الحالتين، تم جمع عينات الأصناف 1 حصرية من قاعدة البيانات ITS2 9، محاذاة تلقائيا مع 4SALE 15،16 ومعالجتها وأخيرا من قبل ProfDistS 17 إلى شجرة النشوء والتطور. في جميع هذه الخطوات، واستخدمت تسلسل والمعلومات هيكل في وقت واحد. وقد تحقق التمهيد لدعم العمود الفقري باستخدام الجار النشوء والتطور الشخصي الدمج (PNJ) 19، والذي يتوفر في إصدار مستقل من ProfDistS. لمجموعة أصغر من تسلسل هيكل أزواج، والأرقام 1-3 وصف الخطوات الرئيسية لهذا العمل آليا 5 مباشرة على طاولة العمل الجديدة قاعدة البيانات ITS2: أخذ العينات الأصناف، ومتعددة محاذاة تسلسل هيكل شجرة النشوء والتطور، وفي نهاية المطاف على حساب. الشكل 1. أخذ العينات الأصناف في السحب والإفلات. في أي وقت أو تسلسل تسلسل متطوره، ويمكن أن يضاف أزواج ه إلى تجمع البيانات، على سبيل المثال عن طريق السحب والإفلات. هنا يتم إضافة تسلسل هيكل باستخدام السحب والإفلات بعد التنبؤ بنية ثانوية. البيضوي أزرق يمثل منطقة حيث يتم إسقاط تسلسل هيكل إلى تجمع البيانات. اضغط هنا للاطلاع على النسخة الكاملة الحجم من هذه الصورة. الشكل 2. متعددة تسلسل هيكل المحاذاة في وضع رسم كامل. لمتواليات القليلة في تجمع البيانات، وقد تم اختيار الوضع الكامل للرسم. القواعد هي الملونة، ويمكن تسليط الضوء أزواج قاعدة مع الدوائر الحمراء من خلال النقر على قاعدة واحدة أو شريحة من زوج قاعدة. انقر هنا لعرض النسخة الكاملة الحجم من هذه الصورة. 3.JPG "ALT =" شكل 3 "/> الشكل 3. تسلسل هيكل الجار الالتحاق بالعمل شجرة. يمكن حفظ شجرة قابلة للبحرية محسوب من محاذاة الأصناف 7 تسلسل بنية متعددة في شكل NEWICK.

Discussion

قاعدة بيانات ITS2 هو طاولة العمل كاملة وتعمل بكامل طاقتها لالداخلية phylogenetics هل المحولة تسلسل البنية المستندة إلى 2. ويمكن تشغيل هذا الموقع سريع جدا وبشكل حدسي. في حين أن غيرها من المناضد نسالة على شبكة الإنترنت مثل ARB 20 أو 21 هي Mobyle فقط قادرة على العمل في تسلسل و / أو إجماع معلومات الهيكل، وقاعدة البيانات ITS2 9 تعتبر متواليات والهياكل الثانوية لكل فرد من الأصناف في وقت واحد. ومع ذلك، نظرا لمحدودية في القدرة الحسابية من خادم الويب، ويوصى بدرجة كبيرة لاستخدام الأدوات القائمة بذاتها لمحاذاة متعددة والجار الالتحاق بالعمل 18 حساب، 4SALE 15،16 و ProfDistS 17، على التوالي، لمجموعات كبيرة. بجانب الأساسية ITS2 سير العمل نسالة تسلسل هيكل هذه الأدوات ميزة وظائف إضافية عدة، مثل التمهيد حساب مكررات، الجار الملف الدمج (PNJ) 19 أو مسكوكةق ترسيم الحدود على أساس التغيرات قاعدة التعويضية (CBCs) 8. ويمكن الوصول إليها من خلال "حول هذا الموقع" – القسم "أدوات" للتحميل ومعلومات مفصلة. لاستخدام 4SALE وProfDistS، فمن الضروري دائما لتقديم الملفات إلى الشكل الصحيح. ويجب على الأصناف أخذ العينات التي سيتم تجهيزها من قبل 4SALE لها نهاية. fasta أو. TXT، في حين أن محاذاة تسلسل هيكل كمدخل لProfDistS يجب ان تنتهي. xfasta.

ونحن ننفذ حاليا طرق بديلة لإعادة بناء شجرة النشوء والتطور في قاعدة البيانات ITS2 وكذلك في الأدوات ذات الصلة. وبالتالي، فإن أساليب مثل تسلسل هيكل القائم على البخل الحد الأقصى 22 و / أو احتمال الحد الأقصى لتكون في متناول 23 في المستقبل.

Disclosures

The authors have nothing to disclose.

Acknowledgements

نشكر بحرارة المجموعة ITS2، Biocenter، جامعة فورتسبورغ، للوقوف على آرائهم غنية وقيمة. كما نشكر جمعية الألمانية للبحوث (DFG؛ منحة Mu-2831/1-1) للحصول على التمويل.

Materials

Name of the reagent Company Comments
Internet access   Preferably high-speed
ITS2 Database9 Department of Bioinformatics, University of Würzburg Website: http://its2.bioapps.biozentrum.uni-wuerzburg.de
Software: 4SALE15,16 Department of Bioinformatics, University of Würzburg Download: http://4sale.bioapps.biozentrum.uni-wuerzburg.de/
Software: ProfDistS17 Department of Bioinformatics, University of Würzburg Download: http://profdist.bioapps.biozentrum.uni-wuerzburg.de/

References

  1. Keller, A. Including RNA secondary structures improves accuracy and robustness in reconstruction of phylogenetic trees. Biology Direct. 5, 4-4 (2010).
  2. Schultz, J., Maisel, S., Gerlach, D., Müller, T., Wolf, M. A common core of secondary structure of the internal transcribed spacer 2 (ITS2) throughout the Eukaryota. RNA. 11, 361-364 (2005).
  3. Buchheim, M. Internal Transcribed Spacer 2 (nu ITS2 rRNA) Sequence-Structure Phylogenetics: Towards an Automated Reconstruction of the Green Algal Tree of Life. PLoS ONE. 6, 16931-16931 (2011).
  4. Merget, B., Wolf, M. A molecular phylogeny of Hypnales (Bryophyta) inferred from ITS2 sequence-structure data. BMC Research Notes. 3, (2010).
  5. Schultz, J., Wolf, M. ITS2 sequence-structure analysis in phylogenetics: a how-to manual for molecular systematics. Molecular Phylogenetics and Evolution. 52, 520-523 (2009).
  6. Coleman, A. ITS2 is a double-edged tool for eukaryote evolutionary comparisons. Trends in Genetics. 19, 370-375 (2003).
  7. Coleman, A. The significance of a coincidence between evolutionary landmarks found in mating affinity and a DNA sequence. Protist. 151, 1-9 (2000).
  8. Müller, T., Philippi, N., Dandekar, T., Schultz, J., Wolf, M. Distinguishing species. RNA. 13, 1469-1472 (2007).
  9. Koetschan, C. The ITS2 Database III-sequences and structures for phylogeny. Nucleic Acids Research. 38, 275-279 (2010).
  10. Keller, A. 5.8 S-28S rRNA interaction and HMM-based ITS2 annotation. Gene. 430, 50-57 (2009).
  11. Benson, D., Karsch-Mizrachi, I., Lipman, D., Ostell, J., Sayers, E. GenBank. Nucleic Acids Research. 39, 32-37 (2011).
  12. Markham, N., Zuker, M. Software for nucleic acid folding and hybridization. Methods in Molecular Biology. , 453-453 (2008).
  13. Wolf, M., Achtziger, M., Schultz, J., Dandekar, T., Müller, T. Homology modeling revealed more than 20,000 rRNA internal transcribed spacer 2 (ITS2) secondary structures. RNA. 11, 1616-1623 (2005).
  14. Altschul, S. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Research. 25, 3389-3402 (1997).
  15. Seibel, P., Müller, T., Dandekar, T., Wolf, M. Synchronous visual analysis and editing of RNA sequence and secondary structure alignments using 4 SALE. BMC Research Notes. 1, (2008).
  16. Seibel, P., Müller, T., Dandekar, T., Schultz, J., Wolf, M. 4 SALE – A tool for synchronous RNA sequence and secondary structure alignment and editing. BMC Bioinformatics. 7, (2006).
  17. Wolf, M., Ruderisch, B., Dandekar, T., Schultz, J., Müller, T. ProfDistS:(profile-) distance based phylogeny on sequence-structure alignments. Bioinformatics. 24, 2401-2402 (2008).
  18. Saitou, N., Nei, M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Molecular Biology and Evolution. 4, 406-425 (1987).
  19. Müller, T., Rahmann, S., Dandekar, T., Wolf, M. Accurate and robust phylogeny estimation based on profile distances: a study of the Chlorophyceae (Chlorophyta. BMC Evolutionary Biology. 4, (2004).
  20. Ludwig, W. o. l. f. g. a. n. g. ARB: a software environment for sequence data. Nucleic Acids Research. 32, 1363-1371 (2004).
  21. Néron, B. Mobyle: a new full web bioinformatics framework. Bioinformatics. 25, 3005-3011 (2009).
  22. Camin, J. H., Sokal, R. R. A method for deducing branching sequences in phylogeny. Evolution. 19, 311-326 (1965).
  23. Felsenstein, J. Evolutionary trees from DNA sequences: a maximum likelihood approach. Journal of Molecular Evolution. 17, 368-376 (1981).

Play Video

Cite This Article
Merget, B., Koetschan, C., Hackl, T., Förster, F., Dandekar, T., Müller, T., Schultz, J., Wolf, M. The ITS2 Database. J. Vis. Exp. (61), e3806, doi:10.3791/3806 (2012).

View Video