IDBac هو خط أنابيب المعلوماتية الحيوية القائمة على الطيف الكتلي المفتوح المصدر الذي يدمج البيانات من كل من البروتين السليم وأطياف المستقلب المتخصصة، التي تم جمعها على مواد الخلايا كشط من المستعمرات البكتيرية. يسمح خط الأنابيب للباحثين بتنظيم المئات إلى الآلاف من المستعمرات البكتيرية بسرعة في مجموعات تصنيفية مفترضة، وتمييزها بشكل أكبر على أساس إنتاج المستقلب المتخصص.
من أجل تصور العلاقة بين الفيلوجيني البكتيري وإنتاج المستقلب المتخصص للمستعمرات البكتيرية التي تنمو على أجار المغذيات، قمنا بتطوير IDBac – وهو امتصاص ليزر بمساعدة مصفوفة منخفضة التكلفة وعالية الإنتاجية بمساعدة المصفوفة/التأين خط أنابيب المعلوماتية الحيوية (MALDI-TOF MS) في وقت الطيران. تم تصميم برنامج IDBac لغير الخبراء، وهو متاح بحرية، وقادر على تحليل عدد قليل إلى الآلاف من المستعمرات البكتيرية. هنا، نقدم إجراءات لإعداد المستعمرات البكتيرية لتحليل MALDI-TOF MS، وتشغيل أداة MS، ومعالجة البيانات والتصور في IDBac. على وجه الخصوص، نحن نوجه المستخدمين كيفية تجميع البكتيريا في dendrograms على أساس بصمات البروتين MS وإنشاء شبكات جمعية المستقلب بشكل تفاعلي (MANs) من بيانات المستقلب المتخصصة.
ومن العوائق الرئيسية أمام الباحثين الذين يدرسون الوظيفة البكتيرية القدرة على تقييم الهوية التصنيفية للكائنات الدقيقة وقدرتها على إنتاج الأيض المتخصص بسرعة وفي وقت واحد. وقد حال ذلك دون إحراز تقدم كبير في فهم العلاقة بين الفيلوجيني البكتيري وإنتاج المستقلب المتخصص في غالبية البكتيريا المعزولة عن البيئة. على الرغم من أن الأساليب المستندة إلىمرض التصلب العصبي المتعدد التي تستخدم بصمات البروتين لتجميع وتحديد البكتيريا هي وصف جيد 1،2،3،4، وقد أجريت هذه الدراسات عموما على مجموعات صغيرة من العزلات، بطريقة خاصة بالأنواع. والأهم من ذلك أن المعلومات المتعلقة بإنتاج المستقلب المتخصص، وهو محرك رئيسي للوظيفة الميكروبية في البيئة، ظلت غير مدمجة في هذه الدراسات. وقد قدم سيلفا وآخرون5 مؤخراً تاريخاً شاملاً يفصّل الاستخدام الناقص لـ MALDI-TOF MS لتحليل الأيض المتخصص ونقص البرمجيات اللازمة للتخفيف من الاختناقات الحالية في مجال المعلوماتية الأحيائية. من أجل معالجة أوجه القصور هذه، أنشأنا IDBac، خط أنابيب المعلوماتية الحيوية التي تدمج كل من وسائط الخطية والعاكسة من MALDI-TOF MS6. وهذا يسمح للمستخدمين لتصور بسرعة وتمييز العزلات البكتيرية على أساس كل من البروتين والمتخصصة metabolite MS بصمات الأصابع، على التوالي.
IDBac هو فعال من حيث التكلفة، والإنتاجية العالية، ومصممة للمستخدم العادي. وهي متاحة بحرية (chasemc.github.io/IDBac)، وتتطلب فقط الوصول إلى مطياف كتلة MALDI-TOF (سيكون وضع الانعكاس مطلوبا لتحليل المستقلب المتخصص). يعتمد إعداد العينات على طريقة “النقل المباشر الموسع” البسيطة7 و8 ويتم جمع البيانات مع عمليات الاستحواذ الخطية والانعكاسية المتتالية على بقعة واحدة من أهداف MALDI. مع IDBac، فمن الممكن تحليل إنتاج فيلوجيني المفترضة والمستقلب المتخصصة من مئات المستعمرات في أقل من أربع ساعات، بما في ذلك إعداد العينة، والحصول على البيانات، والتصور البيانات. وهذا يمثل ميزة كبيرة من الوقت والتكلفة على الأساليب التقليدية لتحديد البكتيريا (مثل تسلسل الجينات)، وتحليل الناتج الأيضي (قياس الطيف الكتلي للكروماتوغرافيا السائلة [LCMS] والأساليب الكروماتوغرافية المماثلة).
باستخدام البيانات التي تم الحصول عليها في تحليل الوضع الخطي، يستخدم IDBac التجميع الهرمي لتمثيل الصلة بين أطياف البروتين. وبما أن الأطياف تمثل في الغالب بروتينات ريبوسومال المأينة، فإنها توفر تمثيلاً للتنوع الجيني الفيوجيني الموجود في عينة. وبالإضافة إلى ذلك، يتضمن IDBac بيانات وضع reflectron لعرض بصمات الأصابع المستقلب المتخصصة كشبكات جمعية المستقلب (MANs). MANs هي شبكات ثنائية تسمح بالتصور السهل لإنتاج المستقلب المشترك والفريد بين العزلات البكتيرية. منصة IDBac يسمح للباحثين لتحليل كل من البروتين وبيانات المستقلب المتخصصة جنبا إلى جنب ولكن أيضا بشكل فردي إذا تم الحصول على نوع واحد فقط من البيانات. الأهم من ذلك، IDBac يعالج البيانات الخام من أدوات بروكر وشيامن، فضلا عن TXT، علامة التبويب، csv، mzXML، وmzML. يؤدي ذلك إلى إزالة الحاجة إلى التحويل اليدوي وتنسيق مجموعات البيانات، ويقلل بشكل كبير من خطر خطأ المستخدم أو سوء التعامل مع بيانات MS.
بروتوكول IDBac تفاصيل البروتين البكتيري والمستقلب المتخصصة الحصول على البيانات وتحليل ما يصل إلى 384 عزلات بكتيرية في 4 ح من قبل باحث واحد. مع IDBac ليست هناك حاجة لاستخراج الحمض النووي من العزلات البكتيرية أو توليد مقتطفات المستقلب المتخصصة من مرق التخمير السائل وتحليلها باستخدام أساليب كروماتوغرافية. بدلا من ذلك، يتم جمع البروتين وبيانات المستقلب المتخصصة ببساطة عن طريق نشر المواد من المستعمرات البكتيرية مباشرة على لوحة الهدف MALDI. وهذا يقلل إلى حد كبير من الوقت والتكلفة المرتبطة بالتقنيات البديلة مثل تسلسل الجينات 16S rRNA وLCMS9.
من المهم إضافة مصفوفة فارغة وبقع معايرة إلى لوحة MALDI، ونحن نوصي باستخدام عدد مناسب من النسخ المتماثلة لضمان استنساخ والثقة الإحصائية. وسوف تكون أعداد النسخ المتماثلة تعتمد على التجربة. على سبيل المثال، إذا كان المستخدم ينوي التمييز بين آلاف المستعمرات ومجموعة من لوحات التنوع البيئي، فقد يكون من الضروري إجراء نسخ متماثل أقل (يقوم مختبرنا بجمع ثلاثة نسخ تقنية في كل مستعمرة). بدلا من ذلك، إذا كان المستخدم يرغب في إنشاء قاعدة بيانات مخصصة من سلالات من taxa البكتيرية محددة لتحديد بسرعة تصنيفات الأنواع الفرعية من عزلات غير معروفة، ثم أكثر تكرارات مناسبة (مختبرنا يجمع ثمانية نسخ بيولوجية لكل سلالة).
IDBac هو أداة للتثواب بسرعة عالية ذات الصلة العزلات البكتيرية على أساس المعلومات التصنيفية المفترضة وإنتاج المستقلب المتخصصة. يمكن أن تكمل أو تكون بمثابة مقدمة لطرق متعامدة مثل التحليلات الوراثية المتعمقة، والدراسات التي تنطوي على إنتاج المستقلب والوظيفة، أو توصيف بنية المستقلب المتخصصة عن طريق التحليل الطيفي للرنين المغناطيسي النووي و / أو LC-MS/MS.
إنتاج المستقلب المتخصصة (IDBac MANs) هو عرضة للغاية لظروف النمو البكتيري، وخاصة باستخدام وسائل الإعلام المختلفة، وهو الحد المحتمل للطريقة. ومع ذلك يمكن استغلال هذه الصفات من قبل المستخدم، كما IDBac يمكن أن تولد بسهولة MANs تبين الاختلافات في إنتاج المستقلب المتخصصة في ظل مجموعة متنوعة من ظروف النمو. من المهم أن نلاحظ أنه في حين أن بصمات المستقلب المتخصصة قد تختلف حسب حالة النمو، فقد أظهرنا في السابق أن بصمات البروتين لا تزال مستقرة نسبيا عبر هذه المتغيرات (انظر Clark et al.6). عند التعامل مع لوحات التنوع البيئي، نوصي بتنقية العزلات البكتيرية قبل التحليل من أجل تقليل المساهمات المحتملة من الحديث البكتيري المجاور.
وأخيرا، فإن عدم وجود قاعدة بيانات عامة يمكن البحث فيها من بصمات البروتين MS هو قصور كبير في استخدام هذه الطريقة لتصنيف البكتيريا البيئية غير معروف. أنشأنا IDBac مع هذا في الاعتبار، وشملت التحويل الآلي للبيانات إلى شكل مفتوح المصدر مقبول من قبل المجتمع (mzML)10،11،12 وتصميم البرنامج للسماح بالبحث، وتقاسم، وإنشاء قواعد بيانات مخصصة. ونحن بصدد إنشاء قاعدة بيانات عامة كبيرة (>000 10 سلالات تتميز بالكامل)، مما سيسمح بتصنيف بعض العزلات إلى مستوى الأنواع، بما في ذلك وصلات بأرقام الانضمام إلى GenBank عند توافرها.
IDBac هو مفتوح المصدر والتعليمات البرمجية متاحة لأي شخص لتخصيص تحليل البيانات واحتياجات التصور. نوصي المستخدمين باستشارة مجموعة واسعة من المؤلفات (ساور وآخرون7وسيلفا وآخرون5)للمساعدة في دعم وتصميم أهدافهم التجريبية. نستضيف منتدى للمناقشة في: https://groups.google.com/forum/#!forum/idbac ووسيلة للإبلاغ عن القضايا مع البرنامج في: https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
وقد دعم هذا العمل المعهد الوطني للعلوم الطبية العامة منحة R01 GM125943، المنحة الجغرافية الوطنية CP-044R-17؛ منحة صندوق البحوث الآيسلندي ة 152336-051؛ وجامعة إلينوي في صناديق بدء التشغيل شيكاغو. كما نشكر المساهمين التالين: الدكتورة أماندا بولمان على مساعدتها في معايير اكتساب بروتين MALDI-TOF MS. الدكتور تيري مور والدكتور أتول جاين لبلورة ألفا-سيانو-4-هيدروكسيسيناميك حمض مصفوفة (CHCA).
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |