LEfSe (حجم تأثير LDA) هو أداة لتعدين المؤشرات الحيوية عالية الأبعاد لتحديد السمات الجينومية (مثل الجينات والمسارات والتصنيفات) التي تميز بشكل كبير مجموعتين أو أكثر في بيانات الميكروبيوم.
هناك اهتمام متزايد نحو الجينوم البيولوجي المغلق في البيئة والصحة. لاستكشاف والكشف عن الاختلافات بين المجموعات بين العينات أو البيئات المختلفة ، من الأهمية بمكان اكتشاف المؤشرات الحيوية ذات الاختلافات الإحصائية بين المجموعات. يمكن أن يساعد تطبيق التحليل التمييزي الخطي لحجم التأثير (LEfSe) في العثور على مؤشرات حيوية جيدة. استنادا إلى بيانات الجينوم الأصلية ، يتم إجراء مراقبة الجودة والقياس الكمي للتسلسلات المختلفة بناء على التصنيفات أو الجينات. أولا ، تم استخدام اختبار رتبة Kruskal-Wallis للتمييز بين الاختلافات المحددة بين المجموعات الإحصائية والبيولوجية. بعد ذلك ، تم إجراء اختبار رتبة ويلكوكسون بين المجموعتين اللتين تم الحصول عليهما في الخطوة السابقة لتقييم ما إذا كانت الاختلافات متسقة. وأخيرا، أجري تحليل تمييزي خطي (LDA) لتقييم تأثير المؤشرات الحيوية على مجموعات مختلفة اختلافا كبيرا استنادا إلى درجات LDA. باختصار ، وفر LEfSe الراحة لتحديد المؤشرات الحيوية الجينومية التي تميز الاختلافات الإحصائية بين المجموعات البيولوجية.
المؤشرات الحيوية هي خصائص بيولوجية يمكن قياسها ويمكن أن تشير إلى بعض الظواهر مثل العدوى أو المرض أو البيئة. من بينها ، قد تكون المؤشرات الحيوية الوظيفية وظائف بيولوجية محددة لنوع واحد أو مشتركة بين بعض الأنواع ، مثل الجينات والبروتين والمستقلب والمسارات. إلى جانب ذلك ، تشير المؤشرات الحيوية التصنيفية إلى نوع غير عادي ، أو مجموعة من الكائنات الحية (المملكة ، الفصيلة ، الطبقة ، الترتيب ، العائلة ، الجنس ، الأنواع) ، أو Varient Sequence Amplicon (ASV)1 ، أو وحدة التصنيف التشغيلية (OTU)2. من أجل العثور على المؤشرات الحيوية بسرعة ودقة أكبر ، من الضروري وجود أداة لتحليل البيانات البيولوجية. يمكن تفسير الاختلافات بين الفئات بواسطة LEfSe إلى جانب الاختبارات القياسية للدلالة الإحصائية والاختبارات الإضافية التي تشفر الاتساق البيولوجي وأهمية التأثير3. يتوفر LEfSe كوحدة مجرة ، وصيغة كوندا ، وصورة عامل رصيف ، ويتم تضمينه في bioBakery (VM و cloud)4. بشكل عام ، غالبا ما يستخدم تحليل التنوع الميكروبي اختبارا غير بارامتري للتوزيع غير المؤكد لمجتمع العينة. اختبار مجموع الرتب هو طريقة اختبار غير بارامترية ، والتي تستخدم رتبة العينات لتحل محل قيمة العينات. وفقا لاختلاف مجموعات العينات ، يمكن تقسيمها إلى عينتين مع اختبار مجموع رتبة ويلكوكسون وإلى عينات متعددة مع اختبار Kruskal-Wallis 5,6. ومن الجدير بالذكر أنه عندما تكون هناك اختلافات كبيرة بين مجموعات متعددة من العينات، ينبغي إجراء اختبار مجموع الرتب للمقارنة الزوجية لعينات متعددة. LDA (الذي يرمز إلى التحليل التمييزي الخطي) الذي اخترعه رونالد فيشر في عام 1936 ، هو نوع من التعلم تحت الإشراف ، والمعروف أيضا باسم Fisher’s Linear Discriminant7. إنها خوارزمية كلاسيكية وشعبية في المجال الحالي لاستخراج بيانات التعلم الآلي.
هنا ، تم تحسين فحص LEfSe بواسطة خوادم Conda و Galaxy. يتم تحليل ثلاث مجموعات من تسلسلات جينات 16S rRNA لإظهار الاختلافات الكبيرة بين المجموعات المختلفة مع درجات LDA من المجتمعات الميكروبية ونتائج التصور.
هنا ، يتم وصف بروتوكول تحديد وتوصيف المؤشرات الحيوية داخل مجموعات مختلفة. يمكن بسهولة تكييف هذا البروتوكول مع أنواع العينات الأخرى ، مثل OTUs للكائنات الحية الدقيقة. يمكن للطريقة الإحصائية بواسطة LEfSe العثور على الكائنات الحية الدقيقة المميزة في كل مجموعة (الافتراضي هو LDA >2) ، أي الكائنات الح…
The authors have nothing to disclose.
تم دعم هذا العمل من خلال منحة من صناديق البحوث الأساسية للمعاهد المركزية لبحوث الرفاه العام (TKS170205) ومؤسسة تطوير العلوم والتكنولوجيا ، ومعهد تيانجين لبحوث هندسة النقل المائي (TIWTE) ، M.O.T. (KJFZJJ170201).