خلافا لبيانات تسلسل الحمض النووي، لا تخضع البيانات ابيجينوميك سهولة البحث المستندة إلى نص. المقدمة هنا هي الإجراءات استخدام إصدار تم ترقيته من جينيمو، أداة للمعلوماتية على شبكة الإنترنت، لإجراء عمليات تفتيش على أساس نمط لأوجه التشابه في البيانات ابيجينوميك مقارنة قواعد البيانات المتاحة على الإنترنت بما في ذلك “عناصر الموسوعة الحمض النووي” مع البيانات الخاصة بالمستخدم.
مقارنة مع أدوات بحث قوية تستند إلى نص للجينوم أو الحمض النووي الريبي تسلسل البيانات، المنهجيات الحالية لعمليات البحث على أساس نمط ابيجينوميك وغيرها من البيانات الجينومية الوظيفية محدودة جداً. جينيمو هو أول أداة للبحث على الإنترنت أن يحقق هذا الهدف. المستخدمين إدخال البيانات الجينومية الوظيفية في البيانات القابلة للتوسيع المستعرض (سرير) والقمم، ونتأمل تنسيقات، والبحث عن البيانات في أي من التنسيقات الثلاثة. قد للمستخدمين تحديد أي أنواع من مجموعات البيانات للبحث ضد، اختيار من مجموعة متنوعة من قواعد البيانات على الإنترنت، مع موسوعة من الحمض النووي العناصر (ترميز) تمثل علامات ابيجينوميك مختلفة ومواقع الربط عامل النسخي الكروماتين هايبرسينسيتيفيتيس أو وصول في أنواع محددة من الخلايا، ومراحل النمو أو الأنواع (الماوس أو الإنسان). جينيمو إرجاع قائمة بمناطق الجينوم مع مطابقة الأنماط لإدخال البيانات، التي قد تكون عرضه في المستعرض، فضلا عن تحميلها بتنسيق ملف سرير. جينيمو ترقية تحسن عرض رسومي، واجهة أكثر قوة، ولم يعد عرضه للأخطاء بسبب التغييرات في جامعة كاليفورنيا، “سانتا كروز” (التسخن) مستعرض الجينوم. وتناقش خطوات استكشاف الأخطاء وإصلاحها لمشاكل مشتركة. كما يزداد مقدار البيانات الجينومية الوظيفية أضعافاً مضاعفة، هناك حاجة ماسة إلى تطوير وصقل أدوات bioinformatic جديدة مثل جينيمو لتحليل البيانات وتفسيرها.
وأتاحت التطورات التكنولوجية الحديثة لتوسع سريع في ابيجينوميك أو مستودعات البيانات الجينومية الوظيفية، التي قد فاقت تطوير الأدوات التحليلية ذات الصلة لاستخراج الأفكار البيولوجية. هو إحدى الطرق الهامة لتحليل البيانات ابيجينوميك للبحث عن البيانات التي تم إنشاؤها المستخدم ضد مستودعات البيانات ولا سيما من المشاريع1 موسوعة عناصر الحمض النووي (ترميز) لمطابقة الأنماط التي يمكن أن تؤدي إلى معرفة جديدة. على سبيل المثال، تحديد أوجه التشابه في أنماط علامتي ابيجينوميك مختلفة في مواضع محددة على نطاق الجينوم قد تشير إلى العمل المنسق من جانب مختلف اللاعبين الجزيئية على تكيف الكروماتين وتنظيم النسخي2 ،،من34.
محركات البحث التقليدية المستندة إلى نص غير فعالة في هذا الصدد لأنه، خلافا لتسلسل الحمض النووي، توجد بيانات ابيجينوميك غالباً في شكل كثافات أو مناطق الجينوم الوظيفي. جينيمو، الدائمة للجينات نيمو (كما هو الحال في العثور على نيمو)، وضعت لمعالجة هذه الحاجة غير الملباة باستخدام عمليات البحث على أساس نمط5. ويستخدم الخوارزمية عملية تعظيم “سلسلة ماركوف مونتي كارلو”5. أن مستخدمي البيانات الخاصة بهم أو تحميل dataset من مستودعات والبحث عن مجموعة بيانات على شبكة الإنترنت ابيجينوميك التعرف على أوجه التشابه في أنماط.
الإصدار الحالي من جينيمو لديه عرض محدث، واجهات أكثر قوة مع جامعة كاليفورنيا، “سانتا كروز” (التسخن) مستعرض الجينوم6، وهو أقل عرضه للقضايا الناجمة عن التغيرات في الحالة الأخيرة. على وجه الخصوص، بينما يستخدم جينيمو في صفحة نتائج لأن يستند إلى واجهة المستعرض الجينوم التسخن، الإصدار الحالي من جينيمو يدعم صفحة النتائج الخاصة بها ونتيجة لذلك لم يعد سلبيا تتأثر بالتغييرات الهيكلية إلى مستعرض الجينوم التسخن. ويمكن استخدام جينيمو أي إشارة الجينوم، بما في ذلك البروتين ملزمة، هستون تعديل، الوصول الكروماتين، المجالات الطوبوغرافية، وهلم جرا، كاستعلام للبحث عن القطع كولوكاليزيد/مماثلة بين مجموعات البيانات المعروفة من اتحادات كبيرة. ولذلك، أداة هامة لدراسة العلاقة بين البيانات ابيجينوميك مختلفة للفائدة والبيانات المعروفة التي تم إنشاؤها في مشاريع الجينوم واسعة النطاق.
فهم دقيق ابيجينومي مطلوب لتحقيق الإمكانات الكاملة لتسلسل الجينوم البشري في تقديم رؤى البيولوجية الجديدة8. وهناك حاليا طرق فقط للبحث في مجموعات البيانات على شبكة الإنترنت ابيجينوميك بوصف البيانات والعنوان (أي، بيانات التعريف)1. وهذا يحد بشدة من أنواع البحث واحد يمكن القيام به مع البيانات ابيجينوميك. أدوات البحث على أساس نمط للبيانات ابيجينوميك ضرورية لاستكشاف العلاقة بين علامات ابيجينوميك مختلفة، والتي قد تؤدي إلى الأفكار البيولوجية الجديدة. جينيمو، الذي يبحث بمحتوى البيانات وليس البيانات الوصفية، الخدمة الأولى من نوعها لمقارنة أنماط في البيانات ابيجينوميك من مستودعات المنشورة مثل ترميز قاعدة البيانات مع المستخدم-إنشاء أو تحميل dataset5. وهذا يمثل بداية لتوافر أداة البحث ابيجينوميك التي متاحة على نطاق واسع للباحثين في جميع أنحاء العالم مجرد أداة البحث عن سلسلة نصية أصبحت متاحة على نطاق واسع في التسعينات. حاليا، لا توجد بدائل لأدوات البحث على الإنترنت على أساس نمط للبيانات ابيجينوميك خلاف جينيمو.
هو مثال المحتملة لاستخدام جينيمو للبحث في التعديلات هيستون الظهور المشترك وعلامات جينية أخرى مع عامل النسخي E2F6 في الخلايا الجذعية الجنينية البشرية (ملف إشارة ربط مثال E2F6 متاح في ترميز بيانات المدخل أو في https://sysbio.ucsd.edu/public/xcao3/ENCODESample/ENCFF001UBC.bed). باستخدام هذا الملف كاستعلام البحث ضد جميع مجموعات البيانات ترميز في H1-هيس، جينيمو سوف تظهر أن E2F6 الملزمة إشارة المخصب بشكل كبير مع H3K4me1، H3K4me2، H3K4me3، و H3K27me3، التي تتفق مع البحوث الحالية تبين أن E2F6 ينظم بعض الجينات عن طريق مثلايشن من H3K279. من ناحية أخرى، يبدو أن هناك كولوكاليزاتيون مواقع الربط E2F6 و CtBP2، الذي يعرف بالتفاعل مع عامل في نفس الأسرة، E2F710. يمكن الحصول على هذه النتائج للجينوم الكامل ضد عدد كبير من علامات جينية والنسخي عامل ربط الإشارات والإشارات الأخرى المدرجة في ترميز إلى حد ما بسهولة مع جينيمو، التي يمكن أن توفر جميع الأهداف المحتملة لمزيد من التحليل.
منذ أول منشور5 من جينيمو كأداة للبحث عن بيانات على شبكة الإنترنت ابيجينوميك، تم تحديث مقطع النتائج من جينيمو أن يكون مظهر مطابقة مع جينيمو في الصفحة الأولى. مقطع النتائج القديمة عن كثب لها نسخ متطابقة القسم نتائج مستعرض الجينوم التسخن، ويتوقف إلى حد كبير على الملقم البعيد التسخن للعرض. مع واجهة جديدة، وجينيمو أكثر سهولة في الاستخدام، ولم تعد تعتمد على الملقم الجينوم التسخن (على الرغم من أن لا يزال يتم جلب البيانات عن بعد). وهذا يجعل جينيمو أكثر قوة وأقل عرضه لمشاكل بسبب التغييرات في التعليمات البرمجية على الخادم التسخن. وعلاوة على ذلك، يعطي واجهة البوليمر جديدة، وأسرع من جينيمو المستخدم المزيد من الأدوات لتصور وتحليل أنماط في البيانات.
وتشمل الخطوات الحاسمة توفير ملف الإدخال المناسبة وتحديد مسارات البيانات للبحث ضد. المستخدمين ينصح بشدة بالتجربة مع مختلف مهام اختيار المسار لتصبح على دراية بعملية الاختيار وأوامر مختلفة كيف يمكن الجمع بين تحقيق النتيجة المتوخاة. على وجه الخصوص، لاحظ أن الدالة “إضافة” مطلوب لإضافة المسارات المطلوبة المحددة في الاستعلام، بينما يمكن استخدام “تصفية” أو “استبعاد” كبوابة منطق الأوامر “AND” و “أو”، على التوالي. مطلوب وظيفة “التحديث” تؤثر على كافة التحديدات قبل تنفيذ عملية البحث. عندما يتم إرجاع أية نتائج، مستخدم يمكن التحقق من ملف بيانات الإدخال أو البحث أكثر المسارات أو زيادة نطاق البحث. عندما يكون هناك خطأ، سيكون هناك نافذة ظهرت في تعريف ما بالضبط الخطأ. وهناك بعض الأخطاء الغامضة، على الرغم. على سبيل المثال، عند النافذة يقول أنه ‘لا يوجد ملف تم تحميله’، أما تم تحميل أي ملف، أو الملف الذي تم تحميله ليس من صيغة مقبولة ونتيجة لذلك، البرنامج لم يكن قادراً على قراءتها بشكل صحيح. تتضمن تنسيقات الملفات المقبولة لإيداع الملف سرير وقمم تنسيق الملف لأساليب تحميل على حد سواء، ونتأمل لتحميل الارتباط عبر الإنترنت فقط. إصدارات تنسيقات هذه الملفات من نوع zip تكون مقبولة أيضا.
وتشمل القيود المفروضة حاليا على هذا النهج بعد الأمثل الخوارزميات ووظائف العاملين في جينيمو. جينيمو لا يمكن حتى الآن تقديم أي توجيه في تفسير أية مجموعات البيانات التي تم إرجاعها. هذه المهمة ما يصل إلى المستخدمين، والذي يتطلب معرفة كبيرة وخبرة في بيولوجيا الجينوم وابيجينومي. وبالإضافة إلى ذلك، الحد الحالي آخر أنه يتعذر على المستخدمين تغيير مستوى الحساسية والضوضاء لعمليات البحث. ونتوقع أن يواصل تحسين وتوسيع نطاق جينيمو على نمط البحث عن القدرات وجمع البيانات في المستقبل.
The authors have nothing to disclose.
هذا العمل كان يدعمها في المعاهد الوطنية للصحة المنح بما في ذلك DP1HD087990 من NICHD، R01HG008135 من نهجري. ونشكر أعضاء مختبر تشونغ لتعليقات قيمة.
مساهمات مقدم البلاغ:
تحديث X.C. و A.T.Z. جينيمو بترميز واجهة جديدة والميزات؛ A.T.Z. إنتاج الفيديو عينة داخلية؛ A.T.Z. و X.C و S.Z. وكتب الورق.