نحن نقدم البوابة علي شبكه الإنترنت CorExplorer ، وهو مورد لاستكشاف الورم الحمض الريبي النيبالي التسلسل العوامل التي وجدتها اله التعلم خوارزميه CorEx (شرح الارتباط) ، وتبين كيف يمكن تحليل العوامل بالنسبة للبقاء علي قيد الحياة ، والشروح قاعده البيانات ، تفاعلات البروتين والبروتين ، وبعضها البعض لاكتساب نظره ثاقبه في البيولوجيا السرطانية والتدخلات العلاجية.
تحليل التعبير الجيني التفاضلي هو تقنيه هامه لفهم حالات المرض. وقد أظهرت خوارزميه التعلم الألى CorEx فائده في تحليل التعبير التفاضلي لمجموعات من الجينات في الورم الحمض الريبي النيبالي-seq بطريقه قد تكون مفيده لتقدم الأورام الدقة. ومع ذلك ، CorEx تنتج العديد من العوامل التي يمكن ان تكون صعبه لتحليل والاتصال بالفهم القائم. لتسهيل مثل هذه الاتصالات ، قمنا ببناء موقع علي شبكه الإنترنت ، CorExplorer ، التي تسمح للمستخدمين بشكل تفاعلي استكشاف البيانات والاجابه علي الاسئله الشائعة المتعلقة بتحليلها. قمنا بتدريب CorEx علي بيانات التعبير الجيني التي تلي الحمض الريبي النيبالي لأربعه أنواع من الأورام: المبيض والرئة وسرطان الجلد والقولون والمستقيم. ثم أدرجنا المقابلة البقاء علي قيد الحياة ، والتفاعلات بروتين البروتين ، علم الجينات (GO) وموسوعة كيوتو من الجينات والجينوم (KEGG) المسار ثراء ، وخرائط الحرارة في الموقع للارتباط مع التصور الرسم البياني عامل. هنا نستخدم البروتوكولات مثال لتوضيح استخدام قاعده البيانات لفهم اهميه عوامل الورم المستفادة في سياق هذه البيانات الخارجية.
منذ تقديمها قبل ما يزيد قليلا عن عقد من الزمان ، وقد أصبح الحمض الريبي النيبالي-seq أداه في كل مكان لقياس التعبير الجيني1. هذا لأنه يتيح السريع ورخيصه التنميط دي نوفو من الناسخ بأكمله من عينه. ومع ذلك ، تعكس البيانات الأورام RNA-seq البيولوجيا الاساسيه التي هي معقده في جوهرها وغالبا ما تكون تحت عينات ، في حين ان البيانات نفسها عاليه الابعاد وصاخبه. وهذا يمثل تحديا كبيرا لاستخراج إشارات موثوق بها. خوارزميه corex روافع متعددة المتغيرات المعلومات المتبادلة للعثور علي أنماط خفيه في مثل هذه الحالات2,3 . وقد تم تكييف هذه التقنية سابقا لتحليل الأورام المبيضية الحمض الريبي-seq عينات من أطلس الجينوم السرطاني (TCGA) وفي هذا السياق يبدو ان لها مزايا كبيره علي أكثر شيوعا أساليب التحليل4.
علي الرغم من ان استخدام RNA-seq هو واسع الانتشار في تطبيقات البحوث, بما في ذلك في علم الأورام, هذه الجهود لم تؤد إلى استخدام واسع لأغراض التدخلات السريرية5. ويتمثل جزء من سبب ذلك في عدم وجود خوارزميات وبرمجيات سهله الاستعمال تستهدف هذه المشاكل المحددة. للمساعدة في سد هذه الفجوة ، قمنا بتصميم البوابة علي شبكه الإنترنت CorExplorer لتمكين الباحثين من مجموعه متنوعة من الخلفيات لدراسة عوامل التعبير الجيني للورم الحمض الريبي النيبالي-seq العينات كما وجدت من قبل CorEx خوارزميه التعلم اله. بوابه corexplorer يدعم التصور التفاعلي والاستعلام عن العوامل من عده أنواع مختلفه من الأورام بما في ذلك الرئة والقولون وسرطان الجلد ، والمبيض6،7،8،9، 10، بهدف مساعده الباحثين للتدقيق من خلال الارتباطات البيانات وتحديد مسارات المرشحين لتقسيم المرضي لأغراض علاجيه.
ونحن نتوقع ان بوابه CorExplorer قد تكون مفيده لعده أنواع من المستخدمين. تم تصميم البوابة مع المستخدم في الاعتبار الذي يرغب في فهم العوامل الواسعة التي تقود الاختلافات التعبير الجينات الفموية في قواعد البيانات العامة ، وربما أيضا وضع الفردية التعبيرات الجينية الشخصية في سياق الأورام مع مماثله الخصائص. بالاضافه إلى البروتوكولات التمثيلية الموضحة هنا ، قد تكون التحقيقات CorExplorer بمثابه نقطه انطلاق لاقتراح فرضيات لمزيد من الاختبارات ، للمقارنة والتباين بين نتائج CorEx علي مجموعات البيانات خارج CorExplorer ، والاتصال تواقيع التعبيرات المرضية لجين واحد أو عدد قليل من الجينات في الورم الفردي إلى المجموعات الأكبر التي قد تتاثر بشكل منسق. وأخيرا ، فانه قد يكون بمثابه مقدمه سهله الاستخدام لتطبيق التعلم الألى لل RNA-seq لأولئك الذين بداوا في هذا المجال.
لقد قدمنا موقع CorExplorer ، وهو خادم الويب المتاح للجمهور للاستكشاف التفاعلي لعوامل التعبير الجيني المرتبطة بشكل اقصي المستفادة من الورم RNA-seq بواسطة خوارزميه CorEx. لقد أظهرنا كيف يمكن استخدام الموقع لتقسيم المرضي وفقا لتعبير الجينات الورم ، وكيف يتوافق هذا التقسيم الطبقي مع الوظيفة البيولوجية والبقاء علي قيد الحياة.
وقد بنيت خوادم الويب الأخرى للتحليل المتسلسل الRNA. ويمكن فحص الفرق وتحليل التعبير المشترك للأورام ودمجها مع أنواع البيانات الأخرى في cbioportal19,20. الخوادم GenePattern21، mev22، وموفيفوس23، دمج تقنيات التجميع المعمول بها مثل تحليل المكونات الرئيسية (PCA) ، kmeans ، أو خرائط التنظيم الذاتي (سوم). وتشمل الجهود الأكثر ابتكارا CamurWeb24، استنادا إلى المصنف توليد القواعد الألى ، و tacco25، الذي ينفذ عشوائية مصنفات الغابات و لأسوس. خوارزميه CorEx المستخدمة هنا يحسن المعلومات متعددة المتغيرات من أجل العثور علي التسلسل الهرمي للعوامل التي تشرح أنماط في البيانات. ويبدو ان التعلم بالعوامل غير الخطية والهرمية يؤدي إلى تحسن التفسير بالنسبة للعوامل العالمية الخطية الموجودة عن طريق الانيسول الخماسي الكلور4. بالاضافه إلى ذلك ، فان التحليل الدقيق لهذه التقنية لإشارات العينة يسمح باجراء مقارنات دقيقه للورم مقارنه بالأنواع الفرعية الواسعة الشائعة الاستخدام. هذا المزيج من التداخل وتحليل العوامل الهرمية يميز CorExplorer من معظم النهج الأخرى ويتطلب أدوات جديده للتصور والتلخيص.
جزءا هاما من تحليل عامل CorExplorer هو القدرة علي استكشاف ليس فقط عده ، ولكن أكثر من 100 العوامل مع أنماط الجينات المعلوماتية التي يتم وضعها داخل التسلسل الهرمي متداخلة. و CorExplorer يسهل التعدين من هذه العوامل لا تحصي للجمعيات البيولوجية والسريرية ويسمح لتوصيف مفصله بشكل استثنائي من الأورام الفردية. ويعني التعلم غير الخاضع للاشراف لهذا العدد الكبير من العوامل انه لن تكون جميعها ذات صله ببيولوجيا الامراض. في مثل هذه الحالة ، من الضروري اما استخدام الشروح أو الجينات المعروفة لسحب العوامل المثيرة للاهتمام أو البحث عن العوامل المرتبطة بالبيانات السريرية مثل البقاء علي قيد الحياة. التالي ، فان CorExplorer يسمح للمستخدمين لتنفيذ هذه الخطوة تصفيه مهمة جدا. وجود أنماط الجينات عامل في الورم قد توحي حتى نهج لعلاج الأورام شخصيه. وعلاوة علي ذلك ، فان تعدد درجات عامل لكل ورم يسمح لاكتشاف تركيبات علاجيه من المحتمل ان تكون مفيده.
وفي بعض الأحيان ، لا تظهر شروحات GO الهامه للعوامل التي ترتبط ارتباطا وثيقا بالبقاء علي قيد الحياة. في حين ان هذا قد يحدث بسبب صاخبه أو تحت عينات البيانات ، وهناك أسباب محتمله أخرى مثل حجم الكتلة التي هي صغيره جدا لتسجيل عشرات الإثراء الكبيرة أو المجموعة كونها “سله” من جينات واحده من مسارات مختلفه دون متماسكة البيولوجية رابطه. بالاضافه إلى ذلك ، قد يكون من المناسب فئة من التعليقات التوضيحية تختلف عن العملية البيولوجية KEGG و GO ، مثل المقصورة الخلوية. يمكن الوصول إلى هذه عن طريق ربط إلى StringDB كما هو موضح في البروتوكول. ولا يمثل تحليل الإثراء الوراثي للجينات في موقع CorExplorer حاليا الوزن الجيني في أحد العوامل ، وان كان من المرجح تدارك ذلك في المستقبل القريب. ملاحظه يتوفر خيار قائمه الجينات تحت ‘ أضافه نافذه ‘ التي تسمح لتحميل قائمه الجينات عامل كامل لمزيد من التحليل مع الاداات الخارجية.
لأغراض الموقع الكتروني ، تم تشغيل CorEx علي كل من مجموعات البيانات خمس مرات وتم الاحتفاظ بالتشغيل الذي ادي إلى الارتباط الإجمالي الكلي الأكبر. وقد يكون وجود تمثيل إحصائي لنتائج أشواط متعددة أكثر أفاده وهدفا للعمل في المستقبل. بالاضافه إلى ذلك ، فان مجموعه أنواع الأورام المتوفرة علي الخادم صغيره نوعا ما ، ولكننا نتوقع ان يتسع هذا النطاق بمرور الوقت وفقا لاهتمام المستخدم.
كما هو موضح أعلاه ، فان CorExplorer تصور العلاقات العاملة CorEx الحمض الريبي المتسلسل مع المعلومات السريرية وقاعده البيانات ، التالي تمكين مجموعه متنوعة من أنماط مختلفه من الاستجواب. ونحن نامل ان هذه الاداه سوف تؤدي إلى مزيد من العمل علي الاستفادة من قوه تحليل الحمض الريبي النيبالي-seq لاكتشاف وتطبيق السريرية في الأورام.
The authors have nothing to disclose.
تم دعم GV من قبل جائزه DARPA W911NF-16-0575.
Public server for CorExplorer website | USC | http://corex.isi.edu | Intel Xeon E5-2690 4-core 2.6 GHz, 8GB RAM. Backend architecture is LAMP: Linux, Apache, MySQL, PHP. |
Web browser | Google/Apple | Chrome/Safari | Verified web browsers. |