Summary

تحليل الأورام الجينية عوامل التعبير مع البوابة الكترونيه CorExplorer

Published: October 11, 2019
doi:

Summary

نحن نقدم البوابة علي شبكه الإنترنت CorExplorer ، وهو مورد لاستكشاف الورم الحمض الريبي النيبالي التسلسل العوامل التي وجدتها اله التعلم خوارزميه CorEx (شرح الارتباط) ، وتبين كيف يمكن تحليل العوامل بالنسبة للبقاء علي قيد الحياة ، والشروح قاعده البيانات ، تفاعلات البروتين والبروتين ، وبعضها البعض لاكتساب نظره ثاقبه في البيولوجيا السرطانية والتدخلات العلاجية.

Abstract

تحليل التعبير الجيني التفاضلي هو تقنيه هامه لفهم حالات المرض. وقد أظهرت خوارزميه التعلم الألى CorEx فائده في تحليل التعبير التفاضلي لمجموعات من الجينات في الورم الحمض الريبي النيبالي-seq بطريقه قد تكون مفيده لتقدم الأورام الدقة. ومع ذلك ، CorEx تنتج العديد من العوامل التي يمكن ان تكون صعبه لتحليل والاتصال بالفهم القائم. لتسهيل مثل هذه الاتصالات ، قمنا ببناء موقع علي شبكه الإنترنت ، CorExplorer ، التي تسمح للمستخدمين بشكل تفاعلي استكشاف البيانات والاجابه علي الاسئله الشائعة المتعلقة بتحليلها. قمنا بتدريب CorEx علي بيانات التعبير الجيني التي تلي الحمض الريبي النيبالي لأربعه أنواع من الأورام: المبيض والرئة وسرطان الجلد والقولون والمستقيم. ثم أدرجنا المقابلة البقاء علي قيد الحياة ، والتفاعلات بروتين البروتين ، علم الجينات (GO) وموسوعة كيوتو من الجينات والجينوم (KEGG) المسار ثراء ، وخرائط الحرارة في الموقع للارتباط مع التصور الرسم البياني عامل. هنا نستخدم البروتوكولات مثال لتوضيح استخدام قاعده البيانات لفهم اهميه عوامل الورم المستفادة في سياق هذه البيانات الخارجية.

Introduction

منذ تقديمها قبل ما يزيد قليلا عن عقد من الزمان ، وقد أصبح الحمض الريبي النيبالي-seq أداه في كل مكان لقياس التعبير الجيني1. هذا لأنه يتيح السريع ورخيصه التنميط دي نوفو من الناسخ بأكمله من عينه. ومع ذلك ، تعكس البيانات الأورام RNA-seq البيولوجيا الاساسيه التي هي معقده في جوهرها وغالبا ما تكون تحت عينات ، في حين ان البيانات نفسها عاليه الابعاد وصاخبه. وهذا يمثل تحديا كبيرا لاستخراج إشارات موثوق بها. خوارزميه corex روافع متعددة المتغيرات المعلومات المتبادلة للعثور علي أنماط خفيه في مثل هذه الحالات2,3 . وقد تم تكييف هذه التقنية سابقا لتحليل الأورام المبيضية الحمض الريبي-seq عينات من أطلس الجينوم السرطاني (TCGA) وفي هذا السياق يبدو ان لها مزايا كبيره علي أكثر شيوعا أساليب التحليل4.

علي الرغم من ان استخدام RNA-seq هو واسع الانتشار في تطبيقات البحوث, بما في ذلك في علم الأورام, هذه الجهود لم تؤد إلى استخدام واسع لأغراض التدخلات السريرية5. ويتمثل جزء من سبب ذلك في عدم وجود خوارزميات وبرمجيات سهله الاستعمال تستهدف هذه المشاكل المحددة. للمساعدة في سد هذه الفجوة ، قمنا بتصميم البوابة علي شبكه الإنترنت CorExplorer لتمكين الباحثين من مجموعه متنوعة من الخلفيات لدراسة عوامل التعبير الجيني للورم الحمض الريبي النيبالي-seq العينات كما وجدت من قبل CorEx خوارزميه التعلم اله. بوابه corexplorer يدعم التصور التفاعلي والاستعلام عن العوامل من عده أنواع مختلفه من الأورام بما في ذلك الرئة والقولون وسرطان الجلد ، والمبيض6،7،8،9، 10، بهدف مساعده الباحثين للتدقيق من خلال الارتباطات البيانات وتحديد مسارات المرشحين لتقسيم المرضي لأغراض علاجيه.

ونحن نتوقع ان بوابه CorExplorer قد تكون مفيده لعده أنواع من المستخدمين. تم تصميم البوابة مع المستخدم في الاعتبار الذي يرغب في فهم العوامل الواسعة التي تقود الاختلافات التعبير الجينات الفموية في قواعد البيانات العامة ، وربما أيضا وضع الفردية التعبيرات الجينية الشخصية في سياق الأورام مع مماثله الخصائص. بالاضافه إلى البروتوكولات التمثيلية الموضحة هنا ، قد تكون التحقيقات CorExplorer بمثابه نقطه انطلاق لاقتراح فرضيات لمزيد من الاختبارات ، للمقارنة والتباين بين نتائج CorEx علي مجموعات البيانات خارج CorExplorer ، والاتصال تواقيع التعبيرات المرضية لجين واحد أو عدد قليل من الجينات في الورم الفردي إلى المجموعات الأكبر التي قد تتاثر بشكل منسق. وأخيرا ، فانه قد يكون بمثابه مقدمه سهله الاستخدام لتطبيق التعلم الألى لل RNA-seq لأولئك الذين بداوا في هذا المجال.

Protocol

1-استكشاف العوامل التي تحتوي علي جين الفائدة افتح مستعرض ويب وانتقل إلى http://corex.isi.edu ، الصفحة الرئيسية ل CorExplorer. علي الجانب الأيمن تحت الروابط السريعة، انقر علي زر + توسيع بجانب المبيض (tcga-OV) للاطلاع علي ملخص للرسم البياني لعامل corex الذي تم تدريبه علي بيانات سرطان المبيض tcga (كما هو موضح في الشكل 1). اختياريا ، انقر علي الآخرين للمقارنة. بمجرد الانتهاء من التفتيش علي الرسوم البيانية عامل ، انقر عليالرئة (TCGA-LUAD)للوصول إلى الصفحة CorExplorer لسرطان الرئة RNA-seq.استكشف الرسم البياني لعامل CorEx لجينات الاهتمام باستخدام نافذه “عامل الرسم البياني” الخاص ب Corexplرر. حرك مؤشر الماوس فوق نافذه عرض الرسم البياني العامل. التكبير في الرسم البياني عامل باستخدام عجله التمرير الماوس أو لوحه التعقب لمعرفه تفاصيل الرسم البياني مثل الجينات الأكثر اهميه في كل عامل والاتصالات بين العقد في طبقات مختلفه. بدلا من ذلك ، انقر واسحب لنقل منطقه العرض أو اي عقده. للعثور علي الجينات المستهدفة (هنا سنستخدم BRCA1) ، انقر علي القائمة المنسدلة الجينات في الأعلى من نافذه الرسم البياني عامل. اكتب ‘ BRCA1 ‘ لتحديده في القائمة المنسدلة واضغط علي العودة لجعل طريقه العرض التكبير إلى عامل 26 ، العامل الذي BRCA1 هو الأكثر ارتباطا وثيقا. تغيير موضع الماوس فوق عرض الرسم البياني والتمرير للتكبير لرؤية عقده المستوي 2 ، L2_8 ، والعوامل المرتبطة به التي هي الجيران إلى عامل 26. لاحظ انه يتم عرض الجينات فقط مع الوزن أكبر من العتبة المشار اليها علي شريط التمرير الوزن الرابط دقيقه . لمشاهده جميع الجينات المرتبطة بالعامل ، انقر علي العقدة L1_26 وحدد تحميل جينات اضافيه في النافذة المنبثقة. عند ظهور الكلمة “تم” ، اغلق النافذة المنبثقة. الآن العودة إلى القسم راس فوق نافذه الرسم البياني عامل وانتزاع وسحب معدل الوزن الارتباط دقيقه . الآن ، كما يتم نقل المنزلق وزن الرابط وصولا إلى 0.05 ، والجينات الأخرى في عامل L1_26 ، بما في ذلك BRCA2 ، وسوف تظهر في ترتيب الوزن. بشكل اختياري ، تغيير موضع العقد عن طريق الاستيلاء والسحب لتحسين التخطيط. تحديد كيفيه التقسيم الطبقي للمرضي فيما يتعلق بعامل يؤثر علي البقاء علي قيد الحياة عن طريق الاستعلام في نافذه البقاء علي قيد الحياة. في نافذه البقاء علي قيد الحياة ، الغ تحديد الفرز بواسطة p-val، ثم حدد عامل 26 في القائمة المنسدلة عامل واحد من أجل إظهار منحنيات البقاء علي قيد الحياة لعامل 26. مرر لأسفل الرسم البياني للبقاء علي قيد الحياة لإظهار عدد المرضي المعرضين للخطر علي طول المحور س. البحث عن اقترانات مع الدالة الحيوية عن طريق الاستعلام داخل اطار التعليق التوضيحي. في اطار التعليق التوضيحي ، لفرز القائمة المنسدلة عامل حسب رقم عامل بدلا من خطا اكتشاف معدل (روزفلت) ، قم بإلغاء الفرز روزفلت. قم بالتمرير وانقر لتحديد العامل 26 في القائمة المنسدلة اطار التعليق التوضيحي لإظهار التعليقات التوضيحية لإثراء العامل. مرر لأسفل قائمه التعليقات التوضيحية حتى يصبح إصلاح الحمض النووي مرئيا وانقر عليه لرؤية الجينات المرتبطة به علي الفور والتي تم تمييزها باللون الأصفر علي شاشه الرسم البياني. انظر اللوحة الوسطي من الشكل 2. لاحظ ان العوامل تختفي أو تظهر كمصطلحات GO مختلفه يتم تحديدها ، وفقا لما إذا كانت مخصبه للجينات مع التعليق التوضيحي المحدد ، علي سبيل المثال “مسار الإشارات الذاتية للاشاره إلى تلف الحمض النووي.” استكشاف العوامل الأخرى عن طريق أضافه النوافذ مع وظائف مختلفه. من شريط القوائم العلوي ، أضف نافذه شبكه تفاعل بروتين بروتيني (PPI) عن طريق تحديد ppi من القائمة المنسدلة أضافه نافذه ، ثم انقر فوق الزر أضافه لأضافه اطار الرسم البياني PPI إلى منطقه العرض. في اطار الرسم البياني PPI ، اختر العامل ‘ Layer1:26 ‘ لإظهار تفاعلات البروتين والبروتين. لاحظ كثافة الاتصالات. من شريط القوائم العلوي ، بدلا من PPI، حدد الخريطة الحرارية من القائمة المنسدلة أضافه نافذه ، ثم انقر فوق الزر أضافه لأضافه نافذه خريطة الحرارة إلى منطقه العرض. في نافذه خريطة الحرارة ، اختر العامل ‘ Layer1:26 ‘ لإظهار أنماط التعبير الجيني. الاستيلاء علي وتغيير موضع نافذه خريطة الحرارة بحيث نافذه البقاء علي قيد الحياة هو أيضا مرئية. علي طول الجانب العلوي من خريطة الحرارة ، ونلاحظ كيف البرتقالي/الأزرق/اللون الرمادي شريط يتوافق مع طبقات خطر المريض علي الرسم البياني البقاء علي قيد الحياة. تظهر النتائج في الجزء السفلي من الشكل 2. 2. تصفيه وتفسير العوامل CorEx باستخدام الوزن الجيني ، والبقاء علي قيد الحياة ، وبيانات التعليق التوضيحي فلتر لعوامل الفائدة باستخدام البقاء علي قيد الحياة ونوعيه الكتلة. من القائمة المنسدلة Dataset في الأعلى ، حدد TCGA_OVCA للانتقال إلى صفحه CorExplorer لسرطان المبيض tcga الحمض الريبي-seq. وبمجرد تحميل الصفحة ، لاحظ من نافذه البقاء علي قيد الحياة ان العامل مع أكبر فرق البقاء علي قيد الحياة للطبقات مختلفه هو 114. في الأعلى من نافذه الرسم البياني عامل حدد ‘ Layer1:114 ‘ من القائمة المنسدلة عامل . الاستيلاء علي رابط الوزن المنزلق مع الماوس ونقله إلى 0.5. لاحظ ان العدد الكبير من الجينات في عامل 114 (1609) ، مع عدم وجود وزن > 0.35 ، يشير إلى تكتل ضعيف نسبيا. بعد ذلك ، قم بتوسيع قائمه العوامل في نافذه البقاء علي قيد الحياة وحدد العامل التالي الأفضل في المنسدلة نافذه البقاء علي قيد الحياة ، عامل 39 ، لإظهار منحنيات البقاء علي قيد الحياة المرتبطة بها. حدد عامل 39 في نافذه التعليق التوضيحي عن طريق النقر عليه. يتم عرض التعليقات التوضيحية GO و KEGG الهامه. للحصول علي فهم أفضل للدور البيولوجي للجينات في العامل 39 ، فسر العوامل باستخدام معلومات التعليق التوضيحي للحي علي النحو التالي. في الأعلى من نافذه الرسم البياني عامل ، حدد عامل ‘ Layer1:39 ‘ في القائمة المنسدلة عامل. ثم ، حرك الماوس فوق نافذه الرسم البياني عامل والتصغير للكشف عن الكتلة L2_14 بأكملها مع 6 عوامل: 14 ، 32 ، 39 ، 42 ، 52 ، 82 (كما هو موضح في الشكل 3). لفهم الاهميه النسبية للعوامل المرتبطة بعقده L2_14 ، أبدا بعرض فروق البقاء علي قيد الحياة لكل عامل من عوامل L2_14. الغ تحديد الفرز بواسطة p-فال في نافذه البقاء علي قيد الحياة ومن ثم انقر علي كل من أرقام عامل في الخلافة. القيام بذلك ، لاحظ ان العوامل فقط 14 ، 32 ، و 39 عرض جمعيه البقاء علي قيد الحياة. الآن من شريط القوائم العلوي ، حدد PPI من القائمة المنسدلة أضافه نافذه مره أخرى. اضغط علي أضافه لأضافه اطار الرسم البياني PPI إلى ناحية العرض. في اطار الرسم البياني PPI ، حدد عامل ‘ Layer1:52 ‘ لإظهار تفاعلات البروتين والبروتين التي هي كبيره. يظهر تخطيط مثال للنوافذ عند هذه النقطة في الشكل 3. انقر فوق طريقه العرض في الارتباط stringdb في الجزء السفلي من اطار PPI للارتباط إلى قاعده بيانات StringDB علي الإنترنت. انقر فوق متابعه من الشاشة الاولي ، ثم حدد علامة التبويب تحليل أسفل الرسم البياني للشبكة كما كان من قبل للحصول علي تحليل GO عبر الإنترنت لجينات شبكه PPI. المكون الخلوي العلوي هو “مجمع بروتين MHC من الفئة الثانية”. العودة إلى التبويب CorExplorer ونافذه PPI وحدد عامل 32 ، هذه المرة من القائمة المنسدلة عامل. انقر فوق عرض الارتباط في stringdb إلى تحليل stringdb. المكون الخلوي العلوي هو “مركب البروتين MHC الفئة الاولي” ، علي النقيض من الفئة الثانية لعامل 52 في الخطوة السابقة! وأخيرا ، العودة إلى نافذه PPI وحدد ‘ Layer1:39 ‘ من القائمة المنسدلة عامل في الأعلى. انقر فوق عرض الارتباط في stringdb للارتباط بتحليل stringdb. انقر فوق متابعه من الشاشة الاولي ، ثم حدد علامة التبويب تحليل أسفل الرسم البياني للشبكة للحصول علي تحليل GO عبر الإنترنت لجينات شبكه PPI. لاحظ ان الوظيفة الجزيئية العليا هي “CXCR3 المستقبلات chemokine ملزمه”. 3. استخدام البقاء علي قيد الحياة والشروح قاعده البيانات للبحث عن تركيبات علاجيه واعده التبديل إلى الورم الميلاني TCGA كوريكبليرر عن طريق تحديد TCGA_SKCM من القائمة المنسدلة Dataset . لاحظت ان العامل مع الكبيرة بقاء فرق معامل 171. افحص العامل 171 الشروح بالتمرير ولاحظ ان “الاستجابة المناعية” و “مسار الإشارات بوساطة السايسيسيني” بالقرب من الأعلى (كما كانت لعامل المبيض العلوي). للعثور علي عامل تكميلي ، افحص أهم العوامل المرتبطة بالبقاء علي قيد الحياة إلى جانب شروط التعليق التوضيحي العلوية. للقيام بذلك ، انقر فوق الارتباط نظره عامه حول dataset في شريط القوائم العلوي لفتح علامة تبويب منفصلة تحتوي علي جدول مع تفاصيل معالجه مجموعه البيانات بالاضافه إلى ملخص للعوامل العلوية وفقا ل p-قيمه الفرق البقاء علي قيد الحياة. لاحظ ان العامل غير المناعي الأول هو 88. العودة إلى علامة التبويب المستعرض TCGA_SKCM . حدد العامل 88 في إطارات البقاء والتعليق التوضيحي والرسم البياني. وترتبط العديد من البنود GO العلوية “معالجه rRNA” و “ميتوكندريا المنظمة” ، مؤكدا انها متميزة عن العوامل المرتبطة بالمناعة. في نافذه البقاء علي قيد الحياة ، علي القائمة المنسدلة العوامل المقترنة ، حدد ‘ 88_171 ‘ لنري كيف يتم تحسين البقاء علي قيد الحياة للمرضي في الطبقة الوسطي لعوامل التعبير 171 و 88 مجتمعه. ويبين الشكل 4الشروح ومقارنات البقاء علي قيد الحياة. 4. العثور علي القواسم المشتركة والاختلافات في اختلاف التعبير الجيني عبر أنواع الأورام باستخدام صفحه البحث انقر علي العنوان Corexplorer للعودة إلى الصفحة الاولي. انقر علي البحث علي شريط القائمة العلوي للذهاب إلى صفحه السماح بالبحث علي جميع مجموعات البيانات علي موقع CorExplorer. في مربع البحث الجيني ، ادخل ‘ FLT1 ‘ (VEGFR1) واضغط علي المفتاح Return ( البحث). تم العثور علي FLT1 مع وزن مرتفع نسبيا في العوامل التالية: OVCA-76 ، LUAD-162 ، SKCM-195 و SKCM-184 ، فضلا عن COAD-112 و COAD-74. بدلا من ذلك ، ابحث عن مصطلح GO ذات صله عبر كافة مجموعات البيانات. جرب هذا في مربع “البحث الذهاب” عن طريق كتابه ‘ تولد الاوعيه ‘ وضرب العودة أو الضغط علي البحث. يتم سرد جميع العوامل FLT1 ، باستثناء SKCM-195 ، كما المخصب إحصائيا لجينات ‘ تولد الاوعيه ‘-عامل 195 لا ، في الواقع ، لديها التعليق التوضيحي ، ولكن تحت عتبه 10-8 الافتراضية. وتظهر نتائج البحث لهذا الأمر والخطوة السابقة في الشكل 5. كامثله أخرى ، في مربع البحث GO ، النوع الأول ‘ مستقبلات عامل نمو البشرة. ‘ يتم إثراء LUAD فقط لهذا المصطلح ، وهو عامل الطبقية المعروفة لسرطان الرئة. بعد ذلك ، اكتب ‘ مسسبي ‘ في مربع البحث. هذا المصطلح هو المخصب في مجموعات التعبير الجيني ل OVCA ، حيث انه عامل الطبقية مدروسه جيدا.

Representative Results

البحث عن الجينات ‘ BRCA1 ‘ في مجموعه البيانات سرطان الرئة يكشف ان الأكثر ارتباطا بقوة مع CorEx عامل 26 (الشكل 2). وينظر إلى إثراء مصطلح GO لهذا العامل ان تكون عاليه للغاية ، مع إصلاح الحمض النووي التي تظهر روزفلت من فقط 1 x 10-19. ويسترعي الاختيار أيضا الانتباه إلى الفئة الثانية من الفئة L2_8 التي لها سته عوامل وثيقة الصلة بالأطفال. اختيار “إصلاح الحمض النووي” اما في التعليقات التوضيحية لمصطلح GO أو القائمة المنسدلة التي تثري الرسم البياني لعامل GO يسلط الضوء علي الجينات المرتبطة في كل من العوامل ، مع العامل 26 وجود أكثر من ذلك بكثير ، كما هو متوقع11. ربطت ال [بروتين-بروتين] تفاعل شبكه بقوة, ابعد يساند ال باحكام يرتبط وظيفة من المورثات في عامله 26. يشير الرسم البياني للبقاء علي قيد الحياة إلى احتمال وجود ارتباط مع بقاء المريض ، ولكن هذا يجب تاكيده في مجموعه بيانات أكبر. بدءا من البقاء علي قيد الحياة يمكن ان تسمح تشريح الأسباب لتحسين البقاء علي قيد الحياة المرتبطة بمجموعات معينه التعبير الجيني. وكمثال علي ذلك ، يعتبر العامل الأعلى الذي يؤثر علي بقاء سرطان المبيض هو الرقم 39 ، الذي يثري بشده للجينات المرتبطة بالجهاز المناعي (الشكل 3). ويشار أيضا إلى خمسه عوامل أخرى مرتبطة بنفس المستوي 2 العقدة لتكون ذات الصلة المناعية ، ولكن يبدو ان تاثير البقاء علي قيد الحياة متغيرة بشده بينها ، مع 39 ويجري اعلي و 52 يجري ادني. أضافه اطار تفاعل بروتين بروتيني لعامل يظهر شبكه التفاعل الفوري ويسمح للارتباط إلى موقع StringDB12 للاستعلام عن الثراء المختلفة لجينات شبكه PPI. ب يتم هذا ل كل من ال [L2_14] عاملات في بالتالي, يجد واحده ان [سترنغدب ثراء] ل ال [PPI] شبكه مورثات يقترحون التالي يمكن شرح للرابطات مع بقاء. عامل 32 يحتوي علي الجينات التي تشكل مجمع التوافق النسيجي الرئيسي (MHC) الفئة الأول البروتين المعقدة ، والتي يتم التعرف عليها من قبل الخلايا الليمفاوية T السامة للخلايا. عامل 39 يتوافق مع الإشارات السايسيسيني وربط مستقبلات CXCR3, المتعلقة CD8 + T اللمفاويات. ويبدو ان كلا من هذين العاملين يضفيان ميزه كبيره علي البقاء علي قيد الحياة للمرضي الذين يظهرون تعبيرا عاليا نسبيا عن الجينات المناظرة. الخلايا الليمفاوية CD8 + T السامة للخلايا هي المسؤولة في المقام الأول عن المناعة المضادة للورم. ويتالف العامل 52 ، من ناحية أخرى ، من ترميز الجينات للبروتينات في مجمع MHC من الفئة الثانية التي يتم التعرف عليها في المقام الأول بواسطة خلايا المساعد الخاصة بالبروتينات التائية وليس مباشره بواسطة لمفاويات T السامة للخلايا. العوامل L2_14 المتبقية تعكس تنشيط الجهاز المناعي المعمم الذي لا يميز بين نوعين من السكان اللمفاوية. جمعيه البقاء علي قيد الحياة خاصه للخلايا اللمفاوية T الاعتراف من الطبقة الام والامومه والطفولة الفئة I المستضدات الخلوية يتسق مع فهمنا للمناعة مضاده للورم بشكل عام ومن السرطانات الأخرى مثل سرطان الجلد13,14. وتدعم بوابه الويب اكتشاف أزواج من العوامل ذات الوظائف التكميلية التي قد توحي بالعلاجات المختلطة الفعالة الخاصة بالأورام. يمكن مسح النظرة العامة لمجموعه البيانات للعوامل التي تظهر ارتباطا مع البقاء علي قيد الحياة حتى الآن ثراء GO متميزة. لسرطان الجلد (TCGA_SKCM; الشكل 4) ، ويري ان عامل البقاء علي قيد الحياة الأعلى 171 المناعية ذات الصلة ، في حين ان عامل 88 أسفل القائمة يظهر إثراء للجينات المتعلقة بتنظيم ميتوكندريا. في الواقع ، وقد اقترح هذا كهدف في سرطان الجلد15. أضافه نوافذ البقاء علي قيد الحياة إلى الصفحة CorExplorer يسمح المقارنة بين الطبقات باستخدام زوج عامل إلى ان من كل عامل علي حده, تبين ان أنماط التعبير الجيني مواتيه من كلا المجموعتين يسلك اتجاها للبقاء علي قيد الحياة أفضل من ذلك لاما عامل وحده. الطبقة العليا لا يبدو ان تحسين ومع ذلك ، مما يوحي العلاج المناعي فقط قد يكون الخيار الأفضل لبعض المرضي. يمكن رؤية القواسم المشتركة والاختلافات بين الأورام من خلال البحث عبر مجموعات البيانات للجينات أو شروط GO (الشكل 5). علي سبيل المثال ، FLT1 (aka VEGFR1) هو علامة مدروسه جيدا الموالية للاوعيه الدموية16،17. عندما يتم وضعها في شريط البحث ، كل من الأورام لديها العوامل التي FLT1 يلعب دورا رئيسيا. وعلي العكس من ذلك ، عندما يكون مصطلح GO ‘ تولد الاوعيه ‘ هو مدخل في صفحه البحث ، تظهر 5 من أصل 6 مجموعات FLT1 مع ذلك الإثراء. يتم سرد جميع العوامل FLT1 ، باستثناء SKCM-195 ، كما المخصب إحصائيا لجينات “تولد الاوعيه”. العامل السادس ، في الواقع ، لديها التعليق التوضيحي ، ولكن دون عتبه 10-8 الافتراضية. عندما يتم استخدام الترجيح ضمن قائمه العوامل في حاسبه الإثراء البديلة ، علي سبيل المثال ، تحليل التخصيب الجيني (GSEA)18، يتم العثور علي العامل السادس لإثراءه بشكل كبير لجينات “تولد الاوعيه” أيضا. ومن المهم التحقق من خرائط الحرارة للتاكد من ان نمط التعبير الجيني ذو جوده كافيه لدعم التفسيرات البيولوجية. خرائط الحرارة التي تظهر تباينا واضحا قويا قد تظهر اما التعبير المنسق من الجينات عامل تتراوح بين المنخفضة والعالية أو أنماط أكثر تعقيدا مع بعض الجينات ذات التعبير المنخفض ترتبط مع الآخرين وجود عاليه (الشكل 6). ومن العلامات الرئيسية للتجميع عالي الجودة وجود العديد من الجينات ذات التباين السلس في التعبير كداله لنقاط العوامل. يوضح عامل الحرارة العينات التي تم ترتيبها وفقا لدرجه العامل ، التالي يجب ان يكون هناك تدرج سلس يتحرك من اليسار إلى اليمين. ومع ذلك ، يمكن ان تفشل في حدوث ذلك بطريقتين مختلفتين علي الأقل. الأكثر شيوعا ، قد تكون الارتباطات صاخبه للغاية (الشكل 5 ج) ، والتشكيك في متانة وفائدة من اي استنتاجات بشان البقاء و/أو الوظيفة البيولوجية. أيضا ، الأنماط التي تحدث فقط في اقليه صغيره من العينات قد لا تتطابق مع نموذج ثلاث دول التعبير التي تفترضها خوارزميه CorEx ، مما ادي إلى تصنيف مضلل للعينات (الجانب الأيمن من الشكل 5D). الشكل 1: الصفحة الاولي للسيد كوريكبلورر. بعد النقر علي + بجوار سرطان المبيض تحت الروابط السريعة، تظهر تفاصيل الرسم البياني للعامل. يتكون النموذج الهرمي CorEx من متغيرات الإدخال (التعبير الجيني في هذه الحالة) علي الطبقة السفلي والعوامل الكامنة التي يستدل عليها في الطبقات العليا. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم. الشكل 2: استخدام اسم جيني لتوجيه الاستكشاف. يظهر الشكل سلسله من لقطات توضح استكشاف عوامل سرطان الرئة CorEx المرتبطة بقوة BRCA1. أولا ، يؤدي تحديد ‘ BRCA1 ‘ في مربع القائمة المنسدلة للجينات للرسم البياني للعامل إلى عرض الرسم البياني للتكبير علي العامل الذي يكون لBRCA1 أكبر وزن له. التكبير من الإطارات بت الطبقة اثنين عقده L2_8 ربط هذا العامل إلى أخرى ذات الصلة. ويمكن مقارنه البقاء علي قيد الحياة والشروح: النقر علي المدى GO إصلاح الحمض النووي يسلط الضوء علي الجينات المشروحة. يتم أضافه اطار PPI لإظهار تفاعلات الشبكة للجينات في العامل. باستخدام زر أضافه نافذه لأضافه خريطة الحرارة يظهر اقتران أنماط التعبير مع البقاء علي قيد الحياة ، مما يوحي زيادة التعبير عن الجينات إصلاح الحمض النووي قد تكون مرتبطة مع انخفاض البقاء علي قيد الحياة. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم. الشكل 3: استخدام البيانات السريرية (البقاء) لتوجيه الاستكشاف. استكشاف العامل الأعلى المرتبطة بالبقاء علي قيد الحياة (39) لسرطان المبيض يكشف عن علاقات مثيره للاهتمام بين العوامل المجاورة. بعد اختيار عامل 39 في الرسم البياني عامل والتصغير قليلا, الطبقة عاملين مرتبطة بعامل 39 وينظر إلى خمسه عوامل أخرى مرتبطة. نافذه اضافيه البقاء علي قيد الحياة يسمح المقارنة المباشرة للفوارق البقاء المرتبطة. يبدي عاملات 39 و 32 علي حد سواء ايجابيه بقاء ارتباط, في المقابل عامل 52, اي لا. وجميع شبكات التفاعل بين البروتين والبروتين محدده جيدا. الربط ب StringDB يسمح بالمقارنة بين التعليقات التوضيحية GO (غير معروضه): يرتبط عامل 39 مع شبكه إشارات سيتوكيني المتعلقة CD8 السامة للخلايا + T تنشيط الخلايا اللمفاوية والعامل 32 يهيمن عليها MHC فئة I مستضد تقديم البروتينات التي الاعتراف الزناد من قبل هذه الخلايا الليمفاوية. العوامل المجاورة ، ومع ذلك ، يهيمن عليها مكونات الجهاز المناعي الأخرى مثل الخلايا T المساعد + وتظهر اي ارتباط البقاء علي قيد الحياة. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم. الشكل 4: استكشاف أهم عوامل البقاء علي قيد الحياة تشير إلى تركيبات علاجيه محتمله. ويؤدي رابط “مجموعات البيانات” في شريط قوائم الصفحة الرئيسية إلى جدول موجز لعوامل البقاء علي قيد الحياة مرتبه حسب القيمة p ، إلى جانب التعليق التوضيحي GO العلوي (غير ظاهر). باستخدام هذه المعلومات لسرطان الجلد ، والجمع بين عامل 171 لوظيفة المناعة مع عامل 88 لمنظمه ميتوكندريا يبدو متكاملا. يظهر الشكل نوافذ التعليق التوضيحي لكل من العوامل جنبا إلى جنب لعكسها. منحنيات البقاء علي قيد الحياة للمرضي الطبقية من قبل العاملين بشكل فردي أو معا تشير إلى ان الجمع يزيد من الفرق البقاء علي قيد الحياة بالمقارنة مع اي عامل وحده. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم. الشكل 5: تسهل صفحه البحث تحليل السرطان عموما. يمكن البحث عن الجينات أو مصطلحات العملية البيولوجية GO عبر جميع مجموعات البيانات باستخدام رابط البحث من الصفحة الرئيسية. يظهر الشكل نتائج البحث عن الجينات FLT1 ومصطلح GO ‘ تولد الاوعيه ‘. تظهر النتائج وجود FLT1 في العوامل المشروحة مع مصطلح ‘ تولد الاوعيه ‘ عبر السرطانات. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم. الشكل 6: يمكن استخدام خرائط الحرارة لتقييم الارتباطات نوعيا بين الجينات والعينات وفقا لدرجه العامل. وتظهر علاقات التعبير الجيني عاليه الجودة عن طريق التدرج السلس عندما يؤمر المرضي حسب درجه العامل في خرائط الحرارة. ومن الامثله علي ذلك خريطة الحرارة في اقصي اليسار للعامل 18. وقد تشمل الأنماط أيضا التوقيعات المعقدة للتعبير الأعلى والأسفل كما في خريطة الحرارة المتوسطة الكبيرة للعامل 11. انخفاض أنماط الجودة في بعض الأحيان تظهر التغييرات المفاجئة في التعبير لمجموعه فرعيه من المرضي كما هو الحال في العامل 9 الحرارة خريطة علي الارتباطات اليمين أو بسيطه جدا صاخبه كما هو الحال في عامل 161 خريطة الحرارة في أسفل اليمين. يرجى النقر هنا لعرض نسخه أكبر من هذا الرقم.

Discussion

لقد قدمنا موقع CorExplorer ، وهو خادم الويب المتاح للجمهور للاستكشاف التفاعلي لعوامل التعبير الجيني المرتبطة بشكل اقصي المستفادة من الورم RNA-seq بواسطة خوارزميه CorEx. لقد أظهرنا كيف يمكن استخدام الموقع لتقسيم المرضي وفقا لتعبير الجينات الورم ، وكيف يتوافق هذا التقسيم الطبقي مع الوظيفة البيولوجية والبقاء علي قيد الحياة.

وقد بنيت خوادم الويب الأخرى للتحليل المتسلسل الRNA. ويمكن فحص الفرق وتحليل التعبير المشترك للأورام ودمجها مع أنواع البيانات الأخرى في cbioportal19,20. الخوادم GenePattern21، mev22، وموفيفوس23، دمج تقنيات التجميع المعمول بها مثل تحليل المكونات الرئيسية (PCA) ، kmeans ، أو خرائط التنظيم الذاتي (سوم). وتشمل الجهود الأكثر ابتكارا CamurWeb24، استنادا إلى المصنف توليد القواعد الألى ، و tacco25، الذي ينفذ عشوائية مصنفات الغابات و لأسوس. خوارزميه CorEx المستخدمة هنا يحسن المعلومات متعددة المتغيرات من أجل العثور علي التسلسل الهرمي للعوامل التي تشرح أنماط في البيانات. ويبدو ان التعلم بالعوامل غير الخطية والهرمية يؤدي إلى تحسن التفسير بالنسبة للعوامل العالمية الخطية الموجودة عن طريق الانيسول الخماسي الكلور4. بالاضافه إلى ذلك ، فان التحليل الدقيق لهذه التقنية لإشارات العينة يسمح باجراء مقارنات دقيقه للورم مقارنه بالأنواع الفرعية الواسعة الشائعة الاستخدام. هذا المزيج من التداخل وتحليل العوامل الهرمية يميز CorExplorer من معظم النهج الأخرى ويتطلب أدوات جديده للتصور والتلخيص.

جزءا هاما من تحليل عامل CorExplorer هو القدرة علي استكشاف ليس فقط عده ، ولكن أكثر من 100 العوامل مع أنماط الجينات المعلوماتية التي يتم وضعها داخل التسلسل الهرمي متداخلة. و CorExplorer يسهل التعدين من هذه العوامل لا تحصي للجمعيات البيولوجية والسريرية ويسمح لتوصيف مفصله بشكل استثنائي من الأورام الفردية. ويعني التعلم غير الخاضع للاشراف لهذا العدد الكبير من العوامل انه لن تكون جميعها ذات صله ببيولوجيا الامراض. في مثل هذه الحالة ، من الضروري اما استخدام الشروح أو الجينات المعروفة لسحب العوامل المثيرة للاهتمام أو البحث عن العوامل المرتبطة بالبيانات السريرية مثل البقاء علي قيد الحياة. التالي ، فان CorExplorer يسمح للمستخدمين لتنفيذ هذه الخطوة تصفيه مهمة جدا. وجود أنماط الجينات عامل في الورم قد توحي حتى نهج لعلاج الأورام شخصيه. وعلاوة علي ذلك ، فان تعدد درجات عامل لكل ورم يسمح لاكتشاف تركيبات علاجيه من المحتمل ان تكون مفيده.

وفي بعض الأحيان ، لا تظهر شروحات GO الهامه للعوامل التي ترتبط ارتباطا وثيقا بالبقاء علي قيد الحياة. في حين ان هذا قد يحدث بسبب صاخبه أو تحت عينات البيانات ، وهناك أسباب محتمله أخرى مثل حجم الكتلة التي هي صغيره جدا لتسجيل عشرات الإثراء الكبيرة أو المجموعة كونها “سله” من جينات واحده من مسارات مختلفه دون متماسكة البيولوجية رابطه. بالاضافه إلى ذلك ، قد يكون من المناسب فئة من التعليقات التوضيحية تختلف عن العملية البيولوجية KEGG و GO ، مثل المقصورة الخلوية. يمكن الوصول إلى هذه عن طريق ربط إلى StringDB كما هو موضح في البروتوكول. ولا يمثل تحليل الإثراء الوراثي للجينات في موقع CorExplorer حاليا الوزن الجيني في أحد العوامل ، وان كان من المرجح تدارك ذلك في المستقبل القريب. ملاحظه يتوفر خيار قائمه الجينات تحت ‘ أضافه نافذه ‘ التي تسمح لتحميل قائمه الجينات عامل كامل لمزيد من التحليل مع الاداات الخارجية.

لأغراض الموقع الكتروني ، تم تشغيل CorEx علي كل من مجموعات البيانات خمس مرات وتم الاحتفاظ بالتشغيل الذي ادي إلى الارتباط الإجمالي الكلي الأكبر. وقد يكون وجود تمثيل إحصائي لنتائج أشواط متعددة أكثر أفاده وهدفا للعمل في المستقبل. بالاضافه إلى ذلك ، فان مجموعه أنواع الأورام المتوفرة علي الخادم صغيره نوعا ما ، ولكننا نتوقع ان يتسع هذا النطاق بمرور الوقت وفقا لاهتمام المستخدم.

كما هو موضح أعلاه ، فان CorExplorer تصور العلاقات العاملة CorEx الحمض الريبي المتسلسل مع المعلومات السريرية وقاعده البيانات ، التالي تمكين مجموعه متنوعة من أنماط مختلفه من الاستجواب. ونحن نامل ان هذه الاداه سوف تؤدي إلى مزيد من العمل علي الاستفادة من قوه تحليل الحمض الريبي النيبالي-seq لاكتشاف وتطبيق السريرية في الأورام.

Disclosures

The authors have nothing to disclose.

Acknowledgements

تم دعم GV من قبل جائزه DARPA W911NF-16-0575.

Materials

Public server for CorExplorer website USC http://corex.isi.edu Intel Xeon E5-2690 4-core 2.6 GHz, 8GB RAM. Backend architecture is LAMP: Linux, Apache, MySQL, PHP.
Web browser Google/Apple Chrome/Safari Verified web browsers.

References

  1. Petryszak, R., et al. The RNASeq-er API-a gateway to systematically updated analysis of public RNA-seq data. Bioinformatics. 33, 2218-2220 (2017).
  2. Steeg, G. V., Galstyan, A. Maximally Informative Hierarchical Representations of High-Dimensional Data. Proceedings of the Eighteenth International Conference on Artificial Intelligence and Statistics (AISTATS). , (2015).
  3. Ver Steeg, G., Galstyan, A. Discovering structure in high-dimensional data through correlation explanation. Advances in Neural Information Processing Systems. , (2014).
  4. Pepke, S., Ver Steeg, G. Comprehensive discovery of subsample gene expression components by information explanation: therapeutic implications in cancer. BMC medical Genomics. 10, 12 (2017).
  5. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nature Reviews Genetics. 17, 257 (2016).
  6. Cancer Genome Atlas Research Network. Comprehensive molecular profiling of lung adenocarcinoma. Nature. 511, 543 (2014).
  7. Cancer Genome Atlas Network. Comprehensive molecular characterization of human colon and rectal cancer. Nature. 487, 330 (2012).
  8. Akbani, R., et al. Genomic classification of cutaneous melanoma. Cell. 161, 1681-1696 (2015).
  9. Cancer Genome Atlas Research Network. Integrated genomic analyses of ovarian carcinoma. Nature. 474, 609 (2011).
  10. Grossman, R. L., et al. Toward a shared vision for cancer genomic data. New England Journal of Medicine. 375, 1109-1112 (2016).
  11. Moynahan, M. E., Chiu, J. W., Koller, B. H., Jasin, M. Brca1 controls homology-directed DNA repair. Molecular Cell. 4, 511-518 (1999).
  12. Szklarczyk, D., et al. STRING v11: protein–protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2018).
  13. Durgeau, A., Virk, Y., Corgnac, S., Mami-Chouaib, F. Recent advances in targeting CD8 T-cell immunity for more effective cancer immunotherapy. Frontiers in Immunology. 9, 14 (2018).
  14. Sato, E., et al. Intraepithelial CD8+ tumor-infiltrating lymphocytes and a high CD8+/regulatory T cell ratio are associated with favorable prognosis in ovarian cancer. Proceedings of the National Academy of Sciences of the United States of America. 102, 18538-18543 (2005).
  15. De Moura, M. B., et al. Mitochondrial respiration-an important therapeutic target in melanoma. PLoS One. 7, 40690 (2012).
  16. Folkman, J., Merler, E., Abernathy, C., Williams, G. Isolation of a tumor factor responsible for angiogenesis. Journal of Experimental Medicine. 133, 275-288 (1971).
  17. Takahashi, S. Vascular endothelial growth factor (VEGF), VEGF receptors and their inhibitors for antiangiogenic tumor therapy. Biological and Pharmaceutical Bulletin. 34, 1785-1788 (2011).
  18. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102, 15545-15550 (2005).
  19. Cerami, E., et al. The cBio Cancer Genomics Portal: An Open Platform for Exploring Multidimensional Cancer Genomics Data. Cancer Discovery. 2, 401-404 (2012).
  20. Gao, J., et al. Integrative Analysis of Complex Cancer Genomics and Clinical Profiles Using the cBioPortal. Science Signalling. 6, 1 (2013).
  21. Reich, M., et al. GenePattern 2.0. Nature Genetics. 38, 500 (2006).
  22. Wang, Y. E., Kutnetsov, L., Partensky, A., Farid, J., Quackenbush, J. WebMeV: A Cloud Platform for Analyzing and Visualizing Cancer Genomic Data. Cancer Research. 77, 11-14 (2017).
  23. . Morpheus Available from: https://software.broadinstitute.org/morpheus (2019)
  24. Weitschek, E., Lauro, S. D., Cappelli, E., Bertolazzi, P., Felici, G. CamurWeb: a classification software and a large knowledge base for gene expression data of cancer. BMC Bioinformatics. 19, 354 (2018).
  25. Chou, P. -. H., et al. tACCo, a Database Connecting transcriptome Alterations, pathway Alterations and Clinical outcomes in Cancers. Scientific Reports. 9, 3877 (2019).

Play Video

Cite This Article
Pepke, S., Nelson, W. M., Ver Steeg, G. Analyzing Tumor Gene Expression Factors with the CorExplorer Web Portal. J. Vis. Exp. (152), e60431, doi:10.3791/60431 (2019).

View Video