تجميع تسلسل الحمض النووي هو استراتيجية سريعة وفعالة من حيث التكلفة للكشف عن بدائل نادر المرتبطة الظواهر المعقدة في أفواج كبيرة. نحن هنا وصف التحليل الحسابي من تجميع التسلسل من الجيل التالي، من الجينات المتصلة بالسرطان 32 باستخدام حزمة البرامج منشقة. هذه الطريقة هي قابلة للتطوير، والتي تنطبق على أي النمط الظاهري في المصالح.
كما تسلسل الحمض النووي التكنولوجيا قد تقدمت بشكل ملحوظ في السنوات الأخيرة 2، فقد أصبح من الواضح بشكل متزايد أن كمية الاختلاف الجيني بين أي الشخصين أكبر مما كان يعتقد سابقا 3. في المقابل، فشلت مجموعة القائمة على التنميط الجيني لتحديد مساهمة كبيرة من المتغيرات تسلسل المشتركة بين تقلب المظهري من الأمراض الشائعة 4،5. أخذت معا، وقد أدت هذه الملاحظات إلى تطور مرض شائع / نادر فرضية البديل مما يدل على أن الغالبية العظمى من "التوريث المفقودة" في الظواهر الشائعة والمعقدة بدلا من ذلك بسبب الملف الفرد الشخصية من متغيرات الحمض النووي نادرة أو خاصة 6-8 . ومع ذلك، واصفا كيف يؤثر اختلاف نادر الظواهر المعقدة يتطلب تحليل العديد من الأفراد المصابين في مواضع كثيرة الجينومية، وتتم مقارنة مثالي لاستطلاع مماثل في الفوج غير متأثر. على الرغم من قوة التسلسل التي توفرها منصات اليوم، وهيالمرتكزة على السكان من مسح الجينوم مواضع كثيرة، وتحليل لاحق الحسابية المطلوبة لا تزال باهظة بالنسبة للمحققين كثير.
لتلبية هذه الحاجة، قمنا بتطوير نهج التسلسل المجمعة 1،9 ومجموعة من البرامج الجديدة 1 للدقيقة للغاية اكتشاف البديل نادرة من البيانات الناتجة. القدرة على الجينوم تجمع من جميع السكان المتضررين من الأفراد ومسح على درجة من الاختلاف الجيني في العديد من المناطق المستهدفة في مكتبة تسلسل واحد يوفر ممتازة التكلفة والوقت وفورات إلى التقليدية منهجية التسلسل عينة واحدة. مع تغطية تسلسل يعني في أليل من أمثالها-25، خوارزمية عادتنا، تشظ، يستخدم استراتيجية داخلية البديل سيطرة يدعو إلى استدعاء الإدراج والحذف واستبدال ما يصل إلى 4 أزواج قاعدة في طول مع حساسية عالية وخصوصية من برك من يصل إلى 1 متحولة أليل في 500 شخص. نحن هنا وصف طريقة لإعداد الصورة المجمعةequencing مكتبة تليها خطوة بخطوة على تعليمات حول كيفية استخدام حزمة سبلينتر لتحليل تسلسل المجمعة ( http://www.ibridgenetwork.org/wustl/splinter ). نعرض مقارنة بين تسلسل المجمعة من 947 أشخاص، وجميعهم خضعوا أيضا الجينوم على نطاق الصفيف، في أكثر من 20kb من تسلسل للشخص الواحد. وكان التوافق بين التنميط الجيني من المفتاحية ومتغيرات جديدة ودعا في العينة المجمعة ممتازة. ويمكن هذا الأسلوب بسهولة تحجيم تصل إلى أي عدد من مواضع الجينومية وأي عدد من الأفراد. من خلال دمج الضوابط الداخلية amplicon الإيجابية والسلبية في النسب التي تحاكي السكان دون سن الدراسة، يمكن معايرة خوارزمية لتحقيق الأداء الأمثل. ويمكن أيضا أن هذه الاستراتيجية يمكن تعديلها للاستخدام مع القبض على تهجين أو الباركود فرد على حدة، ويمكن تطبيقها على التسلسل من عينات غير متجانسة بشكل طبيعي، مثل الحمض النووي للورم.
هناك أدلة متزايدة على أنه يجوز خاضعة للإشراف من حدوث والاستجابة العلاجية من الظواهر، والأمراض الشائعة معقدة مثل السمنة 8، 4 ارتفاع الكولسترول وارتفاع ضغط الدم (7) وغيرها من ملامح الشخصية من اختلاف نادر. ويمكن التعرف على الجينات والممرات حيث مجموع هذه المتغيرات في السكان المتضررين سيكون لها آثار عميقة في التشخيص والعلاج، ولكن تحليل الأفراد المتضررين على حدة أن يكون الوقت والتكلفة الباهظة. سكان التحليل القائم على توفر وسيلة أكثر كفاءة لاستقصاء الاختلاف الجيني في مواضع متعددة.
نقدم رواية تجميع الحمض النووي تسلسل بروتوكول يقترن شظية مجموعة من البرامج المصممة للتعرف على هذا النوع من الاختلاف الجيني عبر السكان. نبين مدى دقة هذه الطريقة في تحديد وقياس الأليلات طفيفة في عدد كبير من السكان المجمعة من 947 شخصا، من بينهم المتغيرات النادرة التي كانتودعا من جديد من التسلسل المجمعة والتصديق عليها من قبل pyrosequencing الفردية. استراتيجيتنا تختلف أساسا عن غيرها من البروتوكولات التي إدماج الإيجابية والسلبية لمراقبة داخل كل تجربة. وهذا يسمح سبلينتر لتحقيق دقة أعلى من ذلك بكثير والطاقة بالمقارنة مع المناهج الأخرى 1. يتم إصلاح التغطية الأمثل لأضعاف نسبة 25 في أليل بصرف النظر عن حجم تجمع، مما يجعل تحليل كميات ضخمة بقدر الإمكان هذا الشرط موازين فقط خطيا مع حجم حوض السباحة. نهجنا مرنة جدا ويمكن تطبيقها على أي النمط الظاهري في المصالح ولكن أيضا لعينات التي هي غير متجانسة بشكل طبيعي، مثل السكان الخلية المختلطة والخزعات ورم. نظرا للاهتمام المتزايد في التسلسل المجمعة من المناطق المستهدفة الكبيرة مثل exome أو الجينوم، الإعدادية لدينا مكتبة والتحليل سبلينتر متوافق مع التقاط-العرف وتسلسل كامل exome، ولكن لم يتم تصميم الأداة المساعدة التوافق في حزمة سبلينتر لل كبيرمراجع متواليات. ولذلك، نحن استخدمت بنجاح اليجنر البرمجة الديناميكية، Novoalign، عن الجينوم على نطاق الاصطفافات تليها البديل استدعاء من العينة المجمعة (راموس وآخرون، المقدمة). وبالتالي، يمكن أن استراتيجيتنا التسلسل المجمعة بنجاح لتوسيع نطاق أكبر مجمعات مع كميات متزايدة من تسلسل الهدف.
The authors have nothing to disclose.
وأيد هذا العمل من قبل معهد الطفل منحة ديسكفري MC-II-2006-1 (RDM وتيد)، وعلم التخلق المعاهد الوطنية للصحة خارطة الطريق منحة [1R01DA025744-01 و3R01DA025744 02S1-] (RDM وFLMV)، U01AG023746 (SC)، والصائغ مؤسسة (FLMV وتيد)، 1K08CA140720-01A1 وشراب الليمون اليكس الجناح "أ" دعم جائزة (تيد). ونحن نشكر وصول مركز تكنولوجيا الجينوم في قسم علم الوراثة في جامعة واشنطن في كلية الطب للمساعدة في التحليل الجيني. ويدعم بشكل جزئي من قبل مركز سرطان NCI دعم منح مركز # P30 CA91842 لمركز سرطان Siteman وتكنولوجيا المعلومات والاتصالات / CTSA جرانت # UL1RR024992 من NationalCenter لبحوث الموارد (NCRR)، وهو مكون من المعاهد الوطنية للصحة (NIH)، و المعاهد الوطنية للصحة خارطة الطريق للبحوث الطبية. هذا المنشور هو فقط من مسؤولية الكتاب ولا تمثل بالضرورة وجهة النظر الرسمية من NCRR أو المعاهد الوطنية للصحة.
Reagent Name | Company | Catalogue Number | Section |
PfuUltra High-Fidelity | Agilent | 600384 | 1.4 |
Betaine | SIGMA | B2629 | 1.4 |
M13mp18 ssDNA vector | NEB | N4040S | 1.5 |
pGEM-T Easy | Promega | A1360 | 1.5 |
T4 Polynucleotide Kinase | NEB | M0201S | 2.2 |
T4 Ligase | NEB | M0202S | 2.2 |
Polyethylene Glycol 8000 MW | SIGMA | P5413 | 2.2 |
Bioruptor sonicator | Diagenode | UCD-200-TS | 2.3 |