Summary

التحقق من صحة تسلسل الجينوم كله نانوبور، وذلك باستخدام فيروس Usutu كمثال

Published: March 11, 2020
doi:

Summary

لقد سبق لنا التحقق من صحة بروتوكول لتسلسل فيروس أوسوتو الجينومي الكامل القائم على amplicon (USUV) على منصة تسلسل النانوبور. هنا ، ونحن وصف الأساليب المستخدمة بمزيد من التفصيل وتحديد معدل الخطأ من نانوبور R10 تدفق الخلية.

Abstract

ويمكن استخدام تسلسل الجينوم بأكمله لتوصيف وتتبع الفاشيات الفيروسية. وقد وصفت بروتوكولات تسلسل الجينوم كله القائم على نانوبور لعدة فيروسات مختلفة. وتستخدم هذه النهج نهجاً متداخلاً قائماً على التضخيم يمكن استخدامه لاستهداف فيروس معين أو مجموعة من الفيروسات ذات الصلة وراثياً. وبالإضافة إلى تأكيد وجود الفيروس، يمكن استخدام التسلسل في دراسات علم الأوبئة الجينومية، لتتبع الفيروسات وكشف مصادرها وخزاناتها وطرق انتقالها. بالنسبة لمثل هذه التطبيقات ، من الأهمية بمكان فهم الآثار المحتملة لمعدل الخطأ المرتبط بالمنصة المستخدمة. يتطلب التطبيق الروتيني في البيئات السريرية والصحية العامة أن يتم توثيق ذلك مع كل تغيير مهم في البروتوكول. في السابق ، تم التحقق من صحة بروتوكول تسلسل فيروس Usutu الجينومي الكامل على منصة تسلسل البوبور النانوي (R9.4 flowcell) عن طريق المقارنة المباشرة لتسلسل Illumina. هنا، نصف الطريقة المستخدمة لتحديد تغطية القراءة المطلوبة، باستخدام المقارنة بين خلية تدفق R10 وتسلسل Illumina كمثال.

Introduction

التطورات السريعة في تقنيات تسلسل الجيل الثالث تسمح لنا بالمضي قدما نحو ما يقرب من التسلسل في الوقت الحقيقي خلال الفاشيات الفيروسية. ويمكن أن يكون توافر المعلومات الجينية في الوقت المناسب مفيداً لتحديد منشأ وتطور مسببات الأمراض الفيروسية. معايير الذهب في مجالات تسلسل الجيل القادم ومع ذلك، لا تزال التسلسل الجيل الثاني. تعتمد هذه التقنيات على تقنيات محددة وتستغرق وقتًا طويلاً مثل التضخيم الكلوني أثناء التضخيم المستحلبي أو تضخيم جسر الكُون. والمنظمون من الجيل الثالث أرخص ومحمولين باليد ومزودين بمنهجيات مبسطة لإعداد المكتبة. خاصة صغر حجم جهاز التسلسل وانخفاض سعر الشراء يجعلها مرشحًا مثيرًا للانتشار والتسلسل القابل للتشغيل. ويمكن ملاحظة ذلك على سبيل المثال أثناء تفشي فيروس الإيبولا في سيراليون وأثناء التحقيقات الجارية في فاشية فيروس الأربوفيروس في البرازيل1و22و3.3 ومع ذلك، قد يحد معدل الخطأ المرتفع4 المبلغ عنه من التطبيقات التي يمكن استخدام تسلسل البوبور النانوي لها.

تسلسل نانوبور يتطور بسرعة. تتوفر منتجات جديدة في السوق على أساس منتظم. ومن الأمثلة على ذلك على سبيل المثال مجموعات التربيعية 1D التي تمكن تسلسل كل من فروع جزيء الحمض النووي، وبالتالي تعزيز دقة القواعد يسمى5 وتطوير خلية تدفق R10 الذي يقيس التغيير في التيار في حالتين مختلفتين في المسام6. وبالإضافة إلى ذلك ، وتحسين الأدوات الحيوية المعلوماتية مثل التحسينات في basecalling سوف تحسن دقة basecalling7. تم تحديث أحد أكثر الحلقات المستخدمة في القاعدة (على سبيل المثال، Albacore)، 12 مرة على الأقل في فترة زمنية مدتها 9 أشهر5. في الآونة الأخيرة ، أصدرت الشركة المصنعة أيضا basecaller رواية تسمى الوجه بالتخبط ، والتي يتم تنفيذها في برنامج nanopore الافتراضي8. معا، كل هذه التحسينات سوف تؤدي إلى تسلسل أكثر دقة وسوف تقلل من معدل الخطأ من المنظم nanopore.

فيروس أوستو (USUV) هو فيروس arboفيروس البعوض التي تحملها الأسرة فلافيريداي ولها الجينوم الحمض النووي المعيلة إيجابية من حوالي 11،000 النيوكليوتيدات. USUV يؤثر أساسا البوم الرمادي العظيم والطيور السوداء9،10، على الرغم من أن أنواع الطيور الأخرى هي أيضا عرضة للعدوى USUV11. في الآونة الأخيرة ، تم تحديد USUV أيضًا في القوارض والزبابة على الرغم من أن دورها المحتمل في انتقال الفيروس لا يزال غير معروف12. في البشر ، تم وصف العدوى بدون أعراض في المتبرعين بالدم13،14،15،16 في حين تم الإبلاغ عن عدوى USUV أيضًا لتكون مرتبطة بالتهاب الدماغ أو التهاب الدماغ السحالي17،18. في هولندا ، تم اكتشاف USUV لأول مرة في الطيور البرية في عام 201610 وفي المتبرعين بالدم بدون أعراض في عام 201814. ومنذ الكشف الأولي عن فيروس الأربيوتي، أُبلغ عن فاشيات خلال السنوات اللاحقة، ولا تزال الترصد، بما في ذلك تسلسل الجينوم بأكمله، جارياً لرصد ظهور فيروس arbovirus وانتشاره بين السكان الذين كانوا ساذجين في السابق.

على غرار ما تم وصفه للفيروسات الأخرى، مثل فيروس الإيبولا،3فيروس زيكا وفيروس الحمى الصفراء19،,20،وضعنا التمهيدي مجموعة لتسلسل طول كامل USUV21. يسمح هذا النهج القائم على تفاعل البوليميراز المتسلسل (PCR) باسترداد جينوم USUV كامل الطول من أنواع العينات الملوثة بشدة بالمضيف مثل عينات الدماغ في عينات تصل إلى قيمة Ct تبلغ حوالي 32. فوائد نهج التسلسل القائم على amplicon هي حساسية أعلى مقارنة بالتسلسل الجيني وخصوصية أعلى. القيود المفروضة على استخدام نهج قائم على amplicon هي أن تسلسل ينبغي أن تكون مماثلة من أجل تصميم التمهيديات المناسب لجميع السلالات وأن التمهيديات مصممة على معرفتنا الحالية حول تنوع الفيروس.

وبالنظر إلى التطورات والتحسينات المستمرة في تسلسل الجيل الثالث، هناك حاجة إلى تقييم معدل الخطأ في المنظم على أساس منتظم. هنا ، ونحن نصف طريقة لتقييم أداء نانوبور مباشرة ضد تسلسل Illumina باستخدام USUV كمثال. يتم تطبيق هذا الأسلوب على التسلسلات التي تم إنشاؤها باستخدام أحدث خلية تدفق R10 ويتم تنفيذ الاستدعاء الأساسي مع أحدث إصدار من basecaller الوجه بالتخبط.

Protocol

ملاحظة: قائمة أدوات البرامج التي سيتم استخدامها: usearch v11.0.667; العضلات v3.8.1551; porechop 0.2.4؛ cutadapt 2.5؛ minimap2 2.16-r922; samtools 1.9؛ trimmomatic 0.39؛ bbmap 38.33; البستوني v3.13.1; كمة-1.2.8 1. تصميم التمهيدي ابدأ بتنزيل أو استرداد مجموعة من تسلسلات الجينوم المرجعية ذات الصلة من مجموعات البيانات العامة أو الخاصة. على سبيل المثال، استرداد جميع الجينوم USUV طول كامل (taxid64286) من قاعدة بيانات NCBI22. تقوم USUV بترميز جينوم يبلغ عدده حوالي 11,000 نيوكليوتيدات حتى لا تستعيد التسلسلات بطول تسلسل من 8,000-12,000 نيوكليوتيدات. قم بذلك باستخدام إدخال البحث التالي:- taxid64286 [Organism:noexp] و 8000 [SLEN]:12000 [SLEN]. انقر على إرسال إلى | سجل كامل | ملف؛ استخدام تنسيق = FASTA وإنشاء الملف. لتقليص مجموعة التسلسلات المرجعية، قم بإزالة التسلسلات أو التسلسلات المكررة بهوية نيوكليوتيد اتّية تزيد عن 99% من مجموعة البيانات. القيام بذلك باستخدام خيار سريع الكتلة من usearch23. على سطر الأوامر أدخل:- usearch -cluster_fast All_USUV.fasta -id 0.99-centroids All_USUV_dedup.fasta لإنشاء الكبيّنات، يجب محاذاة التسلسلات. ويتم ذلك باستخدام MUSCLE24. على سطر الأوامر أدخل:- العضلات -في All_USUV_dedup.fasta-out All_USUV_dedup_aligned.fasta-سجل log_muscle.txtملاحظة: من الضروري فحص المحاذاة يدويًا للتحقق من وجود اختلافات. ويمكن تصحيح هذه يدويا إذا لزم الأمر ويمكن تقليم نهايات وفقا لطول معظم تسلسل الجينوم كله. يستخدم البدائية لجعل مشروع اختيار التمهيديات التي يمكن استخدامها لطول كامل amplicon التسلسل19. تحميل المحاذاة إلى الموقع الأساسي(http://primal.zibraproject.org/)وتحديد طول amplicon المفضل وطول التداخل بين amplicons مختلفة. انتقل إلى primal.zibraproject.org، وملء اسم النظام،وتحميل ملف fasta محاذاة، وتحديد طول amplicon، حجم التداخل، وإنشاء النظام. قم بمحاذاة المجموعة الكاملة من تسلسلات USUV الكاملة المتوفرة (وليس المجموعة المقلصة أو غير المكررة). على سطر الأوامر أدخل:- العضلات -في All_USUV.fasta-out All_USUV_aligned.fasta-سجل log_muscle.txtملاحظة: قم بتعيين التمهيديات التي تم إنشاؤها مقابل المحاذاة الكاملة (لا تستخدم المحاذاة غير المكررة) وتصحيح الأخطاء يدويًا وتضمين 5 مواضع التمهيدي التنكسية كحد أقصى. 2. PCR متعددة قم بإجراء PCR المتعدد باستخدام الكبيرز المصممة وتسلسل nanopore وIllumina. تم تنفيذ PCR متعددة لUSUV كما وصف ها السابق19،21. تنفيذ الأساسية مع الوجه بالتخبط الإصدار 3.0.6.6 +9999d81. 3. تحليل البيانات لتوليد تسلسل الإجماع من البيانات نانوبور يمكن أن تكون عدة عينات متعددة على تشغيل تسلسل نانوبور واحد. بعد تنفيذ تشغيل التسلسل، demultiplex البيانات نانوبور. استخدام Porechop25 لهذا الغرض. لمنع التلوث وتعزيز الدقة، استخدم require_two_barcodes العلم. على سطر الأوامر أدخل:- porechop -i Run_USUV.fastq -o Run_USUV_demultiplex -require_two_barcodes بعد demultiplexing، قم بإزالة تسلسل التمهيدي (المشار إليه في الملف Primers_Usutu.fasta في كلا الاتجاهين) باستخدام cutadapt26. بالإضافة إلى ذلك، قم بإزالة التسلسلات التي يقل طولها عن 75 نيوكليوتيدات. يجب إزالة الالتمهيديات لأنها يمكن أن تدخل تحيزات مصطنعة في تسلسل توافق الآراء. على سطر الأوامر أدخل:- cutadapt -b ملف: Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 يمكن تعيين قراءات التسلسل Demultiplexed مقابل لوحة من سلالات مرجعية متميزة باستخدام minimap227 ويمكن إنشاء تسلسل توافقي باستخدام samtools28. اتبع المثال أدناه الذي يظهر إجراء المحاذاة المستندة إلى مرجع وتوليد تسلسل توافق الآراء من عينة واحدة: BC01. على سطر الأوامر أدخل:- minimap2 -ax خريطة ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam- samtools فرز BC01.bam > BC01_sorted.bam- bcftools mpileup -Ou-f-f Random_Refs_USUV.fasta BC01_sorted.bam | bcftools استدعاء -mv-Oz-o BC01.vcf.gz- مؤشر bcftools BC01.vcf.gz- القط Random_Refs_USUV.fasta | bcftools توافق الآراء BC01.vcf.gz > BC01_consensus.fasta بالنسبة للمحاذاة المستندة إلى المراجع، من الضروري استخدام تسلسل مرجعي وثيق الصلة. لذلك، قم بإجراء بحث BlastN مع تسلسل الإجماع الذي تم إنشاؤه لتحديد الضغط المرجعي الأقرب. بعد ذلك، كرر المحاذاة المستندة إلى المراجع مع أقرب سلالة مرجعية كمرجع (الخطوة 3.3 و 3.4). على سطر الأوامر أدخل:- minimap2 -ax خريطة ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam- samtools فرز BC01_ref.bam > BC01_sorted_ref.bam- bcftools mpileup -Ou-f-Ref_USUV_BC01.fasta BC01_sorted_ref.bam | bcftools استدعاء -mv-Oz-o BC01_ref.vcf.gz- مؤشر بفلوس BC01_ref.vcf.gz- القط Ref_USUV_BC01.fasta | bcftools توافق الآراء BC01_ref.vcf.gz > BC01_ref_consensus.fasta 4 – تحليل بيانات إيلومينا يتم إلغاء هذه التسلسلات تلقائيًا بعد التسلسل. قراءات يمكن أن تكون نوعية تسيطر عليها باستخدام trimmomatic29. لتسلسل Illumina المقترنة نهاية، استخدم درجة PHRED المتوسطة المنقطع شائعة الاستخدام من 33 وحد أدنى من طول القراءة من 75 للحصول على قراءات دقيقة وعالية الجودة. على سطر الأوامر أدخل:- trimmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75 إزالة التمهيديات (المشار لها في الملف Primers_Usutu.fasta في كلا الاتجاهين)، لأنها يمكن أن تقدم التحيزات الاصطناعية، وذلك باستخدام cutadapt26. بالإضافة إلى ذلك، قم بإزالة التسلسلات ذات الطول الأقصر من 75 نيوكليوتيدباستخدام الأوامر أدناه. على سطر الأوامر أدخل:- cutadapt -b س 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 قبل دي نوفو الجمعية، يمكن تطبيع تسلسل يقرأ لتغطية حتى عبر الجينوم. هذا أمر ضروري منذ دي نوفو المجمعين مثل SPAdes تأخذ تغطية القراءة في الاعتبار عند تجميع تسلسل يقرأ. تطبيع يقرأ إلى قراءة تغطية 50 باستخدام BBNorm من حزمة BBMap30. على سطر الأوامر أدخل:- bbmap/bbnorm.sh الهدف =50 في =9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq يتم تجميع القراءات العادية باستخدام SPAdes31. يتم استخدام الإعدادات الافتراضية للتجميع باستخدام كافة kmers مختلفة (21 و 33 و 55 و 77 و 99 و 127). على سطر الأوامر أدخل:- spades.py -k 21،33،55،77،99،127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq خريطة QC يقرأ ضد تسلسل توافق الآراء التي تم الحصول عليها باستخدام minimap2 وبرامج مثل جينيوس، Bioedit أو Ugene لتنظيم المحاذاة. من المهم التحقق من بداية ونهاية التلاصق. محاذاة QC يقرأ ضد التسلسل توافق الآراء التي تم الحصول عليها باستخدام minimap2. استيراد المحاذاة في جينيوس / Bioedit / UGene. فحص يدويا، والصحيح والخوري وخاصة بداية ونهاية الجينوم. 5. تحديد التغطية القراءة المطلوبة للتعويض عن ملف تعريف الخطأ في تسلسل nanopore باستخدام بيانات Illumina كمعيار ذهبي حدد تسلسل يقرأ تعيين إلى amplicon واحد، في هذه الحالة amplicon 26. في وقت لاحق، خريطة nanopore يقرأ ضد هذا amplicon باستخدام minimap2. استخدم Samtools لتحديد تعيين القراءات فقط إلى amplicon 26 ولتحويل ملف bam إلى fastq. على سطر الأوامر أدخل:- minimap2 -ax خريطة ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam- samtools عرض -b-F 4 BC01.bam > BC01_mapped.bam- samtools bam2fq BC01_mapped.bam | seqtk seq – -> BC01_mapped.fastq حدد عشوائيا مجموعات فرعية من تسلسل 200 على سبيل المثال يقرأ ألف مرة. على سبيل المثال، سيؤدي تغييره إلى 10 إلى التحديد العشوائي لألف مرة مجموعة فرعية من 10 تسلسل يقرأ. يتم توفير البرنامج النصي كملف تكميلي 1. على سطر الأوامر أدخل:- بيثون Random_selection.بي تتم محاذاة كافة قراءات التسلسل المحددة عشوائياً إلى amplicon 26. استخدام KMA32 لتعيين تسلسل يقرأ وتوليد تسلسل توافق الآراء على الفور. استخدم الإعدادات المحسنة لتسلسل النانوبور، المشار إلى ذلك بواسطة علامة -bcNano. على سطر الأوامر أدخل:- مؤشر الكم -i Amplicon26.fasta- للملف في random_sample*؛ لا- sampleID = ${file%.fastq}- كمة -i ${sampleID}.fastq-o ${sampleID} -t_db Amplicon26.fasta-mem_mode -mp 5-mrs 0.0-bcNano- تم فحص تسلسلات الإجماع التي تم إنشاؤها على سطر الأوامر باستخدام:- القط *.fsa > All_genomes.fsa- minimap2 -ax خريطة ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam- samtools فرز All_genomes.bam > All_genomes_sorted.bam- احصائيات samtools All_genomes_sorted.bam > stats.txt يتم عرض معدل الخطأ في stats.txt تحت عنوان معدل الخطأ #mismatches / القواعد المعينة. عرضه على الشاشة مع الأمر التالي:- grep ^SN stats.txt | قطع -f 2- يتم عرض مقدار indels تحت عنوان #Indels لكل دورة. عرضه على الشاشة مع الأمر التالي:- grep ^IC stats.txt | قطع -f 2-

Representative Results

في الآونة الأخيرة ، تم إصدار نسخة جديدة من إصدار خلية التدفق (R10) وقدمت تحسينات على basecaller المستخدمة لتحويل الإشارة الحالية الإلكترونية إلى تسلسل الحمض النووي (ما يسمى بـ flip-flop basecaller). ولذلك، لدينا إعادة تسلسل USUV من أنسجة الدماغ من البومة USUV إيجابية التي كانت متسلسلة سابقا على خلية تدفق R9.4 وعلى صك Illumina Miseq21. هنا ، وصفنا الطريقة المستخدمة لتحديد التغطية القراءة المطلوبة لتوافق الآراء الموثوق به الدعوة عن طريق المقارنة المباشرة لتسلسل Illumina. باستخدام أحدث خلية تدفق في تركيبة مع basecaller الوجه بالتخبط نظهر أن قراءة التغطية من 40x النتائج في نتائج متطابقة بالمقارنة مع تسلسل Illumina. قراءة التغطية من نتائج 30x في معدل خطأ من 0.0002 ٪ الذي يقابل خطأ واحد في كل 585000 النيوكليوتيدات تسلسل ، في حين أن قراءة التغطية من نتائج 20x في خطأ واحد في كل 63529 النيوكليوتيدات تسلسل. وقراءة تغطية 10x النتائج في خطأ واحد في كل 3312 النيوكليوتيدات تسلسل، وهذا يعني أن أكثر من ثلاثة النيوكليوتيدات لكل الجينوم USUV الكامل يجري يسمى خطأ. مع تغطية القراءة فوق 30x، لم يلاحظ indels. وأسفرت تغطية قراءة 20x في الكشف عن موقف واحد indel في حين أن تغطية قراءة 10x أدى إلى indels في 29 وظيفة. يتم عرض نظرة عامة على معدل الخطأ باستخدام مختلف الأجزاء المقطوعة من التغطية المقروءة في الجدول 1. تغطيه تكرار الأخطاء 1 تكرار معدل الخطأ 1 إندلز: تكرار الأخطاء 2 تكرار معدل الخطأ 2 إندلز: تكرار الأخطاء 3 تكرار معدل الخطأ 3 إندلز: 10× 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 20× 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 50× 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 الجدول 1: نظرة عامة على معدل الخطأ في تسلسل البوبور النانوي. يمثل كل تكرار ألف عينة عشوائية. الملف التكميلي 1: اختيار عشوائي. الرجاء الضغط هنا لعرض هذا الملف (انقر على اليمين للتحميل).

Discussion

إن تسلسل النانوبور يتطور باستمرار، وبالتالي هناك حاجة إلى طرق لمراقبة معدل الخطأ. هنا ، ونحن وصف سير العمل لرصد معدل الخطأ من المنظم nanopore. يمكن أن يكون هذا مفيداً بعد إصدار خلية تدفق جديدة، أو إذا تم إصدار إصدارات جديدة من الاستدعاء الأساسي. ومع ذلك، يمكن أن يكون هذا مفيداً أيضاً للمستخدمين الذين يرغبون في إعداد بروتوكول التسلسل الخاص بهم والتحقق من صحته.

يمكن أن تسفر البرمجيات المختلفة وأدوات المحاذاة نتائج مختلفة33. في هذه المخطوطة، كنا نُمَدّر إلى استخدام حزم البرمجيات المتاحة مجاناً والتي يشيع استخدامها، والتي تحتوي على وثائق واضحة. وفي بعض الحالات، قد تعطى الأفضلية للأدوات التجارية، التي لها عموما واجهات أكثر سهولة في الاستخدام ولكن يتعين دفع ثمنها. في المستقبل ، يمكن تطبيق هذه الطريقة على نفس العينة في حالة إدخال تعديلات كبيرة في تكنولوجيا التسلسل أو برنامج basecalling بشكل تفضيلي ، وينبغي أن يتم ذلك بعد كل تحديث للbasecaller أو flowcell ، ولكن بالنظر إلى سرعة التطورات الحالية يمكن أيضًا القيام بذلك فقط بعد التحديثات الرئيسية.

يسمح التخفيض في معدل الخطأ في التسلسل بعدد أكبر من العينات أن يكون متعدد. وبالتالي ، فإن تسلسل النانو يقترب من استبدال وحدات الـ PCRs التقليدية في الوقت الحقيقي للاختبارات التشخيصية ، وهو الحال بالفعل لتشخيص فيروس الأنفلونزا. وبالإضافة إلى ذلك، فإن تخفيض معدل الخطأ يزيد من إمكانية استخدام تسلسل هذه التقنية، على سبيل المثال لتحديد المتغيرات الطفيفة والتسلسل الجيني غير الجيني غير المتحيز عالي الإنتاجية.

وتتمثل خطوة حاسمة في البروتوكول في ضرورة توافر تسلسلات مرجعية وثيقة وموثوقة. وتستند الكبيات على المعرفة الحالية حول تنوع الفيروسات وقد تحتاج إلى تحديث كل مرة واحدة في حين. نقطة حرجة أخرى عند وضع نهج تسلسل الأمبيريون القائم هو تحقيق التوازن بين تركيز التمهيدي للحصول على توازن متكافئ في عمق amplicon. وهذا يتيح تعدد العينات على تشغيل تسلسل ويؤدي إلى تخفيض كبير في التكلفة.

Disclosures

The authors have nothing to disclose.

Acknowledgements

وقد تلقى هذا العمل تمويلاً من برنامج الاتحاد الأوروبي للبحث والابتكار في أفق 2020 بموجب اتفاق المنحة رقم 643476 (COMPARE).

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video