Summary

Проверка секвенирования всего генома нанопор, использование вируса Усуту в качестве примера

Published: March 11, 2020
doi:

Summary

Ранее мы утвердили протокол для ампрона на основе всего генома usutu вируса (USUV) секвенирования на нанопор секвенирования платформы. Здесь мы описываем методы, используемые более подробно, и определяем частоту ошибок ячейки потока nanopore R10.

Abstract

Полное секвенирование генома может быть использовано для характеристики и отслеживания вирусных вспышек. Нанопор основе всего генома секвенирования протоколы были описаны для нескольких различных вирусов. Эти подходы используют перекрывающийся подход на основе ампрона, который может быть использован для целевой конкретной цели вируса или группы генетически связанных вирусов. В дополнение к подтверждению присутствия вируса, секвенирование может быть использовано для исследований геномной эпидемиологии, для отслеживания вирусов и распутывания происхождения, резервуаров и способов передачи. Для таких приложений крайне важно понять возможные последствия ошибки, связанные с используемой платформой. Регулярное применение в клинических и медицинских учреждениях требует, чтобы это было задокументировано с каждым важным изменением протокола. Ранее протокол для секвенирования вируса Усуту на платформе секвенирования нанопор был проверен (R9.4 flowcell) путем прямого сравнения с секвенированием Illumina. Здесь мы описываем метод, используемый для определения требуемого покрытия чтения, используя в качестве примера сравнение между ячейкой потока R10 и секвенированием Illumina.

Introduction

Быстрые разработки технологий последовательности третьего поколения позволяют нам двигаться вперед к непосредственному к реальному времени секвенированию во время вирусных вспышек. Эта своевременная доступность генетической информации может быть полезна для определения происхождения и эволюции вирусных патогенов. Золотые стандарты в области последовательности следующего поколения, однако, по-прежнему второго поколения секвенсоров. Эти методы опираются на конкретные и трудоемкие методы, такие как клональное усиление во время эмульсии ПЦР или клонального усиления моста. Секвенсоры третьего поколения дешевле, ручные и поставляются с упрощенными методологиями подготовки библиотеки. Особенно небольшой размер устройства последовательности и низкая цена покупки делает его интересным кандидатом для развертывания, полевых секвенирования. Это можно было, например, увидеть во время вспышки вируса Эбола в Сьерра-Леоне и во время продолжающихся исследований вспышки арбовируса в Бразилии1,2,3. Однако заявленный высокий уровень ошибок4 может ограничить приложения, для которых можно использовать секвенирование нанопор.

Секвенирование Nanopore быстро развивается. Новые продукты доступны на рынке на регулярной основе. Примерами этого являются, например, 1D квадратный наборы, которые позволяют секвенировать обе нити молекулы ДНК, тем самым повышая точность называется баз5 и развитие R10 поток овой клетки, которая измеряет изменения в токе в двух различных случаях в поре6. Кроме того, усовершенствованные биоинформатические инструменты, такие как усовершенствования в basecalling, повысят точность бейс-звонка7. Один из наиболее часто используемых бейскалькеров (например, Albacore) обновлялся по крайней мере 12 раз за 9-месячный период5. Недавно производитель также выпустил новый базовый под названием flip-flop, который реализован в программном обеспечении нанопор по умолчанию8. Вместе все эти улучшения приведут к более точным последовательности и уменьшит частоту ошибок нанопор секвенсора.

Вирус Усуту (USUV) является арбовирусом, передаваемым комарами семейства Flaviviridae, и он имеет положительно-stranded геном РНК около 11000 нуклеотидов. USUV в основном влияет на большие серые совы и черные дроздов9,10, хотя другие виды птиц также восприимчивы к USUV инфекции11. Недавно USUV был также выявлен у грызунов и землеройки, хотя их потенциальная роль в передаче вируса остается неизвестной12. У людей, бессимптомные инфекции были описаны в донорах крови13,14,15,16 в то время как USUV инфекций также сообщалось, связанные с энцефалитом или менинго-энцефалит17,18. В Нидерландах USUV впервые был обнаружен у диких птиц в 2016году 10 и в бессимптомных донорах крови в 2018году 14. С момента первоначального обнаружения USUV, вспышки были зарегистрированы в течение последующих лет и эпиднадзора, в том числе весь секвенирование генома, в настоящее время продолжается для мониторинга появления и распространения арбовируса в ранее наивной популяции.

Подобно тому, что было описано для других вирусов, таких как вирус Эбола, вирус Зика и вирус желтой лихорадки3,19,20, мы разработали грунтовку набор для последовательности полной длины USUV21. Этот подход на основе полимеразы цепи (PcR) позволяет восстановить полноформатные геномы USUV из сильно загрязненных хост-типов образцов, таких как образцы мозга в образцах до значения Ct около 32. Преимуществам подхода к секвенированию на основе амприкона являются более высокая чувствительность по сравнению с метагеномным секвенированием и более высокая специфичность. Ограничения использования ампронов основе подхода в том, что последовательности должны быть аналогичными для того, чтобы разработать грунтовки установки всех штаммов и что праймеры разработаны на наших нынешних знаний о разнообразии вирусов.

Учитывая постоянные разработки и улучшения в последовательности третьего поколения, необходимо регулярно оценивать частоту ошибок секвенсора. Здесь мы описываем метод оценки производительности нанопор непосредственно против последовательности Illumina с использованием USUV в качестве примера. Этот метод применяется к последовательностям, генерируемым с последней ячейкой потока R10, и базовый вызов выполняется с последней версией флип-флопа basecaller.

Protocol

ПРИМЕЧАНИЕ: Список программных средств, которые будут использоваться: usearch v11.0.667; мышца v3.8.1551; порехоп 0.2.4; cutadapt 2.5; minimap2 2.16-r922; samtools 1.9; триммоматическая 0,39; bbmap 38.33; пики v3.13.1; кма-1.2.8 1. Дизайн Праймера Начните с загрузки или извлечения набора соответствующих референтных целых последовательностей генома из общедоступных или частных коллекций данных. Например, получить все полноформатные геномы USUV (taxid64286) из базы данных NCBI22. USUV кодирует геном около 11000 нуклеотидов, так что только получить последовательности с последовательностью длиной 8000-12000 нуклеотидов. Сделайте это с помощью следующей записи поиска:- taxid64286 (Организм:noexp) И 8000 (SLEN):12000 (SLEN). Нажмите на Отправить на Полная запись Файл; использовать Формат и FASTA и создать файл. Чтобы уменьшить набор референтных последовательностей, удалите дубликаты последовательностей или последовательностей с более чем 99% нуклеотидной идентичностью из набора данных. Сделайте это с помощью кластера быстрый вариант от usearch23. На командной строке введите:- usearch -cluster_fast All_USUV.fasta -id 0.99 -центроиды All_USUV_dedup.fasta Для генерации грунтовок последовательности должны быть выровнены. Это делается с помощью MUSCLE24. На командной строке введите:- мышцы – в All_USUV_dedup.fasta-out All_USUV_dedup_aligned.fasta -log log_muscle.txtПРИМЕЧАНИЕ: Важно вручную проверить выравнивание, чтобы проверить несоответствия. Они могут быть исправлены вручную, если это необходимо, и концы могут быть обрезаны в соответствии с длиной большинства целых последовательностей генома. Primal используется для составления проекта выбор грунтовки, которые могут быть использованы для полной длины ампрона секвенирования19. Загрузите выравнивание на первичный веб-сайт(http://primal.zibraproject.org/)и выберите предпочтительную длину ампикона и длину перекрытия между различными ампиконами. Перейти к primal.zibraproject.org, заполнить имя схемы,загрузить выровненный файл fasta, выберите длину ампрона, размер перекрытия и создать схему. Выровнять полный набор доступных полных последовательностей USUV (не уменьшенный или дублированный набор). На командной строке введите:- мышцы -в All_USUV.fasta -out All_USUV_aligned.fasta -журнал log_muscle.txtПРИМЕЧАНИЕ: Карта генерируемых праймеров против полного выравнивания (не используйте дублированное выравнивание), вручную исправьте ошибки и включите максимум 5 дегенеративных позиций грунтовки. 2. Мультиплекс ПЦР Выполните мультиплекс PCR с использованием разработанных грунтовок и нанопор и последовательности Illumina. Мультиплекс PCR для USUV был выполнен как ранее описанные19,21. Выполните basecalling с флип-флоп версия 3.0.6.6’9999d81. 3. Анализ данных для генерации последовательностей консенсуса из данных нанопор Несколько образцов можно мультиплексировать на одном запуске секвенирования нанопор. После выполнения последовательности запуска, demultiplex нанопор данных. Используйте Porechop25 для этого. Для предотвращения загрязнения и повышения точности используйте require_two_barcodes флаг. На командной строке введите:- porechop -i Run_USUV.fastq-o Run_USUV_demultiplex –require_two_barcodes После demultiplexing, удалить грунтовки последовательности (указано в файле Primers_Usutu.fasta в обеих ориентациях) с помощью cutadapt26. Кроме того, удалите последовательности с длиной короче 75 нуклеотидов. Праймеры должны быть удалены, поскольку они могут ввести искусственные предубеждения в последовательности консенсуса. На командной строке введите:- cutadapt -b файл:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 Demultiplexed последовательность читает можно составить на панели различных штаммов ссылка с помощью minimap227 и консенсус последовательность может быть создана с помощью samtools28. Следуйте примеру ниже, который показывает процедуру выравнивания на основе ссылки и генерацию последовательности консенсуса одного образца: BC01. На командной строке введите:- minimap2 -топор карта-ont Random_Refs_USUV.fasta BC01_trimmed.fastq- samtools сортировать BC01.ba BC01_sortedm- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam- bcftools индекс BC01.vcf.gz- кошка Random_Refs_USUV.fasta и bcftools консенсусbc01.vcf.g BC01_consensusz Для референтных выравниваний важно использовать тесно связанную референтную последовательность. Таким образом, выполните поиск BlastN с генерируемой последовательностью консенсуса, чтобы определить ближайший штамм ссылки. После этого повторите референс-выравнивание с ближайшим эталонным напряжением в качестве эталона (шаг 3.3 и 3.4). На командной строке введите:- minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fast BC01_refq- samtools сортировать BC01_ref.ба BC01_sorted_refм- bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.ba BC01_refm- индекс bcftools BC01_ref.vcf.gz- Кошка Ref_USUV_BC01.fasta и bcftools консенсуса BC01_ref.vcf.g BC01_ref_consensusz 4. Анализ данных Illumina Эти последовательности автоматически демножены после секвенирования. Чтения могут контролироваться с помощью trimmomatic29. Для парного конца Последовательности Illumina, используйте широко используемый отсечения медианный балл PHRED 33 и минимальная длина чтения 75, чтобы получить точные, высокое качество читает. На командной строке введите:- триммоматический PE-phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75 Удалите грунтовки (указанные в файле Primers_Usutu.fasta в обеих ориентациях), так как они могут ввести искусственные предубеждения, используя cutadapt26. Кроме того, удалите последовательности с длиной короче 75 нуклеотидов, используя приведенные ниже команды. На командной строке введите:- cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 Перед сборкой de novo, считывание последовательности может быть нормализовано для равномерного покрытия по всему геному. Это важно, так как de novo сборщики, такие как SPAdes, учитывают охват чтения при сборке последовательности. Нормализация читает читать охват 50 с помощью BBNorm из пакета BBMap30. На командной строке введите:- bbmap/bbnorm.sh target-50 в 9_1P_trimmed.fastq в 2-9_2P_trimmed.fastq out-Sample9_FW_norm.fastq out2’Sample9_RE_norm.fastq Нормализованные считывания de novo собраны с использованием SPAdes31. Настройки по умолчанию используются для сборки с использованием всех различных км (21, 33, 55, 77, 99 и 127). На командной строке введите:- spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq Карта КК читает против полученной последовательности консенсуса с помощью minimap2 и таких программ, как Geneious, Bioedit или Ugene, чтобы курировать выравнивание. Важно проверить начало и конец контига. Выровнять КК читает против полученного консенсуса последовательности с помощью minimap2. Импорт выравнивание в Гениальный / Bioedit / UGene. Вручную осматривайте, корректируют и курируют особенно начало и конец генома. 5. Определение требуемого охвата чтения для компенсации профиля ошибки в секвенировании нанопор с использованием данных Illumina в качестве золотого стандарта Выберите последовательность считывает отображение на один ампикон, в данном случае ампиикон 26. Впоследствии карта нанопор считывается против этого ампромсона с помощью minimap2. Используйте Samtools, чтобы выбрать только считыватель на ампром26 и преобразовать файл бама в fastq. На командной строке введите:- minimap2 -ax карта-онт -м 150 Amplicon26.fasta BC01_trimmed.fastq- samtools зрения -b -F 4 BC01.ba BC01_mappedm- samtools bam2fq BC01_mapped.bam seqtk seq – -‘gt; BC01_mapped.fastq Случайно выберите подмножества, например, 200 последовательности считывает сявок тысячу раз. Например, изменение его на 10 приведет к случайному выбору в тысячу раз подмножество 10 последовательности читает. Скрипт предоставляется в качестве дополнительного файла 1. На командной строке введите:- питон Random_selection.py Все случайно выбранные считыватели последовательности выровнены с ампииконом 26. Используйте KMA32 для картирования считываемых последовательностей и немедленного создания последовательности консенсуса. Используйте оптимизированные настройки для секвенирования нанопора, указанные флагом -bcNano. На командной строке введите:- индекс kma -i Amplicon26.fasta- для файла в random_sample;- sampleID ‘$’file.fastq- kma -i $.sampleID.fastq -o $’sampleID- -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano- сделано Проинспектировать генерируемые последовательности консенсуса на командной строке с помощью:- кошка З.Ф All_genomesса- minimap2 -топор карта-ont Amplicon26.fasta All_genomes.fs All_genomesa- samtools сортировать All_genomes.ба All_genomes_sortedм- samtools статистика All_genomes_sorted.bam Частота ошибок отображается в stats.txt под заголовком скорость ошибки #mismatches / базы отображаются. Отобразите его на экране со следующей командой:- grep sN stats.txt Количество indels отображается под заголовком #Indels за цикл. Отобразите его на экране со следующей командой:- grep sIC stats.txt – вырезать -f 2-

Representative Results

Недавно была выпущена новая версия версии ячейки потока (R10) и предложены улучшения для basecaller, используемого для преобразования электронного сигнала тока в последовательности ДНК (так называемый флип-флоп basecaller). Таким образом, у нас есть повторно секвенированные USUV из ткани мозга USUV-положительной совы, которая ранее была секвенирована на R9.4 потоковой клетки и на инструменте Illumina Miseq21. Здесь мы описали метод, используемый для определения необходимого охвата чтения для надежного консенсуса вызова путем прямого сравнения с постоянством Illumina. Использование новой ячейки потока в сочетании с флип-флопом basecaller мы покажем, что охват чтения 40x приводит к идентичным результатам по сравнению с подвешиванием Illumina. Охват чтения 30x приводит к частоте ошибок 0.0002%, что соответствует одной ошибке в каждых 585,000 нуклеотидов секвенированных, в то время как чтение охвата 20x приводит к одной ошибке в каждых 63,529 нуклеотидов секвенированных. Прочитанное покрытие 10x приводит к одной ошибке в каждых 3.312 nucleotides секвенированных, намереваясь что над 3 нуклеотидами в полный геном USUV вызывают неправильно. При охвате чтения выше 30x, никаких indels не наблюдалось. Охват чтения 20x привел к обнаружению одного indel позиции в то время как читать охват 10x привело к indels в 29 позиций. Обзор частоты ошибок с использованием различных отсечений покрытия чтения отображается в таблице 1. Покрытие Итерация ошибок 1 Итерация частоты ошибок 1 Indels: Итерация ошибок 2 Итерация частоты ошибок 2 Indels: Итерация ошибок 3 Итерация частоты ошибок 3 Indels: 10 ” 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 20 лет 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 50 ” 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 Таблица 1: Обзор частоты ошибок секвенирования нанопора. Каждая итерация представляет собой тысячу случайных образцов. Дополнительный файл 1: Случайный выбор. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать).

Discussion

Секвенирование Nanopore постоянно развивается, и поэтому существует необходимость в методах мониторинга частоты ошибок. Здесь мы описываем рабочий процесс для мониторинга частоты ошибок нанопор секвенсора. Это может быть полезно после выпуска новой ячейки потока, или если новые релизы basecalling выпущены. Однако это также может быть полезно для пользователей, которые хотят настроить и проверить свой собственный протокол последовательности.

Различные программы и инструменты выравнивания могут дать различные результаты33. В этой рукописи мы стремились использовать свободно доступные пакеты программного обеспечения, которые широко используются и которые имеют четкую документацию. В некоторых случаях предпочтение может отдаваться коммерческим инструментам, которые, как правило, имеют более удобные интерфейсы, но должны быть оплачены. В будущем, этот метод может быть применен к той же выборке в случае, если большие изменения в технологии последовательности или basecalling программного обеспечения вводятся Предпочтительно это должно быть сделано после каждого обновления basecaller или flowcell, однако, учитывая скорость текущих событий это также может быть сделано только после крупных обновлений.

Снижение частоты ошибок в секвенировании позволяет мультиплексировать большее число образцов. Таким образом, секвенирование нанопор приближается к замене обычных ПЦР в реальном времени для диагностических анализов, что уже имеет место в случае диагностики вируса гриппа. Кроме того, снижение частоты ошибок повышает удобство секвенирования этого метода, например для определения незначительных вариантов и для высокой пропускной способности беспристрастного метагеномического секвенирования.

Важным шагом в протоколе является наличие близких и надежных эталонных последовательностей. Праймеры основаны на текущих знаниях о разнообразии вирусов и, возможно, должны обновляться каждый раз в то время. Другим критическим моментом при настройке подхода к секвенированию на основе амприкона является балансирование концентрации грунтовки, чтобы получить ровный баланс в глубине ампрона. Это позволяет мультиплексировать больше образцов на последовательности запуска и приводит к значительному сокращению затрат.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Эта работа получила финансирование от научно-исследовательской и инновационной программы Европейского союза «Горизонт 2020» в соответствии с соглашением о предоставлении грантов No 643476 (COMPARE).

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video