Summary

Validando o sequenciamento de nanoporos de genoma inteiro, usando o vírus Usutu como exemplo

Published: March 11, 2020
doi:

Summary

Nós validamos anteriormente um protocolo para sequenciamento do vírus Usutu (USUV) baseado em amplicon em uma plataforma de sequenciamento de nanoporos. Aqui, descrevemos os métodos usados com mais detalhes e determinamos a taxa de erro da célula de fluxo Nanopore R10.

Abstract

O sequenciamento do genoma inteiro pode ser usado para caracterizar e rastrear surtos virais. Protocolos de sequenciamento de genomas baseados em nanoporos foram descritos para vários vírus diferentes. Essas abordagens utilizam uma abordagem sobreposta baseada em amplicon que pode ser usada para atingir um vírus específico ou grupo de vírus geneticamente relacionados. Além da confirmação da presença do vírus, o sequenciamento pode ser utilizado para estudos de epidemiologia genômica, para rastrear vírus e desvendar origens, reservatórios e modos de transmissão. Para tais aplicações, é fundamental entender possíveis efeitos da taxa de erro associada à plataforma utilizada. A aplicação de rotina em ambientes clínicos e de saúde pública exige que isso seja documentado com todas as mudanças importantes no protocolo. Anteriormente, um protocolo para sequenciamento de vírus de genoma inteiro usutu na plataforma de sequenciamento de nanoporos foi validado (R9.4 flowcell) por comparação direta com o sequenciamento de Illumina. Aqui, descrevemos o método utilizado para determinar a cobertura de leitura necessária, usando como exemplo a comparação entre a célula de fluxo R10 e o sequenciamento de Illumina.

Introduction

A evolução rápida das tecnologias de seqüência de terceira geração nos permite avançar para perto do sequenciamento em tempo real durante surtos virais. Essa disponibilidade oportuna de informações genéticas pode ser útil para determinar a origem e evolução dos patógenos virais. Os padrões de ouro nos campos de sequenciamento da próxima geração, no entanto, ainda são os sequenciadores de segunda geração. Essas técnicas dependem de técnicas específicas e demoradas, como amplificação clonal durante uma amplificação de emulsão pcr ou ponte clonal. Os sequenciadores de terceira geração são mais baratos, portáteis e vêm com metodologias simplificadas de preparação de bibliotecas. Especialmente o pequeno tamanho do dispositivo de seqüência e o baixo preço de compra torna-o um candidato interessante para sequenciamento implantável e em campo. Isso poderia, por exemplo, ser visto durante o surto de ebola na Serra Leoa e durante as investigações de surto de arbovirose susceno no Brasil1,2,3. No entanto, a alta taxa de erro relatada4 pode limitar os aplicativos para os quais o sequenciamento de nanoporos pode ser usado.

O sequenciamento de nanoporos está evoluindo rapidamente. Novos produtos estão disponíveis no mercado regularmente. Exemplos disso são, por exemplo, os kits 1D ao quadrado que permitem o sequenciamento de ambos os fios da molécula de DNA, aumentando assim a precisão das chamadas bases5 e o desenvolvimento da célula de fluxo R10 que mede a mudança na corrente em duas instâncias diferentes no poro6. Além disso, ferramentas bioinformática aprimoradas, como melhorias na chamada básica, melhorarão a precisão do basecall7. Um dos mais usados como basecallers (por exemplo, Albacore), foi atualizado pelo menos 12 vezes em um período de 9 meses5. Recentemente, a fabricante também lançou um novo chamado flip-flop, que é implementado no software de nanoporos padrão8. Juntos, todas essas melhorias levarão a sequências mais precisas e diminuirão a taxa de erro do sequenciador nanoporo.

O vírus Usutu (USUV) é um arbovírus transmitido por mosquitos da família Flaviviridae e tem um genoma RNA com um fio positivo de cerca de 11.000 nucleotídeos. O USUV afeta principalmente grandes corujas-cinzentas e blackbirds9,10, embora outras espécies de aves também sejam suscetíveis à infecção pelo USUV11. Recentemente, a USUV também foi identificada em roedores e megeras, embora seu potencial papel na transmissão do vírus permaneça desconhecido12. Em humanos, foram descritas infecções assintomáticas em doadores de sangue13,14,15,16 enquanto infecções usam também foram relatadas como associadas com encefalite ou meningo-encefalite17,18. Nos Países Baixos, o USUV foi detectado pela primeira vez em aves silvestres em 201610 e em doadores de sangue assintomáticos em 201814. Desde a detecção inicial do USUV, surtos foram relatados durante os anos subsequentes e a vigilância, incluindo o sequenciamento de genomas inteiros, está atualmente em andamento para monitorar o surgimento e a disseminação de um arbovírus em uma população anteriormente ingênua.

Semelhante ao que foi descrito para outros vírus, como vírus ebola, zika vírus e vírus da febre amarela3,19,20, desenvolvemos um primer definido para seqüência de comprimento total USUV21. Esta abordagem baseada em reação em cadeia de polimerase (PCR) permite a recuperação de genomas USUV de comprimento total de genomas usuv de tipos de amostras altamente contaminados por hospedeiros, como amostras cerebrais em amostras até um valor de Ct de cerca de 32. Os benefícios de uma abordagem de seqüenciamento baseada em amplicon são uma sensibilidade maior em comparação com o sequenciamento metagenómico e uma especificidade maior. As limitações do uso de uma abordagem baseada em amplicon são que as seqüências devem ser semelhantes para projetar primers que se encaixam em todas as cepas e que os primers são projetados em nosso conhecimento atual sobre a diversidade de vírus.

Dada a evolução constante e melhorias no sequenciamento de terceira geração, há a necessidade de avaliar a taxa de erro do sequenciador regularmente. Aqui, descrevemos um método para avaliar o desempenho do nanoporo diretamente contra o sequenciamento de Illumina usando USUV como exemplo. Este método é aplicado a seqüências geradas com a célula de fluxo R10 mais recente e a chamada base é realizada com a versão mais recente do chamador base flip-flop.

Protocol

NOTA: Lista de ferramentas de software a serem utilizadas: usearch v11.0.667; músculo v3.8.1551; porechop 0.2.4; cutadapt 2.5; minimap2 2.16-r922; samtools 1.9; trimmomatic 0,39; bbmap 38.33; espadas v3.13.1; kma-1.2.8 1. Design de primer Comece com o download ou recuperação de um conjunto de seqüências de genoma suscitadas de referência relevantes de coleções de dados públicas ou privadas. Por exemplo, recupere todos os genomas USUV de comprimento total (taxid64286) do banco de dados NCBI22. USUV codifica um genoma de cerca de 11.000 nucleotídeos, então só recupere as seqüências com um comprimento de seqüência de 8.000-12.000 nucleotídeos. Faça isso usando a seguinte entrada de pesquisa:- taxid64286[Organism:noexp] E 8000[SLEN]:12000[SLEN]. Clique em Enviar para | Registro completo | Arquivo; usar formato = FASTA e criar o Arquivo. Para reduzir o tamanho do conjunto de seqüências de referência, remova seqüências duplicadas ou seqüências com mais de 99% de identidade de nucleotídeos do conjunto de dados. Faça isso usando a opção cluster fast do usearch23. Na linha de comando digite:- usearch -cluster_fast All_USUV.fasta -id 0,99 -centroids All_USUV_dedup.fasta Para gerar os primers, as sequências precisam ser alinhadas. Isso é feito usando MUSCLE24. Na linha de comando digite:- músculo -em All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -log log_muscle.txtNOTA: É essencial inspecionar manualmente o alinhamento para verificar se há discrepâncias. Estes podem ser corrigidos manualmente se necessário e as extremidades podem ser aparadas de acordo com o comprimento da maioria das seqüências de genoma inteiros. Primal é usado para fazer uma seleção de rascunho dos primers que podem ser usados para seqüência de amplicon de comprimento total19. Carregue o alinhamento para o site primitivo(http://primal.zibraproject.org/)e selecione o comprimento de amplicon preferido e sobreponha o comprimento entre os diferentes amplicons. Vá para primal.zibraproject.org, preencha o nome Esquema,carregue o arquivo fasta alinhado, selecione o comprimento do amplicon, sobreponha o tamanho e gere o esquema. Alinhe o conjunto completo de seqüências USUV completas disponíveis (não o conjunto reduzido ou deduplicado). Na linha de comando digite:- músculo -em All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txtNOTA: Mapeie os primers gerados contra o alinhamento completo (não use o alinhamento duplicado), corrija manualmente erros e inclua um máximo de 5 posições degenerativas de primer. 2. Multiplex PCR Execute o MULTIPLEX PCR usando os primers projetados e sequenciamento de nanoporos e Illumina. O PCR multiplex para USUV foi realizado como descritoanteriormente 19,21. Execute a chamada base com a versão 3.0.6.6+9999d81. 3. Análise de dados para gerar seqüências de consenso a partir de dados de nanoporos Várias amostras podem ser multiplexadas em uma única seqüência de nanoporos. Depois de executar a sequência de execução, demultiplexe os dados de nanoporos. Use Porechop25 para isso. Para evitar contaminação e aumentar a precisão, utilize a bandeira require_two_barcodes. Na linha de comando digite:- porechop -i Run_USUV.fastq -o Run_USUV_demultiplex –require_two_barcodes Após desmultiplexação, remova seqüências de primer (indicadas no arquivo Primers_Usutu.fasta em ambas as orientações) usando cutadapt26. Além disso, remova sequências com um comprimento menor que 75 nucleotídeos. Os primers devem ser removidos, pois podem introduzir vieses artificiais na seqüência de consenso. Na linha de comando digite:- cutadapt -b arquivo:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 As leituras de seqüência demultiplexadas podem ser mapeadas contra um painel de diferentes cepas de referência usando minimap227 e uma seqüência de consenso pode ser gerada usando samtools28. Siga o exemplo abaixo que mostra o procedimento de um alinhamento baseado em referência e a geração de seqüência de consenso de uma amostra: BC01. Na linha de comando digite:- minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam- samtools classificar BC01.bam > BC01_sorted.bam- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam | bcftools call -mv -Oz -o BC01.vcf.gz- bcftools índice BC01.vcf.gz- gato Random_Refs_USUV.fasta | bcftools consenso BC01.vcf.gz > BC01_consensus.fasta Para alinhamentos baseados em referência, é essencial que uma seqüência de referência intimamente relacionada seja usada. Portanto, realize uma pesquisa BlastN com a seqüência de consenso gerada para identificar a cepa de referência mais próxima. Depois disso, repita o alinhamento baseado em referência com a linha gemida de referência mais próxima como referência (etapa 3.3 e 3.4). Na linha de comando digite:- minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam- samtools classificar BC01_ref.bam > BC01_sorted_ref.bam- bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam | bcftools call -mv -Oz -o BC01_ref.vcf.gz- índice bcftools BC01_ref.vcf.gz- gato Ref_USUV_BC01.fasta | consenso bcftools BC01_ref.vcf.gz > BC01_ref_consensus.fasta 4. Análise dos dados da Illumina Essas seqüências são automaticamente demultiplexadas após o sequenciamento. As leituras podem ser controladas pela qualidade usando trimmomatic29. Para seqüências de Illumina de extremidade emparelhada, use a pontuação mediana de phred de corte comumente usada de 33 e um comprimento mínimo de leitura de 75 para obter leituras precisas e de alta qualidade. Na linha de comando digite:- trimmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3 MINLEN:75 Remova os primers (indicados no arquivo Primers_Usutu.fasta em ambas as orientações), pois eles podem introduzir vieses artificiais, usando cutadapt26. Além disso, remova seqüências com um comprimento menor que 75 nucleotídeos usando os comandos abaixo. Na linha de comando digite:- cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 Antes da montagem de novo, as leituras da seqüência podem ser normalizadas para uma cobertura uniforme em todo o genoma. Isso é essencial, pois montadoras de novo como SPAdes levam em conta a cobertura de leitura ao montar leituras de seqüência. Normalizar leituras para uma cobertura de leitura de 50 usando BBNorm do pacote BBMap30. Na linha de comando digite:- bbmap/bbnorm.sh target=50 in=9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq As leituras normalizadas são montadas de novo usando SPAdes31. As configurações padrão são usadas para o conjunto usando todos os kmers diferentes (21, 33, 55, 77, 99 e 127). Na linha de comando digite:- spades.py -k 21,33,55,77,99,127 -o Amostra9 -1 Amostra9.qc.f.fq -2 Sample9.qc.r.fq Mapeie o QC lê contra a seqüência de consenso obtida usando minimap2 e programas como Geneious, Bioedit ou Ugene para fazer a curadoria do alinhamento. É importante verificar o início e o fim do contig. Alinhar as leituras do QC contra o sequenciamento de consenso obtido usando minimap2. Importe o alinhamento em Geneious/Bioedit/UGene. Inspecione manualmente, corrija e faça a curadoria especialmente o início e o fim do genoma. 5. Determinar a cobertura de leitura necessária para compensar o perfil de erro no sequenciamento de nanoporos usando dados de Illumina como padrão-ouro Selecionar seqüência lê mapeamento para um amplicon, neste caso amplicon 26. Posteriormente, mapeie as leituras de nanoporos contra este amplicon usando minimap2. Use samtools para selecionar apenas o mapeamento de leituras para amplicon 26 e converter o arquivo bam em fastq. Na linha de comando digite:- minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam- samtools view -b -F 4 BC01.bam > BC01_mapped.bam- samtools bam2fq BC01_mapped.bam | seqtk seq – -> BC01_mapped.fastq Selecionar aleatoriamente subconjuntos de, por exemplo, 200 sequências lê mil vezes. Por exemplo, alterá-lo para 10 resultará na seleção aleatória de mil vezes um subconjunto de 10 leituras de seqüência. O script é fornecido como Arquivo Suplementar 1. Na linha de comando digite:- python Random_selection.py Todas as leituras de seqüência selecionadas aleatoriamente estão alinhadas ao amplicon 26. Use KMA32 para mapear as leituras da seqüência e gerar imediatamente uma seqüência de consenso. Use configurações otimizadas para sequenciamento de nanoporos, indicada pela bandeira -bcNano. Na linha de comando digite:- índice kma -i Amplicon26.fasta- para arquivo em random_sample*;- sampleID=${file%.fastq}- kma -i ${sampleID}.fastq -o ${sampleID} -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano- feito Inspecione as seqüências de consenso geradas na linha de comando usando:- gato *.fsa > All_genomes.fsa- minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam- samtools tipo All_genomes.bam > All_genomes_sorted.bam- estatísticas de samtools All_genomes_sorted.bam > stats.txt A taxa de erro é exibida no stats.txt a taxa de erro de título #mismatches / bases mapeadas. Exiba-o na tela com o seguinte comando:- grep ^SN stats.txt | corte -f 2- A quantidade de indels é exibida a posição #Indels por ciclo. Exiba-o na tela com o seguinte comando:- grep ^IC stats.txt | corte -f 2-

Representative Results

Recentemente, uma nova versão da versão flow cell (R10) foi lançada e ofereceu melhorias ao chamador de base usado para converter o sinal de corrente eletrônica em seqüências de DNA (o chamado flip-flop basecaller). Portanto, sequenciamos o USUV do tecido cerebral de uma coruja usuv-positiva que foi anteriormente seqüenciada em uma célula de fluxo R9.4 e em um instrumento Illumina Miseq21. Aqui, descrevemos o método utilizado para determinar a cobertura de leitura necessária para uma chamada de consenso confiável, em comparação direta com o sequenciamento de Illumina. Usando a célula de fluxo mais nova em combinação com o flip-flop do chamador base, mostramos que uma cobertura de leitura de 40x resulta em resultados idênticos em comparação com o sequenciamento de Illumina. Uma cobertura de leitura de 30x resulta em uma taxa de erro de 0,0002% que corresponde a um erro em cada 585.000 nucleotídeos seqüenciados, enquanto uma cobertura de leitura de 20x resulta em um erro em cada 63.529 nucleotídeos seqüenciados. Uma cobertura de leitura de 10x resulta em um erro em cada 3.312 nucleotídeos sequenciados, o que significa que mais de três nucleotídeos por genoma USUV completo estão sendo chamados de errados. Com uma cobertura de leitura acima de 30x, não foram observados indels. Uma cobertura de leitura de 20x resultou na detecção de uma posição indel, enquanto uma cobertura de leitura de 10x resultou em indels em 29 posições. Uma visão geral da taxa de erro usando diferentes cortes de cobertura de leitura é mostrada na Tabela 1. Cobertura Erros de iteração 1 Iteração da taxa de erro 1 Indels: Erros de iteração 2 Iteração da taxa de erro 2 Indels: Erros de iteração 3 Iteração da taxa de erro 3 Indels: 10× 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 20× 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 50× 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 Tabela 1: Visão geral da taxa de erro da seqüência de nanoporos. Cada iteração representa mil amostras aleatórias. Arquivo Suplementar 1: Seleção aleatória. Clique aqui para ver este arquivo (Clique com o botão direito do mouse para baixar).

Discussion

O sequenciamento de nanoporos está em constante evolução e, portanto, há a necessidade de métodos para monitorar a taxa de erro. Aqui, descrevemos um fluxo de trabalho para monitorar a taxa de erro do sequenciador de nanoporos. Isso pode ser útil após o lançamento de uma nova célula de fluxo, ou se novas versões da chamada base forem lançadas. No entanto, isso também pode ser útil para usuários que desejam configurar e validar seu próprio protocolo de seqüenciamento.

Diferentes softwares e ferramentas de alinhamento podem produzir resultados diferentes33. Neste manuscrito, buscamos usar pacotes de software disponíveis gratuitamente que são comumente usados e que tenham documentação clara. Em alguns casos, a preferência pode ser dada às ferramentas comerciais, que geralmente têm interfaces mais fáceis de usar, mas têm que ser pagas. No futuro, este método pode ser aplicado à mesma amostra no caso de grandes modificações na tecnologia de seqüência ou software de chamada base são introduzidos Preferencialmente isso deve ser feito após cada atualização do chamador base ou flowcell, no entanto, dada a velocidade dos desenvolvimentos atuais, isso também pode ser feito somente após grandes atualizações.

A redução da taxa de erro no sequenciamento permite que um número maior de amostras seja multiplexada. Assim, o sequenciamento de nanoporos está cada vez mais próximo de substituir os PCRs convencionais em tempo real para ensaios diagnósticos, o que já é o caso do diagnóstico do vírus da gripe. Além disso, a redução da taxa de erro aumenta a usabilidade dessa seqüência técnica, por exemplo, para a determinação de variantes menores e para sequenciamento metagenómico imparcial de alto throughput.

Um passo crítico no protocolo é que sequências de referência próximas e confiáveis precisam estar disponíveis. Os primers são baseados no conhecimento atual sobre a diversidade de vírus e podem precisar ser atualizados de vez em quando. Outro ponto crítico ao configurar uma abordagem de seqüenciamento baseada em amplicon é o equilíbrio da concentração da cartilha para obter um equilíbrio uniforme na profundidade de amplicon. Isso permite o multiplexamento de mais amostras em uma sequência de execução e resulta em uma redução significativa de custos.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabalho recebeu financiamento do programa de pesquisa e inovação Horizon 2020 da União Europeia o acordo de subvenção nº 643476 (COMPARE).

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video