Summary

Convalida del sequenziamento dei nanopore dell'intero genoma, usando Usutu Virus come esempio

Published: March 11, 2020
doi:

Summary

In precedenza abbiamo convalidato un protocollo per il sequenziamento del virus USsutu intero genoma basato sull’amplicon (USUV) su una piattaforma di sequenziamento nanoporo. Qui, descriviamo i metodi utilizzati in modo più dettagliato e determiniamo il tasso di errore della cella di flusso nanopora R10.

Abstract

Il sequenziamento dell’intero genoma può essere utilizzato per caratterizzare e tracciare focolai virali. I protocolli di sequenziamento dell’intero genoma basati su nanoporo sono stati descritti per diversi virus. Questi approcci utilizzano un approccio sovrapposto basato su amplicon che può essere utilizzato per indirizzare un virus specifico o un gruppo di virus geneticamente correlati. Oltre alla conferma della presenza del virus, il sequenziamento può essere utilizzato per studi di epidemiologia genomica, per monitorare i virus e svelare le origini, i serbatoi e le modalità di trasmissione. Per tali applicazioni, è fondamentale comprendere i possibili effetti del tasso di errore associato alla piattaforma utilizzata. L’applicazione di routine in ambito clinico e sanitario pubblico richiede che questo sia documentato con ogni cambiamento importante nel protocollo. In precedenza, è stato convalidato un protocollo per il sequenziamento del virus Usutu dell’intero genoma sulla piattaforma di sequenziamento dei nanopori (cella di flusso R9.4) confrontando direttamente il sequenziamento dell’Illumina. In questo caso, viene descritto il metodo utilizzato per determinare la copertura di lettura richiesta, utilizzando il confronto tra la cella di flusso R10 e la sequenza Illumina come esempio.

Introduction

I rapidi sviluppi nelle tecnologie di sequenza di terza generazione ci permettono di andare avanti verso il sequenziamento vicino al sequenziamento in tempo reale durante le epidemie virali. Questa tempestiva disponibilità di informazioni genetiche può essere utile per determinare l’origine e l’evoluzione dei patogeni virali. Gli standard dell’oro nei settori del sequenziamento di prossima generazione, tuttavia, sono ancora i sequencer di seconda generazione. Queste tecniche si basano su tecniche specifiche e dispendiose in termini di tempo come l’amplificazione clonale durante una PCR di emulsione o l’amplificazione del ponte clonale. I sequencer di terza generazione sono più economici, portatili e sono dotati di metodologie di preparazione semplificate della libreria. Soprattutto le piccole dimensioni del dispositivo di sequenza e il basso prezzo di acquisto lo rendono un candidato interessante per il sequenziamento distribuibile e da campo. Questo potrebbe essere visto per esempio durante l’epidemia di virus Ebola in Sierra Leone e durante le indagini sull’epidemia di arbovirus in corso in Brasile1,2,3.3 Tuttavia, l’elevato tasso di errore segnalato4 potrebbe limitare le applicazioni per le quali è possibile utilizzare il sequenziamento dei nanopori.

Il sequenziamento nanoporo si sta evolvendo rapidamente. Nuovi prodotti sono disponibili sul mercato su base regolare. Esempi di questo sono ad esempio i kit quadrati 1D che consentono il sequenziamento di entrambi i filamenti della molecola di DNA, aumentando così l’accuratezza delle base chiamate5 e lo sviluppo della cella di flusso R10 che misura il cambiamento di corrente in due istanze diverse nel poro6. Inoltre, strumenti di bioinformatica migliorati come i miglioramenti nel basecalling miglioreranno la precisione del basecalling7. Uno dei basechiamanti più utilizzati (ad esempio, Albacore), è stato aggiornato almeno 12 volte in un periodo di 9 mesi5. Recentemente, il produttore ha anche rilasciato un nuovo basecaller chiamato flip-flop, che viene implementato nel software nanoporo predefinito8. Insieme, tutti questi miglioramenti porteranno a sequenze più accurate e diminuiranno il tasso di errore del sequencer nanoporo.

Usutu virus (USUV) è un arbovirus trasmesso dalle zanzare della famiglia Flaviviridae e ha un genoma di RNA a filamento positivo di circa 11.000 nucleotidi. UsUV colpisce principalmente grandi gufi grigi e merli9,10, anche se altre specie di uccelli sono suscettibili anche all’infezione USUV11. Recentemente, USUV è stato anche identificato in roditori e toporagni, anche se il loro potenziale ruolo nella trasmissione del virus rimane sconosciuto12. Nell’uomo, le infezioni asintomatiche sono state descritte nei donatori di sangue13,14,15,16 mentre le infezioni USUV sono state segnalate anche per essere associati con l’encefalite o meningo-encefalite17,18. Nei Paesi Bassi, usUV è stato rilevato per la prima volta negli uccelli selvatici nel 201610 e nei donatori di sangue asintomatico nel 201814. Dal rilevamento iniziale dell’USUV, nel corso degli anni successivi sono stati segnalati focolai e la sorveglianza, compreso il sequenziamento dell’intero genoma, è attualmente in corso per monitorare l’emergere e la diffusione di un arbovirus in una popolazione precedentemente ingenua.

Simile a quello che è stato descritto per altri virus, come il virus Ebola, virus zika e virus della febbre gialla3,19,20, abbiamo sviluppato un primer impostato per sequenza a piena lunghezza USUV21. Questo approccio basato sulla reazione a catena di polimerasi (PCR) consente il recupero di genomi USUV a piena lunghezza da tipi di campioni altamente contaminati dall’host, come campioni cerebrali in campioni fino a un valore Ct di circa 32. I vantaggi di un approccio di sequenziamento basato su amplicon sono una maggiore sensibilità rispetto al sequenziamento metagenomico e una maggiore specificità. Limitazioni dell’utilizzo di un approccio basato su amplicon sono che le sequenze dovrebbero essere simili al fine di progettare primer che si adattano a tutti i ceppi e che i primer sono progettati sulla nostra conoscenza attuale sulla diversità dei virus.

Dati i costanti sviluppi e i miglioramenti nel sequenziamento di terza generazione, è necessario valutare regolarmente il tasso di errore del sequencer. Qui, descriviamo un metodo per valutare le prestazioni del nanoporo direttamente contro il sequenziamento Illumina usando USUV come esempio. Questo metodo viene applicato alle sequenze generate con la cella di flusso R10 più recente e basecalling viene eseguito con la versione più recente del basecaller flip-flop.

Protocol

NOTA: Elenco degli strumenti software da utilizzare: usearch v11.0.667; muscolo v3.8.1551; porechop 0.2.4; cutadapt 2.5; minimap2 2,16-r922; samtools 1.9; trimmomatic 0,39; bbmap 38.33; picche v3.13.1; kma-1.2.8 1. Progettazione di Primer Inizia con il download o il recupero di una serie di sequenze di riferimenti dell’intero genoma rilevanti da raccolte di dati pubblici o privati. Ad esempio, recuperare tutti i genomi USUV a lunghezza intera (taxid64286) dal database NCBI22. USUV codifica un genoma di circa 11.000 nucleotidi in modo da recuperare solo le sequenze con una lunghezza di sequenza di 8.000-12.000 nucleotidi. A tale scopo, utilizzare la seguente voce di ricerca:- taxid64286[Organism:noexp] E 8000[SLEN]:12000[SLEN]. Fare clic su Invia a . Record completo File; utilizzare Formato : FASTA e creare il file. Per eseguire il downsize del set di sequenze di riferimento, rimuovere le sequenze o le sequenze duplicate con identità nucleotide superiore al 99% dal set di dati. A tale scopo, utilizzare l’opzione di velocità del cluster da usearch23. Nella riga di comando immettere:- usearch -cluster_fast All_USUV.fasta -id 0,99 -centriids All_USUV_dedup.fasta Per generare i primer, le sequenze devono essere allineate. Questo viene fatto utilizzando MUSCLE24. Nella riga di comando immettere:- muscolo-in All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -log log_muscle.txtNOTA: è essenziale controllare manualmente l’allineamento per verificare la presenza di discrepanze. Questi possono essere corretti manualmente se necessario e le estremità possono essere tagliate in base alla lunghezza della maggior parte delle sequenze dell’intero genoma. Primal viene utilizzato per effettuare una selezione di sformo dei primer che possono essere utilizzati per il sequenziamento dell’ampio di lunghezza completa19. Caricare il tracciato sul sito Web primordiale (http://primal.zibraproject.org/) e selezionare la lunghezza dell’amplificatore e la lunghezza di sovrapposizione preferite tra i diversi amplicons. Vai a primal.zibraproject.org, inserisci il nome dello schema,carica il file fasta allineato, seleziona la lunghezza dell’amplificatore, sovrappone e genera lo schema. Allineare il set completo di sequenze USUV complete disponibili (non il set ridimensionato o deduplicato). Nella riga di comando immettere:- muscolo-in All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txtNOTA: mappare i primer generati rispetto al tracciato completo (non utilizzare il tracciato deduplicato), correggere manualmente gli errori e includere un massimo di 5 posizioni degenerative. 2. PCR Multiplex Eseguire il multiplex PCR utilizzando i primer progettati e nanopore e sequenziamento Illumina. Il multiplex PCR per USUV è stato eseguito come descritto in precedenza19,21. Eseguire basecalling con la versione flip-flop 3.0.6.6.9999d81. 3. Analisi dei dati per generare sequenze di consenso dai dati dei nanopori Diversi campioni possono essere multiplexati su una singola corsa di sequenziamento nanoporo. Dopo aver eseguito l’esecuzione della sequenza, demultiplex i dati nanoporo. Utilizzare Porechop25 per questo. Per evitare contaminazioni e migliorare la precisione, utilizzare il flag require_two_barcodes. Nella riga di comando immettere:- porechop -i Run_USUV.fastq -o Run_USUV_demultiplex -require_two_barcodes Dopo la demultiplexing, rimuovere le sequenze di primer (indicate nel file Primers_Usutu.fasta in entrambi gli orientamenti) utilizzando cutadapt26. Inoltre, rimuovere le sequenze con una lunghezza inferiore a 75 nucleotidi. I primer devono essere rimossi in quanto possono introdurre distorsioni artificiali nella sequenza di consenso. Nella riga di comando immettere:- cutadapt -b file:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 Le letture di sequenza Demultiplexed possono essere mappate su un pannello di ceppi di riferimento distinti utilizzando minimap227 e una sequenza di consenso può essere generata utilizzando samtools28. Seguire l’esempio seguente che mostra la procedura di un allineamento basato sui riferimenti e la generazione della sequenza di consenso di un campione: BC01. Nella riga di comando immettere:- minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam- samtools ordinare BC01.bam > BC01_sorted.bam- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam : bcftools chiamare -mv -Oz -o BC01.vcf.gz- indice bcftools BC01.vcf.gz- gatto Random_Refs_USUV.fasta – bcftools consenso BC01.vcf.gz > BC01_consensus.fasta Per i tracciati basati sui riferimenti è essenziale che venga utilizzata una sequenza di riferimento strettamente correlata. Pertanto, eseguire una ricerca BlastN con la sequenza di consenso generata per identificare il ceppo di riferimento più vicino. Dopo di che, ripetere l’allineamento basato sul riferimento con la deformazione di riferimento più vicina come riferimento (passaggio 3.3 e 3.4). Nella riga di comando immettere:- minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam- samtools sort BC01_ref.bam > BC01_sorted_ref.bam- bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam : bcftools chiamare -mv -Oz -o BC01_ref.vcf.gz- indice bcftools BC01_ref.vcf.gz- gatto Ref_USUV_BC01.fasta : bcftools consenso BC01_ref.vcf.gz > BC01_ref_consensus.fasta 4. Analisi dei dati Illumina Queste sequenze vengono automaticamente demultiplexing dopo la sequenza. Le letture possono essere controllate dalla qualità utilizzando trimmomatic29. Per le sequenze Illuminaa accoppiate, utilizzare il punteggio PHRED mediano di uso comune di 33 e una lunghezza di lettura minima di 75 per ottenere letture accurate e di alta qualità. Nella riga di comando immettere:- trimmomatico PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75 Rimuovere primers (indicato nel file Primers_Usutu.fasta in entrambi gli orientamenti), poiché possono introdurre distorsioni artificiali, utilizzando cutadapt26. Inoltre, rimuovere le sequenze con una lunghezza inferiore a 75 nucleotidi utilizzando i comandi riportati di seguito. Nella riga di comando immettere:- cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 Prima dell’assemblaggio de novo, le letture della sequenza possono essere normalizzate per una copertura uniforme in tutto il genoma. Questo è essenziale poiché gli assemblatori de novo come SPAdes prendono in considerazione la copertura di lettura durante l’assemblaggio delle letture di sequenza. Normalizzare le letture a una copertura di lettura di 50 utilizzando BBNorm dal pacchetto BBMap30. Nella riga di comando immettere:- bbmap/bbnorm.sh target- 50 in-9_1P_trimmed.fastq in2.9_2P_trimmed.fastq out-Sample9_FW_norm.fastq out2-Sample9_RE_norm.fastq Le letture normalizzate sono de novo assemblate utilizzando SPAdes31. Le impostazioni di default vengono utilizzate per l’assieme utilizzando tutti i diversi kmer (21, 33, 55, 77, 99 e 127). Nella riga di comando immettere:- spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq Mappare il QC si legge contro la sequenza di consenso ottenuta utilizzando minimap2 e programmi come Geneious, Bioedit o Ugene per curare l’allineamento. È importante controllare l’inizio e la fine del contig. Allineare il controllo qualità legge contro il sequenziamento del consenso ottenuto utilizzando minimap2. Importare il tracciato in Geneious/Bioedit/UGene. Ispezionare manualmente, correggere e curare soprattutto l’inizio e la fine del genoma. 5. Determinazione della copertura di lettura necessaria per compensare il profilo di errore nel sequenziamento dei nanopori utilizzando i dati Illumina come gold standard Selezionare le letture di sequenza che vengono mappate a un amplificatore, in questo caso l’ampiezza 26. Successivamente, mappare il nanoporo si legge contro questo amplificatore utilizzando minimap2. Utilizzare Samtools per selezionare solo il mapping delle letture all’amplicon 26 e per convertire il file bam in fastq. Nella riga di comando immettere:- minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam- samtools vista -b -F 4 BC01.bam > BC01_mapped.bam- samtools bam2fq BC01_mapped.bam – seqtk seq – -> BC01_mapped.fastq Seleziona in modo casuale sottoinsiemi di sequenza per esempio 200 legge mille volte. Ad esempio, la modifica di 10 comporterà la selezione casuale di mille volte un sottoinsieme di 10 letture di sequenza. Lo script viene fornito come File supplementare 1. Nella riga di comando immettere:- pitone Random_selection.py Tutte le letture di sequenza selezionate casualmente sono allineate all’amplificatore 26. Utilizzare KMA32 per mappare le letture della sequenza e generare immediatamente una sequenza di consenso. Utilizzare impostazioni ottimizzate per la sequenza dei nanopori, indicate dal flag -bcNano. Nella riga di comando immettere:- indice kma -i Amplicon26.fasta- per i file in random_sample;- sampleID, file%. fastq- kma -i -sampleID .fastq -o -1t_db’Amplicon26.fasta -mem_mode -mem_mode -mp 5 -mrs 0.0 -bcNano- fatto Esaminare le sequenze di consenso generate sulla riga di comando utilizzando:- gatto .fsa > All_genomes.fsa- minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam- samtools sort All_genomes.bam > All_genomes_sorted.bam- samtools statistiche All_genomes_sorted.bam > stats.txt Il tasso di errore viene visualizzato nel file stats.txt sotto la voce tasso di errore #mismatches/basi mappate. Visualizzarlo sullo schermo con il seguente comando:- grep – SN stats.txt – taglio -f 2- La quantità di indels viene visualizzata sotto l’intestazione #Indels per ciclo. Visualizzarlo sullo schermo con il seguente comando:- grep – IC stats.txt – taglio -f 2-

Representative Results

Recentemente, è stata rilasciata una nuova versione della versione della cella di flusso (R10) che ha offerto miglioramenti al basecaller utilizzato per convertire il segnale di corrente elettronica in sequenze di DNA (il cosiddetto flip-flop basecaller). Pertanto, abbiamo ri-sequenziato USUV dal tessuto cerebrale di un gufo USUV-positivo che è stato precedentemente sequenziato su una cella di flusso R9.4 e su uno strumento Luce Miseq21. Qui è stato descritto il metodo utilizzato per determinare la copertura di lettura richiesta per le chiamate di consenso affidabili confrontando direttamente con la sequenza Illumina. Utilizzando la cella di flusso più recente in combinazione con il flip-flop del chiamante di base dimostriamo che una copertura di lettura di 40x produce risultati identici rispetto al sequenziamento dell’illuminazione. Una copertura di lettura di 30x restituisce un tasso di errore di 0,0002% che corrisponde a un errore ogni 585.000 nucleotidi sequenziati, mentre una copertura di lettura di 20x genera un errore ogni 63.529 nucleotidi sequenziati. Una copertura di lettura di 10x genera un errore in ogni 3.312 nucleotidi sequenziati, il che significa che oltre tre nucleotidi per genoma USUV completo vengono chiamati sbagliati. Con una copertura di lettura superiore a 30x, non sono stati osservati indels. Una copertura di lettura di 20x ha portato al rilevamento di una posizione indel mentre una copertura di lettura di 10x ha portato in indels in 29 posizioni. Nella tabella 1è riportata una panoramica del tasso di errore utilizzando diversi cut-off di copertura in lettura. Copertura Iterazione errori 1 Iterazione tasso di errore 1 Indels: Iterazione errori 2 Iterazione tasso di errore 2 Indels: Iterazione errori 3 Iterazione tasso di errore 3 Indels: 10 anni di vita 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 Più di 20 anni, 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 Più di 50 anni 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 Tabella 1: Panoramica del tasso di errore del sequenziamento dei nanopori. Ogni iterazione rappresenta mille campioni casuali. File supplementare 1: Selezione casuale. Fare clic qui per visualizzare questo file (fare clic con il pulsante destro del mouse per scaricare).

Discussion

Il sequenziamento dei nanopori è in continua evoluzione e quindi c’è bisogno di metodi per monitorare il tasso di errore. In questo caso, descriviamo un flusso di lavoro per monitorare il tasso di errore del sequencer nanoporo. Ciò può essere utile dopo il rilascio di una nuova cella di flusso o se vengono rilasciate nuove versioni del richiamo di base. Tuttavia, questo può essere utile anche per gli utenti che desiderano impostare e convalidare il proprio protocollo di sequenziamento.

Diversi software e strumenti di allineamento possono produrre risultati diversi33. In questo manoscritto, abbiamo cercato di utilizzare pacchetti software liberamente disponibili che sono comunemente utilizzati e che hanno una documentazione chiara. In alcuni casi, la preferenza potrebbe essere data agli strumenti commerciali, che generalmente hanno un’interfaccia più user-friendly ma devono essere pagati. In futuro, questo metodo può essere applicato allo stesso campione nel caso in cui grandi modifiche nella tecnologia di sequenza o software di base- sono introdotti preferibilmente questo dovrebbe essere fatto dopo ogni aggiornamento del basecaller o flowcell, tuttavia data la velocità degli sviluppi attuali questo può essere fatto anche solo dopo importanti aggiornamenti.

La riduzione del tasso di errore nella sequenza consente di multiplexare un numero maggiore di campioni. Di conseguenza, il sequenziamento dei nanopori si sta avvicinando alla sostituzione dei PCR convenzionali in tempo reale per i test diagnostici, il che è già il caso della diagnostica del virus dell’influenza. Inoltre, la riduzione del tasso di errore aumenta l’usabilità di questa tecnica di sequenziamento, ad esempio per la determinazione di varianti minori e per il sequenziamento metagenomico imparziale ad alto throughput.

Un passaggio critico del protocollo è che devono essere disponibili sequenze di riferimento vicine e affidabili. I primer si basano sulle attuali conoscenze sulla diversità dei virus e potrebbe essere necessario aggiornare ogni tanto. Un altro punto critico quando si imposta un approccio di sequenziamento basato su amplicon è il bilanciamento della concentrazione di primer per ottenere un equilibrio uniforme in profondità dell’amplificatore. Ciò consente il multiplexing di più campioni in un’esecuzione di sequenza e comporta una riduzione significativa dei costi.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Questo lavoro ha ricevuto finanziamenti dal programma di ricerca e innovazione Orizzonte 2020 dell’Unione europea nell’ambito dell’accordo di sovvenzione n. 643476 (COMPARE).

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video