Summary

Validering van Whole Genome Nanopore Sequencing, met behulp van Usutu Virus als voorbeeld

Published: March 11, 2020
doi:

Summary

We valideerden eerder een protocol voor op amplicon gebaseerde whole genome Usutu virus (USUV) sequencing op een nanopore sequencing platform. Hier beschrijven we de methoden die in meer detail worden gebruikt en bepalen we het foutenpercentage van de nanopore R10-stroomcel.

Abstract

Hele genoomsequencing kan worden gebruikt om virale uitbraken te karakteriseren en te traceren. Nanopore-gebaseerde hele genoom sequencing protocollen zijn beschreven voor verschillende virussen. Deze benaderingen maken gebruik van een overlappende amplicon-gebaseerde aanpak die kan worden gebruikt om een specifiek virus of groep van genetisch gerelateerde virussen te richten. Naast de bevestiging van de aanwezigheid van het virus, sequencing kan worden gebruikt voor genomische epidemiologie studies, om virussen te volgen en te ontrafelen oorsprong, reservoirs en modi van transmissie. Voor dergelijke toepassingen is het van cruciaal belang om de mogelijke effecten van het foutenpercentage in verband met het gebruikte platform te begrijpen. Routinematige toepassing in klinische en volksgezondheidsinstellingen vereisen dat dit wordt gedocumenteerd met elke belangrijke wijziging in het protocol. Voorheen werd een protocol voor het hele genoom Usutu virus sequencing op het nanopore sequencing platform gevalideerd (R9.4 flowcell) door directe vergelijking met Illumina sequencing. Hier beschrijven we de methode die wordt gebruikt om de vereiste leesdekking te bepalen, met behulp van de vergelijking tussen de R10-stroomcel en Illumina-sequencing als voorbeeld.

Introduction

Snelle ontwikkelingen in de derde generatie sequentietechnologieën stellen ons in staat om verder te gaan in de richting van bijna real-time sequencing tijdens virale uitbraken. Deze tijdige beschikbaarheid van genetische informatie kan nuttig zijn om de oorsprong en evolutie van virale ziekteverwekkers te bepalen. Gouden normen op het gebied van de volgende generatie sequencing echter, zijn nog steeds de tweede generatie sequencers. Deze technieken zijn afhankelijk van specifieke en tijdrovende technieken zoals kloonversterking tijdens een emulsie PCR of kloonbrugversterking. De derde generatie sequencers zijn goedkoper, met de hand gehouden en worden geleverd met vereenvoudigde bibliotheek voorbereiding methodologieën. Vooral de kleine omvang van het sequentieapparaat en de lage aanschafprijs maken het een interessante kandidaat voor inzetbare, fieldable sequencing. Dit kan bijvoorbeeld worden gezien tijdens de uitbraak van het ebolavirus in Sierra Leone en tijdens de lopende onderzoeken naar de uitbraak van het arbovirus in Brazilië1,2,3. Het gerapporteerde hoge foutenpercentage4 kan echter de toepassingen beperken waarvoor nanopore sequencing kan worden gebruikt.

Nanopore sequencing evolueert snel. Nieuwe producten zijn regelmatig op de markt verkrijgbaar. Voorbeelden hiervan zijn bijvoorbeeld de 1D kwadraatkits die het mogelijk maken om beide strengen van het DNA-molecuul te rangschikken, waardoor de nauwkeurigheid van de zogenaamde basen5 en de ontwikkeling van de R10-stroomcel worden versterkt die de verandering in stroom meet in twee verschillende gevallen in de porie6. Bovendien zullen verbeterde bio-informatica-instrumenten, zoals verbeteringen in basecalling, de nauwkeurigheid van basecallingverbeteren 7. Een van de meest gebruikte basecallers (bijvoorbeeld Albacore) is in eenperiodevan 9 maanden minstens 12 keer bijgewerkt. Onlangs heeft de fabrikant ook een nieuwe basecaller genaamd flip-flop, die wordt geïmplementeerd in de standaard nanopore software8. Samen zullen al deze verbeteringen leiden tot nauwkeurigere sequenties en zal het foutenpercentage van de nanoporie sequencer verminderen.

Usutu virus (USUV) is een mug-borne arbovirus van de familie Flaviviridae en het heeft een positief gestrande RNA genoom van ongeveer 11.000 nucleotiden. USUV treft vooral grote grijze uilen en merels9,10, hoewel andere vogelsoorten zijn ook gevoelig voor USUV infectie11. Onlangs werd uSUV ook geïdentificeerd in knaagdieren en spitsmuizen, hoewel hun potentiële rol in de overdracht van het virus onbekend blijft12. Bij de mens zijn asymptomatische infecties beschreven bij bloeddonoren13,14,15,16 terwijl uSUV-infecties ook zijn geassocieerd met encefalitis of meningo-encefalitis17,18. In Nederland werd uSUV voor het eerst aangetroffen bij wilde vogels in 201610 en bij asymptomatische bloeddonoren in 201814. Sinds de eerste detectie van usuv, uitbraken zijn gemeld tijdens de daaropvolgende jaren en toezicht, met inbegrip van hele genoom sequencing, is momenteel aan de gang om de ontstaan en verspreiding van een arbovirus in een voorheen naïeve bevolking te controleren.

Vergelijkbaar met wat is beschreven voor andere virussen, zoals ebolavirus, Zika virus en gele koorts virus3,19,20, hebben we een primer ingesteld op de volledige lengte USUV21sequentie . Deze polymerase kettingreactie (PCR)-gebaseerde aanpak maakt het mogelijk om full length USUV-genomen te herstellen van zeer host-contaminated sample types zoals hersenmonsters in monsters tot een Ct-waarde van ongeveer 32. Voordelen van een op amplicon gebaseerde sequencing-benadering zijn een hogere gevoeligheid in vergelijking met metagenomische sequencing en een hogere specificiteit. Beperkingen van het gebruik van een amplicon-gebaseerde aanpak zijn dat de sequenties moeten vergelijkbaar zijn om primers montage van alle stammen te ontwerpen en dat primers zijn ontworpen op onze huidige kennis over het virus diversiteit.

Gezien de constante ontwikkelingen en verbeteringen in de volgorde van de derde generatie, is het noodzakelijk om het foutenpercentage van de sequencer regelmatig te evalueren. Hier beschrijven we een methode om de prestaties van nanoporie direct te evalueren tegen Illumina sequencing met behulp van USUV als voorbeeld. Deze methode wordt toegepast op sequenties gegenereerd met de nieuwste R10 flow cel en basecalling wordt uitgevoerd met de nieuwste versie van de flip-flop basecaller.

Protocol

OPMERKING: Lijst met softwaretools die moeten worden gebruikt: usearch v11.0.667; spierv3.8.1551; porechop 0.2.4; cutadapt 2.5; minimap2 2.16-r922; samtools 1.9; bijgesneden 0,39; bbmap 38.33; schoppen v3.13.1; kma-1.2.8 1. Primer ontwerp Begin met het downloaden of ophalen van een reeks relevante referentie-hele genoomsequenties uit openbare of privégegevensverzamelingen. Haal bijvoorbeeld alle full length USUV-genomen (taxid64286) uit de NCBI-database22. USUV codeert een genoom van ongeveer 11.000 nucleotiden, dus alleen de sequenties ophalen met een sequentielengte van 8.000-12.000 nucleotiden. Doe dit met behulp van de volgende zoekvermelding:- taxid64286[Organisme:noexp] EN 8000[SLEN]:12000[SLEN]. Klik op Verzenden naar | Volledig record | Dossier; Gebruik Opmaak = FASTA en maak het bestand. Als u de set referentiereeksen wilt verkleinen, verwijdert u dubbele reeksen of sequenties met een nucleotide-identiteit van meer dan 99% uit de gegevensset. Doe dit met behulp van de cluster snelle optie van usearch23. Voer op de opdrachtregel:- usearch -cluster_fast All_USUV.fasta -id 0.99 -centroids All_USUV_dedup.fasta Om de primers te genereren, moeten sequenties worden uitgelijnd. Dit wordt gedaan met behulp van MUSCLE24. Voer op de opdrachtregel:- muscle -in All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -log log_muscle.txtOPMERKING: Het is essentieel om handmatig de uitlijning te inspecteren om te controleren op discrepanties. Deze kunnen indien nodig handmatig worden gecorrigeerd en de uiteinden kunnen worden bijgesneden op basis van de lengte van de meeste hele genoomsequenties. Primal wordt gebruikt om een ontwerp selectie van de primers die kunnen worden gebruikt voor volledige lengte amplicon sequencing19. Upload de uitlijning naar de oerwebsite(http://primal.zibraproject.org/)en selecteer de gewenste ampliconlengte en overlaplengte tussen de verschillende amplicons. Ga naar primal.zibraproject.org, vul de naam vande regeling in, upload het uitgelijnde fasta-bestand, selecteer de amplicon-lengte, overlap grootte en genereer de regeling. Lijn de volledige set beschikbare complete USUV-sequenties uit (niet de verkleinde of ontdubbelde set). Voer op de opdrachtregel:- muscle -in All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txtOPMERKING: Breng de gegenereerde primers in kaart tegen de volledige uitlijning (gebruik de deduplicated alignment niet), corrigeer fouten handmatig en voeg maximaal 5 degeneratieve primerposities toe. 2. Multiplex PCR Voer de multiplex PCR uit met behulp van de ontworpen primers en nanoporie en Illumina sequencing. De multiplex PCR voor USUV werd uitgevoerd zoals eerder beschreven19,21. Voer basecalling uit met flip-flop versie 3.0.6.6+9999d81. 3. Data-analyse om consensussequenties uit nanoporiegegevens te genereren Verschillende monsters kunnen worden multiplexed op een enkele nanopore sequencing run. Na het uitvoeren van de sequentie run, demultiplex de nanopore gegevens. Gebruik Porechop25 hiervoor. Gebruik de require_two_barcodes vlag om besmetting te voorkomen en de nauwkeurigheid te verbeteren. Voer op de opdrachtregel:- porechop -i Run_USUV.fastq -o Run_USUV_demultiplex –require_two_barcodes Verwijder na de multiplexing primersequenties (aangegeven in het bestand Primers_Usutu.fasta in beide richtingen) met cutadapt26. Verwijder bovendien sequenties met een lengte korter dan 75 nucleotiden. De primers moeten worden verwijderd omdat ze kunstmatige vooroordelen in de consensussequentie kunnen introduceren. Voer op de opdrachtregel:- cutadapt -b file:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 Demultiplexed sequentie leest kan worden toegewezen tegen een paneel van verschillende referentie stammen met behulp van minimap227 en een consensus sequentie kan worden gegenereerd met behulp van samtools28. Volg het onderstaande voorbeeld waarin de procedure van een referentiegebaseerde uitlijning en de consensussequentiegeneratie van één steekproef worden weergegeven: BC01. Voer op de opdrachtregel:- minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam- samtools sortbc01.bam > BC01_sorted.bam- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam | bcftools call -mv -Oz -o BC01.vcf.gz- bcftools index BC01.vcf.gz- cat Random_Refs_USUV.fasta | bcftools consensus BC01.vcf.gz > BC01_consensus.fasta Voor referentiegebaseerde uitlijningen is het van essentieel belang dat een nauw verwante referentiereeks wordt gebruikt. Voer daarom een BlastN-zoekopdracht uit met de gegenereerde consensusreeks om de dichtstbijzijnde referentiestam te identificeren. Herhaal daarna de referentiegebaseerde uitlijning met de dichtstbijzijnde referentiestam als referentie (stap 3.3 en 3.4). Voer op de opdrachtregel:- minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam- samtools sorter BC01_ref.bam > BC01_sorted_ref.bam- bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam | bcftools call -mv -Oz -o BC01_ref.vcf.gz- bcftools index BC01_ref.vcf.gz- cat Ref_USUV_BC01.fasta | bcftools consensus BC01_ref.vcf.gz > BC01_ref_consensus.fasta 4. Analyse van de Illumina-gegevens Deze sequenties worden automatisch gedemultiplexed na sequencing. Reads kunnen worden gecontroleerd kwaliteit met behulp van trimmomatic29. Voor paired-end Illumina sequenties, gebruik maken van de veelgebruikte cut-off mediaan PHRED score van 33 en een minimale leeslengte van 75 om nauwkeurige, hoge kwaliteit leest. Voer op de opdrachtregel:- trimmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75 Verwijder primers (aangegeven in het bestand Primers_Usutu.fasta in beide richtingen), omdat ze kunstmatige vooroordelen kunnen introduceren, met behulp van cutadapt26. Verwijder bovendien sequenties met een lengte korter dan 75 nucleotiden met behulp van de onderstaande opdrachten. Voer op de opdrachtregel:- cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 Vóór de novo assemblage, de volgorde leest kan worden genormaliseerd voor een gelijkmatige dekking over het genoom. Dit is essentieel omdat de novo assemblers zoals SPAdes rekening houden met de leesdekking bij het monteren van sequenties. Normalisering leest voor op een leesdekking van 50 met BBNorm uit het BBMap-pakket30. Voer op de opdrachtregel:- bbmap/bbnorm.sh target=50 in=9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq De genormaliseerde reads zijn de novo geassembleerd met behulp van SPAdes31. Standaardinstellingen worden gebruikt voor de montage met behulp van alle verschillende kmers (21, 33, 55, 77, 99 en 127). Voer op de opdrachtregel:- spades.py -k 21.33.55.77.99.127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq Kaart de QC leest tegen de verkregen consensus sequentie met behulp van minimap2 en programma’s zoals Geneious, Bioedit of Ugene om de aanpassing te curateren. Het is belangrijk om het begin en het einde van de aaneengesloten te controleren. Lijn de QC leest tegen de verkregen consensus sequencing met behulp van minimap2. Importeer de uitlijning in Geneious/Bioedit/UGene. Handmatig inspecteren, corrigeren en curate vooral het begin en het einde van het genoom. 5. Het bepalen van de vereiste leesdekking om het foutprofiel in nanoporiesequencing te compenseren met Illumina-gegevens als gouden standaard Selecteer volgorde leest toewijzing aan een amplicon, in dit geval amplicon 26. Vervolgens, kaart de nanoporie leest tegen deze amplicon met behulp van minimap2. Gebruik Samtools om alleen de reads mapping te selecteren op amplicon 26 en om het bam-bestand om te zetten in fastq. Voer op de opdrachtregel:- minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam- samtools view -b -F 4 BC01.bam > BC01_mapped.bam- samtools bam2fq BC01_mapped.bam | seqtk seq – -> BC01_mapped.fastq Selecteer willekeurig subsets van bijvoorbeeld 200 sequentie leest duizend keer. Als u het bijvoorbeeld wijzigt in 10, resulteert dit in de willekeurige selectie van duizend keer een subset van 10 reeksleest. Het script wordt geleverd als Aanvullend Bestand 1. Voer op de opdrachtregel:- python Random_selection.py Alle willekeurig geselecteerde reeksleest zijn uitgelijnd op amplicon 26. Gebruik KMA32 om de volgorde leest in kaart te brengen en om onmiddellijk een consensussequentie te genereren. Gebruik geoptimaliseerde instellingen voor nanoporiesequencing, aangegeven door de -bcNano-vlag. Voer op de opdrachtregel:- kma-index -i Amplicon26.fasta- voor bestand in random_sample*;- sampleID=${bestand%.fastq}- kma -i ${sampleID}.fastq -o ${sampleID} -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano- gedaan Inspecteer de gegenereerde consensusreeksen op de opdrachtregel met behulp van:- kat *.fsa > All_genomes.fsa- minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam- samtools sorter en All_genomes.bam > All_genomes_sorted.bam- samtools stats All_genomes_sorted.bam > stats.txt Het foutenpercentage wordt weergegeven in de stats.txt onder het kopfoutenpercentage #mismatches / bases in kaart gebracht. Geef het weer op het scherm met de volgende opdracht:- grep ^SN stats.txt | cut -f 2- De hoeveelheid indels wordt weergegeven onder de rubriek #Indels per cyclus. Geef het weer op het scherm met de volgende opdracht:- grep ^IC stats.txt | cut -f 2-

Representative Results

Onlangs werd een nieuwe versie van de flow cell versie (R10) uitgebracht en bood verbeteringen aan de basecaller gebruikt om de elektronische huidige signaal om te zetten naar DNA sequenties (zogenaamde flip-flop basecaller). Daarom hebben we opnieuw gesequenced USUV van hersenweefsel van een USUV-positieve uil die eerder werd gesequenced op een R9.4 stroomcel en op een Illumina Miseq instrument21. Hier beschreven we de methode die wordt gebruikt om de vereiste leesdekking voor betrouwbare consensusbellen te bepalen door directe vergelijking met Illumina-sequencing. Met behulp van de nieuwere flow cel in combinatie met de basecaller flip-flop laten we zien dat een leesdekking van 40x resulteert in identieke resultaten in vergelijking met Illumina sequencing. Een leesdekking van 30x resulteert in een foutenpercentage van 0,0002% wat overeenkomt met één fout in elke 585.000 nucleotiden die worden gesequenced, terwijl een leesdekking van 20x resulteert in één fout in elke 63.529 nucleotiden die worden gesequenced. Een gelezen dekking van 10x resulteert in één fout in elke 3.312 nucleotiden gesequenced, wat betekent dat meer dan drie nucleotiden per volledig USUV genoom verkeerd worden genoemd. Met een gelezen dekking boven 30x, werden geen indels waargenomen. Een leesdekking van 20x resulteerde in de detectie van een indel positie, terwijl een leesdekking van 10x resulteerde in indels in 29 posities. Een overzicht van het foutenpercentage met behulp van verschillende leesdekkingcut-offs wordt weergegeven in tabel 1. Dekking Fouten iteratie 1 Foutpercentageiteratie 1 Indels: Fouten iteratie 2 Foutpercentage iteratie 2 Indels: Fouten iteratie 3 Foutpercentageiteratie 3 Indels: 10× 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 20× 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 50× 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 Tabel 1: Overzicht van het foutenpercentage van nanoporiesequencing. Elke iteratie vertegenwoordigt duizend willekeurige monsters. Aanvullende file 1: Willekeurige selectie. Klik hier om dit bestand te bekijken (Klik met de rechtermuisknop om te downloaden).

Discussion

Nanopore sequencing is voortdurend in ontwikkeling en daarom is er behoefte aan methoden om het foutenpercentage te controleren. Hier beschrijven we een workflow om het foutenpercentage van de nanoporiesequencer te controleren. Dit kan handig zijn na het vrijgeven van een nieuwe stroomcel, of als er nieuwe releases van de basecalling worden vrijgegeven. Dit kan echter ook handig zijn voor gebruikers die hun eigen sequencingprotocol willen instellen en valideren.

Verschillende software- en uitlijningstools kunnen verschillende resultaten opleveren33. In dit manuscript wilden we vrij beschikbare softwarepakketten gebruiken die veel worden gebruikt en die duidelijke documentatie hebben. In sommige gevallen kan de voorkeur worden gegeven aan commerciële instrumenten, die over het algemeen een gebruiksvriendelijkere interfaces hebben, maar moeten worden betaald. In de toekomst kan deze methode op hetzelfde monster worden toegepast in het geval grote wijzigingen in sequentietechnologie of basecallingsoftware worden geïntroduceerd Bij voorkeur moet dit gebeuren na elke update van de basecaller of flowcell, maar gezien de snelheid van de huidige ontwikkelingen kan dit ook pas na grote updates worden gedaan.

De vermindering van het foutenpercentage in sequencing zorgt voor een hoger aantal monsters te worden multiplexed. Daardoor komt nanoporiesequencing steeds dichter bij het vervangen van conventionele real-time PCRs voor diagnostische tests, wat al het geval is voor influenzavirusdiagnostiek. Bovendien verhoogt de vermindering van het foutenpercentage de bruikbaarheid van deze technieksequencing, bijvoorbeeld voor de bepaling van kleine varianten en voor onpartijdige metagenomische sequencing met hoge doorvoer.

Een kritieke stap in het protocol is dat er nauwe, betrouwbare referentiesequenties beschikbaar moeten zijn. De primers zijn gebaseerd op de huidige kennis over virusdiversiteit en moeten mogelijk af en toe worden bijgewerkt. Een ander kritiek punt bij het opzetten van een op amplicon gebaseerde sequencing-benadering is het balanceren van de primerconcentratie om een gelijkmatigevenwicht in amplicondiepte te krijgen. Dit maakt het mogelijk om meer monsters op een reeks te laten uitvoeren en resulteert in een aanzienlijke kostenbesparing.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Dit werk heeft financiering ontvangen van het onderzoeks- en innovatieprogramma Horizon 2020 van de Europese Unie in het kader van subsidieovereenkomst nr.

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video