Summary

Valider le séquençage des nanopores du génome entier, en utilisant le virus Usutu comme exemple

Published: March 11, 2020
doi:

Summary

Nous avons précédemment validé un protocole pour le séquençage du virus Usutu (USUV) à base d’amplicon sur une plate-forme de séquençage des nanopores. Ici, nous décrivons les méthodes utilisées plus en détail et déterminons le taux d’erreur de la cellule d’écoulement nanopore R10.

Abstract

Le séquençage du génome entier peut être utilisé pour caractériser et retracer les flambées virales. Des protocoles de séquençage du génome entier à base de nanopore ont été décrits pour plusieurs virus différents. Ces approches utilisent une approche à base d’amplicons qui se chevauche qui peut être utilisée pour cibler un virus ou un groupe spécifique de virus génétiquement apparentés. En plus de la confirmation de la présence du virus, le séquençage peut être utilisé pour des études d’épidémiologie génomique, pour suivre les virus et démêler les origines, les réservoirs et les modes de transmission. Pour de telles applications, il est crucial de comprendre les effets possibles du taux d’erreur associé à la plate-forme utilisée. L’application courante dans les milieux cliniques et de santé publique exige que cela soit documenté à chaque changement important dans le protocole. Auparavant, un protocole pour le séquençage du virus Usutu sur la plate-forme de séquençage des nanopores a été validé (R9.4 flowcell) par comparaison directe avec le séquençage Illumina. Ici, nous décrivons la méthode utilisée pour déterminer la couverture de lecture requise, en utilisant la comparaison entre la cellule de débit R10 et le séquençage Illumina comme exemple.

Introduction

L’évolution rapide des technologies de séquence de troisième génération nous permet d’aller de l’avant vers un séquençage en temps quasi réel lors d’éclosions virales. Cette disponibilité opportune de l’information génétique peut être utile pour déterminer l’origine et l’évolution des agents pathogènes viraux. Les normes d’or dans les domaines du séquençage de la prochaine génération sont cependant encore les séquenceurs de deuxième génération. Ces techniques s’appuient sur des techniques spécifiques et chronophages comme l’amplification clonale lors d’une amplification par col létération du pcR ou d’un pont clonal. Les séquenceurs de troisième génération sont moins chers, portatifs et sont livrés avec des méthodologies simplifiées de préparation de bibliothèque. Surtout la petite taille de l’appareil séquence et le faible prix d’achat en fait un candidat intéressant pour le séquençage déployable et fieldable. Cela pourrait par exemple être vu lors de l’épidémie de virus Ebola en Sierra Leone et au cours des enquêtes en cours sur l’épidémie d’arbovirus au Brésil1,2,3. Cependant, le taux d’erreur élevésignalé 4 pourrait limiter les applications pour lesquelles le séquençage des nanopores peut être utilisé.

Le séquençage des nanopores évolue rapidement. De nouveaux produits sont disponibles régulièrement sur le marché. Par exemple, les kits 1D carrés qui permettent le séquençage des deux brins de la molécule d’ADN, augmentant ainsi la précision des bases5 appelées et le développement de la cellule d’écoulement R10 qui mesure le changement de courant à deux exemples différents dans le pore6. En outre, l’amélioration des outils bio-informatiques comme l’amélioration de l’appel de base améliorera la précision de l’appel de base7. L’un des appel de base les plus fréquemment utilisés (p. ex., Albacore), a été mis à jour au moins 12 fois au cours d’une période de 9 mois5. Récemment, le fabricant a également publié un nouvel appel de base appelé flip-flop, qui est mis en œuvre dans le logiciel nanopore par défaut8. Ensemble, toutes ces améliorations mèneront à des séquences plus précises et diminueront le taux d’erreur du séquenceur de nanopores.

Le virus Usutu (USUV) est un arbovirus transmis par les moustiques de la famille Flaviviridae et il a un génome d’ARN positif-échoué d’environ 11.000 nucléotides. USUV affecte principalement les grands hiboux gris et les merles9,10, bien que d’autres espèces d’oiseaux soient également sensibles à l’infection USUV11. Récemment, USUV a également été identifié chez les rongeurs et les musaraignes bien que leur rôle potentiel dans la transmission du virus reste inconnu12. Chez l’homme, des infections asymptomatiques ont été décrites chez les donneurs de sang13,14,15,16 tandis que les infections USUV ont également été rapportées pour être associées à l’encéphalite ou à la méningo-encéphalite17,18. Aux Pays-Bas, l’USUV a été détecté pour la première fois chez des oiseaux sauvages en 201610 et chez des donneurs de sang asymptomatiques en 201814. Depuis la détection initiale de l’USUV, des flambées ont été signalées au cours des années suivantes et la surveillance, y compris le séquençage du génome entier, est actuellement en cours pour surveiller l’émergence et la propagation d’un arbovirus dans une population auparavant naïve.

Semblable à ce qui a été décrit pour d’autres virus, tels que le virus Ebola, le virus Zika et le virus de la fièvre jaune3,19,20, nous avons développé un ensemble d’amorce pour séquencer pleine longueur USUV21. Cette approche basée sur la réaction en chaîne de polymérase (PCR) permet de récupérer les génomes USUV de pleine longueur à partir de types d’échantillons fortement contaminés par l’hôte comme des échantillons de cerveau dans des échantillons jusqu’à une valeur Ct d’environ 32. Les avantages d’une approche de séquençage à base d’amplicon sont une sensibilité plus élevée par rapport au séquençage métagénomique et une spécificité plus élevée. Les limites de l’utilisation d’une approche basée sur l’amplicon sont que les séquences doivent être similaires afin de concevoir des amorces s’adaptant à toutes les souches et que les amorces sont conçus sur nos connaissances actuelles sur la diversité du virus.

Compte tenu de l’évolution constante et de l’amélioration du séquençage de troisième génération, il est nécessaire d’évaluer régulièrement le taux d’erreur du séquenceur. Ici, nous décrivons une méthode pour évaluer la performance de la nanopore directement contre le séquençage Illumina en utilisant USUV comme exemple. Cette méthode est appliquée aux séquences générées avec la dernière cellule de débit R10 et l’appel de base est effectué avec la dernière version du tourne-disque.

Protocol

REMARQUE : Liste des outils logiciels à utiliser : usearch v11.0.667; muscle v3.8.1551; porechop 0.2.4; cutadapt 2.5; minimap2 2,16-r922; samtools 1.9; trimmomatique 0,39; bbmap 38.33; piques v3.13.1; kma-1.2.8 1. Conception d’apprêt Commencez par télécharger ou récupérer un ensemble de séquences de génome entiers de référence pertinentes à partir de collections de données publiques ou privées. Par exemple, récupérez tous les génomes USUV pleine longueur (taxid64286) de la base de donnéesNCBI 22. USUV code un génome d’environ 11 000 nucléotides et ne récupère les séquences qu’avec une longueur de séquence de 8 000 à 12 000 nucléotides. Faites-le en utilisant l’entrée de recherche suivante :- taxid64286[Organism:noexp] ET 8000[SLEN]:12000[SLEN]. Cliquez sur Envoyer à Enregistrement complet (en anglais) Fichier; utiliser Format et FASTA et créer le fichier. Pour réduire les séquences de référence, supprimez les séquences ou séquences en double avec plus de 99 % d’identité nucléotide du jeu de données. Faites cela en utilisant l’option rapide cluster de usearch23. Sur la ligne de commande entrez :- usearch -cluster_fast All_USUV.fasta -id 0.99 -centroids All_USUV_dedup.fasta Pour générer les amorces, les séquences doivent être alignées. Ceci est fait en utilisant MUSCLE24. Sur la ligne de commande entrez :- muscle -in All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -log log_muscle.txtREMARQUE : Il est essentiel d’inspecter manuellement l’alignement pour vérifier les écarts. Ceux-ci peuvent être corrigés manuellement si nécessaire et les extrémités peuvent être coupées en fonction de la longueur de la plupart des séquences du génome entier. Primal est utilisé pour faire une sélection de projet des amorces qui peuvent être utilisés pour le séquençage amplicon pleine longueur19. Téléchargez l’alignement sur le site Web primal (http://primal.zibraproject.org/) et sélectionnez la longueur d’amplicon préférée et chevauchez la longueur entre les différents amplicons. Aller à primal.zibraproject.org, remplir le nom Scheme,télécharger le fichier fasta aligné, sélectionner la longueur amplicon, la taille de chevauchement, et de générer le régime. Alignez l’ensemble complet des séquences complètes USUV disponibles (pas l’ensemble réduit ou déduplicated). Sur la ligne de commande entrez :- muscle -in All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txtREMARQUE : Cartographiez les amorces générées par rapport à l’alignement complet (n’utilisez pas l’alignement déduplicé), corrigez manuellement les erreurs et incluez un maximum de 5 positions d’amorce dégénératives. 2. MULTIPLEx PCR Effectuez le PCR multiplex à l’aide des amorces et du séquençage des nanopores et des Illumina. Le PCR multiplex pour USUV a été exécuté comme décrit précédemment19,21. Effectuez l’appel de base avec la version flip-flop 3.0.6.6-9999d81. 3. Analyse de données pour générer des séquences consensuelles à partir de données nanopores Plusieurs échantillons peuvent être multiplexés sur une seule course de séquençage de nanopore. Après avoir effectué la séquence, demultiplex les données nanopore. Utilisez Porechop25 pour cela. Pour prévenir la contamination et améliorer la précision, utilisez le drapeau require_two_barcodes. Sur la ligne de commande entrez :- porechop -i Run_USUV.fastq -o Run_USUV_demultiplex –require_two_barcodes Après lemultiplexage, supprimer les séquences d’amorce (indiquées dans le fichier Primers_Usutu.fasta dans les deux orientations) à l’aide de cutadapt26. En outre, retirer les séquences d’une longueur inférieure à 75 nucléotides. Les amorces doivent être supprimées car elles peuvent introduire des biais artificiels dans la séquence consensuelle. Sur la ligne de commande entrez :- cutadapt -b file:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 Les lectures de séquences demultiplexées peuvent être cartographiées contre un panneau de souches de référence distinctes à l’aide de minimap227 et une séquence consensuelle peut être générée à l’aide de samtools28. Suivez l’exemple ci-dessous qui montre la procédure d’un alignement fondé sur des références et la génération de séquences consensuelles d’un échantillon : BC01. Sur la ligne de commande entrez :- minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq -gt; BC01.bam- samtools trier BC01.bam -gt; BC01_sorted.bam- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam – bcftools call -mv -Oz -o BC01.vcf.gz- indice bcftools BC01.vcf.gz- chat Random_Refs_USUV.fasta – consensus bcftools BC01.vcf.gz -gt; BC01_consensus.fasta Pour les alignements basés sur les références, il est essentiel qu’une séquence de référence étroitement liée soit utilisée. Par conséquent, effectuez une recherche BlastN avec la séquence de consensus générée pour identifier la souche de référence la plus proche. Après cela, répétez l’alignement basé sur la référence avec la souche de référence la plus proche comme référence (étape 3.3 et 3.4). Sur la ligne de commande entrez :- minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq -gt; BC01_ref.bam- samtools trier BC01_ref.bam -gt; BC01_sorted_ref.bam- bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam – bcftools call -mv -Oz -o BC01_ref.vcf.gz- indice bcftools BC01_ref.vcf.gz- chat Ref_USUV_BC01.fasta – consensus bcftools BC01_ref.vcf.gz -gt; BC01_ref_consensus.fasta 4. Analyse des données Illumina Ces séquences sont automatiquement démulplexées après séquençage. Les lectures peuvent être contrôlées de qualité à l’aide de trimmomatic29. Pour les séquences Illumina jumelées, utilisez le score phRED médian préélement couramment utilisé de 33 et une longueur de lecture minimale de 75 pour obtenir des lectures précises et de haute qualité. Sur la ligne de commande entrez :- trimmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75 Supprimer les amorces (indiquées dans le fichier Primers_Usutu.fasta dans les deux orientations), car ils peuvent introduire des biais artificiels, en utilisant cutadapt26. En outre, supprimer les séquences d’une longueur inférieure à 75 nucléotides à l’aide des commandes ci-dessous. Sur la ligne de commande entrez :- cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 Avant l’assemblage de novo, la séquence se lit peut être normalisée pour une couverture uniforme à travers le génome. Ceci est essentiel puisque les assembleurs de novo comme SPAdes prennent en compte la couverture de lecture lors de l’assemblage de la séquence. Normaliser les lectures à une couverture de lecture de 50 en utilisant BBNorm à partir du paquet BBMap30. Sur la ligne de commande entrez :- bbmap/bbnorm.sh target 50 in-9_1P_trimmed.fastq in2-9_2P_trimmed.fastq out-Sample9_FW_norm.fastq out2-Sample9_RE_norm.fastq Les lectures normalisées sont de novo assemblés à l’aide de SPAdes31. Les réglages par défaut sont utilisés pour l’assemblage à l’aide de tous les kmers différents (21, 33, 55, 77, 99 et 127). Sur la ligne de commande entrez :- spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq Carte du QC se lit contre la séquence de consensus obtenue à l’aide de minimap2 et des programmes comme Geneious, Bioedit ou Ugene pour organiser l’alignement. Il est important de vérifier le début et la fin du contig. Alignez les lectures du QC par rapport au séquençage consensuel obtenu à l’aide de minimap2. Importer l’alignement dans Geneious/Bioedit/UGene. Inspecter manuellement, corriger et curé en particulier le début et la fin du génome. 5. Déterminer la couverture de lecture requise pour compenser le profil d’erreur dans le séquençage des nanopores à l’aide des données Illumina comme norme d’or Sélectionnez séquence lit la cartographie à un amplicon, dans ce cas amplicon 26. Par la suite, la carte de la nanopore se lit contre cet amplicon à l’aide de minimap2. Utilisez Samtools pour sélectionner uniquement la cartographie des lectures pour amplicon 26 et pour convertir le fichier bam en fastq. Sur la ligne de commande entrez :- minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq -gt; BC01.bam- samtools view -b -F 4 BC01.bam -gt; BC01_mapped.bam- samtools bam2fq BC01_mapped.bam – seqtk seq – -gt; BC01_mapped.fastq Sélectionnez au hasard des sous-ensembles de 200 séquences par exemple lit mille fois. Par exemple, le changer à 10 se traduira par la sélection aléatoire de mille fois un sous-ensemble de 10 lectures séquences. Le script est fourni sous forme de fichier supplémentaire 1. Sur la ligne de commande entrez :- python Random_selection.py Toutes les lectures de séquences choisies au hasard sont alignées sur l’amplicon 26. Utilisez KMA32 pour cartographier les lectures de la séquence et pour générer immédiatement une séquence consensuelle. Utilisez des réglages optimisés pour le séquençage des nanopores, indiqué par le drapeau -bcNano. Sur la ligne de commande entrez :- indice kma -i Amplicon26.fasta- pour le fichier dans random_sample; ne- sampleID-$-file%.fastq- kma -i $.sampleID.fastq -o $-sampleID’ -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano- fait Inspectez les séquences de consensus générées sur la ligne de commande en utilisant :- chat ‘.fsa ‘gt; All_genomes.fsa- minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa -gt; All_genomes.bam- samtools trier All_genomes.bam -gt; All_genomes_sorted.bam- samtools stats All_genomes_sorted.bam -gt; stats.txt Le taux d’erreur est affiché dans le stats.txt sous le taux d’erreur de tête #mismatches / bases cartographiées. Affichez-le à l’écran avec la commande suivante :- grep ‘SN stats.txt ‘ coupe -f 2- La quantité d’indels est affichée sous le cap #Indels par cycle. Affichez-le à l’écran avec la commande suivante :- grep stats.txt ”s cut -f 2-

Representative Results

Récemment, une nouvelle version de la version de cellule de flux (R10) a été libérée et a offert des améliorations au tourne-bas utilisé pour convertir le signal courant électronique en séquences d’ADN (ce qu’on appelle le tourne-disque). Par conséquent, nous avons re-séquence USUV à partir du tissu cérébral d’un hibou USUV-positif qui a été précédemment séquencé sur une cellule de débit R9.4 et sur un instrument Illumina Miseq21. Ici, nous avons décrit la méthode utilisée pour déterminer la couverture de lecture requise pour un consensus fiable appelant par comparaison directe avec le séquençage Illumina. En utilisant la nouvelle cellule de débit en combinaison avec le flip-flop de l’appel de base, nous montrons qu’une couverture de lecture de 40x donne des résultats identiques par rapport au séquençage Illumina. Une couverture de lecture de 30x se traduit par un taux d’erreur de 0,0002% qui correspond à une erreur dans 585 000 nucléotides séquencés, tandis qu’une couverture de lecture de 20x entraîne une erreur dans 63 529 nucléotides séquencés. Une couverture de lecture de 10x entraîne une erreur dans 3 312 nucléotides séquencés, ce qui signifie que plus de trois nucléotides par génome USUV complet sont appelés faux. Avec une couverture de lecture au-dessus de 30x, aucun indels n’a été observé. Une couverture de lecture de 20x a permis de détecter une position indel tandis qu’une couverture de lecture de 10x a entraîné des indels dans 29 positions. Un aperçu du taux d’erreur à l’aide de différents seuils de couverture lus est indiqué dans le tableau 1. Couverture Erreurs itération 1 Fréquence d’erreur itération 1 Indels: Erreurs itération 2 Fréquence d’erreur itération 2 Indels: Erreurs itération 3 Fréquence d’erreur itération 3 Indels: 10 ans et plus 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 20 ans et plus 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30x 30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40x 40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 50 ans et plus 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 Tableau 1 : Aperçu du taux d’erreur du séquençage des nanopores. Chaque itération représente mille échantillons aléatoires. Fichier supplémentaire 1 : Sélection aléatoire. S’il vous plaît cliquez ici pour afficher ce fichier (Cliquez à droite pour télécharger).

Discussion

Le séquençage des nanopores est en constante évolution et il est donc nécessaire de mettre en place des méthodes pour surveiller le taux d’erreur. Ici, nous décrivons un flux de travail pour surveiller le taux d’erreur du séquenceur de nanopore. Cela peut être utile après la libération d’une nouvelle cellule de débit, ou si de nouvelles versions de l’appel de base sont libérés. Cependant, cela peut également être utile pour les utilisateurs qui souhaitent configurer et valider leur propre protocole de séquençage.

Différents logiciels et outils d’alignement peuvent donner des résultats différents33. Dans ce manuscrit, nous avons cherché à utiliser des progiciels librement disponibles qui sont couramment utilisés, et qui ont une documentation claire. Dans certains cas, la préférence peut être accordée aux outils commerciaux, qui ont généralement des interfaces plus conviviales, mais doivent être payés. À l’avenir, cette méthode peut être appliquée au même échantillon au cas où de grandes modifications dans la technologie de séquence ou de basecalling sont introduites De préférence cela devrait être fait après chaque mise à jour du point de base ou flowcell, mais étant donné la vitesse des développements actuels, cela peut également être fait seulement après des mises à jour majeures.

La réduction du taux d’erreur dans le séquençage permet de multiples échantillons. Par conséquent, le séquençage des nanopores se rapproche du remplacement des RPC en temps réel conventionnels pour les essais diagnostiques, ce qui est déjà le cas pour le diagnostic du virus de la grippe. En outre, la réduction du taux d’erreur augmente la facilité d’utilisation de cette technique de séquençage, par exemple pour la détermination de variantes mineures et pour le séquençage métagénomique impartial à haut débit.

Une étape critique du protocole est que des séquences de référence étroites et fiables doivent être disponibles. Les amorces sont basées sur les connaissances actuelles sur la diversité des virus et pourraient avoir besoin d’être mis à jour de temps en temps. Un autre point critique lors de la mise en place d’une approche de séquençage à base d’amplicon est l’équilibre de la concentration d’apprêt pour obtenir un équilibre égal dans la profondeur amplicon. Cela permet le multiplexe d’un plus grand nombre d’échantillons sur une séquence exécutée et entraîne une réduction significative des coûts.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a reçu un financement du programme de recherche et d’innovation Horizon 2020 de l’Union européenne dans le cadre de l’accord de subvention no 643476 (COMPARE).

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video