Summary

Validierung der Nanoporensequenzierung des gesamten Genoms anhand des Usutu-Virus als Beispiel

Published: March 11, 2020
doi:

Summary

Zuvor haben wir ein Protokoll für die Sequenzierung des Amplikon-basierten Ganzgenoms Usutu Virus (USUV) auf einer Nanoporensequenzierungsplattform validiert. Hier beschreiben wir die verwendeten Methoden genauer und bestimmen die Fehlerrate der Nanoporen-R10-Durchflusszelle.

Abstract

Die gesamte Genomsequenzierung kann verwendet werden, um Virusausbrüche zu charakterisieren und zu verfolgen. Nanoporenbasierte Ganze Genomsequenzierungsprotokolle wurden für verschiedene Viren beschrieben. Diese Ansätze verwenden einen sich überschneidenden Amplikon-basierten Ansatz, der verwendet werden kann, um ein bestimmtes Virus oder eine Gruppe genetisch verwandter Viren anzugreifen. Neben der Bestätigung der Viruspräsenz kann die Sequenzierung für genomische Epidemiologiestudien verwendet werden, um Viren zu verfolgen und Ursprünge, Reservoirs und Übertragungsarten zu entwirren. Für solche Anwendungen ist es wichtig, mögliche Auswirkungen der Fehlerrate zu verstehen, die mit der verwendeten Plattform verbunden ist. Die routinemäßige Anwendung im klinischen und öffentlichen Gesundheitswesen erfordert, dass dies bei jeder wichtigen Änderung des Protokolls dokumentiert wird. Zuvor wurde ein Protokoll für die Sequenzierung des gesamten Genoms usutu virus auf der Nanoporensequenzierungsplattform (R9.4-Flowcell) im direkten Vergleich mit der Illumina-Sequenzierung validiert. Hier beschreiben wir die Methode zur Bestimmung der erforderlichen Leseabdeckung, indem wir als Beispiel den Vergleich zwischen der R10-Durchflusszelle und der Illumina-Sequenzierung verwenden.

Introduction

Schnelle Entwicklungen in Sequenztechnologien der dritten Generation ermöglichen es uns, bei Viralausbrüchen in die Nähe der Echtzeitsequenzierung zu kommen. Diese rechtzeitige Verfügbarkeit genetischer Informationen kann nützlich sein, um den Ursprung und die Entwicklung viraler Krankheitserreger zu bestimmen. Goldstandards in den Bereichen der Sequenzierung der nächsten Generation sind jedoch nach wie vor die Sequenzer der zweiten Generation. Diese Techniken basieren auf spezifischen und zeitaufwändigen Techniken wie der klonalen Amplifikation während einer Emulsions-PCR oder klonalen Brückenverstärkung. Die Sequenzer der dritten Generation sind billiger, handgehalten und verfügen über vereinfachte Methoden zur Bibliotheksvorbereitung. Vor allem die geringe Größe des Sequenzgeräts und der niedrige Kaufpreis machen es zu einem interessanten Kandidaten für die einsatzfähige, feldfähige Sequenzierung. Dies konnte beispielsweise während des Ebola-Virusausbruchs in Sierra Leone und während der laufenden Arbovirus-Ausbruchsuntersuchungen in Brasilien1,2,3gesehen werden. Die gemeldete hohe Fehlerquote4 kann jedoch die Anwendungen einschränken, für die eine Nanoporensequenzierung verwendet werden kann.

Die Nanoporensequenzierung entwickelt sich schnell. Neue Produkte sind regelmäßig auf dem Markt erhältlich. Beispiele hierfür sind zum Beispiel die 1D-Quadrat-Kits, die die Sequenzierung beider Stränge des DNA-Moleküls ermöglichen und damit die Genauigkeit der sogenannten Basen5 erhöhen und die Entwicklung der R10-Durchflusszelle, die die Stromveränderung an zwei verschiedenen Instanzen im Poren6misst. Darüber hinaus werden verbesserte bio-informatische Tools wie Verbesserungen im Basecalling die Genauigkeit von Basecalling7verbessern. Einer der am häufigsten verwendeten Basecaller (z. B. Albacore) wurde in einem Zeitraum von 9 Monaten mindestens 12 Mal aktualisiert5. Kürzlich hat der Hersteller auch einen neuartigen Basecaller namens Flip-Flop veröffentlicht, der in der Standard-Nanoporensoftware8implementiert ist. Zusammen werden all diese Verbesserungen zu genaueren Sequenzen führen und die Fehlerrate des Nanoporensequenzers verringern.

Das Usutu-Virus (USUV) ist ein von Mücken übertragenes Arbovirus aus der Familie der Flaviviridae und hat ein positiv gestrandetes RNA-Genom von rund 11.000 Nukleotiden. USUV betrifft vor allem große graue Eulen und Amseln9,10, obwohl andere Vogelarten sind auch anfällig für USUV-Infektion11. Kürzlich wurde USUV auch bei Nagetieren und Spitzmäusen identifiziert, obwohl ihre potenzielle Rolle bei der Übertragung des Virus unbekannt ist12. Beim Menschen, asymptomatische Infektionen wurden bei Blutspendern beschrieben13,14,15,16 während USUV-Infektionen wurden auch berichtet, dass mit Enzephalitis oder Meningo-Enzephalitis17,18assoziiert werden. In den Niederlanden wurde USUV erstmals 2016 bei Wildvögeln10 und 2018 bei asymptomatischen Blutspendern14nachgewiesen. Seit dem ersten Nachweis des USUV wurden in den folgenden Jahren Ausbrüche gemeldet, und die Überwachung, einschließlich der vollständigen Genomsequenzierung, ist derzeit im Gange, um das Auftreten und die Ausbreitung eines Arbovirus in einer zuvor naiven Population zu überwachen.

Ähnlich wie bei anderen Viren wie Ebola-Virus, Zika-Virus und Gelbfiebervirus3,19,20, haben wir eine Grundierung entwickelt, um USUV21in voller Länge zu sequenzieren. Dieser auf Polymerase-Kettenreaktion (PCR) basierende Ansatz ermöglicht die Rückgewinnung von USUV-Genomen in voller Länge von stark hostverseuchten Probentypen wie Hirnproben in Proben bis zu einem Ct-Wert von etwa 32. Die Vorteile eines Amplicon-basierten Sequenzierungsansatzes sind eine höhere Empfindlichkeit im Vergleich zur metagenomischen Sequenzierung und eine höhere Spezifität. Einschränkungen bei der Verwendung eines Amplikon-basierten Ansatzes bestehen darin, dass die Sequenzen ähnlich sein sollten, um Primer zu entwerfen, die allen Stämmen entsprechen, und dass Primer nach unserem derzeitigen Wissen über die Virusvielfalt entworfen wurden.

Angesichts der ständigen Entwicklungen und Verbesserungen bei der Sequenzierung der dritten Generation ist es notwendig, die Fehlerquote des Sequenzers regelmäßig zu bewerten. Hier beschreiben wir eine Methode zur Bewertung der Leistung von Nanoporen direkt gegen die Illumina-Sequenzierung am Beispiel von USUV. Diese Methode wird auf Sequenzen angewendet, die mit der neuesten R10-Flow-Zelle generiert wurden, und Basecalling wird mit der neuesten Version des Flip-Flop-Basecallers durchgeführt.

Protocol

HINWEIS: Liste der zu verwendenden Software-Tools: usearch v11.0.667; Muskel v3.8.1551; Porechop 0.2.4; cutadapt 2.5; minimap2 2.16-r922; Hocker 1.9; trimmomatic 0,39; bbmap 38.33; Spaten v3.13.1; kma-1.2.8 1. Primer-Design Beginnen Sie mit dem Herunterladen oder Abrufen eines Satzes relevanter Referenzsequenzen ganzer Genomsequenzen aus öffentlichen oder privaten Datensammlungen. Rufen Sie beispielsweise alle USUV-Genome in voller Länge (taxid64286) aus der NCBI-Datenbank22ab. USUV kodiert ein Genom von rund 11.000 Nukleotiden, also rufen Sie nur die Sequenzen mit einer Sequenzlänge von 8.000-12.000 Nukleotiden ab. Gehen Sie wie folgt mit folgendem Sucheintrag aus:- taxid64286[Organismus:noexp] UND 8000[SLEN]:12000[SLEN]. Klicken Sie auf Senden an | Vollständiger Datensatz | Datei; Verwenden Sie Format = FASTA und erstellen Sie die Datei. Um die Anzahl der Referenzsequenzen zu verkleinern, entfernen Sie doppelte Sequenzen oder Sequenzen mit einer Nukleotididentität von über 99 % aus dem Dataset. Tun Sie dies mit der Cluster-Schnell-Option von usearch23. Geben Sie in der Befehlszeile ein:- usearch -cluster_fast All_USUV.fasta -id 0.99 -centroids All_USUV_dedup.fasta Um die Primer zu generieren, müssen Sequenzen ausgerichtet werden. Dies geschieht mit MUSCLE24. Geben Sie in der Befehlszeile ein:- Muskel -in All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -log log_muscle.txtHINWEIS: Es ist wichtig, die Ausrichtung manuell zu überprüfen, um Abweichungen zu überprüfen. Diese können bei Bedarf manuell korrigiert und die Enden entsprechend der Länge der meisten gesamten Genomsequenzen gestutzt werden. Primal wird verwendet, um einen Entwurf der Primer zu treffen, die für die Amplicon-Sequenzierung in voller Länge19verwendet werden können. Laden Sie die Ausrichtung auf die ursprüngliche Website (http://primal.zibraproject.org/) hoch und wählen Sie die bevorzugte Amplikonlänge und überlappende Länge zwischen den verschiedenen Amplicons aus. Wechseln Sie zu primal.zibraproject.org, füllen Sie den Scheme-Namen aus,laden Sie die ausgerichtete Fasta-Datei hoch, wählen Sie die Ampliconlänge, überlappen Sie die Größe aus, und generieren Sie das Schema. Richten Sie den vollständigen Satz der verfügbaren vollständigen USUV-Sequenzen aus (nicht den verkleinerten oder deduplizierten Satz). Geben Sie in der Befehlszeile ein:- Muskel -in All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txtHINWEIS: Ordnen Sie die generierten Primer der vollständigen Ausrichtung zu (verwenden Sie nicht die deduplizierte Ausrichtung), korrigieren Sie Fehler manuell und enthalten maximal 5 degenerative Primerpositionen. 2. Multiplex-PCR Führen Sie die Multiplex-PCR mit den entworfenen Primern und Nanoporen- und Illumina-Sequenzierungen durch. Die Multiplex-PCR für USUV wurde wie zuvor beschrieben19,21durchgeführt. Führen Sie Basecalling mit Flip-Flop-Version 3.0.6.6+9999d81 durch. 3. Datenanalyse zur Generierung von Konsenssequenzen aus Nanoporendaten Mehrere Proben können bei einem einzigen Nanoporen-Sequenzierungslauf multiplexiert werden. Nach dem Ablauf der Sequenz entmultiplex die Nanoporendaten. Verwenden Sie porechop25 dafür. Um Verunreinigungen zu vermeiden require_two_barcodes und die Genauigkeit zu erhöhen, verwenden Sie die require_two_barcodes-Flagge. Geben Sie in der Befehlszeile ein:- porechop -i Run_USUV.fastq -o Run_USUV_demultiplex –require_two_barcodes Entfernen Sie nach dem Entmultiplexing primer-Sequenzen (in der Datei Primers_Usutu.fasta in beiden Ausrichtungen) mit cutadapt26. Entfernen Sie außerdem Sequenzen mit einer Länge von weniger als 75 Nukleotiden. Die Primer müssen entfernt werden, da sie künstliche Verzerrungen in der Konsenssequenz einführen können. Geben Sie in der Befehlszeile ein:- cutadapt -b Datei:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 Demultiplexed Sequenz-Lesevorgänge können mit minimap227 einem Panel unterschiedlicher Referenzstämme zugeordnet werden, und eine Konsenssequenz kann mit Samtools28generiert werden. Folgen Sie dem folgenden Beispiel, das das Verfahren einer referenzbasierten Ausrichtung und die Konsenssequenzgenerierung eines Beispiels zeigt: BC01. Geben Sie in der Befehlszeile ein:- minimap2 -ax map-ont Random_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam- Hocker sortieren BC01.bam > BC01_sorted.bam- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam | bcftools call -mv -Oz -o BC01.vcf.gz- bcftools Index BC01.vcf.gz- Cat Random_Refs_USUV.fasta | bcftools consensus BC01.vcf.gz > BC01_consensus.fasta Für referenzbasierte Ausrichtungen ist es wichtig, dass eine eng verwandte Referenzsequenz verwendet wird. Führen Sie daher eine BlastN-Suche mit der generierten Konsenssequenz durch, um den nächstgelegenen Referenzstamm zu identifizieren. Wiederholen Sie anschließend die referenzbasierte Ausrichtung mit dem nächstgelegenen Referenzstamm als Referenz (Schritt 3.3 und 3.4). Geben Sie in der Befehlszeile ein:- minimap2 -ax map-ont Ref_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam- Samtools sortieren BC01_ref.bam > BC01_sorted_ref.bam- bcftools mpileup -Ou -f Ref_USUV_BC01.fasta BC01_sorted_ref.bam | bcftools call -mv -Oz -o BC01_ref.vcf.gz- bcftools Index BC01_ref.vcf.gz- cat Ref_USUV_BC01.fasta | bcftools consensus BC01_ref.vcf.gz > BC01_ref_consensus.fasta 4. Analyse der Illumina-Daten Diese Sequenzen werden nach der Sequenzierung automatisch entmultiplext. Lesevorgänge können mit trimmomatic29qualitätskontrolliert werden. Verwenden Sie für gekoppelte Illumina-Sequenzen den häufig verwendeten Cut-off-Median-WERT von 33 und eine minimale Lesedauer von 75, um genaue, qualitativ hochwertige Lesevorgänge zu erhalten. Geben Sie in der Befehlszeile ein:- trimmomatic PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq LEADING:3 TRAILING:3 SLIDINGWINDOW:3:15 MINLEN:75 Entfernen Sie Primer (in der Datei Primers_Usutu.fasta in beiden Ausrichtungen), da sie künstliche Verzerrungen einführen können, mit cutadapt26. Entfernen Sie außerdem Sequenzen mit einer Länge von weniger als 75 Nukleotiden mit den folgenden Befehlen. Geben Sie in der Befehlszeile ein:- cutadapt -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 Vor der de novo-Montage können die Sequenzlesungen normalisiert werden, um eine gleichmäßige Abdeckung über das Genom zu gewährleisten. Dies ist wichtig, da de novo Assembler wie SPAdes die Leseabdeckung bei der Montage von Sequenzlesungen berücksichtigen. Normalisieren sie liest auf eine Leseabdeckung von 50 mit BBNorm aus dem BBMap-Paket30. Geben Sie in der Befehlszeile ein:- bbmap/bbnorm.sh target=50 in=9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq Die normalisierten Lesevorgänge werden de novo mit SPAdes31montiert. Die Standardeinstellungen werden für die Baugruppe mit allen verschiedenen Kmern (21, 33, 55, 77, 99 und 127) verwendet. Geben Sie in der Befehlszeile ein:- spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.f.fq -2 Sample9.qc.r.fq Karte die QC liest gegen die erhaltene Konsenssequenz mit minimap2 und Programme wie Geneious, Bioedit oder Ugene, um die Ausrichtung zu kuratieren. Es ist wichtig, den Anfang und das Ende des Kontasses zu überprüfen. Richten Sie die QC-Lesevorgänge an der erhaltenen Konsenssequenzierung mit minimap2 aus. Importieren Sie die Ausrichtung in Geneious/Bioedit/UGene. Überprüfen, korrigieren und kuratieren Sie insbesondere den Anfang und das Ende des Genoms manuell. 5. Bestimmung der erforderlichen Leseabdeckung zum Ausgleich des Fehlerprofils bei der Nanoporensequenzierung unter Verwendung von Illumina-Daten als Goldstandard Wählen Sie Sequenzlesezuordnungzuweise zu einem Amplikon, in diesem Fall Amplicon 26. Anschließend wird die Nanopore mit minimap2 gegen dieses Amplikon abgelesen. Verwenden Sie Samtools, um nur die Lesezuordnung zu Amplicon 26 auszuwählen und die bam-Datei in fastq zu konvertieren. Geben Sie in der Befehlszeile ein:- minimap2 -ax map-ont -m 150 Amplicon26.fasta BC01_trimmed.fastq > BC01.bam- Hockeransicht -b -F 4 BC01.bam > BC01_mapped.bam- Samtools bam2fq BC01_mapped.bam | seqtk seq – -> BC01_mapped.fastq Zufällig wählen Sie Teilmengen von z.B. 200 Sequenz liest tausendmal. Wenn Sie sie z. B. in 10 ändern, wird die strittenzielle Auswahl von tausendmal einer Teilmenge von 10 Sequenzlesevorgängen. Das Skript wird als Zusatzdatei 1bereitgestellt. Geben Sie in der Befehlszeile ein:- Python Random_selection.py Alle zufällig ausgewählten Sequenzlesevorgänge werden an Amplikon 26 ausgerichtet. Verwenden Sie KMA32, um die Sequenzlesevorgänge zuzuordnen und sofort eine Konsenssequenz zu generieren. Verwenden Sie optimierte Einstellungen für die Nanoporensequenzierung, die durch das Flag -bcNano angezeigt wird. Geben Sie in der Befehlszeile ein:- kma Index -i Amplicon26.fasta- für die Datei in random_sample*;- sampleID = .fastq- kma -i -sampleID.fastq -o ‘sampleID’ -t_db Amplicon26.fasta -mem_mode -mp 5 -mrs 0.0 -bcNano- fertig Überprüfen Sie die generierten Konsenssequenzen in der Befehlszeile mithilfe von:- Katze *.fsa > All_genomes.fsa- minimap2 -ax map-ont Amplicon26.fasta All_genomes.fsa > All_genomes.bam- Samtools sortieren All_genomes.bam > All_genomes_sorted.bam- Samtools Statistiken All_genomes_sorted.bam > stats.txt Die Fehlerrate wird in der statistik.txt unter der Überschrift Fehlerrate #mismatches / Bases zugeordnet angezeigt. Zeigen Sie es auf dem Bildschirm mit dem folgenden Befehl an:- grep sN stats.txt | geschnitten -f 2- Die Anzahl der Indels wird unter der Überschrift #Indels pro Zyklusangezeigt. Zeigen Sie es auf dem Bildschirm mit dem folgenden Befehl an:- grep ic stats.txt | geschnitten -f 2-

Representative Results

Kürzlich wurde eine neue Version der Flow Cell Version (R10) veröffentlicht und Verbesserungen am Basecaller angeboten, mit dem das elektronische Stromsignal in DNA-Sequenzen umgewandelt wird (sogenannter Flip-Flop-Basecaller). Daher haben wir USUV aus dem Hirngewebe einer USUV-positiven Eule resequenziert, die zuvor auf einer R9.4-Durchflusszelle und auf einem Illumina Miseq-Instrument21sequenziert wurde. Hier beschrieben wir die Methode, mit der die erforderliche Leseabdeckung für eine zuverlässige Konsensaufrufung im direkten Vergleich mit der Illumina-Sequenzierung ermittelt wird. Mit der neueren Durchflusszelle in Kombination mit dem Basecaller-Flipflop zeigen wir, dass eine Leseabdeckung von 40x zu identischen Ergebnissen im Vergleich zur Illumina-Sequenzierung führt. Eine Leseabdeckung von 30x ergibt eine Fehlerquote von 0,0002%, was einem Fehler in jeder sequenzierten 585.000 Nukleotide entspricht, während eine Leseabdeckung von 20x in jedem sequenzierten 63.529 Nukleotiden zu einem Fehler führt. Eine Leseabdeckung von 10x führt zu einem Fehler in allen 3.312 sequenzierten Nukleotiden, was bedeutet, dass mehr als drei Nukleotide pro vollständigem USUV-Genom als falsch bezeichnet werden. Bei einer Leseabdeckung über 30x wurden keine Indels beobachtet. Eine Leseabdeckung von 20x führte zur Erkennung einer Indelposition, während eine Leseabdeckung von 10x zu Indels in 29 Positionen führte. Eine Übersicht über die Fehlerquote unter Verwendung unterschiedlicher Leseabdeckungs-Cutoffs ist in Tabelle 1dargestellt. Abdeckung Fehleriteration 1 Fehlerrate Iteration 1 Indels: Fehleriteration 2 Fehlerrate Iteration 2 Indels: Fehleriteration 3 Fehlerrate Iteration 3 Indels: 10″ 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 20″ 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30x 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40x 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 50€ 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 Tabelle 1: Überblick über die Fehlerrate der Nanoporensequenzierung. Jede Iteration stellt tausend Zufällige Stichproben dar. Ergänzende Datei 1: Zufallsauswahl. Bitte klicken Sie hier, um diese Datei anzuzeigen (Rechtsklick zum Herunterladen).

Discussion

Die Nanoporensequenzierung entwickelt sich ständig weiter, und daher sind Methoden zur Überwachung der Fehlerquote erforderlich. Hier beschreiben wir einen Workflow zur Überwachung der Fehlerrate des Nanoporen-Sequenzers. Dies kann nach der Freigabe einer neuen Flow-Zelle oder wenn neue Versionen des Basisaufrufs veröffentlicht werden, nützlich sein. Dies kann jedoch auch für Benutzer nützlich sein, die ihr eigenes Sequenzierungsprotokoll einrichten und validieren möchten.

Verschiedene Software- und Ausrichtungswerkzeuge können zu unterschiedlichen Ergebnissen führen33. In diesem Manuskript wollten wir frei verfügbare Softwarepakete verwenden, die häufig verwendet werden und eine klare Dokumentation haben. In einigen Fällen könnten kommerzielle Tools bevorzugt werden, die in der Regel über benutzerfreundlichere Schnittstellen verfügen, aber bezahlt werden müssen. In Zukunft kann diese Methode auf die gleiche Probe angewendet werden, falls große Modifikationen in der Sequenztechnologie oder Basecalling-Software eingeführt werden Bevorzugt sollte dies nach jedem Update des Basecallers oder Flowcell erfolgen, aber angesichts der Geschwindigkeit der aktuellen Entwicklungen kann dies auch erst nach größeren Updates erfolgen.

Die Verringerung der Fehlerquote bei der Sequenzierung ermöglicht das Multiplexen einer höheren Anzahl von Stichproben. Damit rückt die Nanoporensequenzierung dem Ersatz herkömmlicher Echtzeit-PCRs für diagnostische Assays näher, was bereits bei der Influenza-Virusdiagnostik der Fall ist. Darüber hinaus erhöht die Reduzierung der Fehlerquote die Verwendbarkeit dieser Techniksequenzierung, z.B. bei der Bestimmung kleinerer Varianten und bei einer durchsatzunvoreingenommenen metagenomischen Sequenzierung mit hohem Durchsatz.

Ein wichtiger Schritt im Protokoll ist, dass enge, zuverlässige Referenzsequenzen verfügbar sein müssen. Die Primer basieren auf dem aktuellen Wissen über die Virenvielfalt und müssen möglicherweise ab und zu aktualisiert werden. Ein weiterer kritischer Punkt beim Einrichten eines Amplicon-basierten Sequenzierungsansatzes ist der Ausgleich der Primerkonzentration, um ein gleichmäßiges Gleichgewicht in Amplicontiefe zu erzielen. Dies ermöglicht das Multiplexing von mehr Samples bei einem Sequenzlauf und führt zu einer signifikanten Kostensenkung.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Diese Arbeit wurde aus dem Forschungs- und Innovationsprogramm Horizont 2020 der Europäischen Union im Rahmen der Finanzhilfevereinbarung Nr. 643476 (COMPARE) finanziert.

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video