Summary

全ゲノムナノポアシーケンシングの検証、例としてUsutuウイルスを用いた

Published: March 11, 2020
doi:

Summary

我々は、ナノポアシーケンシングプラットフォーム上でアンプリコンベースの全ゲノムウストゥウイルス(USUV)シーケンシングのプロトコルを検証した。ここでは、ナノポアR10フローセルの誤差率をより詳細に用いた方法について説明する。

Abstract

全ゲノムシーケンシングは、ウイルスの流行を特徴付け、追跡するために使用することができます。ナノポアベースの全ゲノムシーケンシングプロトコルは、いくつかの異なるウイルスについて説明されている。これらのアプローチは、特定のウイルスまたは遺伝的に関連するウイルスのグループを標的にするために使用することができる重複するアンプリコンベースのアプローチを利用する。ウイルスの存在の確認に加えて、シーケンシングはゲノム疫学研究に使用され、ウイルスを追跡し、起源、貯水池および伝染様式を解明することができる。このようなアプリケーションでは、使用するプラットフォームに関連するエラー率の影響を理解することが重要です。臨床および公衆衛生の設定での日常的な適用は、プロトコルのすべての重要な変更と文書化されている必要があります。以前は、全ゲノムのミウストゥウイルスシーケンシング用プロトコルが、イルミナシーケンシングと直接比較して検証(R9.4フローセル)であった。ここでは、R10フローセルとイルミナシーケンシングの比較を例として用いて、必要な読み込みカバレッジを決定するために使用される方法を説明する。

Introduction

第3世代シーケンス技術の急速な発展により、ウイルスの発生時にリアルタイムシーケンシングに近い方向に進みます。この遺伝情報のタイムリーな入手可能性は、ウイルス病原体の起源および進化を決定するのに役立つ可能性がある。しかし、次世代シーケンシングの分野におけるゴールドスタンダードは、依然として第2世代のシーケンサーです。これらの技術は、エマルジョン PCR またはクローン ブリッジ増幅中のクローン増幅のような特定の時間のかかる技術に依存します。第3世代のシーケンサーは安価で手持ち型で、簡略化されたライブラリ調製方法論が付属しています。特に、シーケンスデバイスの小型化と購入価格の低さは、展開可能でフィールド可能なシーケンシングの興味深い候補となります。これは、例えばシエラレオネでのエボラウイルス,の流行の間に、そしてブラジル1、2、32で進行中のアルボ1ウイルスの流行調査の間に見ることができました。ただし、報告された高エラー率4は、ナノポアシーケンスを使用できるアプリケーションを制限する可能性があります。

ナノポアシーケンシングは急速に進化しています。新製品は定期的に市場で入手可能です。この例としては、例えばDNA分子の両鎖のシーケンシングを可能にする1D二乗キットであり、それによって、ポア6内の2つの異なるインスタンスで電流の変化を測定する呼び出された塩基5の精度とR10フローセルの発達を高める。さらに、ベースコールの改善のような改善されたバイオインフォマティクスツールは、ベースコール7の精度を向上させます。最も頻繁に使用されるベースコールの1つ(例えば、アルバコア)は、9ヶ月の期間5で少なくとも12回更新されています。最近、メーカーはまた、デフォルトのナノポアソフトウェア8に実装されているフリップフロップと呼ばれる新しいベースコールをリリースしました。これらの改善はすべて、より正確なシーケンスにつながり、ナノポアシーケンサーのエラー率を低下させます。

ウストゥウイルス(USUV)は、家族のフラビビリダ科の蚊媒介性アルボウイルスであり、約11,000ヌクレオチドの陽性鎖RNAゲノムを有する。USUVは主に大きな灰色のフクロウとブラックバード99、1010に影響を与えますが、他の鳥種もUSUV感染の影響を受けやすい11です。最近、USUVはげっ歯類や抜け目で同定されたが、ウイルスの感染における潜在的な役割は不明であるが12.ヒトにおいて、無症候性感染症は、血液供与者13、14、15、1614,15に記載されているが、USUV16感染も脳炎または髄膜炎脳炎1317、18,18に関連していると報告されている。オランダでは、USUVは2016年10年に野鳥で初めて検出され、2018年には無症候性の献血者で14.USUVの最初の検出以来、発生は、その後の年の間に報告されており、全ゲノムシーケンシングを含む監視は、以前はナイーブな集団におけるアルボウイルスの出現と広がりを監視するために現在進行中です。

エボラウイルス、ジカウイルスおよび黄熱病ウイルス3、19、20,20などの他のウイルスについて説明3,されているものと同様に、全長USUV21をシーケンスするプライマーセットを開発した。このポリメラーゼ連鎖反応(PCR)ベースのアプローチにより、サンプル中の脳サンプルのような高度に宿主汚染されたサンプルタイプから、約32のCt値までの全長USUVゲノムの回収が可能になります。アンプリコンベースのシーケンシングアプローチの利点は、メタゲノムシーケンシングと比較して高感度と高い特異性です。アンプリコンベースのアプローチを使用する場合の制限は、配列がすべての株に適合するプライマーを設計するために類似する必要があり、プライマーはウイルスの多様性に関する現在の知識に基づいて設計されることです。

第3世代シーケンシングの絶え間ない発展と改善を考えると、シーケンサーのエラー率を定期的に評価する必要があります。ここでは、USUVを例に用いて、イルミナシーケンシングに対してナノポアの性能を直接評価する方法について述べている。このメソッドは最新の R10 フロー セルで生成されたシーケンスに適用され、ベースコールはフリップフロップベース呼び出し元の最新バージョンで実行されます。

Protocol

注: 使用するソフトウェア ツールの一覧: usearch v11.0.667;筋肉 v3.8.1551;ポレチョップ 0.2.4;カットアダプト2.5;ミニマップ2 2.16-r922;サムツール 1.9;トリミング 0.39;bbmap 38.33;スペード v3.13.1;kma-1.2.8 1. プライマー設計 まず、パブリックまたはプライベートデータコレクションから関連する参照全ゲノム配列のセットをダウンロードまたは取得します。たとえば、NCBI データベース22から全長 USUV ゲノム (taxid64286) を取得します。USUVは約11,000ヌクレオチドのゲノムをコードするので、配列長が8,000〜12,000ヌクレオチドの配列のみを取り出す。次の検索エントリを使用して、これを行います。-タクシー64286[生物:noexp]と8000[SLEN]:12000[SLEN]。 [送信] をクリックします。 |完全な記録 |ファイル;フォーマット = FASTA を使用して、ファイルを作成します。 参照配列のセットを縮小するには、データセットから 99% 以上のヌクレオチド ID を持つ重複した配列またはシーケンスを削除します。usearch23のクラスター高速オプションを使用して、これを行います。コマンド ラインで次のように入力します。- usearch -cluster_fast All_USUV.fasta -id 0.99 – All_USUV_dedup プライマーを生成するには、配列を整列させる必要があります。これはMUSCLE24を使用して行われます。コマンド ラインで次のように入力します。-筋肉 – All_USUV_dedup.fasta -out All_USUV_dedup_aligned.fasta -ログlog_muscle.txt注: 位置合わせを手動で検査して、不一致を確認することが重要です。これらは必要に応じて手動で修正することができ、端部はほとんどの全ゲノム配列の長さに従ってトリミングすることができる。 プライマルは、フルレンポンシーケンシング19に使用できるプライマーのドラフト選択を行うために使用されます。ライメントを原始ウェブサイト(http://primal.zibraproject.org/)にアップロードし、異なるアンプリコン間の好ましいアンプリコンの長さと重なりの長さを選択します。primal.zibraproject.orgに移動し、スキーム名を入力し、整列したfastaファイルをアップロードし、アンプリコンの長さ、オーバーラップサイズを選択し、スキームを生成します。 使用可能な完全な USUV シーケンスの完全なセットを揃えます (ダウンサイズまたは重複除去されたセットではありません)。コマンド ラインで次のように入力します。-筋肉 – All_USUV.fasta -out All_USUV_aligned.fasta -log log_muscle.txt注:生成されたプライマーを完全なアライメント(重複除去アライメントを使用しない)にマップし、手動でエラーを修正し、最大5つの変性プライマー位置を含めます。 2. マルチプレックス PCR 設計されたプライマーとナノポアとイルミナシーケンシングを使用してマルチプレックスPCRを実行します。USUV用のマルチプレックスPCRは、前述の19,21,と同様に行った。 フリップフロップバージョン3.0.6.6+9999d81でベースコールを実行します。 3. ナノポアデータからコンセンサス配列を生成するデータ解析 複数のサンプルを単一のナノポアシーケンシング実行で多重化できます。シーケンス実行を行った後、ナノポアデータをデマルチプレックス化する。このためにポレチョップ25を使用してください。汚染を防止し、精度を高めるために、require_two_barcodesフラグを使用します。コマンド ラインで次のように入力します。-ポレチョップ -i Run_USUV.fastq -o Run_USUV_demultiplex –require_two_barcodes デマルチプレクシングの後、cutadapt26を使用してプライマー シーケンス (両方の向きでファイル Primers_Usutu.fasta に示されている) を削除します。さらに、75ヌクレオチドより短い長さの配列を除去する。プライマーは、コンセンサスシーケンスに人工バイアスを導入できるため、除去する必要があります。コマンド ラインで次のように入力します。-カットアダプト -b ファイル:Primers_USUV.fasta -o BC01_trimmed.fastq BC01.fastq -m 75 デマルチプレックスシーケンス読み取りは、minimap227を使用して別個の基準歪みのパネルにマッピングすることができ、samtools28を使用してコンセンサスシーケンスを生成することができます。以下の例に従って、参照ベースのアライメントの手順と、1 つのサンプルのコンセンサスシーケンス生成 BC01 を示します。コマンド ラインで次のように入力します。-ミニマップ2 -axマップオンRandom_Refs_USUV.fasta BC01_trimmed.fastq > BC01.bam-サムツールソートBC01.bam > BC01_sorted.bam- bcftools mpileup -Ou -f Random_Refs_USUV.fasta BC01_sorted.bam | bcftools コール -mv -Oz -o BC01.vcf.gz- bcfツールインデックス BC01.vcf.gz-猫Random_Refs_USUV.fasta | bcftoolsコンセンサス BC01.vcf.gz > BC01_consensus.fasta 参照ベースの配置では、密接に関連する参照シーケンスを使用することが不可欠です。したがって、生成されたコンセンサスシーケンスを使用して BlastN 検索を実行し、最も近い参照株を特定します。その後、参照に最も近い参照ひずみで参照ベースの位置合わせを繰り返します(ステップ 3.3 および 3.4)。コマンド ラインで次のように入力します。-ミニマップ2 -axマップオントRef_USUV_BC01.fasta BC01_trimmed.fastq > BC01_ref.bam-サムツールソートBC01_ref.bam > BC01_sorted_ref.bam- bcftools mpileup -Ou -f Ref_USUV_BC01.ファタ BC01_sorted_ref.bam | bcftools コール -mv -Oz -o BC01_ref.vcf.gz- bcftools インデックス BC01_ref.vcf.gz-猫 Ref_USUV_BC01.fasta | bcftools コンセンサス BC01_ref.vcf.gz > BC01_ref_consensus.fasta 4. イルミナデータの解析 これらのシーケンスは、シーケンス後に自動的に多重化解除されます。読み取りは、trimmomatic29を使用して品質管理できます。ペアエンドイルミナシーケンスの場合、正確で高品質の読み取りを得るために、一般的に使用されるカットオフ中央値PHREDスコア33と75の最小読み取り長さを使用します。コマンド ラインで次のように入力します。-トリミング PE -phred33 9_S9_L001_R1_001.fastq.gz 9_S9_L001_R2_001.fastq.gz 9_1P.fastq 9_1U.fastq 9_2P.fastq 9_2U.fastq リーディング:3 トレーリング:3 スライディングウィンドウ:3:15 ミンレン:75 彼らは、カットアダプト26を使用して、人工的バイアスを導入することができるので、プライマー(両方の向きでPrimers_Usutu.fastaに示されている)を除去します。さらに、以下のコマンドを使用して、75ヌクレオチドより短い長さの配列を除去する。コマンド ラインで次のように入力します。-カットアダプト -b o 9_1P_trimmed.fastq -p 9_2P_trimmed.fastq 9_1P.fastq 9_2P.fastq -m 75 デノボアセンブリの前に、配列読み取りはゲノム全体の均等なカバレッジのために正規化することができます。SpAdes のようなデノボ アセンブラーは、シーケンス読み取りを組み立てる際に読み取りカバレッジを考慮に入れるので、これは不可欠です。BBMapパッケージ30からBBNormを使用して50の読み取りカバレッジに読み取りを正規化します。コマンド ラインで次のように入力します。- bbmap/bbnorm.sh ターゲット=50 in=9_1P_trimmed.fastq in2=9_2P_trimmed.fastq out=Sample9_FW_norm.fastq out2=Sample9_RE_norm.fastq 正規化された読み取りは、SPAdes31を使用して組み立てられます。既定の設定は、すべての異なる kmers (21、33、55、77、99、および 127) を使用してアセンブリに使用されます。コマンド ラインで次のように入力します。- spades.py -k 21,33,55,77,99,127 -o Sample9 -1 Sample9.qc.fq -2 Sample9.qc.r.fq minimap2と、配列をキュレーションするGeneious、BioeditまたはUgeneのようなプログラムを使用して、取得したコンセンサスシーケンスに対してQCの読み取りをマッピングします。コンティグの開始と終了を確認することが重要です。 取得したコンセンサスシーケンスに対して、MINImap2 を使用して QC 読み取りを位置合わせします。 アライメントをジェネイス/バイオエディット/UGeneにインポートします。 手動で検査、修正し、特にゲノムの始まりと終わりをキュレーション。 5. イルミナデータをゴールドスタンダードとして使用するナノポアシーケンシングのエラープロファイルを補正するために必要な読み込みカバレッジを決定する 選択シーケンスは、1アンプリコン(この場合はアンプリコン26)へのマッピングを読み取る。続いて、minimap2を使用して、このアンプリコンに対してナノポア読み取りをマッピングする。Samtools を使用して、アンプリコン 26 への読み取りマッピングのみを選択し、bam ファイルを fastq に変換します。コマンド ラインで次のように入力します。-ミニマップ2 -axマップオン -m 150 アンプリコン26.fasta BC01_trimmed.fastq > BC01.bam-サムツールビュー -b -F 4 BC01.bam > BC01_mapped.bam-サムツール bam2fq BC01_mapped.bam | seqtk seq – -> BC01_mapped.fastq インスタンス 200 シーケンスのサブセットをランダムに選択すると、1000 回読み取られます。たとえば、10 に変更すると、10 シーケンス読み取りのサブセットの 1000 倍のランダム選択が行われます。このスクリプトは、補足ファイル 1として提供されます。コマンド ラインで次のように入力します。-パイソンRandom_selection.py ランダムに選択されたシーケンス読み取りはすべて、アンプリコン26に整列される。KMA32を使用して、シーケンス読み取りをマップし、すぐにコンセンサス シーケンスを生成します。bcNano フラグで示される、ナノポアシーケンスの最適化された設定を使用します。コマンド ラインで次のように入力します。- kma インデックス -i アンプリコン26.ファスタ- random_sample*のファイルに対して-サンプル ID=${ファイル%.ファストq}- kma -i ${sampleID}.fastq -o ${sampleID} -t_db アンプリコン26.ファフタ -mem_mode -mp 5 -mrs 0.0 -bcNano-完了 次のコマンドを使用して、生成されたコンセンサス シーケンスをコマンド ラインで検査します。-猫 *.fsa > All_genomesfsa-ミニマップ2 -axマップオンアンプリコン26.fasta All_genomes.fsa > All_genomes.bam-サムツールソートAll_genomes.bam > All_genomes_sorted.bam-サムツール統計All_genomes_sorted.bam > stats.txt エラー率は、マッピングされた見出しエラー率の下の stats.txt #mismatches / ベースに表示されます。次のコマンドを使用して、画面に表示します。-グレップ ^SN stats.txt | カット -f 2- インデルの量は、サイクルごとの見出し#Indelsの下に表示されます。次のコマンドを使用して、画面に表示します。-グレップ ^IC stats.txt | カット -f 2-

Representative Results

最近、フローセルバージョン(R10)の新しいバージョンがリリースされ、電子電流信号をDNA配列(いわゆるフリップフロップベース発信者)に変換するために使用されるベース発信者に改良が加えられた。したがって、我々は、以前R9.4フローセル上およびイルミナミセック器具21上で配列されたUSUV陽性フクロウの脳組織からUSUVを再配列した。ここでは、Illumina シーケンシングと直接比較することにより、信頼できるコンセンサス呼び出しに必要な読み取りカバレッジを決定するために使用する方法について説明します。 ベースコールフリップフロップと組み合わせて新しいフローセルを使用すると、40倍の読み取りカバレッジがIlluminaシーケンスと比較して同じ結果になるということが示されます。30倍の読み取りカバレッジは0.0002%のエラー率をもたらし、配列化された585,000個のヌクレオチドごとに1つの誤差に相当し、20倍の読み取りカバレッジは配列化された63,529ヌクレオチドごとに1つのエラーをもたらします。10xの読み取りカバレッジは、配列化された3,312個のヌクレオチドごとに1つのエラーをもたらし、完全なUSUVゲノムあたり3ヌクレオチド以上が間違っていると呼ばれていることを意味します。読み取りカバレッジが 30 倍を超える場合、インデルは見られなかった。20倍の読み取りカバレッジは1つのインデルポジションを検出し、10倍の読み取りカバレッジは29のポジションでインデルをもたらしました。異なる読み取りカバレッジのカットオフを使用したエラー率の概要を表 1に示します。 カバレッジ エラーの反復 1 エラー率の反復 1 インデル: エラーの反復 2 エラー率の反復 2 インデル: エラーの反復 3 エラー率の反復 3 インデル: 10× 100 0.0274% 4 116 0.0297% 18 110 0.0282% 7 20× 4 0.0010% 0 6 0.0015% 1 7 0.0018% 0 30倍 2 0.0005% 0 0 0.0000% 0 0 0.0000% 0 40倍 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 50× 0 0.0000% 0 0 0.0000% 0 0 0.0000% 0 表1:ナノポアシーケンシングの誤差率の概要各反復は、1000 個のランダム サンプルを表します。 補足ファイル 1: ランダム選択。このファイルを表示するには、ここをクリックしてください (右クリックしてダウンロードしてください)。

Discussion

ナノポアシーケンシングは絶えず進化しているため、エラー率を監視する方法が必要です。ここでは、ナノポアシーケンサーのエラー率を監視するワークフローについて説明します。これは、新しいフローセルのリリース後、またはベースコールの新しいリリースがリリースされた場合に役立ちます。ただし、これは、独自のシーケンス プロトコルを設定して検証するユーザーにも役立ちます。

異なるソフトウェアとアライメントツールは、異なる結果を生み出すことができます33.本稿では、一般的に使用され、明確なドキュメントを持つ自由に入手可能なソフトウェアパッケージを使用することを目指しました。場合によっては、一般的によりユーザーフレンドリーなインターフェイスを持つ商用ツールを優先するが、支払いが必要な場合があります。将来的には、シーケンス技術やベース呼び出しソフトウェアの大きな変更が優先的に導入された場合に同じサンプルに適用できますが、現在の開発の速度を考えると、これは主要な更新後にのみ行うことができます。

シーケンスのエラー率の低下により、多重化するサンプル数が増えます。それにより、ナノポアシーケンシングは、インフルエンザウイルス診断の場合に既に当てはまる診断アッセイ用の従来のリアルタイムPCRの置き換えに近づいています。さらに、エラー率の低下は、例えばマイナーバリアントの決定やハイスループットの公平なメタゲノムシーケンシングなど、この技術シーケンシングのユーザビリティを向上させます。

プロトコルの重要なステップは、近く、信頼性の高い参照シーケンスを使用する必要があります。プライマーは、ウイルスの多様性に関する現在の知識に基づいており、たまに更新する必要があるかもしれません。アンプリコンベースのシーケンシングアプローチを設定する際のもう一つの重要なポイントは、アンプリコン深度の均一なバランスを得るためにプライマー濃度のバランスです。これにより、シーケンス実行でサンプルの多重化が可能になり、大幅なコスト削減が実現します。

Disclosures

The authors have nothing to disclose.

Acknowledgements

この研究は、補助金契約第643476(COMPARE)に基づく欧州連合のHorizon 2020研究・イノベーションプログラムから資金を受け取っています。

Materials

Agencourt AMPure XP beads Beckman Coulter A63881
dNTPs Qiagen 201900
FLO-MIN106 R10 flowcell Nanopore R10 flowcell
KAPA Hyperplus libarary preparation kit Roche 7962436001
Library Loading Bead Kit Nanopore EXP-LLB001
Ligation Sequencing Kit 1D Nanopore SQK-LSK109
Native Barcoding Kit 1D 1-12 Nanopore EXP-NBD103
Native Barcoding Kit 1D 13-24 Nanopore EXP-NBD104
NEB Blunt/TA Ligase Master Mix NEB M0367S
NEB Next Quick Ligation Module NEB E6056
NEB Next Ultra II End Repair / dA-Tailing Module NEB E7546S
Protoscript II Reverse Transcriptase NEB M0368X
Q5 High-Fidelity polymerase NEB M0491
Qubit dsDNA HS Assay kit Thermo Fisher Q32851
Random Primers Promega C1181
RNAsin Ribonuclease Inhibitor Promega N2111

References

  1. Faria, N. R., et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 546 (7658), 406-410 (2017).
  2. Bonaldo, M. C., et al. Genome analysis of yellow fever virus of the ongoing outbreak in Brazil reveals polymorphisms. Memórias do Instituto Oswaldo Cruz. 112 (6), 447-451 (2017).
  3. Faria, N. R., et al. Genomic and epidemiological monitoring of yellow fever virus transmission potential. bioRxiv. , 299842 (2018).
  4. Magi, A., Giusti, B., Tattini, L. Characterization of MinION nanopore data for resequencing analyses. Briefings in Bioinformatics. 18 (6), bbw077 (2016).
  5. Rang, F. J., Kloosterman, W. P., de Ridder, J. From squiggle to basepair: computational approaches for improving nanopore sequencing read accuracy. Genome Biology. 19 (1), 90 (2018).
  6. . Nanopore Store, R10 flow cells Available from: https://store.nanoporetech.com/flowcells/spoton-flow-cell-mk-i-r10.html (2019)
  7. Wick, R. R., Judd, L. M., Holt, K. E. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biology. 20 (1), 129 (2019).
  8. . GitHub – nanoporetech/flappie: Flip-flop basecaller for Oxford Nanopore reads Available from: https://github.com/nanoporetech/flappie (2019)
  9. Lühken, R., et al. Distribution of Usutu Virus in Germany and Its Effect on Breeding Bird Populations. Emerging Infectious Diseases. 23 (12), 1994-2001 (2017).
  10. Cadar, D., et al. Widespread activity of multiple lineages of Usutu virus, Western Europe, 2016. Eurosurveillance. 22 (4), (2017).
  11. Becker, N., et al. Epizootic emergence of Usutu virus in wild and captive birds in Germany. PLoS ONE. 7 (2), (2012).
  12. Diagne, M., et al. Usutu Virus Isolated from Rodents in Senegal. Viruses. 11 (2), 181 (2019).
  13. Bakonyi, T., et al. Usutu virus infections among blood donors, Austria, July and August 2017 – Raising awareness for diagnostic challenges. Eurosurveillance. 22 (41), (2017).
  14. Zaaijer, H. L., Slot, E., Molier, M., Reusken, C. B. E. M., Koppelman, M. H. G. M. Usutu virus infection in Dutch blood donors. Transfusion. , trf.15444 (2019).
  15. Cadar, D., et al. Blood donor screening for West Nile virus (WNV) revealed acute Usutu virus (USUV) infection, Germany, September 2016. Eurosurveillance. 22 (14), 30501 (2017).
  16. Pierro, A., et al. Detection of specific antibodies against West Nile and Usutu viruses in healthy blood donors in northern Italy, 2010–2011. Clinical Microbiology and Infection. 19 (10), E451-E453 (2013).
  17. Pecorari, M., et al. First human case of Usutu virus neuroinvasive infection, Italy, August-September 2009. Euro surveillance: bulletin européen sur les maladies transmissibles = European Communicable Disease Bulletin. 14 (50), (2009).
  18. Simonin, Y., et al. Human Usutu Virus Infection with Atypical Neurologic Presentation, Montpellier, France, 2016. Emerging Infectious Diseases. 24 (5), 875-878 (2018).
  19. Quick, J., et al. Multiplex PCR method for MinION and Illumina sequencing of Zika and other virus genomes directly from clinical samples. Nature Protocols. 12 (6), 1261-1276 (2017).
  20. Quick, J., et al. Real-time, portable genome sequencing for Ebola surveillance. Nature. 530 (7589), 228-232 (2016).
  21. Oude Munnink, B. B., et al. Towards high quality real-time whole genome sequencing during outbreaks using Usutu virus as example. Infection, Genetics and Evolution. 73, 49-54 (2019).
  22. Benson, D. A., Karsch-Mizrachi, I., Lipman, D. J., Ostell, J., Sayers, E. W. GenBank. Nucleic Acids Research. 38 (Database issue), D46-D51 (2010).
  23. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinformatics. 26 (19), 2460-2461 (2010).
  24. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Research. 32 (5), 1792-1797 (2004).
  25. . GitHub – rrwick/Porechop: adapter trimmer for Oxford Nanopore reads Available from: https://github.com/rrwick/porechop (2018)
  26. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal. 17 (1), 10 (2011).
  27. Li, H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics. 34 (18), 3094-3100 (2018).
  28. Li, H., et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 25 (16), 2078-2079 (2009).
  29. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics (Oxford, England). 30 (15), 2114-2120 (2014).
  30. . BBMap download | SourceForge.net Available from: https://sourceforge.net/projects/bbmap/ (2019)
  31. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  32. Clausen, P. T. L. C., Aarestrup, F. M., Lund, O. Rapid and precise alignment of raw reads against redundant databases with KMA. BMC Bioinformatics. 19 (1), 307 (2018).
  33. Brinkmann, A., et al. Proficiency Testing of Virus Diagnostics Based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets. Journal of Clinical Microbiology. 57 (8), (2019).

Play Video

Cite This Article
Oude Munnink, B. B., Nieuwenhuijse, D. F., Sikkema, R. S., Koopmans, M. Validating Whole Genome Nanopore Sequencing, using Usutu Virus as an Example. J. Vis. Exp. (157), e60906, doi:10.3791/60906 (2020).

View Video