In precedenza abbiamo convalidato un protocollo per il sequenziamento del virus USsutu intero genoma basato sull’amplicon (USUV) su una piattaforma di sequenziamento nanoporo. Qui, descriviamo i metodi utilizzati in modo più dettagliato e determiniamo il tasso di errore della cella di flusso nanopora R10.
Il sequenziamento dell’intero genoma può essere utilizzato per caratterizzare e tracciare focolai virali. I protocolli di sequenziamento dell’intero genoma basati su nanoporo sono stati descritti per diversi virus. Questi approcci utilizzano un approccio sovrapposto basato su amplicon che può essere utilizzato per indirizzare un virus specifico o un gruppo di virus geneticamente correlati. Oltre alla conferma della presenza del virus, il sequenziamento può essere utilizzato per studi di epidemiologia genomica, per monitorare i virus e svelare le origini, i serbatoi e le modalità di trasmissione. Per tali applicazioni, è fondamentale comprendere i possibili effetti del tasso di errore associato alla piattaforma utilizzata. L’applicazione di routine in ambito clinico e sanitario pubblico richiede che questo sia documentato con ogni cambiamento importante nel protocollo. In precedenza, è stato convalidato un protocollo per il sequenziamento del virus Usutu dell’intero genoma sulla piattaforma di sequenziamento dei nanopori (cella di flusso R9.4) confrontando direttamente il sequenziamento dell’Illumina. In questo caso, viene descritto il metodo utilizzato per determinare la copertura di lettura richiesta, utilizzando il confronto tra la cella di flusso R10 e la sequenza Illumina come esempio.
I rapidi sviluppi nelle tecnologie di sequenza di terza generazione ci permettono di andare avanti verso il sequenziamento vicino al sequenziamento in tempo reale durante le epidemie virali. Questa tempestiva disponibilità di informazioni genetiche può essere utile per determinare l’origine e l’evoluzione dei patogeni virali. Gli standard dell’oro nei settori del sequenziamento di prossima generazione, tuttavia, sono ancora i sequencer di seconda generazione. Queste tecniche si basano su tecniche specifiche e dispendiose in termini di tempo come l’amplificazione clonale durante una PCR di emulsione o l’amplificazione del ponte clonale. I sequencer di terza generazione sono più economici, portatili e sono dotati di metodologie di preparazione semplificate della libreria. Soprattutto le piccole dimensioni del dispositivo di sequenza e il basso prezzo di acquisto lo rendono un candidato interessante per il sequenziamento distribuibile e da campo. Questo potrebbe essere visto per esempio durante l’epidemia di virus Ebola in Sierra Leone e durante le indagini sull’epidemia di arbovirus in corso in Brasile1,2,3.3 Tuttavia, l’elevato tasso di errore segnalato4 potrebbe limitare le applicazioni per le quali è possibile utilizzare il sequenziamento dei nanopori.
Il sequenziamento nanoporo si sta evolvendo rapidamente. Nuovi prodotti sono disponibili sul mercato su base regolare. Esempi di questo sono ad esempio i kit quadrati 1D che consentono il sequenziamento di entrambi i filamenti della molecola di DNA, aumentando così l’accuratezza delle base chiamate5 e lo sviluppo della cella di flusso R10 che misura il cambiamento di corrente in due istanze diverse nel poro6. Inoltre, strumenti di bioinformatica migliorati come i miglioramenti nel basecalling miglioreranno la precisione del basecalling7. Uno dei basechiamanti più utilizzati (ad esempio, Albacore), è stato aggiornato almeno 12 volte in un periodo di 9 mesi5. Recentemente, il produttore ha anche rilasciato un nuovo basecaller chiamato flip-flop, che viene implementato nel software nanoporo predefinito8. Insieme, tutti questi miglioramenti porteranno a sequenze più accurate e diminuiranno il tasso di errore del sequencer nanoporo.
Usutu virus (USUV) è un arbovirus trasmesso dalle zanzare della famiglia Flaviviridae e ha un genoma di RNA a filamento positivo di circa 11.000 nucleotidi. UsUV colpisce principalmente grandi gufi grigi e merli9,10, anche se altre specie di uccelli sono suscettibili anche all’infezione USUV11. Recentemente, USUV è stato anche identificato in roditori e toporagni, anche se il loro potenziale ruolo nella trasmissione del virus rimane sconosciuto12. Nell’uomo, le infezioni asintomatiche sono state descritte nei donatori di sangue13,14,15,16 mentre le infezioni USUV sono state segnalate anche per essere associati con l’encefalite o meningo-encefalite17,18. Nei Paesi Bassi, usUV è stato rilevato per la prima volta negli uccelli selvatici nel 201610 e nei donatori di sangue asintomatico nel 201814. Dal rilevamento iniziale dell’USUV, nel corso degli anni successivi sono stati segnalati focolai e la sorveglianza, compreso il sequenziamento dell’intero genoma, è attualmente in corso per monitorare l’emergere e la diffusione di un arbovirus in una popolazione precedentemente ingenua.
Simile a quello che è stato descritto per altri virus, come il virus Ebola, virus zika e virus della febbre gialla3,19,20, abbiamo sviluppato un primer impostato per sequenza a piena lunghezza USUV21. Questo approccio basato sulla reazione a catena di polimerasi (PCR) consente il recupero di genomi USUV a piena lunghezza da tipi di campioni altamente contaminati dall’host, come campioni cerebrali in campioni fino a un valore Ct di circa 32. I vantaggi di un approccio di sequenziamento basato su amplicon sono una maggiore sensibilità rispetto al sequenziamento metagenomico e una maggiore specificità. Limitazioni dell’utilizzo di un approccio basato su amplicon sono che le sequenze dovrebbero essere simili al fine di progettare primer che si adattano a tutti i ceppi e che i primer sono progettati sulla nostra conoscenza attuale sulla diversità dei virus.
Dati i costanti sviluppi e i miglioramenti nel sequenziamento di terza generazione, è necessario valutare regolarmente il tasso di errore del sequencer. Qui, descriviamo un metodo per valutare le prestazioni del nanoporo direttamente contro il sequenziamento Illumina usando USUV come esempio. Questo metodo viene applicato alle sequenze generate con la cella di flusso R10 più recente e basecalling viene eseguito con la versione più recente del basecaller flip-flop.
Il sequenziamento dei nanopori è in continua evoluzione e quindi c’è bisogno di metodi per monitorare il tasso di errore. In questo caso, descriviamo un flusso di lavoro per monitorare il tasso di errore del sequencer nanoporo. Ciò può essere utile dopo il rilascio di una nuova cella di flusso o se vengono rilasciate nuove versioni del richiamo di base. Tuttavia, questo può essere utile anche per gli utenti che desiderano impostare e convalidare il proprio protocollo di sequenziamento.
Diversi software e strumenti di allineamento possono produrre risultati diversi33. In questo manoscritto, abbiamo cercato di utilizzare pacchetti software liberamente disponibili che sono comunemente utilizzati e che hanno una documentazione chiara. In alcuni casi, la preferenza potrebbe essere data agli strumenti commerciali, che generalmente hanno un’interfaccia più user-friendly ma devono essere pagati. In futuro, questo metodo può essere applicato allo stesso campione nel caso in cui grandi modifiche nella tecnologia di sequenza o software di base- sono introdotti preferibilmente questo dovrebbe essere fatto dopo ogni aggiornamento del basecaller o flowcell, tuttavia data la velocità degli sviluppi attuali questo può essere fatto anche solo dopo importanti aggiornamenti.
La riduzione del tasso di errore nella sequenza consente di multiplexare un numero maggiore di campioni. Di conseguenza, il sequenziamento dei nanopori si sta avvicinando alla sostituzione dei PCR convenzionali in tempo reale per i test diagnostici, il che è già il caso della diagnostica del virus dell’influenza. Inoltre, la riduzione del tasso di errore aumenta l’usabilità di questa tecnica di sequenziamento, ad esempio per la determinazione di varianti minori e per il sequenziamento metagenomico imparziale ad alto throughput.
Un passaggio critico del protocollo è che devono essere disponibili sequenze di riferimento vicine e affidabili. I primer si basano sulle attuali conoscenze sulla diversità dei virus e potrebbe essere necessario aggiornare ogni tanto. Un altro punto critico quando si imposta un approccio di sequenziamento basato su amplicon è il bilanciamento della concentrazione di primer per ottenere un equilibrio uniforme in profondità dell’amplificatore. Ciò consente il multiplexing di più campioni in un’esecuzione di sequenza e comporta una riduzione significativa dei costi.
The authors have nothing to disclose.
Questo lavoro ha ricevuto finanziamenti dal programma di ricerca e innovazione Orizzonte 2020 dell’Unione europea nell’ambito dell’accordo di sovvenzione n. 643476 (COMPARE).
Agencourt AMPure XP beads | Beckman Coulter | A63881 | |
dNTPs | Qiagen | 201900 | |
FLO-MIN106 R10 flowcell | Nanopore | R10 flowcell | |
KAPA Hyperplus libarary preparation kit | Roche | 7962436001 | |
Library Loading Bead Kit | Nanopore | EXP-LLB001 | |
Ligation Sequencing Kit 1D | Nanopore | SQK-LSK109 | |
Native Barcoding Kit 1D 1-12 | Nanopore | EXP-NBD103 | |
Native Barcoding Kit 1D 13-24 | Nanopore | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | NEB | M0367S | |
NEB Next Quick Ligation Module | NEB | E6056 | |
NEB Next Ultra II End Repair / dA-Tailing Module | NEB | E7546S | |
Protoscript II Reverse Transcriptase | NEB | M0368X | |
Q5 High-Fidelity polymerase | NEB | M0491 | |
Qubit dsDNA HS Assay kit | Thermo Fisher | Q32851 | |
Random Primers | Promega | C1181 | |
RNAsin Ribonuclease Inhibitor | Promega | N2111 |