Nous avons précédemment validé un protocole pour le séquençage du virus Usutu (USUV) à base d’amplicon sur une plate-forme de séquençage des nanopores. Ici, nous décrivons les méthodes utilisées plus en détail et déterminons le taux d’erreur de la cellule d’écoulement nanopore R10.
Le séquençage du génome entier peut être utilisé pour caractériser et retracer les flambées virales. Des protocoles de séquençage du génome entier à base de nanopore ont été décrits pour plusieurs virus différents. Ces approches utilisent une approche à base d’amplicons qui se chevauche qui peut être utilisée pour cibler un virus ou un groupe spécifique de virus génétiquement apparentés. En plus de la confirmation de la présence du virus, le séquençage peut être utilisé pour des études d’épidémiologie génomique, pour suivre les virus et démêler les origines, les réservoirs et les modes de transmission. Pour de telles applications, il est crucial de comprendre les effets possibles du taux d’erreur associé à la plate-forme utilisée. L’application courante dans les milieux cliniques et de santé publique exige que cela soit documenté à chaque changement important dans le protocole. Auparavant, un protocole pour le séquençage du virus Usutu sur la plate-forme de séquençage des nanopores a été validé (R9.4 flowcell) par comparaison directe avec le séquençage Illumina. Ici, nous décrivons la méthode utilisée pour déterminer la couverture de lecture requise, en utilisant la comparaison entre la cellule de débit R10 et le séquençage Illumina comme exemple.
L’évolution rapide des technologies de séquence de troisième génération nous permet d’aller de l’avant vers un séquençage en temps quasi réel lors d’éclosions virales. Cette disponibilité opportune de l’information génétique peut être utile pour déterminer l’origine et l’évolution des agents pathogènes viraux. Les normes d’or dans les domaines du séquençage de la prochaine génération sont cependant encore les séquenceurs de deuxième génération. Ces techniques s’appuient sur des techniques spécifiques et chronophages comme l’amplification clonale lors d’une amplification par col létération du pcR ou d’un pont clonal. Les séquenceurs de troisième génération sont moins chers, portatifs et sont livrés avec des méthodologies simplifiées de préparation de bibliothèque. Surtout la petite taille de l’appareil séquence et le faible prix d’achat en fait un candidat intéressant pour le séquençage déployable et fieldable. Cela pourrait par exemple être vu lors de l’épidémie de virus Ebola en Sierra Leone et au cours des enquêtes en cours sur l’épidémie d’arbovirus au Brésil1,2,3. Cependant, le taux d’erreur élevésignalé 4 pourrait limiter les applications pour lesquelles le séquençage des nanopores peut être utilisé.
Le séquençage des nanopores évolue rapidement. De nouveaux produits sont disponibles régulièrement sur le marché. Par exemple, les kits 1D carrés qui permettent le séquençage des deux brins de la molécule d’ADN, augmentant ainsi la précision des bases5 appelées et le développement de la cellule d’écoulement R10 qui mesure le changement de courant à deux exemples différents dans le pore6. En outre, l’amélioration des outils bio-informatiques comme l’amélioration de l’appel de base améliorera la précision de l’appel de base7. L’un des appel de base les plus fréquemment utilisés (p. ex., Albacore), a été mis à jour au moins 12 fois au cours d’une période de 9 mois5. Récemment, le fabricant a également publié un nouvel appel de base appelé flip-flop, qui est mis en œuvre dans le logiciel nanopore par défaut8. Ensemble, toutes ces améliorations mèneront à des séquences plus précises et diminueront le taux d’erreur du séquenceur de nanopores.
Le virus Usutu (USUV) est un arbovirus transmis par les moustiques de la famille Flaviviridae et il a un génome d’ARN positif-échoué d’environ 11.000 nucléotides. USUV affecte principalement les grands hiboux gris et les merles9,10, bien que d’autres espèces d’oiseaux soient également sensibles à l’infection USUV11. Récemment, USUV a également été identifié chez les rongeurs et les musaraignes bien que leur rôle potentiel dans la transmission du virus reste inconnu12. Chez l’homme, des infections asymptomatiques ont été décrites chez les donneurs de sang13,14,15,16 tandis que les infections USUV ont également été rapportées pour être associées à l’encéphalite ou à la méningo-encéphalite17,18. Aux Pays-Bas, l’USUV a été détecté pour la première fois chez des oiseaux sauvages en 201610 et chez des donneurs de sang asymptomatiques en 201814. Depuis la détection initiale de l’USUV, des flambées ont été signalées au cours des années suivantes et la surveillance, y compris le séquençage du génome entier, est actuellement en cours pour surveiller l’émergence et la propagation d’un arbovirus dans une population auparavant naïve.
Semblable à ce qui a été décrit pour d’autres virus, tels que le virus Ebola, le virus Zika et le virus de la fièvre jaune3,19,20, nous avons développé un ensemble d’amorce pour séquencer pleine longueur USUV21. Cette approche basée sur la réaction en chaîne de polymérase (PCR) permet de récupérer les génomes USUV de pleine longueur à partir de types d’échantillons fortement contaminés par l’hôte comme des échantillons de cerveau dans des échantillons jusqu’à une valeur Ct d’environ 32. Les avantages d’une approche de séquençage à base d’amplicon sont une sensibilité plus élevée par rapport au séquençage métagénomique et une spécificité plus élevée. Les limites de l’utilisation d’une approche basée sur l’amplicon sont que les séquences doivent être similaires afin de concevoir des amorces s’adaptant à toutes les souches et que les amorces sont conçus sur nos connaissances actuelles sur la diversité du virus.
Compte tenu de l’évolution constante et de l’amélioration du séquençage de troisième génération, il est nécessaire d’évaluer régulièrement le taux d’erreur du séquenceur. Ici, nous décrivons une méthode pour évaluer la performance de la nanopore directement contre le séquençage Illumina en utilisant USUV comme exemple. Cette méthode est appliquée aux séquences générées avec la dernière cellule de débit R10 et l’appel de base est effectué avec la dernière version du tourne-disque.
Le séquençage des nanopores est en constante évolution et il est donc nécessaire de mettre en place des méthodes pour surveiller le taux d’erreur. Ici, nous décrivons un flux de travail pour surveiller le taux d’erreur du séquenceur de nanopore. Cela peut être utile après la libération d’une nouvelle cellule de débit, ou si de nouvelles versions de l’appel de base sont libérés. Cependant, cela peut également être utile pour les utilisateurs qui souhaitent configurer et valider leur propre protocole de séquençage.
Différents logiciels et outils d’alignement peuvent donner des résultats différents33. Dans ce manuscrit, nous avons cherché à utiliser des progiciels librement disponibles qui sont couramment utilisés, et qui ont une documentation claire. Dans certains cas, la préférence peut être accordée aux outils commerciaux, qui ont généralement des interfaces plus conviviales, mais doivent être payés. À l’avenir, cette méthode peut être appliquée au même échantillon au cas où de grandes modifications dans la technologie de séquence ou de basecalling sont introduites De préférence cela devrait être fait après chaque mise à jour du point de base ou flowcell, mais étant donné la vitesse des développements actuels, cela peut également être fait seulement après des mises à jour majeures.
La réduction du taux d’erreur dans le séquençage permet de multiples échantillons. Par conséquent, le séquençage des nanopores se rapproche du remplacement des RPC en temps réel conventionnels pour les essais diagnostiques, ce qui est déjà le cas pour le diagnostic du virus de la grippe. En outre, la réduction du taux d’erreur augmente la facilité d’utilisation de cette technique de séquençage, par exemple pour la détermination de variantes mineures et pour le séquençage métagénomique impartial à haut débit.
Une étape critique du protocole est que des séquences de référence étroites et fiables doivent être disponibles. Les amorces sont basées sur les connaissances actuelles sur la diversité des virus et pourraient avoir besoin d’être mis à jour de temps en temps. Un autre point critique lors de la mise en place d’une approche de séquençage à base d’amplicon est l’équilibre de la concentration d’apprêt pour obtenir un équilibre égal dans la profondeur amplicon. Cela permet le multiplexe d’un plus grand nombre d’échantillons sur une séquence exécutée et entraîne une réduction significative des coûts.
The authors have nothing to disclose.
Ce travail a reçu un financement du programme de recherche et d’innovation Horizon 2020 de l’Union européenne dans le cadre de l’accord de subvention no 643476 (COMPARE).
Agencourt AMPure XP beads | Beckman Coulter | A63881 | |
dNTPs | Qiagen | 201900 | |
FLO-MIN106 R10 flowcell | Nanopore | R10 flowcell | |
KAPA Hyperplus libarary preparation kit | Roche | 7962436001 | |
Library Loading Bead Kit | Nanopore | EXP-LLB001 | |
Ligation Sequencing Kit 1D | Nanopore | SQK-LSK109 | |
Native Barcoding Kit 1D 1-12 | Nanopore | EXP-NBD103 | |
Native Barcoding Kit 1D 13-24 | Nanopore | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | NEB | M0367S | |
NEB Next Quick Ligation Module | NEB | E6056 | |
NEB Next Ultra II End Repair / dA-Tailing Module | NEB | E7546S | |
Protoscript II Reverse Transcriptase | NEB | M0368X | |
Q5 High-Fidelity polymerase | NEB | M0491 | |
Qubit dsDNA HS Assay kit | Thermo Fisher | Q32851 | |
Random Primers | Promega | C1181 | |
RNAsin Ribonuclease Inhibitor | Promega | N2111 |