Anteriormente validamos un protocolo para la secuenciación del virus Usutu (USUV) del genoma completo basado en amplificación en una plataforma de secuenciación de nanoporos. Aquí, describimos los métodos utilizados con más detalle y determinamos la tasa de error de la celda de flujo rincrónico R10.
La secuenciación del genoma completo se puede utilizar para caracterizar y rastrear brotes virales. Se han descrito protocolos de secuenciación del genoma completo basados en nanoporos para varios virus diferentes. Estos enfoques utilizan un enfoque basado en amplificación superpuesto que se puede utilizar para atacar un virus o grupo específico de virus genéticamente relacionados. Además de la confirmación de la presencia del virus, la secuenciación puede utilizarse para estudios de epidemiología genómica, para rastrear virus y desentrañar orígenes, reservorios y modos de transmisión. Para este tipo de aplicaciones, es crucial comprender los posibles efectos de la tasa de error asociada con la plataforma utilizada. La aplicación rutinaria en entornos clínicos y de salud pública requiere que esto se documente con cada cambio importante en el protocolo. Anteriormente, se validó un protocolo para la secuenciación del virus Usutu genómico completo en la plataforma de secuenciación de nanoporos (R9.4 flowcell) mediante comparación directa con la secuenciación de Illumina. Aquí, describimos el método utilizado para determinar la cobertura de lectura requerida, utilizando la comparación entre la celda de flujo R10 y la secuenciación de Illumina como ejemplo.
La rápida evolución de las tecnologías de secuencia de tercera generación nos permite avanzar hacia la secuenciación casi en tiempo real durante los brotes virales. Esta disponibilidad oportuna de información genética puede ser útil para determinar el origen y la evolución de los patógenos virales. Los estándares de oro en los campos de la secuenciación de próxima generación, sin embargo, siguen siendo los secuenciadores de segunda generación. Estas técnicas se basan en técnicas específicas y que consumen mucho tiempo, como la amplificación clonal durante una PCR de emulsión o una amplificación de puente clonal. Los secuenciadores de tercera generación son más baratos, portátiles y vienen con metodologías simplificadas de preparación de bibliotecas. Especialmente el pequeño tamaño del dispositivo de secuencia y el bajo precio de compra lo convierten en un candidato interesante para la secuenciación desplegable y en un campo. Esto podría, por ejemplo, verse durante el brote del virus del Ebola en Sierra Leona y durante las investigaciones en curso sobre el brote de arbovirus en Brasil1,2,3. Sin embargo, la alta tasa de error4 notificada podría limitar las aplicaciones para las que se puede utilizar la secuenciación de nanoporos.
La secuenciación de nanoporos está evolucionando rápidamente. Los nuevos productos están disponibles en el mercado de forma regular. Ejemplos de esto son, por ejemplo, los kits cuadrados 1D que permiten la secuenciación de ambas hebras de la molécula de ADN, aumentando así la precisión de las bases llamadas5 y el desarrollo de la célula de flujo R10 que mide el cambio en la corriente en dos casos diferentes en el poro6. Además, las herramientas bioinformáticas mejoradas, como las mejoras en las llamadas de base, mejorarán la precisión de la llamada base7. Uno de los que llaman base más utilizados (por ejemplo, Albacore), se ha actualizado al menos 12 veces en un período de 9 meses5. Recientemente, el fabricante también lanzó un novedoso llamador base llamado flip-flop, que se implementa en el software de nanoporos predeterminado8. Juntos, todas estas mejoras conducirán a secuencias más precisas y disminuirán la tasa de error del secuenciador de nanoporos.
El virus Usutu (USUV) es un arbovirus transmitido por mosquitos de la familia Flaviviridae y tiene un genoma de ARN de cadena positiva de alrededor de 11.000 nucleótidos. EL USUV afecta principalmente a los grandes búhos grises y mirlos99,10, aunque otras especies de aves también son susceptibles a la infección por USUV11. Recientemente, USUV también fue identificado en roedores y musarañas, aunque su papel potencial en la transmisión del virus sigue siendo desconocido12. En humanos, se han descrito infecciones asintomáticas en donantes de sangre13,14,15,16 mientras que las infecciones de USUV también se han divulgado para estar asociadas con encefalitis o meningo-encefalitis17,18. En los Países Bajos, USUV se detectó por primera vez en aves silvestres en 201610 y en donantes de sangre asintomática en 201814. Desde la detección inicial de USUV, se han notificado brotes durante los años siguientes y la vigilancia, incluida la secuenciación del genoma completo, está actualmente en curso para controlar la emerger y propagar un arbovirus en una población previamente ingenua.
Similar a lo que se ha descrito para otros virus, tales como el virus del Ebola, el virus del Zika y el virus de la fiebre amarilla3,19,20, hemos desarrollado un conjunto de imprimación para secuenciar toda la longitud USUV21. Este enfoque basado en la reacción en cadena de la polimerasa (PCR) permite la recuperación de genomas USUV de longitud completa a partir de tipos de muestras altamente contaminadas por el huésped, como muestras cerebrales en muestras de hasta un valor Ct de alrededor de 32. Los beneficios de un enfoque de secuenciación basado en amplificación son una mayor sensibilidad en comparación con la secuenciación metagenómica y una mayor especificidad. Las limitaciones del uso de un enfoque basado en el amplificador son que las secuencias deben ser similares con el fin de diseñar imprimaciones que se ajusten a todas las cepas y que las imprimaciones están diseñadas sobre nuestro conocimiento actual sobre la diversidad de virus.
Dados los constantes desarrollos y mejoras en la secuenciación de tercera generación, es necesario evaluar la tasa de error del secuenciador de forma regular. Aquí, describimos un método para evaluar el rendimiento de nanoporos directamente contra la secuenciación de Illumina utilizando USUV como ejemplo. Este método se aplica a las secuencias generadas con la última celda de flujo R10 y la llamada base se realiza con la última versión del llamador base flip-flop.
La secuenciación de nanoporos está en constante evolución y, por lo tanto, es necesario realizar métodos para controlar la tasa de error. Aquí, describimos un flujo de trabajo para monitorear la tasa de error del secuenciador de nanoporos. Esto puede ser útil después del lanzamiento de una nueva celda de flujo, o si se liberan nuevas versiones de la llamada base. Sin embargo, esto también puede ser útil para los usuarios que desean configurar y validar su propio protocolo de secuenciación.
Diferentes herramientas de software y alineación pueden producir diferentes resultados33. En este manuscrito, nuestro objetivo era utilizar paquetes de software de libre disposición que se utilizan comúnmente, y que tienen documentación clara. En algunos casos, se puede dar preferencia a las herramientas comerciales, que generalmente tienen interfaces más fáciles de usar, pero tienen que ser pagadas. En el futuro, este método se puede aplicar a la misma muestra en caso de que se introduzcan grandes modificaciones en la tecnología de secuencia o software de llamada base Preferentemente esto debe hacerse después de cada actualización del llamador base o flowcell, sin embargo, dada la velocidad de los desarrollos actuales, esto también se puede hacer sólo después de las actualizaciones importantes.
La reducción de la tasa de error en la secuenciación permite multiplexar un mayor número de muestras. De este modo, la secuenciación de nanoporos está cada vez más cerca de sustituir los ITP convencionales en tiempo real por ensayos de diagnóstico, lo que ya es el caso del diagnóstico del virus de la gripe. Además, la reducción de la tasa de error aumenta la usabilidad de esta secuenciación técnica, por ejemplo para la determinación de variantes menores y para la secuenciación metagenómica imparcial de alto rendimiento.
Un paso crítico en el protocolo es que las secuencias de referencia cercanas y confiables deben estar disponibles. Los imprimadores se basan en el conocimiento actual sobre la diversidad de virus y es posible que deba actualizarse de vez en cuando. Otro punto crítico al configurar un enfoque de secuenciación basado en amplificación es el equilibrio de la concentración de imprimación para obtener un equilibrio uniforme en profundidad de amplificación. Esto permite la multiplexación de más muestras en una ejecución de secuencia y da como resultado una reducción significativa de costos.
The authors have nothing to disclose.
Este trabajo ha recibido financiación del programa de investigación e innovación Horizonte 2020 de la Unión Europea en virtud del acuerdo de subvención No 643476 (COMPARE).
Agencourt AMPure XP beads | Beckman Coulter | A63881 | |
dNTPs | Qiagen | 201900 | |
FLO-MIN106 R10 flowcell | Nanopore | R10 flowcell | |
KAPA Hyperplus libarary preparation kit | Roche | 7962436001 | |
Library Loading Bead Kit | Nanopore | EXP-LLB001 | |
Ligation Sequencing Kit 1D | Nanopore | SQK-LSK109 | |
Native Barcoding Kit 1D 1-12 | Nanopore | EXP-NBD103 | |
Native Barcoding Kit 1D 13-24 | Nanopore | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | NEB | M0367S | |
NEB Next Quick Ligation Module | NEB | E6056 | |
NEB Next Ultra II End Repair / dA-Tailing Module | NEB | E7546S | |
Protoscript II Reverse Transcriptase | NEB | M0368X | |
Q5 High-Fidelity polymerase | NEB | M0491 | |
Qubit dsDNA HS Assay kit | Thermo Fisher | Q32851 | |
Random Primers | Promega | C1181 | |
RNAsin Ribonuclease Inhibitor | Promega | N2111 |