Este protocolo detalla un enfoque integral para el cultivo, la secuenciación y el ensamblaje del genoma híbrido de novo de las bacterias urinarias. Proporciona un procedimiento reproducible para la generación de secuencias completas y circulares del genoma útiles en el estudio de elementos genéticos cromosómicos y extracromosómicos que contribuyen a la colonización urinaria, la patogénesis y la diseminación de la resistencia a los antimicrobianos.
Las secuencias completas del genoma proporcionan datos valiosos para la comprensión de la diversidad genética y los factores únicos de colonización de los microbios urinarios. Estos datos pueden incluir elementos genéticos móviles, como plásmidos y fagos extracromosómicos, que contribuyen a la diseminación de la resistencia a los antimicrobianos y complican aún más el tratamiento de la infección del tracto urinario (ITU). Además de proporcionar una resolución fina de la estructura del genoma, los genomas completos y cerrados permiten la genómica comparativa detallada y los análisis evolutivos. La generación de genomas completos de novo ha sido durante mucho tiempo una tarea desafiante debido a las limitaciones de la tecnología de secuenciación disponible. La secuenciación de próxima generación (NGS) de extremo pareado produce lecturas cortas de alta calidad que a menudo resultan en ensamblajes de genoma precisos pero fragmentados. Por el contrario, la secuenciación de nanoporos proporciona lecturas largas de menor calidad que normalmente conducen a ensamblajes completos propensos a errores. Tales errores pueden obstaculizar los estudios de asociación de todo el genoma o proporcionar resultados engañosos del análisis de variantes. Por lo tanto, los enfoques híbridos que combinan lecturas cortas y largas han surgido como métodos confiables para lograr genomas bacterianos cerrados altamente precisos. Aquí se informa un método integral para el cultivo de diversas bacterias urinarias, la identificación de especies mediante la secuenciación del gen 16S rRNA, la extracción de ADN genómico (gDNA) y la generación de lecturas cortas y largas por las plataformas NGS y Nanopore, respectivamente. Además, este método describe una línea bioinformática de algoritmos de control de calidad, ensamblaje y predicción de genes para la generación de secuencias completas del genoma anotadas. La combinación de herramientas bioinformáticas permite la selección de datos de lectura de alta calidad para el ensamblaje del genoma híbrido y el análisis posterior. El enfoque simplificado para el ensamblaje del genoma híbrido de novo descrito en este protocolo puede adaptarse para su uso en cualquier bacteria cultivable.
El microbioma urinario es un área emergente de investigación que ha roto una idea errónea de décadas de que el tracto urinario es estéril en individuos sanos. Los miembros de la microbiota urinaria pueden servir para equilibrar el ambiente urinario y prevenir la infección del tracto urinario (ITU)1,2. Las bacterias uropatógenas invaden el tracto urinario y emplean diversos mecanismos de virulencia para desplazar la microbiota residente, colonizar el urotelio, evadir las respuestas inmunes y contrarrestar las presiones ambientales3,4. La orina es un medio relativamente limitado en nutrientes caracterizado por una alta osmolaridad, disponibilidad limitada de nitrógeno y carbohidratos, baja oxigenación y bajo pH5,6,7. La orina también se considera antimicrobiana, compuesta de altas concentraciones de urea inhibitoria y péptidos antimicrobianos como la catelicidina humana LL-378. La investigación de los mecanismos empleados tanto por las bacterias residentes como por los uropatógenos para colonizar el tracto urinario es fundamental para comprender mejor la salud del tracto urinario y desarrollar nuevas estrategias para el tratamiento de las infecciones urinarias. Además, a medida que el fracaso de las terapias antimicrobianas de primera línea se vuelve más común, es cada vez más importante monitorear la diseminación de elementos genéticos móviles portadores de determinantes de resistencia a los antimicrobianos dentro de las poblaciones de bacterias urinarias9,10.
Para investigar los genotipos y fenotipos de las bacterias urinarias, es imperativo su cultivo exitoso y la posterior secuenciación del genoma completo (WGS). Los métodos dependientes del cultivo son necesarios para detectar e identificar microbios viables en muestras de orina11. El cultivo clínico de orina estándar consiste en enchapar la orina en agar de sangre de oveja al 5% (BAP) y agar MacConkey e incubar aeróbicamente a 35 ° C durante 24 h12. Sin embargo, con un umbral de detección de ≥105 UFC/ml13,muchos miembros de la microbiota urinaria no se informan por este método. Las técnicas de cultivo mejoradas, como el cultivo cuantitativo mejorado de orina (EQUC)11, emplean varias combinaciones de diferentes volúmenes de orina, tiempos de incubación, medios de cultivo y condiciones atmosféricas para identificar microbios que comúnmente se omiten en el cultivo de orina estándar. Descrito en este protocolo es una versión modificada de EQUC, denominado aquí protocolo de cultivo de orina mejorado modificado, que permite el cultivo de diversas bacterias urinarias y uropatógenos utilizando medios selectivos y condiciones atmosféricas óptimas, pero no es inherentemente cuantitativo. El aislamiento exitoso de bacterias urinarias permite la extracción de ADN genómico (gDNA) para el WGS aguas abajo y el ensamblaje del genoma.
Los ensamblajes de genomas, ensamblajes completos en particular, permiten el descubrimiento de factores genéticos que pueden contribuir a la colonización, el mantenimiento del nicho y la virulencia tanto entre la microbiota residente como entre las bacterias uropatógenas. Los ensamblajes de genoma preliminares contienen un número diverso de secuencias contiguas (contigs) que pueden contener errores de secuenciación y carecen de información de orientación. En un ensamblaje completo del genoma, se ha verificado tanto la orientación como la precisión de cada par de bases14. Además, la obtención de secuencias completas del genoma proporciona información sobre la estructura del genoma, la diversidad genética y los elementos genéticos móviles15. Las lecturas cortas por sí solas pueden identificar la presencia o ausencia de genes importantes, pero pueden no identificar su contexto genómico16. Con tecnologías de secuenciación de lectura larga como Oxford Nanopore y PacBio, la generación de ensamblajes cerrados de novo de genomas bacterianos ya no requiere métodos extenuantes como el cierre manual de ensamblajes de novo mediante PCR multiplex17,18. La combinación de las tecnologías de secuenciación de lectura corta de próxima generación y secuenciación de lectura larga nanoporos permite la generación fácil de ensamblajes de genomas bacterianos precisos, completos y cerrados a costos relativamente bajos19. La secuenciación de lectura corta produce ensamblajes de genoma precisos pero fragmentados que generalmente consisten en un promedio de 40-100 contigs, mientras que la secuenciación de nanoporos genera lecturas largas de aproximadamente 5-100 kb de longitud que son menos precisas pero pueden servir como andamios para unir contigs y resolver la sintenia genómica. Los enfoques híbridos que utilizan tecnologías de lectura corta y larga pueden producir genomas bacterianos precisos y completos19.
Aquí se describe un protocolo integral para el aislamiento e identificación de bacterias de la orina humana, la extracción de ADN genómico, la secuenciación y el ensamblaje completo del genoma utilizando un enfoque de ensamblaje híbrido. Este protocolo proporciona un énfasis especial en los pasos necesarios para modificar adecuadamente las lecturas generadas por la secuenciación de lectura corta y larga para el ensamblaje preciso de un cromosoma bacteriano cerrado y elementos extracromosómicos como los plásmidos.
El protocolo integral de ensamblaje del genoma híbrido descrito aquí ofrece un enfoque simplificado para el cultivo exitoso de diversa microbiota urinaria y uropatógenos, y el ensamblaje completo de sus genomas. El WGS exitoso de genomas bacterianos comienza con el aislamiento de microbios diversos y, a veces, fastidiosos para extraer su ADN genómico. Hasta la fecha, los protocolos de urocultivo existentes carecen de la sensibilidad necesaria para detectar muchas especies urinarias o implican enfoques largos y extensos que requieren tiempo y recursos prolongados11. El enfoque de cultivo de orina mejorado modificado descrito ofrece un protocolo simplificado pero completo para el aislamiento exitoso de bacterias pertenecientes a 17 géneros urinarios comunes, incluidas especies comensales potencialmente patógenas o beneficiosas, y bacterias aeróbicas o anaeróbicas facultativas y obligadas. Esto, a su vez, proporciona el material de partida necesario para la secuenciación y el ensamblaje precisos de los genomas bacterianos y para experimentos fenotípicos críticos, que contribuyen a la comprensión de la salud y la enfermedad urinaria. Además, este enfoque de cultivo modificado proporciona un diagnóstico clínico más definido de los microorganismos viables que se encuentran en las muestras de orina y permite su biobanco para futuros estudios genómicos. Sin embargo, este protocolo no está exento de limitaciones. Puede requerir largos tiempos de incubación dependiendo del organismo, así como el uso de recursos como una cámara de hipoxia o incubadoras controladas que pueden no estar fácilmente disponibles. El uso de GasPaks anaeróbicos ofrece una solución alternativa, pero estos son costosos y no siempre producen un ambiente sostenido y controlado. Finalmente, el sesgo de cultivo, así como la diversidad de muestras, pueden permitir que organismos y uropatógenos particulares superen a las bacterias fastidiosas. A pesar de estas limitaciones, este enfoque hace posible un cultivo de diversas bacterias urinarias.
La secuenciación genómica ha ganado popularidad con el avance de las tecnologías de secuenciación de próxima generación que aumentaron enormemente tanto el rendimiento como la precisión de los datos de secuenciación14,15. Junto con el desarrollo de algoritmos para el procesamiento de datos y el ensamblaje de novo, las secuencias completas del genoma están al alcance de los científicos novatos y expertos por igual15,45. El conocimiento de la organización general del genoma proporcionado por los genomas completos ofrece importantes conocimientos evolutivos y biológicos, incluida la duplicación de genes, la pérdida de genes y la transferencia horizontal degenes 14. Además, los genes importantes para la resistencia a los antimicrobianos y la virulencia a menudo se localizan en elementos móviles, que generalmente no se resuelven en borradores de ensamblajes del genoma15,16.
El protocolo aquí sigue un enfoque híbrido para la combinación de datos de secuenciación de plataformas de lectura corta y larga para generar ensamblajes completos del genoma. Si bien se centra en los genomas bacterianos urinarios, este procedimiento puede adaptarse a diversas bacterias de diversas fuentes de aislamiento. Los pasos críticos en este enfoque incluyen seguir una técnica estéril adecuada y utilizar los medios y las condiciones de cultivo apropiados para el aislamiento de bacterias urinarias puras. Además, la extracción de gDNA intacto y de alto rendimiento es esencial para generar datos de secuenciación libres de lecturas contaminantes que puedan obstaculizar el éxito del ensamblaje. Los protocolos posteriores de preparación de bibliotecas son críticos para la generación de lecturas de calidad de suficiente longitud y profundidad. Por lo tanto, es de suma importancia manejar el gDNA con cuidado durante la preparación de la biblioteca para la secuenciación de lectura larga en particular, ya que el mayor beneficio de esta tecnología es la generación de lecturas largas sin límite teórico de longitud superior. También se describen secciones para el control de calidad (QC) apropiado de las lecturas de secuenciación que elimina los datos ruidosos y mejora el resultado del ensamblaje.
A pesar del aislamiento exitoso del ADN, la preparación de la biblioteca y la secuenciación, la naturaleza de la arquitectura genómica de algunas especies aún puede proporcionar un obstáculo para la generación de un ensamblaje de genoma cerrado45,46. Las secuencias repetitivas a menudo complican el cálculo del ensamblaje y, a pesar de los datos de lectura larga, estas regiones pueden resolverse con poca confianza o no resolverse en absoluto. Por lo tanto, las lecturas largas deben ser en promedio más largas que la región de repetición más grande del genoma o la cobertura debe ser alta (>100x)19. Algunos genomas pueden permanecer incompletos y requieren enfoques manuales para su finalización. Sin embargo, los genomas incompletos ensamblados híbridos suelen estar compuestos de menos contigs que los genomas de borrador de lectura corta. Ajustar los parámetros predeterminados del algoritmo de ensamblaje o seguir cortes más estrictos para leer el control de calidad puede ayudar. Alternativamente, un enfoque sugerido es mapear lecturas largas a las regiones incompletas en busca de evidencia para la ruta de ensamblaje más probable, y luego confirmar la ruta utilizando la secuenciación de PCR y Sanger de la región amplificada. Se sugiere el mapeo de lecturas utilizando Minimap2 y Bandage ofrece una herramienta útil para la visualización de lecturas mapeadas a lo largo de contigs ensamblados que proporcionan evidencia de vinculación contig47.
Un desafío adicional para generar genomas completos radica en la familiaridad y la comodidad con las herramientas de línea de comandos. Muchas herramientas bioinformáticas se desarrollan para ofrecer oportunidades computacionales a cualquier usuario; sin embargo, su utilización se basa en una comprensión de los conceptos básicos de UNIX y la programación. Este protocolo tiene como objetivo proporcionar instrucciones suficientemente detalladas para permitir a las personas sin experiencia previa en la línea de comandos generar ensamblajes de genoma cerrado y anotarlos.
The authors have nothing to disclose.
Agradecemos al Dr. Moutusee Jubaida Islam y al Dr. Luke Joyce por sus contribuciones a este protocolo. También nos gustaría reconocer al Centro del Genoma de la Universidad de Texas en Dallas por sus comentarios y apoyo. Este trabajo fue financiado por la Fundación Welch, número de premio AT-2030-20200401 a N.J.D., por los Institutos Nacionales de Salud, número de premio R01AI116610 a K.P., y por la Cátedra Felecia y John Cain en Salud de la Mujer, en poder de P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |