Este protocolo detalha uma abordagem abrangente para a montagem de um genoma híbrido de bactérias urinárias. Fornece um procedimento reprodutível para a geração de sequências completas de genomas circulares úteis no estudo de elementos genéticos cromossômicos e extracromosômicos que contribuem para a colonização urinária, patogênese e disseminação de resistência antimicrobiana.
Sequências completas de genomas fornecem dados valiosos para a compreensão da diversidade genética e fatores de colonização únicos de micróbios urinários. Esses dados podem incluir elementos genéticos móveis, como plasmídeos e fágio extracromosomal, que contribuem para a disseminação da resistência antimicrobiana e complicam ainda mais o tratamento da infecção do trato urinário (ITU). Além de fornecer uma boa resolução da estrutura do genoma, genomas completos e fechados permitem a genômica comparativa detalhada e análises evolutivas. A geração de genomas completos de novo tem sido uma tarefa desafiadora devido às limitações da tecnologia de sequenciamento disponível. O Sequenciamento de Próxima Geração (NGS) de ponta emparelhada produz leituras curtas de alta qualidade, muitas vezes resultando em conjuntos precisos, mas fragmentados de genomas. Pelo contrário, o sequenciamento de Nanopore fornece leituras longas de menor qualidade normalmente levando a conjuntos completos propensos a erros. Tais erros podem dificultar estudos de associação em todo o genoma ou fornecer resultados enganosos de análise de variantes. Portanto, abordagens híbridas que combinam leituras curtas e longas surgiram como métodos confiáveis para alcançar genomas bacterianos fechados altamente precisos. Relatado aqui é um método abrangente para a cultura de diversas bactérias urinárias, identificação de espécies por sequenciamento genético 16S rRNA, extração de DNA genômico (gDNA), e geração de leituras curtas e longas por plataformas NGS e Nanopore, respectivamente. Além disso, este método descreve um pipeline bioinforático de algoritmos de controle de qualidade, montagem e previsão genética para a geração de sequências completas de genoma anotadas. A combinação de ferramentas bioinformáticas permite a seleção de dados de leitura de alta qualidade para montagem de genoma híbrido e análise a jusante. A abordagem simplificada para o conjunto híbrido de novo genoma descrito neste protocolo pode ser adaptada para uso em qualquer bactéria cultural.
O microbioma urinário é uma área emergente de pesquisa que destruiu um equívoco de décadas de que o trato urinário é estéril em indivíduos saudáveis. Os membros da microbiota urinária podem servir para equilibrar o ambiente urinário e prevenir a infecção do trato urinário (ITU)1,2. Bactérias uropatômicas invadem o trato urinário e empregam diversos mecanismos de virulência para deslocar a microbiota residente, colonizar o urotélio, evitar respostas imunológicas e neutralizar pressões ambientais3,4. A urina é um meio relativamente limitado por nutrientes caracterizado por alta osmolaridade, disponibilidade limitada de nitrogênio e carboidratos, baixa oxigenação e baixo pH5,6,7. A urina também é considerada antimicrobiana, composta de altas concentrações de ureia inibitória e peptídeos antimicrobianos, como o cathelicidina humano LL-378. Investigar mecanismos empregados tanto por bactérias residentes quanto por uropatógenos para colonizar o trato urinário é fundamental para entender melhor a saúde do trato urinário e desenvolver novas estratégias para o tratamento da ITU. Além disso, à medida que a falha das terapias antimicrobianas de linha de frente se torna mais comum, é cada vez mais importante monitorar a disseminação de elementos genéticos móveis que carregam determinantes de resistência antimicrobiana dentro de populações de bactérias urinárias9,10.
Para investigar genótipos e fenótipos de bactérias urinárias, sua cultura bem sucedida e sequenciamento de genomas inteiros subsequentes (WGS) é imperativo. Métodos dependentes da cultura são necessários para detectar e identificar micróbios viáveis em amostras de urina11. A cultura clínica de urina padrão envolve a criação de urina em 5% de ágar de sangue de ovelha (BAP) e ágar MacConkey e incubação aerobicamente a 35 °C por 24 h12. No entanto, com um limiar de detecção de≥10 5 CFU/mL13, muitos membros da microbiota urinária não são relatados por este método. Técnicas aprimoradas de cultivo, como a Cultura Quantitativa Aprimorada da Urina (EQUC)11 empregam várias combinações de diferentes volumes de urina, tempos de incubação, mídia cultural e condições atmosféricas para identificar micróbios comumente perdidos pela cultura de urina padrão. Descrito neste protocolo é uma versão modificada do EQUC, denominada aqui protocolo Modified Enhanced Urine Culture, que permite a cultivo de diversas bactérias urinárias e uropatógenos usando mídia seletiva e condições atmosféricas ideais, mas não é inerentemente quantitativo. O isolamento bem sucedido das bactérias urinárias permite a extração de DNA genômico (gDNA) para WGS a jusante e montagem de genoma.
Montagens de genomas, conjuntos completos em particular, permitem a descoberta de fatores genéticos que podem contribuir para a colonização, manutenção de nicho e virulência entre as microbiotas residentes e as bactérias uropatogênicas. Os conjuntos de genomas de rascunho contêm um número diversificado de sequências conguosas (contigs) que podem conter erros de sequenciamento e falta de informações de orientação. Em um conjunto completo do genoma, tanto a orientação quanto a precisão de cada par de base foram verificadas14. Além disso, a obtenção de sequências completas de genomas fornece uma visão da estrutura do genoma, da diversidade genética e dos elementos genéticosmóveis 15. Leituras curtas por si só podem identificar a presença ou ausência de genes importantes, mas podem não identificar seu contexto genômico16. Com a habilitação de tecnologias de sequenciamento de leitura longa, como Oxford Nanopore e PacBio, gerar conjuntos fechados de novos genomas bacterianos não requer mais métodos extenuantes, como o fechamento manual de novos conjuntos pelo multiplex PCR17,18. A combinação de tecnologias de sequenciamento de leitura curta da Próxima Geração e nanopore de sequenciamento de longa leitura permite a geração fácil de conjuntos precisos, completos e fechados de genoma bacteriano a custos relativamente baixos19. Sequenciamento de leitura curta produz conjuntos precisos e fragmentados de genoma geralmente consistindo de uma média de 40-100 contigs, enquanto o sequenciamento de nanoporo gera leituras longas de cerca de 5-100 kb de comprimento que são menos precisas, mas podem servir como andaimes para se juntar a contigs e resolver a sintensia genômica. Abordagens híbridas utilizando tecnologias de leitura curta e longa podem produzir genomas bacterianos precisos e completos19.
Descrito aqui é um protocolo abrangente para o isolamento e identificação de bactérias da urina humana, extração genômica de DNA, sequenciamento e montagem completa do genoma usando uma abordagem híbrida de montagem. Este protocolo fornece uma ênfase especial nas etapas necessárias para modificar adequadamente as leituras geradas pelo sequenciamento de leitura curta e longa leitura para a montagem precisa de um cromossomo bacteriano fechado e elementos extracromosomais, como plasmídeos.
O protocolo abrangente de montagem de genomas híbridos descrito aqui oferece uma abordagem simplificada para a cultura bem sucedida de diversas microbiota urinária e uropatógenos, e a montagem completa de seus genomas. O sucesso do WGS de genomas bacterianos começa com o isolamento de micróbios diversos e às vezes exigentes, a fim de extrair seu DNA genômico. Até o momento, os protocolos de cultura urinária existentes ou não têm a sensibilidade necessária para detectar muitas espécies urinárias ou envolvem abordagens longas e extensas que requerem tempo e recursos prolongados11. A abordagem modificativa da cultura da urina aprimorada descrita oferece um protocolo simplificado, mas abrangente, para o isolamento bem-sucedido de bactérias pertencentes a 17 gêneros urinários comuns, incluindo espécies commensais potencialmente patogênicas ou benéficas, e bactérias aeróbicas ou aeróbicas facultativas e obrigatórias. Isso, por sua vez, fornece o material inicial necessário para sequenciamento preciso e montagem de genomas bacterianos e para experimentos fenotípicos críticos, que contribuem para a compreensão da saúde urinária e da doença. Além disso, essa abordagem cultural modificada prevê um diagnóstico clínico mais definido de microrganismos viáveis encontrados em amostras de urina e permite seu biobanco para futuros estudos genômicos. No entanto, este protocolo não é sem limitações. Pode exigir longos tempos de incubação, dependendo do organismo, bem como do uso de recursos como uma câmara de hipóxia ou incubadoras controladas que podem não estar prontamente disponíveis. O uso de GasPaks anaeróbicos oferece uma solução alternativa, mas estes são caros e nem sempre produzem um ambiente sustentado e controlado. Finalmente, o viés cultural, bem como a diversidade de amostras podem permitir que organismos particulares e uropatógenos superem as bactérias exigentes. Apesar dessas limitações, uma cultura de diversas bactérias urinárias é possível por essa abordagem.
O sequenciamento genômico ganhou popularidade com o avanço das tecnologias de Sequenciamento de Próxima Geração, que aumentaram tremendamente o rendimento e a precisão dos dados de sequenciamento14,15. Juntamente com o desenvolvimento de algoritmos para processamento de dados e montagem de novo, sequências completas de genomas estão na ponta dos dedos de cientistas novatos e especialistasapenas 15,45. O conhecimento da organização geral do genoma fornecida por genomas completos oferece importantes insights evolutivos e biológicos, incluindo duplicação genética, perda genética e transferência horizontal de genes14. Além disso, genes importantes para a resistência antimicrobiana e virulência são frequentemente localizados em elementos móveis, que normalmente não são resolvidos nos conjuntos degenomas 15,16.
O protocolo aqui segue uma abordagem híbrida para a combinação de dados de sequenciamento de plataformas de leitura curta e longa leitura para gerar conjuntos completos de genomas. Embora focado em genomas bacterianos urinários, este procedimento pode ser adaptado a diversas bactérias de várias fontes de isolamento. As etapas críticas nesta abordagem incluem seguir a técnica estéril adequada e utilizar condições adequadas de mídia e cultura para o isolamento de bactérias urinárias puras. Além disso, a extração de gDNA intacto e de alto rendimento é essencial para gerar dados de sequenciamento livres de leituras contaminantes que podem dificultar o sucesso da montagem. Os protocolos subsequentes de preparação da biblioteca são fundamentais para a geração de leituras de qualidade de comprimento e profundidade suficientes. Portanto, é de total importância lidar com gDNA com cuidado durante a preparação da biblioteca para sequenciamento de leitura longa em particular, já que o maior benefício desta tecnologia é a geração de leituras longas sem limite teórico de comprimento superior. Também estão delineadas seções para o controle de qualidade apropriado (QC) de leituras de sequenciamento que eliminam dados barulhentos e melhoram o resultado da montagem.
Apesar do sucesso do isolamento do DNA, da preparação da biblioteca e do sequenciamento, a natureza da arquitetura genômica de algumas espécies ainda pode fornecer um obstáculo para a geração de um conjunto de genomasfechados 45,46. Sequências repetitivas muitas vezes complicam a computação de montagem e, apesar dos dados de leitura longa, essas regiões podem ser resolvidas com baixa confiança, ou não. As leituras longas, portanto, devem ser, em média, mais longas do que a maior região de repetição do genoma ou a cobertura deve ser alta (>100x)19. Alguns genomas podem permanecer incompletos e requerem abordagens manuais para conclusão. No entanto, genomas incompletos montados em híbridos são tipicamente compostos de menos contigs do que genomas de rascunho de leitura curta. Ajustar os parâmetros padrão do algoritmo de montagem ou seguir cortes mais rigorosos para ler QC pode ajudar. Alternativamente, uma abordagem sugerida é mapear leituras longas para as regiões incompletas em busca de evidências para o caminho de montagem mais provável e, em seguida, confirmar o caminho utilizando pcr e sequenciamento Sanger da região amplificada. O mapeamento de leituras usando o Minimap2 é sugerido e o Bandge oferece uma ferramenta útil para a visualização de leituras mapeadas ao longo de contigas montadas fornecendo evidências para a ligação de contig47.
Um desafio adicional para gerar genomas completos está na familiaridade e conforto com ferramentas de linha de comando. Muitas ferramentas bioinformáticas são desenvolvidas para oferecer oportunidades computacionais a qualquer usuário; no entanto, sua utilização depende de um entendimento com o básico da UNIX e programação. Este protocolo visa fornecer instruções suficientemente detalhadas para permitir que indivíduos sem experiência prévia de linha de comando gerem conjuntos de genomas fechados e as anotem.
The authors have nothing to disclose.
Agradecemos ao Dr. Moutusee Jubaida Islam e ao Dr. Luke Joyce por suas contribuições para este protocolo. Também gostaríamos de reconhecer a Universidade do Texas no Centro de Genoma de Dallas por seu feedback e apoio. Este trabalho foi financiado pela Fundação Welch, número do prêmio AT-2030-2020401 para n.J.D., pelos Institutos Nacionais de Saúde, prêmio número R01AI11610 para K.P., e pela Felecia e John Cain Chair in Women’s Health, realizada pela P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |