Questo protocollo descrive un approccio completo per la coltura, il sequenziamento e l’assemblaggio del genoma ibrido de novo dei batteri urinari. Fornisce una procedura riproducibile per la generazione di sequenze genomiche circolari complete utili nello studio di elementi genetici sia cromosomici che extracromosomiali che contribuiscono alla colonizzazione urinaria, alla patogenesi e alla diffusione della resistenza antimicrobica.
Le sequenze complete del genoma forniscono dati preziosi per la comprensione della diversità genetica e dei fattori di colonizzazione unici dei microbi urinari. Questi dati possono includere elementi genetici mobili, come plasmidi e fagi extracromosomiali, che contribuiscono alla diffusione della resistenza antimicrobica e complicano ulteriormente il trattamento dell’infezione del tratto urinario (UTI). Oltre a fornire una risoluzione fine della struttura del genoma, i genomi completi e chiusi consentono la genomica comparativa dettagliata e le analisi evolutive. La generazione di genomi completi de novo è stata a lungo un compito impegnativo a causa delle limitazioni della tecnologia di sequenziamento disponibile. Il sequenziamento di nuova generazione (NGS) di alta qualità produce brevi letture di alta qualità, spesso con conseguenti assemblaggi di genoma accurati ma frammentati. Al contrario, il sequenziamento a nanopori fornisce lunghe letture di qualità inferiore che normalmente portano a assemblaggi completi soggetti a errori. Tali errori possono ostacolare gli studi di associazione a livello di genoma o fornire risultati fuorvianti dell’analisi delle varianti. Pertanto, gli approcci ibridi che combinano letture brevi e lunghe sono emersi come metodi affidabili per ottenere genomi batterici chiusi altamente accurati. Qui riportato è riportato un metodo completo per la coltura di diversi batteri urinari, l’identificazione delle specie mediante sequenziamento del gene rRNA 16S, l’estrazione del DNA genomico (gDNA) e la generazione di letture brevi e lunghe da piattaforme NGS e Nanopore, rispettivamente. Inoltre, questo metodo descrive una pipeline bioinformatica di algoritmi di controllo qualità, assemblaggio e previsione genica per la generazione di sequenze genomiche complete annotate. La combinazione di strumenti bioinformatici consente la selezione di dati di lettura di alta qualità per l’assemblaggio del genoma ibrido e l’analisi a valle. L’approccio semplificato per l’assemblaggio del genoma ibrido de novo descritto in questo protocollo può essere adattato per l’uso in qualsiasi batterio coltivabile.
Il microbioma urinario è un’area emergente di ricerca che ha frantumato un malinteso lungo decenni che il tratto urinario è sterile in individui sani. I membri del microbiota urinario possono servire a bilanciare l’ambiente urinario e prevenire l’infezione del tratto urinario (UTI)1,2. I batteri uropatogeni invadono le vie urinarie e impiegano diversi meccanismi di virulenza per spostare il microbiota residente, colonizzare l’urotelio, eludere le risposte immunitarie e contrastare le pressioni ambientali3,4. L’urina è un mezzo relativamente nutriente-limitato caratterizzato da alta osmolarità, limitata disponibilità di azoto e carboidrati, bassa ossigenazione e basso pH5,6,7. L’urina è anche considerata antimicrobica, composta da alte concentrazioni di urea inibitoria e peptidi antimicrobici come la catelicidina umana LL-378. Studiare i meccanismi impiegati sia dai batteri residenti che dagli uropatogeni per colonizzare il tratto urinario è fondamentale per comprendere ulteriormente la salute del tratto urinario e sviluppare nuove strategie per il trattamento delle UTI. Inoltre, poiché il fallimento delle terapie antimicrobiche di prima linea diventa più comune, è sempre più importante monitorare la diffusione di elementi genetici mobili portatori di determinanti di resistenza antimicrobica all’interno di popolazioni di batteri urinari9,10.
Per studiare genotipi e fenotipi di batteri urinari, la loro coltura di successo e il successivo sequenziamento dell’intero genoma (WGS) è imperativo. Sono necessari metodi dipendenti dalla coltura per rilevare e identificare microbi vitali nei campioni di urina11. La coltura clinica standard delle urine prevede la placcatura dell’urina sul 5% di agar di sangue di pecora (BAP) e l’agar MacConkey e l’incubazione aerobica a 35 °C per 24 ore12. Tuttavia, con una soglia di rilevazione di ≥105 CFU/mL13,molti membri del microbiota urinario non sono segnalati con questo metodo. Tecniche di coltivazione migliorate come Enhanced Quantitative Urine Culture (EQUC)11 impiegano varie combinazioni di diversi volumi di urina, tempi di incubazione, terreni di coltura e condizioni atmosferiche per identificare i microbi comunemente mancati dalla coltura delle urine standard. Descritto in questo protocollo è una versione modificata di EQUC, chiamato qui Modified Enhanced Urine Culture protocol, che consente la coltura di diversi batteri urinari e uropatogeni utilizzando mezzi selettivi e condizioni atmosferiche ottimali, ma non è intrinsecamente quantitativo. L’isolamento riuscito dei batteri urinari consente l’estrazione del DNA genomico (gDNA) per il WGS a valle e l’assemblaggio del genoma.
Gli assemblaggi del genoma, in particolare gli assemblaggi completi, consentono la scoperta di fattori genetici che possono contribuire alla colonizzazione, al mantenimento della nicchia e alla virulenza sia tra il microbiota residente che tra i batteri uropatogeni. Gli assemblaggi di genomi di bozza contengono un numero diversificato di sequenze contigue (contigs) che possono contenere errori di sequenziamento e mancano di informazioni sull’orientamento. In un assemblaggio completo del genoma, sia l’orientamento che l’accuratezza di ogni coppia di basi sono stati verificati14. Inoltre, ottenere sequenze genomiche complete fornisce informazioni sulla struttura del genoma, sulla diversità genetica e sugli elementi genetici mobili15. Brevi letture da sole possono identificare la presenza o l’assenza di geni importanti, ma potrebbero non individuare il loro contesto genomico16. Con l’abilitazione di tecnologie di sequenziamento a lunga lettura come Oxford Nanopore e PacBio, la generazione di assemblaggi de novo chiusi di genomi batterici non richiede più metodi faticosi come la chiusura manuale di assemblaggi de novo mediante multiplex PCR17,18. La combinazione di next generation short-read sequencing e nanopore long-read sequencing technologies consente la facile generazione di assemblaggi di genomi batterici accurati, completi e chiusi a costi relativamente bassi19. Il sequenziamento a lettura breve produce assemblaggi di genoma accurati ma frammentati generalmente costituiti da una media di 40-100 contig, mentre il sequenziamento nanoporo genera lunghe letture di circa 5-100 kb di lunghezza che sono meno accurate ma possono servire come impalcature per unire i contig e risolvere la sintenia genomica. Gli approcci ibridi che utilizzano tecnologie sia a lettura breve che a lettura lunga possono produrre genomi batterici accurati e completi19.
Qui è descritto un protocollo completo per l’isolamento e l’identificazione dei batteri dalle urine umane, l’estrazione del DNA genomico, il sequenziamento e l’assemblaggio completo del genoma utilizzando un approccio di assemblaggio ibrido. Questo protocollo fornisce un’enfasi particolare sui passaggi necessari per modificare correttamente le letture generate dal sequenziamento a lettura breve e a lunga lettura per l’assemblaggio accurato di un cromosoma batterico chiuso e di elementi extracromosomiali come i plasmidi.
Il protocollo completo di assemblaggio del genoma ibrido qui descritto offre un approccio semplificato per la coltura di successo di diversi microbiota urinari e uropatogeni e l’assemblaggio completo dei loro genomi. Il successo del WGS dei genomi batterici inizia con l’isolamento di microbi diversi e talvolta fastidiosi al fine di estrarre il loro DNA genomico. Ad oggi, i protocolli di coltura delle urine esistenti mancano della sensibilità necessaria per rilevare molte specie urinarie o comportano approcci lunghi ed estesi che richiedono tempo e risorse prolungati11. L’approccio Modified Enhanced Urine Culture descritto offre un protocollo semplificato ma completo per l’isolamento di successo di batteri appartenenti a 17 generi urinari comuni, comprese specie commensali potenzialmente patogene o benefiche e batteri aerobici o anaerobici sia facoltativi che obbligati. Questo a sua volta fornisce il materiale di partenza necessario per il sequenziamento accurato e l’assemblaggio di genomi batterici e per esperimenti fenotipici critici, che contribuiscono alla comprensione della salute e della malattia urinaria. Inoltre, questo approccio di coltura modificata fornisce una diagnosi clinica più definita dei microrganismi vitali trovati nei campioni di urina e consente il loro biobanking per futuri studi genomici. Tuttavia, questo protocollo non è privo di limitazioni. Può richiedere lunghi tempi di incubazione a seconda dell’organismo e l’uso di risorse come una camera di ipossia o incubatori controllati che potrebbero non essere prontamente disponibili. L’uso di GasPak anaerobici offre una soluzione alternativa, ma questi sono costosi e non sempre producono un ambiente sostenuto e controllato. Infine, il pregiudizio della coltura e la diversità del campione possono consentire a particolari organismi e uropatogeni di superare i batteri fastidiosi. Nonostante queste limitazioni, una coltura di diversi batteri urinari è resa possibile da questo approccio.
Il sequenziamento genomico ha guadagnato popolarità con il progresso delle tecnologie di sequenziamento di nuova generazione che hanno aumentato enormemente sia la resa che l’accuratezza dei dati di sequenziamento14,15. Accoppiato con lo sviluppo di algoritmi per l’elaborazione dei dati e l’assemblaggio de novo, le sequenze complete del genoma sono a portata di mano di scienziati principianti ed esperti allo stesso modo15,45. La conoscenza dell’organizzazione generale del genoma fornita da genomi completi offre importanti approfondimenti evolutivi e biologici, tra cui la duplicazione genica, la perdita genica e il trasferimento genico orizzontale14. Inoltre, i geni importanti per la resistenza antimicrobica e la virulenza sono spesso localizzati su elementi mobili, che in genere non vengono risolti in bozze di assemblaggi di genoma15,16.
Il protocollo qui segue un approccio ibrido per la combinazione di dati di sequenziamento da piattaforme a lettura breve e a lunga lettura per generare assemblaggi di genoma completi. Mentre si concentra sui genomi batterici urinari, questa procedura può essere adattata a diversi batteri da varie fonti di isolamento. I passaggi critici in questo approccio includono il seguire un’adeguata tecnica sterile e l’utilizzo di mezzi e condizioni di coltura appropriati per l’isolamento dei batteri urinari puri. Inoltre, l’estrazione di gDNA intatto e ad alto rendimento è essenziale per generare dati di sequenziamento privi di letture contaminanti che possono ostacolare il successo dell’assemblaggio. I successivi protocolli di preparazione della libreria sono fondamentali per la generazione di letture di qualità di lunghezza e profondità sufficienti. Pertanto, è di fondamentale importanza gestire il gDNA con cura durante la preparazione della libreria per il sequenziamento a lunga lettura in particolare, poiché il più grande vantaggio di questa tecnologia è la generazione di letture lunghe senza limite teorico di lunghezza superiore. Sono inoltre delineate le sezioni per il controllo di qualità appropriato (QC) delle letture di sequenziamento che elimina i dati rumorosi e migliora il risultato dell’assemblaggio.
Nonostante il successo dell’isolamento del DNA, della preparazione della libreria e del sequenziamento, la natura dell’architettura genomica di alcune specie può ancora fornire un ostacolo per la generazione di un assemblaggio di genoma chiuso45,46. Le sequenze ripetitive spesso complicano il calcolo dell’assieme e, nonostante i dati letti a lungo termine, queste aree possono essere risolte con scarsa affidabilità o per niente. Le letture lunghe devono quindi essere in media più lunghe della più grande regione di ripetizione nel genoma o la copertura deve essere alta (>100x)19. Alcuni genomi possono rimanere incompleti e richiedono approcci manuali per il completamento. Tuttavia, i genomi ibridi assemblati incompleti sono in genere composti da meno contig rispetto ai genomi a bozza di breve lettura. La regolazione dei parametri predefiniti dell’algoritmo di assemblaggio o la seguente definizione di cutoff più rigorosi per la lettura del controllo qualità possono essere d’aiuto. In alternativa, un approccio suggerito è quello di mappare le letture lunghe alle regioni incomplete alla ricerca di prove per il percorso di assemblaggio più probabile, e quindi confermare il percorso utilizzando la PCR e il sequenziamento Sanger della regione amplificata. La mappatura delle letture utilizzando Minimap2 è suggerita e Bandage offre uno strumento utile per la visualizzazione di letture mappate lungo contigs assemblati fornendo prove per il collegamento contig47.
Un’ulteriore sfida per generare genomi completi risiede nella familiarità e nel comfort con gli strumenti da riga di comando. Molti strumenti bioinformatici sono sviluppati per offrire opportunità computazionali a qualsiasi utente; tuttavia, il loro utilizzo si basa su una comprensione con le basi di UNIX e della programmazione. Questo protocollo mira a fornire istruzioni sufficientemente dettagliate per consentire alle persone senza precedente esperienza da riga di comando di generare assemblaggi di genoma chiuso e annotarli.
The authors have nothing to disclose.
Ringraziamo il Dr. Moutusee Jubaida Islam e il Dr. Luke Joyce per i loro contributi a questo protocollo. Vorremmo anche riconoscere l’Università del Texas al Dallas Genome Center per il loro feedback e supporto. Questo lavoro è stato finanziato dalla Welch Foundation, numero di premio AT-2030-20200401 a N.J.D., dal National Institutes of Health, numero di premio R01AI116610 a K.P., e dalla Felecia and John Cain Chair in Women’s Health, detenuta da P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |