Dit protocol beschrijft een alomvattende aanpak voor het kweken, sequentiëren en de novo hybride genoomassemblage van urinebacteriën. Het biedt een reproduceerbare procedure voor het genereren van volledige, circulaire genoomsequenties die nuttig zijn bij het bestuderen van zowel chromosomale als extrachromosomale genetische elementen die bijdragen aan urinaire kolonisatie, pathogenese en verspreiding van antimicrobiële resistentie.
Complete genoomsequenties bieden waardevolle gegevens voor het begrijpen van genetische diversiteit en unieke kolonisatiefactoren van urinemicroben. Deze gegevens kunnen mobiele genetische elementen omvatten, zoals plasmiden en extrachromosomale faag, die bijdragen aan de verspreiding van antimicrobiële resistentie en de behandeling van urineweginfecties (UTI) verder bemoeilijken. Naast het bieden van een fijne resolutie van de genoomstructuur, maken complete, gesloten genomen de gedetailleerde vergelijkende genomica en evolutionaire analyses mogelijk. Het genereren van complete genomen de novo is lange tijd een uitdagende taak geweest vanwege de beperkingen van de beschikbare sequencingtechnologie. Paired-end Next Generation Sequencing (NGS) produceert korte metingen van hoge kwaliteit, wat vaak resulteert in nauwkeurige maar gefragmenteerde genoomassemblages. Integendeel, Nanopore-sequencing biedt lange reads van lagere kwaliteit, wat normaal gesproken leidt tot foutgevoelige complete assemblages. Dergelijke fouten kunnen genoombrede associatiestudies belemmeren of misleidende variantanalyseresultaten opleveren. Daarom zijn hybride benaderingen die zowel korte als lange metingen combineren, naar voren gekomen als betrouwbare methoden om zeer nauwkeurige gesloten bacteriële genomen te bereiken. Hierin wordt een uitgebreide methode beschreven voor het kweken van diverse urinebacteriën, soortidentificatie door 16S rRNA-gensequencing, extractie van genomisch DNA (gDNA) en het genereren van korte en lange lezingen door respectievelijk NGS- en Nanopore-platforms. Bovendien beschrijft deze methode een bioinformatische pijplijn van algoritmen voor kwaliteitscontrole, assemblage en genvoorspelling voor het genereren van geannoteerde complete genoomsequenties. Combinatie van bioinformatische hulpmiddelen maakt de selectie van hoogwaardige leesgegevens mogelijk voor hybride genoomassemblage en downstream-analyse. De gestroomlijnde aanpak voor de hybride de novo genoomassemblage die in dit protocol wordt beschreven, kan worden aangepast voor gebruik in alle kweekbare bacteriën.
Het microbioom van de urine is een opkomend onderzoeksgebied dat een decennialange misvatting heeft verbrijzeld dat de urinewegen steriel zijn bij gezonde personen. Leden van de urinemicrobiota kunnen dienen om de urinewegomgeving in evenwicht te brengen en urineweginfectie (UTI) te voorkomen1,2. Uropathogene bacteriën dringen de urinewegen binnen en gebruiken diverse virulentiemechanismen om de inwonende microbiota te verdringen, het urotheel te koloniseren, immuunresponsen te ontwijken en omgevingsdruk tegen te gaan3,4. Urine is een relatief voedingsarm medium dat wordt gekenmerkt door een hoge osmolariteit, beperkte beschikbaarheid van stikstof en koolhydraten, lage oxygenatie en lage pH5,6,7. Urine wordt ook beschouwd als antimicrobieel, samengesteld uit hoge concentraties remmend ureum en antimicrobiële peptiden zoals de humane cathelicidin LL-378. Het onderzoeken van mechanismen die worden gebruikt door zowel residente bacteriën als uropathogenen om de urinewegen te koloniseren, is van cruciaal belang voor het verder begrijpen van de gezondheid van de urinewegen en het ontwikkelen van nieuwe strategieën voor UTI-behandeling. Bovendien, naarmate het falen van antimicrobiële therapieën in de eerste lijn vaker voorkomt, wordt het steeds belangrijker om de verspreiding van mobiele genetische elementen met antimicrobiële resistentiedeterminanten binnen populaties van urinebacteriën te monitoren9,10.
Om genotypen en fenotypes van urinebacteriën te onderzoeken, is hun succesvolle kweek en daaropvolgende whole genome sequencing (WGS) noodzakelijk. Cultuurafhankelijke methoden zijn nodig om levensvatbare microben in urinemonsters te detecteren en te identificeren11. Standaard klinische urinekweek omvat het platen van urine op 5% schapenbloed agar (BAP) en MacConkey agar en het aëroob incuberen bij 35 °C gedurende 24 uur12. Met een detectiedrempel van ≥105 CFU / ml13worden veel leden van de urinemicrobiota echter niet gemeld door deze methode. Verbeterde kweektechnieken zoals Enhanced Quantitative Urine Culture (EQUC)11 maken gebruik van verschillende combinaties van verschillende urinevolumes, incubatietijden, kweekmedia en atmosferische omstandigheden om microben te identificeren die vaak worden gemist door standaard urinekweek. In dit protocol wordt een aangepaste versie van EQUC beschreven, hier modified enhanced urine culture protocol genoemd, dat het kweken van diverse urinebacteriën en uropathogenen mogelijk maakt met behulp van selectieve media en optimale atmosferische omstandigheden, maar niet inherent kwantitatief is. De succesvolle isolatie van urinebacteriën maakt de extractie van genomisch DNA (gDNA) mogelijk voor downstream WGS en genoomassemblage.
Genoomassemblages, complete assemblages in het bijzonder, maken de ontdekking mogelijk van genetische factoren die kunnen bijdragen aan kolonisatie, nicheonderhoud en virulentie bij zowel residente microbiota als uropathogene bacteriën. Ontwerpgenoomassemblages bevatten een divers aantal aaneengesloten sequenties (contigs) die sequencingfouten en ontbrekende oriëntatie-informatie kunnen bevatten. In een volledige genoomassemblage zijn zowel de oriëntatie als de nauwkeurigheid van elk basenpaar geverifieerd14. Bovendien geeft het verkrijgen van volledige genoomsequenties inzicht in de genoomstructuur, genetische diversiteit en mobiele genetische elementen15. Korte metingen alleen kunnen de aan- of afwezigheid van belangrijke genen identificeren, maar kunnen hun genomische context niet vaststellen16. Met het mogelijk maken van long-read sequencing-technologieën zoals Oxford Nanopore en PacBio, vereist het genereren van gesloten de novo assemblages van bacteriële genomen niet langer inspannende methoden zoals het handmatig sluiten van de novo assemblages door multiplex PCR17,18. De combinatie van Next Generation short-read sequencing en Nanopore long-read sequencing technologieën maakt het mogelijk om eenvoudig nauwkeurige, complete en gesloten bacteriële genoomassemblages te genereren tegen relatief lage kosten19. Short-read sequencing produceert nauwkeurige maar gefragmenteerde genoomassemblages die over het algemeen bestaan uit gemiddeld 40-100 contigs, terwijl Nanopore sequencing long reads van ongeveer 5-100 kb lang genereert die minder nauwkeurig zijn, maar kunnen dienen als steigers om contigs samen te voegen en genomische syntenie op te lossen. Hybride benaderingen die gebruikmaken van zowel short-read als long-read technologieën kunnen nauwkeurige en volledige bacteriële genomen produceren19.
Hier wordt een uitgebreid protocol beschreven voor de isolatie en identificatie van bacteriën uit menselijke urine, genomische DNA-extractie, sequencing en volledige genoomassemblage met behulp van een hybride assemblagebenadering. Dit protocol biedt een speciale nadruk op de stappen die nodig zijn om de leesbewerkingen die worden gegenereerd door short-read en long-read sequencing goed te wijzigen voor de nauwkeurige assemblage van een gesloten bacterieel chromosoom en extrachromosomale elementen zoals plasmiden.
Het uitgebreide hybride genoomassemblageprotocol dat hier wordt beschreven, biedt een gestroomlijnde aanpak voor het succesvol kweken van diverse urinemicrobiota en uropathogenen, en de volledige assemblage van hun genomen. Succesvolle WGS van bacteriële genomen begint met de isolatie van diverse en soms kieskeurige microben om hun genomisch DNA te extraheren. Tot op heden missen bestaande urinekweekprotocollen ofwel de nodige gevoeligheid om veel urinesoorten te detecteren of omvatten ze langdurige en uitgebreide benaderingen die langere tijd en middelen vereisen11. De beschreven Modified Enhanced Urine Culture-benadering biedt een vereenvoudigd maar uitgebreid protocol voor de succesvolle isolatie van bacteriën die behoren tot 17 veel voorkomende urinegeslachten, waaronder potentieel pathogene of gunstige commensale soorten, en zowel facultatieve als obligate aerobe of anaërobe bacteriën. Dit biedt op zijn beurt het nodige uitgangsmateriaal voor nauwkeurige sequencing en assemblage van bacteriële genomen en voor kritische fenotypische experimenten, die bijdragen aan het begrip van de gezondheid en ziekte van de urinewegen. Bovendien zorgt deze aangepaste kweekbenadering voor een meer gedefinieerde klinische diagnose van levensvatbare micro-organismen die in urinemonsters worden aangetroffen en maakt het hun biobanking mogelijk voor toekomstige genomische studies. Dit protocol is echter niet zonder beperkingen. Het kan lange incubatietijden vereisen, afhankelijk van het organisme, evenals het gebruik van middelen zoals een hypoxiekamer of gecontroleerde incubators die mogelijk niet direct beschikbaar zijn. Het gebruik van anaerobe GasPaks biedt een alternatieve oplossing, maar deze zijn kostbaar en produceren niet altijd een duurzame en gecontroleerde omgeving. Ten slotte kunnen cultuurbias en monsterdiversiteit ervoor zorgen dat bepaalde organismen en uropathogenen kieskeurige bacteriën kunnen overtreffen. Ondanks deze beperkingen wordt door deze aanpak een cultuur van diverse urinebacteriën mogelijk gemaakt.
Genomische sequencing heeft aan populariteit gewonnen met de vooruitgang van Next Generation Sequencing-technologieën die zowel de opbrengst als de nauwkeurigheid van sequencinggegevens enorm hebben verhoogd14,15. In combinatie met de ontwikkeling van algoritmen voor gegevensverwerking en de novo assemblage, zijn volledige genoomsequenties binnen handbereik van zowel beginnende als deskundige wetenschappers15,45. Kennis van de algehele genoomorganisatie die wordt geleverd door complete genomen biedt belangrijke evolutionaire en biologische inzichten, waaronder genduplicatie, genverlies en horizontale genoverdracht14. Bovendien zijn genen die belangrijk zijn voor antimicrobiële resistentie en virulentie vaak gelokaliseerd op mobiele elementen, die meestal niet worden opgelost in ontwerpgenoomassemblages15,16.
Het protocol hierin volgt een hybride benadering voor de combinatie van sequencinggegevens van short-read en long-read platforms om complete genoomassemblages te genereren. Hoewel gericht op bacteriële genomen in de urine, kan deze procedure worden aangepast aan diverse bacteriën uit verschillende isolatiebronnen. Kritieke stappen in deze aanpak omvatten het volgen van een adequate steriele techniek en het gebruik van geschikte media- en kweekomstandigheden voor de isolatie van zuivere urinebacteriën. Bovendien is de extractie van intact, hoogrenderende gDNA essentieel voor het genereren van sequencinggegevens zonder contaminerende reads die het succes van de assemblage kunnen belemmeren. Latere protocollen voor bibliotheekvoorbereiding zijn van cruciaal belang voor het genereren van kwaliteitslezingen van voldoende lengte en diepte. Daarom is het van het grootste belang om zorgvuldig om te gaan met gDNA tijdens de voorbereiding van de bibliotheek voor long-read sequencing in het bijzonder, omdat het grootste voordeel van deze technologie het genereren van long reads is zonder theoretische bovenlengtelimiet. Ook worden secties beschreven voor de juiste kwaliteitscontrole (QC) van sequencing-reads die luidruchtige gegevens elimineren en het assemblageresultaat verbeteren.
Ondanks succesvolle DNA-isolatie, bibliotheekvoorbereiding en sequencing, kan de aard van de genomische architectuur van sommige soorten nog steeds een obstakel vormen voor het genereren van een gesloten genoomassemblage45,46. Repetitieve sequenties bemoeilijken vaak de berekening van assemblages en ondanks lang gelezen gegevens kunnen deze regio’s met weinig of helemaal niet worden opgelost. Long reads moeten dus gemiddeld langer zijn dan het grootste herhalingsgebied in het genoom of de dekking moet hoog zijn (>100x)19. Sommige genomen kunnen onvolledig blijven en vereisen handmatige benaderingen voor voltooiing. Niettemin zijn hybride geassembleerde onvolledige genomen meestal samengesteld uit minder contigs dan kort afgelezen conceptgenomen. Het aanpassen van standaardparameters van het assemblagealgoritme of het volgen van strengere cutoffs voor lees-QC kan helpen. Als alternatief is een voorgestelde aanpak om long reads in kaart te brengen met de onvolledige regio’s op zoek naar bewijs voor het meest waarschijnlijke assemblagepad, en vervolgens het pad te bevestigen met behulp van PCR- en Sanger-sequencing van het versterkte gebied. Mapping reads met behulp van Minimap2 wordt voorgesteld en Bandage biedt een handig hulpmiddel voor de visualisatie van in kaart gebrachte reads langs geassembleerde contigs die bewijs leveren voor contig koppeling47.
Een extra uitdaging voor het genereren van complete genomen ligt in vertrouwdheid en comfort met opdrachtregelprogramma’s. Veel bioinformatische tools zijn ontwikkeld om computationele mogelijkheden te bieden aan elke gebruiker; hun gebruik is echter afhankelijk van een goed begrip van de basisprincipes van UNIX en programmeren. Dit protocol is bedoeld om voldoende gedetailleerde instructies te geven om individuen zonder voorafgaande opdrachtregelervaring in staat te stellen gesloten genoomassemblages te genereren en deze te annoteren.
The authors have nothing to disclose.
Wij danken Dr. Moutusee Jubaida Islam en Dr. Luke Joyce voor hun bijdragen aan dit protocol. We willen ook graag de Universiteit van Texas in Dallas Genome Center erkennen voor hun feedback en ondersteuning. Dit werk werd gefinancierd door de Welch Foundation, awardnummer AT-2030-20200401 aan N.J.D., door de National Institutes of Health, awardnummer R01AI116610 aan K.P., en door de Felecia and John Cain Chair in Women’s Health, gehouden door P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |