Summary

Hybride de novo genoomassemblage voor het genereren van complete genomen van urinebacteriën met behulp van short- en long-read sequencing-technologieën

Published: August 20, 2021
doi:

Summary

Dit protocol beschrijft een alomvattende aanpak voor het kweken, sequentiëren en de novo hybride genoomassemblage van urinebacteriën. Het biedt een reproduceerbare procedure voor het genereren van volledige, circulaire genoomsequenties die nuttig zijn bij het bestuderen van zowel chromosomale als extrachromosomale genetische elementen die bijdragen aan urinaire kolonisatie, pathogenese en verspreiding van antimicrobiële resistentie.

Abstract

Complete genoomsequenties bieden waardevolle gegevens voor het begrijpen van genetische diversiteit en unieke kolonisatiefactoren van urinemicroben. Deze gegevens kunnen mobiele genetische elementen omvatten, zoals plasmiden en extrachromosomale faag, die bijdragen aan de verspreiding van antimicrobiële resistentie en de behandeling van urineweginfecties (UTI) verder bemoeilijken. Naast het bieden van een fijne resolutie van de genoomstructuur, maken complete, gesloten genomen de gedetailleerde vergelijkende genomica en evolutionaire analyses mogelijk. Het genereren van complete genomen de novo is lange tijd een uitdagende taak geweest vanwege de beperkingen van de beschikbare sequencingtechnologie. Paired-end Next Generation Sequencing (NGS) produceert korte metingen van hoge kwaliteit, wat vaak resulteert in nauwkeurige maar gefragmenteerde genoomassemblages. Integendeel, Nanopore-sequencing biedt lange reads van lagere kwaliteit, wat normaal gesproken leidt tot foutgevoelige complete assemblages. Dergelijke fouten kunnen genoombrede associatiestudies belemmeren of misleidende variantanalyseresultaten opleveren. Daarom zijn hybride benaderingen die zowel korte als lange metingen combineren, naar voren gekomen als betrouwbare methoden om zeer nauwkeurige gesloten bacteriële genomen te bereiken. Hierin wordt een uitgebreide methode beschreven voor het kweken van diverse urinebacteriën, soortidentificatie door 16S rRNA-gensequencing, extractie van genomisch DNA (gDNA) en het genereren van korte en lange lezingen door respectievelijk NGS- en Nanopore-platforms. Bovendien beschrijft deze methode een bioinformatische pijplijn van algoritmen voor kwaliteitscontrole, assemblage en genvoorspelling voor het genereren van geannoteerde complete genoomsequenties. Combinatie van bioinformatische hulpmiddelen maakt de selectie van hoogwaardige leesgegevens mogelijk voor hybride genoomassemblage en downstream-analyse. De gestroomlijnde aanpak voor de hybride de novo genoomassemblage die in dit protocol wordt beschreven, kan worden aangepast voor gebruik in alle kweekbare bacteriën.

Introduction

Het microbioom van de urine is een opkomend onderzoeksgebied dat een decennialange misvatting heeft verbrijzeld dat de urinewegen steriel zijn bij gezonde personen. Leden van de urinemicrobiota kunnen dienen om de urinewegomgeving in evenwicht te brengen en urineweginfectie (UTI) te voorkomen1,2. Uropathogene bacteriën dringen de urinewegen binnen en gebruiken diverse virulentiemechanismen om de inwonende microbiota te verdringen, het urotheel te koloniseren, immuunresponsen te ontwijken en omgevingsdruk tegen te gaan3,4. Urine is een relatief voedingsarm medium dat wordt gekenmerkt door een hoge osmolariteit, beperkte beschikbaarheid van stikstof en koolhydraten, lage oxygenatie en lage pH5,6,7. Urine wordt ook beschouwd als antimicrobieel, samengesteld uit hoge concentraties remmend ureum en antimicrobiële peptiden zoals de humane cathelicidin LL-378. Het onderzoeken van mechanismen die worden gebruikt door zowel residente bacteriën als uropathogenen om de urinewegen te koloniseren, is van cruciaal belang voor het verder begrijpen van de gezondheid van de urinewegen en het ontwikkelen van nieuwe strategieën voor UTI-behandeling. Bovendien, naarmate het falen van antimicrobiële therapieën in de eerste lijn vaker voorkomt, wordt het steeds belangrijker om de verspreiding van mobiele genetische elementen met antimicrobiële resistentiedeterminanten binnen populaties van urinebacteriën te monitoren9,10.

Om genotypen en fenotypes van urinebacteriën te onderzoeken, is hun succesvolle kweek en daaropvolgende whole genome sequencing (WGS) noodzakelijk. Cultuurafhankelijke methoden zijn nodig om levensvatbare microben in urinemonsters te detecteren en te identificeren11. Standaard klinische urinekweek omvat het platen van urine op 5% schapenbloed agar (BAP) en MacConkey agar en het aëroob incuberen bij 35 °C gedurende 24 uur12. Met een detectiedrempel van ≥105 CFU / ml13worden veel leden van de urinemicrobiota echter niet gemeld door deze methode. Verbeterde kweektechnieken zoals Enhanced Quantitative Urine Culture (EQUC)11 maken gebruik van verschillende combinaties van verschillende urinevolumes, incubatietijden, kweekmedia en atmosferische omstandigheden om microben te identificeren die vaak worden gemist door standaard urinekweek. In dit protocol wordt een aangepaste versie van EQUC beschreven, hier modified enhanced urine culture protocol genoemd, dat het kweken van diverse urinebacteriën en uropathogenen mogelijk maakt met behulp van selectieve media en optimale atmosferische omstandigheden, maar niet inherent kwantitatief is. De succesvolle isolatie van urinebacteriën maakt de extractie van genomisch DNA (gDNA) mogelijk voor downstream WGS en genoomassemblage.

Genoomassemblages, complete assemblages in het bijzonder, maken de ontdekking mogelijk van genetische factoren die kunnen bijdragen aan kolonisatie, nicheonderhoud en virulentie bij zowel residente microbiota als uropathogene bacteriën. Ontwerpgenoomassemblages bevatten een divers aantal aaneengesloten sequenties (contigs) die sequencingfouten en ontbrekende oriëntatie-informatie kunnen bevatten. In een volledige genoomassemblage zijn zowel de oriëntatie als de nauwkeurigheid van elk basenpaar geverifieerd14. Bovendien geeft het verkrijgen van volledige genoomsequenties inzicht in de genoomstructuur, genetische diversiteit en mobiele genetische elementen15. Korte metingen alleen kunnen de aan- of afwezigheid van belangrijke genen identificeren, maar kunnen hun genomische context niet vaststellen16. Met het mogelijk maken van long-read sequencing-technologieën zoals Oxford Nanopore en PacBio, vereist het genereren van gesloten de novo assemblages van bacteriële genomen niet langer inspannende methoden zoals het handmatig sluiten van de novo assemblages door multiplex PCR17,18. De combinatie van Next Generation short-read sequencing en Nanopore long-read sequencing technologieën maakt het mogelijk om eenvoudig nauwkeurige, complete en gesloten bacteriële genoomassemblages te genereren tegen relatief lage kosten19. Short-read sequencing produceert nauwkeurige maar gefragmenteerde genoomassemblages die over het algemeen bestaan uit gemiddeld 40-100 contigs, terwijl Nanopore sequencing long reads van ongeveer 5-100 kb lang genereert die minder nauwkeurig zijn, maar kunnen dienen als steigers om contigs samen te voegen en genomische syntenie op te lossen. Hybride benaderingen die gebruikmaken van zowel short-read als long-read technologieën kunnen nauwkeurige en volledige bacteriële genomen produceren19.

Hier wordt een uitgebreid protocol beschreven voor de isolatie en identificatie van bacteriën uit menselijke urine, genomische DNA-extractie, sequencing en volledige genoomassemblage met behulp van een hybride assemblagebenadering. Dit protocol biedt een speciale nadruk op de stappen die nodig zijn om de leesbewerkingen die worden gegenereerd door short-read en long-read sequencing goed te wijzigen voor de nauwkeurige assemblage van een gesloten bacterieel chromosoom en extrachromosomale elementen zoals plasmiden.

Protocol

Bacteriën werden gekweekt uit urine verzameld van instemmende vrouwen als onderdeel van door de institutionele beoordelingsraad goedgekeurde studies 19MR0011 (UTD) en STU 032016-006 (UTSW). 1. Gemodificeerde verbeterde urinecultuur OPMERKING: Alle kweekstappen moeten onder steriele omstandigheden worden uitgevoerd. Steriliseer alle instrumenten, oplossingen en media. Reinig het werkgebied met 70% ethanol, zet vervolgens een Bunsen-brander op en werk zorgvuldig dicht bij de vlam om de kans op besmetting te verkleinen. Als alternatief kan een bioveiligheidskast van klasse II worden gebruikt om een steriele omgeving te behouden. Draag geschikte persoonlijke beschermingsmiddelen (PBM) om blootstelling aan potentieel pathogene microben te voorkomen. Plating van met glycerol gevulde urine en kolonie-isolatie Ontdooi met glycerol gevulde urine bij kamertemperatuur (RT). Eenmaal ontdooid, vortex het monster gedurende 5 s om te mengen. Bereid in steriele microcentrifugebuizen 1:3 en 1:30 verdunningen van de urine in steriele 1x fosfaat-gebufferde zoutoplossing (PBS) tot een eindvolume van 100 μL.OPMERKING: Met glycerol gevulde urine wordt bereid door 500 μL onverdunde urine en 500 μL 50% steriele glycerol in cryovialen te mengen en op te slaan bij -80 °C. Verwarm agarplaten voor bij 37 °C gedurende 15 minuten voor gebruik. Zie figuur 1 voor mediatypen en kweekomstandigheden die geschikt zijn voor veel voorkomende bacteriële geslachten in de urine. Meng de verdunde urine goed door te pipetteren voor het platen, plaats 100 μL van de verdunde urine op de gewenste agarplaat en verdeel het monster met steriele glasparels. Plaat 100 μL van het 1x PBS verdunningsmiddel op een aparte plaat als geen groeiregulator.OPMERKING: Als u probeert gemeenschappelijke uropathogene soorten te kweken (bijv. Escherichia coli, Klebsiella spp., Enterococcus faecalis, enz.), Wordt het aanbevolen om chromogene agar(Tabel met materialen)te gebruiken, omdat dit een gemakkelijke identificatie van uropathogene bacteriesoorten mogelijk maakt(Figuur 1). Colistine Nalidixinezuur (CNA) of MRS-agar zijn nuttig voor het isoleren van kieskeurige Gram-positieve soorten (bijv. Lactobacillus spp.) uit urine waarvan bekend is dat ze Gram-negatieve uropathogenen bevatten, die de kieskeurige soorten in niet-selectieve agaren kunnen overtreffen. Incubeer de plaat omgekeerd in de gewenste atmosferische conditie bij 35 °C gedurende een periode van 24 uur voor uropathogenen en 3-5 dagen voor kieskeurige bacteriën(figuur 1). Verwijder na de incubatietijd de platen uit de couveuse. Kies uit elke plaat de kolonies die een unieke kleur, morfologie of hemolytische patronen vertonen. Streep de bacteriekolonie opnieuw met behulp van een steriele lus op de overeenkomstige agar en incubeer de plaat omgekeerd gedurende 2-5 dagen in de gewenste atmosfeer om goed geïsoleerde kolonies te verkrijgen.OPMERKING: Bij gebruik van BAP voor primaire kweek, kan het patchen van kolonies op chromogene agar nuttige informatie opleveren over de heterogeniteit van de bacteriële populatie in het monster. Kweken in vloeibare bouillon en glycerol-kousen bacteriële isolaten Zodra de geïsoleerde kolonies die overeenkomen met de morfologie van de moederkolonie zijn verkregen, kiest u een enkele kolonie en ent u in 3 ml vloeibare bouillon met behulp van een steriele inentingslus. Zie figuur 1 voor bouillon die de groei van gemeenschappelijke microbiota-geslachten in de urine kan ondersteunen. Sluit de agarplaten af met parafilm en bewaar ze 2-4 dagen bij 4 °C. Incubeer vloeibare culturen in de gewenste atmosferische omstandigheden gedurende 1-5 dagen totdat de cultuur zichtbaar troebel is. Nadat de groei is waargenomen, vortex de cultuur en voeg vervolgens 1 ml van de nachtcultuur toe aan 500 μL steriele 50% glycerol in een cryovial van 2 ml; verzegel en meng voorzichtig door inversie. Bereid twee glycerolvoorraden voor elke kolonie (één dient als back-up) en bewaar bij -80 °C. 2. Identificatie van bacteriesoorten door 16S rRNA gen Sanger sequencing OPMERKING: Microbiële identiteit kan als alternatief worden bevestigd met behulp van Matrix-Assisted Laser Desorption Ionization Time of Flight Mass Spectrometry (MALDI-TOF)20. Kolonie-polymerasekettingreactie (PCR) Bereid een 25 μL van de PCR-reactie in PCR-buizen door toevoeging van 12,5 μL 2x Taq Polymerase Master Mix, 0,5 μL van 10 μM 8F primer, 0,5 μL van 10 μM 1492R primer (Tabel der Materialen) en 11,5 μL nucleasevrij water21.OPMERKING: Als u PCR uitvoert voor meerdere monsters, maak dan een reactiemastermix van Taq Polymerase-mix, primers en steriel nucleasevrij water. Vervolgens aliquot 25 μL in elke PCR-buis. Om kolonie-PCR uit te voeren, veegt u een goed geïsoleerde kolonie van de re-streak met behulp van een steriele tandenstoker of pipetpunt. Resuspend de kolonie in de PCR-reactiemix die in stap 2.1.1 is bereid. Meng voorzichtig. Verzamel de vloeistof aan de onderkant van de buis door een snelle spin bij 2000 x g.OPMERKING: Zorg ervoor dat het monster vrij is van luchtbellen. Voeg een NTC-monster (no-template control) toe dat alleen de PCR-reactiemix bevat. Plaats de monsterbuizen in de thermocycler en voer het volgende programma uit: 95 °C gedurende 3 minuten; 40 cycli van: 95 °C voor 30 s, 51 °C voor 30 s en 72 °C voor 1 min 30 s; 72 °C gedurende 10 min; houd bij 10 °C. Gelextractie en soortidentificatie Controleer na voltooiing van de PCR-run het PCR-product op een 1% agarose-gel bereid in 0,5x Tris-Borate-EDTA (TBE) buffer. Voeg voordat u de gel giet ethidiumbromide (EtBr) toe. Giet vervolgens de gel met kammen voor putjes die ten minste 20 μL monstervolume bevatten.LET OP: EtBr is een intercalating agent waarvan wordt vermoed dat het kankerverwekkend is. Draag altijd handschoenen en PBM’s bij het hanteren ervan en gooi materialen die EtBr bevatten weg volgens de richtlijnen van de instelling. Wanneer de gel is ingesteld, plaatst u de gel in de elektroforesetank gevuld met 0,5x TBE-buffer en verwijdert u de kam. Laad de ladder van 1 kb in de eerste put en 10-20 μL van de PCR-reactie in volgende putten. Draai op 100-140 V totdat het is opgelost. Visualiseer de gel onder UV-licht en bevestig de aanwezigheid van een duidelijk gedefinieerde band op ~ 1,5 kb die afwezig is in de NTC-put.LET OP: UV-stralen zijn schadelijk voor huid en ogen, gebruik een geschikte afscherming bij het visualiseren van de gel en draag geschikte PBM’s.OPMERKING: Kolonie PCR kan voor sommige bacteriën niet succesvol zijn; doorgaan met PCR van geïsoleerd gDNA is een alternatieve optie22. Snijd de ~1,5 kb banden met een scheermes en breng de gelstekken over in schone microcentrifugebuizen. Ga verder met het gelextractieprotocol volgens de instructies van de fabrikant(Tabel met materialen). Meet de concentratie van het gezuiverde DNA met een microvolumespectrofotometer.OPMERKING: Een concentratie >10 ng/μL is wenselijk en A260/280 tussen 1,7-2,0 is aanvaardbaar. Bereid twee Sanger-sequencingreacties voor elk monster voor, één met behulp van de 8F en de andere met behulp van de 1492R-primer in nucleasevrij water volgens de richtlijnen van elke gekozen Sanger-sequencingservice. Zodra de sequencinggegevens zijn ontvangen, uploadt u de DNA-sequenties naar de NCBI Basic Local Alignment Search Tool (BLAST) -website (blast.ncbi.nlm.nih.gov/Blast.cgi), kiest u Nucleotide BLAST (blastn), selecteert u de rRNA / ITS-database 16S ribosomale RNA-sequenties (Bacteriën en Archaea) en voert u het Megablast-programma uit. Het isolaat kan worden geïdentificeerd door de hoogste kwaliteit hit naar een verwijzing uit de database.OPMERKING: Sommige bacteriesoorten vertonen een hoge identiteit in hun 16S rRNA-sequenties en kunnen alleen door deze methode niet van elkaar te onderscheiden zijn. Soortvorming vereist DNA-homologie en biochemische analyses om met vertrouwen leden van hetzelfde geslacht23te onderscheiden . 3. Extractie van genomisch DNA (gDNA) OPMERKING: Deze sectie maakt gebruik van reagentia en spinkolommen in de gDNA-extractiekit waarnaar wordt verwezen in de tabel met materialen voor de extractie met hoge opbrengst van hoogwaardig genomisch DNA uit diverse bacteriesoorten. Hieronder vindt u aanbevolen wijzigingen en instructies. Bereid kitreagentia voor volgens de instructies van de fabrikant. Bereid culturen van 3-10 ml in geschikte steriele bouillon (figuur 1) door bacteriën uit goed geïsoleerde kolonies in de media te enten en te broeden bij de temperatuur en atmosferische druk die in figuur 1 zijn vermeld totdat voldoende groei is waargenomen. Meet na incubatie de optische dichtheid bij 600 nm (OD600) van de cultuur met behulp van een spectrofotometer24. Bereid het monster voor op kwantificering door nachtculturen te verdunnen in een verhouding van 1:10. Voeg ook een blanco van de steriele kweekmedia toe voor meting. Bereken de optische dichtheid door de blancowaarde af te trekken van de monsteraflezing en te vermenigvuldigen met de verdunningsfactor van tien. Bereken met behulp van de OD600-meting en een vooraf vastgestelde OD 600/KVE/ml-verhouding voor de soort hoeveel milliliter cultuur nodig is om 2 x 10 9 cellen te verkrijgen. Centrifugeer het vereiste kweekvolume gedurende 5 min bij 5000 x g tot pellet. Zuig het supernatant op en resuspend de pellet in 200 μL koude TE-buffer (pre-chill op ijs aan het begin van de procedure). Centrifugeer het monster gedurende 2 minuten bij 5000 x g. Verwijder het supernatant en resuspend de pellet in 180 μL Enzymatic Lysis Buffer (ELB) en voeg 20 μL voorgekookte RNase A (10 mg/ml) toe. Voeg voor een efficiënte lysis van Gram-positieve bacteriën 18 μL mutanolysine (25 kU/ml) toe. Vortex goed, en dan incubeer de monsters bij 37 °C op rotator gedurende 2 uur.OPMERKING: Het wordt aanbevolen om de ELB te gebruiken die wordt beschreven in het protocol van de fabrikant voor zowel Gram-positieve als Gram-negatieve bacteriën. Ga te werk volgens de instructies van de fabrikant.OPMERKING: Herhaal de elutiestappen nog een of twee keer om desgewenst extra gDNA-opbrengst te verkrijgen. Beoordeel de kwaliteit van geëxtraheerd gDNA zoals aangegeven in rubriek 4 en bewaar gDNA bij 4 °C als het binnen 1 week zal worden gebruikt. U kunt gDNA ook op -20 °C houden voor langdurige opslag. 4. Beoordeling van de kwaliteit van geëxtraheerd gDNA Om de kwaliteit door gel-elektroforese te beoordelen, bereidt u 1% agarose-gel zoals beschreven in subsectie 2.2. Bereid het monster in een schone buis: meng 1-2 μL geëxtraheerd gDNA en 3 μL 2x ladingskleurstof op parafilm. Voer de gel uit zodra deze is geladen en visualiseer deze vervolgens onder UV-licht.OPMERKING: Succesvolle gDNA-extractie zal duidelijk zijn door een discrete band aan de bovenkant van de gel en minimaal uitstrijken(figuur 2A). Uitstrijken is indicatief voor scheren. Als er geen gDNA-band duidelijk is en/of het uitstrijken aanzienlijk is, herhaal dan de gDNA-extractie. Overweeg de incubatietijd in RNase A en Proteinase K te verkorten. Als twee banden rond 1,5-3 kb worden waargenomen, suggereert dit RNA-besmetting(figuur 2B). Bereid verse RNase A en herhaal de extractie. Om de kwaliteit per microvolumespectrofotometer te beoordelen, meet u de gDNA-concentratie en absorptieverhouding A260/280 met de microvolumespectrofotometer. Concentraties >50 ng/μL en A260/280 tussen 1,7-2,0 zijn aanvaardbaar.OPMERKING: Lage gDNA-opbrengst kan te wijten zijn aan lage input, hoge input, verontreiniging van nucleasen, onvoldoende lysis. Absorptieverhoudingen boven het bereik duiden op RNA-besmetting. Herhaal de extractie als de gDNA-kwaliteit slecht is. Om de kwaliteit per fluorometer te beoordelen, volgt u de instructies van de fabrikant om de gDNA-concentratie te kwantificeren met behulp van een high-sensitivity assay kit en fluorometerinstrument(Materiaaltabel). Concentratie >50 ng/μL is wenselijk. 5. Paired-end next generation short-read sequencing en bibliotheekvoorbereiding OPMERKING: Short-read sequencing kan worden uitgevoerd op verschillende instrumenten met verschillende leeslengtes en oriëntaties. 150 bp (300 cyclus) gepaarde-end sequencing wordt aanbevolen voor bacteriële WGS. Zowel bibliotheekvoorbereiding als sequencing kunnen worden uitbesteed aan kernfaciliteiten of commerciële laboratoria. Bereid een sequencingbibliotheek voor volgens de instructies van de fabrikant(Tabel met materialen). Volg de door de fabrikant aanbevolen eindconcentratie van de belastingsbibliotheek; een aanbevolen wijziging is echter om de gepoolde bibliotheek te laden op 1,8 pM voor optimale leesgeneratie op NextSeq-instrumenten. Hoewel optioneel, gebruik een Bioanalyzer(Table of Materials)om de gepoolde bibliotheekfragmentverdeling te beoordelen en ervoor te zorgen dat de fragmentgrootte gemiddeld 600 bp is. 6. Nanopore MinION sequencing bibliotheek voorbereiding Bereid de sequencingbibliotheek voor volgens het protocol van de fabrikant(Tabel met materialen). Het gebruik van twee barcode-uitbreidingskits maakt multiplexing van maximaal 24 monsters op een enkele stroomcel mogelijk. Het wordt aanbevolen om bibliotheekvoorbereiding in twee delen uit te voeren, 12 monsters tegelijk bij het multiplexen van 24 monsters. Alle 24 monsters kunnen worden samengevoegd zoals hieronder beschreven.OPMERKING: Monsters kunnen ‘s nachts bij 4 °C worden bewaard na het voltooien van native barcodeligatie – dit biedt indien nodig een stoppunt in het protocol. Aan het einde van de sectie Native barcode ligatie van het bibliotheekvoorbereidingsprotocol wordt aanbevolen om equimolaire hoeveelheden van elk monster te bundelen tot de maximaal mogelijke DNA-massa (ng). Om dit te doen, kwantificeert u alle monsters na barcodeligatie met behulp van een fluorometer (Tabel met materialen) volgens de instructies van de fabrikant. Schat het volume van het monster met de laagste dsDNA-concentratie en bereken vervolgens het totale dsDNA dat in dit monster wordt aangetroffen. Gebruik dit getal om de equimolaire hoeveelheden te bepalen van alle andere monsters die worden samengevoegd.OPMERKING: Omdat de equimolaire berekening de hoeveelheid gepoold dsDNA maximaliseert en dus een pool met een hoog volume oplevert (>65 μL), is opschoning noodzakelijk om het zwembad te concentreren. dsDNA zwembad opschonen en concentreren Voeg 2,5x volume paramagnetische kralen(Tabel met materialen)toe aan de DNA-pool en veeg vervolgens voorzichtig over de buis om de inhoud te mengen. Plaats de buis gedurende 5 minuten in de rotator bij RT. Draai het monster op 2000 x g en pellet op een magneet. Voeg 250 μL vers bereide 70% ethanol (in nucleasevrij water) toe en zorg ervoor dat de pellet niet wordt verstoord. Zuig de ethanol op en herhaal de ethanolwas eenmaal. Draai na de tweede aspiratie het monster op 2000 x g en plaats het terug op de magneet. Pipetteer eventueel resterende ethanol en laat het monster ongeveer 30 s drogen. Verwijder de buis van de magneet en vul de pellet opnieuw op in 60-70 μL nucleasevrij water. Incubeer bij RT gedurende 2 min. Pelleteer het monster op de magneet totdat de eluut helder is en verwijder vervolgens het eluut en breng het over in een schone microcentrifugebuis van 1,5 ml. Kwantificeer de geconcentreerde pool met behulp van een fluorometer en bereid vervolgens een aliquot voor om door te gaan naar de adapterligatiestap: bereid 700 ng van het monster voor in een eindvolume van 65 μL. Houd de rest van het zwembad op 4 °C voor een tweede run die moet worden voltooid zodra de eerste run is voltooid. Ga verder met het afzongen van de adapter volgens de instructies van de fabrikant en laad het monster op de stroomcel. Start de sequencingrun.OPMERKING: Zuig lucht en ~200 μL opslagbuffer uit de aanzuigpoort van de stroomcel aan voordat het monster wordt geladen. Dit is van cruciaal belang voor de succesvolle flow cell priming en monsterbelasting. Gebruik een p1000 pipet en tips bij het trekken en deponeren van oplossingen via de primingpoort van de stroomcel. Volg de bibliotheek volgens de instructies van de fabrikant. Open de besturingssoftware voor sequencing en klik op Start. Voer een naam in voor het experiment, een aanbevolen nomenclatuur bevat de uitvoeringsdatum en de naam van de gebruiker. Klik op Doorgaan naar kitselectie,selecteer de juiste bibliotheekvoorbereidingskit en gebruikte streepjescode-uitbreidingspakket (en) en klik vervolgens op Doorgaan met uitvoeren van opties. Pas de looptijd aan op 48 uur als u van plan bent voldoende bibliotheek voor te bereiden voor een tweede run (anders blijft deze standaard 72 uur staan). Klik op Doorgaan naar Basecalling. Controleer de basecalling-optie Config: Fast Basecalling en zorg ervoor dat Barcoding is ingesteld op Ingeschakeld, zodat fastq-uitvoerbestanden worden bijgesneden van de streepjescodesequenties en worden gedemultiplexeerd in afzonderlijke mappen op basis van streepjescode. Klik op Doorgaan naar uitvoer. Kies waar u uitvoervolgordegegevens wilt opslaan. Verwacht ongeveer 30-50 Gb aan gegevens als u alleen FASTQ-uitvoer opslaat en > 500 Gb aan gegevens als u ook FAST5-uitvoer opslaat. Verwijder het vinkje uit de filteroptie Qscore: 7 | Readlength: Ongefilterd als u van plan bent om door te gaan met filteren zoals beschreven in paragraaf 7.2, laat anders gecontroleerd en pas Readlength aan op 200. Klik op Doorgaan om Setup uit te voeren en controleer alle instellingen. Als de instellingen correct zijn, klikt u op Start, anders klikt u op Terug en brengt u de nodige aanpassingen aan. Indien gewenst kan de stroomcel volgens de instructies van de fabrikant worden gewassen en opnieuw worden geladen met de resterende pool. Herhaal de stappen in 6.2 voor het resterende zwembad zodra de eerste run is voltooid en de stroomcel is gewassen.OPMERKING: Pas bij het instellen van de tweede run de Bias-spanning aan op -250 mV volgens de aanbevelingen van de fabrikant voor flowcellen die eerder werden gebruikt in runs van meer dan 48 uur. 7. Beoordelen en voorbereiden van lezingen OPMERKING: Een aanbevolen mapstructuur is weergegeven in figuur 4. Maak de mappen op het bureaublad,namelijk Long_Reads, Short_Reads en Trimmed_Reads, voordat u doorgaat met de onderstaande berekeningsstappen. Korte lezingen (Figuur 3)OPMERKING: Korte metingen worden gegenereerd in het FASTQ-formaat. De bestanden bevatten 4000 maximale reads per FASTQ. Deze worden vaak gezipt (.gz archief) en georganiseerd in meerdere bestanden. Afhankelijk van het platform worden barcodes meestal bijgesneden. Sommige programma’s accepteren bestanden in het gezipte formaat, andere vereisen mogelijk hun extractie voordat ze worden geïmporteerd. De reads moeten de stappen van de kwaliteitscontrole (QC) doorstaan om de nauwkeurigheid van de gegevens tijdens de genoomassemblage te garanderen. Als CLC Genomics Workbench niet beschikbaar is, kunnen alternatieve programma’s worden gebruikt om korte metingen en QC’s bij te snijden, zoals Trimmomatic25 of Trim Galore (https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/) voor trimmen en FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) voor het evalueren van de leeskwaliteit. De gemiddelde korte leesdekking, geschat door het aantal leesbewerkingen te vermenigvuldigen met de gemiddelde leeslengte en te delen door de genoomgrootte, wordt aanbevolen om >100x te zijn.Open Genomics Workbench-software(Tabel met materialen)en importeer alle gekoppelde FASTQ-bestanden met kort gelezen uiteinden. Gekoppelde bestanden worden automatisch gegenereerd. Maak een nieuwe map aan onder CLC_Data door op de bovenste werkbalk Nieuw te klikken en Mapte selecteren … om de bestanden op te slaan. Geef de map de gewenste naam, een aanbevolen conventie is het gebruik van de voorbeeld-id. Sla alle uitvoer uit de volgende stappen op in deze map. Klik op de bovenste werkbalk op de knop Importeren en selecteer Illumina… Navigeer naar en selecteer alle kort gelezen bestanden die overeenkomen met het voorbeeld. Zorg ervoor dat de optie voor gekoppeld lezen is geselecteerd en schakel de optie Mislukte leesbewerkingen verwijderen uit. Klik op Volgende,selecteer Opslaanen klik nogmaals op Volgende. Kies ervoor om de geïmporteerde bestanden op te slaan in de nieuwe map die in de vorige stap is gemaakt en klik op Voltooien. Maak een volgordelijst van alle gekoppelde bestanden voor het isolaat; dit zal gelezen gegevens samenvoegen tot een enkel bestand voor eenvoud van analyse. Klik op de bovenste werkbalk op de knop Nieuw en selecteer Reeksenlijst… Selecteer in de mappenlijst aan de linkerkant de bestanden die moeten worden samengevoegd en gebruik de pijlen om deze naar de lijst met geselecteerde bestanden aan de rechterkant te verplaatsen. Klik op Volgende,selecteer Opslaanen klik nogmaals op Volgende. Kies ervoor om de volgordelijst op te slaan en klik op Voltooien. Zodra de volgordelijst is gegenereerd, wijzigt u de naam ervan onmiddellijk met de voorbeeld-ID. Voer het hulpprogramma QC for Sequencing Reads uit op de sequentielijst: deze procedure beoordeelt de algemene kwaliteitsparameters van de leesbewerkingen die worden gegenereerd door NGS met korte leesbewerking. Zoek naar het gereedschap QC for Sequencing Reads in het toolboxmenu (venster linksonder). Dubbelklik op de tool en kies vervolgens de volgordelijst die moet worden geanalyseerd en klik op Volgende. Zorg ervoor dat alle uitvoeropties zijn aangevinkt en kies Opslaan onder Resultatenverwerking. Klik op Volgende en geef op om de uitvoerbestanden op te slaan en klik vervolgens op Voltooien. Voer het gereedschap Bijsnijden lezen uit in de reekslijst: Bijsnijden wordt uitgevoerd op basis van kwaliteit, lengte en dubbelzinnigheid. Dit proces gaat ervan uit dat de streepjescodes die worden gebruikt bij sequencing voorafgaand aan deze stap zijn bijgesneden. Zoek naar het gereedschap Bijsnijden lezen in de toolbox (venster linksonder). Dubbelklik op Trim Readsen kies vervolgens de volgordelijst die moet worden geanalyseerd en klik op Volgende. Kwaliteitssnoeien: stel de kwaliteitsscorelimiet in op 0,01 en laat dubbelzinnige nucleotiden op 2 staan. Klik op Volgende.OPMERKING: Parameters kunnen naar goeddunken van de gebruiker worden aangepast; dit zijn de aanbevolen instellingen. Schakel Automatisch bijsnijden van doorleesadapters uit (doe dit alleen als adapters zijn bijgesneden van de leesbewerkingen voordat ze in CLC werden geïmporteerd). Klik op Volgende en vink Discard Reads Below Length aan,gebruik standaard 15. Klik op Volgende,vink Rapport makenaan en kies vervolgens Opslaan. Klik op Volgende en geef op waar de uitvoerbestanden moeten worden opgeslagen. Klik op Voltooien. Exporteer de bijgesneden reekslijst: de daaropvolgende hybride assemblage en analyse worden buiten CLC voltooid en vereisen dat bijgesneden kortleesbestanden worden geëxporteerd. Kies in de mapnavigatie linksboven het bijgesneden bestand dat is gegenereerd in stap 7.1.4 en klik vervolgens op Exporteren op de bovenste werkbalk. Selecteer Fastq voor het exportbestandstype en klik op Volgende. Schakel Het selectievakje Lijst met gekoppelde reeksen exporteren naar twee bestanden in. Klik vervolgens op Volgende en kies de map Trimmed_Reads om de bestanden naar te exporteren. Klik op Voltooien. Zorg ervoor dat de bijgesneden kortleesbestanden met succes zijn geëxporteerd als twee bestanden (R1 en R2) met de extensie .fastq.OPMERKING: De bijgesneden reekslijst moet worden geëxporteerd naar twee bestanden, die doorgaans door CLC worden aangeduid als R1 en R2. Dit is van cruciaal belang omdat downstream hybride assemblage vereist dat kort afgelezen gegevensinvoer als zodanig wordt ingesteld. Hernoem de geëxporteerde bestanden, onthoud u van het gebruik van spaties en speciale tekens in bestandsnamen. Voor de eenvoud is een aanbevolen formaat trimmed_short_file. R1.fastq. Lange (MinION) leest (Figuur 3)OPMERKING: De volgende pijplijn voor de voorbereiding van Long (MinION) sequencing leest voor hybride assemblage maakt gebruik van NanoFilt en Nanostat programma’s26 uitgevoerd door de command-line. Installeer de hulpprogramma’s voordat u verder gaat en wees vertrouwd met de basisprincipes van UNIX om deze opdrachten uit te voeren. Standaardterminals en Bash Shell worden aanbevolen. Een lesgids voor algemene terminalopdrachten en -gebruik is te vinden op Software Carpentry27. De onderstaande instructies gaan ervan uit dat de gegenereerde bestanden een naam krijgen met de barcodenomenclatuur (NB01, NB02, enz.) en worden opgeslagen in de map Long_Reads. Als alternatief kan leesfiltering worden bereikt met MinKNOW bij het instellen van de sequencing-run. Gemiddelde dekking voor lang lezen wordt aanbevolen om >100x te zijn. De aanbevolen gemiddelde leeslengte is >2000 bp; daarom is het aantal benodigde long reads lager dan het aantal short reads. Maak nieuwe mappen voor elke streepjescode die in de run wordt gebruikt (barcode01, barcode02, enz.) in de map Long_Reads(figuur 4). Kopieer alle FASTQ-bestanden die overeenkomen met elke streepjescode naar de juiste map. Combineer alle .fastq-bestanden voor elke streepjescode van elke run. Open Terminal en navigeer naar de barcodemappen in de map Long_Reads met de opdracht cd: cd Desktop/Long_Reads/barcode01 Voeg alle .fastq-bestanden per streepjescode samen in één .fastq-bestand door de volgende opdracht uit te voeren: cat *.fastq > NB01.fastqOPMERKING: Deze opdracht combineert alle reads van elk van de FASTQ-bestanden in één grote, enkele FASTQ met de naam NB01.fastq. Gebruik NanoStat om de leeskwaliteit van het monster te beoordelen door de volgende opdracht uit te voeren: NanoStat –fastq NB01.fastq Noteer de resultaten door de uitvoer naar een tekst- of Word-bestand te kopiëren voor toekomstig gebruik. Gebruik NanoFilt om MinION leest discarding reads te filteren met Q < 7 en lengte < 200 door het uitvoeren van de opdracht: NanoFilt -q 7 -l 200 bp NB01.fastq | gzip > NB01 _trimmed.fastq.gz Voer NanoStat uit op het bijgesneden bestand dat is gegenereerd in stap 7.2.6 door de opdracht uit te voeren: NanoStat –fastq NB01 _trimmed.fastq.gz Noteer de resultaten door de uitvoer naar een tekst- of Word-bestand te kopiëren en vergelijk met de resultaten van stap 7.2.4 om ervoor te zorgen dat het filteren succesvol was(tabel 1). Herhaal stap 7.2.2 tot en met 7.2.8 voor elke streepjescode die in de sequencing wordt gebruikt.OPMERKING: Het bestand NB01_trimmed.fastq.gz dat in stap 7.2.6 is gegenereerd, wordt gebruikt voor hybride assemblage. 8. Het genereren van hybride genoomassemblage OPMERKING: De volgende assemblagepijplijn maakt gebruik van Unicycler19,28,29,30 om korte en lange metingen te combineren die zijn voorbereid in secties 7.1 en 7.2(figuur 3). Installeer Unicycler en zijn afhankelijkheden en voer de onderstaande opdrachten uit. Kort gelezen bestanden die in stap 7.1.5 zijn geëxporteerd, worden verondersteld trimmed_short_file te hebben. R1.fastq en trimmed_short_file. R2.fastq voor eenvoud. Organiseer de kort gelezen bestanden en lang gelezen bestanden in één map met de naam Trimmed_Reads. De directory moet het volgende bevatten: Een .fastq.gz bestand voor bijgesneden long reads (gegenereerd in stap 7.2.6). Twee FASTQ-bestanden (R1 en R2) voor bijgesneden korte metingen (gegenereerd in stap 7.1.5). Navigeer naar de map Trimmed_Reads waarin de gelezen bestanden worden opgeslagen met de opdracht cd in Terminal: cd Desktop/Trimmed_Reads Eenmaal in de juiste map, zip de twee kort gelezen bestanden zodat ze ook in de .fastq.gz formaat door het uitvoeren van de volgende opdracht: gzip trimmed_short_file. R1.fastq Herhaal stap 8.2 voor zowel R1 als R2. Controleer of alle gelezen bestanden nu de .fastq.gz-indeling hebben en controleer of alle bestanden overeenkomen met hetzelfde isolaat. Begin de hybride assembly met Unicycler door de volgende opdracht uit te voeren:eenwieler -1 trimmed_short_file. R1.fastq.gz -2 trimmed_short_file. R2.fastq.gz -l NB01 _trimmed.fastq.gz -o unicycler_output_directoryOPMERKING: -o specificeert de map waarin de Unicycler-uitvoer wordt opgeslagen, Unicycler maakt deze map zodra de opdracht is uitgevoerd; genereer de map niet van tevoren. De looptijd varieert afhankelijk van de rekenkracht van de gebruikte computer, evenals de grootte van het genoom en het aantal leesbewerkingen. Dit kan 4 uur tot 1 of 2 dagen duren. Dit protocol werd uitgevoerd op een CentOS Linux 7 machine met 250 Gb RAM, Intel Xeon (R) CPU met 2,5 GHz 12 praktische cores en 48 virtuele cores. Als alternatief kunnen pc’s met 16 Gb RAM en 2,6 GHz 6-core processors deze assemblages met een langere verwerkingstijd berekenen. Wanneer de run is voltooid, controleert u het bestand van de eenwieler.log om er zeker van te zijn dat er geen fouten zijn – noteer het aantal, de grootte en de status (voltooid, onvolledig) van de gegenereerde contigs. Als onvolledige contigs worden geïdentificeerd (aangeduid als onvolledig in het Unicycler-logboek), voert u Unicycler vetgedrukt uit door de volgende vlag toe te voegen aan de opdracht in stap 8.4: –mode bold.OPMERKING: Vetgedrukte modus verlaagt de kwaliteitsdrempel die wordt geaccepteerd voor langleesbruggen tijdens de montage; dit kan een volledige assemblage opleveren, maar de assemblagekwaliteit kan afnemen. Het wordt aanbevolen om de vetgedrukte modus alleen te gebruiken wanneer dat nodig is en als voorlopig bewijs voor contig-verbinding om later door PCR te worden bevestigd. 9. Beoordeling van de assemblagekwaliteit OPMERKING: Het volgende protocol maakt gebruik van Bandage31 en QUAST32,twee programma’s die vóór gebruik moeten worden ingesteld(Figuur 2 en Figuur 4). Bandage vereist geen installatie na het downloaden en QUAST vereist vertrouwdheid met het basisgebruik van de opdrachtregel. Het wordt ook aanbevolen om de volledigheid van het genoom te beoordelen met behulp van Benchmarking Universal Single-Copy Orthologs (BUSCO)33. Verband: Klik op Bestand. Kies vervolgens Grafiek laden en selecteer het bestand assembly.gfa dat is opgeslagen in unicycler_output_directory gegenereerd door Unicycler in stap 8.4. Eenmaal geladen, klikt u op de knop Grafiek tekenen op de linker werkbalk en kijkt u hoe de contigs (knooppunten genoemd) zijn verbonden en georganiseerd om te evalueren of de assemblage is voltooid(Figuur 5).OPMERKING: Volledige assemblages worden weergegeven door enkele cirkelvormige contigs die aan beide uiteinden zijn verbonden(figuur 5A,B). Onvolledige assemblages hebben meerdere aan elkaar gekoppelde contigs of zijn lineair(figuur 5C). Kleine lineaire contigs mogen niet onvolledig zijn, omdat ze kunnen wijzen op lineaire extrachromosomale elementen. Dekking, ook wel diepte genoemd, wordt genoteerd in verband en vertegenwoordigt de relatieve overvloed van de contigs aan het chromosoom, genormaliseerd in Unicycler tot 1x. QUAST Navigeer in de Terminal naar de map waarin de Unicycler-uitvoer is opgeslagen met behulp van de opdracht cd: cd Desktop/Trimmed_Reads/unicycler_output_directoryOPMERKING: Spaties zijn niet toegestaan in het pad naar waar de assembly zich bevindt, d.w.z. geen mappen die naar de Unicycler-uitvoer leiden, mogen spaties in hun naam hebben. U kunt ook het bestand assembly.fasta naar het bureaublad kopiëren voor eenvoudige toegang. Voer QUAST uit door het volgende commando uit te voeren: quast assembly.fasta -o quast_output_directory Bekijk de rapporten die door QUAST zijn gegenereerd in de uitvoermap quast_output_directory. 10. Genoomannotatie OPMERKING: De onderstaande annotatiepijplijn maakt gebruik van Prokka34, een opdrachtregelprogramma dat moet worden geïnstalleerd voordat het wordt gebruikt. U kunt ook Prokka gebruiken via de geautomatiseerde GUI K-Base(Tabel met materialen)of genomen annoteren via de webserver RAST35. Als genomen in NCBI worden gedeponeerd, worden ze automatisch geannoteerd met behulp van de Prokaryotic Genome Annotation Pipeline (PGAP)36. Navigeer in de Terminal naar de map waarin de Unicycler-uitvoer is opgeslagen met behulp van de opdracht cd (zie stap 9.2.1). Voer vervolgens Prokka uit door de volgende opdracht uit te voeren: prokka –voorvoegsel sample_ID –outdir prokka_output_directory assembly.fastaOPMERKING: –prefix geeft alle uitvoerbestanden een naam op basis van de opgegeven sample_ID. –outdir maakt een uitvoermap met de opgegeven naam waar alle Prokka-uitvoerbestanden worden opgeslagen; maak vooraf geen uitvoermap voor Prokka. Bekijk de annotaties door de .tsv-tabel te openen en/of door het gegenereerde .gff-bestand te uploaden naar een sequentieanalysesoftware om de annotaties te visualiseren en te analyseren(Figuur 6). Specifieke soorten annotaties kunnen worden gegenereerd, afhankelijk van genetische factoren van belang. Het wordt aanbevolen om te beginnen met de gebruiksvriendelijke tools op de webserver van het Center for Genomic Epidemiology (www.genomicepidemiology.org/) voor voorlopige analyse37,38,39,40,41. Aanvullende hulpmiddelen voor de detectie van CRISPR-cas-systemen en affaag zijn beschikbaar(Figuur 3)42,43. 11. Voorgestelde praktijken voor datademocratisering Indien mogelijk, deponeer alle ruwe leesgegevens en geassembleerde genomen in een openbare opslagplaats zoals NCBI Sequence Read Archive (SRA) en Genbank. Genomen worden automatisch geannoteerd via de PGAP-pijplijn tijdens het NCBI-depositieproces.

Representative Results

Dit protocol is geoptimaliseerd voor de kweek en sequencing van urinebacteriën die behoren tot de geslachten vermeld in figuur 1. Niet alle urinebacteriën zijn met deze methode te kweken. Kweekmedia en -omstandigheden worden gespecificeerd door het geslacht in figuur 1. Voorbeeldige gel-elektroforesebeoordelingen van gDNA-integriteit zijn weergegeven in figuur 2. Een overzicht van de bioinformatica pijplijn voor sequencing leesverwerking, genoomassemblage en annotatie wordt beschreven in figuur 3. Een gids voor computationele directorystructuur wordt gegeven in Figuur 4 om zowel protocolbegrip te vereenvoudigen als een kader te bieden voor een succesvolle organisatie. Verder zijn representatieve complete genomen van twee Klebsiella spp., K. pneumoniae en K. oxytoca, die door dit protocol werden gegenereerd. Een weergave van deze samenstellingen is opgenomen in figuur 5 en bevat ook een extra onvolledig voorbeeld K. pneumoniae-genoom. Een gedetailleerd overzicht van elk volledig geannoteerd compleet genoom is weergegeven in figuur 6. Ten slotte wordt in tabel 1 een samenvatting gegeven van de sequencing-leesstatistieken om een breed begrip te bieden van ruwe en bijgesneden gegevens die voldoende zijn voor het genereren van hoogwaardige gesloten genoomassemblages. Bovendien completeren de belangrijkste parameters van de twee representatieve Klebsiella spp. genomen worden vermeld. Genomen en ruwe gegevens werden gedeponeerd in Genbank onder het BioProject PRJNA683049. Figuur 1: Gemodificeerde verbeterde urinekweek van diverse urinegeslachten. Grafiek voor de agar en vloeibare bouillon die kan worden gebruikt om verschillende urinegeslachten te kweken. Alle kweek wordt voorgesteld uit te voeren bij 35 °C zoals beschreven in punt 1.1. Cirkels vertegenwoordigen media die geschikt zijn voor het kweken van een bepaald geslacht, kleuren werden willekeurig geselecteerd om het ene mediatype van het andere te onderscheiden. CDC-AN BAP (rood), CDC Anaerobe Sheep Blood Agar; 5% Schapen-BAP (oranje), Schapenbloed Agar; BHI (groen), Brain Heart Infusion; TSB (geel), Tryptische Sojabouillon; CHROMagar Oriëntatie (blauw). eenGardnerella vaginalis moet worden gekweekt op HBT Bilayer G. vaginalis Selectieve agar in microaerofiele atmosfeer en onder speciale bouillonkweekvereisten44. bLactobacillus iners moeten worden gekweekt op 5% Konijn-BAP platen en NYCIII bouillon in microaerofiele atmosfeer. cLactobacillus spp. kan worden gekweekt op MRS in microaerofiele omstandigheden. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 2: Genomische DNA extractie agarose gel beelden. Representatieve gelafbeeldingen met gDNA-extractieresultaten. (A) Baan 1: 1 kb ladder, Baan 2: intact gDNA staat voor succesvolle extractie, Baan 3: vegen duidt op gefragmenteerd gDNA. (B) Baan 1: 1 kb ladder, Lanes 2 & 3: rRNA-besmetting aangeduid met twee banden tussen 1,5 kb en 3 kb. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 3: Hybride genoomassemblageworkflow. Schema van stappen van leeskwaliteitscontrole en voorbewerking tot assemblage-annotatie. Lezen bijsnijden verwijdert dubbelzinnige en lage kwaliteit leesbewerkingen. Q-score en lengteparameters worden aangegeven en vertegenwoordigen de waarden die worden bewaard. Assembly maakt gebruik van zowel korte als lange reads om een hybride de novo genoomassemblage te genereren. De assemblagekwaliteit wordt geëvalueerd op basis van volledigheid en juistheid met behulp van gespecificeerde tools en parameters. De uiteindelijke genoomassemblage is geannoteerd voor alle genen en specifieke loci van belang. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 4: Bioinformatica directory structure guide. Een schema van aanbevolen directory- en bestandsorganisatie voor de verwerking van korte en lange reads, hybride assemblage en genoomannotatie en QC. Belangrijke stappen voor gegevensverwerking op de opdrachtregel worden gemarkeerd naast de bijbehorende bestanden en mappen. Het uitlokken van opdrachten en vlaggen (vet), invoerbestanden (blauw), uitvoerbestanden of mappen (rood), gebruikersinvoer zoals bestandsnaamgevingsconventie (magenta). Klik hier om een grotere versie van deze figuur te bekijken. Figuur 5: Genoomassemblagegrafieken per bandage. Representatieve volledige genoomassemblagegrafieken van (A) Klebsiella oxytoca KoPF10 en (B) Klebsiella pneumoniae KpPF25 en onvolledige genoomassemblage van (C) Klebsiella pneumoniae KpPF46. Het complete genoom van KoPF10 toont een enkel gesloten chromosoom en het complete genoom van KpPF25 bestaat uit een gesloten chromosoom en vijf gesloten plasmiden. Het onvolledige chromosoom van KpPF46 bestaat uit twee onderling verbonden contigs. Unicycler hybrid de novo assembly genereert een assemblagegrafiek die wordt gevisualiseerd door Bandage. De assemblagegrafiek biedt een simplistisch schema van het genoom, dat gesloten chromosoom of plasmiden aangeeft door een linker die twee uiteinden van een enkel contig verbindt. De aanwezigheid van meer dan één onderling verbonden contig duidt op onvolledige assemblage. Contig grootte en diepte kunnen ook worden opgemerkt in Bandage. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 6: Volledige genoomkaarten van geannoteerde hybride assemblages. Assemblagekaarten gegenereerd door Geneious Prime voor het volledige genoom van (A) K. oxytoca KoPF10 en (B) K. pneumoniae KpPF25 met geannoteerde genen aangeduid met gekleurde pijlen langs plasmide-ruggengraat. Chromosomen tonen alleen rRNA- en tRNA-genen voor de eenvoud. Genoomannotaties werden uitgevoerd met Prokka zoals aangegeven in sectie 10 van dit protocol. Klik hier om een grotere versie van deze figuur te bekijken. Tabel 1: Representatieve Klebsiella spp.volledige samenstellingskenmerken. Assemblageparameters van K. oxytoca stam KoPF10 en K. pneumoniae stam KpPF25. Toetredingsnummers voor de gedeponeerde gegevens over NCBI worden verstrekt. Het aantal leesbewerkingen voor en na het bijsnijden wordt gespecificeerd voor beide sequencingtechnologieën. N50 is alleen bedoeld voor long reads, omdat short reads een gecontroleerde lengte hebben. Plasmid replicon voorspeld met behulp van PlasmidFinder v2.1 Enteroebacteriaceae database met parameters ingesteld op 80% identiteit en 60% lengte. een MLST, Multilocus Sequence Type. b CDS, coderingssequenties. c Plasmid replicon voorspeld met behulp van PlasmidFinder v2.1 Enterobacteriaceae database met parameters ingesteld op 80% identiteit en 60% lengte. d Oxford Nanopore Technologies (ONT) deponeerde gelezen gegevens. e Illumina deponeerde leesgegevens. Klik hier om deze tabel te downloaden.

Discussion

Het uitgebreide hybride genoomassemblageprotocol dat hier wordt beschreven, biedt een gestroomlijnde aanpak voor het succesvol kweken van diverse urinemicrobiota en uropathogenen, en de volledige assemblage van hun genomen. Succesvolle WGS van bacteriële genomen begint met de isolatie van diverse en soms kieskeurige microben om hun genomisch DNA te extraheren. Tot op heden missen bestaande urinekweekprotocollen ofwel de nodige gevoeligheid om veel urinesoorten te detecteren of omvatten ze langdurige en uitgebreide benaderingen die langere tijd en middelen vereisen11. De beschreven Modified Enhanced Urine Culture-benadering biedt een vereenvoudigd maar uitgebreid protocol voor de succesvolle isolatie van bacteriën die behoren tot 17 veel voorkomende urinegeslachten, waaronder potentieel pathogene of gunstige commensale soorten, en zowel facultatieve als obligate aerobe of anaërobe bacteriën. Dit biedt op zijn beurt het nodige uitgangsmateriaal voor nauwkeurige sequencing en assemblage van bacteriële genomen en voor kritische fenotypische experimenten, die bijdragen aan het begrip van de gezondheid en ziekte van de urinewegen. Bovendien zorgt deze aangepaste kweekbenadering voor een meer gedefinieerde klinische diagnose van levensvatbare micro-organismen die in urinemonsters worden aangetroffen en maakt het hun biobanking mogelijk voor toekomstige genomische studies. Dit protocol is echter niet zonder beperkingen. Het kan lange incubatietijden vereisen, afhankelijk van het organisme, evenals het gebruik van middelen zoals een hypoxiekamer of gecontroleerde incubators die mogelijk niet direct beschikbaar zijn. Het gebruik van anaerobe GasPaks biedt een alternatieve oplossing, maar deze zijn kostbaar en produceren niet altijd een duurzame en gecontroleerde omgeving. Ten slotte kunnen cultuurbias en monsterdiversiteit ervoor zorgen dat bepaalde organismen en uropathogenen kieskeurige bacteriën kunnen overtreffen. Ondanks deze beperkingen wordt door deze aanpak een cultuur van diverse urinebacteriën mogelijk gemaakt.

Genomische sequencing heeft aan populariteit gewonnen met de vooruitgang van Next Generation Sequencing-technologieën die zowel de opbrengst als de nauwkeurigheid van sequencinggegevens enorm hebben verhoogd14,15. In combinatie met de ontwikkeling van algoritmen voor gegevensverwerking en de novo assemblage, zijn volledige genoomsequenties binnen handbereik van zowel beginnende als deskundige wetenschappers15,45. Kennis van de algehele genoomorganisatie die wordt geleverd door complete genomen biedt belangrijke evolutionaire en biologische inzichten, waaronder genduplicatie, genverlies en horizontale genoverdracht14. Bovendien zijn genen die belangrijk zijn voor antimicrobiële resistentie en virulentie vaak gelokaliseerd op mobiele elementen, die meestal niet worden opgelost in ontwerpgenoomassemblages15,16.

Het protocol hierin volgt een hybride benadering voor de combinatie van sequencinggegevens van short-read en long-read platforms om complete genoomassemblages te genereren. Hoewel gericht op bacteriële genomen in de urine, kan deze procedure worden aangepast aan diverse bacteriën uit verschillende isolatiebronnen. Kritieke stappen in deze aanpak omvatten het volgen van een adequate steriele techniek en het gebruik van geschikte media- en kweekomstandigheden voor de isolatie van zuivere urinebacteriën. Bovendien is de extractie van intact, hoogrenderende gDNA essentieel voor het genereren van sequencinggegevens zonder contaminerende reads die het succes van de assemblage kunnen belemmeren. Latere protocollen voor bibliotheekvoorbereiding zijn van cruciaal belang voor het genereren van kwaliteitslezingen van voldoende lengte en diepte. Daarom is het van het grootste belang om zorgvuldig om te gaan met gDNA tijdens de voorbereiding van de bibliotheek voor long-read sequencing in het bijzonder, omdat het grootste voordeel van deze technologie het genereren van long reads is zonder theoretische bovenlengtelimiet. Ook worden secties beschreven voor de juiste kwaliteitscontrole (QC) van sequencing-reads die luidruchtige gegevens elimineren en het assemblageresultaat verbeteren.

Ondanks succesvolle DNA-isolatie, bibliotheekvoorbereiding en sequencing, kan de aard van de genomische architectuur van sommige soorten nog steeds een obstakel vormen voor het genereren van een gesloten genoomassemblage45,46. Repetitieve sequenties bemoeilijken vaak de berekening van assemblages en ondanks lang gelezen gegevens kunnen deze regio’s met weinig of helemaal niet worden opgelost. Long reads moeten dus gemiddeld langer zijn dan het grootste herhalingsgebied in het genoom of de dekking moet hoog zijn (>100x)19. Sommige genomen kunnen onvolledig blijven en vereisen handmatige benaderingen voor voltooiing. Niettemin zijn hybride geassembleerde onvolledige genomen meestal samengesteld uit minder contigs dan kort afgelezen conceptgenomen. Het aanpassen van standaardparameters van het assemblagealgoritme of het volgen van strengere cutoffs voor lees-QC kan helpen. Als alternatief is een voorgestelde aanpak om long reads in kaart te brengen met de onvolledige regio’s op zoek naar bewijs voor het meest waarschijnlijke assemblagepad, en vervolgens het pad te bevestigen met behulp van PCR- en Sanger-sequencing van het versterkte gebied. Mapping reads met behulp van Minimap2 wordt voorgesteld en Bandage biedt een handig hulpmiddel voor de visualisatie van in kaart gebrachte reads langs geassembleerde contigs die bewijs leveren voor contig koppeling47.

Een extra uitdaging voor het genereren van complete genomen ligt in vertrouwdheid en comfort met opdrachtregelprogramma’s. Veel bioinformatische tools zijn ontwikkeld om computationele mogelijkheden te bieden aan elke gebruiker; hun gebruik is echter afhankelijk van een goed begrip van de basisprincipes van UNIX en programmeren. Dit protocol is bedoeld om voldoende gedetailleerde instructies te geven om individuen zonder voorafgaande opdrachtregelervaring in staat te stellen gesloten genoomassemblages te genereren en deze te annoteren.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wij danken Dr. Moutusee Jubaida Islam en Dr. Luke Joyce voor hun bijdragen aan dit protocol. We willen ook graag de Universiteit van Texas in Dallas Genome Center erkennen voor hun feedback en ondersteuning. Dit werk werd gefinancierd door de Welch Foundation, awardnummer AT-2030-20200401 aan N.J.D., door de National Institutes of Health, awardnummer R01AI116610 aan K.P., en door de Felecia and John Cain Chair in Women’s Health, gehouden door P.E.Z.

Materials

Equipment:
Bioanalyzer 2100 Agilent G29398A Optional but recommended
Centrifuge Eppendorf Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R)
Electrophoresis BioRad Laboratories 1645070
Gel Imaging System BioRad Laboratories ChemiDoc models
Incubator ThermoFisher Scientific Any CO2 Incubator (e.g. Thermo Forma model 3110)
Magnetic Rack New England BioLabs S15095 12-tube rack
MinION Oxford Nanopore Technologies
Nanodrop ThermoFisher Scientific ND-ONE-W
NextSeq 500 Illumina SY-415-1002 Other Illumina models are acceptable
Plate Reader BioTek Synergy H1
Qubit fluorometer ThermoFisher Scientific Q33238
Rotator Benchmark Scientific H2024
Thermocycler ThermoFisher Scientific Any thermocycler for PCR reactions (e.g. ProFlex PCR system)
Materials:
10X Phosphate Buffered Saline (PBS) Fisher Scientific BP3991
10X TBE buffer 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0)
1429R primer Sigma Aldrich (Custom oligos) GGTTACCTTGTTACGACTT
1kb Ladder VWR 101228-494
1M Tris-Cl (pH 7.5) ThermoFisher Scientific 15567027
6x Loading dye Fisher Scientific NC0783588
8F primer Sigma Aldrich (Custom oligos) AGAGTTTGATCCTGGCTCAG
Agar Fisher Scientific BP1423-2
Agarose BioRad Laboratories 63001
AMPure XP Beads Beckman Coulter A63880
Anaerobe Pouch System – GasPak EZ BD Diagnostic Systems B260683
Boric Acid Fisher Scientific A73-500
Brain Heart Infusion Broth BD Diagnostic Systems 212304
CDC Anaerobe 5% Sheep Blood Agar BD Diagnostic Systems L007357
CHROMagar Orientation BD Diagnostic Systems PA-257481.04
DNeasy Blood & Tissue QIAGEN 69504
DreamTaq Master Mix ThermoFisher Scientific K1081
Dry Anaerobic Indicator Strips BD Diagnostic Systems 271051
EDTA Fisher Scientific S311-500
Ethanol 200 Proof Sigma Aldrich E7023 For molecular biology
Ethidium Bromide ThermoFisher Scientific BP130210
Flow cell priming kit Oxford Nanopore Technologies EXP-FLP002
Flow cell wash kit Oxford Nanopore Technologies EXP-WSH003
Gel Extraction Miniprep Kit BioBasic BS654
Ligation sequencing kit Oxford Nanopore Technologies SQK-LSK109
Lysozyme Research Products International Corp L381005.05
Mutanolysin Sigma Aldrich M9901-5KU
Native barcoding expansion 1-12 Oxford Nanopore Technologies EXP-NBD104
NEB Blunt/TA Ligase Master Mix New England BioLabs M0367L
NEBNext FFPE DNA Repair Mix New England BioLabs M6630L
NEBNext quick ligation buffer New England BioLabs B6058S
NEBNext Ultra II End repair / dA-tailing module New England BioLabs E7546L
Nextera DNA CD Indexes Illumina 20018708
Nextera DNA Flex Library Prep – (M) Tagmentation Illumina 20018705
Nuclease-free water Sigma Aldrich W4502
Qubit 1X dsDNA HS Assay Kit ThermoFisher Scientific Q33230
Qubit Assay Tubes ThermoFisher Scientific Q32856
Quick T4 DNA Ligase New England BioLabs E6056L
R9 Flow cell Oxford Nanopore Technologies FLO-MIN106D
RNase A ThermoFisher Scientific EN0531
Sheep Blood Hemostat Laboratories DS13250
TE buffer 10mM Tris, 1mM EDTA (pH 8.0)
Triton X-100 Sigma Aldrich T8787
Tryptic Soy Broth BD Diagnostic Systems 211825
Software & Bioinformatic Tools:
Bandage https://rrwick.github.io/Bandage/
Center for Genomic Epidemiology http://www.genomicepidemiology.org/
CLC Genomics Workbench 12 QIAGEN
CRISPRcasFinder https://crisprcas.i2bc.paris-saclay.fr/
FastQC https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Geneious Prime Geneious
gVolante (BUSCO) https://gvolante.riken.jp/
Kbase Prokka Wrapper https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release
Minimap2 https://github.com/lh3/minimap2
MinKNOW Oxford Nanopore Technologies
NanoFilt https://github.com/wdecoster/nanofilt
NanoStat https://github.com/wdecoster/nanostat
PHASTER https://phaster.ca/
Prokka https://github.com/tseemann/prokka
QUAST http://quast.sourceforge.net/quast
Trim Galore https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/
Trimmomatic http://www.usadellab.org/cms/?page=trimmomatic
Unicycler https://github.com/rrwick/Unicycler#necessary-read-length

References

  1. Brubaker, L., Wolfe, A. The urinary microbiota: a paradigm shift for bladder disorders. Current Opinion in Obstetrics & Gynecology. 28 (5), 407-412 (2016).
  2. Neugent, M. L., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., De Nisco, N. J. Advances in understanding the human urinary microbiome and its potential role in urinary tract infection. mBio. 11 (2), (2020).
  3. Klein, R. D., Hultgren, S. J. Urinary tract infections: microbial pathogenesis, host-pathogen interactions and new treatment strategies. Nature Reviews. Microbiology. 18 (4), 211-226 (2020).
  4. Horsley, H., et al. Enterococcus faecalis subverts and invades the host urothelium in patients with chronic urinary tract infection. PLoS One. 8 (12), 83637 (2013).
  5. Reitzer, L., Zimmern, P. Rapid growth and metabolism of uropathogenic Escherichia coli in relation to urine composition. Clinical Microbiology Reviews. 33 (1), 00101-00119 (2019).
  6. Snyder, J. A., et al. Transcriptome of uropathogenic Escherichia coli during urinary tract infection. Infection and Immunity. 72 (11), 6373-6381 (2004).
  7. Ipe, D. S., Horton, E., Ulett, G. C. The basics of bacteriuria: Strategies of microbes for persistence in urine. Frontiers in Cellular and Infection Microbiology. 6, 14 (2016).
  8. Babikir, I. H., et al. The impact of cathelicidin, the human antimicrobial peptide LL-37 in urinary tract infections. BMC Infectious Diseases. 18 (1), 17 (2018).
  9. Jancel, T., Dudas, V. Management of uncomplicated urinary tract infections. The Western Journal of Medicine. 176 (1), 51-55 (2002).
  10. Ventola, C. L. The antibiotic resistance crisis: part 1: causes and threats. P & T. 40 (4), 277-283 (2015).
  11. Price, T. K., et al. The clinical urine culture: Enhanced techniques improve detection of clinically relevant microorganisms. Journal of Clinical Microbiology. 54 (5), 1216-1222 (2016).
  12. Kass, E. H. Asymptomatic infections of the urinary tract. Transactions of the Association of American Physicians. 69, 56-64 (1956).
  13. Garcia, L. S. . Clinical microbiology procedures handbook. 3rd edn. , (2010).
  14. Fraser, C. M., Eisen, J. A., Nelson, K. E., Paulsen, I. T., Salzberg, S. L. The value of complete microbial genome sequencing (you get what you pay for). Journal of Bacteriology. 184 (23), 6403-6405 (2002).
  15. Chen, Z., Erickson, D. L., Meng, J. Benchmarking hybrid assembly approaches for genomic analyses of bacterial pathogens using Illumina and Oxford Nanopore sequencing. BMC Genomics. 21 (1), 631 (2020).
  16. Greig, D. R., Dallman, T. J., Hopkins, K. L., Jenkins, C. MinION nanopore sequencing identifies the position and structure of bacterial antibiotic resistance determinants in a multidrug-resistant strain of enteroaggregative Escherichia coli. Microbial Genomics. 4 (10), 000213 (2018).
  17. Carraro, D. M., et al. PCR-assisted contig extension: stepwise strategy for bacterial genome closure. Biotechniques. 34 (3), 626-628 (2003).
  18. Tettelin, H., Radune, D., Kasif, S., Khouri, H., Salzberg, S. L. Optimized multiplex PCR: efficiently closing a whole-genome shotgun sequencing project. Genomics. 62 (3), 500-507 (1999).
  19. Wick, R. R., Judd, L. M., Gorrie, C. L., Holt, K. E. Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads. PLoS Computational Biology. 13 (6), 1005595 (2017).
  20. Singhal, N., Kumar, M., Kanaujia, P. K., Virdi, J. S. MALDI-TOF mass spectrometry: an emerging technology for microbial identification and diagnosis. Frontiers in Microbiology. 6, 791 (2015).
  21. Turner, S., Pryer, K. M., Miao, V. P., Palmer, J. D. Investigating deep phylogenetic relationships among cyanobacteria and plastids by small subunit rRNA sequence analysis. The Journal of Eukaryotic Microbiology. 46 (4), 327-338 (1999).
  22. Weisburg, W. G., Barns, S. M., Pelletier, D. A., Lane, D. J. 16S ribosomal DNA amplification for phylogenetic study. Journal of Bacteriology. 173 (2), 697-703 (1991).
  23. Janda, J. M., Abbott, S. L. 16S rRNA gene sequencing for bacterial identification in the diagnostic laboratory: pluses, perils, and pitfalls. Journal of Clinical Microbiology. 45 (9), 2761-2764 (2007).
  24. Stevenson, K., McVey, A. F., Clark, I. B. N., Swain, P. S., Pilizota, T. General calibration of microbial growth in microplate readers. Science Reports. 6, 38828 (2016).
  25. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  26. De Coster, W., D’Hert, S., Schultz, D. T., Cruts, M., Van Broeckhoven, C. NanoPack: visualizing and processing long-read sequencing data. Bioinformatics. 34 (15), 2666-2669 (2018).
  27. Wilson, G., et al. The UNIX Shell. Zenodo. , (2019).
  28. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  29. Vaser, R., Sovic, I., Nagarajan, N., Sikic, M. Fast and accurate de novo genome assembly from long uncorrected reads. Genome Research. 27 (5), 737-746 (2017).
  30. Walker, B. J., et al. Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement. PLoS One. 9 (11), 112963 (2014).
  31. Wick, R. R., Schultz, M. B., Zobel, J., Holt, K. E. Bandage: interactive visualization of de novo genome assemblies. Bioinformatics. 31 (20), 3350-3352 (2015).
  32. Gurevich, A., Saveliev, V., Vyahhi, N., Tesler, G. QUAST: quality assessment tool for genome assemblies. Bioinformatics. 29 (8), 1072-1075 (2013).
  33. Simao, F. A., Waterhouse, R. M., Ioannidis, P., Kriventseva, E. V., Zdobnov, E. M. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics. 31 (19), 3210-3212 (2015).
  34. Seemann, T. Prokka: rapid prokaryotic genome annotation. Bioinformatics. 30 (14), 2068-2069 (2014).
  35. Aziz, R. K., et al. The RAST server: rapid annotations using subsystems technology. BMC Genomics. 9, 75 (2008).
  36. Tatusova, T., et al. NCBI prokaryotic genome annotation pipeline. Nucleic Acids Research. 44 (14), 6614-6624 (2016).
  37. Carattoli, A., Hasman, H. PlasmidFinder and In Silico pMLST: Identification and Typing of Plasmid Replicons in Whole-Genome Sequencing (WGS). Methods in Molecular Biology. 2075, 285-294 (2020).
  38. Carattoli, A., et al. In silico detection and typing of plasmids using PlasmidFinder and plasmid multilocus sequence typing. Antimicrobial Agents and Chemotherapy. 58 (7), 3895-3903 (2014).
  39. Larsen, M. V., et al. Multilocus sequence typing of total-genome-sequenced bacteria. Journal of Clinical Microbiology. 50 (4), 1355-1361 (2012).
  40. Bortolaia, V., et al. ResFinder 4.0 for predictions of phenotypes from genotypes. The Journal of Antimicrobial Chemotherapy. 75 (12), 3491-3500 (2020).
  41. Joensen, K. G., et al. Real-time whole-genome sequencing for routine typing, surveillance, and outbreak detection of verotoxigenic Escherichia coli. Journal of Clinical Microbiology. 52 (5), 1501-1510 (2014).
  42. Arndt, D., et al. PHASTER: a better, faster version of the PHAST phage search tool. Nucleic Acids Research. 44 (1), 16-21 (2016).
  43. Couvin, D., et al. CRISPRCasFinder, an update of CRISRFinder, includes a portable version, enhanced performance and integrates search for Cas proteins. Nucleic Acids Research. 46 (1), 246-251 (2018).
  44. Totten, P. A., Amsel, R., Hale, J., Piot, P., Holmes, K. K. Selective differential human blood bilayer media for isolation of Gardnerella (Haemophilus) vaginalis. Journal of Clinical Microbiology. 15 (1), 141-147 (1982).
  45. Nagarajan, N., Pop, M. Sequence assembly demystified. Nat Reviews. Genetics. 14 (3), 157-167 (2013).
  46. Phillippy, A. M., Schatz, M. C., Pop, M. Genome assembly forensics: finding the elusive mis-assembly. Genome Biology. 9 (3), 55 (2008).
  47. . Unicycler Wiki Available from: https://github.com/rrwick/Unicycler/wiki (2017)

Play Video

Cite This Article
Sharon, B. M., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., Palmer, K. L., De Nisco, N. J. Hybrid De Novo Genome Assembly for the Generation of Complete Genomes of Urinary Bacteria using Short- and Long-read Sequencing Technologies. J. Vis. Exp. (174), e62872, doi:10.3791/62872 (2021).

View Video