Dieses Protokoll beschreibt einen umfassenden Ansatz für die Kultivierung, Sequenzierung und De-novo-Hybridgenomassemblierung von Harnbakterien. Es bietet ein reproduzierbares Verfahren zur Erzeugung vollständiger, zirkulärer Genomsequenzen, die bei der Untersuchung sowohl chromosomaler als auch extrachromosomaler genetischer Elemente nützlich sind, die zur Kolonisierung im Urin, zur Pathogenese und zur Verbreitung antimikrobieller Resistenzen beitragen.
Vollständige Genomsequenzen liefern wertvolle Daten für das Verständnis der genetischen Vielfalt und der einzigartigen Kolonisationsfaktoren von Urinmikroben. Diese Daten können mobile genetische Elemente wie Plasmide und extrachromosomale Phagen umfassen, die zur Verbreitung antimikrobieller Resistenzen beitragen und die Behandlung von Harnwegsinfektionen (UTI) weiter erschweren. Vollständige, geschlossene Genome bieten nicht nur eine feine Auflösung der Genomstruktur, sondern ermöglichen auch detaillierte vergleichende Genomik- und Evolutionsanalysen. Die Generierung vollständiger Genome de novo ist aufgrund der Einschränkungen der verfügbaren Sequenzierungstechnologie seit langem eine herausfordernde Aufgabe. Paired-End Next Generation Sequencing (NGS) erzeugt qualitativ hochwertige Kurzlesevorgänge, die oft zu genauen, aber fragmentierten Genomanordnungen führen. Im Gegenteil, die Nanoporensequenzierung liefert lange Lesevorgänge von geringerer Qualität, die normalerweise zu fehleranfälligen kompletten Baugruppen führen. Solche Fehler können genomweite Assoziationsstudien behindern oder irreführende Ergebnisse der Variantenanalyse liefern. Daher haben sich hybride Ansätze, die sowohl kurze als auch lange Lesevorgänge kombinieren, als zuverlässige Methoden herausgestellt, um hochgenaue geschlossene Bakteriengenome zu erhalten. Hierin wird eine umfassende Methode für die Kultur verschiedener Harnbakterien, die Speziesidentifizierung durch 16S rRNA-Gensequenzierung, die Extraktion genomischer DNA (gDNA) und die Generierung von kurzen und langen Lesevorgängen durch NGS- bzw. Nanopore-Plattformen beschrieben. Darüber hinaus beschreibt diese Methode eine bioinformatische Pipeline von Qualitätskontroll-, Assemblierungs- und Genvorhersagealgorithmen zur Erzeugung annotierter vollständiger Genomsequenzen. Die Kombination bioinformatischer Werkzeuge ermöglicht die Auswahl hochwertiger Lesedaten für die hybride Genomassemblierung und die nachgelagerte Analyse. Der in diesem Protokoll beschriebene gestraffte Ansatz für die hybride De-novo-Genomanordnung kann für die Verwendung in allen kultivierbaren Bakterien angepasst werden.
Das Urin-Mikrobiom ist ein aufstrebendes Forschungsgebiet, das ein jahrzehntelanges Missverständnis zerschlagen hat, dass die Harnwege bei gesunden Menschen steril sind. Mitglieder der Harnmikrobiota können dazu dienen, die Harnumgebung auszugleichen und Harnwegsinfektionen (UTI) zu verhindern1,2. Uropathogene Bakterien dringen in die Harnwege ein und nutzen verschiedene Virulenzmechanismen, um die ansässige Mikrobiota zu verdrängen, das Urothel zu besiedeln, Immunreaktionen zu entgehen und Umweltbelastungen entgegenzuwirken3,4. Urin ist ein relativ nährstoffarmes Medium, das durch hohe Osmolarität, begrenzte Stickstoff- und Kohlenhydratverfügbarkeit, geringe Sauerstoffversorgung und niedrigen pH-Wert5,6,7gekennzeichnet ist. Urin gilt auch als antimikrobiell, bestehend aus hohen Konzentrationen von inhibitorischem Harnstoff und antimikrobiellen Peptiden wie dem humanen Cathelicidin LL-378. Die Untersuchung von Mechanismen, die sowohl von ansässigen Bakterien als auch von Uropathogenen zur Besiedlung der Harnwege eingesetzt werden, ist entscheidend für das weitere Verständnis der Gesundheit der Harnwege und die Entwicklung neuer Strategien für die Behandlung mit Harnwegsinfektionen. Da das Versagen antimikrobieller Therapien an vorderster Front immer häufiger auftritt, wird es immer wichtiger, die Verbreitung mobiler genetischer Elemente zu überwachen, die antimikrobielle Resistenzdeterminanten in Populationen von Harnbakterien tragen9,10.
Um Genotypen und Phänotypen von Harnbakterien zu untersuchen, ist ihre erfolgreiche Kultur und anschließende Sequenzierung des gesamten Genoms (WGS) unerlässlich. Kulturabhängige Methoden sind notwendig, um lebensfähige Mikroben in Urinproben nachzuweisen und zu identifizieren11. Bei der klinischen Standard-Urinkultur werden Urin auf 5% Schafblutagar (BAP) und MacConkey-Agar plattiert und bei 35 °C für 24 h aerob inkubiert12. Mit einer Nachweisschwelle von ≥105 KBE/ml13werden jedoch viele Mitglieder der Urinmikrobiota durch diese Methode nicht berichtet. Verbesserte Kultivierungstechniken wie Enhanced Quantitative Urine Culture (EQUC)11 verwenden verschiedene Kombinationen unterschiedlicher Urinvolumina, Inkubationszeiten, Kulturmedien und atmosphärischer Bedingungen, um Mikroben zu identifizieren, die häufig von der Standardurinkultur übersehen werden. In diesem Protokoll wird eine modifizierte Version von EQUC beschrieben, hier als Modifiziertes Enhanced Urine Culture-Protokoll bezeichnet, das die Kultivierung verschiedener Harnbakterien und Uropathogene unter Verwendung selektiver Medien und optimaler atmosphärischer Bedingungen ermöglicht, aber nicht von Natur aus quantitativ ist. Die erfolgreiche Isolierung von Harnbakterien ermöglicht die Extraktion genomischer DNA (gDNA) für nachgeschaltete WGS und Genomassemblierung.
Genom-Assemblierungen, insbesondere komplette Assemblierungen, ermöglichen die Entdeckung genetischer Faktoren, die zur Kolonisierung, Nischenerhaltung und Virulenz sowohl bei ansässigen Mikrobiota als auch bei uropathogenen Bakterien beitragen können. Entwürfe von Genomassemblys enthalten eine Vielzahl von zusammenhängenden Sequenzen (Contigs), die Sequenzierungsfehler enthalten können und keine Orientierungsinformationen enthalten. In einer vollständigen Genomanordnung wurden sowohl die Orientierung als auch die Genauigkeit jedes Basenpaares verifiziert14. Darüber hinaus bietet die Gewinnung vollständiger Genomsequenzen Einblicke in die Genomstruktur, die genetische Vielfalt und die mobilen genetischen Elemente15. Kurze Lektüren allein können das Vorhandensein oder Fehlen wichtiger Gene identifizieren, aber möglicherweise nicht ihren genomischen Kontextbestimmen 16. Mit der Ermöglichung von Long-Read-Sequenzierungstechnologien wie Oxford Nanopore und PacBio erfordert die Erzeugung geschlossener De-novo-Assemblierungen bakterieller Genome keine anstrengenden Methoden wie das manuelle Schließen von De-novo-Assemblierungen durch Multiplex-PCR17,18. Die Kombination von Next Generation Short-Read-Sequencing und Nanopore Long-Read-Sequencing-Technologien ermöglicht die einfache Generierung genauer, vollständiger und geschlossener bakterieller Genom-Assemblierungen zu relativ geringen Kosten19. Die Short-Read-Sequenzierung erzeugt genaue, aber fragmentierte Genomanordnungen, die im Allgemeinen aus durchschnittlich 40-100 Contigs bestehen, während die Nanoporensequenzierung lange Lesevorgänge von etwa 5-100 kb Länge erzeugt, die weniger genau sind, aber als Gerüste dienen können, um Contigs zu verbinden und die genomische Syntenie aufzulösen. Hybride Ansätze, die sowohl Short-Read- als auch Long-Read-Technologien verwenden, können genaue und vollständige Bakteriengenome erzeugen19.
Hier wird ein umfassendes Protokoll für die Isolierung und Identifizierung von Bakterien aus menschlichem Urin, genomische DNA-Extraktion, Sequenzierung und vollständige Genomassemblierung unter Verwendung eines hybriden Assemblierungsansatzes beschrieben. Dieses Protokoll legt besonderen Wert auf die Schritte, die notwendig sind, um Lesevorgänge richtig zu modifizieren, die durch Short-Read- und Long-Read-Sequenzierung für die genaue Montage eines geschlossenen bakteriellen Chromosoms und extrachromosomaler Elemente wie Plasmide erzeugt werden.
Das hier beschriebene umfassende Hybridgenom-Assemblierungsprotokoll bietet einen optimierten Ansatz für die erfolgreiche Kultivierung verschiedener Harnmikrobiota und Uropathogene und die vollständige Assemblierung ihrer Genome. Erfolgreiche WGS von Bakteriengenomen beginnt mit der Isolierung verschiedener und manchmal anspruchsvoller Mikroben, um ihre genomische DNA zu extrahieren. Bis heute fehlt den bestehenden Urinkulturprotokollen entweder die notwendige Empfindlichkeit, um viele Harnspezies zu erkennen, oder sie beinhalten langwierige und umfangreiche Ansätze, die längere Zeit und Ressourcen erfordern11. Der beschriebene Modified Enhanced Urine Culture-Ansatz bietet ein vereinfachtes und dennoch umfassendes Protokoll für die erfolgreiche Isolierung von Bakterien, die zu 17 häufigen Harngattungen gehören, einschließlich potenziell pathogener oder nützlicher kommensaler Spezies und sowohl fakultativer als auch obligater aerober oder anaerober Bakterien. Dies wiederum liefert das notwendige Ausgangsmaterial für eine genaue Sequenzierung und Assemblierung bakterieller Genome und für kritische phänotypische Experimente, die zum Verständnis von Harngesundheit und -krankheit beitragen. Darüber hinaus bietet dieser modifizierte Kulturansatz eine genauere klinische Diagnose von lebensfähigen Mikroorganismen, die in Urinproben vorkommen, und ermöglicht deren Biobanking für zukünftige genomische Studien. Dieses Protokoll ist jedoch nicht ohne Einschränkungen. Es kann je nach Organismus lange Inkubationszeiten sowie die Verwendung von Ressourcen wie einer Hypoxiekammer oder kontrollierten Inkubatoren erfordern, die möglicherweise nicht ohne weiteres verfügbar sind. Die Verwendung von anaeroben GasPaks bietet eine alternative Lösung, aber diese sind kostspielig und erzeugen nicht immer eine nachhaltige und kontrollierte Umgebung. Schließlich können Kulturverzerrungen sowie die Probenvielfalt es bestimmten Organismen und Uropathogenen ermöglichen, anspruchsvolle Bakterien zu übertreffen. Trotz dieser Einschränkungen wird durch diesen Ansatz eine Kultur verschiedener Harnbakterien ermöglicht.
Die genomische Sequenzierung hat mit der Weiterentwicklung der Next Generation Sequencing-Technologien an Popularität gewonnen, die sowohl die Ausbeute als auch die Genauigkeit der Sequenzierungsdaten enorm erhöht haben14,15. In Verbindung mit der Entwicklung von Algorithmen zur Datenverarbeitung und De-novo-Assemblierung stehen Anfängern und Fachwissenschaftlern komplette Genomsequenzen gleichermaßen zur Verfügung15,45. Das Wissen über die gesamte Genomorganisation, das durch vollständige Genome bereitgestellt wird, bietet wichtige evolutionäre und biologische Erkenntnisse, einschließlich Genduplikation, Genverlust und horizontaler Gentransfer14. Darüber hinaus sind Gene, die für antimikrobielle Resistenz und Virulenz wichtig sind, oft auf mobilen Elementen lokalisiert, die typischerweise nicht in Entwurfsgenomassemgruppen aufgelöst werden15,16.
Das hierin enthaltene Protokoll folgt einem hybriden Ansatz für die Kombination von Sequenzierungsdaten von Short-Read- und Long-Read-Plattformen, um vollständige Genom-Assemblierungen zu erzeugen. Während es sich auf bakterielle Genome im Urin konzentriert, kann dieses Verfahren an verschiedene Bakterien aus verschiedenen Isolationsquellen angepasst werden. Kritische Schritte in diesem Ansatz umfassen die Anwendung einer adäquaten sterilen Technik und die Verwendung geeigneter Medien- und Kulturbedingungen für die Isolierung reiner Harnbakterien. Darüber hinaus ist die Extraktion intakter, ertragreicher gDNA unerlässlich, um Sequenzierungsdaten frei von kontaminierenden Lesevorgängen zu generieren, die den Montageerfolg beeinträchtigen können. Nachfolgende Bibliotheksvorbereitungsprotokolle sind entscheidend für die Generierung von Qualitätslesevorgängen von ausreichender Länge und Tiefe. Daher ist es von äußerster Wichtigkeit, gDNA bei der Bibliotheksvorbereitung insbesondere für die Long-Read-Sequenzierung sorgfältig zu behandeln, da der größte Vorteil dieser Technologie die Generierung von langen Lesevorgängen ohne theoretische obere Längenbegrenzung ist. Ebenfalls beschrieben sind Abschnitte für die geeignete Qualitätskontrolle (QC) der Sequenzierung von Lesevorgängen, die verrauschte Daten eliminiert und das Montageergebnis verbessert.
Trotz erfolgreicher DNA-Isolierung, Bibliotheksvorbereitung und Sequenzierung kann die Art der genomischen Architektur einiger Arten immer noch ein Hindernis für die Erzeugung einer geschlossenen Genomanordnung darstellen45,46. Sich wiederholende Sequenzen erschweren oft die Montageberechnung, und trotz langer gelesener Daten können diese Bereiche mit geringer Zuverlässigkeit oder gar nicht aufgelöst werden. Lange Lesevorgänge müssen also im Durchschnitt länger sein als die größte Wiederholungsregion im Genom oder die Abdeckung muss hoch sein (>100x)19. Einige Genome können unvollständig bleiben und manuelle Ansätze zur Vervollständigung erfordern. Dennoch bestehen hybrid zusammengesetzte unvollständige Genome typischerweise aus weniger Contigs als kurz gelesene Entwurfsgenomen. Das Anpassen der Standardparameter des Baugruppenalgorithmus oder das Befolgen strengerer Cutoffs für die Lese-QC kann hilfreich sein. Alternativ besteht ein vorgeschlagener Ansatz darin, lange Lesevorgänge auf die unvollständigen Regionen auf der Suche nach Beweisen für den wahrscheinlichsten Montagepfad abzubilden und dann den Pfad unter Verwendung von PCR und Sanger-Sequenzierung der amplifizierten Region zu bestätigen. Mapping-Lesevorgänge mit Minimap2 wird vorgeschlagen und Bandage bietet ein nützliches Werkzeug für die Visualisierung von zugeordneten Lesevorgängen entlang zusammengesetzter Contigs, die Beweise für die Contig-Verknüpfungliefern 47.
Eine zusätzliche Herausforderung bei der Generierung vollständiger Genome liegt in der Vertrautheit und dem Komfort mit Befehlszeilenwerkzeugen. Viele bioinformatische Werkzeuge werden entwickelt, um jedem Benutzer Rechenmöglichkeiten zu bieten. Ihre Verwendung hängt jedoch von einem Verständnis der Grundlagen von UNIX und der Programmierung ab. Dieses Protokoll zielt darauf ab, ausreichend detaillierte Anweisungen bereitzustellen, damit Personen ohne vorherige Befehlszeilenerfahrung geschlossene Genomassemblys generieren und kommentieren können.
The authors have nothing to disclose.
Wir danken Dr. Moutusee Jubaida Islam und Dr. Luke Joyce für ihre Beiträge zu diesem Protokoll. Wir möchten auch die University of Texas am Dallas Genome Center für ihr Feedback und ihre Unterstützung danken. Diese Arbeit wurde von der Welch Foundation, Vergabenummer AT-2030-20200401 an N.J.D., von den National Institutes of Health, Preisnummer R01AI116610 an K.P., und vom Felecia and John Cain Chair in Women’s Health, gehalten von P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |