Этот протокол детализирует комплексный подход к культивированию, секвенированию и сборке гибридного генома мочевых бактерий de novo. Он обеспечивает воспроизводимую процедуру для генерации полных, круговых последовательностей генома, полезных для изучения как хромосомных, так и внехромосомных генетических элементов, способствующих колонизации мочи, патогенезу и распространению устойчивости к противомикробным препаратам.
Полные последовательности генома предоставляют ценные данные для понимания генетического разнообразия и уникальных факторов колонизации мочевых микробов. Эти данные могут включать подвижные генетические элементы, такие как плазмиды и внехромосомный фаг, которые способствуют распространению устойчивости к противомикробным препаратам и еще больше усложняют лечение инфекции мочевыводящих путей (ИМП). В дополнение к обеспечению точного разрешения структуры генома, полные, закрытые геномы позволяют проводить детальную сравнительную геномику и эволюционный анализ. Генерация полных геномов de novo уже давно является сложной задачей из-за ограничений доступной технологии секвенирования. Парное секвенирование следующего поколения (NGS) обеспечивает высококачественное короткое чтение, часто приводящее к точным, но фрагментированным сборкам генома. Напротив, секвенирование nanopore обеспечивает длительное чтение более низкого качества, что обычно приводит к подверженным ошибкам полным сборкам. Такие ошибки могут препятствовать общегеномным исследованиям ассоциаций или давать вводящие в заблуждение результаты анализа вариантов. Поэтому гибридные подходы, сочетающие как короткие, так и длинные чтения, стали надежными методами достижения высокоточных закрытых бактериальных геномов. В настоящем документе представлен комплексный способ культивирования разнообразных мочевых бактерий, идентификации видов путем секвенирования гена 16S рРНК, экстракции геномной ДНК (гДНК) и генерации коротких и длинных считываний платформами NGS и Nanopore соответственно. Кроме того, этот метод описывает биоинформационный конвейер алгоритмов контроля качества, сборки и прогнозирования генов для генерации аннотированных полных последовательностей генома. Сочетание биоинформационных инструментов позволяет выбирать высококачественные считываемые данные для сборки гибридного генома и последующего анализа. Упрощенный подход к гибридной сборке генома de novo, описанный в этом протоколе, может быть адаптирован для использования в любых культивируемых бактериях.
Мочевой микробиом является новой областью исследований, которая разрушила многолетнее заблуждение о том, что мочевыводящие пути стерильны у здоровых людей. Члены мочевой микробиоты могут служить для балансировки мочевой среды и предотвращения инфекции мочевыводящих путей (ИМП)1,2. Уропатогенные бактерии вторгаются в мочевыводящие пути и используют различные механизмы вирулентности для вытеснения резидентной микробиоты, колонизации уротелия, уклонения от иммунных реакций и противодействия давлению окружающей среды3,4. Моча представляет собой относительно питательную среду, характеризующуюся высокой осмолярностью, ограниченной доступностью азота и углеводов, низкой оксигенацией и низким рН5,6,7. Моча также считается противомикробной, состоящей из высоких концентраций ингибирующей мочевины и антимикробных пептидов, таких как человеческий кателицидин LL-378. Изучение механизмов, используемых как резидентными бактериями, так и уропатогенами для колонизации мочевыводящих путей, имеет решающее значение для дальнейшего понимания здоровья мочевыводящих путей и разработки новых стратегий лечения ИМП. Кроме того, по мере того, как неудача передовой антимикробной терапии становится все более распространенной, все более важно контролировать распространение мобильных генетических элементов, несущих детерминанты устойчивости к противомикробным препаратам, в популяциях мочевых бактерий9,10.
Для исследования генотипов и фенотипов мочевых бактерий необходима их успешная культивирование и последующее секвенирование всего генома (WGS). Культурозависимые методы необходимы для обнаружения и идентификации жизнеспособных микробов в образцах мочи11. Стандартный клинический посев мочи включает нанесение мочи на 5% агар овечьей крови (BAP) и агар Макконки и аэробную инкубацию при 35 °C в течение 24 ч12. Однако при пороге обнаружения ≥105 КОЕ/мл13многие члены мочевой микробиоты не сообщаются этим методом. Улучшенные методы культивирования, такие как Enhanced Quantitative Urine Culture (EQUC)11, используют различные комбинации различных объемов мочи, времени инкубации, питательных сред и атмосферных условий для идентификации микробов, обычно пропускаемых стандартным посевом мочи. В этом протоколе описана модифицированная версия EQUC, называемая здесь модифицированным протоколом расширенной культуры мочи, которая позволяет культивировать различные мочевые бактерии и уропатогены с использованием селективных сред и оптимальных атмосферных условий, но по своей сути не является количественной. Успешная изоляция мочевых бактерий позволяет экстрагировать геномную ДНК (гДНК) для последующей WGS и сборки генома.
Сборки генома, в частности, полные сборки, позволяют обнаружить генетические факторы, которые могут способствовать колонизации, поддержанию ниши и вирулентности как среди резидентной микробиоты, так и среди уропатогенных бактерий. Черновые сборки генома содержат разнообразное количество смежных последовательностей (contigs), которые могут содержать ошибки секвенирования и отсутствие информации об ориентации. В полной сборке генома как ориентация, так и точность каждой пары оснований были проверены14. Кроме того, получение полных последовательностей генома дает представление о структуре генома, генетическом разнообразии и мобильных генетических элементах15. Короткие чтения сами по себе могут идентифицировать наличие или отсутствие важных генов, но не могут точно определить их геномный контекст16. Благодаря технологиям секвенирования с длительным считыванием, таким как Oxford Nanopore и PacBio, создание закрытых de novo сборок бактериальных геномов больше не требует напряженных методов, таких как ручное закрытие сборок de novo мультиплекснойПЦР 17,18. Сочетание технологий секвенирования с коротким считыванием Next Generation и технологий секвенирования с длинным считыванием Nanopore позволяет легко генерировать точные, полные и закрытые сборки бактериального генома при относительно низкихзатратах19. Короткочитаемое секвенирование производит точные, но фрагментированные сборки генома, обычно состоящие в среднем из 40-100 контигов, в то время как секвенирование нанопор генерирует длинные чтения длиной около 5-100 кб, которые менее точны, но могут служить каркасами для соединения контигов и разрешения геномной синтении. Гибридные подходы, использующие как технологии короткого, так и длинного чтения, могут производить точные и полные бактериальные геномы19.
Здесь описан комплексный протокол для выделения и идентификации бактерий из мочи человека, геномной экстракции ДНК, секвенирования и полной сборки генома с использованием гибридного подхода к сборке. Этот протокол обеспечивает особый акцент на шагах, необходимых для правильной модификации считываний, генерируемых коротким и длинным секвенированием для точной сборки закрытой бактериальной хромосомы и внехромосомных элементов, таких как плазмиды.
Комплексный протокол сборки гибридного генома, описанный здесь, предлагает упрощенный подход для успешного культивирования разнообразной мочевой микробиоты и уропатогенов, а также полной сборки их геномов. Успешная WGS бактериальных геномов начинается с выделения разнообразных и иногда привередливых микробов с целью извлечения их геномной ДНК. На сегодняшний день существующие протоколы посева мочи либо не обладают необходимой чувствительностью для обнаружения многих видов мочеиспускания, либо включают длительные и обширные подходы, требующие длительного времени и ресурсов11. Описанный модифицированный улучшенный подход к посеву мочи предлагает упрощенный, но всеобъемлющий протокол для успешной изоляции бактерий, принадлежащих к 17 общим мочевым родам, включая потенциально патогенные или полезные комменсальные виды, а также факультативные и облигатные аэробные или анаэробные бактерии. Это, в свою очередь, обеспечивает необходимый исходный материал для точного секвенирования и сборки бактериальных геномов и для критических фенотипических экспериментов, которые способствуют пониманию здоровья и заболеваний мочеиспускания. Кроме того, этот модифицированный культуральный подход обеспечивает более определенную клиническую диагностику жизнеспособных микроорганизмов, обнаруженных в образцах мочи, и позволяет проводить их биобанк для будущих геномных исследований. Однако этот протокол не лишен ограничений. Это может потребовать длительного времени инкубации в зависимости от организма, а также использования ресурсов, таких как камера гипоксии или контролируемые инкубаторы, которые могут быть недоступны. Использование анаэробных газовых пакетов предлагает альтернативное решение, но они являются дорогостоящими и не всегда создают устойчивую и контролируемую среду. Наконец, смещение культуры, а также разнообразие образцов могут позволить определенным организмам и уропатогенам превзойти привередливые бактерии. Несмотря на эти ограничения, культура разнообразных мочевых бактерий становится возможной благодаря такому подходу.
Геномное секвенирование приобрело популярность с развитием технологий секвенирования следующего поколения, которые значительно увеличили как выход, так и точность данных секвенирования14,15. В сочетании с разработкой алгоритмов обработки данных и сборки de novo, полные последовательности генома находятся на кончиках пальцев как начинающих, так и опытных ученых15,45. Знания об общей организации генома, обеспечиваемые полными геномами, предлагают важные эволюционные и биологические идеи, включая дупликацию генов, потерю генов и горизонтальный перенос генов14. Кроме того, гены, важные для устойчивости к противомикробным препаратам и вирулентности, часто локализуются на подвижных элементах, которые обычно не разрешаются в черновых сборках генома15,16.
Протокол в настоящем документе следует гибридному подходу для комбинации данных секвенирования с платформ короткого и длинного чтения для создания полных сборок генома. Хотя эта процедура сосредоточена на геномах мочевых бактерий, она может быть адаптирована к различным бактериям из различных источников изоляции. Критические шаги в этом подходе включают следование адекватной стерильной технике и использование соответствующих сред и условий культивирования для выделения чистых мочевых бактерий. Кроме того, извлечение неповрежденной высокопроизводительной гДНК имеет важное значение для генерации данных секвенирования, свободных от загрязняющих считываний, которые могут препятствовать успеху сборки. Последующие протоколы подготовки библиотек имеют решающее значение для создания качественных чтений достаточной длины и глубины. Поэтому крайне важно обращаться с гДНК с осторожностью во время подготовки библиотеки к секвенированию длительного чтения, в частности, поскольку самым большим преимуществом этой технологии является генерация длинных считываний без теоретического верхнего предела длины. Также выделены разделы для надлежащего контроля качества (QC) последовательности считывания, которая устраняет шумные данные и улучшает результаты сборки.
Несмотря на успешную изоляцию ДНК, подготовку библиотек и секвенирование, природа геномной архитектуры некоторых видов все еще может служить препятствием для генерации закрытой сборки генома45,46. Повторяющиеся последовательности часто усложняют вычисления сборки, и, несмотря на данные длительного чтения, эти области могут быть разрешены с низкой степенью достоверности или вообще не разрешаться. Таким образом, длительное чтение должно быть в среднем длиннее, чем самая большая повторяющаяся область в геноме, или покрытие должно быть высоким (>100x)19. Некоторые геномы могут оставаться неполными и требуют ручных подходов для завершения. Тем не менее, гибридные собранные неполные геномы, как правило, состоят из меньшего количества контигов, чем короткочитаемые черновые геномы. Настройка параметров алгоритма сборки по умолчанию или следование более строгим отсечкам для контроля качества чтения может помочь. В качестве альтернативы, один из предлагаемых подходов заключается в отображении длинных считываний в неполные области в поисках доказательств наиболее вероятного пути сборки, а затем в подтверждении пути с использованием СЕКВР и секвенирования Сэнгера амплифицированной области. Предлагается картографирование считываний с использованием Minimap2, и Bandage предлагает полезный инструмент для визуализации сопоставленных считываний вдоль собранных контигов, предоставляя доказательства связи contig47.
Дополнительная проблема при создании полных геномов заключается в знакомстве и комфорте с инструментами командной строки. Многие биоинформационные инструменты разработаны, чтобы предложить вычислительные возможности любому пользователю; однако их использование зависит от понимания основ UNIX и программирования. Этот протокол направлен на предоставление достаточно подробных инструкций, позволяющих людям без предварительного опыта работы в командной строке генерировать закрытые сборки генома и аннотировать их.
The authors have nothing to disclose.
Мы благодарим д-ра Мутузи Джубайду Ислама и д-ра Люка Джойса за их вклад в этот протокол. Мы также хотели бы поблагодарить Техасский университет в Далласском геномном центре за их отзывы и поддержку. Эта работа финансировалась Фондом Уэлча, номером награды AT-2030-20200401 для N.J.D., Национальными институтами здравоохранения, номером награды R01AI116610 для K.P., и кафедрой Фелесии и Джона Кейна в области женского здоровья, проводимой P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |