Усовершенствованный метод отбора частиц для крио-ЭМ, а именно CryoSieve, улучшает разрешение карты плотности за счет удаления большинства частиц в конечных стопках, что продемонстрировано его применением на реальном наборе данных.
За последнее десятилетие достижения в области технологии и методологии в области криогенной электронной микроскопии (крио-ЭМ) анализа одиночных частиц (СПА) значительно улучшили наши возможности по структурному исследованию биологических макромолекул с высоким разрешением. Этот прогресс открыл новую эру молекулярных знаний, заменив рентгеновскую кристаллографию в качестве доминирующего метода и дав ответы на давние вопросы биологии. Поскольку крио-ЭМ не зависит от кристаллизации, которая является существенным ограничением рентгеновской кристаллографии, она захватывает частицы различного качества. Следовательно, выбор частиц имеет решающее значение, так как качество выбранных частиц напрямую влияет на разрешение восстановленной карты плотности. Инновационный итеративный подход к выбору частиц, получивший название CryoSieve, значительно улучшает качество восстановленных карт плотности за счет эффективного уменьшения количества частиц в конечном стеке. Экспериментальные данные показывают, что этот метод может удалить большинство частиц в конечных стопках, что приводит к заметному улучшению качества карт плотности. В этой статье подробно описан рабочий процесс этого подхода и продемонстрировано его применение на реальном наборе данных.
Криогенная электронная микроскопия (крио-ЭМ) — анализ отдельных частиц (SPA) — стал доминирующим методом определения трехмерных карт плотности биологических макромолекул с высоким разрешением. Благодаря ряду технологических инноваций 1,2,3,4,5,6, получивших название «революцияразрешения 7», крио-ЭМ обладает способностью определять структуры биологических макромолекул с разрешением до атомов с беспрецедентной скоростью. Этот прорыв знаменует собой начало новой эры в молекулярном понимании, обогнав рентгеновскую кристаллографию в качестве преобладающего метода и ответив на давние биологические вопросы.
Cryo-EM SPA отличается от рентгеновской кристаллографии тем, что не требует кристаллизации биологических макромолекул. Вместо этого раствор, содержащий целевые биологические макромолекулы, быстро замораживается в стекловидном льду. Затем его визуализируют с помощью электронного луча для получения серии микрофотографий, минуя необходимостькристаллизации. Впоследствии алгоритмы отбора частиц используются для извлечения отдельных исходных частиц из этих микроизображений 4,9,10,11,12. Поскольку крио-ЭМ не зависит от кристаллизации, естественно, что извлеченные частицы преимущественно повреждены или находятся в нежелательных конформационных состояниях, что требует нескольких раундов отбора частиц для получения карты плотности с высоким разрешением. Таким образом, при обработке изображений cryo-EM SPA выбор частиц имеет решающее значение для получения карт плотности с высоким разрешением13.
В крио-ЭМ СПА стандартные методы отбора частиц включают двумерную (2D) и трехмерную (3D) классификацию14. Двухмерная классификация классифицирует частицы по заранее определенному числу групп, что дает среднее изображение и предполагаемое 2D-разрешение для каждого класса. Затем исследователи могут визуально осмотреть эти классы, удаляя частицы из групп с более низким разрешением, чтобы использовать оставшиеся в реконструкциях, направленных на достижение более высокого разрешения. После того, как с помощью алгоритмов уточнения будут установлены положения частиц, исследователи приступят к 3D-классификации, кластеризуя частицы в несколько классов. Это позволяет визуально контролировать восстановленную карту плотности для каждого класса, что позволяет исключить нежелательные частицы, например, из нежелательных конформаций. После нескольких раундов классификации получается окончательный пакет, состоящий из частиц относительно высокого качества. Эти конечные стеки играют важную роль в создании карт плотности атомного или околоатомного разрешения.
Чжу и ее коллеги продемонстрировали, что дальнейший отбор частиц может быть проведен на этих конечных стеках15. CryoSieve15, инновационный итеративный метод отбора частиц, может быть применен для повышения качества итоговой карты плотности за счет значительного уменьшения количества частиц. В то время как в настоящее время в этой области используются другие критерии сортировки частиц и программное обеспечение, такие как метод нормализованной взаимной корреляции (NCC)16, подход17 на основе углового графа (AGC) и классификация невыравнивания5, было показано, что этот метод превосходит эти алгоритмы с точки зрения эффективности.
В этом исследовании мы представляем подробное руководство по всему процессу. В качестве примера мы применили этот новый метод к набору данных тримера гемагглютинина гриппа (запись EMPIAR: 10097)18, который включает 130 000 частиц в своем окончательном стеке. Наша процедура успешно отбросила около 73,8% частиц из конечного стека этого набора данных, улучшив разрешение восстановленной карты плотности с 4,11 Å до 3,62 Å. В дополнение к тримеру гемагглютинина гриппа, результаты нескольких наборов данных представлены в более ранней публикации15, демонстрируя разнообразие разрешений и молекулярных масс биомолекул.
Крио-ЭМ является ключевым методом для выяснения структуры биологических молекул. В этом процессе, после сбора данных с помощью микроскопии, важное значение имеет извлечение частиц из микрофотографий, а затем их классификация в несколько этапов для составления окончательного стека. Общей проблемой является преобладание поврежденных или нежелательны конформированных частиц, что подчеркивает необходимость повторного отбора частиц для получения карт плотности с высоким разрешением. Это делает выбор частиц критически важным этапом в крио-ЭМ SPA для получения высококачественных карт плотности. Существующие методы отбора частиц включают алгоритм22 статистической валидации без наклона, подход23 на основе z-оценки и метод24 оценки угловой точности.
В этом контексте CryoSieve является ценным инструментом, способным удалять значительное количество посторонних частиц из конечного пакета. Это сокращение не только повышает вычислительную эффективность реконструкции, но и оптимизирует процесс. Он предлагает комплексный набор для выбора частиц, где степень отбрасывания частиц и последующее улучшение разрешения в значительной степени зависят от исходного качества данных и методологий, используемых при их обработке.
В этой рукописи мы представили полный рабочий процесс просеивания частиц с использованием реального набора данных о тримере гемагглютинина гриппа (запись EMPIAR: 10097). Шаги, рассмотренные и рассмотренные здесь, могут быть обобщены как просеивание частиц и повторная оценка позы. Окончательный 3D-реконструированный объем достиг разрешения 3,62 Å, а боковые цепи в альфа-спиралях были более четкими в обработанном объеме по сравнению с опубликованной картой плотности.
CryoSieve — это метод с открытым исходным кодом, который доступен на GitHub (https://github.com/mxhulab/cryosieve). Подробное руководство также можно найти на его главной странице. Пользователи могут установить и использовать его, следуя инструкциям по эксплуатации. Кроме того, предусмотрены два модуля: cryosieve-csrefine и cryosieve-csrhbfactor. Модуль cryosieve-csrefine специально разработан для автоматизации последовательного выполнения различных операций в CryoSPARC (Дополнительный файл 5). Эти операции включают в себя импорт стеков частиц и выполнение заданий ab initio, гомогенной или неравномерной очистки. С другой стороны, модуль cryosieve-csrhbfactor предназначен для автоматизации определения B-фактора Розенталя-Хендерсона за счет использования возможностей cryosieve-csrefine (Дополнительный файл 6).
В настоящее время применение этого метода ограничено единичными сценариями конформации. Следовательно, в тех случаях, когда частицы представляют собой множественные конформации, их возможности ограничены. Пользователям рекомендуется сначала использовать 3D-классификацию для разделения частиц разрозненных конформаций, прежде чем использовать ее для отбора уточненных частиц. Более того, несмотря на то, что метод демонстрирует мастерство в отфильтровывании более 50% частиц из конечного стека, происхождение этих отброшенных частиц и основные причины их незначительного вклада в качество реконструкции остаются неясными. Этот пробел в понимании требует дополнительных исследований для всестороннего рассмотрения и потенциального исправления этого ограничения.
Существует три возможных метода сортировки частиц или просеивания частиц. Прежде всего, cisTEM4 может сообщать оценку для каждого отдельного изображения частицы после 3D-уточнения. Пользователи могли сортировать частицы с помощью оценки cisTEM для отбрасывания частиц. Подход17 на основе консистентности углового графа (AGC) также является методом отбрасывания невыровненных частиц. Кроме того, классификация невыравнивания5 является традиционным способом отбрасывания частиц с помощью 3D-классификации. Мы сравнили качество частиц, удерживаемых этими методами, с помощью CryoSieve и обнаружили, что удерживаемые частицы CryoSieve имеют более высокоекачество15. Представленный здесь метод значительно превосходит альтернативные методы и позволяет достичь наименьшего количества частиц при том же разрешении.
Как показано в результате, большинство частиц в конечном стеке крио-ЭМ не участвуют в реконструкции карты плотности. Другими словами, среди всех частиц, собранных в процессе получения изображения, только несколько избранных, а именно самое тонкое подмножество, действительно вносят свой вклад в окончательную реконструкцию. Следовательно, отношение этого конечного подмножества к общему количеству собранных частиц может служить количественной метрикой для оценки качества образца. Чем выше это соотношение, тем лучше качество образца. Несмотря на технические достижения, которые сделали крио-ЭМ более доступной для структурных биологов, подготовка образцов остается основным узким местом в рабочем процессе. Таким образом, ученые и инженеры сосредотачивают свои усилия на решении этой задачи25. При анализе отдельных частиц (SPA) подготовка образцов состоит из двух важнейших этапов: оптимизации образца и подготовки сетки. Первый предполагает очистку образца при сохранении его оптимального биохимического состояния. Последнее включает в себя подготовку образца к анализу в микроскопе, включая химическую или плазменную обработку сетки, осаждение образца и витрификацию. Для решения проблемы макромолекулярной нестабильности было предложено множество методов, но эффективность одного подхода по сравнению с другим зависит от характеристик образца25,26. В настоящее время результаты подготовки сетки в значительной степени зависят от знаний и опыта пользователя, что может сделать процесс трудоемким и сложным27,28. Многочисленные переменные, встречающиеся при подготовке образцов и сеток, создают проблемы при установлении причинно-следственных связей, поскольку исследователи могут оценить образец только на молекулярном уровне с помощью микроскопа. В результате, количественная статистика сравнений различных протоколов подготовки выборки и сетки все еще отсутствует, и необходим системный подход для исследования тенденций и понимания фундаментальных механизмов поведения выборки.
The authors have nothing to disclose.
Эта работа была поддержана Шэньчжэньской академией исследований и перевода (для M.H.), Центром передовых инноваций в области структурной биологии (для M.H.), Пекинским пограничным исследовательским центром биологической структуры (для M.H.), Национальной ключевой программой исследований и разработок Китая (No.2021YFA1001300) (для C.B.), Национальным фондом естественных наук Китая (No.12271291) (для C.B.), и Национальный фонд естественных наук Китая (No.12071244) (для Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |