Одночастичный анализ в криоэлектронной микроскопии является одним из основных методов, используемых для определения структуры биологических ансамблей с высоким разрешением. Scipion предоставляет инструменты для создания всего конвейера для обработки информации, полученной микроскопом, и достижения 3D-реконструкции биологического образца.
Криоэлектронная микроскопия стала одним из важнейших инструментов в биологических исследованиях для выявления структурной информации макромолекул при околоатомном разрешении. При анализе одной частицы остеклованный образец визуализируется электронным пучком, и детекторы в конце колонки микроскопа производят пленки этого образца. Эти фильмы содержат тысячи изображений одинаковых частиц в случайных ориентациях. Данные должны пройти через рабочий процесс обработки изображений с несколькими шагами, чтобы получить окончательный 3D-реконструированный том. Целью рабочего процесса обработки изображений является определение параметров сбора, чтобы иметь возможность реконструировать исследуемый образец. Scipion предоставляет все инструменты для создания этого рабочего процесса с использованием нескольких пакетов обработки изображений в интегративной структуре, что также позволяет отслеживать результаты. В этой статье весь рабочий процесс обработки изображений в Scipion представлен и обсужден с данными, поступающими из реального тестового случая, давая все детали, необходимые для перехода от фильмов, полученных микроскопом, к окончательной 3D-реконструкции с высоким разрешением. Также обсуждается целесообразность использования консенсусных инструментов, позволяющих комбинировать методы, и подтверждать результаты на каждом этапе рабочего процесса, повышая точность получаемых результатов.
В криоэлектронной микроскопии (крио-ЭМ) анализ одиночных частиц (SPA) остеклованных замороженно-гидратированных образцов является одним из наиболее широко используемых и успешных вариантов визуализации биологических макромолекул, поскольку позволяет понять молекулярные взаимодействия и функцию биологических ансамблей1. Это благодаря недавним достижениям в этой технике визуализации, которые привели к «революции разрешения»2 и позволили успешно определить биологические 3D-структуры с почти атомным разрешением. В настоящее время самое высокое разрешение, достигнутое в SPA cryo-EM, составляет 1,15 Å для апоферритина3 (запись EMDB: 11668). Эти технологические достижения включают усовершенствования в подготовке образцов4, получении изображения5 и методах обработки изображений6. Эта статья посвящена этому последнему пункту.
Вкратце, целью методов обработки изображений является идентификация всех параметров сбора для инверсии процесса визуализации микроскопа и восстановления 3D-структуры изучаемого биологического образца. Этими параметрами являются усиление камеры, движение, индуцированное лучом, аберрации микроскопа (в основном расфокусировка), 3D-угловая ориентация и трансляция каждой частицы, а также конформационное состояние в случае наличия образца с конформационными изменениями. Однако количество параметров очень велико и крио-ЭМ требует использования низкодозных изображений, чтобы избежать радиационного повреждения, что значительно снижает отношение сигнал/шум (SNR) полученных изображений. Таким образом, задача не может быть однозначно решена и все параметры, подлежащие расчету, могут быть только оценками. В ходе рабочего процесса обработки изображения следует определить правильные параметры, отбросив оставшиеся, чтобы наконец получить 3D-реконструкцию с высоким разрешением.
Данные, генерируемые микроскопом, собираются в кадрах. Упрощая, кадр содержит количество электронов, которые достигли определенного положения (пикселя) на изображении, всякий раз, когда используются детекторы подсчета электронов. В определенном поле зрения собирается несколько кадров и это называется фильмом. Поскольку низкие дозы электронов используются, чтобы избежать радиационного повреждения, которое может разрушить образец, SNR очень низкий, и кадры, соответствующие одному и тому же фильму, должны быть усреднены для получения изображения, раскрывающего структурную информацию о образце. Однако применяется не только простое среднее значение, образец может страдать от сдвигов и других видов движений во время визуализации из-за движения, вызванного лучом, которое необходимо компенсировать. Кадры со смещенной компенсацией и усредненные кадры создают микрофотографию.
Как только микроснимки получены, нам нужно оценить аберрации, введенные микроскопом для каждого из них, называемые контрастной передаточной функцией (CTF), которая представляет изменения контраста микрофотографии как функцию частоты. Затем частицы могут быть выбраны и извлечены, что называется отбором частиц. Каждая частица должна представлять собой небольшое изображение, содержащее только одну копию исследуемого образца. Существует три семейства алгоритмов выбора частиц: 1) те, которые используют только некоторую базовую параметризацию внешнего вида частицы, чтобы найти их во всем наборе микроснимков (например, размер частиц), 2) те, которые узнают, как выглядят частицы от пользователя или предварительно обученного набора, и 3) те, которые используют шаблоны изображений. Каждая семья имеет разные свойства, которые будут показаны позже.
Извлеченный набор частиц, обнаруженных на микроснимках, будет использоваться в процессе 2D-классификации, который имеет две цели: 1) очистка набора частиц путем отбрасывания подмножества, содержащего чистые шумовые изображения, перекрывающиеся частицы или другие артефакты, и 2) усредненные частицы, представляющие каждый класс, могут быть использованы в качестве начальной информации для расчета начального объема 3D.
Расчет начального объема в 3D является следующим важным шагом. Проблему получения 3D-структуры можно рассматривать как задачу оптимизации в многомерном ландшафте решений, где глобальный минимум является лучшим 3D-объемом, представляющим исходную структуру, но можно найти несколько локальных минимумов, представляющих неоптимальные решения, и где очень легко попасть в ловушку. Начальный объем представляет собой отправную точку для процесса поиска, поэтому плохая первоначальная оценка объема может помешать нам найти глобальный минимум. Из начального объема этап 3D-классификации поможет обнаружить различные конформационные состояния и снова очистить набор частиц; цель состоит в том, чтобы получить структурно однородную популяцию частиц. После этого этап 3D-уточнения будет отвечать за уточнение угловых и трансляционных параметров для каждой частицы, чтобы получить наилучший возможный 3D-объем.
Наконец, на последних этапах полученную 3D-реконструкцию можно заточить и отполировать. Резкость – это процесс повышения высоких частот реконструируемого объема, а полировка – это шаг для дальнейшего уточнения некоторых параметров, таких как CTF или компенсация движения, вызванная пучком, на уровне частиц. Кроме того, некоторые процедуры проверки могут быть использованы для лучшего понимания достигнутого решения в конце рабочего процесса.
После всех этих этапов процессы трассировки и стыковки7 помогут придать биологический смысл полученной 3D-реконструкции, путем построения атомных моделей de novo или подгонки существующих моделей. Если будет достигнуто высокое разрешение, эти процессы расскажут нам о положении биологических структур, даже различных атомов, в нашей структуре.
Scipion8 позволяет создать весь рабочий процесс, объединяя наиболее релевантные пакеты обработки изображений интегративным способом. Xmipp9, Relion10, CryoSPARC11, Eman12, Spider13, Cryolo14, Ctffind15, CCP416, Phenix17 и многие другие пакеты могут быть включены в Scipion. Кроме того, он включает в себя все необходимые инструменты для улучшения интеграции, совместимости, прослеживаемости и воспроизводимости, чтобы обеспечить полное отслеживание всего рабочего процесса обработки изображений8.
Одним из самых мощных инструментов, которые Scipion позволяет нам использовать, является консенсус, что означает сравнение результатов, полученных несколькими методами на одном этапе обработки, делая комбинацию информации, передаваемой различными методами, для получения более точного вывода. Это может помочь повысить производительность и улучшить достигнутое качество в расчетных параметрах. Обратите внимание, что более простой рабочий процесс может быть построен без использования консенсусных методов; однако мы видели мощь этого инструмента22,25, и рабочий процесс, представленный в этой рукописи, будет использовать его в несколько этапов.
Все шаги, которые были кратко изложены в предыдущих пунктах, будут подробно объяснены в следующем разделе и объединены в полный рабочий процесс с использованием Scipion. Кроме того, будет показано, как использовать инструменты консенсуса для достижения более высокого согласия в генерируемых результатах. С этой целью был выбран пример набора данных рибосомы Plasmodium falciparum 80S (запись EMPIAR: 10028, запись EMDB: 2660). Набор данных состоит из 600 фильмов по 16 кадров размером 4096×4096 пикселей при размере пикселя 1,34Å, снятых на FEI POLARA 300 с камерой FEI FALCON II, с заявленным разрешением в EMDB 3,2Å18 .
В настоящее время крио-ЭМ является ключевым инструментом для выявления 3D-структуры биологических образцов. При сборе хороших данных с помощью микроскопа имеющиеся инструменты обработки позволят получить 3D-реконструкцию исследуемой макромолекулы. Крио-ЭМ обработка данных способна достичь почти атомного разрешения, что является ключом к пониманию функционального поведения макромолекулы, а также имеет решающее значение в открытии лекарств.
Scipion – это программное обеспечение, которое позволяет создать весь рабочий процесс, объединяющий наиболее релевантные пакеты обработки изображений интегративным образом, что помогает прослеживаемости и воспроизводимости всего рабочего процесса обработки изображений. Scipion предоставляет очень полный набор инструментов для проведения обработки; однако получение реконструкций с высоким разрешением полностью зависит от качества полученных данных и способа их обработки.
Чтобы получить 3D-реконструкцию с высоким разрешением, первым требованием является получение хороших фильмов из микроскопа, которые сохраняют структурную информацию до высокого разрешения. Если это не так, рабочий процесс не сможет извлекать информацию высокой четкости из данных. Затем успешный рабочий процесс обработки должен иметь возможность извлекать частицы, которые действительно соответствуют структуре, и находить ориентации этих частиц в 3D-пространстве. Если какой-либо из шагов рабочего процесса завершится ошибкой, качество восстановленного тома будет ухудшаться. Scipion позволяет использовать различные пакеты на любом из этапов обработки, что помогает найти наиболее адекватный подход к обработке данных. Кроме того, благодаря наличию большого количества пакетов, можно использовать инструменты консенсуса, которые повышают точность, находя согласие в предполагаемых результатах различных методов. Кроме того, в разделе «Репрезентативные результаты» подробно обсуждаются несколько инструментов проверки и способы выявления точных и неточных результатов на каждом этапе рабочего процесса, выявления потенциальных проблем и способов их решения. Вдоль протокола есть несколько контрольных точек, которые могут помочь понять, работает ли протокол правильно или нет. Некоторые из наиболее актуальных: комплектация, 2D-классификация, первоначальная оценка объема и 3D-выравнивание. Проверка входных данных, повторение шага с помощью другого метода или использование консенсуса — это варианты, доступные в Scipion, которые пользователь может использовать для поиска решений при возникновении проблем.
Что касается предыдущих подходов к интеграции пакетов в области Cryo-EM, Appion31 является единственным, который позволяет реально интегрировать различные программные пакеты. Однако Appion тесно связан с Leginon32, системой автоматизированного сбора изображений с электронных микроскопов. Основное отличие от Scipion заключается в том, что модель данных и хранилище менее связаны. Таким образом, чтобы создать новый протокол в Scipion, нужно разработать только скрипт Python. Однако в Appion разработчик должен написать сценарий и изменить базовую базу данных. Таким образом, Scipion был разработан для упрощения обслуживания и расширяемости.
В этой рукописи мы представили полный рабочий процесс для обработки Cryo-EM, используя реальный набор данных Plasmodium falciparum 80S Ribosome (запись EMPIAR: 10028, запись EMDB: 2660). Этапы, рассмотренные и обсуждаемые здесь, могут быть обобщены как выравнивание фильма, оценка CTF, выбор частиц, 2D-классификация, первоначальная оценка карты, 3D-классификация, 3D-уточнение, оценка и постобработка. Были использованы различные пакеты, и на нескольких из этих шагов были применены инструменты консенсуса. Окончательный 3D-реконструированный объем достиг разрешения 3 Å, и в постобработанном объеме можно выделить некоторые вторичные структуры, такие как альфа-спирали, что помогает описать, как атомы расположены в пространстве.
Рабочий процесс, представленный в этой рукописи, показывает, как Scipion может быть использован для объединения различных пакетов Cryo-EM простым и интегративным способом, чтобы упростить обработку и одновременно получить более надежный результат.
В будущем разработка новых методов и пакетов будет продолжать расти, а программное обеспечение, такое как Scipion, для легкой интеграции всех из них будет еще более важным для исследователей. Консенсусные подходы будут более актуальными уже тогда, когда будет доступно множество методов с различной базой, помогающих получить более точные оценки всех параметров, задействованных в процессе реконструкции в Крио-ЭМ. Отслеживание и воспроизводимость являются ключевыми в исследовательском процессе и их легче достичь с помощью Scipion благодаря наличию общей структуры для выполнения полных рабочих процессов.
The authors have nothing to disclose.
Авторы хотели бы отметить экономическую поддержку со стороны: Министерства науки и инноваций Испании посредством грантов: PID2019-104757RB-I00/AEI/10.13039/501100011033, «Comunidad Autónoma de Madrid» через грант: S2017/BMD-3817, Instituto de Salud Carlos III, PT17/0009/0010 (ISCIII-SGEFI/ERDF), Европейского Союза (ЕС) и Horizon 2020 через грант: INSTRUCT – ULTRA (INFRADEV-03-2016-2017, Предложение: 731005), EOSC Life (INFRAEOSC-04-2018, Предложение: 824087), iNEXT – Discovery (Предложение: 871037) и HighResCells (ERC – 2018 – SyG, Предложение: 810057). Проект, который привел к этим результатам, получил поддержку стипендии от Фонда «La Caixa» (ID 100010434). Код стипендии — LCF/BQ/DI18/11660021. Этот проект получил финансирование от исследовательской и инновационной программы Европейского Союза Horizon 2020 в рамках грантового соглашения Марии Склодовской-Кюри No 713673. Авторы признают поддержку и использование ресурсов проекта Instruct, Landmark ESFRI.