В этой статье объясняется, как использовать машинное обучение под наблюдением моделирования для анализа морфологии митохондрий во флуоресцентных микроскопических изображениях фиксированных клеток.
Количественный анализ субклеточных органелл, таких как митохондрии в изображениях клеточной флуоресцентной микроскопии, является сложной задачей из-за присущих проблем в сегментации этих небольших и морфологически разнообразных структур. В этой статье мы демонстрируем использование конвейера сегментации и анализа с помощью машинного обучения для количественной оценки морфологии митохондрий в флуоресцентных микроскопических изображениях фиксированных клеток. Инструмент сегментации на основе глубокого обучения обучается на смоделированных изображениях и устраняет необходимость в аннотациях наземной истины для контролируемого глубокого обучения. Мы демонстрируем полезность этого инструмента на флуоресцентных микроскопических изображениях фиксированных кардиомиобластов со стабильной экспрессией флуоресцентных маркеров митохондрий и используем специфические условия клеточной культуры для индуцирования изменений в морфологии митохондрий.
В этой статье мы демонстрируем полезность физического инструмента машинного обучения для субклеточной сегментации1 в флуоресцентных микроскопических изображениях фиксированных кардиомиобластов, экспрессирующих флуоресцентные маркеры митохондрий.
Митохондрии являются основными энергопроизводящими органеллами в клетках млекопитающих. В частности, митохондрии являются высокодинамичными органеллами и часто встречаются в сетях, которые постоянно меняются по длине и ветвятся. Форма митохондрий влияет на их функцию, и клетки могут быстро изменять свою митохондриальную морфологию, чтобы адаптироваться к изменениям в окружающей среде2. Чтобы понять это явление, морфологическая классификация митохондрий как точек, стержней или сетей очень информативна3.
Сегментация митохондрий имеет решающее значение для анализа морфологии митохондрий в клетках. Современные методы сегментирования и анализа флуоресцентных микроскопических изображений митохондрий основаны на ручной сегментации или традиционных подходах к обработке изображений. Подходы, основанные на порогах, такие как Otsu4, менее точны из-за высокого уровня шума в микроскопических изображениях. Как правило, изображения для морфологического анализа митохондрий имеют большое количество митохондрий, что делает ручную сегментацию утомительной. Математические подходы, такие как MorphoLibJ5 и полуконтролируемые подходы машинного обучения, такие как Weka6 , очень требовательны и требуют экспертных знаний. Обзор методов анализа изображений для митохондрий7 показал, что методы, основанные на глубоком обучении, могут быть полезны для этой задачи. Действительно, сегментация изображений в изображениях повседневной жизни для таких приложений, как самостоятельное вождение, была революционизирована с использованием моделей, основанных на глубоком обучении.
Глубокое обучение — это подмножество машинного обучения, которое предоставляет алгоритмы, которые учатся на больших объемах данных. Контролируемые алгоритмы глубокого обучения изучают отношения из больших наборов изображений, которые аннотированы их метками истинности (GT). Проблемы использования контролируемого глубокого обучения для сегментации митохондрий в изображениях флуоресцентной микроскопии двояки. Во-первых, контролируемое глубокое обучение требует большого набора данных обучающих изображений, и, в случае флуоресцентной микроскопии, предоставление этого большого набора данных будет обширной задачей по сравнению с использованием более легкодоступных традиционных изображений на основе камеры. Во-вторых, флуоресцентная микроскопия изображений требует ГТ аннотаций объектов, представляющих интерес в обучающих изображениях, что является утомительной задачей, требующей экспертных знаний. Эта задача может легко занять часы или дни времени эксперта для получения одного изображения клеток с флуоресцентно мечеными субклеточными структурами. Более того, различия между аннотаторами создают проблему. Чтобы устранить необходимость в ручной аннотации и иметь возможность использовать превосходную производительность методов глубокого обучения, здесь была использована модель сегментации на основе глубокого обучения, которая была обучена на смоделированных изображениях. Физические симуляторы обеспечивают способ имитировать и контролировать процесс формирования изображений в микроскопе, позволяя создавать изображения известных форм. Используя физический симулятор, для этой цели был создан большой набор данных смоделированных флуоресцентных микроскопических изображений митохондрий.
Моделирование начинается с генерации геометрии с использованием параметрических кривых для генерации фигур. Излучатели случайным образом размещаются на поверхности формы равномерно распределенным образом, так что плотность соответствует экспериментальным значениям. Функция 3D-разброса точек (PSF) микроскопа вычисляется с использованием вычислительно эффективного приближения8 модели Гибсона-Ланни9. Чтобы точно сопоставить смоделированные изображения с экспериментальными изображениями, эмулируются как темный ток, так и шум снимка для достижения фотореализма. Физический GT генерируется в виде двоичной карты. Код для генерации набора данных и обучения имитационной модели доступен10, а шаг создания этого моделируемого набора данных описан на рисунке 1.
Мы демонстрируем полезность сегментации на основе глубокого обучения, обученной полностью на моделируемом наборе данных путем анализа изображений конфокальной микроскопии фиксированных кардиомиобластов. Эти кардиомиобласты экспрессировали флуоресцентный маркер в митохондриальной наружной мембране, что позволило визуализировать митохондрии на изображениях флуоресцентной микроскопии. До проведения эксперимента, приведенного здесь в качестве примера, клетки были лишены глюкозы и адаптированы к галактозе в течение 7 дней в культуре. Замена глюкозы в среде роста галактозой заставляет клетки в культуре становиться более окислительными и, таким образом, зависеть от своих митохондрий для производства энергии11,12. Кроме того, это делает клетки более чувствительными к повреждению митохондрий. Изменения морфологии митохондрий могут быть экспериментально индуцированы путем добавления митохондриального разъединяющего агента, такого как карбонилцианид м-хлорфенилгидразон (CCCP), к среде13 клеточной культуры. CCCP приводит к потере митохондриального мембранного потенциала (ΔΨm) и, таким образом, приводит к изменениям в митохондриях от более трубчатой (палочковидной) к более шаробулярной (точечной) морфологии14. Кроме того, митохондрии, как правило, набухают во время лечения CCCP15. Мы показываем морфологическое распределение изменений митохондрий, когда адаптированные к галактозе кардиомиобласты лечились митохондриальным разъединителем CCCP. Сегментация митохондрий глубокого обучения позволила нам классифицировать их как точки, стержни или сети. Затем мы вывели количественные метрики для оценки длины ветвей и обилия различных митохондриальных фенотипов. Этапы анализа описаны на рисунке 2, а детали клеточной культуры, визуализации, создания набора данных для сегментации на основе глубокого обучения, а также количественного анализа митохондрий приведены ниже.
Мы обсуждаем меры предосторожности, связанные с критическими шагами в протоколе, в пунктах «генерация геометрии» и «параметры симулятора». В параграфе под названием «трансферное обучение» обсуждаются модификации для повышения пропускной способности при адаптации к нескольким микроскопам. Параграфы об «анализе частиц» и «создании других субклеточных структур» относятся к будущим применениям этого метода. В параграфе об «отличии от биологической истины» обсуждаются различные причины, по которым моделирование может отличаться от реальных данных, и влияют ли эти причины на наше приложение. Наконец, мы обсуждаем сложный сценарий для нашего метода в пункте «плотно упакованные структуры».
Генерация геометрии
Для генерации 3D-геометрии митохондрий простая 2D-структура, созданная из кривых b-сплайна в виде скелетов, хорошо подходит для создания синтетического набора данных. Эти синтетические формы тесно имитируют формы митохондрий, наблюдаемых в 2D-культурах клеток. Однако в случае 3D-ткани, такой как сердечная ткань, форма и расположение митохондрий совершенно иные. В таких случаях производительность модели сегментации может улучшиться с добавлением направленности в моделируемые изображения.
Параметры симулятора
Следует проявлять осторожность при настройке параметров симулятора, чтобы убедиться, что они соответствуют параметрам данных для выполнения вывода, так как неспособность сделать это может привести к снижению производительности сегментации. Одним из таких параметров является диапазон отношения сигнал/шум (SNR). Диапазон SNR тестируемых данных должен совпадать со значениями моделируемого набора данных. Кроме того, используемый PSF должен совпадать с целевыми тестовыми данными. Например, обученные модели изображения из конфокального PSF не должны использоваться для тестирования изображений с эпифлуоресцентного микроскопа. Еще одним параметром, на который следует обратить внимание, является использование дополнительного увеличения в тестовых данных. Если в тестовых данных использовалось дополнительное увеличение, имитатор также должен быть установлен соответствующим образом.
Трансфер обучения
Трансферное обучение — это феномен использования изученной модели, обученной на одной задаче, для использования в другой задаче. Это явление также применимо к нашей проблеме в отношении различных типов данных микроскопа. Веса модели сегментации (поставляемой с исходным кодом), которая обучается на одном типе данных микроскопии, могут быть использованы для инициализации модели сегментации, которая будет использоваться на другом типе данных оптического микроскопа. Это позволяет нам обучаться на значительно меньшем подмножестве обучающего набора данных (3000 изображений по сравнению с 10 000), тем самым снижая вычислительные затраты на моделирование.
Анализ частиц
Анализ частиц также может быть выполнен на сегментированных масках. Это может предоставить информацию о площади и искривлении и т. Д. Отдельных митохондрий. Эта информация также может служить метрикой для количественного сравнения митохондрий (не используется для этого эксперимента). Например, в настоящее время мы определяем морфологию точек, используя порог, основанный на длине митохондрий. В некоторых случаях может быть полезно включить эллиптичность, чтобы лучше отделить небольшие палочкоподобные митохондрии от пунктов или точечных митохондрий. В качестве альтернативы, если определенные биологические условия заставляют митохондрии сворачиваться, то количественная оценка кривизны может представлять интерес для анализа популяции митохондрий.
Генерация других субклеточных структур
Сегментация субклеточных структур на основе физики была продемонстрирована для митохондрий и везикул1. Хотя везикулы имеют различные формы, их размеры меньше, и они выглядят как простые сферы при наблюдении через флуоресцентный микроскоп. Следовательно, геометрия везикул моделируется с использованием сферических структур соответствующего диапазона диаметров. Это подразумевает изменение функции, порождающей геометрию (цилиндры в случае митохондрий и сферы в случае везикул) структур и соответствующих параметров (шаг 5.4 в разделе протокола). Геометрически эндоплазматический ретикулум и микротрубочки также были смоделированы как трубчатые структуры17. Моделирование эндоплазматического ретикулума диаметром 150 нм и микротрубочек со средним наружным диаметром 25 нм и внутренней полой трубки диаметром 15 нм обеспечивает приближения форм этих структур. Другим параметром, который будет варьироваться для каждой из этих субклеточных структур, является плотность флуорофора. Это рассчитывается исходя из распределения биомолекулы, с которой связываются флуорофоры, и вероятности связывания.
Отличие от биологической базовой истины
Смоделированные данные, используемые для имитационного обучения модели глубокого обучения, во многом отличаются от реальных данных. i) отсутствие неспецифической маркировки в моделируемых данных отличается от реальных данных, поскольку в реальных данных часто присутствуют свободно плавающие флуорофоры. Это приводит к более высокому среднему фоновому значению в реальном изображении. Эта разница смягчается путем сопоставления SNR и установки фонового значения таким образом, чтобы оно соответствовало наблюдаемым реальным значениям. ii) Движение субклеточных структур и фотокинетика являются двумя источниками динамики в системе. Движущиеся структуры в живых клетках (которые движутся в диапазоне нескольких миллисекунд) вызывают размытие движения. Время экспозиции сокращается во время сбора реальных данных, чтобы избежать эффекта размытия. С другой стороны, мы не моделируем таймлапс и не предполагаем неподвижные структуры; это предположение справедливо, когда время экспозиции в реальных данных невелико. Однако это предположение может привести к ошибке в выходных данных, если время экспозиции реальных данных достаточно велико, чтобы привести к размытию движения. Фотокинетика, с другой стороны, находится в порядке от наносекунд до микросекунд и может быть опущена при моделировании, поскольку обычное время экспозиции экспериментов достаточно велико (порядка миллисекунд), чтобы усреднить эффекты фотокинетики. iii) Шум в микроскопических изображениях имеет разные источники, и эти источники имеют различные функции плотности вероятности. Вместо того, чтобы моделировать эти отдельные источники шума, мы аппроксимируем его как гауссовский шум на постоянном фоне. Эта разница существенно не изменяет распределение данных для условий низкого отношения сигнал/фон (в диапазоне 2-4) и при работе с макроплотностью флуорофоров1. (iv) Артефакты в изображениях могут возникать в результате аберраций, дрейфа и систематического размытия. Мы предполагаем, что микроскоп хорошо выровнен и что области, выбранные для анализа в реальных данных, лишены этих артефактов. Существует также возможность моделирования некоторых из этих артефактов в PSF 18,19,20.
Плотно упакованные конструкции
Трудности с невозможностью дифференцировать перекрывающиеся стержни от сетей являются постоянной проблемой при сегментации данных 2D-микроскопии. Чрезвычайно сложный сценарий представлен на рисунке 5, где митохондрии плотно упакованы, что приводит к неоптимальным результатам в модели сегментации и последующем анализе. Несмотря на эту проблему, использование морфологических операторов в таких ситуациях для уменьшения скелетонизации может помочь сломать эти чрезмерно связанные сети, позволяя при этом обнаружить значительные изменения во всех категориях морфологии митохондрий. Кроме того, использование конфокального, а не широкоугольного микроскопа для визуализации является одним из методов частичного смягчения этой проблемы путем устранения нефокусированного света. Кроме того, в будущем было бы полезно выполнить 3D-сегментацию для дифференциации митохондрий, которые пересекаются (т.е. физически образуют сеть) от стержнеобразных митохондрий, проекции которых в одной плоскости пересекаются друг с другом.
Сегментация глубокого обучения является перспективным инструментом, который предлагает расширить возможности анализа пользователей микроскопии, тем самым открывая возможность автоматизированного анализа сложных данных и больших количественных наборов данных, которые ранее были бы неуправляемыми.
The authors have nothing to disclose.
Авторы признают дискуссию с Арифом Ахмедом Сехом. Замбарлал Бхуджабал признан за помощь в создании стабильных клеток H9c2. Мы признаем следующее финансирование: стартовый грант ERC No 804233 (K.A.), Исследовательский проект по научному обновлению грант No 325741 (D.K.P.), грант Регионального управления здравоохранения Северной Норвегии No HNF1449-19 (Å.B.B.) и тематический проект финансирования UiT VirtualStain с Cristin Project ID 2061348 (D.K.P., Å.B.B., K.A. и A.H.).
12-well plate | FALCON | 353043 | |
Aqueous Glutaraldehyde EM Grade 25% | Electron Microscopy Sciences | 16200 | |
Axio Vert.A1 | Zeiss | Brightfield microscope | |
CCCP | Sigma-Aldrich | C2759 | |
Computer | n/a | n/a | Must be running Linux/Windows Operating System having an NVIDIA GPU with at least 4GB of memory |
Coverslips | VWR | 631-0150 | |
DAPI (stain) | Sigma-Aldrich | D9542 | |
DMEM | gibco | 11966-025 | |
Fetal Bovine Serum | Sigma-Aldrich | F7524 | |
Glass Slides (frosted edge) | epredia | AA00000112E01MNZ10 | |
H9c2 mCherry-EGFP-OMP25 | In-house stable cell line derived from purchased cell line | ||
Incubator | Thermo Fisher Scientific | 51033557 | |
LSM 800 | Zeiss | Confocal Microscope | |
Mounting Media (Glass) | Thermo Fisher Scientific | P36980 | |
Paraformaldehyde Solution, 4% in PBS | Thermo Fisher Scientific | J19943-K2 | |
Plan-Apochromat 63x oil (M27) objective with an NA of 1.4 | Zeiss | 420782-9900-000 | |
Sterile laminar flow hood | Labogene | SCANLAF MARS | |
Trypsin | Sigma-Aldrich | T4049 | |
Vacusafe aspiration system | VACUUBRAND | 20727400 | |
ZEN 2.6 | Zeiss |