Este artigo explica como usar o aprendizado de máquina supervisionado por simulação para analisar a morfologia das mitocôndrias em imagens de microscopia de fluorescência de células fixas.
A análise quantitativa de organelas subcelulares, como mitocôndrias, em imagens de microscopia de fluorescência celular, é uma tarefa exigente devido aos desafios inerentes à segmentação dessas estruturas pequenas e morfologicamente diversas. Neste artigo, demonstramos o uso de um pipeline de segmentação e análise auxiliado por aprendizado de máquina para a quantificação da morfologia mitocondrial em imagens de microscopia de fluorescência de células fixas. A ferramenta de segmentação baseada em aprendizado profundo é treinada em imagens simuladas e elimina a necessidade de anotações de verdade no solo para aprendizado profundo supervisionado. Demonstramos a utilidade desta ferramenta em imagens de microscopia de fluorescência de cardiomioblastos fixos com uma expressão estável de marcadores de mitocôndrias fluorescentes e empregamos condições específicas de cultura celular para induzir mudanças na morfologia mitocondrial.
Neste artigo, demonstramos a utilidade de uma ferramenta de aprendizado de máquina baseada em física para segmentação subcelular1 em imagens de microscopia de fluorescência de cardiomioblastos fixos expressando marcadores de mitocôndrias fluorescentes.
As mitocôndrias são as principais organelas produtoras de energia nas células de mamíferos. Especificamente, as mitocôndrias são organelas altamente dinâmicas e são frequentemente encontradas em redes que estão constantemente mudando em comprimento e ramificação. A forma das mitocôndrias afeta sua função, e as células podem mudar rapidamente sua morfologia mitocondrial para se adaptar a uma mudança no ambiente2. Para compreender esse fenômeno, a classificação morfológica das mitocôndrias em pontos, bastonetes ou redes é altamente informativa3.
A segmentação das mitocôndrias é crucial para a análise da morfologia mitocondrial nas células. Os métodos atuais para segmentar e analisar imagens de microscopia de fluorescência de mitocôndrias dependem de segmentação manual ou abordagens convencionais de processamento de imagens. Abordagens baseadas em limiares, como o Otsu4 , são menos precisas devido aos altos níveis de ruído nas imagens de microscopia. Normalmente, as imagens para a análise morfológica das mitocôndrias apresentam um grande número de mitocôndrias, tornando a segmentação manual tediosa. Abordagens matemáticas como o MorphoLibJ5 e abordagens de aprendizado de máquina semi-supervisionado como o Weka6 são altamente exigentes e exigem conhecimento especializado. Uma revisão das técnicas de análise de imagem para mitocôndrias7 mostrou que técnicas baseadas em aprendizagem profunda podem ser úteis para a tarefa. De fato, a segmentação de imagens na vida cotidiana para aplicações como a direção autônoma foi revolucionada com o uso de modelos baseados em aprendizado profundo.
O aprendizado profundo é um subconjunto do aprendizado de máquina que fornece algoritmos que aprendem com grandes quantidades de dados. Os algoritmos de aprendizagem profunda supervisionados aprendem relacionamentos a partir de grandes conjuntos de imagens que são anotadas com seus rótulos de verdade fundamental (GT). Os desafios no uso de aprendizagem profunda supervisionada para segmentar mitocôndrias em imagens de microscopia de fluorescência são duplos. Em primeiro lugar, o aprendizado profundo supervisionado requer um grande conjunto de dados de imagens de treinamento e, no caso da microscopia de fluorescência, fornecer esse grande conjunto de dados seria uma tarefa extensa em comparação com o uso de imagens tradicionais baseadas em câmera mais facilmente disponíveis. Em segundo lugar, as imagens de microscopia de fluorescência requerem anotações GT dos objetos de interesse nas imagens de treinamento, o que é uma tarefa tediosa que requer conhecimento especializado. Esta tarefa pode facilmente levar horas ou dias do tempo do especialista para uma única imagem de células com estruturas subcelulares marcadas fluorescentemente. Além disso, as variações entre os anotadores representam um problema. Para remover a necessidade de anotação manual e para poder aproveitar o desempenho superior das técnicas de aprendizado profundo, um modelo de segmentação baseado em aprendizado profundo foi usado aqui que foi treinado em imagens simuladas. Os simuladores baseados em física fornecem uma maneira de imitar e controlar o processo de formação de imagens em um microscópio, permitindo a criação de imagens de formas conhecidas. Utilizando um simulador baseado em física, um grande conjunto de dados de imagens de microscopia de fluorescência simulada de mitocôndrias foi criado para esse fim.
A simulação começa com a geração de geometria usando curvas paramétricas para geração de formas. Os emissores são colocados aleatoriamente na superfície da forma de forma uniformemente distribuída, de modo que a densidade corresponda aos valores experimentais. Uma função de propagação de ponto 3D (PSF) do microscópio é calculada usando uma aproximação computacionalmente eficiente8 do modelo 9 de Gibson-Lanni. Para combinar de perto as imagens simuladas com imagens experimentais, tanto a corrente escura quanto o ruído da foto são emulados para alcançar o realismo fotográfico. O GT físico é gerado na forma de um mapa binário. O código para gerar o conjunto de dados e treinar o modelo de simulação está disponível10, e a etapa para criar esse conjunto de dados simulado é descrita na Figura 1.
Mostramos a utilidade da segmentação baseada em aprendizado profundo treinada inteiramente em um conjunto de dados simulados, analisando imagens de microscopia confocal de cardiomioblastos fixos. Esses cardiomioblastos expressaram um marcador fluorescente na membrana externa mitocondrial, permitindo a visualização das mitocôndrias nas imagens de microscopia de fluorescência. Antes da realização do experimento dado como exemplo aqui, as células foram privadas de glicose e adaptadas à galactose por 7 dias em cultura. A substituição da glicose no meio de crescimento por galactose força as células em cultura a se tornarem mais oxidativas e, assim, dependentes de suas mitocôndrias para a produção de energia11,12. Além disso, isso torna as células mais sensíveis aos danos mitocondriais. Alterações morfológicas mitocondriais podem ser induzidas experimentalmente pela adição de um agente de desacoplamento mitocondrial, como o cianeto de carbonila m-clorofenilhidrazona (CCCP), ao meio de cultura celular13. A CCCP leva a uma perda do potencial de membrana mitocondrial (ΔΨm) e, assim, resulta em alterações nas mitocôndrias de uma morfologia mais tubular (tipo bastonete) para uma mais globular (tipo ponto)14. Além disso, as mitocôndrias tendem a inchar durante o tratamento da CCCP15. Mostramos a distribuição morfológica das alterações mitocondriais quando os cardiomioblastos adaptados à galactose foram tratados com o desacoplador mitocondrial CCCP. As segmentações de aprendizagem profunda das mitocôndrias nos permitiram classificá-las como pontos, hastes ou redes. Em seguida, derivamos métricas quantitativas para avaliar os comprimentos dos ramos e a abundância dos diferentes fenótipos mitocondriais. As etapas da análise são descritas na Figura 2, e os detalhes da cultura celular, imagem, criação de conjuntos de dados para segmentação baseada em aprendizagem profunda, bem como a análise quantitativa das mitocôndrias, são apresentados abaixo.
Discutimos as precauções relacionadas às etapas críticas do protocolo nos parágrafos sobre “geração de geometria” e “parâmetros do simulador”. O parágrafo intitulado “aprendizado de transferência” discute modificações para maior rendimento ao se adaptar a múltiplos microscópios. Os parágrafos sobre “análise de partículas” e “geração de outras estruturas subcelulares” referem-se a futuras aplicações deste método. O parágrafo sobre a “diferença da verdade biológica” discute as diferentes razões pelas quais as simulações podem diferir dos dados reais e se essas razões afetam nossa aplicação. Finalmente, discutimos um cenário desafiador para o nosso método no parágrafo “estruturas densamente compactadas”.
Geração de geometria
Para gerar a geometria 3D das mitocôndrias, uma estrutura 2D simples criada a partir de curvas b-spline como esqueletos funciona bem para a criação do conjunto de dados sintético. Essas formas sintéticas emulam de perto as formas das mitocôndrias observadas em culturas de células 2D. No entanto, no caso do tecido 3D, como o tecido cardíaco, a forma e o arranjo das mitocôndrias são bastante diferentes. Nesses casos, o desempenho do modelo de segmentação pode melhorar com a adição de direcionalidade nas imagens simuladas.
Parâmetros do simulador
Deve-se ter cuidado ao definir os parâmetros do simulador para garantir que eles correspondam aos dos dados nos quais executar a inferência, pois a falha em fazer isso pode levar a um desempenho menor na segmentação. Um desses parâmetros é a faixa de relação sinal-ruído (SNR). O intervalo do SNR dos dados a ensaiar deve corresponder aos valores do conjunto de dados simulado. Além disso, o PSF usado deve corresponder ao dos dados de teste de destino. Por exemplo, imagens treinadas por modelo de um PSF confocal não devem ser usadas para testar imagens de um microscópio epifluorescente. Outro parâmetro a ser observado é o uso de ampliação adicional nos dados de teste. Se tiver sido utilizada uma ampliação adicional nos dados de ensaio, o simulador também deve ser ajustado de forma adequada.
Transferir aprendizado
O aprendizado de transferência é o fenômeno de alavancar um modelo aprendido treinado em uma tarefa para uso em outra tarefa. Este fenômeno também é aplicável ao nosso problema em relação a diferentes tipos de dados de microscópio. Os pesos do modelo de segmentação (fornecido com o código-fonte) que é treinado em um tipo de dados de microscopia podem ser usados para inicializar um modelo de segmentação a ser usado em outro tipo de dados de microscópio óptico. Isso nos permite treinar em um subconjunto significativamente menor do conjunto de dados de treinamento (3.000 imagens em comparação com 10.000), reduzindo assim os custos computacionais da simulação.
Análise de partículas
A análise de partículas também pode ser realizada nas máscaras segmentadas. Isso pode fornecer informações sobre a área e a curvatura, etc., das mitocôndrias individuais. Essas informações também podem servir como métricas para a comparação quantitativa de mitocôndrias (não utilizadas para este experimento). Por exemplo, atualmente, definimos a morfologia dos pontos usando um limiar baseado no comprimento das mitocôndrias. Pode ser útil, em alguns casos, incorporar a elipticidade para separar melhor pequenas mitocôndrias semelhantes a bastonetes de puncta ou mitocôndrias semelhantes a pontos. Alternativamente, se certas condições biológicas fazem com que as mitocôndrias se enrolem, a quantificação da curvatura pode ser de interesse para analisar a população mitocondrial.
Geração de outras estruturas subcelulares
A segmentação física de estruturas subcelulares tem sido demonstrada para mitocôndrias e vesículas1. Embora as vesículas exibam formas variadas, seus tamanhos são menores e aparecem como esferas simples quando observadas através de um microscópio de fluorescência. Assim, a geometria das vesículas é simulada usando estruturas esféricas de uma faixa de diâmetro apropriada. Isso implica uma mudança na função gera a geometria (cilindros no caso das mitocôndrias e esferas no caso das vesículas) das estruturas e os respectivos parâmetros (etapa 5.4 na seção do protocolo). Geometricamente, o retículo endoplasmático e os microtúbulos também têm sido simulados como estruturas tubulares17. A modelagem do retículo endoplasmático com diâmetro de 150 nm e microtúbulos com diâmetro externo médio de 25 nm e tubo oco interno de 15 nm de diâmetro fornece aproximações das formas dessas estruturas. Outro parâmetro que irá variar para cada uma dessas estruturas subcelulares é a densidade do fluoróforo. Isto é calculado com base na distribuição da biomolécula à qual os fluoróforos se ligam e na probabilidade de ligação.
Diferença da verdade biológica do solo
Os dados simulados usados para o treinamento supervisionado por simulação do modelo de aprendizado profundo diferem dos dados reais de várias maneiras. i) A ausência de rotulagem não específica nos dados simulados difere dos dados reais, uma vez que existem frequentemente fluoróforos flutuantes nos dados reais. Isso faz com que um valor médio de plano de fundo mais alto na imagem real. Essa diferença é atenuada pela correspondência do SNR e pela definição do valor de plano de fundo de modo que ele corresponda aos valores reais observados. (ii) O movimento das estruturas subcelulares e a fotocinética são duas fontes de dinâmica no sistema. Estruturas em movimento em células vivas (que se movem na faixa de alguns milissegundos) causam desfoque de movimento. O tempo de exposição é reduzido durante a aquisição de dados reais para evitar o efeito de desfocagem. Por outro lado, não simulamos timelapse e assumimos estruturas imóveis; essa suposição é válida quando o tempo de exposição nos dados reais é pequeno. No entanto, essa suposição pode produzir um erro na saída se o tempo de exposição dos dados reais for grande o suficiente para introduzir o desfoque de movimento. A fotocinética, por outro lado, é da ordem de nanossegundos a microssegundos e pode ser omitida na simulação, uma vez que os tempos de exposição habituais dos experimentos são longos o suficiente (na ordem de milissegundos) para calcular a média dos efeitos da fotocinética. (iii) O ruído em imagens de microscópio tem diferentes fontes, e essas fontes têm diferentes funções de densidade de probabilidade. Em vez de modelar essas fontes individuais de ruído, nós o aproximamos como um ruído gaussiano sobre um fundo constante. Essa diferença não altera significativamente a distribuição dos dados para as condições de baixa relação sinal-fundo (na faixa de 2-4) e quando se trata da macrodensidade dos fluoróforos1. (iv) Artefatos em imagens podem surgir de aberrações, derivas e borrões sistemáticos. Assumimos que o microscópio esteja bem alinhado e que as regiões escolhidas para análise nos dados reais sejam desprovidas desses artefatos. Há também a possibilidade de modelagem de alguns desses artefatos no PSF18,19,20.
Estruturas densamente embaladas
As dificuldades em não ser capaz de diferenciar hastes sobrepostas de redes é um problema persistente na segmentação de dados de microscopia 2D. Um cenário extremamente desafiador é apresentado na Figura 5, onde as mitocôndrias estão densamente embaladas, o que leva a resultados subótimos no modelo de segmentação e na análise a seguir. Apesar desse desafio, o uso de operadores morfológicos em tais situações para reduzir a esqueletização pode ajudar a quebrar essas redes excessivamente conectadas, permitindo que mudanças significativas em todas as categorias de morfologia mitocondrial ainda sejam detectadas. Além disso, o uso de um microscópio confocal em vez de um microscópio de campo largo para imagens é um método para mitigar parcialmente esse problema, eliminando a luz fora de foco. Além disso, no futuro, seria útil realizar segmentação 3D para diferenciar mitocôndrias que se cruzam (ou seja, formam fisicamente uma rede) de mitocôndrias semelhantes a bastonetes cujas projeções em um único plano se sobrepõem umas às outras.
A segmentação de aprendizagem profunda é uma ferramenta promissora que oferece expandir as capacidades de análise dos usuários de microscopia, abrindo assim a possibilidade de análise automatizada de dados complexos e grandes conjuntos de dados quantitativos, que antes seriam incontroláveis.
The authors have nothing to disclose.
Os autores reconhecem a discussão com Arif Ahmed Sekh. Zambarlal Bhujabal é reconhecido por ajudar na construção das células H9c2 estáveis. Reconhecemos o seguinte financiamento: Bolsa de início do ERC n.º 804233 (a K.A.), Bolsa de Projeto de Investigador para Renovação Científica n.º 325741 (a D.K.P.), subvenção da Autoridade Regional de Saúde do Norte da Noruega n.º HNF1449-19 (Å.B.B.), e o projeto de financiamento temático da UiT, VirtualStain with Cristin Project ID 2061348 (D.K.P., Å.B.B., K.A., e A.H.).
12-well plate | FALCON | 353043 | |
Aqueous Glutaraldehyde EM Grade 25% | Electron Microscopy Sciences | 16200 | |
Axio Vert.A1 | Zeiss | Brightfield microscope | |
CCCP | Sigma-Aldrich | C2759 | |
Computer | n/a | n/a | Must be running Linux/Windows Operating System having an NVIDIA GPU with at least 4GB of memory |
Coverslips | VWR | 631-0150 | |
DAPI (stain) | Sigma-Aldrich | D9542 | |
DMEM | gibco | 11966-025 | |
Fetal Bovine Serum | Sigma-Aldrich | F7524 | |
Glass Slides (frosted edge) | epredia | AA00000112E01MNZ10 | |
H9c2 mCherry-EGFP-OMP25 | In-house stable cell line derived from purchased cell line | ||
Incubator | Thermo Fisher Scientific | 51033557 | |
LSM 800 | Zeiss | Confocal Microscope | |
Mounting Media (Glass) | Thermo Fisher Scientific | P36980 | |
Paraformaldehyde Solution, 4% in PBS | Thermo Fisher Scientific | J19943-K2 | |
Plan-Apochromat 63x oil (M27) objective with an NA of 1.4 | Zeiss | 420782-9900-000 | |
Sterile laminar flow hood | Labogene | SCANLAF MARS | |
Trypsin | Sigma-Aldrich | T4049 | |
Vacusafe aspiration system | VACUUBRAND | 20727400 | |
ZEN 2.6 | Zeiss |