En este artículo se explica cómo utilizar el aprendizaje automático supervisado por simulación para analizar la morfología de las mitocondrias en imágenes de microscopía de fluorescencia de células fijas.
El análisis cuantitativo de orgánulos subcelulares como las mitocondrias en imágenes de microscopía de fluorescencia celular es una tarea exigente debido a los desafíos inherentes en la segmentación de estas estructuras pequeñas y morfológicamente diversas. En este artículo, demostramos el uso de una canalización de segmentación y análisis asistida por aprendizaje automático para la cuantificación de la morfología mitocondrial en imágenes de microscopía de fluorescencia de células fijas. La herramienta de segmentación basada en aprendizaje profundo se entrena en imágenes simuladas y elimina el requisito de anotaciones de verdad básica para el aprendizaje profundo supervisado. Demostramos la utilidad de esta herramienta en imágenes de microscopía de fluorescencia de cardiomioblastos fijos con una expresión estable de marcadores mitocondriales fluorescentes y empleamos condiciones específicas de cultivo celular para inducir cambios en la morfología mitocondrial.
En este artículo, demostramos la utilidad de una herramienta de aprendizaje automático basada en la física para la segmentación subcelular1 en imágenes de microscopía de fluorescencia de cardiomioblastos fijos que expresan marcadores de mitocondrias fluorescentes.
Las mitocondrias son los principales orgánulos productores de energía en las células de mamíferos. Específicamente, las mitocondrias son orgánulos altamente dinámicos y a menudo se encuentran en redes que cambian constantemente en longitud y ramificación. La forma de las mitocondrias afecta su función, y las células pueden cambiar rápidamente su morfología mitocondrial para adaptarse a un cambio en el medio ambiente2. Para comprender este fenómeno, la clasificación morfológica de las mitocondrias como puntos, bastones o redes es altamente informativa3.
La segmentación de las mitocondrias es crucial para el análisis de la morfología mitocondrial en las células. Los métodos actuales para segmentar y analizar imágenes de microscopía de fluorescencia de las mitocondrias se basan en la segmentación manual o en enfoques convencionales de procesamiento de imágenes. Los enfoques basados en umbrales como Otsu4 son menos precisos debido a los altos niveles de ruido en las imágenes de microscopía. Por lo general, las imágenes para el análisis morfológico de las mitocondrias presentan un gran número de mitocondrias, lo que hace que la segmentación manual sea tediosa. Los enfoques matemáticos como MorphoLibJ5 y los enfoques de aprendizaje automático semisupervisados como Weka6 son muy exigentes y requieren conocimientos expertos. Una revisión de las técnicas de análisis de imágenes para las mitocondrias7 mostró que las técnicas basadas en el aprendizaje profundo pueden ser útiles para la tarea. De hecho, la segmentación de imágenes en imágenes de la vida cotidiana para aplicaciones como la conducción autónoma se ha revolucionado con el uso de modelos basados en el aprendizaje profundo.
El aprendizaje profundo es un subconjunto del aprendizaje automático que proporciona algoritmos que aprenden de grandes cantidades de datos. Los algoritmos de aprendizaje profundo supervisados aprenden las relaciones de grandes conjuntos de imágenes que están anotadas con sus etiquetas de verdad básica (GT). Los desafíos en el uso del aprendizaje profundo supervisado para segmentar las mitocondrias en imágenes de microscopía de fluorescencia son dobles. En primer lugar, el aprendizaje profundo supervisado requiere un gran conjunto de datos de imágenes de entrenamiento y, en el caso de la microscopía de fluorescencia, proporcionar este gran conjunto de datos sería una tarea extensa en comparación con cuando se utilizan imágenes tradicionales basadas en cámaras más fácilmente disponibles. En segundo lugar, las imágenes de microscopía de fluorescencia requieren anotaciones GT de los objetos de interés en las imágenes de entrenamiento, lo cual es una tarea tediosa que requiere un conocimiento experto. Esta tarea puede tomar fácilmente horas o días del tiempo del experto para una sola imagen de células con estructuras subcelulares marcadas con fluorescencia. Además, las variaciones entre los anotadores plantean un problema. Para eliminar la necesidad de anotación manual y poder aprovechar el rendimiento superior de las técnicas de aprendizaje profundo, se utilizó aquí un modelo de segmentación basado en el aprendizaje profundo que se entrenó en imágenes simuladas. Los simuladores basados en la física proporcionan una forma de imitar y controlar el proceso de formación de imágenes en un microscopio, lo que permite la creación de imágenes de formas conocidas. Utilizando un simulador basado en la física, se creó un gran conjunto de datos de imágenes de microscopía de fluorescencia simuladas de mitocondrias para este propósito.
La simulación comienza con la generación de geometría utilizando curvas paramétricas para la generación de formas. Los emisores se colocan aleatoriamente en la superficie de la forma de manera uniformemente distribuida de tal manera que la densidad coincida con los valores experimentales. Una función de dispersión de puntos 3D (PSF) del microscopio se calcula utilizando una aproximación computacionalmente eficiente8 del modelo9 de Gibson-Lanni. Para hacer coincidir estrechamente las imágenes simuladas con las imágenes experimentales, tanto la corriente oscura como el ruido de disparo se emulan para lograr el realismo fotográfico. El GT físico se genera en forma de mapa binario. El código para generar el conjunto de datos y entrenar el modelo de simulación está disponible10, y el paso para crear este conjunto de datos simulado se describe en la figura 1.
Mostramos la utilidad de la segmentación basada en el aprendizaje profundo entrenada completamente en un conjunto de datos simulado mediante el análisis de imágenes de microscopía confocal de cardiomioblastos fijos. Estos cardiomioblastos expresaron un marcador fluorescente en la membrana externa mitocondrial, lo que permitió la visualización de las mitocondrias en las imágenes de microscopía de fluorescencia. Antes de realizar el experimento dado como ejemplo aquí, las células fueron privadas de glucosa y adaptadas a la galactosa durante 7 días en cultivo. La sustitución de la glucosa en los medios de crecimiento por galactosa obliga a las células en cultivo a volverse más oxidativas y, por lo tanto, dependientes de sus mitocondrias para la producción de energía11,12. Además, esto hace que las células sean más sensibles al daño mitocondrial. Los cambios en la morfología mitocondrial pueden ser inducidos experimentalmente mediante la adición de un agente de desacoplamiento mitocondrial como cianuro de carbonilo m-clorofenil hidrazona (CCCP) al medio de cultivo celular13. La CCCP conduce a una pérdida del potencial de la membrana mitocondrial (ΔΨm) y, por lo tanto, resulta en cambios en las mitocondrias de una morfología más tubular (en forma de bastón) a una morfología más globular (en forma de punto)14. Además, las mitocondrias tienden a hincharse durante el tratamiento con PCCC15. Mostramos la distribución morfológica de los cambios mitocondriales cuando los cardiomioblastos adaptados a la galactosa fueron tratados con el desacoplador mitocondrial CCCP. Las segmentaciones de aprendizaje profundo de las mitocondrias nos permitieron clasificarlas como puntos, bastones o redes. Luego derivamos métricas cuantitativas para evaluar la longitud de las ramas y la abundancia de los diferentes fenotipos mitocondriales. Los pasos del análisis se describen en la Figura 2, y los detalles del cultivo celular, las imágenes, la creación de conjuntos de datos para la segmentación basada en el aprendizaje profundo, así como el análisis cuantitativo de las mitocondrias, se dan a continuación.
Discutimos las precauciones relacionadas con los pasos críticos en el protocolo en los párrafos sobre “generación de geometría” y “parámetros del simulador”. El párrafo titulado “aprendizaje por transferencia” analiza las modificaciones para un mayor rendimiento al adaptarse a múltiples microscopios. Los párrafos sobre “análisis de partículas” y “generación de otras estructuras subcelulares” se refieren a futuras aplicaciones de este método. El párrafo sobre la “diferencia de la verdad biológica” discute las diferentes razones por las cuales las simulaciones podrían diferir de los datos reales y si estas razones afectan nuestra aplicación. Finalmente, discutimos un escenario desafiante para nuestro método en el párrafo “estructuras densamente empaquetadas”.
Generación de geometría
Para generar la geometría 3D de las mitocondrias, una estructura 2D simple creada a partir de curvas b-spline como esqueletos funciona bien para la creación del conjunto de datos sintéticos. Estas formas sintéticas emulan de cerca las formas de las mitocondrias observadas en cultivos celulares 2D. Sin embargo, en el caso del tejido 3D, como el tejido cardíaco, la forma y la disposición de las mitocondrias son bastante diferentes. En tales casos, el rendimiento del modelo de segmentación puede mejorar con la adición de direccionalidad en las imágenes simuladas.
Parámetros del simulador
Se debe tener precaución al establecer los parámetros del simulador para asegurarse de que coincidan con los de los datos en los que se ejecutará la inferencia, ya que de lo contrario esto puede conducir a un menor rendimiento en la segmentación. Uno de estos parámetros es el rango de relación señal-ruido (SNR). El rango de SNR de los datos que se van a probar debe coincidir con los valores del conjunto de datos simulado. Además, la PSF utilizada debe coincidir con la de los datos de prueba de destino. Por ejemplo, las imágenes entrenadas por modelos de una PSF confocal no deben usarse para probar imágenes de un microscopio epifluorescente. Otro parámetro a tener en cuenta es el uso de aumento adicional en los datos de prueba. Si se ha utilizado un aumento adicional en los datos de prueba, el simulador también debe configurarse adecuadamente.
Aprendizaje por transferencia
El aprendizaje por transferencia es el fenómeno de aprovechar un modelo aprendido entrenado en una tarea para su uso en otra tarea. Este fenómeno también es aplicable a nuestro problema en relación con diferentes tipos de datos de microscopio. Los pesos del modelo de segmentación (proporcionado con el código fuente) que se entrena en un tipo de datos de microscopía se pueden utilizar para inicializar un modelo de segmentación que se utilizará en otro tipo de datos de microscopio óptico. Esto nos permite entrenar en un subconjunto significativamente más pequeño del conjunto de datos de entrenamiento (3.000 imágenes en comparación con 10.000), reduciendo así los costos computacionales de la simulación.
Análisis de partículas
El análisis de partículas también se puede realizar en las máscaras segmentadas. Esto puede proporcionar información sobre el área y la curvatura, etc., de las mitocondrias individuales. Esta información también puede servir como métricas para la comparación cuantitativa de las mitocondrias (no utilizadas para este experimento). Por ejemplo, en la actualidad, definimos la morfología del punto utilizando un umbral basado en la longitud de las mitocondrias. Puede ser útil, en algunos casos, incorporar la elipticidad para separar mejor las mitocondrias pequeñas en forma de bastón de las mitocondrias puntuales o en forma de punto. Alternativamente, si ciertas condiciones biológicas hacen que las mitocondrias se enrosquen, entonces la cuantificación de la curvatura puede ser de interés para analizar la población mitocondrial.
Generación de otras estructuras subcelulares
La segmentación basada en la física de las estructuras subcelulares ha sido demostrada para mitocondrias y vesículas1. Aunque las vesículas exhiben diferentes formas, sus tamaños son más pequeños y aparecen como esferas simples cuando se observan a través de un microscopio de fluorescencia. Por lo tanto, la geometría de las vesículas se simula utilizando estructuras esféricas de un rango de diámetro apropiado. Esto implica un cambio en la función genera la geometría (cilindros en el caso de las mitocondrias y esferas en el caso de las vesículas) de las estructuras y los parámetros respectivos (paso 5.4 en la sección de protocolo). Geométricamente, el retículo endoplásmico y los microtúbulos también han sido simulados como estructuras tubulares17. El modelado del retículo endoplásmico con un diámetro de 150 nm y microtúbulos con un diámetro exterior promedio de 25 nm y un tubo hueco interno de 15 nm de diámetro proporciona aproximaciones de las formas de estas estructuras. Otro parámetro que variará para cada una de estas estructuras subcelulares es la densidad del fluoróforo. Esto se calcula en función de la distribución de la biomolécula a la que se unen los fluoróforos y la probabilidad de unión.
Diferencia con la verdad del terreno biológico
Los datos simulados utilizados para el entrenamiento supervisado por simulación del modelo de aprendizaje profundo difieren de los datos reales en muchos aspectos. (i) La ausencia de etiquetado no específico en los datos simulados difiere de los datos reales, ya que a menudo hay fluoróforos que flotan libremente en los datos reales. Esto provoca un valor de fondo promedio más alto en la imagen real. Esta diferencia se mitiga haciendo coincidir la SNR y estableciendo el valor de fondo de tal manera que coincida con los valores reales observados. (ii) El movimiento de las estructuras subcelulares y la fotocinética son dos fuentes de dinámica en el sistema. Las estructuras móviles en las células vivas (que se mueven en el rango de unos pocos milisegundos) causan desenfoque de movimiento. El tiempo de exposición se reduce durante la adquisición de datos reales para evitar el efecto borroso. Por otro lado, no simulamos timelapse y asumimos estructuras inmóviles; Esta suposición es válida cuando el tiempo de exposición en los datos reales es pequeño. Sin embargo, esta suposición puede producir un error en la salida si el tiempo de exposición de los datos reales es lo suficientemente grande como para introducir desenfoque de movimiento. La fotocinética, por otro lado, es del orden de nanosegundos a microsegundos y puede omitirse en la simulación, ya que los tiempos de exposición habituales de los experimentos son lo suficientemente largos (del orden de milisegundos) para promediar los efectos de la fotocinética. (iii) El ruido en las imágenes de microscopio tiene diferentes fuentes, y estas fuentes tienen diferentes funciones de densidad de probabilidad. En lugar de modelar estas fuentes individuales de ruido, lo aproximamos como un ruido gaussiano sobre un fondo constante. Esta diferencia no altera significativamente la distribución de datos para las condiciones de baja relación señal-fondo (en el rango de 2-4) y cuando se trata de la macro densidad de fluoróforos1. (iv) Los artefactos en las imágenes pueden surgir de aberraciones, derivas y borrones sistemáticos. Asumimos que el microscopio está bien alineado y que las regiones elegidas para el análisis en los datos reales carecen de estos artefactos. También existe la posibilidad de modelar algunos de estos artefactos en el PSF18,19,20.
Estructuras densamente empaquetadas
Las dificultades de no poder diferenciar las varillas superpuestas de las redes es un problema persistente en la segmentación de los datos de microscopía 2D. Un escenario extremadamente desafiante se presenta en la Figura 5, donde las mitocondrias están densamente empaquetadas, lo que conduce a resultados subóptimos en el modelo de segmentación y el siguiente análisis. A pesar de este desafío, el uso de operadores morfológicos en tales situaciones para adelgazar la esqueletización puede ayudar a romper estas redes excesivamente conectadas al tiempo que permite detectar cambios significativos en todas las categorías de morfología mitocondrial. Además, el uso de un microscopio confocal en lugar de un microscopio de campo amplio para obtener imágenes es un método para mitigar parcialmente este problema al eliminar la luz desenfocada. Además, en el futuro, sería útil realizar una segmentación 3D para diferenciar las mitocondrias que se cruzan (es decir, forman físicamente una red) de las mitocondrias en forma de bastón cuyas proyecciones en un solo plano se superponen entre sí.
La segmentación de aprendizaje profundo es una herramienta prometedora que ofrece ampliar las capacidades de análisis de los usuarios de microscopía, abriendo así la posibilidad de análisis automatizado de datos complejos y grandes conjuntos de datos cuantitativos, que anteriormente habrían sido inmanejables.
The authors have nothing to disclose.
Los autores reconocen la discusión con Arif Ahmed Sekh. Zambarlal Bhujabal es reconocido por ayudar a construir las células H9c2 estables. Reconocemos la siguiente financiación: subvención inicial del ERC n.º 804233 (a K.A.), subvención del Proyecto de Investigador para la Renovación Científica n.º 325741 (a D.K.P.), subvención n.º HNF1449-19 de la Autoridad Regional de Salud del Norte de Noruega (Å.B.B.), y el proyecto de financiación temática de UiT VirtualStain con ID de proyecto Cristin 2061348 (D.K.P., Å.B.B., K.A. y A.H.).
12-well plate | FALCON | 353043 | |
Aqueous Glutaraldehyde EM Grade 25% | Electron Microscopy Sciences | 16200 | |
Axio Vert.A1 | Zeiss | Brightfield microscope | |
CCCP | Sigma-Aldrich | C2759 | |
Computer | n/a | n/a | Must be running Linux/Windows Operating System having an NVIDIA GPU with at least 4GB of memory |
Coverslips | VWR | 631-0150 | |
DAPI (stain) | Sigma-Aldrich | D9542 | |
DMEM | gibco | 11966-025 | |
Fetal Bovine Serum | Sigma-Aldrich | F7524 | |
Glass Slides (frosted edge) | epredia | AA00000112E01MNZ10 | |
H9c2 mCherry-EGFP-OMP25 | In-house stable cell line derived from purchased cell line | ||
Incubator | Thermo Fisher Scientific | 51033557 | |
LSM 800 | Zeiss | Confocal Microscope | |
Mounting Media (Glass) | Thermo Fisher Scientific | P36980 | |
Paraformaldehyde Solution, 4% in PBS | Thermo Fisher Scientific | J19943-K2 | |
Plan-Apochromat 63x oil (M27) objective with an NA of 1.4 | Zeiss | 420782-9900-000 | |
Sterile laminar flow hood | Labogene | SCANLAF MARS | |
Trypsin | Sigma-Aldrich | T4049 | |
Vacusafe aspiration system | VACUUBRAND | 20727400 | |
ZEN 2.6 | Zeiss |