Cet article explique comment utiliser l’apprentissage automatique supervisé par simulation pour analyser la morphologie des mitochondries dans des images de microscopie à fluorescence de cellules fixes.
L’analyse quantitative d’organites subcellulaires tels que les mitochondries dans les images de microscopie à fluorescence cellulaire est une tâche exigeante en raison des défis inhérents à la segmentation de ces petites structures morphologiquement diverses. Dans cet article, nous démontrons l’utilisation d’un pipeline de segmentation et d’analyse assisté par l’apprentissage automatique pour la quantification de la morphologie mitochondriale dans des images de microscopie à fluorescence de cellules fixes. L’outil de segmentation basé sur l’apprentissage profond est formé sur des images simulées et élimine le besoin d’annotations de réalité de terrain pour l’apprentissage profond supervisé. Nous démontrons l’utilité de cet outil sur des images de microscopie à fluorescence de cardiomyoblastes fixes avec une expression stable de marqueurs mitochondriaux fluorescents et utilisons des conditions de culture cellulaire spécifiques pour induire des changements dans la morphologie mitochondriale.
Dans cet article, nous démontrons l’utilité d’un outil d’apprentissage automatique basé sur la physique pour la segmentation subcellulaire1 dans des images de microscopie à fluorescence de cardiomyoblastes fixes exprimant des marqueurs mitochondriaux fluorescents.
Les mitochondries sont les principaux organites producteurs d’énergie dans les cellules de mammifères. Plus précisément, les mitochondries sont des organites très dynamiques et se trouvent souvent dans des réseaux dont la longueur et la ramification changent constamment. La forme des mitochondries impacte leur fonction, et les cellules peuvent rapidement changer leur morphologie mitochondriale pour s’adapter à un changement dans l’environnement2. Pour comprendre ce phénomène, la classification morphologique des mitochondries sous forme de points, de bâtonnets ou de réseaux est très informative3.
La segmentation des mitochondries est cruciale pour l’analyse de la morphologie mitochondriale dans les cellules. Les méthodes actuelles de segmentation et d’analyse des images de microscopie à fluorescence des mitochondries reposent sur la segmentation manuelle ou des approches conventionnelles de traitement d’images. Les approches basées sur le seuillage telles que Otsu4 sont moins précises en raison des niveaux de bruit élevés dans les images de microscopie. En règle générale, les images pour l’analyse morphologique des mitochondries présentent un grand nombre de mitochondries, ce qui rend la segmentation manuelle fastidieuse. Les approches mathématiques comme MorphoLibJ5 et les approches semi-supervisées d’apprentissage automatique comme Weka6 sont très exigeantes et nécessitent des connaissances spécialisées. Un examen des techniques d’analyse d’images pour les mitochondries7 a montré que les techniques basées sur l’apprentissage profond peuvent être utiles pour la tâche. En effet, la segmentation des images dans les images de la vie quotidienne pour des applications telles que la conduite autonome a été révolutionnée avec l’utilisation de modèles basés sur l’apprentissage profond.
L’apprentissage profond est un sous-ensemble de l’apprentissage automatique qui fournit des algorithmes qui apprennent à partir de grandes quantités de données. Les algorithmes d’apprentissage profond supervisés apprennent les relations à partir de grands ensembles d’images annotées avec leurs étiquettes de vérité terrain (GT). Les défis liés à l’utilisation de l’apprentissage profond supervisé pour segmenter les mitochondries dans les images de microscopie à fluorescence sont doubles. Tout d’abord, l’apprentissage profond supervisé nécessite un grand ensemble de données d’images d’apprentissage et, dans le cas de la microscopie à fluorescence, fournir ce grand ensemble de données serait une tâche considérable par rapport à l’utilisation d’images traditionnelles plus facilement disponibles basées sur des caméras. Deuxièmement, les images de microscopie à fluorescence nécessitent des annotations GT des objets d’intérêt dans les images d’apprentissage, ce qui est une tâche fastidieuse qui nécessite des connaissances spécialisées. Cette tâche peut facilement prendre des heures ou des jours du temps de l’expert pour une seule image de cellules avec des structures subcellulaires marquées par fluorescence. De plus, les variations entre les annotateurs posent problème. Pour éliminer le besoin d’annotation manuelle et pour pouvoir tirer parti des performances supérieures des techniques d’apprentissage en profondeur, un modèle de segmentation basé sur l’apprentissage profond a été utilisé ici qui a été formé sur des images simulées. Les simulateurs basés sur la physique fournissent un moyen d’imiter et de contrôler le processus de formation d’images dans un microscope, permettant la création d’images de formes connues. À l’aide d’un simulateur basé sur la physique, un grand ensemble de données d’images de microscopie à fluorescence simulées de mitochondries a été créé à cette fin.
La simulation commence par la génération de la géométrie à l’aide de courbes paramétriques pour la génération de formes. Les émetteurs sont placés au hasard sur la surface de la forme d’une manière uniformément répartie de sorte que la densité corresponde aux valeurs expérimentales. Une fonction d’étalement de point (PSF) 3D du microscope est calculée à l’aide d’une approximation efficacede calcul 8 du modèle Gibson-Lanni9. Pour faire correspondre étroitement les images simulées avec des images expérimentales, le courant d’obscurité et le bruit de prise de vue sont émulés pour obtenir le réalisme photo. Le GT physique est généré sous la forme d’une carte binaire. Le code pour générer le jeu de données et former le modèle de simulation est disponible10, et l’étape de création de ce jeu de données simulé est décrite à la figure 1.
Nous montrons l’utilité de la segmentation basée sur l’apprentissage profond entièrement entraînée sur un ensemble de données simulées en analysant des images de microscopie confocale de cardiomyoblastes fixes. Ces cardiomyoblastes exprimaient un marqueur fluorescent dans la membrane externe mitochondriale, permettant la visualisation des mitochondries dans les images de microscopie à fluorescence. Avant de mener l’expérience donnée en exemple ici, les cellules ont été privées de glucose et adaptées au galactose pendant 7 jours en culture. Le remplacement du glucose dans le milieu de croissance par du galactose oblige les cellules en culture à devenir plus oxydatives et, par conséquent, dépendantes de leurs mitochondries pour la production d’énergie11,12. De plus, cela rend les cellules plus sensibles aux dommages mitochondriaux. Les modifications de la morphologie mitochondriale peuvent être induites expérimentalement par l’ajout d’un agent de découplage mitochondrial tel que le cyanure de carbonyle m-chlorophénylhydrazone (CCCP) au milieu de culture cellulaire13. Le PCCC entraîne une perte de potentiel membranaire mitochondrial (ΔΨm) et, par conséquent, entraîne des changements dans les mitochondries d’une morphologie plus tubulaire (en forme de bâtonnet) à une morphologie plus globulaire (en forme de point)14. De plus, les mitochondries ont tendance à gonfler pendant le traitement CCCP15. Nous affichons la distribution morphologique des changements mitochondriaux lorsque les cardiomyoblastes adaptés au galactose ont été traités avec le découpleur mitochondrial CCCP. Les segmentations d’apprentissage profond des mitochondries nous ont permis de les classer sous forme de points, de bâtonnets ou de réseaux. Nous avons ensuite dérivé des métriques quantitatives pour évaluer la longueur des branches et l’abondance des différents phénotypes mitochondriaux. Les étapes de l’analyse sont décrites à la figure 2, et les détails de la culture cellulaire, de l’imagerie, de la création d’ensembles de données pour la segmentation basée sur l’apprentissage profond, ainsi que l’analyse quantitative des mitochondries, sont donnés ci-dessous.
Nous discutons des précautions liées aux étapes critiques du protocole dans les paragraphes sur la « génération de géométrie » et les « paramètres du simulateur ». Le paragraphe intitulé « apprentissage par transfert » traite des modifications pour un débit plus élevé lors de l’adaptation à plusieurs microscopes. Les paragraphes sur « l’analyse des particules » et « la génération d’autres structures subcellulaires » font référence aux applications futures de cette méthode. Le paragraphe sur la « différence par rapport à la vérité biologique » discute des différentes raisons pour lesquelles les simulations pourraient différer des données réelles et si ces raisons ont un impact sur notre application. Enfin, nous discutons d’un scénario difficile pour notre méthode dans le paragraphe « structures densément emballées ».
Génération de géométrie
Pour générer la géométrie 3D des mitochondries, une structure 2D simple créée à partir de courbes b-splines en tant que squelettes fonctionne bien pour la création de l’ensemble de données synthétiques. Ces formes synthétiques imitent étroitement les formes des mitochondries observées dans les cultures cellulaires 2D. Cependant, dans le cas de tissus 3D tels que le tissu cardiaque, la forme et la disposition des mitochondries sont très différentes. Dans de tels cas, les performances du modèle de segmentation peuvent s’améliorer avec l’ajout de la directionnalité dans les images simulées.
Paramètres du simulateur
Des précautions doivent être prises lors de la définition des paramètres du simulateur pour s’assurer qu’ils correspondent à ceux des données sur lesquelles exécuter l’inférence, car ne pas le faire peut entraîner une baisse des performances lors de la segmentation. L’un de ces paramètres est la plage de rapport signal sur bruit (SNR). La plage du SNR des données à tester doit correspondre aux valeurs de l’ensemble de données simulé. De plus, le PSF utilisé doit correspondre à celui des données d’essai cibles. Par exemple, les images formées par modèle à partir d’une PSF confocale ne doivent pas être utilisées pour tester les images d’un microscope épifluorescent. Un autre paramètre à prendre en compte est l’utilisation d’un grossissement supplémentaire dans les données de test. Si un grossissement supplémentaire a été utilisé dans les données d’essai, le simulateur doit également être réglé de manière appropriée.
Apprentissage par transfert
L’apprentissage par transfert est le phénomène consistant à tirer parti d’un modèle appris entraîné sur une tâche pour une utilisation dans une autre tâche. Ce phénomène est également applicable à notre problème en ce qui concerne différents types de données de microscope. Les poids du modèle de segmentation (fourni avec le code source) qui est entraîné sur un type de données de microscopie peuvent être utilisés pour initialiser un modèle de segmentation à utiliser sur un autre type de données de microscope optique. Cela nous permet de nous entraîner sur un sous-ensemble beaucoup plus petit de l’ensemble de données d’apprentissage (3 000 images contre 10 000), réduisant ainsi les coûts de calcul de la simulation.
Analyse des particules
L’analyse des particules peut également être effectuée sur les masques segmentés. Cela peut fournir des informations sur la zone et la courbure, etc., des mitochondries individuelles. Ces informations peuvent également servir de métriques pour la comparaison quantitative des mitochondries (non utilisées pour cette expérience). Par exemple, à l’heure actuelle, nous définissons la morphologie des points à l’aide d’un seuil basé sur la longueur des mitochondries. Il peut être utile, dans certains cas, d’incorporer l’ellipticité pour mieux séparer les petites mitochondries en forme de bâtonnets des puncta ou des mitochondries en forme de points. Alternativement, si certaines conditions biologiques provoquent l’enroulement des mitochondries, la quantification de la courbure peut être intéressante pour analyser la population mitochondriale.
Génération d’autres structures sous-cellulaires
La segmentation physique des structures subcellulaires a été démontrée pour les mitochondries et les vésicules1. Bien que les vésicules présentent des formes variables, leurs tailles sont plus petites et elles apparaissent comme de simples sphères lorsqu’elles sont observées au microscope à fluorescence. Par conséquent, la géométrie des vésicules est simulée à l’aide de structures sphériques d’une gamme de diamètre appropriée. Cela implique un changement dans la fonction génère la géométrie (cylindres dans le cas des mitochondries et sphères dans le cas des vésicules) des structures et les paramètres respectifs (étape 5.4 dans la section protocole). Géométriquement, le réticulum endoplasmique et les microtubules ont également été simulés en tant que structures tubulaires17. La modélisation du réticulum endoplasmique avec un diamètre de 150 nm et des microtubules avec un diamètre extérieur moyen de 25 nm et un tube creux interne de 15 nm de diamètre fournit des approximations des formes de ces structures. Un autre paramètre qui variera pour chacune de ces structures sous-cellulaires est la densité fluorophore. Ceci est calculé en fonction de la distribution de la biomolécule à laquelle les fluorophores se lient et de la probabilité de liaison.
Différence par rapport à la réalité biologique du terrain
Les données simulées utilisées pour l’entraînement supervisé par simulation du modèle d’apprentissage profond diffèrent des données réelles à bien des égards. i) L’absence d’étiquetage non spécifique dans les données simulées diffère des données réelles, car il y a souvent des fluorophores flottant librement dans les données réelles. Cela entraîne une valeur d’arrière-plan moyenne plus élevée dans l’image réelle. Cette différence est atténuée en faisant correspondre le SNR et en définissant la valeur d’arrière-plan de telle sorte qu’elle corresponde aux valeurs réelles observées. (ii) Le mouvement des structures subcellulaires et la photocinétique sont deux sources de dynamique dans le système. Les structures en mouvement dans les cellules dynamiques (qui se déplacent dans la plage de quelques millisecondes) provoquent un flou de mouvement. Le temps d’exposition est réduit lors de l’acquisition de données réelles pour éviter l’effet de flou. D’autre part, nous ne simulons pas le timelapse et supposons des structures immobiles; Cette hypothèse est valable lorsque le temps d’exposition dans les données réelles est faible. Cependant, cette hypothèse peut produire une erreur dans la sortie si le temps d’exposition des données réelles est suffisamment important pour introduire un flou de mouvement. La photocinétique, d’autre part, est de l’ordre de nanosecondes à microsecondes et peut être omise dans la simulation, car les temps d’exposition habituels des expériences sont suffisamment longs (de l’ordre de la milliseconde) pour faire la moyenne des effets de la photocinétique. (iii) Le bruit dans les images au microscope a des sources différentes, et ces sources ont des fonctions de densité de probabilité différentes. Au lieu de modéliser ces sources de bruit individuelles, nous l’approximons comme un bruit gaussien sur un fond constant. Cette différence ne modifie pas de manière significative la distribution des données dans les conditions de faible rapport signal/bruit de fond (de l’ordre de 2 à 4) et lorsqu’il s’agit de la macrodensité des fluorophores1. (iv) Les artefacts en imagerie peuvent provenir d’aberrations, de dérives et de flous systématiques. Nous supposons que le microscope est bien aligné et que les régions choisies pour l’analyse dans les données réelles sont dépourvues de ces artefacts. Il est également possible de modéliser certains de ces artefacts dans le PSF18,19,20.
Structures densément tassées
Les difficultés liées à l’impossibilité de différencier les tiges qui se chevauchent des réseaux constituent un problème persistant dans la segmentation des données de microscopie 2D. Un scénario extrêmement difficile est présenté à la figure 5, où les mitochondries sont densément emballées, ce qui conduit à des résultats sous-optimaux dans le modèle de segmentation et l’analyse suivante. Malgré ce défi, l’utilisation d’opérateurs morphologiques dans de telles situations pour amincir le squelettage peut aider à briser ces réseaux trop connectés tout en permettant de détecter des changements significatifs dans toutes les catégories de morphologie mitochondriale. De plus, l’utilisation d’un microscope confocal plutôt que d’un microscope à grand champ pour l’imagerie est une méthode pour atténuer partiellement ce problème en éliminant la lumière floue. De plus, à l’avenir, il serait utile d’effectuer une segmentation 3D pour différencier les mitochondries qui se croisent (c’est-à-dire forment physiquement un réseau) des mitochondries en forme de bâtonnets dont les projections dans un seul plan se chevauchent.
La segmentation par apprentissage profond est un outil prometteur qui offre d’étendre les capacités d’analyse des utilisateurs de microscopie, ouvrant ainsi la possibilité d’une analyse automatisée de données complexes et de grands ensembles de données quantitatives, ce qui aurait été auparavant ingérable.
The authors have nothing to disclose.
Les auteurs prennent acte de la discussion avec Arif Ahmed Sekh. Zambarlal Bhujabal est reconnu pour avoir aidé à construire les cellules H9c2 stables. Nous reconnaissons le financement suivant : la subvention de démarrage du CER n° 804233 (à K.A.), la subvention n° 325741 (à D.K.P.), la subvention n° HNF1449-19 (Å.B.B.) et le projet de financement thématique de l’UIT VirtualStain avec Cristin Project ID 2061348 (D.K.P., Å.B.B., K.A. et A.H.).
12-well plate | FALCON | 353043 | |
Aqueous Glutaraldehyde EM Grade 25% | Electron Microscopy Sciences | 16200 | |
Axio Vert.A1 | Zeiss | Brightfield microscope | |
CCCP | Sigma-Aldrich | C2759 | |
Computer | n/a | n/a | Must be running Linux/Windows Operating System having an NVIDIA GPU with at least 4GB of memory |
Coverslips | VWR | 631-0150 | |
DAPI (stain) | Sigma-Aldrich | D9542 | |
DMEM | gibco | 11966-025 | |
Fetal Bovine Serum | Sigma-Aldrich | F7524 | |
Glass Slides (frosted edge) | epredia | AA00000112E01MNZ10 | |
H9c2 mCherry-EGFP-OMP25 | In-house stable cell line derived from purchased cell line | ||
Incubator | Thermo Fisher Scientific | 51033557 | |
LSM 800 | Zeiss | Confocal Microscope | |
Mounting Media (Glass) | Thermo Fisher Scientific | P36980 | |
Paraformaldehyde Solution, 4% in PBS | Thermo Fisher Scientific | J19943-K2 | |
Plan-Apochromat 63x oil (M27) objective with an NA of 1.4 | Zeiss | 420782-9900-000 | |
Sterile laminar flow hood | Labogene | SCANLAF MARS | |
Trypsin | Sigma-Aldrich | T4049 | |
Vacusafe aspiration system | VACUUBRAND | 20727400 | |
ZEN 2.6 | Zeiss |