In dit artikel wordt uitgelegd hoe u machine learning onder toezicht van simulatie kunt gebruiken voor het analyseren van mitochondriale morfologie in fluorescentiemicroscopiebeelden van vaste cellen.
De kwantitatieve analyse van subcellulaire organellen zoals mitochondriën in celfluorescentiemicroscopiebeelden is een veeleisende taak vanwege de inherente uitdagingen in de segmentatie van deze kleine en morfologisch diverse structuren. In dit artikel demonstreren we het gebruik van een machine learning-ondersteunde segmentatie- en analysepijplijn voor de kwantificering van mitochondriale morfologie in fluorescentiemicroscopiebeelden van vaste cellen. De op deep learning gebaseerde segmentatietool is getraind op gesimuleerde afbeeldingen en elimineert de vereiste voor annotaties van grondwaarheid voor supervised deep learning. We demonstreren het nut van deze tool op fluorescentiemicroscopiebeelden van vaste cardiomyoblasten met een stabiele expressie van fluorescerende mitochondriënmarkers en gebruiken specifieke celkweekomstandigheden om veranderingen in de mitochondriale morfologie te induceren.
In dit artikel demonstreren we het nut van een op fysica gebaseerde machine learning-tool voor subcellulaire segmentatie1 in fluorescentiemicroscopiebeelden van vaste cardiomyoblasten die fluorescerende mitochondriënmarkers tot expressie brengen.
Mitochondriën zijn de belangrijkste energieproducerende organellen in zoogdiercellen. In het bijzonder zijn mitochondriën zeer dynamische organellen en worden ze vaak aangetroffen in netwerken die voortdurend veranderen in lengte en vertakking. De vorm van mitochondriën beïnvloedt hun functie en cellen kunnen hun mitochondriale morfologie snel veranderen om zich aan te passen aan een verandering in de omgeving2. Om dit fenomeen te begrijpen, is de morfologische classificatie van mitochondriën als stippen, staafjes of netwerken zeer informatief3.
De segmentatie van mitochondriën is cruciaal voor de analyse van mitochondriale morfologie in cellen. Huidige methoden om fluorescentiemicroscopiebeelden van mitochondriën te segmenteren en te analyseren, zijn afhankelijk van handmatige segmentatie of conventionele beeldverwerkingsbenaderingen. Thresholding-gebaseerde benaderingen zoals Otsu4 zijn minder nauwkeurig vanwege de hoge ruisniveaus in microscopiebeelden. Typisch, afbeeldingen voor de morfologische analyse van mitochondriën bevatten een groot aantal mitochondriën, waardoor handmatige segmentatie vervelend is. Wiskundige benaderingen zoals MorphoLibJ5 en semi-supervised machine learning-benaderingen zoals Weka6 zijn zeer veeleisend en vereisen deskundige kennis. Een overzicht van de beeldanalysetechnieken voor mitochondriën7 toonde aan dat op deep learning gebaseerde technieken nuttig kunnen zijn voor de taak. Inderdaad, beeldsegmentatie in afbeeldingen in het dagelijks leven voor toepassingen zoals zelfrijdend rijden is gerevolutioneerd met het gebruik van op deep learning gebaseerde modellen.
Deep learning is een subset van machine learning die algoritmen biedt die leren van grote hoeveelheden gegevens. Supervised deep learning-algoritmen leren relaties van grote sets afbeeldingen die zijn geannoteerd met hun ground truth (GT) -labels. De uitdagingen bij het gebruik van supervised deep learning voor het segmenteren van mitochondriën in fluorescentiemicroscopiebeelden zijn tweeledig. Ten eerste vereist supervised deep learning een grote dataset van trainingsbeelden, en in het geval van fluorescentiemicroscopie zou het verstrekken van deze grote dataset een uitgebreide taak zijn in vergelijking met het gebruik van gemakkelijker beschikbare traditionele camera-gebaseerde beelden. Ten tweede vereisen fluorescentiemicroscopiebeelden GT-annotaties van de objecten die van belang zijn in de trainingsbeelden, wat een vervelende taak is die deskundige kennis vereist. Deze taak kan gemakkelijk uren of dagen van de tijd van de expert in beslag nemen voor een enkele afbeelding van cellen met fluorescerend gelabelde subcellulaire structuren. Bovendien vormen variaties tussen annotators een probleem. Om de noodzaak van handmatige annotatie weg te nemen en om gebruik te kunnen maken van de superieure prestaties van deep learning-technieken, werd hier een op deep learning gebaseerd segmentatiemodel gebruikt dat werd getraind op gesimuleerde afbeeldingen. Op fysica gebaseerde simulatoren bieden een manier om het proces van beeldvorming in een microscoop na te bootsen en te beheersen, waardoor afbeeldingen van bekende vormen kunnen worden gemaakt. Met behulp van een op fysica gebaseerde simulator werd hiervoor een grote dataset van gesimuleerde fluorescentiemicroscopiebeelden van mitochondriën gemaakt.
De simulatie begint met de geometriegeneratie met behulp van parametrische curven voor het genereren van vormen. Emitters worden willekeurig op het oppervlak van de vorm geplaatst op een gelijkmatig verdeelde manier, zodat de dichtheid overeenkomt met de experimentele waarden. Een 3D-puntspreidingsfunctie (PSF) van de microscoop wordt berekend met behulp van een computationeel efficiënte benadering8 van het Gibson-Lanni-model9. Om de gesimuleerde beelden nauw aan te sluiten bij experimentele beelden, worden zowel de donkere stroom als de opnameruis nagebootst om fotorealisme te bereiken. De fysieke GT wordt gegenereerd in de vorm van een binaire kaart. De code voor het genereren van de dataset en het trainen van het simulatiemodel is beschikbaar10, en de stap voor het maken van deze gesimuleerde dataset wordt beschreven in Figuur 1.
We laten het nut zien van op deep learning gebaseerde segmentatie die volledig is getraind op een gesimuleerde dataset door confocale microscopiebeelden van vaste cardiomyoblasten te analyseren. Deze cardiomyoblasten drukten een fluorescerende marker uit in het mitochondriale buitenmembraan, waardoor de mitochondriën in de fluorescentiemicroscopiebeelden konden worden gevisualiseerd. Voorafgaand aan het uitvoeren van het experiment dat hier als voorbeeld wordt gegeven, werden de cellen beroofd van glucose en aangepast aan galactose gedurende 7 dagen in cultuur. Het vervangen van glucose in de groeimedia door galactose dwingt de cellen in cultuur om meer oxidatief te worden en dus afhankelijk van hun mitochondriën voor energieproductie11,12. Bovendien maakt dit de cellen gevoeliger voor mitochondriale schade. Mitochondriale morfologische veranderingen kunnen experimenteel worden geïnduceerd door een mitochondriaal ontkoppelingsmiddel zoals carbonylcyanide m-chloorfenylhydrazon (CCCP) toe te voegen aan het celkweekmedium13. CCCP leidt tot een verlies van mitochondriaal membraanpotentiaal (ΔΨm) en resulteert dus in veranderingen in de mitochondriën van een meer buisvormige (staafachtige) naar een meer bolvormige (puntachtige) morfologie14. Bovendien hebben mitochondriën de neiging om op te zwellen tijdens CCCP-behandeling15. We tonen de morfologische verdeling van mitochondriale veranderingen wanneer de galactose-aangepaste cardiomyoblasten werden behandeld met de mitochondriale ontkoppelaar CCCP. De deep learning-segmentaties van de mitochondriën stelden ons in staat om ze te classificeren als stippen, staafjes of netwerken. Vervolgens hebben we kwantitatieve statistieken afgeleid om de taklengtes en abundantie van de verschillende mitochondriale fenotypen te beoordelen. De stappen van de analyse worden beschreven in figuur 2 en de details van de celcultuur, beeldvorming, het maken van datasets voor op deep learning gebaseerde segmentatie, evenals de kwantitatieve analyse van de mitochondriën, worden hieronder gegeven.
We bespreken voorzorgsmaatregelen met betrekking tot de kritieke stappen in het protocol in de paragrafen over “geometriegeneratie” en “simulatorparameters”. De paragraaf met de titel “transfer learning” bespreekt wijzigingen voor een hogere doorvoer bij aanpassing aan meerdere microscopen. De paragrafen over “deeltjesanalyse” en “het genereren van andere subcellulaire structuren” verwijzen naar toekomstige toepassingen van deze methode. De paragraaf over het “verschil met biologische waarheid” bespreekt de verschillende redenen waarom de simulaties kunnen verschillen van echte gegevens en of deze redenen van invloed zijn op onze toepassing. Tot slot bespreken we een uitdagend scenario voor onze methode in de paragraaf “dicht opeengepakte structuren”.
Geometrie generatie
Om de 3D-geometrie van mitochondriën te genereren, werkt een eenvoudige 2D-structuur gemaakt van b-spline-curven als skeletten goed voor het maken van de synthetische dataset. Deze synthetische vormen bootsen nauw de vormen van mitochondriën na die worden waargenomen in 2D-celculturen. In het geval van 3D-weefsel zoals hartweefsel zijn de vorm en rangschikking van mitochondriën echter heel anders. In dergelijke gevallen kunnen de prestaties van het segmentatiemodel verbeteren door de toevoeging van directionaliteit in de gesimuleerde beelden.
Simulatorparameters
Voorzichtigheid is geboden bij het instellen van de parameters van de simulator om ervoor te zorgen dat ze overeenkomen met die van de gegevens waarop de gevolgtrekking moet worden uitgevoerd, omdat het niet doen hiervan kan leiden tot lagere prestaties bij segmentatie. Een van die parameters is het signaal-ruisverhouding (SNR) bereik. Het bereik van de SNR van de te testen gegevens moet overeenkomen met de waarden van de gesimuleerde gegevensset. Bovendien moet de gebruikte PSF overeenkomen met die van de doeltestgegevens. Modelgetrainde beelden van een confocale PSF mogen bijvoorbeeld niet worden gebruikt om beelden van een epi-fluorescerende microscoop te testen. Een andere parameter om op te letten is het gebruik van extra vergroting in de testgegevens. Als extra vergroting is gebruikt in de testgegevens, moet de simulator ook op de juiste manier worden ingesteld.
Transferleren
Transfer learning is het fenomeen van het gebruik van een geleerd model dat op de ene taak is getraind voor gebruik in een andere taak. Dit fenomeen is ook van toepassing op ons probleem met betrekking tot verschillende soorten microscoopgegevens. De gewichten van het segmentatiemodel (geleverd met de broncode) dat is getraind op één type microscopiegegevens kunnen worden gebruikt om een segmentatiemodel te initialiseren voor gebruik op een ander soort optische microscoopgegevens. Dit stelt ons in staat om te trainen op een aanzienlijk kleinere subset van de trainingsdataset (3.000 afbeeldingen in vergelijking met 10.000), waardoor de computationele kosten van simulatie worden verlaagd.
Deeltjesanalyse
Deeltjesanalyse kan ook worden uitgevoerd op de gesegmenteerde maskers. Dit kan informatie geven over het gebied en de kromming, enz., Van de individuele mitochondriën. Deze informatie kan ook dienen als metriek voor de kwantitatieve vergelijking van mitochondriën (niet gebruikt voor dit experiment). Op dit moment definiëren we bijvoorbeeld de puntmorfologie met behulp van een drempel op basis van de lengte van de mitochondriën. Het kan in sommige gevallen nuttig zijn om ellipticiteit op te nemen om kleine staafachtige mitochondriën beter te scheiden van puncta- of puntachtige mitochondriën. Als alternatief, als bepaalde biologische omstandigheden ervoor zorgen dat de mitochondriën opkrullen, kan krommingskwantificering van belang zijn om de mitochondriale populatie te analyseren.
Het genereren van andere subcellulaire structuren
De op fysica gebaseerde segmentatie van subcellulaire structuren is aangetoond voor mitochondriën en blaasjes1. Hoewel blaasjes verschillende vormen vertonen, zijn hun maten kleiner en lijken ze als eenvoudige bollen wanneer ze worden waargenomen door een fluorescentiemicroscoop. Daarom wordt de geometrie van blaasjes gesimuleerd met behulp van bolvormige structuren met een geschikt diameterbereik. Dit impliceert een verandering in de functie genereert de geometrie (cilinders in het geval van mitochondriën en bollen in het geval van blaasjes) van de structuren en de respectieve parameters (stap 5.4 in de protocolsectie). Geometrisch zijn het endoplasmatisch reticulum en de microtubuli ook gesimuleerd als buisvormige structuren17. Het modelleren van het endoplasmatisch reticulum met een diameter van 150 nm en microtubuli met een gemiddelde buitendiameter van 25 nm en een binnenste holle buis van 15 nm in diameter biedt benaderingen van de vormen van deze structuren. Een andere parameter die voor elk van deze subcellulaire structuren zal variëren, is de fluorofoordichtheid. Dit wordt berekend op basis van de verdeling van het biomolecuul waaraan de fluoroforen binden en de kans op binding.
Verschil met biologische grondwaarheid
De gesimuleerde gegevens die worden gebruikt voor de simulatie-begeleide training van het deep learning-model verschillen op veel manieren van echte gegevens. (i) De afwezigheid van niet-specifieke etikettering in de gesimuleerde gegevens verschilt van echte gegevens, aangezien er vaak vrij zwevende fluoroforen in de echte gegevens zitten. Dit zorgt voor een hogere gemiddelde achtergrondwaarde in het echte beeld. Dit verschil wordt verzacht door de SNR te matchen en de achtergrondwaarde zo in te stellen dat deze overeenkomt met de waargenomen reële waarden. (ii) De beweging van subcellulaire structuren en fotokinetiek zijn twee bronnen van dynamica in het systeem. Bewegende structuren in levende cellen (die in het bereik van enkele milliseconden bewegen) veroorzaken bewegingsonscherpte. De belichtingstijd wordt verkort tijdens echte data-acquisitie om het vervagingseffect te voorkomen. Aan de andere kant simuleren we geen timelapse en gaan we uit van onbeweeglijke structuren; deze veronderstelling is geldig wanneer de blootstellingstijd in de reële gegevens klein is. Deze aanname kan echter een fout in de uitvoer veroorzaken als de belichtingstijd van de echte gegevens groot genoeg is om bewegingsonscherpte te introduceren. Fotokinetiek daarentegen is in de orde van nanoseconden tot microseconden en kan in de simulatie worden weggelaten, omdat de gebruikelijke belichtingstijden van experimenten lang genoeg zijn (in de orde van milliseconden) om de effecten van fotokinetiek te gemiddelden. (iii) Ruis in microscoopbeelden heeft verschillende bronnen en deze bronnen hebben verschillende waarschijnlijkheidsdichtheidsfuncties. In plaats van deze individuele bronnen van ruis te modelleren, benaderen we het als een Gaussische ruis over een constante achtergrond. Dit verschil verandert niets significant aan de gegevensverdeling voor de omstandigheden van een lage signaal-achtergrondverhouding (in het bereik van 2-4) en bij het omgaan met de macrodichtheid van fluoroforen1. (iv) Artefacten in beeldvorming kunnen ontstaan door aberraties, drift en systematische vervagingen. We gaan ervan uit dat de microscoop goed is uitgelijnd en dat de regio’s die zijn gekozen voor analyse in de echte gegevens verstoken zijn van deze artefacten. Er is ook de mogelijkheid om enkele van deze artefacten te modelleren in de PSF 18,19,20.
Dicht opeengepakte structuren
De problemen met het niet kunnen onderscheiden van overlappende staven van netwerken is een hardnekkig probleem bij de segmentatie van 2D-microscopiegegevens. Een extreem uitdagend scenario wordt gepresenteerd in figuur 5, waar de mitochondriën dicht opeengepakt zijn, wat leidt tot suboptimale resultaten in het segmentatiemodel en de volgende analyse. Ondanks deze uitdaging kan het gebruik van morfologische operatoren in dergelijke situaties om de skeletvorming af te slanken, helpen om deze overdreven verbonden netwerken te doorbreken, terwijl significante veranderingen in alle mitochondriale morfologiecategorieën nog steeds kunnen worden gedetecteerd. Bovendien is het gebruik van een confocale in plaats van een widefield-microscoop voor beeldvorming een methode om dit probleem gedeeltelijk te verminderen door onscherp licht te elimineren. Verder zou het in de toekomst nuttig zijn om 3D-segmentatie uit te voeren om mitochondriën te onderscheiden die elkaar kruisen (d.w.z. fysiek een netwerk vormen) van staafachtige mitochondriën waarvan de projecties in een enkel vlak elkaar overlappen.
Deep-learning segmentatie is een veelbelovend hulpmiddel dat biedt om de analysemogelijkheden van microscopiegebruikers uit te breiden, waardoor de mogelijkheid wordt geopend voor geautomatiseerde analyse van complexe gegevens en grote kwantitatieve datasets, die voorheen onbeheersbaar zouden zijn geweest.
The authors have nothing to disclose.
De auteurs erkennen de discussie met Arif Ahmed Sekh. Zambarlal Bhujabal wordt erkend voor het helpen bouwen van de stabiele H9c2-cellen. We erkennen de volgende financiering: ERC starting grant no. 804233 (to K.A.), Researcher Project for Scientific Renewal grant no. 325741 (to D.K.P.), Northern Norway Regional Health Authority grant no. HNF1449-19 (Å.B.B.), and UiT’s thematic funding project VirtualStain with Cristin Project ID 2061348 (D.K.P., Å.B.B., K.A., and A.H.).
12-well plate | FALCON | 353043 | |
Aqueous Glutaraldehyde EM Grade 25% | Electron Microscopy Sciences | 16200 | |
Axio Vert.A1 | Zeiss | Brightfield microscope | |
CCCP | Sigma-Aldrich | C2759 | |
Computer | n/a | n/a | Must be running Linux/Windows Operating System having an NVIDIA GPU with at least 4GB of memory |
Coverslips | VWR | 631-0150 | |
DAPI (stain) | Sigma-Aldrich | D9542 | |
DMEM | gibco | 11966-025 | |
Fetal Bovine Serum | Sigma-Aldrich | F7524 | |
Glass Slides (frosted edge) | epredia | AA00000112E01MNZ10 | |
H9c2 mCherry-EGFP-OMP25 | In-house stable cell line derived from purchased cell line | ||
Incubator | Thermo Fisher Scientific | 51033557 | |
LSM 800 | Zeiss | Confocal Microscope | |
Mounting Media (Glass) | Thermo Fisher Scientific | P36980 | |
Paraformaldehyde Solution, 4% in PBS | Thermo Fisher Scientific | J19943-K2 | |
Plan-Apochromat 63x oil (M27) objective with an NA of 1.4 | Zeiss | 420782-9900-000 | |
Sterile laminar flow hood | Labogene | SCANLAF MARS | |
Trypsin | Sigma-Aldrich | T4049 | |
Vacusafe aspiration system | VACUUBRAND | 20727400 | |
ZEN 2.6 | Zeiss |