Summary

Visualisatie en kwantificering van High-dimensionale Cytometrie gegevens met behulp van Cytofast en de upstream clustering methoden FlowSOM en Cytosplore

Published: December 12, 2019
doi:

Summary

Cytofast is een visualisatietool die wordt gebruikt om de uitvoer van clustering te analyseren. Cytofast kan worden gebruikt om twee clustering methoden te vergelijken: Flowsom en cytosplore. Cytofast kan snel een kwantitatief en kwalitatief overzicht van Mass cytometrie gegevens genereren en de belangrijkste verschillen tussen verschillende clustering algoritmen benadrukken.

Abstract

De complexiteit van de door Mass cytometrie gegenereerde gegevens heeft nieuwe instrumenten nodig om de analytische uitkomsten snel te visualiseren. Cluster methoden zoals Cytosplore of flowsom worden gebruikt voor de visualisatie en identificatie van celclusters. Voor downstream-analyse, een nieuw ontwikkelde R-pakket, Cytofast, kan een snelle visualisatie van de resultaten van clustering methoden genereren. Cytofast houdt rekening met de fenotypische karakterisering van celclusters, berekent de overvloed van het celcluster en vergelijkt vervolgens kwantitatief groepen. Dit protocol verklaart de toepassingen van Cytofast aan het gebruik van massa cytometrie gegevens op basis van modulatie van het immuunsysteem in de tumor micro omgeving (dat wil zeggen, de Natural killer [NK] Cell Response) op tumor Challenge gevolgd door immunotherapie (PD-L1 blokkade). Demonstratie van het nut van Cytofast met Flowsom en cytosplore wordt getoond. Cytofast genereert snel visuele representaties van groepgerelateerde immuuncelclusters en correlaties met de samenstelling van het immuunsysteem. Verschillen worden waargenomen in de clusteranalyse, maar scheiding tussen groepen zijn zichtbaar met beide cluster methoden. Cytofast toont visueel de patronen geïnduceerd door PD-L1-behandeling die een hogere overvloed aan geactiveerde NK-celsubsets bevatten, waarbij een hogere intensiteit van activerings markers wordt uitgesproken (d.w.z. CD54 of CD11c).

Introduction

Massa cytometrie (cytometrie door tijd-van-vlucht, of CyTOF) maakt detectie van een breed scala van intracellulaire of extracellulaire biomarkers in miljoenen afzonderlijke cellen. De High-dimensionale aard van Mass cytometrie gegevens vereist bepaalde analysetools, zoals celclustering technieken zoals SPADE1, flowmaps2, flowsom3, phenograph4, VorteX5en steiger Maps6. Daarnaast zijn er verschillende technieken voor dimensionaliteit reductie ontwikkeld (d.w.z. hoofdcomponent analyse [PCA]7, t-Distributed stochastische buurman insluiten [t-SNE]8, hiërarchische stochastische neighbor Embedding [hsne]9, uniforme variëteit benadering en projectie [umap]10, en diffusie kaarten11) om de snelheid, interpretatie en visualisatie van High-dimensionale gegevenssets te verbeteren.

Downstreamanalyse van High-dimensionale flow en Mass cytometrische gegevens mist vaak automatische processen om statistische tests uit te voeren op cluster frequentie en koppelingen met klinische uitkomsten. Voorheen ontwikkelden we een R-gebaseerde workflow, bekend als Cytofast12, die visuele en kwantitatieve stroomafwaartse analyses van clustering technieken mogelijk maakt door Cytosplore of flowsom.

Het hier beschreven protocol verduidelijkt het gebruik van Cytofast in R en laat zien hoe kwantitatieve en kwalitatieve Heatmaps en grafieken te genereren. Bovendien vergemakkelijkt het de bepaling van verbindingen tussen waargenomen immuunfenotypes en klinische uitkomsten. Dit rapport beschrijft ook de analyse van een specifieke massa-cytometrie-gegevensset met behulp van twee verschillende clustering procedures: Flowsom en cytosplore. Door Cytofast te gebruiken met beide cluster methoden, is het dienovereenkomstig aangetoond dat het activerings fenotype van NK-cellen wordt beïnvloed door PD-L1 immune Checkpoint blokkade.

Protocol

Alle dier experimenten werden goedgekeurd door het dier experimenten Comité van LUMC en werden uitgevoerd volgens de richtlijnen voor dierproeven van het LUMC in overeenstemming met de richtlijnen van de Nederlandse en Europese commissies. Opmerking: voor experimentele opstelling werden C57BL/6 muizen subcutaan geënt op de rechterflank met de Murine Colon tumor MC38 bij een concentratie van 0,3 x 106 cellen/200 μL fosfaatbufferde zoutoplossing (PBS). Na 10 dagen, wanneer tumoren voelbaar waren, werden de muizen behandeld met PD-L1 blokkerende antilichamen (kloon MIH-5, 200 μg/muis, intra-peritoneale injectie) of werden met een mock behandeld. De tumoren werden 3 dagen later na de PD-L1-injectie geperfectioneerd, ex vivo verwerkt en geanalyseerd door CyTOF Mass cytometrie met behulp van 38-markers13. 1. apparatuur en software voor gegevensanalyse Opmerking: gebruik een computer (Windows 7 of nieuwer) en de processor I5 op 2,4 GHz of gelijkwaardig, geïnstalleerd geheugen RAM 6 GB en 10 GB vrije ruimte op de harde schijf. Het R-pakket Cytofast maakt gebruik van bestaande functies: voornamelijk flowcore, pheatmapen ggplot. De opdrachtregels die in R moeten worden uitgevoerd, zijn opgenomen in het protocol. De resource voor R instructies u vinden op https://education.rstudio.com/. Om het Cytofast -pakket te installeren, start R (versie “3,6”) en Installeer bioconductor versie 3,9 door de volgende code in te voeren:Als (! requireNamespace (“BiocManager”, rustig = TRUE))install. packages (“BiocManager”)BiocManager:: Installeer (“cytofast”) Zorg ervoor dat het pakket in de gewenste omgeving wordt geladen door het volgende uit te voeren:Library (cytofast) 2. clusters maken Opmerking: om de twee clustering methoden cytosplore en flowsom met CYTOFASTte laten zien, worden de NK-cellen (CD161+) in de tumor micro-omgeving 3 dagen na pd-L1-behandeling geanalyseerd. Clustering uitgevoerd doorCytosplore Na het downloaden en installeren van Cytosplore, gehost op < www. Cytosplore. org >, upload de. FCS bestanden (aanvullende bestanden 1.1 – 1.8 [cytosplore invoerbestanden]) door te klikken op bestand | Open FCS bestand (en) in Cytosplore. Voeg een unieke voorbeeldcode als kanaal toe door te klikken op unieke voorbeeldcode toevoegen als kanaal wanneer hierom wordt gevraagd en selecteer een cofactor voor hyperbolische arcsinh-transformatie (de standaardwaarde is 5). Selecteer H-SNE uitvoeren, voer een hsne-niveau van 3 uit en wacht tot de kaart is gegenereerd.Opmerking: deze stap kan enige tijd vergen, afhankelijk van het aantal geanalyseerde cellen en het niveau van de gekozen HSNE. Controleer op het eerste HSNE-niveau de cellen die positief zijn voor CD161. Selecteer de CD161+ cellen en klik met de rechtermuisknop op Inzoomen in selectie. Op het tweede niveau herhaalt u de procedure om het derde niveau te bereiken met alleen CD161+ gebeurtenissen. Nadat de laatste tSNE-kaart is gegenereerd, slaat u de door Cytosplore gedefinieerde clusters op door met de rechtermuisknop op de tsne-kaart te klikken en clusters opslaante kiezen. Kies de map van de uitvoerbestanden zoals gevraagd door Cytosplore en noteer deze locatie, omdat deze map wordt vervolgens gebruikt voor het laden van de. FCS bestanden in R.Opmerking: het aantal subsets kan handmatig worden gewijzigd door de Sigma-waarde te wijzigen. De Sigma-waarde is standaard ingesteld op 30; het werkelijke aantal subsets is echter afhankelijk van de invoer. Hier ontdekte Cytosplore 10 verschillende subsets, waarbij elk bestand één subset vertegenwoordigt. Gebruik een eenvoudige naam (alleen tekens) bij het hernoemen van de uitvoerbestanden, waardoor de identificatie en de verdere afhandeling eenvoudiger worden. Sla de uitvoerbestanden op door Opslaante selecteren.Opmerking: na het opslaan wordt een map gemaakt door cytosplore met de. FCS-bestanden, waarbij elk bestand overeenkomt met de geïdentificeerde clusters in cytosplore. De volgende stap zal het laden van de bestanden in R met de hulp van Cytofast. Hier, de gegenereerde output bestanden worden geleverd in aanvullende bestanden 2.1 – 2.10 (cytosplore uitvoerbestanden). Laad de door Cytosplore gegenereerde uitvoerbestanden in R met de aangewezen functie: readCytosploreFCS.dirFCS <-"C:\\users\\gebruikersnaam\\desktop\\tostudy"cfData <-readCytosploreFCS (dir = dirFCS, colNames = "Beschrijving") Reinig de gegevens door enkele parameters te verwijderen, zoals “tijd” en “achtergrond”. Controleer de positie van de kolom met betrekking tot de onnodige parameters en verwijder deze uit de matrix.colNames (cfData@expr)cfData@expr <-cfData@expr [,-c (3, 4, 6, 8:10, 46:49, 51:54)]Opmerking: de overbodige kolommen u zien door de kolomnamen van de gegenereerde matrix te lezen. Door colNames (cfData@expr) opnieuw uit te voeren, moet u ervoor zorgen dat alleen de gewenste parameters worden verkregen. Volg de markeringen opnieuw zodat de Lineage markers eerst worden weergegeven, gevolgd door functionele markeringen.cfData@expr <-cfData@expr [, c (1, 2, 3, 35, 36, 31, 9, 10, 18, 8, 37, 20,29, 40, 5, 30, 33, 11, 34, 14, 19,32, 28, 6, 7, 4, 12, 13, 17, 16, 15,21, 22, 24, 25, 26, 27, 38, 39)]Opmerking: stap 2.1.8 is optioneel. Koppel de metagegevens aan de gegenereerde gegevens uit Cytosplore door het spreadsheet-meta bestand met klinische informatie (aanvullend bestand 3) te uploaden.bibliotheek (readxl)Meta <-read_excel ("C:\\users\\gebruikersnaam\\desktop\\ sample_id. xlsx")cfData@samples <-data. frame (meta)Opmerking: de clustering die wordt uitgevoerd door cytosplore is nu voltooid. Een alternatieve clustering optie voor Cytosplore is flowsom en wordt beschreven in paragraaf 2,2. Nadat een van de twee cluster stappen is uitgevoerd, gaat u verder met de visualisatie stap (sectie 3). Clustering uitgevoerd doorFlowSOM Installeer eerst Flowsom in R door de volgende opdracht uit te voeren:Als (! requireNamespace (“BiocManager”, rustig = TRUE))install. packages (“BiocManager”)BiocManager:: install (“FlowSOM”)bibliotheek (FlowSOM) Installeer het flowCore-pakket met een vergelijkbare methode en laad het in de omgeving door het volgende uit te voeren:Als (! requireNamespace (“BiocManager”, rustig = TRUE))install. packages (“BiocManager”)BiocManager:: install (“flowCore”)bibliotheek (FlowSOM) De onbewerkte gegevens in aanvullende bestanden laden 4.1 – 4.8 (FCS flowsom input), die eerder werden afgesloten op CD161 + gebeurtenissen, in R met de Read. flowset functie.fcs_raw <-lezen. flowSet (Path = "C:\\users\\gebruikersnaam\\desktop\\tocluster", pattern = ". FCS", transformatie = FALSE, truncate_max_range = FALSE, Seed = 123) Selecteer de relevante biologische markers (Verwijder “achtergrond” of “tijd”) door de juiste kolommen te selecteren en de gegevens op een arcsinh5 manier te transformeren zoals getoond in de onderstaande code (hier, Verwijder kolommen 1, 2, 4, 5, 6, 17, 21, 24, 25, 34, 35, 37, 38, 51, die niet overeenkomen met een biologische marker). Een cofactor van 5 toepassen zoals eerder toegepast met Cytosplore, door te kiezen voor cofactor = 5 in de onderstaande functie.fcs_raw <-fsApply (fcs_raw, functie (x, cofactor = 5) {colNames (x) <-fcs_raw [[1]] @parameters @data $ descexpr <-exprs (x)expr <-asinh (expr [,-c (1, 2, 4, 5, 6, 17, 21, 24, 25, 34, 35, 37, 38, 51)]/cofactor)exprs (x) <-exprReturn (x)}) Cluster de gegevens met behulp van de Flowsom functie. Om Flowsom en cytosplorete vergelijken, kiest u ervoor om de gegevens in tien subsets te clusteren als de output die eerder door cytosploreis opgeleverd.fsom <-FlowSOM (fcs_raw, transformFunction = FALSE, schaal = FALSE,geschaald. Center = FALSE, geschaald. scale = FALSE, Silent = FALSE, colsToUse = c (1:37),nClus = 10, maxMeta = 10, belang = NULL, Seed = 123)Opmerking: dit kan handmatig worden gewijzigd door de gebruiker. Wijs elke cel toe aan de geïdentificeerde subset en voorbeeld-ID.subset_id <-as. factor (fsom $ FlowSOM $ map $ mapping [, 1])niveaus (subset_id) <-fsom $ metaclusteringhoofd (subset_id) Laad het bestand met metagegevens in R (beschikbaar in aanvullend bestand 5) met de groepsopdracht en koppel het aan de. FCS-bestanden.SampleID <-read_excel ("C:\\users\\gebruikersnaam\\desktop\\ sample_id. xlsx")SampleID <-na. weglaten (SampleID)SampleID $ sampleID <-as. factor (SampleID $ sampleID)SampleID $ Group <-as. factor (SampleID $ Group)SampleID $ CSPLR_ST <-as. factor (SampleID $ CSPLR_ST)SampleID <-as. data. frame (SampleID)namen (SampleID) [3] <-"sampleID"sampleID <-lapply (fsom $ FlowSOM $ metaData, functie (x) {rep (x [1], elke = length (x [1]: x [2]))})attr (sampleID, ‘ names ‘) <-NULLsampleID <-as. factor (Unlist (sampleID))SampleID <-data. frame (SampleID)niveaus (sampleID) <-paste ("ID", 1: Dim (SampleID) [1], sep = "_")DF <-data. frame (subset_id, sampleID, fsom $ FlowSOM $ data [, c (1:37)])Wijzig de naam van <-data. frame (colpar = fcs_raw [[1]] @parameters @data $ DESC)colNames (DF) <-c ("clusterID", "sampleID", hernoemen $ colpar [c (1:37)])DF $ clusterID <-as. factor (DF $ clusterID)DF $ sampleID <-as. factor (DF $ sampleID) Maak een cfList op basis van het gegevensframe dat is verkregen van Flowsom door het volgende script uit te voeren:cfData < cfList (samples = SampleID,expr = DF) Bestel de markeringen opnieuw om op dezelfde manier te verschijnen als de uitvoer van de Cytosplore -analyse.cfData@expr <-cfData@expr [, c (1, 2, 34, 36, 37, 10, 23, 24, 31, 22,38, 15, 8, 3, 27, 9, 11, 28, 35, 26,14, 33, 17, 20, 21, 18, 25, 29, 13,30, 12, 16, 32, 4, 5, 6, 7, 19, 39)]Opmerking: de clustering door flowsom is nu voltooid. Voer vervolgens visualisatie van de clustering-uitvoer uit. 3. visualisatie: analyse van clustering na verwerking Opmerking: deze stap is een methode die voor beide cluster methoden gebruikelijk is. Daarom kan het worden uitgevoerd na Clustering, hetzij met Flowsom of cytosplore. Voordat u de Heatmaps maakt, genereert u de teltabel per sample met behulp van de functie cellCounts zoals weergegeven in de onderstaande code. Omdat sommige clusters minder cellen dan andere bevatten, schaal de gegevens per cluster door op te geven “scale = TRUE” binnen de functie cellCounts, zodat de dispersie tussen de monsters gemakkelijk kan worden gezien.cfData <-cellCounts (cfData, frequentie = TRUE, Scale = TRUE)Opmerking: de gegevens kunnen nu worden gevisualiseerd. Visualiseer met heatmap.Opmerking: een van de belangrijkste functies van dit pakket is cytoHeatmaps, die wordt gebruikt om het fenotype van de gecreëerde clusters en hun heterogeniteit met betrekking tot de monsters te visualiseren.cytoHeatmaps (cfData, groep = “groep”, Legend = TRUE) Visualisatie met boxplotsOpmerking: gegevens kunnen op een kwantitatieve manier worden weergegeven door de functie cytoBoxplots aan te roepen. De uitvoer van deze functie vertegenwoordigt de verhouding van elk voorbeeld voor elk cluster. Genereer het aantal cellen zoals gedaan in stap 3,1, maar schaal de gegevens niet om de frequentie van elk cluster te verkrijgen.cfData <-cellCounts (cfData, frequentie = TRUE, Scale = FALSE)cytoBoxplots (cfData, groep = “groep”) Visualisatie met mediaan intensiteit signaal histogramOpmerking: de gegevens kunnen ook worden gevisualiseerd door het gemiddelde intensiteits signaal histogram te representeren. Visualiseer de intensiteit van de expressie van drie Markeringen: CD45, CD11c en CD54. Controleer de namen van de gewenste markeringen door de volgende regel te bellen. Noteer de namen van de markeerstift en neem deze op in de functie msiPlot.namen (cfData@expr)Opmerking: hier, focus op CD45, CD11c, en CD54. Controleer de exacte spelling van de markeringen en pas deze aan indien nodig:msiPlot (cfData, markers = c (“89Y_CD45”, “167Er_CD11c”, “164Dy_CD54”), byGroup = ‘ Group ‘)

Representative Results

De workflow Cytofast (Figuur 1) is bedoeld om een kwantitatief en kwalitatief overzicht te geven van de gegevens die oorspronkelijk zijn geclusterd door analyse software (D.w.z. Flowsom of cytosplore). Cytofast loopt verschillende mogelijke uitgangen, met inbegrip van de heatmap van alle clusters geïdentificeerd in de analyse en op basis van marker uitdrukking (Figuur 2 en Figuur 3). Het dendrogram op de top vertegenwoordigt de hiërarchische gelijkenis tussen de geïdentificeerde clusters. In het bovenste deelvenster wordt een andere heatmap weergegeven met de relatieve hoeveelheid overeenkomende subsets in elk voorbeeld. Het dendrogram aan de rechterkant toont de gelijkenis tussen de monsters en is gebaseerd op hiërarchische clustering uitgevoerd op de Euclidische afstanden tussen de monsters. De gecombineerde Heatmaps worden weergegeven voor Flowsom gevolgd door cytofast in Figuur 2 en voor cytosplore gevolgd door cytofast in Figuur 3. Cytofast kan ook worden gebruikt om de gegevens kwantitatief te presenteren en de resultaten weer te geven in boxplots (met behulp van de functie cytoBoxplots), zoals weergegeven in Figuur 4 en Figuur 5. Vergelijkbare clusters werden gevonden tussen de twee verschillende methoden (bijvoorbeeld cluster 8 van Cytosplore correspondeert met cluster 10 van flowsom), en co-expressie van sommige remmende markers zoals PD-1 en lag-3 waren nog steeds zichtbaar in beide methoden). Beide cluster methoden lieten discriminatie tussen PD-L1 versus PBS behandelde muizen. Sommige verschillen tussen beide methoden kunnen daarentegen worden gemarkeerd. Flowsom identificeert 2 clusters (MHC-II+), terwijl cytosplore slechts één cluster (MHC-II+ Dim) toont. Dit is te wijten aan de initiële gating strategie waarin NK cellen handmatig werden afgesloten op CD161+ cellen, vervolgens verder verwerkt door flowsom. Echter, Cytosplore automatisch gated cellen van de CD45+ populatie op de eerste hsne niveau, die vervolgens werden geclusterd in een hoger hiërarchisch niveau. Zo definieerde Cytosplore de NK-celsubgroepen preciezer dan hoe handmatig gating zich RICHTTE op CD161. Niettemin, hiërarchische clustering van de monsters werd bewaard, zoals weergegeven in het dendrogram aan de rechterkant, wat aangeeft dat de scheiding tussen de twee groepen (PD-L1 en PBS) was niet afhankelijk van de gekozen clustering methode. Het aantal clusters kan handmatig worden gedefinieerd met behulp van beide methoden. Cytofast stelt de gebruiker in staat om de heterogeniteit van hun gegevens te beoordelen en kan inzicht geven in hoe het aantal clusters te kiezen waarin de gegevens moeten worden verdeeld. Andere functies zijn opgenomen in het Cytofast -pakket, zoals de msiplot-functie (stap 3.4.2), met het mediaan signaalintensiteit (MSI)-plot van elke marker per groep (Figuur 6 en Figuur 7). Deze functie maakt het mogelijk om globale wijzigingen te detecteren, zoals een toename van de expressie van CD54 of CD11c in NK-cellen van de PD-L1-behandelde groep. Optionele functies kunnen worden opgenomen in het Cytofast -pakket, zoals het weergeven van gegevens in staafgrafieken en andere methoden voor gegevens representatie. Deze laatste vereist de toevoeging van ggplot tools, die kunnen worden gegenereerd door R. Figuur 1: workflow van Cytofast -pakket. De gegevens werden gegenereerd door massa cytometrie van een tumor 3 dagen na de behandeling met immunotherapie of onbehandeld gelaten. Twee verschillende clustering technieken werden vergeleken: Cytosplore en flowsom. Cytofast werd gebruikt om de verschillen tussen de twee technieken te visualiseren. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 2: cluster overzicht en cluster overvloed per groep zoals geanalyseerd door Cytofast na cytosplore. Heatmap van alle NK-celclusters (CD161+ cellen die automatisch worden gedefinieerd door cytosplore), die 3 dagen na immunotherapie (PD-L1) werden geïdentificeerd. De getoonde gegevens zijn gebaseerd op Cytosplore clustering en gegroepeerd uit de ONBEHANDELDE en pd-L1 behandelde groepen. Niveaus van ArcSinh5-getransformeerde expressie markering worden weergegeven op een schaal van de regenboog. Op het onderste deelvenster wordt de relatieve overvloed van elk monster weergegeven door de groen-naar-paarse schaal. Het dendrogram aan de rechterkant vertegenwoordigt de gelijkenis tussen monsters op basis van subset frequenties. De frequentie schaal vertegenwoordigt de spreiding van het gemiddelde. Een lage of een hoge frequentie wordt weergegeven door respectievelijk een groene of paarse kleur. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 3: cluster overzicht en cluster overvloed per groep zoals geanalyseerd door Cytofast na flowsom. Heatmap van alle NK-celclusters (vooraf gegated op CD161+ Events), die 3 dagen na IMMUNOTHERAPIE (PD-L1) werden geïdentificeerd. Getoonde gegevens zijn gebaseerd op Flowsom clustering en gegroepeerd uit de ONBEHANDELDE en pd-L1 behandelde groepen. Niveaus van ArcSinh5-getransformeerde expressie markering worden weergegeven op een schaal van de regenboog. Op het onderste deelvenster wordt de relatieve overvloed van elk monster weergegeven door de groen-naar-paarse schaal. Het dendrogram aan de rechterkant vertegenwoordigt de gelijkenis tussen monsters op basis van subset frequenties. De frequentie schaal vertegenwoordigt de spreiding van het gemiddelde. Een lage of een hoge frequentie wordt weergegeven door respectievelijk een groene of paarse kleur. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 4: cytosnelle weergave met boxplots van de door cytosploregedefinieerde clusters. De frequentie van elk cluster wordt weergegeven in een boxplot, gescheiden in de twee groepen (PBS en PD-L1). Eén afzonderlijke stip komt overeen met één muis. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 5: cytosnelle representatie met boxplots van de clusters gedefinieerd door flowsom. De frequentie van elk cluster wordt weergegeven in een boxplot, gescheiden in de twee groepen (PBS en PD-L1). Eén afzonderlijke stip komt overeen met één muis. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 6: verdeling van signaalintensiteit plots van NK-cellen die automatisch worden afgesloten door Cytosplore. De verdeling van de signaal intensiteiten wordt in een histogram weergegeven voor drie specifieke Markeringen: CD45, CD11c en CD54. Klik hier om een grotere versie van dit cijfer te bekijken. Figuur 7: verdeling van signaalintensiteit plots van NK-cellen automatisch afgesloten door flowsom. De verdeling van de signaal intensiteiten wordt in een histogram weergegeven voor drie specifieke markers: CD45, CD11c en CD54, gescheiden door groepen PBS en PD-L1. Klik hier om een grotere versie van dit cijfer te bekijken. Aanvullende bestanden 1.1 – 1.8. Klik hier om dit bestand te bekijken (Klik met de rechtermuisknop om te downloaden). Aanvullende bestanden 2.1 – 2.10. Klik hier om dit bestand te bekijken (Klik met de rechtermuisknop om te downloaden). Aanvullend bestand 3. Klik hier om dit bestand te bekijken (Klik met de rechtermuisknop om te downloaden). Aanvullende bestanden 4.1 – 4.8. Klik hier om dit bestand te bekijken (Klik met de rechtermuisknop om te downloaden). Aanvullend bestand 5. Klik hier om dit bestand te bekijken (Klik met de rechtermuisknop om te downloaden).

Discussion

Cytofast is een snelle computationele tool die een snelle en wereldwijde verkenning van cytometrische gegevens biedt door het markeren en kwantificeren van behandelings specifieke cellulaire subsets. Het beschreven protocol is bedoeld om clustering analyses verder te verwerken met Cytosplore of flowsom. Andere clustering analysetools zijn geschikt voor cytofast, maar dit vereist het gebruik van cytofast om elke cel aan een subset toe te wijzen. Cytofastis echter geen cluster methode en vereist daarom voor gebruik clustering procedures.

De hier uitgevoerde analyse toonde aan dat bepaalde CD161+ NK-celsubgroepen in de tumor-micro omgeving gevoelig waren voor een PD-L1-blokkade. Dit werd bewezen door veranderingen in hun fenotype en overvloed, die werden waargenomen met behulp van zowel Cytosplore als flowsom als clustering methoden. Beide methoden onderscheiden de belangrijkste NK-celclusters (CD11b+ NKG2A+) met iets verschillende frequenties (15% – 20% voor cytosplore, 30% – 40% voor flowsom). De verschillen in overvloed en deze benadering hebben geen invloed op het globale patroon, omdat beide dendrogrammen weergegeven in de rechter panelen van Figuur 2 en Figuur 3 vergelijkbare resultaten vertoonden. Door Cytofastte gebruiken, is het dus mogelijk (onafhankelijk van de gekozen cluster methode) om PD-L1-behandelde en onbehandelde muizen te scheiden op basis van analyses van de NK-celcluster fenotype en overvloed.

Afhankelijk van de vastgelegde parameters zijn wijzigingen aan het protocol nodig. Bepaalde parameters zoals tijd en achtergrond moeten worden verwijderd tijdens het uitvoeren van de clusteranalyse. Bovendien is het belangrijk dat elke cel aan een subset wordt toegewezen. De functie cfData voegt eenvoudigweg het aantal ruwe cellen per cluster per sample toe aan de cfList. Vanuit deze stap kan de cytoheatmap worden gebouwd zoals uitgelegd in sectie 3.

Cytofast is met succes gebruikt als visualisatie-en kwantificerings tool om verschillende clustering methoden te vergelijken13. Dit R-pakket is ook compatibel met geavanceerde functies, zoals de globaltest14, die associaties kan testen tussen groepen clusters met behulp van klinische variabelen. In de toekomst kunnen de globaltest tool en andere algoritmen worden geïntegreerd met cytofast voor meer diepgaande visualisatie en kwantificering.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Wij erkennen de financiering van de Europese Commissie van een H2020 MSCA Award onder het voorstel nummer 675743 (ISPIC). Wij danken Tetje van der sluis en Iris Pardieck voor het testen van het protocol.

Materials

Computer Dell NA NA

References

  1. Anchang, B., et al. Visualization and cellular hierarchy inference of single-cell data using SPADE. Nature Protocols. 11 (7), 1264-1279 (2016).
  2. Zunder, E. R., Lujan, E., Goltsev, Y., Wernig, M., Nolan, G. P. A continuous molecular roadmap to iPSC reprogramming through progression analysis of single-cell mass cytometry. Cell Stem Cell. 16 (3), 323-337 (2015).
  3. Van Gassen, S., et al. FlowSOM: Using self-organizing maps for visualization and interpretation of cytometry data. Cytometry A. 87 (7), 636-645 (2015).
  4. Levine, J. H., et al. Data-Driven Phenotypic Dissection of AML Reveals Progenitor-like Cells that Correlate with Prognosis. Cell. 162 (1), 184-197 (2015).
  5. Samusik, N., Good, Z., Spitzer, M. H., Davis, K. L., Nolan, G. P. Automated mapping of phenotype space with single-cell data. Nature Methods. 13 (6), 493-496 (2016).
  6. Spitzer, M. H., et al. An interactive reference framework for modeling a dynamic immune system. Science. 349 (6244), 1259425 (2015).
  7. Hotelling, H. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology. 24 (6), 417-441 (1933).
  8. van der Maaten, L., Hinton, G. Visualizing Data using t-SNE. Journal of Machine Learning Research. , (2008).
  9. Pezzotti, N., Hollt, T., Lelieveldt, B., Eisemann, E., Vilanova, A. Hierarchical Stochastic Neighbor Embedding. Computer Graphics Forum. 35 (3), 21-30 (2016).
  10. Becht, E., et al. Dimensionality reduction for visualizing single-cell data using UMAP. Nature Biotechnology. 37, 38 (2018).
  11. Haghverdi, L., Buettner, F., Theis, F. J. Diffusion maps for high-dimensional single-cell analysis of differentiation data. Bioinformatics. 31 (18), 2989-2998 (2015).
  12. Beyrend, G., Stam, K., Höllt, T., Ossendorp, F., Arens, R. Cytofast: A workflow for visual and quantitative analysis of flow and mass cytometry data to discover immune signatures and correlations. Computational and Structural Biotechnology Journal. 16, 435-442 (2018).
  13. Beyrend, G., et al. PD-L1 blockade engages tumor-infiltrating lymphocytes to co-express targetable activating and inhibitory receptors. Journal for ImmunoTherapy of Cancer. 7 (1), 217 (2019).
  14. Goeman, J. J., van de Geer, S. A., de Kort, F., van Houwelingen, H. C. A global test for groups of genes: testing association with a clinical outcome. Bioinformatics. 20 (1), 93-99 (2004).

Play Video

Cite This Article
Beyrend, G., Stam, K., Ossendorp, F., Arens, R. Visualization and Quantification of High-Dimensional Cytometry Data using Cytofast and the Upstream Clustering Methods FlowSOM and Cytosplore. J. Vis. Exp. (154), e60525, doi:10.3791/60525 (2019).

View Video