Summary

Workflow pour haut-contenu, cellule individuelle quantification des marqueurs fluorescents de Data Universal Microscope, pris en charge par Open Source Software

Published: December 16, 2014
doi:

Summary

Présenté informatique est un workflow flexible permettant multiplexé analyse basée sur l'image de cellules marquées par fluorescence. Le workflow quantifie marqueurs nucléaires et cytoplasmiques et calcule marqueur translocation entre ces compartiments. Des procédures sont prévues pour perturbation de cellules en utilisant siRNA et la méthodologie fiable pour la détection du marqueur par immunofluorescence indirecte dans des formats de 96 puits.

Abstract

Les progrès dans la compréhension des mécanismes de contrôle régissant le comportement des cellules dans les modèles de culture de tissus de mammifères adhérentes sont de plus en plus dépendante des modes d'analyse unicellulaire. Méthodes qui fournissent des données composites reflétant les valeurs moyennes des biomarqueurs de populations de cellules risquent de perdre la dynamique des sous-populations qui reflètent l'hétérogénéité du système biologique étudié. Dans cet esprit, les approches traditionnelles sont remplacées par, ou soutenus avec des formes plus sophistiquées de dosage cellulaire développés pour permettre une évaluation par microscopie à haute teneur. Ces analyses génèrent potentiellement un grand nombre d'images de biomarqueurs fluorescents, ce qui a permis en accompagnant des logiciels propriétaires, permet des mesures multi-paramétriques par cellule. Toutefois, les coûts d'investissement relativement élevés et la surspécialisation de plusieurs de ces dispositifs ont empêché leur accessibilité à de nombreux enquêteurs.

Décrit ici est unflux de travail universellement applicable pour la quantification des intensités multiples marqueurs fluorescents provenant de régions sous-cellulaires spécifiques de cellules individuelles appropriées pour une utilisation avec des images de la plupart des microscopes à fluorescence. La clé de ce flux de travail est la mise en œuvre du logiciel Cell Profiler disponible gratuitement 1 à distinguer les cellules individuelles dans ces images, les segmenter en régions subcellulaires définies et livrer l'intensité de marqueur de fluorescence des valeurs spécifiques à ces régions. L'extraction des valeurs individuelles d'intensité de la cellule à partir de données d'image est l'objectif central de ce flux de travail et sera illustrée par l'analyse des données de contrôle à partir d'un écran de siRNA pour G1 régulateurs de points de contrôle dans les cellules humaines adhérentes. Cependant, le flux de travail présenté ici peut être appliquée à l'analyse des données provenant d'autres moyens de perturbation cellulaire (par exemple, les écrans de composés) et d'autres formes de marqueurs cellulaires de fluorescence en fonction et devrait donc être utile pour un large éventail de laboratoires.

Introduction

Le travail présenté ici décrit l'utilisation du logiciel portable disponible gratuitement Profiler pour effectuer répartition algorithme guidée d'images de microscopie de fluorescence de cellules adhérentes pour identifier des cellules individuelles et des régions subcellulaires définies. Cette approche, appelée segmentation d'image, permet l'analyse multi-paramétrique ultérieur des cellules imagées par la quantification des marqueurs marqués par fluorescence localisées à chaque cellule ou de la région subcellulaire (ci-objets segmentés). Ce flux de travail constitue une base pour permettre une analyse de haut-contenu et est destiné à servir comme un outil qui peut être encore développé et modifié pour répondre multi-paramétrique, cellule individuelle analyses dans les laboratoires, sans accès à des instruments de haut contenu spécialisés ou des logiciels propriétaires. Les fichiers fournis avec ce manuscrit comprennent un ensemble de données d'images brutes pertinentes, les paramètres de l'algorithme et son appui test pour générer l'analyse décrit. Les réglages de l'algorithme fourni fou cellulaire Profiler sont optimisés pour l'ensemble de données d'exemple et les détails de la section Discussion quels ajustements peuvent être nécessaires pour permettre l'utilisation de données d'image d'autres études.

Une fois les données quantitatives a été extrait en utilisant cellulaire Profiler, les laboratoires peuvent avoir des exigences différentes pour savoir comment utiliser l'information présentée par les valeurs des cellules individuelles dans les données brutes; montré ici est une méthode par laquelle les portes sont appliquées aux données brutes pour chaque dosage. L'utilisation de ces portes, les données sont transformées en termes binaires de réponse, permettant la visualisation de l'évolution des traitements différents de liaison avec les sous-populations de cellules subissant une réponse définie par les barrières. Les portes sont fixés en fonction des observations des distributions de données obtenues pour les contrôles négatifs et positifs appropriés pour chaque mesure pertinente. L'utilisation de portes ne est qu'un exemple de la façon de gérer les premières mesures, à base de cellules. Également montré ici est l'utilisation de l'intensité de l'ADN nucléaire moiasurements dans leur forme brute comme une plage continue de valeurs en combinaison avec les données gated. D'autres approches pour la gestion des données d'analyse d'image doivent être envisagés, en fonction de la nature de l'étude; alternatives à l'utilisation de statistiques portes pour affecter les cellules à des sous-populations ont été signalés 2 et systématiques des comparaisons de stratégies pour résumer les données à haute teneur sur un grand nombre de paramètres ont été signalés 3.

Analyses Haute-contenu de données d'image ont trouvé une utilisation dans les études cellulaires de drogues-réponse, la génétique inverse et le stress environnemental signalisation 4-6. Le mérite de tiges analyse à haute teneur du fait que l'analyse algorithmique de données de microscopie à fluorescence permet des paramètres quantitatifs et spatiales à prendre en compte simultanément dans des cellules individuelles 7. De cette manière, les résultats de plusieurs essais cellulaires peuvent être recoupées comportement, de dosage différentiel-dsous-populations de cellules efined peuvent être suivis dans des conditions expérimentales et les essais peuvent inclure l'examen des variables morphologiques. L'analyse des stratégies et des flux de travail a discuté ici, comme pour d'autres approches à haut contenu, sont capables de fournir des données multiplexées qui sont des renvois à des cellules individuelles. Des études de haut contenu méthodes costume qui génèrent des images de microscope à fluorescence et sont applicables à l'analyse des données allant de quelques dizaines d'images produites en microscopie de fluorescence à base conventionnelle faible débit grâce aux milliers d'images produites en utilisant des plates-formes de criblage à haut contenu automatisés.

Le workflow est illustré ici avec des exemples de données à partir de laquelle essais séparés sont mesurés en termes de soit intensités de marqueurs fluorescents nucléaires ou translocation cytoplasmique / nucléaire d'une protéine rapporteur fluorescent, respectivement. Le flux de travail est souple en ce que ces dosages peuvent être considérées séparément ou en combinaison en fonction de l'EACh donnée question de recherche par différents enquêteurs. Les données d'exemple sont produites dans le cadre d'une interférence ARN (ARNi) expérience (Figure 1). Les petits oligonucléotides d'ARN interférents (siARN) sont utilisés pour knockdown protéines spécifiques dans HCT116 cellules de carcinome de côlon humain qui se traduisent par des changements pour deux rapporteurs fluorescents de kinase (CDK) l'activité de la cycline-dépendante. La phosphorylation de la CDK6 dépendante de la protéine du rétinoblastome nucléaire à serine 780 (P-S780 RB1) est évaluée par coloration d'anticorps. Dans les mêmes cellules, un fluorescent reporter vert de la protéine à étiquette de l'activité CDK2 (GFP-CDK2 reporter) est évaluée par sa nucléaire rapport cytoplasmique où en l'absence de l'activité de CDK2 le rapporteur réside dans le noyau et sur les navettes d'activation de CDK2 dans le cytoplasme 8. En outre, l'ADN nucléaire de chaque cellule est coloré en utilisant un colorant intercalant de l'ADN, bisbenzimide, qui sert en tant que moyen pour identifier les cellules et définir les frontières des noyaux dans les images ainsi unemesure de sa abondance de l'ADN de fournir des informations sur la position de cycle cellulaire de la cellule (figure 2).

Les activités de la CDK2 et de la CDK6 peuvent être détectés comme des cellules de transit G1 à la phase S du cycle cellulaire et 5 se succèdent 9,10 et, de ce fait, la concordance étroite entre les deux rapporteurs dans des cellules individuelles est attendue. L'ensemble de données de démonstration utilisée ici analyse comme un exemple de l'effet de siRNA ciblant CDK6, protéine du rétinoblastome (RB1) et un contrôle négatif non-ciblage (tableau 1). Knockdown de CDK6 doit obtenir à la fois une diminution de l'épitope RB1 P-S780 et une accumulation de cellules en phase G1 du cycle cellulaire. Le knockdown de RB1 sert de témoin de réactif pour la spécificité de l'anticorps phospho-S780. Des images de microscopie à fluorescence de la formaline 11 fixés, les cellules de culture de tissu de HCT116 colorées par fluorescence sont utilisés pour l'analyse d'image algorithmique. Les données numériques résultant est ensuite utilisé pourréférence croisée les journalistes et juger de l'impact des différents états knockdown.

La taille potentielle des données produites par ce type d'analyse peut présenter un défi aux outils d'analyse normales. Par exemple, les données de cellules individuelles peuvent être plus grand que certains logiciels de tableur accueillir. Inclus sont des scripts Perl qui effectuent hautement répétitif, de traitement simple, supervisé des données pour faciliter l'analyse de grands ensembles de données. Les scripts Perl sont écrits spécifiquement pour les fichiers de sortie produits par Cell Profiler, lors du traitement des fichiers d'image avec un fichier convention de nommage spécifique (figure 3), et permettent un nombre variable de champs par puits pour être utilisées dans l'analyse. Il est souvent important de données de titrage porte de cellule individuelle pour suivre les tendances dans les sous-populations de cellules 5 et représenté ici est l'utilisation d'un script Perl pour marquer chaque cellule basée sur un ensemble porte prédéterminé pour chaque type d'essai. Sont également inclus les scripts Perl optionnelsqui résument les résultats de données pour des puits individuels (ou conditions), la prestation: pourcentage de cellules dans la grille de jeu et les valeurs moyennes des scores de dosage premières. Ce dernier moyen, plus homogène de la visualisation des données, est valable lorsque des réponses affectent la totalité ou la majorité des cellules à l'intérieur d'un puits. Comme discuté ci-dessus, cette évaluation est moins utile que celle conférée par l'individu déclenchement de données de cellule dans laquelle la réponse est limitée à un sous-ensemble de cellules dans une population.

L'utilité du flux de travail décrite ne est pas limitée à une perturbation par siRNA ou les dosages de marqueurs décrits. Des études ont utilisé cette méthode pour évaluer la réponse dans les expériences de culture de tissu en utilisant des combinaisons de siRNA, inhibiteurs chimiques et des traitements de radiothérapie et d'évaluation des marqueurs autres que CDK6 et l'activité de CDK2 5.

Conceptuellement, la stratégie expérimentale permet une variété de régions subcellulaires biologiquement utiles pour être automatiquement enregistrédans des cellules individuelles présentes dans les images au microscope à fluorescence. En tant que tel, cette approche peut produire des données multiplexées révélant des informations quantitatives, biologique qui peut être manquée par des techniques qui mettent l'accent sur les populations plutôt que des cellules individuelles. Avec des modifications mineures, l'approche et l'analyse flux décrit peut produire des données de cellules quantitatives, individuelles pour toutes les sorties de dosage basés sur la fluorescence et les réponses des cellules biologiques, où l'évaluation quantitative de la teneur en ADN, la quantification de la fluorescence nucléaire ou cytoplasmique ou le mouvement alternatif des marqueurs entre ceux-ci deux compartiments individuellement ou d'une manière multiplexée est d'intérêt. Comme les exigences de publication tendent plus vers la présentation de données brutes librement accessibles, l'accès et la familiarité avec les outils gratuits pour l'analyse d'images de microscopie telles que celles décrites ici sera également un intérêt direct pour les laboratoires qui cherchent à réanalyser les données publiées.

Protocol

1. expérimentale Perturbation et Cell étiquetage pour les marqueurs de réponse (écran arrière transfection siRNA) Dans une culture de tissu hotte pipette stérile 70 pi de 200 nM de siRNA tampon 1x siRNA dans les puits d'une plaine plaque de 96 puits stérile. Diluer transfection lipide dans 40 volumes de milieu de DMEM sans sérum et dispenser 105 pi dans chaque puits contenant un ARNsi. NOTE: La dilution 262,5 pi lipides dans 10,5 ml de DMEM sans sérum donne un mélange maître approprié pour l'ensemble plaque de 96 puits de siRNA, délivrant 2,6 pi de lipides par puits. Utilisation de 200 nM siRNA concentration à partir de cette étape donnera une concentration de travail de 20 nM dans l'étape 1.3, mais les procédures travaillera pour des concentrations en descendant à 5 nM, avec la concentration de départ ajustée en conséquence (soit 50 nM). Concentration de travail inférieure peut réduire scores positifs faux hors-cible, mais ils peuvent réduire l'ampleur de la réponse sur la cible, conduisant à une augmentation du sur-target taux de faux négatifs. Mélanger la plaque de vibration douce pendant dix minutes à la température ambiante. Sous-diviser les 175 pi résultant en trois répétitions par 50 pi cible sur une culture de tissu opaque traité, plaque de 96 puits avec une base transparente. Transfecter inversée en distribuant 8000 cellules par puits dans 150 ul de DMEM contenant du sérum à 10% directement sur les complexes de lipides siRNA 50 ul. Cellules colorectales humaines utilisation HCT116 exprimant de manière stable un marqueur GFP-tagged déclarant l'activité CDK2 5,8. Aucune autre mélange est nécessaire. Sceller la plaque avec un adhésif membrane respirante stérile pour contrôler l'humidité et prévenir les bords effets 'plaque et placer la plaque dans un incubateur humidifié à 37 ° C, 5% de CO 2 pendant 48 heures. Aspirer les médias tels qu'une petite quantité résiduelle de médias reste dans les puits. Fixer les cellules par addition de 100 pl de 4% de formaldehyde tamponnée à chaque puits et incuber dans une hotte de laboratoire pendant 10 min à t ambianteempérature. Retirer la solution de fixation par aspiration la plaque. À ce stade, soit arrêter l'expérience en lavant la plaque trois fois avec 100 ul de solution saline tamponnée au phosphate (PBS), puis stocker scellé, moins de 100 pi de PBS dans l'obscurité à 4 ° C pendant jusqu'à une semaine, ou procéder à la perméabilisation des cellules. NOTE: Nous recommandons plaques de traitement dès que possible après la fixation, et généralement préfèrent le stockage de plaques entièrement transformés. Des conservateurs tels que des biocides thimérosal, l'azoture de sodium, ou alternatives commerciales peuvent être ajoutés pour empêcher la croissance micoroganismal. Addition d'inhibiteurs de phosphatase aide à préserver phospho-épitopes, et d'autres moyens de préserver états de modification de la protéine peut être utile dans des contextes d'analyse pertinents Retirer la plaque de PBS et perméabiliser les cellules par addition de 100 ul de solution de perméabilisation. Incuber pendant 10 min à température ambiante, sans agitation. Aspirer la solution de perméabilisation utilisant un Multichpipette Annel. Répétez cette étape trois fois. Bloquer les cellules en ajoutant une solution du bloc 100 ul par puits pendant 30 minutes à température ambiante. Retirer la solution de bloc en aspirant la plaque, puis sonder avec 50 ul d'anticorps RB1 P-S780 lutte contre dilué 500 fois dans la solution de bloc pendant 2 heures dans l'obscurité à la température ambiante. Laver la plaque trois fois avec 100 ul de solution de lavage de plaque, en laissant la solution sur la plaque pendant 5 minutes à chaque fois. Sonde de la plaque pendant une nuit dans l'obscurité à 4 ° C avec 50 dilué 1000 fois ul marqué par fluorescence de l'anticorps secondaire dans une solution de bloc supplémenté avec 2 uM de colorant de l'ADN spécifique de la chromatine bisbenzimide. Laver la plaque trois fois avant et magasin étanche, moins de 100 pi de PBS dans l'obscurité à 4 ° C. Image de la plaque dans les deux semaines. 2. Imagerie et segmentation d'images Utilisez un microscope confocal ou à disque rotatif fluorescence avec un objectif 20X à prendre séparée 16bits, les images TIFF en niveaux de gris en trois canaux correspondant au colorant d'ADN, la GFP et les fluorophores immuno-coloration. Capturez le nombre de jeux d'images non-chevauchement, appelé ici cadres, à l'image d'environ 1.000-2.000 cellules par puits. Nommez les fichiers d'image systématiquement de sorte que chaque nom de fichier est une combinaison unique de 'nom de l'expérience »,« adresse bien »,« numéro d'image »et« identificateur de canal », dans cet ordre (Figure 3). L'ensemble des données de l'exemple utilise "Bleu" (chromatine coloration de l'ADN) ou «vert» (GFP) ou «Red» (le fluorophore immuno-colorés) comme identificateurs de canal. L'adresse de puits, numéro de châssis et le canal identifiant sont plus loin appelé les métadonnées de l'image. Utilisez le symbole de soulignement pour éviter bien et le cadre métadonnées confusion. Nommez les fichiers avec ces éléments de métadonnées dans l'ordre spécifié. Cela est nécessaire pour se assurer que les étapes ultérieures de logiciels Correjeux de groupe cte d'images pour l'analyse. Téléchargez et installez la cellule Profiler freeware, Active Perl Community Edition, environnement de programmation statistique R et RStudio. Acceptez toutes les options par défaut lors de l'installation; PC utilisateurs installant Active Perl devraient permettre toutes les options relatives à PATH, association extension de fichier et le mappage de script où vous êtes invité. Active Perl est facultative pour les utilisateurs de Mac, mais ils autrement besoin pour exécuter le script Perl à l'étape 3.2 de la ligne de commande Terminal plutôt que d'utiliser l'icône clic. Ouvrez le logiciel Cell Profiler, cliquez sur «Fichier», «importation Pipeline», puis «À partir du fichier" et sélectionnez le fichier 3_channels_pipeline.cppipe (figures S1A et S1B). Le fichier contient les instructions nécessaires pour le logiciel d'interpréter l'image métadonnées du fichier de la convention de nom de fichier décrit. Cellule Profiler concerne maintenant les images, des extraits d'ADN nucléaire et intensités anticorps de eese et utilise le canal de la GFP pour calculer le ratio de l'énergie nucléaire par rapport intensité de cytoplasme pour chaque cellule détectés (figures 4 et 5). Cliquez sur le bouton «Afficher les paramètres de sortie» dans le coin inférieur gauche de la fenêtre Cell Profiler. Au sommet de la nouvelle écran sont encadrés portant la mention «Dossier d'entrée par défaut» et «Dossier de sortie par défaut '. Un à la fois, cliquez sur le dossier icônes à droite de ces cases et sélectionnez l'emplacement des fichiers d'image pour l'analyse et la destination des données extraites, respectivement (figure S1C). Commencer l'analyse d'image en appuyant sur le bouton 'analyser les images de dans le coin inférieur gauche de Cell Profiler. Au bas de l'écran observer le temps restant pour l'extraction de données, la «Analyse Stop 'et boutons de la« pause ». Si nécessaire pause l'analyse en sélectionnant le bouton 'Pause' à tout moment, ce qui est utilelorsque vous regardez les images en cours d'analyse (décrit dans l'étape 2.8). Eventuellement, ouvrir les fenêtres pour l'une des étapes d'analyse d'images en cliquant sur ​​les oculaires icônes dans le panneau à l'extrême gauche de la fenêtre du programme (Figure S1D). Observez la fenêtre '' IdentifyPrimaryObjects et ceux pour «secondaires» et «objets tertiaire» pour vérifier que les paramètres actuels cellulaire Profiler pour effectuer la segmentation d'image sont adaptés (voir la figure 1 et de discussion pour des conseils sur la modification de ces paramètres). Cliquez sur «OK» dans la boîte de message qui se affiche lorsque l'analyse est terminée. Allez à l'emplacement 'Default Folder de sortie »où tous les fichiers de données avec les résultats sont enregistrés en tant que séparés par des virgules valeur (.csv) (Figure S2A). 3. Extraction des données Trouver le nouveau fichier 'Nuclei.csv', qui est inclus parmi lessortie de cellule Profiler. Ce fichier contient des données de cellules individuelles pour fluorescente intensité d'anticorps nucléaire, l'intensité de l'ADN nucléaire et des valeurs de rapport rapporteur GFP-CDK2 (figures 6A et S2A). REMARQUE: Différents laboratoires voudront traiter ce type de données en fonction de la nature de leurs propres essais. Suggérée pour les données en cours est le déclenchement des cellules de chaque condition de traitement en fonction des données d'anticorps et les valeurs de rapporteur GFP CDK2 en utilisant le script Perl disponible 'de 2_gate_classifier.pl. Copiez le fichier de script Perl fourni "de 2_gate_classifier.pl» dans le même dossier que le fichier de données du 'Nuclei.csv' (Figure S2A). Double-cliquez sur l'icône pour le script Perl et, lorsque vous êtes invité, tapez le nom complet du fichier de données suivie d'une '.csv' nom de nom du fichier dans lequel les cellules doivent être fermée et enfin les valeurs à la ferme pour l'anticorpsfluorescence et données rapporteurs GFP-CDK2. NOTE: Comment faire pour déterminer principalement les paramètres de grille et de les appliquer à l'analyse des données sont discutés ci-dessous dans la section des données représentatives et la figure 6 (pour analyser les données fournies utilisation '0,004' et '1.5', respectivement). Les utilisateurs de Mac doivent exécuter le script Perl à partir de la ligne de commande Terminal en tapant: «perl 2_gate_classifier.pl '. Observez le fichier nouvellement créé qui combine les valeurs individuelles premières d'analyse cellulaire à partir des données Cell Profiler originaux avec des étiquettes des sous-populations qui montrent comment chaque cellule de chaque puits effectue contre les deux portes (Figure 6C). Tracer les données pour chaque condition expérimentale en utilisant les étiquettes individuelles de sous-populations de cellules en ouvrant le logiciel RStudio. Cliquez sur «Fichier» et «Open File», puis sélectionnez le fichier fourni "de analysis.r '. Respecter les commandes pour tracer les figures 6B, <strong> 7 et 8 dans la fenêtre supérieure gauche de RStudio (Figure S2B). Dans la fenêtre en haut à gauche, entre les symboles de citation doubles sur les lignes 5 et 6, tapez l'adresse de l'ordinateur du dossier contenant les données gated. Inclure la lettre de lecteur et le nom du fichier lui-même, respectivement (par exemple, "C: / dossier d'analyse / sortie d'analyse» et «nuclei_gated.csv"). NOTE: Si RStudio est utilisé pour la première fois sur un ordinateur donné, le logiciel graphique de R 'de ggplot2' devra être installé en premier. Ce est une étape qu'une seule fois pour une nouvelle installation de RStudio, après quoi cette étape devient redondant. Pour installer 'ggplot2', cliquez sur l'onglet appelé «paquets» dessus de la fenêtre dans le coin inférieur droit de RStudio, cliquez sur le bouton "installer des paquets» qui apparaît sous cette. Une nouvelle fenêtre apparaît. Type 'ggplot2' (des citations omettant) dans le s 'paquets'le rythme dans cette nouvelle fenêtre et enfin cliquez sur le bouton «Installer» pour fermer la fenêtre, installer les fonctions de ggplot2 nécessaires et revenir à la fenêtre principale de RStudio de continuer de l'étape 3.6. Faits saillants des lignes 1 à 17 dans la fenêtre en haut à gauche de RStudio, puis cliquez sur le bouton "Exécuter". Ce entrera les données expérimentales, les valeurs de seuil et les détails de localisation de bien dans R (Figure S2C). R va maintenant détenir temporairement les données pertinentes pour le traçage. Mettez en surbrillance les blocs individuels du code restant sous la ligne 17 et de créer les parcelles correspondantes en cliquant sur le bouton "Exécuter" comme avant. Respecter les parcelles dans la fenêtre dans le coin inférieur droit de RStudio et économisez nombre de formats en cliquant sur ​​le bouton 'Export' (Figure S2D). Lors de la fermeture RStudio, cliquez sur «Ne pas enregistrer" lorsque vous êtes invité. Cela évite la confusion sur la prochaine utilisation de RStudio, qui autrement détenir des donnéesde la session précédente.

Representative Results

L'exemple d'images généré en utilisant l'inverse-transfection siRNA protocole de dépistage ont été préparées et analysées avec le logiciel Cell Profiler. Les données brutes numérique résultant est telle que chaque cellule est représentée individuellement, traçables à son image et bien d'origine et mesurée pour plusieurs paramètres d'intensité de fluorescence (figure 6A). Pour chaque cellule identifiée l'intensité moyenne de fluorescence nucléaire pour l'anticorps RB1 P-S780 et l'intensité de l'ADN intégré pour les masques de protection nucléaire de colorant défini ADN sont déterminés. Les valeurs moyennes d'intensité de la GFP pour les régions de noyau et le cytoplasme de chaque cellule sont également enregistrés permettant le calcul de l'énergie nucléaire par rapport fluorescence cytoplasmique du rapporteur GFP-CDK2. En aval de ces fluorescence algorithmique mesures d'intensité on utilise ces données de cellules individuelles pour définir des grilles pour les deux essais, la coloration d'anticorps nucléaire et CDK2-GFP rapporteur. Annotation ultérieure des cellules sur ee base des résultats dosage et l'utilisation de ces étiquettes pour permettre à des sous-populations spécifiques devant être en outre caractérisé par une troisième mesure (teneur en ADN nucléaire) est décrit. parcelles histogramme des données d'intensité de fluorescence brutes recueillies pour chaque essai sont un moyen efficace d'évaluer comment les sous-populations de cellules se comportent dans des conditions différentes. Les histogrammes de la figure 6B montrent les distributions de population de données cellulaires individuels de puits en triple pour chaque condition knockdown ARNi. Pour la gauche sont les données pour l'intensité d'anticorps nucléaire et sur le droit sont les données correspondantes pour le rapporteur GFP-CDK2. Les données d'anticorps RB1 P-S780 révèle que les cellules existent largement dans deux populations à l'égard de cette modification post-traductionnelle et que les populations de cellules avec une perte de RB1 phosphorylée sur S780 peuvent être distingués en tant que pic de gauche de l'intensité nucléaire qui est enrichie quand CDK6 est renversé par siRNA. Cette même pic gaucheest vu quand RB1 se est la cible ARNi, reflétant la suppression pure et simple de la protéine et donc P-S780 RB1 coloration. En revanche, les mêmes conditions expérimentales pour les mêmes cellules, lorsque observée par l'intermédiaire du dosage de rapporteur GFP-CDK2, présentent une dynamique différente dans les données de cellules individuelles. Une distribution continue est observée, avec un seul pic, mais siRNA qui perturbe le cycle cellulaire (siCDK6) et provoque l'accumulation dans les résultats de la phase G1 dans une extension de l'épaule droite de cette distribution (ce est à dire indiquant la présence accrue des cellules présentant une augmentation du ratio de la GFP nucléaire / cytoplasme, tracé sur l'axe X). On voit également sur ​​les histogrammes de la figure 6B sont des valeurs de grille (barres verticales) qui sont choisis sur la base des distributions de deux ensembles de données d'essai. La règle utilisée pour les données d'anticorps RB1 P-S780 est de définir la position de grille comme la demi-hauteur: la position de largeur maximale sur l'épaule gauche de la principale(À droite) de pointe lors de l'examen des données négatives de cellules de contrôle (non-ciblage siRNA). Données souligné rouge sont des cellules avec réduite et absent RB1 P-S780, qui sont identifiés avec cette porte. Une porte similaire placé sur l'épaule opposée de la distribution de valeur de rapport est utilisé pour le rapporteur GFP-CDK2. Les cellules de la sous-population à ratio élevé résultant, qui manquent ou la fonction réduction de l'activité de CDK2, sont indiquées en vert. Pour illustrer l'analyse multiplexée des deux dosages Figure 6C montre la mise en œuvre des deux valeurs de grille en utilisant le script 2_gate_classifier.pl perl pour convertir les données brutes (figure 6A) dans le fichier annoté ci-dessous. Ce nouveau fichier comprend des données d'origine le long d'une nouvelle colonne d'étiquettes de classe pour chaque cellule et les deux valeurs de grille utilisés pour les distinguer (dans ce cas des portes de 0,004 pour les données d'anticorps et 1,5 pour le rapporteur GFP-CDK2 ont été utilisés, respectivement) . Ayant classé les cellules individuelles From chaque condition knockdown sur la base des deux essais, il est maintenant possible d'utiliser ces étiquettes de classe pour aider l'annotation de parcelles de données de titrage. La figure 7 montre dispersent parcelles de données cellulaires individuelles pour le P-S780 RB1 et GFP dosages de CDK2 de l'ensemble pour les trois conditions ARNi données d'exemple. Numéros annoter les quadrants sur les diagrammes de dispersion montrent les pourcentages relatifs de chaque sous-population fermée à l'ensemble de ce contexte d'effet de choc et sont générés dans la R en utilisant les étiquettes de classe décrites ci-dessus. Ces courbes montrent que, par rapport aux cellules transfectées avec des non-ciblage siRNA (figure 7B), les cellules transfectées avec siCDK6 révèlent une distribution de données net déplacé à la fois vers le bas sur l'axe des Y (indiquant l'absence d'RB1 phosphorylation sur la serine 780) et à droite, sur l'axe X (ce qui indique une faible activité de CDK2, Figure 7C). Ces deux changements sont attendus pour effet de choc de cet objectif. Contrairement à cela, les données de SirB1 cellules transfectées (figure 7A) montrer une perte de la coloration d'anticorps conforme à la perte de l'épitope, mais peu d'effet dans la distribution de données pour le journaliste de CDK2 par rapport aux témoins transfectées avec non-ciblage siRNA, suggérant l'absence de grand effet sur ​​la GFP journaliste -CDK2 découle de RB1 knockdown. Pour explorer davantage l'utilisation des données de la cellule individuelle, la classification des sous-population et le multiplexage dosage figure 8 montre le diagramme de dispersion pour les données siCDK6 de profils d'histogramme Figure 7C aux côtés appariés pour l'intensité de l'ADN intégré. Les paires d'histogrammes concernent moitiés opposées de l'ensemble de la population, répartis sur la base de l'intensité soit d'anticorps (de droite du diagramme de dispersion) ou GFP-CDK2 valeurs de rapport rapporteurs (au-dessus du nuage de points). La quantification de l'intensité de l'ADN nucléaire de ces populations montre deux pics caractéristiques de 2N et 4N teneur en ADN comme des pics de gauche et de droite, respectivement. Le intentions des grilles représentées sur les figures 6, 7 et 8 sont telles que les cellules identifiées comme faible pour P-S780 RB1 (marqué P-S780-) ou avec une forte valeur de rapport à partir du rapporteur GFP-CDK2 (marqués: G1) seront être en phase G1 du cycle cellulaire. En effet, les histogrammes de profils d'ADN pour les sous-populations identifiées avec l'une de ces essais contiennent principalement des cellules avec l'ADN contenu 2N. profils ADN de la population opposée fermée (étiquetés: P-S780 + ou non-G1) contient des cellules avec des distributions allant de 2n à 4N, en accord avec ces cellules adoptant une gamme de cycle cellulaire positionne phase post-G1. Bien que l'accent ici a été la génération et l'analyse des données de cellules individuelles à partir d'images colorées par fluorescence, il est également utile d'être en mesure de prendre ces données et résumer chaque essai sur une base bien par puits pour surveiller la variabilité entre les répétitions et la performance de tous les puits pour un essai donné dans l'ensemble une plaque de données. <strong> La figure 9 montre les données de chaque traitement siRNA résumées comme les valeurs moyennes de puits en triple pour le pourcentage de cellules dans les portes appliquées à A) les données de RB1 et B P-S780) les données rapporteurs GFP-CDK2. Les valeurs tracées dans A et B sont produits par deux scripts Perl supplémentaires fournies avec ce manuscrit; 'Antibody_fluorescence_summary.pl »et« G1assay_summary.pl', respectivement. Ces scripts utilisent les données brutes créées par Profiler cellulaire (Nuclei.csv) et les données du rapport ainsi que par i) cellules totales mesurées par puits, ii) le nombre de cellules dans la porte, iii) pourcentage de cellules dans la porte et iv) la moyenne arithmétique moyenne des données brutes, mesurées pour ce puits. Ce est inclus comme une option appropriée pour la recherche sur de vastes ensembles de données d'essai, avant de se concentrer sur les données individuelles de traitement utilisant l'évaluation des données multiplexé de cellules individuelles comme illustré dans <strong> figures 7 et 8. Les graphiques affichés ici complot »iii) pourcentage de cellules au sein de la porte» pour les deux dosages, qui conviennent les distributions de données non-normales observées pour les données de P-S780 RB1 et GFP-CDK2 dans les histogrammes de la figure 6B. Ces scripts calculent aussi 'iv) la moyenne arithmétique des données brutes, mesurées pour ce bien », qui conviendrait à l'analyse des données pour les réactions des populations homogènes et de la distribution normale des données avant et après la perturbation expérimentale. Figure 1:. Vue d'ensemble des étapes du flux de travail pour l'analyse quantitative des données d'image de microscope marquées par fluorescence Le workflow est représenté ici comme quatre étapes (A) d'abord, il est nécessaire de préparer expérimentalement des cellules pour l'imagerie de fluorescence.. L'exemple décrit ici est celui d'uneécran dans lequel les cellules tumorales humaines adhérentes siARN traités sont cultivées pendant 48 heures, fixées et colorées sur une plaque de culture de tissu à 96 puits. Conditions ARNi différents sont présents en triple exemplaire dans des puits séparés dans la plaque. Les cellules sont colorées avec un colorant d'ADN, un anticorps spécifique pour RB1 phosphorylée sur la CDK4 et 6 sélectif site cible sérine-780 (P-S780 RB1) et ils ont aussi exprimer de manière stable un GFP-CDK2-reporter, les rapports de sortie du cycle cellulaire de G1. Collectivement, ces sondes fluorescentes constituent deux dosages évalués séparément dans le flux de travail. (B) images de microscope parallèle pour chaque sonde fluorescente (canal) sont générés et nommés de manière à inclure des détails par lequel le logiciel d'analyse d'image peut organiser les données. (C) Le fichiers d'images sont chargées dans le logiciel Cell Profiler, qui identifie algorithmique cellules individuelles et les paires associées de noyaux et le cytoplasme avant de céder mesures d'intensité pour les trois sondes fluorescentes détectented dans chaque. (D) Enfin, un script Perl est utilisé pour organiser les données quantitatives brutes produites. Cette étape se applique portes aux données d'intensité de fluorescence pour chaque cellule, binning efficacement les cellules en sous-populations, qui peuvent être tracées, suivis et contre-interrogé. Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 2: Les données expérimentales à obtenir par analyse d'image, Les siRNA-traitées, les cellules marquées par fluorescence fixes de l'ensemble ont été imagées et des mesures d'intensité correspondantes prises par cellule données d'exemple.. Des données d'image représentatives sont indiquées pour chaque paramètre enregistré lors de l'analyse de l'image d'intensité (A) ADN nucléaire. L'intensité de la coloration du colorant de l'ADN nucléaire est utilisée pour donner une mesure de l'ADN par noyau (B) Intensité nucléaire de phospho-RB1:. Immuno-coloration spécifique pour P-S780 RB1 l'aide d'un (noir) anticorps primaire et fluorescence marqués anticorps secondaire (rouge) permettent une mesure d'intensité de RB1 phosphorylation au . S780 par noyau (C) GFP-CDK2 journaliste: Les cellules utilisées exprimer de façon stable une protéine rapporteur GFP-tagged que translocation entre le noyau et le cytoplasme dans un modèle d'ensemble avec le cycle cellulaire. Double mesure de l'intensité de la GFP nucléaire et cytoplasmique couplé pour chaque cellule permet le calcul d'un rapport par cellule qui peut être utilisée pour distinguer la phase G1 du reste du cycle cellulaire. Trois cibles d'ARNsi seront utilisés pour illustrer l'analyse; un non-ciblage siRNA contrôle négatif; CDK6 siRNA comme témoin positif dans RB1 perturber la phosphorylation et la progression du cycle cellulaire; RB1 siRNA pour établir la spécificité des anticorps.k "> Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 3: Organisation des fichiers image avant l'analyse d'image Les images prises à partir de la plaque de culture de tissus sont nommés systématiquement afin de permettre le logiciel d'analyse d'image de relier les données d'image replacer dans le contexte expérimental original.. Cette information est placée dans le nom du fichier pour chaque image. (A) Comme chaque puits sur la plaque d'expérimentation peut correspondre à différentes cibles ou traitements ARNi, les formes d'adresse et une partie du nom de fichier. (B) Le numéro de l'image fait partie du nom de fichier . que chaque puits est imagée pour recueillir multiples, non-chevauchement des cadres (C) sondes fluorescentes de chaque trame sont imagés séparément; par conséquent, les noms de fichiers doivent également refléter le canal chaque image se rapporte. <strong> (D) Exemple noms de fichiers, relatives au bien (G12), Cadre (2) à chaque image représentant l'un des canaux (bleu, rouge, vert). Les lignes en pointillé relient les éléments de nom de fichier pour les représentations schématiques pertinentes pour le bien, le cadre et la Manche, respectivement. Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 4:. L'utilisation de cellules Profiler pour mesurer l'ADN nucléaire et la coloration des anticorps Avec les paramètres dans le fichier fourni de pipeline (3_channels_pipeline.cppipe), les valeurs d'intensité des mesures de logiciels d'analyse d'images de fluorescence cellulaire de Profiler pour l'ADN nucléaire et anticorps contraignant relatif à des cellules individuelles . (A) Les noyaux sont identifiés dans l'image de canal «bleu» de l'ADN coloré. (B) < / Strong> Les positions des noyaux d'ADN colorées sont détenues temporairement dans un «masque noyaux». Le masque est ensuite noyaux superposé à (C) les images bleues et rouges canal (ADN et de fluorescence de l'anticorps de données, respectivement) et les valeurs de fluorescence à partir de segments d'image qui se chevauchent avec le masque sont enregistrés contre chaque cellule identifiée. Identification réussie des noyaux voisins séparés, peut être évaluée visuellement à l'apparence du masque noyaux. Pour illustration, montré encerclé dans cette image de masque, sont des exemples où les paramètres choisis pour l'algorithme ont mis-identifiés noyaux voisins comme un seul noyau. Réglage des paramètres de l'algorithme pour minimiser ces événements est introduite dans la section Discussion. Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. /ftp_upload/51882/51882fig5highres.jpg "/> Figure 5: Utilisation de la cellule pour mesurer les intensités de profils GFP nucléaires et cytoplasmiques La CDK2 rapporteur GFP-tagged translocation entre le noyau et le cytoplasme en fonction de la position du cycle cellulaire des cellules.. En même temps que cellule Profiler calcule les ADN et d'anticorps intensités nucléaires par cellule (figure 4), on calcule également le nucléaire à taux de cytoplasme des intensités GFP pour chaque cellule. (A) Les données ADN de colorant pour chaque image est utilisé pour générer un masque noyaux. (B) Cell Profiler utilise le masque de noyaux en liaison avec l'image de la GFP à partir du rapporteur GFP-CDK2 pour ensemencer la position de chaque cellule puis se dilate au périmètre de chaque cellule pour estimer l'ensemble de l'empreinte de chaque cellule. Cela devient une nouvelle, «masque cellulaire '. (C) Le masque de noyaux est soustrait du masque cellulaire pour obtenir une série de forme de beignet de cytoplasme contours, qui deviennentle «masque cytoplasme». (D) Le masque et le cytoplasme masque noyaux sont utilisés par Cell Profiler pour mesurer paires de valeurs de GFP nucléaires et cytoplasmiques. Ces valeurs appariées sont ensuite utilisés par Cell Profiler pour calculer les ratios, qui informent à la position de chaque cellule dans le cycle cellulaire. Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 6:. Extraction des données – Traitement des données brutes de cellules individuelles en imposant des portes sur l'évolution des valeurs de dosage biologiques à partir des données de cellules individuelles pour la coloration d'anticorps et des dosages de rapporteur GFP CDK2 sont extraites en utilisant les données bloquées. Histogrammes des données brutes permettent d'identifier des valeurs de grille appropriés. Elles sont ensuite imposées avec un script Perl. (A) Leproduit de l'analyse des fichiers d'image avec les paramètres fournis pour cellulaire Profiler final sont séparées par des virgules valeur (.csv). Ces fichiers C ontain données individuelles de cellules relatives à chacun des différents segments de sous-cellulaire. Le fichier 'Nuclei.csv' contient toutes les mesures sélectionnées relatives à l'utilisation du masque noyaux. Ces mesures comprennent l'intensité des anticorps nucléaire, l'intensité de l'ADN nucléaire, et le rapport de la GFP (noyau / cytoplasme). (B) histogrammes d'intensité d'anticorps nucléaire (à gauche) et les rapports de rapporteurs GFP-CDK2 (à droite) tracée à partir des données de cellules individuelles pour chaque état ​​knockdown siARN . Les barres sur les histogrammes affichés montrent les positions de départ désirées pour ces essais. Des données de couleur sur les histogrammes indiquent les sous-populations gated. (C) Les portes pour les deux essais illustrés dans B sont appliquées aux données brutes en utilisant le script Perl «2_gate_classifier.pl '. Le scriptcrée une copie modifiée du fichier de sortie d'origine Cell Profiler (Nuclei.csv) pour aider tracer par la suite. Les deux valeurs de grille sont enregistrés dans le nouveau fichier (surligné en couleur ici) et une nouvelle colonne «Label» est ajouté. Le bac étiquettes chaque cellule dans l'une des quatre sous-groupes possibles en fonction des deux valeurs de dosage bloquées pour chaque cellule. Ces étiquettes sont utilisées dans les parcelles suivantes qui disposent calculs des contributions de chaque sous-population ainsi que le recoupement des paramètres supplémentaires générés dans Cell Profiler. Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 7:. Les diagrammes de dispersion pour chaque condition siRNA représentant les données brutes de cellules individuelles et les positions de grille Scatter parcelles de individouble données cellulaires à partir de toutes les images pour les conditions siARN indiqué: (A) siRB1; (B) de commande de ciblage Sinon négative; (C) siCDK6. Complotèrent contre les axes Y sont des valeurs de fluorescence nucléaire de l'anti-P-S780 RB1 coloration. Comploté contre les X-axes sont les valeurs de rapport correspondantes calculées à partir du rapporteur GFP-CDK2. Les barres rouges et vertes indiquent les positions des portes pour la porte de la RB1 P-S780 et les portes rapporteurs GFP-CDK2, respectivement. Les deux grilles des cellules se divisent en quatre sous-populations et les nombres résultants sur les quadrants représentent le nombre de cellules de pour cent de chacun de ceux-ci. Annotations autour des axes pour A indiquent les quatre étiquettes-éléments possibles appliquées à chaque cellule par le 2_gate_classifier.pl script Perl. Ces étiquettes sont représentés par rapport à leur grille respective de dosage et sont utilisés dans le R-écriture (analysis.r) pour générer les tracés des figures 6, 7 et <strong> 8. Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 8: cellulaires sous-populations définies par les deux dosages de transit G1 montrent profils 2N et 4N ADN en accord avec dosage résultats Le nuage de points de données pour les cellules siCDK6 est répété à partir de la figure 7C.. Entourant le nuage de points sont des histogrammes pour intégrée intensité de l'ADN nucléaire relatif à des sous-ensembles de la population. Ceux au-dessus du nuage de points se rapportent à l'essai rapporteur GFP-CDK2. Ceux à la droite de la nuage concernent nucléaire phospho-RB1 anticorps mesures seuls. Les lignes de grille de couleur sont étendues à montrer leur relation avec les histogrammes. Étiquettes porte par laquelle les données de la cellule ont été sélectionnés pour ces parcelles supplémentaires sont également présentés. Les cellules avec perte de RB1 phosphorylée sur des sérine 780 (P-S780-) ou ceux avec une GFP-CDK2 journaliste nucléaires de haute ratio cytoplasmique (indiquant une faible activité de CDK2) montrent des profils d'ADN principalement 2N-like, alors que leurs homologues opposées pour chaque dosage respective montrer une distribution de 2N et 4N, caractéristique d'un, post-G1 population de phase mixte de cellules. Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 9: Résumé des parcelles de valeurs de dosage pour chaque gated siRNA état ​​parcelles de données Résumé de gated (a) P-S780 données RB1 et données (B) GFP-CDK2 de puits en triple pour chaque condition knockdown. SiRNA. Les valeurs ont été calculées à partir de la sortie brute de Profiler cellulaire (Nuclei.csv) en utilisant leScripts Perl, 'antibody_fluorescence_summary.pl' (A) ou «G1assay_summary.pl '(B). Les valeurs tracées sont des moyens de le pourcentage de cellules au sein de la grille appliquée à chaque dosage. Les barres indiquent les erreurs-types calculées à partir des puits en triple. , Les valeurs homoscédastiques test t non apparié P pour chaque condition knockdown par rapport à la non-ciblage siRNA sont indiquées ci-dessus les données tracées où P <0,001 (**) et P <0,05 (*). Se il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure S1. Mise en place logiciel Cell Profiler pour l'analyse d'image. (A) Screenshot of Cell Profiler avant les paramètres d'analyse d'images sont saisies. (B) Screenshot of Cell Profiler après les détails de l'algorithme contenues dans '3_channels_pipeline.cppipe' ont été chargés. La haute onglet allumé dans le coin supérieur gauche indique que cet écran affiche les paramètres pour l'étape "loadImages» de l'analyse. En cliquant sur ​​les autres parties de la liste ci-dessous cela révéler les détails pour les étapes ultérieures de l'analyse. (C) Screenshot of Cell Profiler avec des détails pour dossier d'entrée et de sortie de dossier est entré. (D) Screenshot of Cell Profiler après la «Analyser le bouton de images a été cliqué pour commencer l'analyse. Superposées sont trois nouvelles fenêtres illustrant les masques algorithmique-produits générés par le logiciel à partir des images en cours d'analyse. Ces fenêtres sont accessibles en cliquant sur les icônes «oculaires» à la position ouverte à côté des mesures pertinentes dans l'analyse, dans le coin supérieur gauche de la fenêtre principale Cell Profiler. Ces vues permettent à l'utilisateur de vérifier si les paramètres générant les masques confettis de couleur en accord avec les données en niveaux de gris, d'accompagnement d'origine. ent "> Figure S2. L'utilisation de Perl et RStudio aux données de cellule individuelle de grille et de tracer les sous-populations de cellules qui en résultent. (A) Le panneau de droite montre le dossier choisi de recevoir les dossiers de la sortie (icônes vertes) de l'analyse cellulaire de Profiler. Les scripts Perl fournis avec le manuscrit (icônes bleues) sont copiés dans ce dossier. surbrillance est le script Perl «2_gate_classifier.pl», qui a été double-cliqué avec la souris pour produire la boîte de dialogue dans le panneau de gauche. indiquées sont les invites et réponses correspondant tapé nécessaires à la porte les données de cellules individuelles à partir du fichier 'Nuclei.csv'. (B) Capture d'écran de RStudio immédiatement après le chargement du script 'analysis.R'. surbrillance sont les commandes de télécharger les données de A gated dans le logiciel avant de traçage (détails de notes dans les lignes 5 et 6 devra être ajustée en fonction de l'endroit où les données fermée se trouve sur le calculr utilisé pour l'analyse). (C) Capture d'écran de RStudio fois que les données ont été téléchargées. (D) Capture d'écran de RStudio démontrant souligné le bloc de code requis pour produire le tracé affiché dans la fenêtre en bas à droite. Codes pour chaque parcelle sont séparés par des lignes vides et regroupés par type de tracé. cible siRNA Plaque de puits adresses Non-ciblage (NT) E5, F5, G5 Rétinoblastome (RB) E7, F7, G7 Kinase cycline-dépendante 6 (CDK6) B2, C2, D2 Tableau 1: Well adresses et conditions siARN correspondants utilisés dans l'ensemble de données d'exemple.

Discussion

Le flux de travail décrit constitue une procédure de perturbance multipuits de cellules en utilisant des siRNA, la détection de marqueur ultérieur et enfin l'utilisation d'une série d'étapes de logiciels pris en charge pour faciliter l'extraction de données quantitatives à partir des images de microscopie à fluorescence résultant. L'approche est axée sur la prestation de valeurs d'intensité nucléaires et cytoplasmiques de cellules individuelles, qui a une large application pratique dans de nombreuses applications à base de cellules. Les données d'exemple utilisées ici ont été générés dans un cadre d'écran siRNA dans lequel deux essais de fluorescence pour le transit du cycle cellulaire en phase G1 sont testés et corrélés retour à une mesure biophysique plus directe de la teneur en ADN nucléaire.

L'utilisation d'un ADN colorant fluorescent à l'ADN nucléaire de l'image est une étape indispensable dans le processus de segmentation d'image car elle permet l'identification de cellules individuelles et résultant 'masque noyaux »sert de point de départ pour identifier cytoplasmi correspondantc régions. La CDK2 rapporteur GFP-étiqueté, qui est exprimé de façon stable dans les cellules, donne encore une variable systématiquement plus élevée que le signal de fond dans le cytoplasme par lequel ce compartiment peut être délimitée. La même pipeline d'analyse devrait être applicable à l'analyse des événements protéines de translocation utilisant d'autres journalistes de fluorescence liée appropriées et leur réponse à perturbance. En outre, la substitution du rapporteur GFP-CDK2 avec des colorants fluorescents spécifiques à cytoplasme permettrait l'utilisation alternative de cet algorithme pour mesurer les dimensions du cytoplasme et les tailles relatives des cellules dans les images.

Une autre considération de conception dans la stratégie de segmentation d'image décrit ici est l'utilisation de cellules Profiler pour fournir des valeurs d'intensité intégrés pour la quantification de l'ADN. Intégration des valeurs d'intensité pour l'ADN nucléaire des données de coloration permettent de variations possibles dans la taille noyau, et représente un match serré pour les profils de quantification vuspour l'iodure de propidium teinté FACS données. Cependant, l'intensité intégrée peut ne pas donner les moyens appropriés pour évaluer la fonction de la protéine où la concentration moyenne, illustré par l'intensité moyenne de l'antigène fluorescence, est biologiquement plus pertinent que le montant total intégrée de protéines (et fluorescence associée) dans un compartiment cellulaire. Par conséquent, les valeurs moyennes d'intensité ont été utilisés pour la P-S780 RB1 et des données de GFP. L'option de modifier entre les deux modes (moyenne ou intégrée) de l'évaluation des données se trouve sur le panneau 'ExportToSpreadsheet' du logiciel Cell Profiler.

Les paramètres d'analyse dans le fichier 3_channels_pipeline.cppipe sont optimisés pour les images de l'ensemble des données d'exemple. Analyse des nouvelles images ensembles avec ce protocole, il faudra que les noms de fichiers adopter la convention de nommage décrite ci-dessus (Figure 3). En outre, la sensibilité valeurs en fonction de la luminosité de la coloration et des seuils d'ADN nucléaire pour le fondintensités dans les nouveaux ensembles d'image peuvent avoir besoin d'être ajusté dans les paramètres Cell Profiler. Étant donné le rôle clé de la coloration de l'ADN détient pour la construction des différents masques de segmentation d'image, l'application des réglages de sensibilité correctes pour ce canal est la clé du succès de l'analyse de nouvelles données d'image avec le logiciel Cell Profiler. Le fichier de paramètres fourni de Profiler de cellule (3_channels_pipeline.cppipe) contient des notes sur les paramètres les plus fréquemment utile pour adapter l'analyse de nouvelles données. Ces notes sont dans la zone de texte en haut de l'écran dans la Cellule fenêtre principale Profiler et comprennent des conseils sur la modification des réglages de sensibilité et en ajustant le nombre de canaux à analyser. Comme inculpé dans la section Protocole 2.8, pour tester les paramètres pour les nouvelles données d'image, il peut être nécessaire d'observer la segmentation d'image lors de l'analyse d'image en cliquant sur ​​Ouvrir les icônes «oculaires» pour chacun des «Identifier … Objets de protocole les étapes (Figure S1D </strong>). En particulier, la visualisation des données d'image à travers des «IdentifyPrimaryOjects 'indique si le masque noyaux est correctement identifié à partir d'images de la coloration de l'ADN. Sur la page de logiciel Cell Profiler pour le module 'de IdentifyPrimaryOjects est le facteur de correction de seuil. Essais et erreurs réglage de cette valeur sera corriger la plupart des erreurs de reconnaissance nucléaires. Les valeurs Solde le canal d'ADN contre l'intensité de fond pour chaque image. valeurs de facteur de correction de seuil charnière autour de 1, où plus de cela est plus rigoureuse (bon pour des images claires) et moins de 1 est clémente (adapté aux images avec moins de contraste entre la coloration et le fond).

Le résultat brut des données de cellule individuelle auprès de Cell Profiler peut être analysée de différentes façons pour répondre aux besoins d'autres études. Montré ici est l'utilisation d'un script Perl pour appliquer portes à deux des paramètres mesurés par cellule afin d'aider à extraire les tendances biologiques de l'un de donnéesd permis renvois des sous-populations identifiées avec des mesures supplémentaires. Bien qu'il soit également possible d'inclure des éléments de déclenchement dans le cadre de Cell Profiler, la route alternative utilisée ici fournit une plus grande flexibilité et la vitesse, surtout si de grands ensembles de données doivent être évaluées. L'étape la plus lente dans les phases de post-acquisition de l'image de l'actuel protocole est le fonctionnement du logiciel Cell Profiler. Cellule profiler ici est exécuté sans imposer portes pour produire une première série de données de l'ONU-fermée qui peut être réanalysé avec le script Perl ultérieure plus rapidement et, si nécessaire, de manière itérative avec différentes valeurs de grille. Toutes les études ne sauront à l'avance les valeurs de grille appropriés que cela peut varier avec des réactifs sur ne importe quel ensemble de données, et potentiellement au fil du temps. Il est donc recommandé de générer des histogrammes représentant la distribution de données brutes obtenues à partir de cellules Profiler pour les contrôles positifs et les cellules maquette perturbés afin d'identifier porte valu appropriéees pour les paramètres d'intérêt.

Les scripts Perl sont écrits à accepter une structure de données provenant de cellules Profiler de colonne définis de façon rigide et peuvent cesser de fonctionner si un utilisateur modifie le nombre de sortie des paramètres par Cell Profiler aide des paramètres du 'ExportToSpreadsheet'. Pour aider à mettre en œuvre la modification des paramètres notes sont incluses dans les fichiers de script Perl. Pour voir ces voir le script dans un éditeur de texte, de préférence l'éditeur de texte d'un programmeur fixé aux éléments de Perl de code de couleur (par exemple, http://www.activestate.com/komodo-edit). Ces notes indiquent où régler le script pour se adapter aux changements dans le format de données. Comme pour les scripts Perl, le fichier R-code fourni (analysis.r), contenant les instructions pour tracer les chiffres à partir des données d'analyse d'image, peut être lu dans un éditeur de texte ou le logiciel RStudio pour voir les notes supplémentaires sur l'utilisation et l'adaptation. Ces notes peuvent être complétées avec des détails sur les expressions régulières Perl et <sup> 12 et le paquet ggplot2 13 R, les deux qui forment la base de la façon dont les données sont lues, annotées et tracée, respectivement.

De nouvelles études utilisant la microscopie de fluorescence, ainsi que des données brutes déposés auprès publications open source se prêtent à des méthodes d'analyse tels que ceux décrits ici. La nature même des données à haut contenu se prête à l'analyse récursive avec des accents différents analytiques en fonction des intérêts de recherche de tout observateur donné. Bien que les questions qui peuvent être posées des données sont limitées par les sondes utilisées à l'origine, des données d'image peuvent souvent être réanalysés significative au-delà de la portée des études qui les ont générés.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a été financé par des subventions CRUK 15 043 et 14 251 CRUK.

Nous remercions Daniel Wetterskog et Ka Ho Kei pour l'assistance technique et la lecture critique du manuscrit.

Materials

Name of Material/ Equipment Company Catalog Number Comments/Description
AllStars negative control siRNA Qiagen 1027280 Negative control siRNA.
CDK6 siRNA Dharmacon/ Custom synthesis NA Antisense sequence: 5' CUCUAGGCCAGUCUUCUUCUU
RB1 siRNA Dharmacon/ Custom synthesis NA Antisense sequence: 5' GGUUCAACUACGCGUGUAATT
5x siRNA buffer Thermo Scientific B-002000-UB-100 To be diluted with nuclease-free, non-DEPC treated water.
Nulcease-free water (non-DEPC) Applied Biosystems AM9937 For dilution of siRNA buffer.
Hiperfect Qiagen 301705 Transfection lipid.
DMEM Life Technologies 41966052 Pyruvate and high-glucose supplemented tissue culture media.
96 well tissue culture plate Falcon 3072 Plain, 96-well tissue culture plate for the parallel, compartmentalized mixing of transfection complexes.
Packard Viewplate Perkin Elmer LAS 6005182 96 well TC plate with optical base on which cells are transfected, grown, fixed and eventually imaged. Supplied with opaque, adhesive plate seals, which are used during storage of used plates.
Breathable membrane Alpha Labs LW2783 Sterile, gas-permeable, adhesive membrane.
Neutral buffered formalin, 10% Sigma-Aldrich HT5012-1CS 10% Formalin (4% formaldehyde) fixative used neat in protocol.
Triton X-100 Sigma-Aldrich X100PC Non-ionic detergent
Tris Sigma-Aldrich T1503 Trizma base (tris(hydroxymethyl)aminomethane)
Tween 20 Sigma-Aldrich P2287 For plate wash solution.
Anti-P-S780 RB1 antibody Abcam ab32513 Rabbit monoclonal
AlexaFluor647 Anti-rabbit Invitrogen A21245 Highly cross-adsorbed, fluorescently labelled secondary antibody.
Hoechst 33342 (Bisbenzimide) Sigma-Aldrich B2261 Fluorescent, chromatin-intercalating, DNA dye.
Permeabilization solution NA NA 0.1% Triton X-100 in 50 mM Tris-buffered saline, pH 8.0.
Plate wash solution NA NA Tris-buffered saline containing 0.1 % Tween-20.
Block solution NA NA 5% powdered milk in Tris-buffered saline and 0.1% Tween-20. For blocking plate prior to immuno-staining and dilution of antibodies.
Cell Profiler 2.1 Broad Institute http://www.cellprofiler.org/download.shtml
Active Perl Community Edition ActiveState http://www.activestate.com/activeperl/downloads
R programming environment The R Foundation http://www.r-project.org
Rstudio Rstudio http://www.rstudio.com/

References

  1. Carpenter, A. E., et al. CellProfiler: image analysis software for identifying and quantifying cell phenotypes. Genome Biol. 7 (10), 100 (2006).
  2. Khan, A., Eldaly, H., Rajpoot, N. A gamma-gaussian mixture model for detection of mitotic cells in breast cancer histopathology images. J Pathol Inform. 4, 11 (2013).
  3. Selzer, P., Beibel, M., Gubler, H., Parker, C. N., Gabriel, D. Comparison of multivariate data analysis strategies for high-content screening. J Biomol Screen. 16 (3), 338-347 (2011).
  4. Lyman, S. K., et al. High content, high-throughput analysis of cell cycle perturbations induced by the HSP90 inhibitor XL888. PLoS One. 6 (3), e17692 (2011).
  5. Richardson, E., Stockwell, S. R., Li, H., Aherne, W., Cuomo, M. E., Mittnacht, S. Mechanism-based screen establishes signalling framework for DNA damage-associated G1 checkpoint response. PLoS One. 7 (2), e17692 (2012).
  6. Heynen-Genel, S., Pache, L., Chanda, S. K., Rosen, J. Functional genomic and high-content screening for target discovery and deconvolution. Expert Opin Drug Discov. 7 (10), 955-968 (2012).
  7. Krausz, E. High-content siRNA screening. Mol Biosyst. 3 (4), 232-240 (2007).
  8. Gu, J., Xia, X., et al. Cell Cycle-dependent Regulation of a Human DNA Helicase That Localizes in. DNA Damage Foci. Mol Biol Cell. 15 (7), 3320-3332 (2004).
  9. Mittnacht, S. Control of pRB phosphorylation. Curr Opin Genet Dev. 8 (1), 21-27 (1998).
  10. Mittnacht, S. The retinoblastoma protein–from bench to bedside. Eur J Cell Biol. 84 (2-3), 97-107 (2005).
  11. Nybo, K. GFP imaging in fixed cells. BioTechniques. 52 (6), 359-360 (2012).
  12. Schwartz, R. L., Foy, B. D., Phoenix, T. . Learning Perl – Making Easy Things Easy and Hard Things Possible. , 1-363 (2011).
  13. Wickham, H. . ggplot2: Elegant Graphics for Data Analysis. , 978-970 (2009).

Play Video

Cite This Article
Stockwell, S. R., Mittnacht, S. Workflow for High-content, Individual Cell Quantification of Fluorescent Markers from Universal Microscope Data, Supported by Open Source Software. J. Vis. Exp. (94), e51882, doi:10.3791/51882 (2014).

View Video