Présenté informatique est un workflow flexible permettant multiplexé analyse basée sur l'image de cellules marquées par fluorescence. Le workflow quantifie marqueurs nucléaires et cytoplasmiques et calcule marqueur translocation entre ces compartiments. Des procédures sont prévues pour perturbation de cellules en utilisant siRNA et la méthodologie fiable pour la détection du marqueur par immunofluorescence indirecte dans des formats de 96 puits.
Les progrès dans la compréhension des mécanismes de contrôle régissant le comportement des cellules dans les modèles de culture de tissus de mammifères adhérentes sont de plus en plus dépendante des modes d'analyse unicellulaire. Méthodes qui fournissent des données composites reflétant les valeurs moyennes des biomarqueurs de populations de cellules risquent de perdre la dynamique des sous-populations qui reflètent l'hétérogénéité du système biologique étudié. Dans cet esprit, les approches traditionnelles sont remplacées par, ou soutenus avec des formes plus sophistiquées de dosage cellulaire développés pour permettre une évaluation par microscopie à haute teneur. Ces analyses génèrent potentiellement un grand nombre d'images de biomarqueurs fluorescents, ce qui a permis en accompagnant des logiciels propriétaires, permet des mesures multi-paramétriques par cellule. Toutefois, les coûts d'investissement relativement élevés et la surspécialisation de plusieurs de ces dispositifs ont empêché leur accessibilité à de nombreux enquêteurs.
Décrit ici est unflux de travail universellement applicable pour la quantification des intensités multiples marqueurs fluorescents provenant de régions sous-cellulaires spécifiques de cellules individuelles appropriées pour une utilisation avec des images de la plupart des microscopes à fluorescence. La clé de ce flux de travail est la mise en œuvre du logiciel Cell Profiler disponible gratuitement 1 à distinguer les cellules individuelles dans ces images, les segmenter en régions subcellulaires définies et livrer l'intensité de marqueur de fluorescence des valeurs spécifiques à ces régions. L'extraction des valeurs individuelles d'intensité de la cellule à partir de données d'image est l'objectif central de ce flux de travail et sera illustrée par l'analyse des données de contrôle à partir d'un écran de siRNA pour G1 régulateurs de points de contrôle dans les cellules humaines adhérentes. Cependant, le flux de travail présenté ici peut être appliquée à l'analyse des données provenant d'autres moyens de perturbation cellulaire (par exemple, les écrans de composés) et d'autres formes de marqueurs cellulaires de fluorescence en fonction et devrait donc être utile pour un large éventail de laboratoires.
Le travail présenté ici décrit l'utilisation du logiciel portable disponible gratuitement Profiler pour effectuer répartition algorithme guidée d'images de microscopie de fluorescence de cellules adhérentes pour identifier des cellules individuelles et des régions subcellulaires définies. Cette approche, appelée segmentation d'image, permet l'analyse multi-paramétrique ultérieur des cellules imagées par la quantification des marqueurs marqués par fluorescence localisées à chaque cellule ou de la région subcellulaire (ci-objets segmentés). Ce flux de travail constitue une base pour permettre une analyse de haut-contenu et est destiné à servir comme un outil qui peut être encore développé et modifié pour répondre multi-paramétrique, cellule individuelle analyses dans les laboratoires, sans accès à des instruments de haut contenu spécialisés ou des logiciels propriétaires. Les fichiers fournis avec ce manuscrit comprennent un ensemble de données d'images brutes pertinentes, les paramètres de l'algorithme et son appui test pour générer l'analyse décrit. Les réglages de l'algorithme fourni fou cellulaire Profiler sont optimisés pour l'ensemble de données d'exemple et les détails de la section Discussion quels ajustements peuvent être nécessaires pour permettre l'utilisation de données d'image d'autres études.
Une fois les données quantitatives a été extrait en utilisant cellulaire Profiler, les laboratoires peuvent avoir des exigences différentes pour savoir comment utiliser l'information présentée par les valeurs des cellules individuelles dans les données brutes; montré ici est une méthode par laquelle les portes sont appliquées aux données brutes pour chaque dosage. L'utilisation de ces portes, les données sont transformées en termes binaires de réponse, permettant la visualisation de l'évolution des traitements différents de liaison avec les sous-populations de cellules subissant une réponse définie par les barrières. Les portes sont fixés en fonction des observations des distributions de données obtenues pour les contrôles négatifs et positifs appropriés pour chaque mesure pertinente. L'utilisation de portes ne est qu'un exemple de la façon de gérer les premières mesures, à base de cellules. Également montré ici est l'utilisation de l'intensité de l'ADN nucléaire moiasurements dans leur forme brute comme une plage continue de valeurs en combinaison avec les données gated. D'autres approches pour la gestion des données d'analyse d'image doivent être envisagés, en fonction de la nature de l'étude; alternatives à l'utilisation de statistiques portes pour affecter les cellules à des sous-populations ont été signalés 2 et systématiques des comparaisons de stratégies pour résumer les données à haute teneur sur un grand nombre de paramètres ont été signalés 3.
Analyses Haute-contenu de données d'image ont trouvé une utilisation dans les études cellulaires de drogues-réponse, la génétique inverse et le stress environnemental signalisation 4-6. Le mérite de tiges analyse à haute teneur du fait que l'analyse algorithmique de données de microscopie à fluorescence permet des paramètres quantitatifs et spatiales à prendre en compte simultanément dans des cellules individuelles 7. De cette manière, les résultats de plusieurs essais cellulaires peuvent être recoupées comportement, de dosage différentiel-dsous-populations de cellules efined peuvent être suivis dans des conditions expérimentales et les essais peuvent inclure l'examen des variables morphologiques. L'analyse des stratégies et des flux de travail a discuté ici, comme pour d'autres approches à haut contenu, sont capables de fournir des données multiplexées qui sont des renvois à des cellules individuelles. Des études de haut contenu méthodes costume qui génèrent des images de microscope à fluorescence et sont applicables à l'analyse des données allant de quelques dizaines d'images produites en microscopie de fluorescence à base conventionnelle faible débit grâce aux milliers d'images produites en utilisant des plates-formes de criblage à haut contenu automatisés.
Le workflow est illustré ici avec des exemples de données à partir de laquelle essais séparés sont mesurés en termes de soit intensités de marqueurs fluorescents nucléaires ou translocation cytoplasmique / nucléaire d'une protéine rapporteur fluorescent, respectivement. Le flux de travail est souple en ce que ces dosages peuvent être considérées séparément ou en combinaison en fonction de l'EACh donnée question de recherche par différents enquêteurs. Les données d'exemple sont produites dans le cadre d'une interférence ARN (ARNi) expérience (Figure 1). Les petits oligonucléotides d'ARN interférents (siARN) sont utilisés pour knockdown protéines spécifiques dans HCT116 cellules de carcinome de côlon humain qui se traduisent par des changements pour deux rapporteurs fluorescents de kinase (CDK) l'activité de la cycline-dépendante. La phosphorylation de la CDK6 dépendante de la protéine du rétinoblastome nucléaire à serine 780 (P-S780 RB1) est évaluée par coloration d'anticorps. Dans les mêmes cellules, un fluorescent reporter vert de la protéine à étiquette de l'activité CDK2 (GFP-CDK2 reporter) est évaluée par sa nucléaire rapport cytoplasmique où en l'absence de l'activité de CDK2 le rapporteur réside dans le noyau et sur les navettes d'activation de CDK2 dans le cytoplasme 8. En outre, l'ADN nucléaire de chaque cellule est coloré en utilisant un colorant intercalant de l'ADN, bisbenzimide, qui sert en tant que moyen pour identifier les cellules et définir les frontières des noyaux dans les images ainsi unemesure de sa abondance de l'ADN de fournir des informations sur la position de cycle cellulaire de la cellule (figure 2).
Les activités de la CDK2 et de la CDK6 peuvent être détectés comme des cellules de transit G1 à la phase S du cycle cellulaire et 5 se succèdent 9,10 et, de ce fait, la concordance étroite entre les deux rapporteurs dans des cellules individuelles est attendue. L'ensemble de données de démonstration utilisée ici analyse comme un exemple de l'effet de siRNA ciblant CDK6, protéine du rétinoblastome (RB1) et un contrôle négatif non-ciblage (tableau 1). Knockdown de CDK6 doit obtenir à la fois une diminution de l'épitope RB1 P-S780 et une accumulation de cellules en phase G1 du cycle cellulaire. Le knockdown de RB1 sert de témoin de réactif pour la spécificité de l'anticorps phospho-S780. Des images de microscopie à fluorescence de la formaline 11 fixés, les cellules de culture de tissu de HCT116 colorées par fluorescence sont utilisés pour l'analyse d'image algorithmique. Les données numériques résultant est ensuite utilisé pourréférence croisée les journalistes et juger de l'impact des différents états knockdown.
La taille potentielle des données produites par ce type d'analyse peut présenter un défi aux outils d'analyse normales. Par exemple, les données de cellules individuelles peuvent être plus grand que certains logiciels de tableur accueillir. Inclus sont des scripts Perl qui effectuent hautement répétitif, de traitement simple, supervisé des données pour faciliter l'analyse de grands ensembles de données. Les scripts Perl sont écrits spécifiquement pour les fichiers de sortie produits par Cell Profiler, lors du traitement des fichiers d'image avec un fichier convention de nommage spécifique (figure 3), et permettent un nombre variable de champs par puits pour être utilisées dans l'analyse. Il est souvent important de données de titrage porte de cellule individuelle pour suivre les tendances dans les sous-populations de cellules 5 et représenté ici est l'utilisation d'un script Perl pour marquer chaque cellule basée sur un ensemble porte prédéterminé pour chaque type d'essai. Sont également inclus les scripts Perl optionnelsqui résument les résultats de données pour des puits individuels (ou conditions), la prestation: pourcentage de cellules dans la grille de jeu et les valeurs moyennes des scores de dosage premières. Ce dernier moyen, plus homogène de la visualisation des données, est valable lorsque des réponses affectent la totalité ou la majorité des cellules à l'intérieur d'un puits. Comme discuté ci-dessus, cette évaluation est moins utile que celle conférée par l'individu déclenchement de données de cellule dans laquelle la réponse est limitée à un sous-ensemble de cellules dans une population.
L'utilité du flux de travail décrite ne est pas limitée à une perturbation par siRNA ou les dosages de marqueurs décrits. Des études ont utilisé cette méthode pour évaluer la réponse dans les expériences de culture de tissu en utilisant des combinaisons de siRNA, inhibiteurs chimiques et des traitements de radiothérapie et d'évaluation des marqueurs autres que CDK6 et l'activité de CDK2 5.
Conceptuellement, la stratégie expérimentale permet une variété de régions subcellulaires biologiquement utiles pour être automatiquement enregistrédans des cellules individuelles présentes dans les images au microscope à fluorescence. En tant que tel, cette approche peut produire des données multiplexées révélant des informations quantitatives, biologique qui peut être manquée par des techniques qui mettent l'accent sur les populations plutôt que des cellules individuelles. Avec des modifications mineures, l'approche et l'analyse flux décrit peut produire des données de cellules quantitatives, individuelles pour toutes les sorties de dosage basés sur la fluorescence et les réponses des cellules biologiques, où l'évaluation quantitative de la teneur en ADN, la quantification de la fluorescence nucléaire ou cytoplasmique ou le mouvement alternatif des marqueurs entre ceux-ci deux compartiments individuellement ou d'une manière multiplexée est d'intérêt. Comme les exigences de publication tendent plus vers la présentation de données brutes librement accessibles, l'accès et la familiarité avec les outils gratuits pour l'analyse d'images de microscopie telles que celles décrites ici sera également un intérêt direct pour les laboratoires qui cherchent à réanalyser les données publiées.
Le flux de travail décrit constitue une procédure de perturbance multipuits de cellules en utilisant des siRNA, la détection de marqueur ultérieur et enfin l'utilisation d'une série d'étapes de logiciels pris en charge pour faciliter l'extraction de données quantitatives à partir des images de microscopie à fluorescence résultant. L'approche est axée sur la prestation de valeurs d'intensité nucléaires et cytoplasmiques de cellules individuelles, qui a une large application pratique dans de nombreuses applications à base de cellules. Les données d'exemple utilisées ici ont été générés dans un cadre d'écran siRNA dans lequel deux essais de fluorescence pour le transit du cycle cellulaire en phase G1 sont testés et corrélés retour à une mesure biophysique plus directe de la teneur en ADN nucléaire.
L'utilisation d'un ADN colorant fluorescent à l'ADN nucléaire de l'image est une étape indispensable dans le processus de segmentation d'image car elle permet l'identification de cellules individuelles et résultant 'masque noyaux »sert de point de départ pour identifier cytoplasmi correspondantc régions. La CDK2 rapporteur GFP-étiqueté, qui est exprimé de façon stable dans les cellules, donne encore une variable systématiquement plus élevée que le signal de fond dans le cytoplasme par lequel ce compartiment peut être délimitée. La même pipeline d'analyse devrait être applicable à l'analyse des événements protéines de translocation utilisant d'autres journalistes de fluorescence liée appropriées et leur réponse à perturbance. En outre, la substitution du rapporteur GFP-CDK2 avec des colorants fluorescents spécifiques à cytoplasme permettrait l'utilisation alternative de cet algorithme pour mesurer les dimensions du cytoplasme et les tailles relatives des cellules dans les images.
Une autre considération de conception dans la stratégie de segmentation d'image décrit ici est l'utilisation de cellules Profiler pour fournir des valeurs d'intensité intégrés pour la quantification de l'ADN. Intégration des valeurs d'intensité pour l'ADN nucléaire des données de coloration permettent de variations possibles dans la taille noyau, et représente un match serré pour les profils de quantification vuspour l'iodure de propidium teinté FACS données. Cependant, l'intensité intégrée peut ne pas donner les moyens appropriés pour évaluer la fonction de la protéine où la concentration moyenne, illustré par l'intensité moyenne de l'antigène fluorescence, est biologiquement plus pertinent que le montant total intégrée de protéines (et fluorescence associée) dans un compartiment cellulaire. Par conséquent, les valeurs moyennes d'intensité ont été utilisés pour la P-S780 RB1 et des données de GFP. L'option de modifier entre les deux modes (moyenne ou intégrée) de l'évaluation des données se trouve sur le panneau 'ExportToSpreadsheet' du logiciel Cell Profiler.
Les paramètres d'analyse dans le fichier 3_channels_pipeline.cppipe sont optimisés pour les images de l'ensemble des données d'exemple. Analyse des nouvelles images ensembles avec ce protocole, il faudra que les noms de fichiers adopter la convention de nommage décrite ci-dessus (Figure 3). En outre, la sensibilité valeurs en fonction de la luminosité de la coloration et des seuils d'ADN nucléaire pour le fondintensités dans les nouveaux ensembles d'image peuvent avoir besoin d'être ajusté dans les paramètres Cell Profiler. Étant donné le rôle clé de la coloration de l'ADN détient pour la construction des différents masques de segmentation d'image, l'application des réglages de sensibilité correctes pour ce canal est la clé du succès de l'analyse de nouvelles données d'image avec le logiciel Cell Profiler. Le fichier de paramètres fourni de Profiler de cellule (3_channels_pipeline.cppipe) contient des notes sur les paramètres les plus fréquemment utile pour adapter l'analyse de nouvelles données. Ces notes sont dans la zone de texte en haut de l'écran dans la Cellule fenêtre principale Profiler et comprennent des conseils sur la modification des réglages de sensibilité et en ajustant le nombre de canaux à analyser. Comme inculpé dans la section Protocole 2.8, pour tester les paramètres pour les nouvelles données d'image, il peut être nécessaire d'observer la segmentation d'image lors de l'analyse d'image en cliquant sur Ouvrir les icônes «oculaires» pour chacun des «Identifier … Objets de protocole les étapes (Figure S1D </strong>). En particulier, la visualisation des données d'image à travers des «IdentifyPrimaryOjects 'indique si le masque noyaux est correctement identifié à partir d'images de la coloration de l'ADN. Sur la page de logiciel Cell Profiler pour le module 'de IdentifyPrimaryOjects est le facteur de correction de seuil. Essais et erreurs réglage de cette valeur sera corriger la plupart des erreurs de reconnaissance nucléaires. Les valeurs Solde le canal d'ADN contre l'intensité de fond pour chaque image. valeurs de facteur de correction de seuil charnière autour de 1, où plus de cela est plus rigoureuse (bon pour des images claires) et moins de 1 est clémente (adapté aux images avec moins de contraste entre la coloration et le fond).
Le résultat brut des données de cellule individuelle auprès de Cell Profiler peut être analysée de différentes façons pour répondre aux besoins d'autres études. Montré ici est l'utilisation d'un script Perl pour appliquer portes à deux des paramètres mesurés par cellule afin d'aider à extraire les tendances biologiques de l'un de donnéesd permis renvois des sous-populations identifiées avec des mesures supplémentaires. Bien qu'il soit également possible d'inclure des éléments de déclenchement dans le cadre de Cell Profiler, la route alternative utilisée ici fournit une plus grande flexibilité et la vitesse, surtout si de grands ensembles de données doivent être évaluées. L'étape la plus lente dans les phases de post-acquisition de l'image de l'actuel protocole est le fonctionnement du logiciel Cell Profiler. Cellule profiler ici est exécuté sans imposer portes pour produire une première série de données de l'ONU-fermée qui peut être réanalysé avec le script Perl ultérieure plus rapidement et, si nécessaire, de manière itérative avec différentes valeurs de grille. Toutes les études ne sauront à l'avance les valeurs de grille appropriés que cela peut varier avec des réactifs sur ne importe quel ensemble de données, et potentiellement au fil du temps. Il est donc recommandé de générer des histogrammes représentant la distribution de données brutes obtenues à partir de cellules Profiler pour les contrôles positifs et les cellules maquette perturbés afin d'identifier porte valu appropriéees pour les paramètres d'intérêt.
Les scripts Perl sont écrits à accepter une structure de données provenant de cellules Profiler de colonne définis de façon rigide et peuvent cesser de fonctionner si un utilisateur modifie le nombre de sortie des paramètres par Cell Profiler aide des paramètres du 'ExportToSpreadsheet'. Pour aider à mettre en œuvre la modification des paramètres notes sont incluses dans les fichiers de script Perl. Pour voir ces voir le script dans un éditeur de texte, de préférence l'éditeur de texte d'un programmeur fixé aux éléments de Perl de code de couleur (par exemple, http://www.activestate.com/komodo-edit). Ces notes indiquent où régler le script pour se adapter aux changements dans le format de données. Comme pour les scripts Perl, le fichier R-code fourni (analysis.r), contenant les instructions pour tracer les chiffres à partir des données d'analyse d'image, peut être lu dans un éditeur de texte ou le logiciel RStudio pour voir les notes supplémentaires sur l'utilisation et l'adaptation. Ces notes peuvent être complétées avec des détails sur les expressions régulières Perl et <sup> 12 et le paquet ggplot2 13 R, les deux qui forment la base de la façon dont les données sont lues, annotées et tracée, respectivement.
De nouvelles études utilisant la microscopie de fluorescence, ainsi que des données brutes déposés auprès publications open source se prêtent à des méthodes d'analyse tels que ceux décrits ici. La nature même des données à haut contenu se prête à l'analyse récursive avec des accents différents analytiques en fonction des intérêts de recherche de tout observateur donné. Bien que les questions qui peuvent être posées des données sont limitées par les sondes utilisées à l'origine, des données d'image peuvent souvent être réanalysés significative au-delà de la portée des études qui les ont générés.
The authors have nothing to disclose.
Ce travail a été financé par des subventions CRUK 15 043 et 14 251 CRUK.
Nous remercions Daniel Wetterskog et Ka Ho Kei pour l'assistance technique et la lecture critique du manuscrit.
Name of Material/ Equipment | Company | Catalog Number | Comments/Description |
AllStars negative control siRNA | Qiagen | 1027280 | Negative control siRNA. |
CDK6 siRNA | Dharmacon/ Custom synthesis | NA | Antisense sequence: 5' CUCUAGGCCAGUCUUCUUCUU |
RB1 siRNA | Dharmacon/ Custom synthesis | NA | Antisense sequence: 5' GGUUCAACUACGCGUGUAATT |
5x siRNA buffer | Thermo Scientific | B-002000-UB-100 | To be diluted with nuclease-free, non-DEPC treated water. |
Nulcease-free water (non-DEPC) | Applied Biosystems | AM9937 | For dilution of siRNA buffer. |
Hiperfect | Qiagen | 301705 | Transfection lipid. |
DMEM | Life Technologies | 41966052 | Pyruvate and high-glucose supplemented tissue culture media. |
96 well tissue culture plate | Falcon | 3072 | Plain, 96-well tissue culture plate for the parallel, compartmentalized mixing of transfection complexes. |
Packard Viewplate | Perkin Elmer LAS | 6005182 | 96 well TC plate with optical base on which cells are transfected, grown, fixed and eventually imaged. Supplied with opaque, adhesive plate seals, which are used during storage of used plates. |
Breathable membrane | Alpha Labs | LW2783 | Sterile, gas-permeable, adhesive membrane. |
Neutral buffered formalin, 10% | Sigma-Aldrich | HT5012-1CS | 10% Formalin (4% formaldehyde) fixative used neat in protocol. |
Triton X-100 | Sigma-Aldrich | X100PC | Non-ionic detergent |
Tris | Sigma-Aldrich | T1503 | Trizma base (tris(hydroxymethyl)aminomethane) |
Tween 20 | Sigma-Aldrich | P2287 | For plate wash solution. |
Anti-P-S780 RB1 antibody | Abcam | ab32513 | Rabbit monoclonal |
AlexaFluor647 Anti-rabbit | Invitrogen | A21245 | Highly cross-adsorbed, fluorescently labelled secondary antibody. |
Hoechst 33342 (Bisbenzimide) | Sigma-Aldrich | B2261 | Fluorescent, chromatin-intercalating, DNA dye. |
Permeabilization solution | NA | NA | 0.1% Triton X-100 in 50 mM Tris-buffered saline, pH 8.0. |
Plate wash solution | NA | NA | Tris-buffered saline containing 0.1 % Tween-20. |
Block solution | NA | NA | 5% powdered milk in Tris-buffered saline and 0.1% Tween-20. For blocking plate prior to immuno-staining and dilution of antibodies. |
Cell Profiler 2.1 | Broad Institute | http://www.cellprofiler.org/download.shtml | |
Active Perl Community Edition | ActiveState | http://www.activestate.com/activeperl/downloads | |
R programming environment | The R Foundation | http://www.r-project.org | |
Rstudio | Rstudio | http://www.rstudio.com/ |