Summary

Um Paradigma Psicofísico para a Coleta e Análise de Julgamentos de Similaridade

Published: March 01, 2022
doi:

Summary

O protocolo apresenta um paradigma psicofísico experimental para obter grandes quantidades de julgamentos de similaridade, e um fluxo de trabalho de análise que acompanha. O paradigma sonda efeitos de contexto e permite a modelagem de dados de similaridade em termos de espaços euclidianos de pelo menos cinco dimensões.

Abstract

Julgamentos de similaridade são comumente usados para estudar representações mentais e suas correlações neurais. Essa abordagem tem sido usada para caracterizar espaços perceptivos em muitos domínios: cores, objetos, imagens, palavras e sons. Idealmente, pode-se querer comparar estimativas de similaridade percebida entre todos os pares de estímulos, mas isso é muitas vezes impraticável. Por exemplo, se alguém pede a um sujeito para comparar a semelhança de dois itens com a semelhança de dois outros itens, o número de comparações cresce com a quarta potência do tamanho do conjunto de estímulos. Uma estratégia alternativa é pedir a um sujeito para classificar semelhanças de pares isolados, por exemplo, em uma escala Likert. Isso é muito mais eficiente (o número de classificações cresce quadráticamente com tamanho definido em vez de quarticamente), mas essas classificações tendem a ser instáveis e têm resolução limitada, e a abordagem também assume que não há efeitos de contexto.

Aqui, é apresentado um novo paradigma de classificação para a coleta eficiente de julgamentos de similaridade, juntamente com um pipeline de análise (software fornecido) que testa se os modelos de distância euclidianos explicam os dados. Os ensaios típicos consistem em oito estímulos em torno de um estímulo de referência central: o sujeito classifica estímulos em ordem de sua semelhança com a referência. Por seleção criteriosa de combinações de estímulos utilizados em cada ensaio, a abordagem tem controles internos para efeitos de consistência e contexto. A abordagem foi validada para estímulos extraídos de espaços euclidianos de até cinco dimensões.

A abordagem é ilustrada com um experimento que mede semelhanças entre 37 palavras. Cada ensaio produz os resultados de 28 comparações em pares da forma: “A era mais semelhante à referência do que B era a referência?” Embora comparar diretamente todos os pares de pares de estímulos teria exigido 221445 ensaios, este projeto permite a reconstrução do espaço perceptivo a partir de 5994 comparações obtidas a partir de 222 ensaios.

Introduction

Os seres humanos processam mentalmente e representam informações sensoriais recebidas para realizar uma ampla gama de tarefas, como reconhecimento de objetos, navegação, fazer inferências sobre o meio ambiente e muitas outras. Julgamentos de similaridade são comumente usados para sondar essas representações mentais1. Compreender a estrutura das representações mentais pode fornecer insights sobre a organização do conhecimento conceitual2. Também é possível obter insights sobre computação neural, relacionando julgamentos de similaridade aos padrões de ativação cerebral3. Além disso, julgamentos de similaridade revelam características que são salientes na percepção4. Estudar como as representações mentais mudam durante o desenvolvimento pode lançar luz sobre como elas são aprendidas5. Assim, julgamentos de similaridade fornecem informações valiosas sobre o processamento de informações no cérebro.

Um modelo comum de representações mentais usando semelhanças é um modelo de espaço geométrico6,7,8. Aplicado a domínios sensoriais, esse tipo de modelo é frequentemente referido como um espaço perceptivo9. Os pontos no espaço representam estímulos e distâncias entre os pontos correspondem à diferença percebida entre eles. A partir de julgamentos de similaridade, pode-se obter estimativas quantitativas de diferenças. Essas diferenças pareentas (ou distâncias perceptuais) podem então ser usadas para modelar o espaço perceptivo através de dimensionamento multidimensional10.

Existem muitos métodos para coletar julgamentos de similaridade, cada um com suas vantagens e desvantagens. A maneira mais simples de obter medidas quantitativas de dissimilaridade é pedir aos sujeitos que classifiquem em escala o grau de dissimilaridade entre cada par de estímulos. Embora isso seja relativamente rápido, as estimativas tendem a ser instáveis em longas sessões, pois os sujeitos não podem voltar a julgamentos anteriores, e os efeitos do contexto, se presentes, não podem ser detectados. (Aqui, um efeito de contexto é definido como uma mudança na similaridade julgada entre dois estímulos, com base na presença de outros estímulos que não estão sendo comparados.) Alternativamente, os sujeitos podem ser solicitados a comparar todos os pares de estímulos com todos os outros pares de estímulos. Embora isso produziria uma ordenação de classificação mais confiável de diferenças, o número de comparações necessárias escalas com o quarto poder do número de estímulos, tornando-o viável apenas para pequenos conjuntos de estímulos. Alternativas mais rápidas, como classificar em um número predefinido de clusters11 ou classificação gratuita têm suas próprias limitações. A classificação livre (em qualquer número de pilhas) é intuitiva, mas força o sujeito a categorizar os estímulos, mesmo que os estímulos não se prestam facilmente à categorização. O método multi-arranjo mais recente, O MDS inverso, contorna muitas dessas limitações e é muito eficiente12. No entanto, este método exige que os sujeitos projetem suas representações mentais em um plano euclidiano 2D e considerem semelhanças de forma geométrica específica, tornando a suposição de que a estrutura de similaridade pode ser recuperada a partir de distâncias euclidianas em um plano. Assim, resta a necessidade de um método eficiente para coletar grandes quantidades de julgamentos de similaridade, sem fazer suposições sobre a geometria subjacente aos julgamentos.

Descrito aqui é um método que é razoavelmente eficiente e também evita as armadilhas potenciais acima. Ao pedir aos sujeitos que classifiquem os estímulos por ordem de similaridade a uma referência central em cada ensaio13, a relativa semelhança pode ser sondada diretamente, sem assumir nada sobre a estrutura geométrica das respostas dos sujeitos. O paradigma repete um subconjunto de comparações com contextos idênticos e diferentes, permitindo a avaliação direta dos efeitos do contexto, bem como a aquisição de respostas classificadas em termos de probabilidades de escolha. O procedimento de análise decompõe esses julgamentos em múltiplas comparações em pares e os utiliza para construir e procurar modelos euclidianos de espaços perceptivos que expliquem os julgamentos. O método é adequado para descrever detalhadamente a representação de conjuntos de estímulo de tamanhos moderados (por exemplo, 19 a 49).

Para demonstrar a viabilidade da abordagem, foi realizado um experimento, utilizando um conjunto de 37 animais como estímulos. Os dados foram coletados ao longo de 10 sessões de uma hora e, em seguida, analisados separadamente para cada assunto. A análise revelou consistência entre os sujeitos e efeitos de contexto insignificantes. Também avaliou a consistência das diferenças percebidas entre estímulos com modelos euclidianos de seus espaços perceptivos. Os procedimentos paradigmáticos e de análise descritos neste artigo são flexíveis e devem ser de uso para pesquisadores interessados em caracterizar as propriedades geométricas de uma gama de espaços perceptivos.

Protocol

Antes do início dos experimentos, todos os sujeitos fornecem consentimento informado de acordo com as diretrizes institucionais e a Declaração de Helsinque. No caso deste estudo, o protocolo foi aprovado pelo conselho de revisão institucional da Weill Cornell Medical College. 1. Instalação e configuração Baixe o código no repositório do GitHub, semelhanças (https://github.com/jvlab/similarities). Na linha de comando, corra: https://github.com/jvlab/sim…

Representative Results

A Figura 1A mostra parte de um arquivo de condições gerado pelo script na etapa 3.3, para o experimento da palavra. Cada linha corresponde a um julgamento. O estímulo na coluna do árbitro aparece no centro do display. Os nomes das colunas stim1 a stim8 correspondem a oito posições ao longo de um círculo, correndo no sentido anti-horário, começando da posição à direita da referência central. Um teste amostral do experimento da palavra é mostrado na Figura 1B…

Discussion

O protocolo aqui delineado é eficaz para a obtenção e análise de julgamentos de similaridade para estímulos que podem ser apresentados visualmente. O paradigma experimental, a análise e possíveis extensões são discutidos primeiro e, posteriormente, as vantagens e desvantagens do método.

Paradigma experimental: O método proposto é demonstrado utilizando um domínio de 37 nomes de animais, e um conjunto de dados amostral de julgamentos perceptivos é fornecido para q…

Disclosures

The authors have nothing to disclose.

Acknowledgements

O trabalho é apoiado por financiamento dos Institutos Nacionais de Saúde (NIH), subvenção EY07977. Os autores também gostariam de agradecer a Usman Ayyaz por sua ajuda no teste do software, e Muhammad Naeem Ayyaz por seus comentários sobre o manuscrito.

Materials

Computer Workstation N/A N/A OS: Windows/ MacOS 10 or higher/ Linux; 3.1 GHz Dual-Core Intel Core i5 or similar; 8GB or more memory; User permissions for writing and executing files
conda Version 4.11 OS: Windows/ MacOS 10 or higher/ Linux
Microsoft Excel Microsoft Any To open and shuffle rows and columns in trial conditions files.
PsychoPy N/A Version 2021.2 Framework for running psychophysical studies
Python 3 Python Software Foundation Python Version 3.8 Python3 and associated built-in libraries
Required Python Libraries N/A numpy version: 1.17.2 or higher; matplotlib version 3.4.3 or higher; scipy version 1.3.1 or higher; pandas version 0.25.3 or higher; seaborn version 0.9.0 or higher; scikit_learn version 0.23.1 or higher; yaml version 6.0 or higher  numpy, scipy and scikit_learn are computing modules with in-built functions for optimization and vector operations. matplotlib and seaborn are plotting libraries. pandas is used to reading in and edit data from csv files.

References

  1. Edelman, S. Representation is representation of similarities. TheBehavioral and Brain Sciences. 21 (4), 449-498 (1998).
  2. Hahn, U., Chater, N. Concepts and similarity. Knowledge, Concepts and Categories. , 43-84 (1997).
  3. Kriegeskorte, N., Kievit, R. A. Representational geometry: integrating cognition, computation, and the brain. Trends in Cognitive Sciences. 17 (8), 401-412 (2013).
  4. Hebart, M. N., Zheng, C. Y., Pereira, F., Baker, C. I. Revealing the multidimensional mental representations of natural objects underlying human similarity judgements. Nature Human Behaviour. 4 (11), 1173-1185 (2020).
  5. Deng, W. S., Sloutsky, V. M. The development of categorization: Effects of classification and inference training on category representation. Developmental Psychology. 51 (3), 392-405 (2015).
  6. Shepard, R. N. Stimulus and response generalization: tests of a model relating generalization to distance in psychological space. Journal of Experimental Psychology. 55 (6), 509-523 (1958).
  7. Coombs, C. H. A method for the study of interstimulus similarity. Psychometrika. 19 (3), 183-194 (1954).
  8. Gärdenfors, P. . Conceptual Spaces: The Geometry of Thought. , (2000).
  9. Zaidi, Q., et al. Perceptual spaces: mathematical structures to neural mechanisms. The Journal of Neuroscience The Official Journal of the Society for Neuroscience. 33 (45), 17597-17602 (2013).
  10. Krishnaiah, P. R., Kanal, L. N. . Handbook of Statistics 2. , (1982).
  11. Tsogo, L., Masson, M. H., Bardot, A. Multidimensional Scaling Methods for Many-Object Sets: A Review. Multivariate Behavioral Research. 35 (3), 307-319 (2000).
  12. Kriegeskorte, N., Mur, M. Inverse MDS: Inferring dissimilarity structure from multiple item arrangements. Frontiers in Psychology. 3, 245 (2012).
  13. Rao, V. R., Katz, R. Alternative Multidimensional Scaling Methods for Large Stimulus Sets. Journal of Marketing Research. 8 (4), 488-494 (1971).
  14. Hoffman, J. I. E. Hypergeometric Distribution. Biostatistics for Medical and Biomedical Practitioners. , 179-182 (2015).
  15. Victor, J. D., Rizvi, S. M., Conte, M. M. Two representations of a high-dimensional perceptual space. Vision Research. 137, 1-23 (2017).
  16. Knoblauch, K., Maloney, L. T. Estimating classification images with generalized linear and additive models. Journal of Vision. 8 (16), 1-19 (2008).
  17. Maloney, L. T., Yang, J. N. Maximum likelihood difference scaling. Journal of Vision. 3 (8), 573-585 (2003).
  18. Logvinenko, A. D., Maloney, L. T. The proximity structure of achromatic surface colors and the impossibility of asymmetric lightness matching. Perception & Psychophysics. 68 (1), 76-83 (2006).
  19. Zhou, Y., Smith, B. H., Sharpee, T. O. Hyperbolic geometry of the olfactory space. Science Advances. 4 (8), (2018).
  20. Goldstone, R. An efficient method for obtaining similarity data. Behavior Research Methods, Instruments, & Computers. 26 (4), 381-386 (1994).
  21. Townsend, J. T. Theoretical analysis of an alphabetic confusion matrix. Perception & Psychophysics. 9, 40-50 (1971).

Play Video

Cite This Article
Waraich, S. A., Victor, J. D. A Psychophysics Paradigm for the Collection and Analysis of Similarity Judgments. J. Vis. Exp. (181), e63461, doi:10.3791/63461 (2022).

View Video