Summary

С помощью движений глаз, записанная в парадигме визуальный мир для изучения оперативной обработки разговорного языка

Published: October 13, 2018
doi:

Summary

Парадигма визуальный мир следит за участников движения глаз в рабочей области visual как они слушать или разговорным языком. Эта парадигма может использоваться для изучения оперативной обработки широкого круга Психолингвистические вопросов, в том числе семантически сложные операторы, например дизъюнктивной заявления.

Abstract

В типичной глаз отслеживания исследования с использованием парадигмы визуальный мир, участников глаз движений объектов или фотографии в рабочей области visual записываются через трекер глаз как участник производит или постигает разговорного языка описания параллельной визуальный мир. Эта парадигма имеет высокую универсальность, как он может использоваться в широком диапазоне населения, включая тех, кто не может читать или кто не может дать открыто их поведенческие реакции, например дописьменных детей, пожилых взрослых и пациентов. Что еще более важно парадигма является чрезвычайно чувствительны к мелкозернистого манипуляции речевого сигнала, и он может использоваться для изучения оперативной обработки большинства тем в понимании языка на нескольких уровнях, например мелкозернистого акустические фонетические характеристики, свойства слов и языковых конструкций. Протокол, описанные в этой статье иллюстрирует, как типичный визуальный мир глаз отслеживания исследования проводится, с пример, показывающий, как оперативной обработки некоторых семантически сложные операторы могут быть изучены с парадигмой визуальный мир.

Introduction

Разговорный язык является быстрый, текущей информации поток, который исчезает прямо сейчас. Это вызов для экспериментально изучения этой временной, быстро менять речевого сигнала. Движения глаз, записанная в парадигме визуальный мир может использоваться для преодоления этой проблемы. В типичной глаз отслеживания исследования с использованием парадигмы визуальный мир участников движения глаз для фотографии на дисплее или реальных объектов в рабочей области visual контролируются как они слушать, или производить, разговорный язык, изображающие содержимое визуальный мир1 ,2,3,4. Основная логика, или увязки гипотеза, позади этой парадигмы является что Постигая или планирования высказывания (открыто или тайно) переместит визуального внимание участников на определенный объект в визуальный мир. Этот сдвиг внимания будет иметь высокую вероятность начать движение скачкообразных глаз для приведения области приняли участие в фовеальное зрение. С этой парадигмы исследователи намерены определить, в какой временной точке, в отношении некоторых акустических вехой в речевого сигнала, происходит сдвиг в участника визуального внимания, как измеряется движение скачкообразных глаз на объект или рисунок в visual мир. Когда и где движения скачкообразных глаз запускаются по отношению к речевого сигнала используются затем вывести онлайн языка обработки. Парадигма визуальный мир может использоваться для изучения разговорного языка понимание1,2 и производство5,6. Эта методологическая статья будет сосредоточена на понимание исследований. В исследовании понимание используя визуальный мир парадигмы, глаз участников, которые контролируются движениями на визуальное отображение, как они слушать разговорный высказываний, говоря о визуального отображения.

Другой глаз слежения системы были разработаны в истории. Простейших, наименее дорогостоящим и наиболее портативные системы это просто нормальное видео камеру, которая записывает изображение глазами участника. Движения глаз затем вручную закодированные через кадр за кадром Экспертиза видеозаписи. Однако частота таких глаз трекер является относительно низким, и процедура по кодирвоания отнимает много времени. Таким образом современного коммерческого айтрекинга системы обычно использует оптических датчиков, измерения ориентации глаз в свою орбиту7,8,9. Чтобы понять, как работает современным коммерческой системы eye отслеживание, следует рассмотреть следующие моменты. Во-первых, правильно измерять направление фовеальное зрение, инфракрасный прожектор (обычно с длиной волны около 780-880 Нм) обычно укладывается вдоль или от оптической оси камеры, делая изображение ученик различимо ярче или темнее чем окружающие Ирис. Имидж учащегося или ученик роговицы отражения (обычно первое изображение Пуркинье) затем используется для вычисления ориентации глаза на ее орбите. Во-вторых взгляд расположение в визуальный мир на самом деле контингента, не только на глаз ориентации в отношении руководителя, но и на голову ориентацию в отношении визуальный мир. Точно вывести взгляд связи от глаз ориентации, источник света и камеры глаза трекеры устанавливаются в отношении участников начальник (руководитель монтируется глаз трекеры) или фиксированной связи визуальный мир (таблица смонтированы или удаленный глаз трекеры). В-третьих головы ориентации участников либо должны быть исправлены в отношении визуальный мир или вычислительно быть компенсированы, если голова участников свободно двигаться. Когда удаленный глаз трекер используется в режиме головы бесплатно к перемещение, участников головки обычно записывается, размещая небольшой стикер на лбу участников. Затем Главный ориентации вычислительно вычитается из глаз ориентации для получения расположения взгляд в визуальный мир. В-четвертых калибровки и проверки процесса затем требуется сопоставить ориентации глаз взглядом связи в визуальный мир. В процессе калибровки участников фиксации образцов из известных целевых точек записываются для сопоставления данных сырье глаз смотреть позиции в визуальный мир. В процессе проверки участники представлены с той же точки цели как процесс калибровки. Различия, существующие между вычисляемым фиксации позиции из калиброванного результатов и фактическое положение зацикленная цели в визуальный мир затем используются для судить о точности калибровки. Далее подтвердить точность процесса сопоставления, проверить дрейф обычно применяется в каждом испытании, где один фиксации целевой представлена участникам измерить разницу между позицией вычисляемых фиксации и фактическое положение Текущая цель.

Первичные данные исследования визуальный мир представляет собой поток взгляд места в визуальный мир, записанная на дискретизации глаз трекер, начиная за полностью или частично испытательный срок. Зависимой переменной, используемой в исследовании визуальный мир обычно является доля проб, что участников записей находятся в определенных пространственных региона в визуальный мир через определенный интервал времени. Для анализа данных, окно времени имеет прежде всего должен выбираться, часто упоминается как периоды интерес. Окно времени, обычно время-к морю для представления некоторых языковых событий во входной слуховые. Кроме того визуальный мир также необходимо разделить на несколько областей интереса (ROI), каждый из которых связан с одним или более объектами. Один такой регион содержит объект, соответствующий правильное понимание разговорного языка и таким образом часто называют целевой области. Типичный способ визуализации данных является доля фиксации сюжет, где в каждом бен в окно времени, доля проб с нетерпением для каждого региона интерес усредняются различных участников и элементов.

С помощью данных, полученных из исследования визуальный мир, различные исследовательские вопросы можно ответить:) на уровне кормового зерна, являются участниками движения глаз в визуальный мир, пострадавших от различных слуховой языкового ввода? b) если есть эффект, что такое траектория эффекта в течение судебного разбирательства? Это линейный эффект или эффект высок заказа? и c) если есть эффект, а затем на уровне мелкозернистая, при ранней временной точке, где такой эффект возникает и как долго длится этот эффект последний?

Статистически анализировать результаты, следует рассмотреть следующие моменты. Во-первых ответ переменной, т.е., пропорции фиксаций, ниже и выше граничит (между 0 и 1), который будет следовать МУЛЬТИНОМ распределения, а не нормального распределения. Отныне традиционные статистические методы, основанные на нормальное распределение t теста ANOVA и линейные модели (смешанные эффект)10, не могут быть использованы непосредственно до тех пор, пока пропорции были преобразованы в неограниченных переменных таких как с логит эмпирические формулы11 или были заменены с неограниченной зависимые переменные например евклидово расстояние12. Может также использоваться статистические методы, которые не требуют что предположении нормального распределения такие обобщенные линейные модели (смешанные эффект)13 . Во-вторых чтобы исследовать изменения траектории наблюдаемого эффекта, переменная, обозначающая время серия должна быть добавлена в модель. Эта переменная время серии является первоначально глаз трекер выборки точек, перестроены до наступления языка ввода. Поскольку изменение траектории обычно не является линейной, полиномиальной функции высокого порядка рядов обычно добавляется в (обобщенный) линейная (смешанные эффект) модель, то есть, рост кривой анализ14. Кроме того участников глаз позиции в текущей точки семплирования сильно зависит от предыдущей выборки точек, особенно когда частота записи высок, что приводит к проблеме автокорреляции. Чтобы уменьшить автокорреляции между прилегающих участков отбора проб, исходные данные часто являются вниз пробы или сегментированием. В последние годы обобщенные смешанного аддитивный эффект модели (GAMM) также использовались для решения autocorrelated ошибки12,,1516. Ширина ячеек варьируется среди различных исследований, начиная от нескольких миллисекунд до нескольких сотен миллисекунд. Узкой бин, исследование можно выбрать ограничен дискретизации глаз отслеживания используется в конкретных исследования. Например если глаз трекер имеет дискретизации 500 Гц, то ширину окна времени не может быть меньше чем 2 мс = 1000/500. В-третьих когда неоднократно статистический анализ применяется каждый раз Бен периодов интерес, familywise ошибка индуцированной из них, которые должны решаться несколько сравнений. Как было описано ранее, анализ траектории сообщает исследователь ли эффект наблюдается на уровне крупногранулированных линейная относительно изменения времени, но не показывать, когда наблюдаемый эффект начинает проявляться и как долго наблюдаемых эффект длится. Чтобы определить временнoе положение, когда наблюдаемое различие начинает отклоняться и выяснить, временной период, что наблюдаемый эффект длится, статистический анализ должен применяться неоднократно каждый раз Бен. Эти множественные сравнения представит так называемые familywise ошибки, независимо от того, какой статистический метод используется. Бонферрони перестройки17традиционно Исправлена familywise ошибка. Недавно метод называется непараметрических перестановка тест, первоначально использовались в нейровизуализации, поданной18 был применен к визуального слово парадигма19 для контроля familywise ошибка.

Исследователи, используя визуальный мир парадигмы намерены вывести понимания некоторых разговорного языка от участников движения глаз в визуальный мир. Для обеспечения достоверности этот вычет, другие факторы, которые возможно влияние движения глаз должны быть исключать или под контролем. Среди распространенных, которые должны быть рассмотрены следующие два фактора. Первый фактор включает некоторые систематической в участников пояснительные записях независимо от языка ввода, например тенденция закрепится на верхний левый квадрат визуальный мир, и движущиеся глаза в горизонтальном направлении, что проще, чем в по вертикали,12,и т.д.20 чтобы убедиться, что наблюдаемые фиксации шаблоны связаны с объектами, не в пространственного расположения, где находятся объекты, пространственной позиции объекта должен быть сбалансирован через различные испытания или через различных участников. Второй фактор, который может повлиять на участников движения глаз есть основное изображение объектов в визуальный мир, такие как яркость контрастность, цвет и края ориентации, среди прочих21. Для диагностики этот потенциал смешанных, визуального отображения обычно представлен до начала разговорного языка или до наступления критического акустическая маркер разговорного языка, около 1000 г-жа временной период с начала еще не был услышан тестового изображения до начала тестирования аудио, язык ввода или точку значения языка ввода. Любая разница между различными условиями следует вывели другие смешанные факторы, такие как визуального отображения per se, а не язык ввода. Отныне движения глаз, в этот период просмотра служат основой для определения влияния языкового ввода. Этот предварительный период также позволяет участникам получить ознакомил с визуального отображения и уменьшить систематического смещения пояснительных фиксаций при предъявлении разговорного языка.

Чтобы проиллюстрировать, как проводится типичный глаз отслеживания исследования с использованием парадигмы визуальный мир, следующий протокол описывает эксперимент адаптировано из17 л Zhan исследовать оперативной обработки семантически сложных заявлений, т.е. дизъюнктивная заявления (S1 или S2), соединительной заявления (S1 и S2) и но-заявления (S1, но не S2). В обычных сохранения информация, выраженные некоторыми высказываниями на самом деле сильнее, чем его буквальное значение. Дизъюнктивная заявления как Сяомин поле содержит корову или петуха являются такие высказывания. Логически, дизъюнктивной утверждение верно, до тех пор, как два disjuncts Сяомин поле содержит корову и Сяомин поле содержит петуха не являются оба значение false. Таким образом дизъюнктивной утверждение верно, когда два disjuncts как true, где соответствующее заявление соединительной Сяомин поле содержит корову и петуха также верно. В обычный разговор, однако, услышав что дизъюнктивной заявление часто предполагает, что соответствующие соединительной заявление является ложным (скалярные импликатура); и свидетельствует о том, что правда двух disjuncts значений неизвестных диктором (вывод невежества). Счета в литературе различаются в том, являются ли два умозаключения грамматических или прагматической процессов22,23,24,25,26. Эксперимент показывает, как визуальный мир парадигма может использоваться выносить между этими счетами, путем изучения оперативной обработки трех сложных инструкций.

Protocol

Все субъекты должны дать обоснованное письменное согласие перед администрацией экспериментальных протоколов. Все процедуры, формы согласия и экспериментальный протокол были одобрены Комитет по этике исследований Пекин языка и культуры университета. Примечание: Поним…

Representative Results

Поведенческие реакции участников приводится на рисунке 4. Как было описано ранее, правильный ответ на совместное заявление (S1 и S2) является большой открытой коробке, таких как окно на рисунке 1. Правильный ответ на но-заявление (…

Discussion

Для проведения исследования, визуальный мир, есть несколько важных шагов, чтобы следовать. Во-первых исследователи намерены вывести интерпретации вербально представленных языка через участников движения глаз в визуальный мир. Отныне в проектировании визуальных раздражителей, должны…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Это исследование было поддержано фонд Пекин язык науки и культуры университета под фундаментальные исследования средств для университетов Центральной (утверждение номер 15YJ050003).

Materials

Pixelmator Pixelmator Team http://www.pixelmator.com/pro/ image editing app
Praat Open Sourse http://www.fon.hum.uva.nl/praat/ Sound analyses and editting software
Eyelink 1000plus SR-Research, Inc https://www.sr-research.com/products/eyelink-1000-plus/ remote infrared eye tracker 
Experimental Builder SR-Research, Inc https://www.sr-research.com/experiment-builder/ eye tracker software 
Data Viewer SR-Research, Inc https://www.sr-research.com/data-viewer/ eye tracker software 
R Open Sourse https://www.r-project.org free software environment for statistical computing and graphics

References

  1. Tanenhaus, M. K., Spivey-Knowlton, M. J., Eberhard, K. M., Sedivy, J. C. Integration of visual and linguistic information in spoken language comprehension. Science. 268 (5217), 1632-1634 (1995).
  2. Cooper, R. M. The control of eye fixation by the meaning of spoken language: A new methodology for the real-time investigation of speech perception, memory, and language processing. Cognitive Psychology. 6 (1), 84-107 (1974).
  3. Salverda, A. P., Tanenhaus, M. K., de Groot, A. M. B., Hagoort, P. . Research methods in psycholinguistics and the neurobiology of language: A practical guide. , (2017).
  4. Huettig, F., Rommers, J., Meyer, A. S. Using the visual world paradigm to study language processing: A review and critical evaluation. Acta Psychologica. 137 (2), 151-171 (2011).
  5. Meyer, A. S., Sleiderink, A. M., Levelt, W. J. M. Viewing and naming objects: Eye movements during noun phrase production. Cognition. 66 (2), B25-B33 (1998).
  6. Griffin, Z. M., Bock, K. What the eyes say about speaking. Psychological Science. 11 (4), 274-279 (2000).
  7. Young, L. R., Sheena, D. Survey of eye movement recording methods. Behavior Research Methods & Instrumentation. 7 (5), 397-429 (1975).
  8. Conklin, K., Pellicer-Sánchez, A., Carrol, G. . Eye-tracking: A guide for applied linguistics research. , (2018).
  9. Duchowski, A. . Eye tracking methodology: Theory and practice. , (2007).
  10. Baayen, R. H., Davidson, D. J., Bates, D. M. Mixed-effects modeling with crossed random effects for subjects and items. Journal of Memory and Language. 59 (4), 390-412 (2008).
  11. Barr, D. J. Analyzing ‘visual world’ eyetracking data using multilevel logistic regression. Journal of Memory and Language. 59 (4), 457-474 (2008).
  12. Nixon, J. S., van Rij, J., Mok, P., Baayen, R. H., Chen, Y. The temporal dynamics of perceptual uncertainty: eye movement evidence from Cantonese segment and tone perception. Journal of Memory and Language. 90, 103-125 (2016).
  13. Bolker, B. M., et al. Generalized linear mixed models: A practical guide for ecology and evolution. Trends in Ecology and Evolution. 24 (3), 127-135 (2009).
  14. Mirman, D., Dixon, J. A., Magnuson, J. S. Statistical and computational models of the visual world paradigm: Growth curves and individual differences. Journal of Memory and Language. 59 (4), 475-494 (2008).
  15. Baayen, H., Vasishth, S., Kliegl, R., Bates, D. The cave of shadows: Addressing the human factor with generalized additive mixed models. Journal of Memory and Language. 94, 206-234 (2017).
  16. Baayen, R. H., van Rij, J., de Cat, C., Wood, S., Speelman, D., Heylen, K., Geeraerts, D. . Mixed-Effects Regression Models in Linguistics. 4, 49-69 (2018).
  17. Zhan, L. Scalar and ignorance inferences are both computed immediately upon encountering the sentential connective: The online processing of sentences with disjunction using the visual world paradigm. Frontiers in Psychology. 9, (2018).
  18. Maris, E., Oostenveld, R. Nonparametric statistical testing of EEG- and MEG-data. Journal of Neuroscience Methods. 164 (1), 177-190 (2007).
  19. Barr, D. J., Jackson, L., Phillips, I. Using a voice to put a name to a face: The psycholinguistics of proper name comprehension. Journal of Experimental Psychology-General. 143 (1), 404-413 (2014).
  20. Dahan, D., Tanenhaus, M. K., Salverda, A. P., van Gompel, R. P. G., Fischer, M. H., Murray, W. S., Hill, R. L. . Eye movements: A window on mind and brain. , 471-486 (2007).
  21. Parkhurst, D., Law, K., Niebur, E. Modeling the role of salience in the allocation of overt visual attention. Vision Research. 42 (1), 107-123 (2002).
  22. Grice, H. P., Cole, P., Morgan, J. L. Vol. 3 Speech Acts. Syntax and semantics. , 41-58 (1975).
  23. Sauerland, U. Scalar implicatures in complex sentences. Linguistics and Philosophy. 27 (3), 367-391 (2004).
  24. Chierchia, G. Scalar implicatures and their interface with grammar. Annual Review of Linguistics. 3 (1), 245-264 (2017).
  25. Fox, D., Sauerland, U., Stateva, P. . Presupposition and Implicature in Compositional Semantics. , 71-120 (2007).
  26. Meyer, M. C. . Ignorance and grammar. , (2013).
  27. SR Research Ltd. . SR Research Experiment Builder User Manual (Version 2.1.140). , (2017).
  28. SR Research Ltd. . EyeLink® 1000 Plus Technical Specifications. , (2017).
  29. SR Research Ltd. . EyeLink-1000-Plus-Brochure. , (2017).
  30. SR Research Ltd. . EyeLink® 1000 Plus User Manual (Version 1.0.12). , (2017).
  31. SR Research Ltd. . EyeLink® Data Viewer User’s Manual (Version 3.1.97). , (2017).
  32. McQueen, J. M., Viebahn, M. C. Tracking recognition of spoken words by tracking looks to printed words. The Quarterly Journal of Experimental Psychology. 60 (5), 661-671 (2007).
  33. Altmann, G. T. M., Kamide, Y. Incremental interpretation at verbs: restricting the domain of subsequent reference. Cognition. 73 (3), 247-264 (1999).
  34. Altmann, G. T. M., Kamide, Y. The real-time mediation of visual attention by language and world knowledge: Linking anticipatory (and other) eye movements to linguistic processing. Journal of Memory and Language. 57 (4), 502-518 (2007).
  35. Snedeker, J., Trueswell, J. C. The developing constraints on parsing decisions: The role of lexical-biases and referential scenes in child and adult sentence processing. Cognitive Psychology. 49 (3), 238-299 (2004).
  36. Allopenna, P. D., Magnuson, J. S., Tanenhaus, M. K. Tracking the time course of spoken word recognition using eye movements: Evidence for continuous mapping models. Journal of Memory and Language. 38 (4), 419-439 (1998).
  37. Zhan, L., Crain, S., Zhou, P. The online processing of only if and even if conditional statements: Implications for mental models. Journal of Cognitive Psychology. 27 (3), 367-379 (2015).
  38. Zhan, L., Zhou, P., Crain, S. Using the visual-world paradigm to explore the meaning of conditionals in natural language. Language, Cognition and Neuroscience. 33 (8), 1049-1062 (2018).
  39. Brown-Schmidt, S., Tanenhaus, M. K. Real-time investigation of referential domains in unscripted conversation: A targeted language game approach. Cognitive Science. 32 (4), 643-684 (2008).
  40. Fernald, A., Pinto, J. P., Swingley, D., Weinberg, A., McRoberts, G. W. Rapid gains in speed of verbal processing by infants in the 2nd year. Psychological Science. 9 (3), 228-231 (1998).
  41. Trueswell, J. C., Sekerina, I., Hill, N. M., Logrip, M. L. The kindergarten-path effect: studying on-line sentence processing in young children. Cognition. 73 (2), 89-134 (1999).
  42. Zhou, P., Su, Y., Crain, S., Gao, L. Q., Zhan, L. Children’s use of phonological information in ambiguity resolution: a view from Mandarin Chinese. Journal of Child Language. 39 (4), 687-730 (2012).
  43. Zhou, P., Crain, S., Zhan, L. Grammatical aspect and event recognition in children’s online sentence comprehension. Cognition. 133 (1), 262-276 (2014).
  44. Zhou, P., Crain, S., Zhan, L. Sometimes children are as good as adults: The pragmatic use of prosody in children’s on-line sentence processing. Journal of Memory and Language. 67 (1), 149-164 (2012).
  45. Moscati, V., Zhan, L., Zhou, P. Children’s on-line processing of epistemic modals. Journal of Child Language. 44 (5), 1025-1040 (2017).
  46. Helfer, K. S., Staub, A. Competing speech perception in older and younger adults: Behavioral and eye-movement evidence. Ear and Hearing. 35 (2), 161-170 (2014).
  47. Dickey, M. W., Choy, J. W. J., Thompson, C. K. Real-time comprehension of wh-movement in aphasia: Evidence from eyetracking while listening. Brain and Language. 100 (1), 1-22 (2007).
  48. Magnuson, J. S., Nusbaum, H. C. Acoustic differences, listener expectations, and the perceptual accommodation of talker variability. Journal of Experimental Psychology-Human Perception and Performance. 33 (2), 391-409 (2007).
  49. Reinisch, E., Jesse, A., McQueen, J. M. Early use of phonetic information in spoken word recognition: Lexical stress drives eye movements immediately. Quarterly Journal of Experimental Psychology. 63 (4), 772-783 (2010).
  50. Chambers, C. G., Tanenhaus, M. K., Magnuson, J. S. Actions and affordances in syntactic ambiguity resolution. Journal of Experimental Psychology-Learning Memory and Cognition. 30 (3), 687-696 (2004).
  51. Tanenhaus, M. K., Trueswell, J. C., Trueswell, J. C., Tanenhaus, M. K. . Approaches to Studying World-Situated Language Use: Bridging the Language-as-Product and Language-as-Action Traditions. , (2005).

Play Video

Cite This Article
Zhan, L. Using Eye Movements Recorded in the Visual World Paradigm to Explore the Online Processing of Spoken Language. J. Vis. Exp. (140), e58086, doi:10.3791/58086 (2018).

View Video