Summary

Utilizzo dei movimenti oculari per valutare i processi cognitivi coinvolti nella comprensione del testo

Published: January 10, 2014
doi:

Summary

Il presente articolo descrive come utilizzare le metodologie di tracciamento oculare per studiare i processi cognitivi coinvolti nella comprensione del testo. Sono incluse descrizioni delle apparecchiature di tracciamento oculare, come sviluppare stimoli sperimentali e raccomandazioni procedurali. Le informazioni presentate possono essere applicate alla maggior parte di qualsiasi studio utilizzando stimoli verbali.

Abstract

Il presente articolo descrive come utilizzare le metodologie di tracciamento oculare per studiare i processi cognitivi coinvolti nella comprensione del testo. Misurare i movimenti oculari durante la lettura è uno dei metodi più precisi per misurare le richieste di elaborazione momento per momento (online) durante la comprensione del testo. Le richieste di elaborazione cognitiva sono riflesse da diversi aspetti del comportamento del movimento degli occhi, come la durata della fissazione, il numero di fissazioni e il numero di regressioni (tornando alle parti precedenti di un testo). Vengono descritte importanti proprietà delle apparecchiature di tracciamento oculare che i ricercatori devono considerare, tra cui la frequenza con cui viene misurata la posizione dell’occhio (frequenza di campionamento), l’accuratezza della determinazione della posizione degli occhi, la quantità di movimento della testa consentita e la facilità d’uso. Sono descritte anche le proprietà degli stimoli che influenzano i movimenti oculari che devono essere controllati negli studi sulla comprensione del testo, come la posizione, la frequenza e la lunghezza delle parole bersaglio. Vengono fornite raccomandazioni procedurali relative alla preparazione del partecipante, alla configurazione e alla calibrazione dell’attrezzatura e all’esecuzione di uno studio. Vengono presentati risultati rappresentativi per illustrare come valutare i dati. Sebbene la metodologia sia descritta in termini di comprensione della lettura, molte delle informazioni presentate possono essere applicate a qualsiasi studio in cui i partecipanti leggano stimoli verbali.

Introduction

Quando i lettori leggono un testo, spostano gli occhi da una parola all’altra attraverso un modello alternato di fissazioni (punti in cui gli occhi sono fermi e focalizzati su una parola) e saccadi (punti in cui l’occhio si muove tra le parole). Le correzioni che seguono saccades che spostano il lettore in avanti attraverso un testo sono chiamate fissazioni e correzioni in avanti a seguito di saccade che spostano il lettore verso punti precedenti in un testo sono chiamate fissazioni regressive. L’ipotesi di base dei metodi di tracciamento oculare è che l’aumento delle richieste di elaborazione è associato a un aumento del tempo di elaborazione o a cambiamenti nel modello di fissazione. L’aumento del tempo di elaborazione può essere riflesso da fissazioni di durata più lunga o da un maggior numero di fissazioni (in avanti e regressive).

I movimenti oculari offrono diversi vantaggi importanti come misura del comportamento di lettura rispetto alla misurazione dei tempi di lettura per un intero passaggio o tempi di lettura frase per frase. In primo luogo, il monitoraggio dei movimenti oculari produce un record continuo e online delle prestazioni di lettura. Ciò consente di esaminare le richieste di elaborazione del testo a livello globale (su un intero testo), a livello di frase (singole frasi) o a livello locale (singole parole o frasi). Ad esempio, le modifiche nella difficoltà globale portano a cambiamenti in diverse misure di prestazioni, come il tempo di lettura totale, il numero di fissazioni in avanti e il numero di regressioni. I cambiamenti nella difficoltà a livello locale influiscono anche su diverse misure, come i tempi di lettura per le singole parole, la probabilità di fissare le parole e la probabilità di fare regressioni a parole specifiche. I tempi di lettura complessivi o i tempi di lettura frase per frase non forniscono misure così dettagliate delle prestazioni di lettura. In secondo luogo, i movimenti oculari sono una parte naturale della lettura; pertanto, non vengono poste ulteriori richieste di attività a un lettore. In terzo luogo, possono essere analizzatimolteplici aspetti dei movimenti oculari (ad esempio durata di fissazione, lunghezza saccade e frequenza di regressione), fornendo una finestra su diversi elementi del processo di lettura. In quarto luogo, i movimenti oculari riflettono direttamente le esigenze di elaborazione associate alle caratteristiche del testo letto. Ad esempio, i movimenti oculari variano in funzione della frequenzadelle parole 10,11, della lunghezzadella parola 7, dell’ambiguità lessicale2, del vincolo contestuale1e dellaripetizione 10,13. Quinto, i movimenti oculari riflettono le differenze individuali nei lettori. Ad esempio, i movimenti oculari variano in base allacapacità di lettura 1, alla conoscenza preliminare diun argomento 9e all’età dellettore 14. Rayner, Pollatsek, Ashby e Clifton13 forniscono una revisione approfondita dei movimenti oculari durante la lettura. Nel complesso, questi vantaggi rendono i movimenti degli occhi una misura ideale del comportamento di lettura.

La ricerca qui descritta ha utilizzato una metodologia di movimento oculare per studiare i processi cognitivi coinvolti nella comprensione del testo. In particolare, l’esperimento è stato progettato per esplorare come vengono elaborate metafore familiari e sconosciute4. In questo studio, i partecipanti leggono brevi testi presentati su un monitor mentre i loro movimenti oculari sono stati monitorati. Ogni testo conteneva quattro frasi. Le prime due frasi fornivano un contesto coerente con il significato previsto della metafora. Le metafore sono state presentate nella terza frase. La quarta frase è servita da conclusione neutrale. Esempi di testi contenenti metafore familiari (1) e sconosciute (2) sono presentati di seguito con le metafore sottolineate per facilità di identificazione.

  1. Passaggio metaforico familiare. Peter non aveva mai visto una ragazza così bella prima d’ora. Sperava davvero che qualcosa di speciale sarebbe cresciuto tra i due. Pensava a se stesso che l’amore è un fiore. Peter chiamò la ragazza più tardi quella notte.
  2. Passaggio metaforico sconosciuto. Laurearsi al college è una pietra miliare molto importante per molte persone. Ci vuole molto lavoro per raggiungere questo obiettivo. Per molte persone una laurea è una porta. Laurearsi al college è qualcosa di cui essere molto orgogliosi.

Ricerche passate basate su una varietà di metodi hanno dimostrato che le metafore familiari sono più facili da capire (elaborate più velocemente) rispetto alle metaforesconosciute 3,6. La potenza del metodo di tracciamento oculare è che la fonte della difficoltà di elaborazione può essere isolata a parole specifiche. Ad esempio, i ricercatori possono determinare se il tempo extra necessario per comprendere metafore sconosciute si ottiene rallentando quando si legge ogni parola nelle metafore o rallentando le ultime parole della metafora (quando è chiaro che la frase precedente è una metafora). Inoltre, i modelli di movimenti oculari supportano le deduzioni sui processi cognitivi coinvolti nella comprensione delle metafore. Ad esempio, quando si leggono metafore nuove o sconosciute, i lettori dovrebbero elaborare ulteriormente le metafore per estrarre i significati figurativi. Questo potrebbe riflettersi nello schema del movimento degli occhi come regredire all’inizio delle metafore e poi leggere attraverso le metafore una seconda volta. I lettori potrebbero anche cercare di confrontare i significati delle due parole chiave nelle metafore (ad esempio amore e fiore),che potrebbero portare a uno schema di movimenti oculari avanti e indietro tra le parole chiave. In alternativa, quando si leggono metafore familiari, i lettori potrebbero estrarre i significati figurativi immediatamente dopo aver letto le metafore; pertanto, non sarebbero necessarie regressioni. Il punto chiave è che i modelli di movimento degli occhi consentono ai ricercatori di fare deduzioni sui processi online utilizzati per comprendere le metafore. Ciò supporta conclusioni più descrittive rispetto alla semplice affermazione che il tempo complessivo di elaborazione è più lungo per metafore sconosciute che familiari.

Lo studio qui descritto illustra un metodo comune di contrasto dei modelli di movimento degli occhi per due tipi di stimoli scritti e fornisce una situazione concreta per descrivere gli aspetti critici delle metodologie di movimento degli occhi. È importante sottolineare che il metodo di movimento degli occhi descritto qui può essere generalizzato per studiare molti altri problemi, come il modo in cui i lettori risolvono problemi matematici basati su parole che variano incomplessità (ad esempio alta e bassa complessità), o come i problemi di parole vengono risolti dagli esperti di dominio rispetto ai principianti. I movimenti oculari potrebbero essere usati per determinare quali parole nei problemi attirano la maggiorattenzione (cioè durate di fissazione più lunghe e il maggior numero di fissazioni) e se esperti e principianti si concentrano sulle stesse informazioni. In ogni caso, il monitoraggio dei movimenti oculari fornirebbe una registrazione dei cambiamenti momento per momento nelle richieste di elaborazione associati alla comprensione dei problemi letti.

Protocol

1. Proprietà delle apparecchiature di tracciamento oculare Gli eye tracker variano per quanto riguarda il modo in cui vengono misurati i movimenti oculari, la frequenza con cui viene misurata la posizione dell’occhio (frequenza di campionamento), l’accuratezza della determinazione della posizione degli occhi, la quantità di movimento della testa consentita e la facilità d’uso. L’importanza di questi fattori varia a seconda del tipo di ricerca svolta e dei partecipanti sottoposti a test. Ad esempio, nella maggior parte degli studi di lettura, è necessaria un’elevata precisione per determinare quale parola viene fissata. Come secondo esempio, la tolleranza dei movimenti della testa e la facilità d’uso sono fondamentali quando si usano i bambini come partecipanti. La ricerca qui descritta è stata condotta utilizzando un eye tracker SR Research EyeLink 1000 (SR Research Ltd). Un’immagine del sistema di tracciamento oculare è presentata nella figura 1. Il sistema EyeLink tiene traccia dei movimenti degli occhi misurando i cambiamenti nella posizione della pupilla in un’immagine video. Questo viene fatto brillando una luce infrarossa dispersa (che non è visibile ai partecipanti) sugli occhi dei soggetti e registrando la riflessione infrarossa (immagine) da un occhio (o entrambi gli occhi) con una videocamera ad alta risoluzione con rilevamento a infrarossi. La sorgente luminosa a infrarossi e la videocamera sono posizionate sotto il monitor utilizzato per visualizzare gli stimoli. La luce infrarossa viene utilizzata per evitare riflessi spuri dalle normali luci dello spettro. La luce infrarossa produce un punto luminoso in cui si trova la pupilla (le luci entrano nella pupilla e si riflettono sulla retina per illuminare la pupilla) e un riflesso puntico sulla superficie dell’occhio chiamato riflesso corneale. L’immagine video viene digitalizzata in modo da poter misurare i movimenti orizzontali e verticali della pupilla (il punto luminoso) nel fotogramma video. Il riflesso corneale è un riflesso stazionario che non si muove a meno che la testa non si muova (perché è un riflesso dalla superficie dell’occhio, non si muove quando gli occhi si muovono). Misurare la riflessione corneale fornisce un mezzo per distinguere piccoli movimenti della testa, che portano al movimento della riflessione corneale, dai soli movimenti oculari, che non portano al movimento della riflessione corneale. Per ridurre al minimo i movimenti della testa e mantenere il partecipante nella gamma focale della videocamera, i partecipanti posizionano la testa su una fronte e il poggiamento del mento mentre leggono il testo presentato su un monitor del computer. Di seguito sono descritte diverse caratteristiche critiche dei sistemi di tracciamento oculare. Frequenza di campionamento. La frequenza di campionamento si riferisce al numero di volte al secondo di posizione dell’occhio. La frequenza di campionamento per il sistema EyeLink 1000 è di 1.000 Hz, il che significa che la posizione degli occhi viene misurata 1.000 volte al secondo. Le frequenze di campionamento comuni sono 1.000 Hz, 500 Hz, 250 Hz e 60 Hz (la frequenza/frequenza di aggiornamento video di molti monitor del computer).Nota: quando si studia la lettura, l’obiettivo è misurare con precisione la posizione e la durata delle fissazioni e dei saccadi. Durante la normale lettura per adulti, la durata della fissazione varia in genere da circa 100-800 msec, con una media di circa 250 msec (per i lettori in età universitaria). I saccadi in genere variano in durata da circa 10-20 msec quando i lettori spostano gli occhi da una parola all’altra. Saccades molto grandi, come lo spostamento dalla fine di una riga all’inizio della riga successiva, possono avere una durata di 60-80 msec. Tassi di campionamento più elevati producono una migliore precisione temporale (chiamata anche risoluzione temporale) quando si misura la durata delle fissazioni e dei saccadi. In particolare, l’errore temporale medio sarà circa la metà della durata del tempo tra i campioni. Ad esempio, una frequenza di campionamento di 1.000 Hz (posizione degli occhi di campionamento ogni 1 msec) porterà a un errore medio di 0,5 msec e una frequenza di campionamento di 60 Hz (posizione degli occhi di campionamento ogni 16,7 msec) porterà a un errore medio di circa 8 msec. Un errore di 8 msec potrebbe essere considerato troppo grande per studiare la durata dei saccadi, ma non troppo grande per studiare la durata delle fissazioni. Trent’anni fa la maggior parte delle ricerche di lettura è stata condotta utilizzando eye tracker con frequenze di campionamento a 60 Hz. La maggior parte delle ricerche sulla lettura viene ora eseguita utilizzando eye tracker in grado di campionire a 500 Hz o 1.000 Hz.Durante la lettura, l’obiettivo è quello di concentrare entrambi gli occhi sulla stessa posizione; pertanto, la pratica comune è registrare i movimenti oculari da un occhio. Alcuni sistemi di tracciamento oculare consentono il tracciamento simultaneo di entrambi gli occhi. Il vantaggio di tracciare entrambi gli occhi è che l’occhio con la migliore precisione di tracciamento può essere selezionato per l’analisi finale. Lo svantaggio di tracciare entrambi gli occhi è che la frequenza di campionamento è generalmente ridotta di un fattoredue (cioè una frequenza di campionamento di 1.000 Hz per un occhio è ridotta a 500 Hz durante la registrazione da entrambi gli occhi). Precisione. Precisione si riferisce al modo in cui la posizione di fissazione calcolata corrisponde alla posizione di fissazione effettiva. Questo è espresso in gradi di angolo visivo (un semicerchio ha 180º di angolo visivo). La precisione media del sistema EyeLink 1000 è di 0,25-0,5º di angolo visivo. Per mettere questo in prospettiva, quando si guarda un 17-20 nel monitor del computer a una distanza di visualizzazione normale, la larghezza del monitor copre 20-30º di angolo visivo.Nota: il grado di precisione necessario dipende dagli obiettivi di ricerca. Se l’obiettivo è misurare quale carattere su una linea è fissato, è necessaria l’accuratezza della posizione del carattere. Se l’obiettivo è misurare quale parola su una riga è fissata, è necessaria l’accuratezza della posizione della parola. Nella ricerca qui descritta, il testo è stato visualizzato in modo che 3 caratteri equivalevano a circa 1° di angolo visivo. La misurazione è di circa 3 caratteriperché il testo è stato visualizzato in caratteri proporzionali ( cioè caratteri differivano per larghezza, ad esempio il carattere i è più stretto del w). Per ottenere la precisione della posizione del carattere, l’eye tracker deve determinare la posizione di fissazione a 1/3° (la larghezza di circa un carattere) su un intervallo orizzontale di 30 ° (la larghezza del display del computer). Per ottenere l’accuratezza della posizione delle parole, l’eye tracker deve determinare la posizione di fissazione entro un intervallo di 1° per parole di 3 caratteri di lunghezza. Gli eye tracker tendono ad essere leggermente meno precisi nel misurare grandi movimenti verticalidegli occhi (ad esempio spostandosi dalla parte inferiore del display verso l’alto) perché la pupilla può essere parzialmente occlusa dalle palpebre e dalle ciglia degli occhi. Questo problema può essere sostanzialmente ridotto o eliminato raddoppiando i testi, il che rende più facile discernere quale riga di testo viene letta. Per 17-20 nei monitor per computer, la doppia spaziatura produce circa 2,5° di separazione verticale tra le linee, ben entro l’intervallo di precisione di EyeLink 1000 e della maggior parte degli eye tracker di generazione corrente. Movimento della testa. Il movimento della testa consentita per il sistema EyeLink 1000 è di 25 mm x 25 mm x 10 mm (orizzontale x verticale x profondità). Cioè, i partecipanti possono effettuare movimenti della testa di ±12,5 mm a sinistra/destra, ±12,5 mm su /giù e ±5 mm in/out dalla posizione della testa in cui è stata eseguita la calibrazione iniziale (spiegata di seguito) senza compromettere la precisione. Le restrizioni sinistra/destra e su/giù sono necessarie per tenere d’occhio il campo visivo della videocamera. La restrizione in/out è necessaria per tenere d’occhio la gamma focale della videocamera. L’uso di una combinazione di fronte / mento riposa facilmente mantiene i movimenti all’interno di questo intervallo.Nota: se sono necessari movimenti della testa più grandi, ad esempio se il display consisteva di tre monitor fianco a fianco che richiedevano movimenti della testa per guardare ogni monitor (come in un simulatore di guida), è disponibile una versione “montata sulla testa” dell’eye tracker che non richiede un poggiatesta / mento. Per il sistema montato sulla testa, le telecamere utilizzate per tracciare la posizione degli occhi sono montate su una fascia regolabile in modo che i partecipanti possano muovere liberamente la testa. Una fotocamera separata che punta in avanti registra la scena visualizzata. I movimenti oculari sono determinati rispetto alla scena visualizzata. Lo svantaggio del sistema montato sulla testa è che la frequenza di campionamento è ridotta a 500 Hz (massimo) o meno, la precisione tende ad essere leggermente inferiore perché i movimenti della testa di grandi dimensioni possono introdurre errori e i tempi di configurazione tendono ad essere leggermente più lunghi perché la posizione delle telecamere di movimento degli occhi deve essere regolata per ogni partecipante. Il software per il funzionamento dell’eye tracker montato sulla testa è essenzialmente identico all’EyeLink 1000. Tempo di configurazione del sistema. EyeLink 1000 in genere può essere impostato e calibrato in 5 minuti o meno, il che è tipico degli eye tracker basati su video. Questo processo è ulteriormente definito nella sezione relativa alla procedura seguente. 2. Preparazione allo stimolo Quando si confrontano i movimenti oculari per gli stimoli prelevati da due o più condizioni, gli stimoli devono essere abbinati a caratteristiche note per influenzare i movimenti oculari. I testi metaforici qui usati illustrano diverse proprietà importanti che dovrebbero essere controllate quando si confrontano come vengono letti due stimoli. Le parole chiave devono essere abbinate alla lunghezza media delle parole (in numero di caratteri) e alla frequenza delle parole (tipicamente espressa come occorrenze/milioni di parole) tra le condizioni. Questo è fondamentale perché la durata della fissazione aumenta man mano che la frequenza delle parole diminuisce e la probabilità di fissare una parola aumenta man mano che la lunghezza dellaparola aumenta di 10,13. Nei passaggi metaforica, le parole di contenuto in metafore familiari e sconosciute sono state abbinate alla lunghezza media delle parole e alla frequenza delle parole. Le parole chiave dovrebbero essere presentate in posizioni simili all’interno di testi e frasi. Questo è importante perché le parole alla fine delle frasi vengono in genere lette più lentamente rispetto alle parole precedenti nelle frasi e i lettori tendono a leggere più velocemente mentre progrediscono attraverso un passaggio e poi rallentanol’ultima frase 11,12. Nei passaggi metaforico, tutte le metafore sono state presentate alla fine della terza frase. Presentare alcune metafore all’inizio delle frasi e altre alla fine delle frasi porterebbe a variazioni nei tempi di lettura non associati alle metafore stesse. Le frasi chiave devono essere approssimativamente abbinate alla lunghezza e alla struttura delle parole. Questo è importante perché la lunghezza della frase e la struttura sintattica influenzano il tempo di lettura, il numero di fissazioni e la probabilità di regressioni13. Nei passaggi metafori, metafore familiari e sconosciute avevano lo stesso numero di parole e struttura (X è una Y). Il contesto immediatamente precedente le parole chiave deve essere approssimativamente equiparato al numero di parole, al formato e alla difficoltà di elaborazione. L’equiparare i contesti tra le condizioni è necessario perché il vincolo contestuale influenza le durate di fissazione per le parolesuccessive 1,14. Nei passaggi metaforico, la prima frase di contesto sempre legata alla prima parola chiave nelle metafore(amore e pescatore)e la seconda frase di contesto sempre legata alla seconda parola chiave nelle metafore(fiore e ragno). Le parole o le frasi chiave non dovrebbero essere l’ultima parola o frase di un passaggio. Questo è importante perché i lettori leggono la fine di un testo più lentamente rispetto alle parti precedenti del testo, che è chiamato effetto di wrap-updel passaggio 12. L’aggiunta di una frase conclusiva consente inoltre di misurare lo sversamento di elaborazione. Lo sversamento si riferisce alla difficoltà di elaborazione che si estende da una frase alla frase successiva. Nei passaggi metaforico, una frase di conclusione neutra seguiva le metafore. Se i lettori non capivano il significato di una metafora, potrebbero passare alla frase successiva sperando in spunti sul significato della metafora. Come tale, la frase di conclusione era intenzionalmente neutra per rimuovere i segnali di significato.Sebbene le proprietà di controllo dello stimolo siano state descritte qui in termini di metafore, si applicano alla maggior parte di qualsiasi studio sulla comprensione del testo o su qualsiasi studio che manipoli gli stimoli linguistici. Si consideri il nostro esempio precedente in cui i lettori risolvono problemi matematici basati su parole che variano incomplessità (ad esempio alta e bassa complessità). Non si vorrebbe che i problemi di alta complessità includevano parole più non comuni (frequenza molto bassa) rispetto ai problemi di bassa complessità perché la complessità matematica sarebbe confusa con la frequenza delle parole. Naturalmente, l’obiettivo dell’esperimento determina quali caratteristiche devono essere controllate. Ad esempio, se l’obiettivo dell’esperimento è quello di esaminare in che modo la struttura delle frasi influenza l’elaborazione, la struttura delle frasi deve essere manipolata. Per tornare al nostro esperimento di problemi matematici, si potrebbe desiderare di esplorare come le diverse strutture grammaticali influenzino la difficoltà di risolvere i problemi. Ad esempio, le frasi contenenti dettagli chiave dei problemi potrebbero essere scritte in voce attiva o passiva. Il modello di movimenti oculari su queste frasi chiave potrebbe essere misurato così come l’influenza sulla determinazione delle soluzioni corrette. 3. Esecuzione dell’esperimento I partecipanti devono iniziare completando un consenso informato che descriva la procedura generale. La ricerca comportamentale come l’esperimento descritto qui è comunemente approvata dall’IRB comportamentale di un istituto (Institutional Research Board) rispetto a un IRB medico perché le apparecchiature di tracciamento oculare basate su video non vengono a contatto con l’occhio ed è approvato come dispositivo LED di classe 1 che è sicuro in tutte le condizioni. Se le procedure di tracciamento oculare sono combinate con procedure mediche, come la registrazione dei movimenti oculari durante la formazione di un fMRI, sarà necessario un IRB medico. I partecipanti devono spegnere o disattivare l’audio di tutti i dispositivi elettronici che distraggono. L’altezza del mentoniera deve essere impostata in modo che l’occhio monitorato sia centrato approssimativamente sul display video. I partecipanti dovrebbero regolare l’altezza del sedile in modo da poter riposare comodamente il mento sul mento e la fronte contro il poggia fronte. I partecipanti tendono a slouch sulla sedia mentre si rilassano, il che tende a tirare la fronte lontano dal riposo della fronte. Ciò può aumentare l’errore verticale nel record di tracciamento oculare. Questo problema può essere ridotto al minimo assicurandosi che i partecipanti inizino con i loro stagisti leggermente sopra l’altezza del poggiamento del mento in modo che possano riposare il mento sul poggiamento del mento. Ai partecipanti dovrebbe essere detto come viene regolato e impostato l’eye tracker prima di iniziare l’esperimento. La visualizzazione delle istruzioni sul monitor offre ai partecipanti l’opportunità di vedere come appare il display prima di iniziare l’esperimento e di regolare ulteriormente la loro posizione sul poggiamento fronte/mento, se necessario. Assicurarsi che solo l’occhio registrato sia visibile nel display della fotocamera. Ciò impedirà al tracker di “spostarsi” verso l’altro occhio nel caso in cui i partecipanti debbano fare un grande movimento della testa. Se entrambi gli occhi si trovano nel campo visivo della fotocamera, lo spostamento può verificarsi se i partecipanti spostano la testa abbastanza lontano in modo che l’immagine dell’occhio registrato venga spostata fuori dal campo visivo della fotocamera e l’altro occhio venga spostato nella vista della fotocamera. L’eye tracker “cercherà” una nuova riflessione della pupilla. Il tracker tornerà all’occhio originale quando la testa viene restituita alla posizione iniziale, ma lo spostamento causa una temporanea perdita della posizione degli occhi. Mettere a fuoco la fotocamera (l’immagine verrà visualizzata sul display dello sperimentatore). La messa a fuoco corretta aumenta la capacità di rilevare e tracciare la pupilla e la riflessione corneale. Regolare la soglia di sensibilità all’infrarosso della videocamera. Il sistema EyeLink ha una funzione di “soglia automatica” che imposta correttamente la soglia per la stragrande maggioranza dei partecipanti. Se ampie aree di riflessione infrarossa sono visibili vicino all’occhio, la soglia può essere ridotta manualmente. A questo punto l’eye tracker dovrebbe rilevare la pupilla e il riflesso corneale e iniziare a tracciare la posizione degli occhi (indicata dai peli incrociati sulla pupilla e dal riflesso corneale). Assicurarsi che la pupilla e la riflessione corneale vengano tracciate su tutta la superficie del display facendo in modo che i partecipanti guardino ogni angolo del monitor del computer. Se la pupilla o la riflessione corneale si perde ai bordi del display, inclinando la testa del partecipante spostando la base di riposo del mento in avanti o all’indietro di solito risolve il problema. Per i partecipanti che indossano occhiali, i fotogrammi a volte occludeno parte dell’immagine video degli occhi quando guardano angoli orizzontali o verticali estremi. Questo è un problema solo se la pupilla e la riflessione corneale non possono essere tracciate in tutta l’area in cui verranno mostrati gli stimoli. L’eye tracker può essere calibrato (descritto successivamente) su un intervallo più piccolo, se necessario per compensare questo problema. La calibrazione è il processo utilizzato per impostare il software di tracciamento oculare per tenere traccia con precisione dei movimenti degli occhi. Questo viene fatto registrando la posizione degli occhi mentre i partecipanti fissano un set di nove punti di fissazione (punti neri) visualizzati sul monitor in luoghi noti. I punti di fissazione sono presentati in ordine casuale. Il numero di punti di fissazione può essere variato a seconda di quanto del display occuperanno gli stimoli. Se i passaggi riempiono la maggior parte del display, la calibrazione deve utilizzare una formazione a 9 punti (in alto a sinistra, in alto a centro, in alto a destra, al centro sinistro, al centro, al centro, in basso a sinistra). Se nel centro verticale del display viene presentata una sola riga di testo, l’intervallo di calibrazione potrebbe essere ridotto alla regione centrale del display. Durante la calibrazione, istruisci i partecipanti a fissare ogni punto fino a quando non scompare e cerca di non prevedere i movimenti del punto. Se i partecipanti spostano gli occhi nel tentativo di prevedere la posizione successiva del punto, il movimento del punto può essere controllato manualmente per garantire che i partecipanti fissino ogni punto prima che venga visualizzato il punto successivo. Convalidare la calibrazione. Durante la convalida, i partecipanti fissano gli stessi nove punti della calibrazione. Le posizioni di fissazione calcolate vengono quindi confrontate con le posizioni di fissazione note per determinare il grado di errore visivo nelle posizioni di fissazione calcolate. A questo punto il software visualizza informazioni sul grado di errore visivo per ogni punto di fissazione, sull’errore medio in tutti i punti e sull’errore massimo in tutti i punti. Se l’errore medio supera 0,5º di angolo visivo, è necessario controllare la configurazione dell’eye tracker e ripetere il processo di calibrazione. L’errore medio combina errori verticali e orizzontali; pertanto, un errore medio accettabile di 0,3º potrebbe, ad esempio, riflettere una combinazione di piccoli errori orizzontali e verticali, una combinazione di piccolierrori orizzontali (ad esempio 0,1º) e grandi errori verticali(ad esempio 0,6º) o un modello variabile di errori. Di conseguenza, i ricercatori dovrebbero esaminare lo spostamento orizzontale e verticale per ogni punto di calibrazione e stabilire una soglia di errore accettabile in base all’esperimento in corso. Ad esempio, se gli stimoli sono frasi a riga singola che appariranno al centro dello schermo, la precisione verticale è meno importante perché c’è solo una riga di testo. L’esempio precedente di errori orizzontali di 0,1º e 0,6º di errori verticali potrebbe essere accettabile per i display a riga singola. Quando si utilizzano passaggi su più linee, la precisione verticale e orizzontale sono entrambe fondamentali. Iniziare l’esperimento dopo aver ottenuto una calibrazione accettabile. Istruisi i partecipanti a non parlare quando vengono visualizzati gli stimoli. Parlare fa sì che la testa si muova su e giù quando si appoggia sul poggiamento del mento e questo diminuisce la precisione di tracciamento oculare. Inizia presentando un piccolo numero di prove di pratica in modo che i partecipanti si sentisero a proprio agio con l’eye tracker, il controller di risposta (se usato) e il formato degli stimoli. Prima di ogni prova viene visualizzato un punto di fissazione (spesso chiamato punto di correzione della deriva) in cui si trova la prima parola del testo. Istruisi i partecipanti a fissare il punto di correzione della deriva prima di ogni prova. Se l’errore visivo durante la correzione del punto di correzione della deriva supera l’errore massimo consentito (0,5º), il sistema non consentirà l’inizio della prova. A questo punto è necessaria una ricalibrazione. Ciò garantisce una traccia costantemente accurata durante l’esperimento. La ricalibrazione richiede in genere meno di un minuto perché il sistema è già impostato per tenere traccia degli occhi dei partecipanti. Chiedi ai partecipanti se hanno domande dopo aver completato le prove di pratica. I partecipanti devono rimuovere la testa dal riposo fronte/mento per porre domande. La precisione di tracciamento deve essere ricontrollata dopo che i partecipanti sono tornati al riposo fronte/mento perché le loro teste non saranno esattamente nella stessa posizione. Questo può essere fatto facendo esaminare ai partecipanti il punto di correzione della deriva e confrontando la posizione calcolata con la posizione effettiva, che viene visualizzata sul monitor dello sperimentatore. Per la maggior parte dei partecipanti, la ricalibrazione in genere non è necessaria dopo essere tornati alla fronte / riposo del mento. Se in qualsiasi momento i partecipanti devono fare una pausa o la qualità della pista si è degradata (di solito a causa del riposizionamento dei partecipanti sulla sedia), la calibrazione deve essere controllata e la ricalibrazione eseguita secondo necessità. I partecipanti tendono a rilassare i loro posti a sedere (slouch) durante un esperimento, che può cambiare l’angolo della testa. Ciò può ridurre la precisione di tracciamento e portare alla necessità di ricalibrare. Includere brevi pause ogni 15-20 minuti in esperimenti più lunghi riduce al minimo questo problema. I partecipanti devono essere interrogati dopo aver completato l’esperimento.

Representative Results

Possono essere analizzati più aspetti dei movimenti oculari, che sono spesso classificati come misure globali e locali. Le misure globali riflettono il comportamento del movimento degli occhi in un’intera prova, ad esempio il tempo di lettura complessivo, la durata media di fissazione per tutte le parole e il numero totale di fissazioni (sia in avanti che regressive). Le misure locali riflettono il comportamento del movimento degli occhi per una parola bersaglio specifica o un insieme di parole bersaglio (come le parole nelle metafore) e sono indicate come regioni di interesse. Le misure locali includono i tempi di fissazione per le parole di destinazione, la probabilità di fissare le parole di destinazione, il numero di fissazioni sulle parole di destinazione e il numero di regressioni per le parole di destinazione, per citane alcune. Inoltre, le misure locali sono spesso discusse in termini di prima esecuzione, seconda esecuzione e tempo totale. La prima esecuzione (chiamata anche primo passaggio) si riferisce alle correzioni effettuate su una parola di destinazione prima di passare a un’altra parola. Questo può essere pensato come il primo incontro con la parola di destinazione. La seconda esecuzione (chiamata anche secondo passaggio) si riferisce alle correzioni effettuate su una parola di destinazione dopo aver lasciato inizialmente la parola di destinazione. Queste sono generalmente regressioni alle parole di destinazione. Il tempo totale include tutte le correzioni effettuate sulle parole di destinazione (tutte le esecuzioni combinate). Misure più complesse vengono utilizzate anche per valutare i tempi di elaborazione e i modelli di movimento degli occhi, come la durata del percorso di regressione, che è definito come il tempo totale dall’incontro iniziale di una parola allo spostamento alla parola successiva. Ad esempio, se un lettore (1) fissava l’ultima parola in una metafora, (2) tornava a fissare la prima parola nella metafora, (3) fissava di nuovo l’ultima parola, e poi (4) fissava la prima parola nella frase successiva, la durata del percorso di regressione includerebbe le prime tre fissazioni in questo esempio. I movimenti oculari di una prova campione sono presentati nella figura 2. I cerchi rappresentano posizioni di fissazione e le linee gialle rappresentano saccades, che mostrano come il lettore si è spostato da una parola all’altra. La difficoltà di elaborazione extra associata alla metafora può essere vista dalla densità delle fissazioni sulla metafora. Le fissazioni possono essere raggruppate per regioni di interesse(ad esempio parole nelle metafore) per determinare quanto tempo è stato speso per ogni parola e il numero di fissazioni fatte su ogni parola per metafore familiari e sconosciute. I risultati mostrati nella figura 3 dimostrano che è stato trascorso più tempo a elaborare le due parole di contenuto chiave in metafore sconosciute che in metafore familiari. I vantaggi della registrazione dei movimenti oculari rispetto ai tempi di lettura per un intero passaggio o i tempi di lettura frase per frase possono essere visti nelle figure 2 e 3. Ad esempio, ci sono cinque correzioni sulla regione metaforica (Figura 2), tre fissazioni in avanti e due fissazioni regressive, che riflettono il lettore che legge attraverso la metafora “porta” e poi ritorna (regredendo) a “grado”. In sostanza, la metafora è stata letta due volte. Questo risultato passa inosservato se si misurano solo i tempi di lettura delle frasi o i tempi di lettura complessivi. Come secondo esempio, la Figura 3 mostra che è stato trascorso più tempo a leggere l’ultima parola della metafora rispetto alle altre tre parole della metafora, e che il tempo di lettura era più veloce per metafore familiari che sconosciute per tre delle quattro parole nelle metafore. Misurare i tempi di lettura frase per frase indicherebbe tempi di lettura più lunghi per frasi contenenti metafore familiari rispetto a metafore sconosciute, ma sarebbe impossibile sapere se il tempo di lettura extra fosse distribuito su tutte le parole della metafora o fosse limitato a parole specifiche, e quanto tempo è stato speso per ogni parola sarebbe sconosciuto. Questi due esempi mostrano il vantaggio di registrare un comportamento di lettura online continuo. Figura 1. L’immagine a sinistra mostra un partecipante posizionato sul poggiatesta/mento mentre guarda il display di un computer. La sorgente luminosa a infrarossi e la videocamera si trovano sotto il display. L’immagine giusta mostra la visualizzazione dello sperimentatore. L’immagine di grandi dimensioni nella cornice superiore mostra il volto del partecipante intorno all’occhio destro (l’occhio monitorato) e la piccola immagine mostra un primo piano dell’occhio destro. Le aree blu sono aree di alta riflessione della luce infrarossa dai capelli del partecipante (immagine grande) e pupilla (piccola immagine). I peli incrociati sopra l’occhio identificano il centro della pupilla e il riflesso corneale vicino al fondo della pupilla. Clicca qui per visualizzare l’immagine più grande. Figura 2. Movimenti oculari da un passaggio campione contenente una metaforasconosciuta (una laurea è una porta). I cerchi indicano le posizioni di fissazione e le linee gialle indicano i tracciati saccade. I cerchi più grandi rappresentano fissazioni di durata più lunga. I piccoli numeri accanto ai cerchi indicano la durata di fissazione in millisecondi (msec). Gli spazi vuoti (nessuna linea saccade, ad esempio tra le parole molte persone) indicano punti in cui si è verificata una perdita di traccia a causa di un artefatto come soggetti che chiudono momentaneamente gli occhi. La figura mostra una regressione da porta a grado all’interno della metafora. Figura 3. Durata totale di fissazione (msec) sulle parole in metafore familiari e sconosciute. Le parole nell’asse orizzontale corrispondono alle metafore familiari (F) e sconosciute (U) del campione. I dati rappresentano una media di 10 metafore familiari e 10 sconosciute.

Discussion

I progressi tecnologici hanno portato alla disponibilità di sistemi di tracciamento oculare altamente accurati, affidabili e facili da usare. Nel campo della ricerca linguistica, il monitoraggio dei movimenti oculari consente ai ricercatori di determinare come i lettori valutano un testo. I modelli di fissazione possono essere usati per determinare quali parti di un testo sono più difficili da elaborare o sono più facili da elaborare, quali parti di un testo possono essere comprese con una singola fissazione e quali parti richiedono più correzioni o regressioni e la sequenza in cui i lettori elaborano il testo. Insieme, queste misure supportano le conclusioni sui processi cognitivi coinvolti nella comprensione del testo.

La comprensione si basa su un’interazione tra le informazioni contenute in un testo e le capacità cognitive e le conoscenze applicate dal lettore; pertanto, una comprensione completa della comprensione del testo può essere ottenuta solo utilizzando una misura di elaborazione sensibile alle proprietà del testo e alle caratteristiche del lettore. Come notato in precedenza, i movimenti oculari variano in base alle caratteristiche linguistiche, come la frequenza delle parole, la lunghezza delle parole e lacomplessità delle frasi 1,2, 7,10,11e le caratteristiche del lettore, come la capacità di lettura e la conoscenza degliargomenti 1,9. Pertanto, i movimenti oculari forniscono una misura ideale della comprensione del testo.

Poiché i movimenti oculari variano in base a molte caratteristiche linguistiche, il controllo preciso degli stimoli è essenziale quando si studiano i processi cognitivi coinvolti nella comprensione del testo. I ricercatori spesso si sforzano di sviluppare stimoli controllati quanto è necessario per condurre l’esperimento reale. In effetti, la ricerca è buona solo quanto gli stimoli.

Le metodologie di tracciamento oculare possono fornire dati preziosi per qualsiasi campo di ricerca in cui ai partecipanti vengono mostrati stimoli visivi e sono tenuti a valutare gli stimoli. Ad esempio, nel campo della pubblicità, si potrebbero determinare quali parti di un annuncio visivo attirano più attenzione misurando quali parti dell’annuncio le persone guardanoal massimo 5,8. Nella ricerca medica, si potrebbe determinare se stagisti e medici esperti valutano un’immagine a raggi X o risonanza magnetica allo stesso modo osservando il percorso di scansione del movimento degli occhi e quanto tempo viene speso per valutare le strutture fisiche critiche15. In questi esempi il modello dei movimenti oculari indica quali parti dell’immagine attirano l’attenzione della persona che visualizza l’immagine.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Desideriamo ringraziare tutti coloro che hanno partecipato alla ricerca condotta nel Language Research Lab dell’Università dell’Illinois a Chicago. Ringraziamo anche Frances Daniel, che ha contribuito a sviluppare i programmi utilizzati per raccogliere i dati presentati qui.

Materials

Eye Tracker SR Research Ltd. EyeLink 1000 Remote Desktop model
Experiment Control Software SR Research Ltd. Experimental Builder
Eye Movement Evaluation Software SR Research Ltd. Data Viewer

References

  1. Ashby, J., Rayner, K., Clifton, C. Eye movements of highly skilled and average readers: Differential effects of frequency and predictability. Q. J. Exp. Psychol.. 58A, 1065-1086 (2005).
  2. Binder, K. S., Morris, R. K. An eye-movement analysis of ambiguity resolution: Beyond meaning access. Discourse Processes. 48, 305-330 (2011).
  3. Bowdle, B., Gentner, D. The career of metaphor. Psychol. Rev. 112, 193-216 (2005).
  4. Campbell, S. J., Raney, G. E. Life Is A Pencil: Using Eye Tracking to Explore Metaphor Processing. , (2011).
  5. Drèze, X., Hussherr, F. Internet advertising: Is anybody watching. J. Interact. Marketing. 17, 8-23 (2003).
  6. Glucksberg, S. The psycholinguistics of metaphor. TRENDS Cogn. Sci. 7, 92-96 (2003).
  7. Juhasz, B. J. The processing of compound words in English: Effects of word length on eye movements during reading. Lang. Cogn. Process. 23, 1057-1088 (2008).
  8. Lohse, G. L. Consumer Eye movement patterns on yellow pages advertising. J. Advert. 26, 61-73 (1997).
  9. Kaakinen, J. K., Hyn, J. Perspective effects in repeated reading: An eye movement study. Mem. Cogn. 35, 1323-1336 (2007).
  10. Raney, G. E., Rayner, K. Word frequency effects and eye movements during two readings of a text. Can. J. Exp. Psychol. 49, 151-172 (1995).
  11. Rayner, K., Raney, G. E. Eye movement control in reading and visual search: Effects of word frequency. Psychonomic Bull. Rev. 3, 245-248 (1996).
  12. Rayner, K., Raney, G. E., Pollatsek, A., Lorch, R. F., O’Brien, E. J. . Ch. 1. Eye movements and discourse processing. , 9-36 (1995).
  13. Rayner, K., Pollatsek, A., Ashby, J., Clifton, C. . Ch. 4. Psychology of Reading.. , 91-134 (2012).
  14. Rayner, K., Reichle, E. D., Stroud, M. J., Williams, C. C., Pollatsek, A. The effect of word frequency, word predictability, and font difficulty on the eye movements of young and older readers. Psychol. Aging. 21, 448-465 (2006).
  15. Yang, G. Z., Dempere-Marco, L., Hu, X. P., Rowe, A. Visual search: Psychophysical models and practical applications. Image Vis. Comput. 20, 291-305 (2002).

Play Video

Cite This Article
Raney, G. E., Campbell, S. J., Bovee, J. C. Using Eye Movements to Evaluate the Cognitive Processes Involved in Text Comprehension. J. Vis. Exp. (83), e50780, doi:10.3791/50780 (2014).

View Video