Çalışma, kendinden emin ve şüpheli prozodik senaryolarda olayla ilgili potansiyellerin eski/yeni etkilerini araştırmak için bir eğitim-test paradigması sunmaktadır. Veriler, Pz ve diğer elektrotlarda 400-850 ms arasında gelişmiş bir geç pozitif bileşen ortaya koymaktadır. Bu boru hattı, konuşma prozodisinin ötesindeki faktörleri ve bunların işaret bağlayıcı hedef belirleme üzerindeki etkilerini keşfedebilir.
Tanıdık konuşmacıları ses akışlarından tanımak, insan sözlü iletişiminin temel bir yönüdür. Bununla birlikte, dinleyicilerin anlamlı konuşmada konuşmacının kimliğini hala nasıl ayırt edebilecekleri belirsizliğini koruyor. Bu çalışma, ezberlemeye dayalı bir bireysel konuşmacı kimlik tanıma yaklaşımı ve dinleyicilerin tanıdık konuşmacıları nasıl tanıdığını ve tanıdık olmayanları nasıl ayırt ettiğini izleyen eşlik eden bir elektroensefalogram (EEG) veri analizi hattı geliştirmektedir. EEG verileri, sese dayalı yeni ve eski konuşmacı ayrımı sırasında çevrimiçi bilişsel süreçleri yakalar, beyin aktivitesinin gerçek zamanlı bir ölçümünü sunar, reaksiyon sürelerinin sınırlarını aşar ve doğruluk ölçümleri sunar. Paradigma üç adımdan oluşur: dinleyiciler üç ses ve isimleri arasında ilişkiler kurar (eğitim); dinleyiciler, üç adaydan gelen bir sese karşılık gelen adı belirtir (kontrol edilir); Dinleyiciler, iki alternatifli zorunlu seçim görevinde (test) üç eski ve üç yeni konuşmacı sesi arasında ayrım yapar. Testteki konuşma prozodisi ya kendinden emin ya da şüpheliydi. EEG verileri 64 kanallı bir EEG sistemi kullanılarak toplandı, ardından ön işleme tabi tutuldu ve ERP ve istatistiksel analiz için RStudio’ya ve beyin topografyası için MATLAB’a aktarıldı. Sonuçlar, Pz’deki 400-850 ms’lik pencerede ve her iki prozodideki diğer daha geniş elektrot aralığındaki yeni konuşmacı durumuna kıyasla eski konuşmacıda genişlemiş bir geç pozitif bileşen (LPC) ortaya çıktığını gösterdi. Yine de, şüpheli prozodi algısı için santral ve posterior elektrotlarda eski/yeni etki sağlamken, anterior, santral ve posterior elektrotlar kendinden emin prozodi durumu içindir. Bu çalışma, bu deney tasarımının, çeşitli senaryolarda (örneğin, anaforik ifade) ve fonagnozi gibi hastalarda patolojilerde konuşmacıya özgü işaret bağlama etkilerini araştırmak için bir referans görevi görebileceğini önermektedir.
İnsan ses akışları, duygu 1,2, sağlık durumu 3,4, biyolojik cinsiyet5,yaş 6 ve daha da önemlisi bireysel ses kimliği 7,8 gibi bilgiler açısından zengindir. Araştırmalar, insan dinleyicilerin, sesler aracılığıyla akranlarının kimliklerini tanıma ve ayırt etme konusunda güçlü bir kapasiteye sahip olduklarını, konuşmacı kimliğinin akustik alandaki ortalamaya dayalı temsili etrafındaki konuşmacı içi varyasyonların üstesinden geldiklerini göstermiştir9. Bu tür varyasyonlar, net bir pragmatik niyete 9 karşılık gelmeyen akustik manipülasyon(temel frekans ve ses yolu uzunluğu, yani F0 ve VTL), duygu prozodilerine10 ve konuşmacıların bilme hissini ileten vokal güvene11 neden olur. Davranışsal deneyler, dil ile ilgili manipülasyonlar 8,12,13, müzik deneyimi veya okuma yeteneği gibi katılımcılarla ilgili özellikler14,15 ve geriye doğru konuşma veya kelime olmayanlar gibi uyaranlarla ilgili uyarlamalar16,17; Literatür incelemelerinde daha fazla bulunabilir18,19. Yakın zamanda yapılan birkaç deney, yüksek ve düşük duygusal ifade16 ve nötr ve korkulu prozodiler5 gibi yönleri göz önünde bulundurarak, konuşmacı kimlik temsilinin bireysel varyasyonunun tanıma doğruluğunu nasıl zayıflatabileceğini araştırdı; Bir gözden geçirme20 tarafından önerildiği gibi, daha fazla araştırma için daha fazla olası senaryo açıktır.
İlk araştırma boşluğu için, çalışma, konuşmacı tanımlamanın nörolojik temellerinin, konuşmacı içi varyasyonun dinleyicilerin beyin aktivitelerine nasıl meydan okuduğunu henüz tam olarak keşfetmediğini öne sürüyor. Örneğin, Zäske ve arkadaşları tarafından yapılan fMRI tabanlı bir konuşmacı tanıma görevinde, katılımcıların sağ posterior superior temporal girus (pSTG), sağ inferior/orta frontal girus (IFG/MFG), sağ medial frontal girus ve sol kaudat, dilsel içeriğin aynı veya farklı olmasına bakılmaksızın, eski ve yeni konuşmacılar olarak doğru bir şekilde tanımlandığında azalmış aktivasyon gösterdi21. Bununla birlikte, Zäske ve arkadaşları tarafından yapılan daha önceki bir elektroensefalografi (EEG) çalışması, konuşmacı kimlik varyasyonu farklı metinler aracılığıyla tanıtıldığında bu eski/yeni etkiyi gözlemlememiştir22. Spesifik olarak, 300 ila 700 ms arasında değişen daha büyük, geç pozitif bileşen (LPC), dinleyiciler aynı metni ifade eden tanıdık eğitimli konuşmacılarıyla karşılaştıklarında (yani, çeşitli olmayan dilsel içerikli bir tekrar duymak) Pz elektrodunda tespit edildi, konuşmacılar yeni metinler sunduğunda yoktu.
Zäske ve ark.21 tarafından yapılan iddiayı desteklemek için, bu çalışma, olayla ilgili potansiyel (ERP) analizlerinde eğitim ve test oturumları arasındaki dilsel içerik farklılıklarına rağmen eski/yeni bir etkinin hala gözlemlenebileceğinden şüphelenmektedir. Bu mantık, farklı metinlerin kullanıldığı koşullar altında Zäske ve ark.22’de eski/yeni etkisinin olmamasının, Lavan ve ark.23 tarafından önerildiği gibi, kapsamlı ve etkili kimlik öğrenimini sağlamak için eğitim görevi sırasında ek bir kontrol oturumunun olmamasına atfedilebileceği fikrinden kaynaklanmaktadır. Sonuç olarak, çalışmanın ilk amacı bu hipotezi incelemek ve doğrulamaktır. Bu çalışma, eğitim-test paradigması22’ye bir kontrol oturumu ekleyerek bunu test etmeyi amaçlamaktadır.
Bu çalışmanın ele almayı amaçladığı bir diğer önemli soru, konuşma prozodisi varlığında konuşmacı kimliğinin sağlamlığıdır. Önceki davranışsal çalışmalar, dinleyicilerin özellikle farklı prozodiler arasında konuşmacıları tanımakta zorlandıklarını öne sürmüştür, bu da prozodik bağlamın modülatör bir rolünü gösterir – dinleyiciler farklı eğitim-test prozodi koşullarında düşük performans gösterir. Bu çalışma, dinleyicilerin kendinden emin veya şüpheli prozodilerde tanıdık konuşmacıları tanımalarını sağlayarak bunu test etmeyi amaçlamaktadır24. Bu çalışma, gözlemlenen ERP farklılıklarının, konuşma prozodisinin kimlik tanımayı nasıl etkilediğini açıklamaya yardımcı olacağını beklemektedir.
Bu çalışmanın temel amacı, konuşmacı tanımadaki eski/yeni etkinin sağlamlığını araştırmak, özellikle kendinden emin ve şüpheli prozodilerde konuşmacıları tanımada farklılıklar olup olmadığını incelemektir. Xu ve Armony10, bir eğitim-test paradigması kullanarak davranışsal bir çalışma yaptılar ve bulguları, dinleyicilerin prozodik farklılıkların üstesinden gelemeyeceklerini (örneğin, nötr prozodideki bir konuşmacıyı tanımak için eğitilmiş ve korkulu prozodi üzerinde test edilmiş) ve yalnızca şans seviyesi10’dan daha düşük bir doğruluk elde edebileceklerini göstermektedir. Akustik analiz, çeşitli duygusal durumları ifade eden hoparlörlerin VTL/F0 modülasyonu ile ilişkili olduğunu gösterir; örneğin, kendinden emin prozodi, uzamış VTL ve daha düşük F0 ile karakterize edilirken, şüpheli prozodi11,24 için bunun tersi geçerlidir. Bir başka kanıt da Lavan ve ark.23 tarafından yapılan ve dinleyicilerin konuşmacının VTL ve F0 değişikliklerine uyum sağlayabildiğini ve konuşmacıların ortalamaya dayalı temsillerini oluşturabildiğini doğrulayan çalışmadan geliyor. Bu çalışma, davranışsal veri perspektifinden bakıldığında, dinleyicilerin prozodiler arasında konuşmacının kimliğini hala tanıma olasılığının yüksek olduğunu uzlaştırmaktadır (örneğin, kendine güvenen prozodide birini tanımak için eğitilmiş, ancak şüpheli prozodide test edilmiş; hazırlık aşamasında ayrı bir el yazmasında rapor edilmiştir). Yine de, konuşmacı tanımlamasının sinirsel bağıntıları, özellikle Zäske ve ark.22 tarafından gözlemlenen eski/yeni etkinin genelleştirilebilirliği belirsizliğini korumaktadır. Bu nedenle, mevcut çalışma, test bağlamları olarak kendinden emin ve şüpheli prozodilerde eski / yeni etkinin sağlamlığını doğrulamaya kendini adamıştır.
Çalışma, eski / yeni etki çalışmalarında önceki araştırma paradigmalarından bir ayrılma ortaya koymaktadır. Geçmiş araştırmalar, eski / yeni konuşmacı tanımanın algıyı nasıl etkilediğine odaklanırken, bu çalışma bunu paradigmaya iki güven düzeyi (kendinden emin ve şüpheli) ekleyerek genişletmektedir (bu nedenle, 2 + 2 çalışması). Bu, kendinden emin ve şüpheli konuşma prozodileri bağlamında konuşmacı tanımayı araştırmamıza olanak tanır. Paradigma, eski/yeni etkilerin sağlamlığının araştırılmasını sağlar. Hem kendinden emin hem de şüpheli konuşma bağlamlarında hafıza etkilerinin ve ilgi bölgelerinin (ROI) analizleri bu araştırma için kanıt görevi görür.
Toplamda, çalışma, EEG eski/yeni etkisinin genişlemiş LPC’sinin 1) dilsel içerik aynı olmadığında ve 2) kendinden emin ve şüpheli prozodi varlığında bile gözlemlenebilir olduğu hipotezleriyle, ses tanımanın EEG korelasyonlarının anlaşılmasını güncellemeyi amaçlamaktadır. Bu çalışmada hipotezler üç aşamalı bir paradigma ile incelenmiştir. İlk olarak, eğitim aşamasında katılımcılar üç ses ve karşılık gelen isimleri arasında ilişkiler kurdular. Daha sonra, kontrol aşamasında, üç aday arasından bir sese karşılık gelen ismi belirlemekle görevlendirildiler. Lavan ve ark.23’ü takip eden bu kontrol, eğitim ve test aşamalarındaki metninfarklı olduğu 6 ve konuşmacıların tarafsız ve korkulu prozodiler10 boyunca konuşmacıları tanıyamadığı durumlarda gözlemlenmeyen eski/yeni etkisine yol açan yetersiz eski konuşmacı aşinalığının üstesinden gelmeyi amaçlamaktadır. Son olarak, test aşamasında, katılımcılar iki alternatifli zorunlu seçim görevinde üç eski ve üç yeni konuşmacı sesi arasında ayrım yaptılar ve konuşma prozodisi kendinden emin veya şüpheli olarak sunuldu. EEG verileri 64 kanallı EEG sistemi kullanılarak toplandı ve analizden önce ön işleme tabi tutuldu. İstatistiksel analiz ve olayla ilişkili potansiyel (ERP) analizi RStudio’da yapılırken, beyin topografisi analizi için MATLAB kullanıldı.
Tasarım detayları ile ilgili olarak, bu çalışma, VTL ile ilgili olan ve kimin konuştuğuna dair izlenimleri etkileyen, konuşmacının boyunu kontrol eden bir konuşmacı kimliği öğrenme deneyi önermektedir23. Bu yön aynı zamanda algılanan baskınlık25 gibi sosyal izlenimleri de etkiler ve bu tür üst düzey izlenim oluşumu, konuşmacı kimliğinin26 kodunu çözme ile etkileşime girebilir.
Çalışma, daha önce öğrenilen konuşmacı kimliklerini tanımaya odaklanan EEG veri toplama ve analizi için bir boru hattı sunmaktadır. Bu çalışma, konuşma içeriği22 ve prozodi10’daki farklılıklar dahil olmak üzere öğrenme ve tanıma aşamaları arasındaki farklılıkları ele almaktadır. Tasarım, zamir ve anaforik işleme gibi psikodilbilim de dahil olmak üzere bir dizi araştırma alanına uyarlanabilir41.
<p class="jove…The authors have nothing to disclose.
Bu çalışma Çin Doğa Bilimleri Vakfı (Hibe No. 31971037) tarafından desteklenmiştir; Şanghay Eğitim Geliştirme Vakfı ve Şanghay Belediye Eğitim Komitesi tarafından desteklenen Shuguang Programı (Hibe No. 20SG31); Şanghay Doğa Bilimleri Vakfı (22ZR1460200); Şanghay Uluslararası Çalışmalar Üniversitesi (2022113001) Danışman Rehberlik Programı; ve Çin Ulusal Sosyal Bilimler Vakfı Ana Programı (Hibe No. 18ZDA293).
64Ch Standard BrainCap for BrainAmp | Easycap GmbH | Steingrabenstrasse 14 DE-82211 | https://shop.easycap.de/products/64ch-standard-braincap |
Abrasive Electrolyte-Gel | Easycap GmbH | Abralyt 2000 | https://shop.easycap.de/products/abralyt-2000 |
actiCHamp Plus | Brain Products GmbH | 64 channels + 8 AUX | https://www.brainproducts.com/solutions/actichamp/ |
Audio Interface | Native Instruments GmbH | Komplete audio 6 | https://www.native-instruments.com/en/products/komplete/audio-interfaces/komplete-audio-6/ |
Foam Eartips | Neuronix | ER3-14 | https://neuronix.ca/products/er3-14-foam-eartips |
Gel-based passive electrode system | Brain Products GmbH | BC 01453 | https://www.brainproducts.com/solutions/braincap/ |
High-Viscosity Electrolyte Gel | Easycap GmbH | SuperVisc | https://shop.easycap.de/products/supervisc |
.