Summary

نموذج التدريب والاختبار القائم على الحفظ للتعرف القوي على الهوية الصوتية في الكلام التعبيري باستخدام تحليل الإمكانات المتعلقة بالحدث

Published: August 09, 2024
doi:

Summary

تقدم الدراسة نموذج اختبار التدريب للتحقيق في الآثار القديمة / الجديدة للإمكانات المتعلقة بالحدث في سيناريوهات عروضية واثقة ومشكوك فيها. تكشف البيانات عن مكون إيجابي متأخر محسن بين 400-850 مللي ثانية في Pz والأقطاب الكهربائية الأخرى. يمكن لخط الأنابيب هذا استكشاف عوامل تتجاوز علم الكلام وتأثيرها على تحديد الهدف المرتبط بالإشارة.

Abstract

يعد التعرف على المتحدثين المألوفين من التدفقات الصوتية جانبا أساسيا من التواصل اللفظي البشري. ومع ذلك ، لا يزال من غير الواضح كيف لا يزال بإمكان المستمعين تمييز هوية المتحدث في الكلام التعبيري. تطور هذه الدراسة نهجا قائما على الحفظ للتعرف على هوية المتحدث الفردي وخط أنابيب تحليل بيانات مخطط كهربية الدماغ (EEG) المصاحب ، والذي يراقب كيفية تعرف المستمعين على المتحدثين المألوفين والتمييز بين المتحدثين غير المألوفين. تلتقط بيانات EEG العمليات المعرفية عبر الإنترنت أثناء التمييز بين المتحدث الجديد والقديم بناء على الصوت ، مما يوفر مقياسا في الوقت الفعلي لنشاط الدماغ ، ويتغلب على حدود أوقات رد الفعل وقياسات الدقة. ويتألف النموذج من ثلاث خطوات: ينشئ المستمعون ارتباطات بين ثلاثة أصوات وأسمائهم (التدريب)؛ ويقوم المستمعون بالربط بين ثلاثة أصوات وأسمائهم (التدريب)؛ ويقوم المستمعون بالربط بين ثلاثة أصوات وأسمائهم (التدريب)؛ ويقوم المستمعون بالربط بين ثلاثة أصوات وأسمائهم (التدريب يشير المستمعون إلى الاسم المقابل لصوت من ثلاثة مرشحين (التحقق) ؛ يميز المستمعون بين ثلاثة أصوات قديمة وثلاثة أصوات جديدة في مهمة الاختيار القسري البديلة (الاختبار). كان عرض الكلام في الاختبار إما واثقا أو مشكوكا فيه. تم جمع بيانات EEG باستخدام نظام EEG المكون من 64 قناة ، تليها المعالجة المسبقة واستيرادها إلى RStudio لتخطيط موارد المؤسسات والتحليل الإحصائي و MATLAB لتضاريس الدماغ. أظهرت النتائج أن المكون الإيجابي المتأخر الموسع (LPC) قد تم استنباطه في المتكلم القديم مقارنة بحالة المتكلم الجديد في نافذة 400-850 مللي ثانية في Pz ومجموعة أخرى واسعة من الأقطاب الكهربائية في كلا العرضين. ومع ذلك ، كان التأثير القديم / الجديد قويا في الأقطاب الكهربائية المركزية والخلفية للإدراك الإيجابي المشكوك فيه ، في حين أن الأقطاب الكهربائية الأمامية والمركزية والخلفية مخصصة لحالة العروض الواثقة. تقترح هذه الدراسة أن تصميم التجربة هذا يمكن أن يكون بمثابة مرجع للتحقيق في تأثيرات ربط الإشارات الخاصة بالمتحدث في سيناريوهات مختلفة (على سبيل المثال ، التعبير المجازي) والأمراض في مرضى مثل phonagnosia.

Introduction

التدفقات الصوتية البشرية غنية بالمعلومات ، مثل العاطفة 1,2 ، والحالة الصحية 3,4 ، والجنس البيولوجي5 ، وسن6 ، والأهم من ذلك ، الهوية الصوتية الفردية 7,8. أشارت الدراسات إلى أن المستمعين البشريين لديهم قدرة قوية على التعرف على هويات أقرانهم وتمييزها من خلال الأصوات ، والتغلب على الاختلافات داخل المتحدث حول التمثيل القائم على متوسط هوية المتحدث في الفضاء الصوتي9. تحدث هذه الاختلافات عن طريق التلاعب الصوتي (التردد الأساسي وطول المسالك الصوتية ، أي F0 و VTL) الذي لا يتوافق مع النوايا البراغماتيةالواضحة 9 ، وعروض العاطفة10 ، والثقة الصوتية التي تنقل شعور المتحدثين بمعرفة11. ركزت التجارب السلوكية على العديد من العوامل التي تؤثر على أداء المستمعين في التعرف على المتحدثين ، بما في ذلك التلاعب المرتبط باللغة8،12،13 ، والخصائص المتعلقة بالمشاركين مثل تجربة الموسيقى أو القدرة على القراءة14،15 ، والتكيفات المتعلقة بالمحفزات مثل الكلام العكسي أو اللاكلمات16،17 ؛ يمكن العثور على المزيد في مراجعات الأدبيات18,19. حققت بعض التجارب الحديثة في كيفية تقويض الاختلاف الفردي لتمثيل هوية المتحدث دقة التعرف ، مع الأخذ في الاعتبار الجوانب بما في ذلك التعبير العاطفي المرتفع مقابل المنخفض16 والعروض المحايدة مقابل العروض المخيفة5 ؛ المزيد من السيناريوهات المحتملة مفتوحة لمزيد من التحقيق ، على النحو المقترح في مراجعة20.

بالنسبة للفجوة البحثية الأولى ، تقترح الدراسة أن الأسس العصبية لتحديد المتحدث لم تستكشف بعد بشكل كامل كيف يتحدى الاختلاف داخل المتحدث أنشطة دماغ المستمعين. على سبيل المثال ، في مهمة التعرف على المتحدث المستندة إلى التصوير بالرنين المغناطيسي الوظيفي بواسطة Zäske et al. ، أظهر التلفيف الصدغي العلوي الخلفي الأيمن للمشاركين (pSTG) ، والتلفيف الجبهي السفلي / الأوسط الأيمن (IFG / MFG) ، والتلفيف الجبهي الإنسي الأيمن ، والمذنب الأيسر تنشيطا منخفضا عند تحديده بشكل صحيح على أنه متحدث قديم مقابل متحدث جديد ، بغض النظر عن كون المحتوى اللغوي متماثلا أو مختلفا21. ومع ذلك ، فإن دراسة سابقة لتخطيط كهربية الدماغ (EEG) أجراها Zäske et al. لم تلاحظ هذا التأثير القديم / الجديد عندما تم تقديم اختلاف هوية المتحدث من خلال نصوص مختلفة22. على وجه التحديد ، كان المكون الإيجابي الأكبر والمتأخر (LPC) الذي يتراوح من 300 إلى 700 مللي ثانية ، والذي تم اكتشافه عند قطب Pz عندما واجه المستمعون متحدثهم المدرب المألوف الذي يعبر عن نفس النص (أي سماع إعادة بمحتوى لغوي غير متنوع) ، غائبا عندما قدم المتحدثون نصوصا جديدة.

دعما للتأكيد الذي قدمه Zäske et al.21 ، تشك هذه الدراسة في أنه لا يزال من الممكن ملاحظة تأثير قديم / جديد على الرغم من الاختلافات في المحتوى اللغوي بين جلسات التدريب والاختبار في تحليلات الإمكانات المتعلقة بالحدث (ERP). ينبع هذا الأساس المنطقي من فكرة أن غياب التأثير القديم / الجديد في Zäske et al.22 ، في ظل ظروف تم فيها استخدام نصوص مختلفة ، يمكن أن يعزى إلى عدم وجود جلسة فحص إضافية أثناء مهمة التدريب لضمان تعلم الهوية الشامل والفعال ، على النحو الذي اقترحه Lavan et al.23. وبالتالي ، فإن الهدف الأول من الدراسة هو فحص هذه الفرضية والتحقق من صحتها. تهدف هذه الدراسة إلى اختبار ذلك عن طريق إضافة جلسة فحص إلى نموذج اختبار التدريب22.

سؤال رئيسي آخر تهدف هذه الدراسة إلى معالجته هو قوة تحديد المتحدث في وجود عروض الكلام. اقترحت الدراسات السلوكية السابقة أن المستمعين يكافحون بشكل خاص للتعرف على المتحدثين عبر عروض مختلفة ، مما يشير إلى الدور التعديلي للسياق الإيجابي – كان أداء المستمعين ضعيفا في ظروف العروض المختلفة لاختبار التدريب. تهدف هذه الدراسة إلى اختبار ذلك من خلال تعريض المستمعين للتعرف على المتحدثين المألوفين إما في العروض الواثقة أو المشكوك فيها24. تتوقع هذه الدراسة أن تساعد الاختلافات المرصودة في تخطيط موارد المؤسسات في تفسير كيفية تأثير عروض الكلام على التعرف على الهوية.

الهدف الأساسي من الدراسة الحالية هو التحقيق في قوة التأثير القديم / الجديد في التعرف على المتحدث ، وتحديدا فحص ما إذا كانت هناك اختلافات في التعرف على المتحدثين في العروض الواثقة مقابل المشكوك فيها. أجرى شو وأرموني10 دراسة سلوكية باستخدام نموذج اختبار التدريب ، وتشير النتائج التي توصلوا إليها إلى أن المستمعين لا يمكنهم التغلب على الاختلافات العروضية (على سبيل المثال ، تم تدريبهم على التعرف على المتكلم في علم العروض المحايد واختباره على علم العروض المخيف) ويمكنهم فقط تحقيق دقة أقل من مستوىالصدفة 10. يشير التحليل الصوتي إلى أن المتحدثين الذين يعبرون عن حالات عاطفية متنوعة يرتبطون بتعديل VTL / F0 ؛ على سبيل المثال ، يتميز علم العروض الواثق بطول VTL وانخفاض F0 ، في حين أن العكس صحيح بالنسبة للعروض المشكوك فيها11,24. يأتي دليل آخر من الدراسة التي أجراها Lavan et al.23 ، والتي أكدت أن المستمعين يمكنهم التكيف مع تغييرات VTL و F0 للمتحدث وتشكيل تمثيلات متوسطة للمتكلمين. توفق هذه الدراسة بين أنه ، من منظور البيانات السلوكية ، من المرجح أن يظل المستمعون يتعرفون على هوية المتكلم عبر العروض (على سبيل المثال ، تم تدريبهم على التعرف على واحد في علم العروض الواثق ولكن تم اختباره في علم العروض المشكوك فيه ؛ تم الإبلاغ عنه في مخطوطة منفصلة قيد الإعداد). ومع ذلك ، فإن الارتباطات العصبية لتحديد المتحدث ، وتحديدا قابلية تعميم التأثير القديم / الجديد الذي لاحظه Zäske et al.22 ، لا تزال غير واضحة. ومن ثم ، فإن الدراسة الحالية ملتزمة بالتحقق من متانة التأثير القديم / الجديد في العروض الواثقة مقابل المشكوك فيها كسياقات للاختبار.

تقدم الدراسة خروجا عن نماذج البحث السابقة في دراسات التأثيرات القديمة / الجديدة. بينما ركزت الأبحاث السابقة على كيفية تأثير التعرف على المتكلم القديم / الجديد على الإدراك ، فإن هذه الدراسة توسع هذا من خلال دمج مستويين من الثقة (الثقة مقابل الشك) في النموذج (وبالتالي ، دراسة 2 + 2). هذا يسمح لنا بالتحقيق في التعرف على المتحدث في سياقات عروض الكلام الواثقة والمشكوك فيها. يتيح النموذج استكشاف متانة التأثيرات القديمة / الجديدة. تعمل تحليلات تأثيرات الذاكرة ومناطق الاهتمام (ROI) ضمن سياقات الكلام الواثقة والمشكوك فيها كدليل على هذا التحقيق.

إجمالا ، تهدف الدراسة إلى تحديث فهم ارتباطات EEG للتعرف على الصوت ، مع الفرضيات القائلة بأن LPC الموسع لتأثير EEG القديم / الجديد يمكن ملاحظته حتى عندما يكون 1) المحتوى اللغوي ليس هو نفسه ، و 2) مع وجود عروض واثقة مقابل مشكوك فيها. بحثت هذه الدراسة في الفرضيات من خلال نموذج من ثلاث خطوات. أولا ، خلال مرحلة التدريب ، أنشأ المشاركون ارتباطات بين ثلاثة أصوات وأسمائهم المقابلة. بعد ذلك ، في مرحلة التحقق ، تم تكليفهم بتحديد الاسم المقابل لصوت من مجموعة مختارة من ثلاثة مرشحين. يهدف هذا الفحص ، بعد Lavan et al.23 ، إلى التغلب على عدم كفاية التعرف على المتحدث القديم ، مما أدى إلى التأثير القديم / الجديد غير الملحوظ عندما اختلف النص في مرحلتي التدريب والاختبار6 ، ولم يتمكن المتحدثون من التعرف على المتحدثين عبر العروض المحايدة والمخيفة10. أخيرا ، في مرحلة الاختبار ، ميز المشاركون بين ثلاثة أصوات قديمة وثلاثة أصوات جديدة في مهمة الاختيار القسري البديلة ، مع تقديم عروض الكلام على أنها إما واثقة أو مشكوك فيها. تم جمع بيانات EEG باستخدام نظام EEG المكون من 64 قناة وخضعت للمعالجة المسبقة قبل التحليل. تم إجراء التحليل الإحصائي وتحليل الإمكانات المرتبطة بالحدث (ERP) في RStudio ، بينما تم استخدام MATLAB لتحليل طبوغرافيا الدماغ.

فيما يتعلق بتفاصيل التصميم ، تقترح هذه الدراسة تجربة تعلم هوية المتحدث التي تتحكم في ارتفاع المتكلم ، والذي يرتبط ب VTL ويؤثر على انطباعات من يتحدث23. يؤثر هذا الجانب أيضا على الانطباعات الاجتماعية ، مثل الهيمنة المتصورة25 ، وقد يتفاعل تكوين الانطباع عالي المستوى هذا مع فك تشفير هوية المتحدث26.

Protocol

وافقت لجنة الأخلاقيات التابعة لمعهد اللغويات بجامعة شنغهاي للدراسات الدولية على تصميم التجربة الموضح أدناه. تم الحصول على موافقة مستنيرة من جميع المشاركين لهذه الدراسة. 1. إعداد المكتبة الصوتية والتحقق من صحتها تسجيل الصوت وتحريرهقم بإنشاء قاعدة بيانات…

Representative Results

يتميز التأثير القديم / الجديد الكلاسيكي بزيادة كبيرة في نشاط دماغ المستمعين على قطب Pz (بين 300 إلى 700 مللي ثانية) عندما يتطابق محتوى الكلام في جلسة الاختبار مع محتوى جلسة التدريب ، خاصة في حالة المتكلم القديم مقارنة بحالة المتكلم الجديد22. يكشف البروتوكول النقاب عن نسخة محدثة من ?…

Discussion

تقدم الدراسة خط أنابيب لجمع بيانات EEG وتحليلها ، مع التركيز على التعرف على هويات المتحدثين التي تم تعلمها مسبقا. تتناول هذه الدراسة الاختلافات بين مرحلتي التعلم والتعرف ، بما في ذلك الاختلافات في محتوى الكلام22 وعلم العروض10. التصميم قابل للتكيف مع مجموعة من مجالا?…

Divulgations

The authors have nothing to disclose.

Acknowledgements

وحظي هذا العمل بدعم مؤسسة العلوم الطبيعية في الصين (المنحة رقم 31971037)؛ برنامج شوغوانغ المدعوم من مؤسسة شنغهاي لتطوير التعليم ولجنة التعليم في بلدية شنغهاي (المنحة رقم 20SG31)؛ مؤسسة العلوم الطبيعية في شنغهاي (22ZR1460200) ؛ برنامج توجيه المشرف بجامعة شنغهاي للدراسات الدولية (2022113001) ؛ والبرنامج الرئيسي للمؤسسة الوطنية للعلوم الاجتماعية في الصين (المنحة رقم 18ZDA293).

Materials

64Ch Standard BrainCap for BrainAmp Easycap GmbH Steingrabenstrasse 14 DE-82211 https://shop.easycap.de/products/64ch-standard-braincap
Abrasive Electrolyte-Gel Easycap GmbH Abralyt 2000 https://shop.easycap.de/products/abralyt-2000
actiCHamp Plus Brain Products GmbH 64 channels + 8 AUX https://www.brainproducts.com/solutions/actichamp/
Audio Interface Native Instruments GmbH Komplete audio 6 https://www.native-instruments.com/en/products/komplete/audio-interfaces/komplete-audio-6/
Foam Eartips Neuronix ER3-14  https://neuronix.ca/products/er3-14-foam-eartips
Gel-based passive electrode system Brain Products GmbH BC 01453 https://www.brainproducts.com/solutions/braincap/
High-Viscosity Electrolyte Gel  Easycap GmbH SuperVisc https://shop.easycap.de/products/supervisc

References

  1. Larrouy-Maestri, P., Poeppel, D., Pell, M. D. The sound of emotional prosody: Nearly 3 decades of research and future directions. Perspect Psychol Sci. , 17456916231217722 (2024).
  2. Pell, M. D., Kotz, S. A. Comment: The next frontier: Prosody research gets interpersonal. Emotion Rev. 13 (1), 51-56 (2021).
  3. Cummins, N., et al. Multilingual markers of depression in remotely collected speech samples: A preliminary analysis. J Affect Disor. 341, 128-136 (2023).
  4. Cummins, N., Baird, A., Schuller, B. W. Speech analysis for health: Current state-of-the-art and the increasing impact of deep learning. Methods. 151, 41-54 (2018).
  5. Kennedy, E., Thibeault, S. L. Voice-gender incongruence and voice health information-seeking behaviors in the transgender community. Am J Speech-language Pathol. 29 (3), 1563-1573 (2020).
  6. Zäske, R., et al. Electrophysiological correlates of voice memory for young and old speakers in young and old listeners. Neuropsychologia. 116, 215-227 (2018).
  7. Lavan, N., Burton, A. M., Scott, S. K., Mcgettigan, C. Flexible voices: Identity perception from variable vocal signals. Psychonomic Bullet Rev. 26, 90-102 (2019).
  8. Perrachione, T. K., Del Tufo, S. N., Gabrieli, J. D. Human voice recognition depends on language ability. Science. 333 (6042), 595-595 (2011).
  9. Lavan, N., Knight, S., Mcgettigan, C. Listeners form average-based representations of individual voice identities. Nat Comm. 10 (1), 2404 (2019).
  10. Xu, H., Armony, J. L. Influence of emotional prosody, content, and repetition on memory recognition of speaker identity. Quart J Exp Psychol. 74 (7), 1185-1201 (2021).
  11. Jiang, X., Pell, M. D. The sound of confidence and doubt. Speech Comm. 88, 106-126 (2017).
  12. Winters, S. J., Levi, S. V., Pisoni, D. B. Identification and discrimination of bilingual talkers across languages. J Acoustical Soci Am. 123 (6), 4524-4538 (2008).
  13. Orena, A. J., Polka, L., Theodore, R. M. Identifying bilingual talkers after a language switch: Language experience matters. J Acoustical Soc Am. 145 (4), EL303-EL309 (2019).
  14. Xie, X., Myers, E. The impact of musical training and tone language experience on talker identification. J Acoustical Soc Am. 137 (1), 419-432 (2015).
  15. Kadam, M. A., Orena, A. J., Theodore, R. M., Polka, L. Reading ability influences native and non-native voice recognition, even for unimpaired readers. J Acoustical Soc Am. 139 (1), EL6-EL12 (2016).
  16. Fleming, D., Giordano, B. L., Caldara, R., Belin, P. A language-familiarity effect for speaker discrimination without comprehension. Proc Natl Acad Sci. 111 (38), 13795-13798 (2014).
  17. White, K. S., Yee, E., Blumstein, S. E., Morgan, J. L. Adults show less sensitivity to phonetic detail in unfamiliar words, too. J Memory Lang. 68 (4), 362-378 (2013).
  18. Levi, S. Methodological considerations for interpreting the language familiarity effect in talker processing. Wiley Interdiscip Revi: Cognitive Sci. 10 (2), e1483 (2019).
  19. Perrachione, T. K., Frühholz, S., Belin, P. Recognizing Speakers Across Languages. The oxford handbook of voice perception. , 515-538 (2018).
  20. Lavan, N., Burton, A. M., Scott, S. K., Mcgettigan, C. Flexible voices: Identity perception from variable vocal signals. Psychonomic Bullet Rev. 26 (1), 90-102 (2019).
  21. Zäske, R., Hasan, B. a. S., Belin, P. It doesn’t matter what you say: Fmri correlates of voice learning and recognition independent of speech content. Cortex. 94, 100-112 (2017).
  22. Zäske, R., Volberg, G., Kovács, G., Schweinberger, S. R. Electrophysiological correlates of voice learning and recognition. J Neurosci. 34 (33), 10821-10831 (2014).
  23. Lavan, N., Knight, S., Mcgettigan, C. Listeners form average-based representations of individual voice identities. Nat Comm. 10 (1), 1-9 (2019).
  24. Chen, W., Jiang, X. Voice-Cloning Artificial-Intelligence Speakers Can Also Mimic Human-Specific Vocal Expression. Preprints. , (2023).
  25. Pisanski, K., Anikin, A., Reby, D. Vocal size exaggeration may have contributed to the origins of vocalic complexity. Philosoph Trans Royal Soc B. 377 (1841), 20200401 (2022).
  26. Belin, P., Fecteau, S., Bedard, C. Thinking the voice: Neural correlates of voice perception. Trend Cognitive Sci. 8 (3), 129-135 (2004).
  27. . Praat: doing phonetics by computer Available from: https://www.fon.hum.uva.nl/praat/ (2022)
  28. Jiang, X., Pell, M. D. On how the brain decodes vocal cues about speaker confidence. Cortex. 66, 9-34 (2015).
  29. Jiang, X., Gossack-Keenan, K., Pell, M. D. To believe or not to believe? How voice and accent information in speech alter listener impressions of trust. Quart J Exp Psychol. 73 (1), 55-79 (2020).
  30. Rigoulot, S., Pell, M. D. Seeing emotion with your ears: Emotional prosody implicitly guides visual attention to faces. PloS One. 7 (1), e30740 (2012).
  31. Cui, X., Jiang, X., Ding, H. Affective prosody guides facial emotion processing. Curr Psychol. 42 (27), 23891-23902 (2023).
  32. . Memorization-based training and testing paradigm for robust vocal identity recognition in expressive speech using event-related potentials analysis Available from: https://osf.io/6zu83/ (2024)
  33. . Brainvision recorder Available from: https://www.brainproducts.com/downloads/recorder/ (2024)
  34. Jiang, X., Paulmann, S., Robin, J., Pell, M. D. More than accuracy: Nonverbal dialects modulate the time course of vocal emotion recognition across cultures. J Exp Psychol. 41 (3), 597 (2015).
  35. Jiang, X., Pell, M. D. The feeling of another’s knowing: How "mixed messages" in speech are reconciled. J Exp Psychol. 42 (9), 1412 (2016).
  36. Zhou, X., et al. Semantic integration processes at different levels of syntactic hierarchy during sentence comprehension: An erp study. Neuropsychologia. 48 (6), 1551-1562 (2010).
  37. Jiang, X., Tan, Y., Zhou, X. Processing the universal quantifier during sentence comprehension: Erp evidence. Neuropsychologia. 47 (8-9), 1799-1815 (2009).
  38. Acunzo, D. J., Mackenzie, G., Van Rossum, M. C. W. Systematic biases in early erp and erf components as a result of high-pass filtering. J Neurosci Meth. 209 (1), 212-218 (2012).
  39. Bates, D. Fitting linear mixed models in r. R news. 5 (1), 27-30 (2005).
  40. Oostenveld, R., Fries, P., Maris, E., Schoffelen, J. M. Fieldtrip: Open source software for advanced analysis of meg, eeg, and invasive electrophysiological data. Computat Intelligence Neurosci. 2011, 1-9 (2011).
  41. Coopmans, C. W., Nieuwland, M. S. Dissociating activation and integration of discourse referents: Evidence from erps and oscillations. Cortex. 126, 83-106 (2020).
  42. Humble, D., et al. The jena voice learning and memory test (jvlmt): A standardized tool for assessing the ability to learn and recognize voices. Behavior Res Meth. 55 (3), 1352-1371 (2023).
  43. Holmes, E., To, G., Johnsrude, I. S. How long does it take for a voice to become familiar? Speech intelligibility and voice recognition are differentially sensitive to voice training. Psychol Sci. 32 (6), 903-915 (2021).
  44. Kroczek, L. O. H., Gunter, T. C. Communicative predictions can overrule linguistic priors. Sci Rep. 7 (1), 17581 (2017).
  45. Kroczek, L. O. H., Gunter, T. C. The time course of speaker-specific language processing. Cortex. 141, 311-321 (2021).
  46. Schroeger, A., et al. Atypical prosopagnosia following right hemispheric stroke: A 23-year follow-up study with mt. Cognitive Neuropsychol. 39 (3-4), 196-207 (2022).
  47. Garrido, L., et al. Developmental phonagnosia: A selective deficit of vocal identity recognition. Neuropsychologia. 47 (1), 123-131 (2009).
  48. Schelinski, S., Borowiak, K., Von Kriegstein, K. Temporal voice areas exist in autism spectrum disorder but are dysfunctional for voice identity recognition. Social Cognitive Affective Neurosci. 11 (11), 1812-1822 (2016).
  49. Holle, H., Gunter, T. C. The role of iconic gestures in speech disambiguation: Erp evidence. J Cognitive Neurosci. 19 (7), 1175-1192 (2007).
  50. Regel, S., Coulson, S., Gunter, T. C. The communicative style of a speaker can affect language comprehension? Erp evidence from the comprehension of irony. Brain Res. 1311, 121-135 (2010).
This article has been published
Video Coming Soon
Keep me updated:

.

Citer Cet Article
Chen, W., Jiang, X. Memorization-Based Training and Testing Paradigm for Robust Vocal Identity Recognition in Expressive Speech Using Event-Related Potentials Analysis. J. Vis. Exp. (210), e66913, doi:10.3791/66913 (2024).

View Video