In this paper, an experimental framework to perform closed-loop experiments is presented, in which information processing (i.e., coding and decoding) and learning of neuronal assemblies are studied during the continuous interaction with a robotic body.
Information coding in the Central Nervous System (CNS) remains unexplored. There is mounting evidence that, even at a very low level, the representation of a given stimulus might be dependent on context and history. If this is actually the case, bi-directional interactions between the brain (or if need be a reduced model of it) and sensory-motor system can shed a light on how encoding and decoding of information is performed. Here an experimental system is introduced and described in which the activity of a neuronal element (i.e., a network of neurons extracted from embryonic mammalian hippocampi) is given context and used to control the movement of an artificial agent, while environmental information is fed back to the culture as a sequence of electrical stimuli. This architecture allows a quick selection of diverse encoding, decoding, and learning algorithms to test different hypotheses on the computational properties of neuronal networks.
العديد من الميزات وظيفة الدماغ من المستحيل حاليا لتكرار في نظام اصطناعي. قدرة الدماغ لمعالجة المعلومات بسرعة الحسية المعقدة وتوليد، ردا على ذلك، الأوامر الحركية الدقيقة هي في حد ذاتها بالفعل خارج دولة من بين الفن الحالي. ولكن قدرتها على التكيف مع الظروف المختلفة من خلال التعلم من التجارب السابقة تجعل من ذلك متفوقة بشكل كبير على أنظمة التحكم المطورة الإنسان. وحتى الآن، ومحاولات لتكرار أو استغلال وقد اجتمع هذا اللدونة نجاح يذكر، وفهم الأعمال الداخلية للدماغ استعصت على فهم الباحثين. واحدة من القضايا الرئيسية في حين التحقيق في العلاقة بين الدماغ والسلوك هو عدم القدرة على الوصول بشكل صحيح كل من المتغيرات في النظام: من الناحية المثالية، وهو الإعداد التجريبية الأمثل ستسمح تسجيل والتحفيز في وقت واحد إلى أعداد كبيرة من الخلايا العصبية، والاستقرار على المدى الطويل ورصد المواقف نقاط الاشتباك العصبي والأوزان، والتحكم ثنائية directioالتفاعل نال مع البيئة. وأدت صعوبة في تتبع كل تلك المتغيرات في وقت واحد لدراسة العلاقة الدماغ السلوك في جدولين مختلفة جدا: إما مع تتصرف الحيوانات، مع عدم دفع غرامة السيطرة على الظروف التجريبية 1-7 أو مع وقطع صغيرة معزولة، مثل أجزاء من الأنسجة العصبية، مع عدم وجود نظرة شاملة للنظام 8. في الحالة الأخيرة، في حين لا يسمح الإعداد التجريبية وضعت رصد كامل لجميع المعلمات المشاركين في أعمال حتى الشبكة العصبية بسيطة، يتم توفير جيدة مفاضلة من قبل الخلايا العصبية فصلها نمت على مايكرو-الكهربائي صالحة (الاتفاقات البيئية المتعددة الأطراف) 9. تلك الأجهزة، ولدت في نهاية في 10 70، لديها العديد من المزايا تقنيات الكهربية التقليدية: أولا، وإمكانية تسجيل وتحفيز الشبكة العصبية في كثير من مواقع مختلفة في آن واحد (عادة 60 الأقطاب الكهربائية). وعلاوة على ذلك، واقتران الاتفاقات البيئية المتعددة الأطراف مع الخلايا يكاد يكون غير الغازية، والسماح للمراقبة نفس الشبكة لفترات طويلة من الزمن، تصل إلى عدة أشهر 11. الآثار الفسيولوجية للالتحفيز الكهربائي على الثقافات نأت وقد تم دراسة على نطاق واسع بفضل تلك الأجهزة، وكشف عن أن العديد من الخصائص لاحظت على مستويات أعلى (مثل، على سبيل المثال، اللدونة والعمليات ذاكرة بسيطة 12-14) يتم حفظها على الرغم من خسارة الهندسة المعمارية. خلال نمو ثقافة، تلك الشبكات تبدأ تظهر النشاط العفوي في حوالي 7 أيام في المختبر (DIV) 15،16. نشاط الشبكة يميل إلى تغيير جذري مع مزيد من النمو. أول ما جمع المسامير واحدة في رشقات نارية (في نهاية الأسبوع الثاني) 17، في وقت لاحق أنه يغير في نمط معقد للغاية من متزامنة، شبكة غير الدورية رشقات نارية 18، الذي يمثل دولة ناضجة من الشبكة. وقد اقترح 19 أن هذا السلوك متزامن، تشبه إلى حد ما تلك التي لوحظت في الجسم الحي في سجلبالجلسات على الحيوانات النوم، وينجم عن نقص المدخلات الحسية.
وحاول مقاربة مختلفة للحصول على فهم أفضل للترميز المعلومات التي تم اتخاذها عن طريق إجراء التجارب حلقة مغلقة، والتي كانت تستخدم أنواع مختلفة من الإشارات للسيطرة على التحفيز للشبكة العصبية نفسها 11،20-23. في هذه التجارب، وقد استخدمت وكيل خارجي قادر على التفاعل مع البيئة لتوليد المعلومات الحسية لتغذية الشبكة العصبية، والتي أنتجت بدورها الأوامر الحركية لآلية المستجيب. هذا يسمح الملاحظات لكيفية الخصائص الحيوية والتكيفية للأنظمة العصبية تطورت استجابة للتغيرات التي يسببها في البيئة.
والإعداد لإجراء "يجسد الفسيولوجيا العصبية" تم تطوير التجارب، حيث قاعدة بأربع عجلات الاستشعار (الروبوت البدني أو نموذجها الظاهري) يتحرك حول في الساحة ويتم تحديد الملامح سرعتها من النشاط من العصبيةنظام (أي مجموعة من السكان من الخلايا العصبية الفئران مثقف أكثر من MEA). ويتميز الروبوت من قبل التشكيلات سرعة لها عجلتين تسيطر بشكل مستقل، والقراءات الحالية من أجهزة الاستشعار عن بعد. الطبيعة الدقيقة للأجهزة الاستشعار عن بعد ليست ذات الصلة؛ أنها قد تكون الصريح أو الضمني أجهزة الاستشعار البصرية أو أجهزة الاستشعار بالموجات فوق الصوتية. بشكل واضح، لا تنطبق هذه القضية في حالة من الروبوتات الافتراضية، التي يمكن أن تصمم أجهزة الاستشعار مع أي ميزة المرجوة.
في التجارب المذكورة هنا، والروبوت المستخدم هو دائما تنفيذ الظاهري، مع 6 أجهزة الاستشعار عن بعد مشيرا في 30 °، 60 ° و 90 ° من الروبوت تسير في كلا الاتجاهين. وبلغ متوسط النشاط من أجهزة الاستشعار اليسار واليمين وثلاثة هو الدافع وراء النشاط من الثقافة البيولوجية من المعلومات التي تم جمعها من قبل هذه "فائقة أجهزة الاستشعار" (والتي سوف يكون مجرد يشار إلى "اليسار" وأجهزة استشعار "حق" في بقية هذا العمل). وبروتوعمود وصف قد يكون في الواقع تطبيقها على الروبوت البدني مع تعديلات طفيفة إلى حد ما. يتم ترميز المعلومات التي تم جمعها بواسطة الروبوت (إما فعلية أو ظاهرية) في سلسلة من المحفزات التي تستخدم للتلاعب في نشاط الشبكة العصبية البيولوجية، والتي يتم فصل جسديا من قبل الروبوت. المحفزات أنفسهم كلها متطابقة وبالتالي لا الكود أي معلومات. ما هو مهم هو تيرتها: زيادة معدل التحفيز عندما يقترب الروبوت عقبة، مع مواقع مختلفة للإنجاز ترميز المعلومات الحسية من 'عيون' اليسرى واليمنى من الروبوت. وستعمل الشبكة العصبية تقديم استجابات مختلفة إلى القطار القادم من التحفيز: مهمة خوارزمية فك التشفير هي ترجمة نشاط الشبكة مما أدى إلى أوامر تستخدم للسيطرة على عجلات الروبوت. نظرا ل"الكمال" سلوك الشبكة (أي، مع موثوقية وفصلها تماما الاستجابات لمثيرات مختلفة من الأقطاب الكهربائية)، وهذا من شأنه بالنتيجهتي في الروبوت القيادة في الساحة من دون ضرب أي عقبة. معظم الشبكات الحاضر سلوك مختلفة جدا عن المثالية، لذلك يتم إدخال بروتوكول التعلم بسيط: عند تفعيلها، وتحفيز كزازي (نوبات قصيرة من التحفيز عالية التردد، 20 هرتز التحفيز لمدة 2 ثانية، مستوحاة من البروتوكولات المذكورة في 24،25) بعد يتم تسليم الاصطدام مع عقبة. إذا كانت نتائج التحفيز كزازي في تعزيز المحليين من الاتصال بالشبكة، وهذا سوف يؤدي إلى زيادة مطردة في القدرات الملاحية للروبوت.
HyBrainWare2، وهو نسخة محسنة من برامج مخصصة نشرت في 26، هو البنية الأساسية المتقدمة للتعامل مع السيطرة على الأجهزة المختلفة للنظام (مشجعا، واقتناء البيانات وتجهيزها والتصور، والاتصالات الروبوت أو المحاكاة). وقد تم تطوير هذا البرنامج في مختبرنا ومتاح مجانا على الطلب. هذا البرنامج يوفر واجهة معمجلس الحصول على البيانات: بمجرد أن يبدأ المستخدم الحصول على البيانات من واجهة المستخدم الرسومية، البرنامج يتحكم مجلس اكتساب لبدء أخذ العينات وA / D تحويل البيانات القادمة من أقطاب تسجيل. ويمكن بعد ذلك يتم تسجيل هذه البيانات، عرض على الشاشة أو تحليلها في الوقت الحقيقي للكشف عن المسامير، وفقا للخيارات التي وضعها المستخدم (انظر القسم الداخلي للتفاصيل). وعلاوة على ذلك، في داخل البرنامج، وتعريف الترميز (ترجمة المعلومات الحسية إلى التحفيز الكهربائي) وفك التشفير (ترجمة النشاط المسجلة في الأوامر الحركية للروبوت) يجب تحديد الخوارزميات. على وجه الخصوص، والإعداد لدينا هو نسبيا سهلة الاستخدام مقارنة بأنظمة مماثلة صممت في الماضي ال 27، حيث أن جميع المتغيرات تقريبا يمكن الوصول إليها من قبل المستخدم الحق قبل بدء التجربة الفعلية، في حين يتم حفظ جميع المعلومات المسجلة تلقائيا في تنسيق متوافق مع تحليل أدوات للبيانات العصبي 28.
يصف القسم الإجراءات التالية تجربة التعلم على الثقافات قرن آمون الفئران نأت: يتم توفير جميع زراعة والمعلمات التجريبية لهذا إعداد خاص، وربما تحتاج إلى تعديل إذا كان الركيزة البيولوجية المختلفة لاستخدامه. وبالمثل، فإن تجربة وصفها يستفيد من الهندسة المعمارية حلقة مغلقة لدراسة تأثير التعلم من التحفيز كزازي، ولكن العمارة في حد ذاته هو مرنة بما فيه الكفاية لاستخدامها في دراسة ملامح مختلفة من الشبكات العصبية فصلها. تم شرحها متغيرات رئيسية من التجربة المقترحة في القسم مناقشة.
في هذه الورقة بنية العصبية الروبوتية تعتمد على وحدة تحكم العصبي (أي شبكة من الخلايا العصبية القادمة من القشرة أو الحصين من الفئران الجنينية)، توصيل ثنائية إتجاهي لالروبوت الظاهري، وتقدم. الروبوت، التي لديها أجهزة الاستشعار والعجلات، وأجبر على التحرك في الساحة ساكنة مع العقبات ويتكون مهمتها لتجنب الاصطدامات.
الجانب الأول وربما الأكثر أهمية من الإجراء الموضح هو إعداد الثقافات أنفسهم، حيث أن نسبة الفشل سوف تميل إلى أن تكون كبيرة حتى في أفضل الظروف التقنية. وصف تفصيلي للتقنيات زراعة هو، ومع ذلك، خارج نطاق العمل الحالي. كمبدأ عام، ينبغي أن يحدث التسجيلات عندما يصل معدل اطلاق شبكة على مستوى مستقر، وعادة بعد 3 أسابيع في المختبر. وهناك مؤشر تقريبي لثقافات صحية هو وجود النشاط الكهربية عفوية في العديد من تسجيل channإلس (لا يقل عن 20 قنوات أكثر من 60 متوفرة). وتتميز هذه الثقافات بدرجة عالية من الخلايا العصبية بين الاتصال. في ظل هذه الظروف، النشاط العصبي عادة ما يصبح متزامنة وبقوة، في بعض الأحيان، فإنه يعرض الأحداث صرعي، مع ارتفاعه الشديد تليها طويلة دقيقة فترات صامتة 37. كل من هذه الميزات يمثل مشكلة: سوف تزامن المفرط يجعل من المستحيل التمييز بين الاستجابات للمثيرات من أقطاب مختلفة، في حين الثقافات واظهار النشاط صرعي سوف تستجيب لحافز الأول قدم مع فورة طويل من النشاط، تليها فترة الصامتة، بغض النظر عن أي مؤثرات المتعاقبة تسليمها. كل من هذه القضايا يمكن تحسينها بشدة توظيف الثقافات منقوشة 35، حيث يتم تقسيم السكان العصبي إلى قسمين أو أكثر ضعيفة مترابطة مجموعات فرعية.
وثمة مسألة أخرى هي أن الاستجابات العصبية تعتمد بشدة على توزيع الامفيتامين واردةط 38،39. في تجربة حلقة مغلقة، والتحفيز تسليمها هي وظيفة من قراءات أجهزة الاستشعار، والتي، بدورها، هي نتيجة للحركة الروبوت، وبالتالي من الاستجابات العصبية نفسها. وهذا يعني أنه لا توجد طريقة سهلة لإنشاء مسبقا ما الاستجابات سيتم وحظ خلال التجربة الفعلية. ونتيجة لذلك، واختيار من الأقطاب الكهربائية المدخلات والمخرجات يجب أن تعتمد على تقريبية المتعاقبة. في بروتوكول صفها، وهي عملية من خطوتين (وهي الخطوات 5.5 و 6.4) ويتم تنفيذ في محاولة لتحديد خريطة الاتصال. في الخطوة الأولى، يتم تسليم تسلسل منتظم من التحفيز وتستخدم الردود على مثل هذه المحفزات لاستخلاص خريطة اتصال الأولى ومجموعة مؤقتة من القنوات تسجيل. ثم يتم استخدام هذا التكوين لأداء اختبار القيادة هو موضح في الخطوة 6.4 و تحديد القنوات تسجيل التي سيتم رصدها خلال التجربة الفعلية.
في قسم النتائج، وهو احتياط الملاحة التمثيليةوتعرض الموج وتحسينات فورية الناجمة عن إدخال نموذج التعلم. في جميع أنحاء وصف البروتوكول، وأشار إلى العديد من المتغيرات الأخرى الممكنة التجريبية. على سبيل المثال، وهما النظم الرئيسية الترميز تنفيذها في HyBrainWare2 (الخطية ومؤشر ستوكاستيك) حيث وضعت للتحقيق في دور الدقيق للتقلب مدخلات الزمني على الكود العصبي 38. في حالة الخطية، ومعدل التحفيز لحظية هي وظيفة من المعلمات المعرفة من قبل المستخدم وأجهزة استشعار الروبوت التسجيلات. في حالة العشوائية، لكل مثيل الوقت لديه الاحتمال نظرا ليتم اختيار لتقديم الحوافز. يتم احتساب هذا الاحتمال تلقائيا من قبل HyBrainWare2 ذلك أن معدلات التحفيز المتوقعة المباراة التي من الحالة الأولى. إمكانية إضافة إلى غضب يوفر الترميز الخطي الانتقال السلس بين الحالتين هو موضح أعلاه. في نفس الطريق، واستكشاف مجموعات مختلفة من المعلمات في القسم فك قد تساعد تسليط الضوء على PRECIالدور ذاته من انفجار في المختبر في الشبكات العصبية. سرعة كل عجلة من الروبوت يزيد يتناسب مع المعلمة الوزن في كل مرة يتم الكشف عن حدث في منطقة الانتاج المقابلة، في حين أن معامل الانقراض يشير وكم من الوقت، في ثوان، واحدة من المساهمات يلزم لتفقد 50٪ من قيمتها . الاضمحلال هو بسيط الأسي. وقد تم بالفعل اتخاذ تلك المتغيرات في الاعتبار في التصميم الحالي من HyBrainWare2، ولكن العديد من الفرص البحثية مفتوحة إذا يمكن إدخال تعديلات إضافية في البرنامج أو الإعداد التجريبية.
وجود قيود كبير بدلا من بروتوكول هنا وصف هو شرط للبرنامج تم تطويره العرف، HyBrainWare2 (متاح مجانا عند الطلب لجميع المستخدمين المهتمين). وقد تم تصميم هذا البرنامج لمجموعة من الأجهزة (مشجعا، لوحة الاستحواذ، مكبر للصوت MEA) لنموذج والشركة المصنعة محددة. بينما هو في الواقع من الممكن تكييفه للعمل على ديالاجهزة fferent، سيتم تحويل يستغرق بعض مهارة البرمجة. وبالمثل، تغطي الخيارات وشملت فقط مجموعة محدودة من جميع الأسئلة التجريبية التي يمكن أن يتم التحقيق من خلال هذا الإعداد. على سبيل المثال، خوارزمية الكشف عن ارتفاع تنفيذها في الهندسة المعمارية قدم (الوقت الدقيق الكشف عن ارتفاع 40) ويعرف تماما من قبل العديد من المعلمات الثابت ترميز التي تحتاج إلى أن تتغير إذا موضوع تسجيل مختلف جدا عن الشبكات العصبية فصل (على سبيل المثال، وخلايا القلب أو شرائح). وأخيرا، ويتكون بروتوكول التعلم من تسليم قصيرة، ذات تردد عال (2 ثانية من التحفيز 20 هرتز، كل نبضة التحفيز هو نفس تلك المستخدمة لتشفير المعلومات الحسية) التحفيز عقب كل ضربة عقبة. إذا كان الروبوت يضرب عقبة مع جانبها الأيمن، يتم تسليم التحفيز كزازي إلى القطب التي عادة رموز للحصول على معلومات الجانب الأيمن ويصدق الشيء نفسه لتوجيه ضربات الجانب الأيسر. هذا البروتوكول هو الثابت تلوينها ولا يمكن بالبريد تغيرت من قبل المستخدم دون تعديل الخروج البرمجيات.
في حين أن الإعداد المعروضة هنا ليس هو أول نظام يتجسد للتجارب الهجين، حلقة مغلقة 20،23،27،41،42، تركزت على تلك التي صممت في الماضي على أطروحة واحدة مدعومة ببيانات من عدد محدود من استعدادات مماثلة . من ناحية أخرى، وقد استخدم الإعداد وصفها لعدد كبير من التجارب (تم تسجيل أكثر من 100 الثقافات منذ عام 2012) مع الاستعدادات المختلفة للنمطية والأصل، في حين أن التجارب أنفسهم موجهة القضايا المختلفة (مثل تأثير التحفيز كزازي و أهمية انفجار، كما وردت في النتائج). في المستقبل القريب، من المتوقع جلسات تجريبية جديدة للتحقق من آثار دائمة على حد سواء التحفيز كزازي وحلقة مغلقة، والعلاقة بين التحفيز انتظام، ولاحظ الردود. وثمة مسألة أخرى لمعالجتها هي الصلة بين النشاط العفوي والملاحظ، معفكرة إضافة خوارزمية فك جديدة تأخذ بعين الاعتبار تاريخ النشاط الماضي والتحفيز 43.
The authors have nothing to disclose.
الكتاب نود أن بفضل دكتوراه طالب مارتا Bisio لزراعة وصيانة شبكات الخلايا العصبية على الصغير الكهربائي صفائف والدكتور مرسى ناني والدكتورة كلوديا Chiabrera من NBT-IIT للمساعدة الفنية لإجراءات تشريح والتفكك. تلقت الأبحاث الرائدة لهذه النتائج بتمويل من البرنامج الإطاري السابع للاتحاد الأوروبي (ICT-FET FP7 / 2007-2013 FET يونغ مخطط المستكشفون) بموجب اتفاقية منحة رقم 284772 BRAIN BOW ( www.brainbowproject.eu ). فإن الكتاب أود أيضا أن أشكر سيلفيا Chiappalone لمساعدتها في إنتاج الرسومات المستخدمة في المقدمة.
Name of Reagent/Material | Company |
Stimulus Generator 4002 | Multi Channel Systems |
MEA1060-Inv-BC | Multi Channel Systems |
TC02 | Multi Channel Systems |
NI 6255 Acquisition Card | National Instruments |
Microsoft Visual Studio 2008 | Microsoft |
2078P Multichannel System-National Instruments adapter board | Developed at University of Genova (Italy) |
Matlab 2010 | Mathworks |