The article shows how to use the program SpikeSorter to detect and sort spikes in extracellular recordings made with multi-electrode arrays.
Few stand-alone software applications are available for sorting spikes from recordings made with multi-electrode arrays. Ideally, an application should be user friendly with a graphical user interface, able to read data files in a variety of formats, and provide users with a flexible set of tools giving them the ability to detect and sort extracellular voltage waveforms from different units with some degree of reliability. Previously published spike sorting methods are now available in a software program, SpikeSorter, intended to provide electrophysiologists with a complete set of tools for sorting, starting from raw recorded data file and ending with the export of sorted spikes times. Procedures are automated to the extent this is currently possible. The article explains and illustrates the use of the program. A representative data file is opened, extracellular traces are filtered, events are detected and then clustered. A number of problems that commonly occur during sorting are illustrated, including the artefactual over-splitting of units due to the tendency of some units to fire spikes in pairs where the second spike is significantly smaller than the first, and over-splitting caused by slow variation in spike height over time encountered in some units. The accuracy of SpikeSorter’s performance has been tested with surrogate ground truth data and found to be comparable to that of other algorithms in current development.
أي شخص يسجل إشارات الخلية من الدماغ باستخدام أساليب أكثر تطورا من بسيطة العتبة على الانترنت والنوافذ يواجه مهمة تحديد وفصل الإشارات من الخلايا العصبية المختلفة من إشارات الجهد صاخبة التي سجلتها القطب. هذه المهمة كما هو معلوم الفرز ارتفاع. ومما يزيد من صعوبة الفرز ارتفاع بسبب عوامل مختلفة. يمكن أن الخلايا العصبية تكون قريبة جدا من بعضها بحيث تسجل الإشارات منها من قبل القطب قريب من المحتمل أن تكون متشابهة ويصعب تمييز. قد تختلف الإشارات التي تنتجها الخلايا العصبية واحدة مع مرور الوقت، ربما بسبب تحركات القطب، متغير حركية قناة الصوديوم أثناء فترات معدل إطلاق النار عالية، ودرجات متفاوتة من تفعيل المواصلة الجهد في التشعبات التي هي قريبة من القطب، أو ربما كما نتيجة للتغيرات في ولاية الدماغ. ويمكن التخفيف من هذه المشاكل باستخدام صفائف متعدد القطب (الاتفاقات البيئية المتعددة الأطراف) مع العديد من المتقاربة (20-100 ميكرون) ص تسجيل مفيدة من القنوات التي تسمح تعريف المكاني أفضل من الإشارات من الخلايا العصبية واحدة لأنها عادة ما تكون موزعة على عدة قنوات 1 و 2. ومع ذلك، هذا، جنبا إلى جنب مع حقيقة أن الإشارات الصادرة من الخلايا العصبية تنتشر على طول التداخل الكهربائي في الفضاء، لا بد من تحديد النتائج في الفضاء الأبعاد يحتمل أن تكون عالية جدا في المجموعات التي المقابلة للخلايا العصبية فريدة من نوعها. تصبح هذه المشكلة المستعصية حسابيا لأكثر من عدد قليل من القنوات الكهربائي. حتى الآن، لا يوجد المتفق عليها عموما أفضل طريقة للفرز السنبلة، على الرغم من العديد من الحلول وقد اقترحت 3، 4، 5، 6، 7، 8 و التسجيلات من الاتفاقات البيئية المتعددة الأطراف أصبحت شائعة بشكل متزايد 9،الحمار = "XREF"> 10. بسبب ارتفاع الفرز ليس غاية في حد ذاته، ولكن هو مجرد خطوة تمهيدية ضرورية قبل مزيد من تحليل البيانات، وهناك حاجة لحزمة قابلة للاستخدام سهلة من شأنها أن قراءة في ملفات تسجيل البيانات الخام وتحويلها لقطارات ارتفاع فرزها مع المستخدم والقليل المدخلات، وبسرعة وبشكل موثوق، وقت ممكن.
وتقدم هذه الورقة تعليمي لاستخدام SpikeSorter – برنامج وضع بهدف تلبية هذه الاحتياجات. ويستند البرنامج على الخوارزميات وصفها في ورقة نشرت سابقا 11 و 12 و 13. وكانت أهداف في تصميم البرنامج الذي أ) ينبغي أن يكون واجهة سهلة الاستخدام التي تتطلب القليل أو أي معرفة مسبقة من برمجة الكمبيوتر أو من ارتفاع فرز منهجية. ب) يجب أن تكون هناك حاجة إلى المكونات المتخصصة الأخرى قليلة أو عدم وجود برامج وراء أنظمة التشغيل ويندوز او لينكس القياسية. ج </em>) وينبغي أن تدعم مجموعة واسعة من صيغ بيانات لتسجيل بيانات الاستيراد والتصدير؛ د) ضرورة إدخال المستخدم أثناء يجب أن يكون الحد الأدنى الفرز، والبريد) وحدة الفرز الأوقات يجب تحجيم بطريقة معقولة، من الناحية المثالية خطيا، مع مدة التسجيل وعدد من القنوات على القطب. وتشمل الخوارزميات تنفيذها في البرنامج أ) مجموعة مرنة من استراتيجيات ما قبل المعالجة وكشف الحدث. ب) الفجوة الآلي واستراتيجية تسد الحد من البعد الذي مجموعات الطول الموجي الجهد على أساس المكونات الرئيسية (PC) التوزيعات التي تم الحصول عليها من مجموعات فرعية من القنوات المخصصة لمجموعات محددة؛ ج) التجميع الآلي للتوزيعات الكمبيوتر مع إجراء سريع التجميع على أساس خوارزمية يعني التحول 3، 14، و د) دمج البشرى الآلي جزئيا وتقسيم مجموعات لضمان أن كل غير واضح قدر الإمكان من جميع الآخرين. لثيتم إضافة الصورة مجموعة من الإجراءات التي تسمح للتقسيم اليدوي أو دمج مجموعات على أساس تفتيش التوزيعات الكمبيوتر، العابرة والسيارات correlograms القطارات ارتفاع والمؤامرات لمرة والسعة من الطول الموجي ارتفاع. تسجيلات من tetrodes، صفائف صمام رباعي، صفائف يوتا وكذلك الاتفاقات البيئية المتعددة الأطراف واحد ومتعدد عرقوب يمكن قراءة وفرزها. الحد الحالي على عدد من القنوات هو 256 ولكن يمكن زيادة هذه النسبة في المستقبل.
آخر عبر منصة تنفيذ مفتوحة المصدر، "spyke" (http://spyke.github.io)، متاح أيضا. كتبه واحد منا (MS) في بيثون وCython، يستخدم spyke نفس النهج العام كما SpikeSorter، مع بعض الاختلافات: للحد من مطالب الذاكرة، ويتم تحميل البيانات الخام في كتل صغيرة، وإلا عند الضرورة القصوى. يتم عرض مجموعات حصرا، التلاعب، وفرزها في 3D. والمكون الرئيسي وتحليل عنصر مستقل وكلاهما يستخدم أساليب متكاملة للحد من البعد. Spyke يتطلب المزيد من المستخدمين فيteraction، ولكن يعتمد بشكل كبير على لوحة المفاتيح والفأرة اختصارات وقائمة انتظار التراجع / إعادة لاستكشاف بسرعة آثار العوامل المختلفة على تجميع أي مجموعة فرعية معينة من المسامير. وتشمل هذه العوامل قناة الارتفاع والوقت اختيار النطاق، والمحاذاة السنبلة، أبعاد تجميع وعرض النطاق الترددي المكاني (سيغما) 11.
وفيما يلي وصفا موجزا للخوارزميات والاستراتيجيات المستخدمة لفرز. ويمكن الاطلاع على المزيد من أوصاف كاملة في المنشورات السابقة 11 و 12 و 13 و في الشروح التي يمكن الوصول إليها عن طريق أزرار المساعدة (التي تم تحديدها مع '؟') داخل SpikeSorter. بعد تحميل ملف الجهد خارج الخلية الخام وتصفية المكونات أدنى تردد، مرحلة أولية لنتائج الكشف عن الحدث في مجموعة من الأحداث، كل منها يتكون من الجهد لقطة وجيزة قبل وبعد وقت الحدث. إذا كان المنتخبوبما فيه الكفاية متباعدة المواقع ركب كثب (<100 ميكرون)، وسوف تظهر إشارات وحدة وحيدة عموما على العديد من القنوات المجاورة. يتم اختيار القناة المركزية آليا لكل حدث، الموافق القناة على الجهد الذي الذروة إلى الذروة من هذا الحدث هو أكبر. الفرز الآلي يبدأ من خلال تشكيل مجموعة أولية واحدة لكل قناة القطب، وتتألف من جميع الاحداث التي تم المترجمة إلى تلك القناة. وحدة تقع في منتصف الطريق بين القنوات قد تؤدي إلى طفرات أن تكون مترجمة (ربما بشكل عشوائي) لقنوات مختلفة: سيتم تحديد مجموعات من هذه مجموعتين من المسامير على أنها مماثلة واندمجت في مرحلة لاحقة. ثم يتم حساب متوسط الموجي للأحداث في كل مجموعة الأولي. هذا ويشار إلى كقالب العنقودية. يتم تعيين القنوات الفرعية لكل مجموعة على أساس سعة والانحراف المعياري للالطول الموجي النموذج على كل قناة. ثم يتم حساب القيم المكون الرئيسي لكل س مجموعة يستندن الطول الموجي على مجموعة تعيينه من القنوات. يمكن للمستخدم اختيار عدد من أبعاد المكون الرئيسي لاستخدام: عادة 2 غير كافية. ثم يتم تقسيم كل مجموعة إلى مجموعة أخرى من الكتل، وهذا يتكرر حتى لا يمكن أن يكون مزيدا من الانقسام التي تجمع الآلي.
في هذه المرحلة، مجموعة أولية من القول، 64 مجموعات من القطب 64 قناة، ويمكن تقسيمها إلى اثنين أو ثلاثة أضعاف هذا العدد، وهذا يتوقف على عدد الوحدات التي كانت موجودة في التسجيل. ولكن بسبب تعيين متغير من الأحداث من وحدة واحدة لقنوات مختلفة، وعدد من الكتل وجدت في هذه المرحلة هو تقريبا بالتأكيد أكبر مما ينبغي. المرحلة التالية من الفرز هي لتصحيح oversplitting بمقارنة أزواج من الكتل ودمج أزواج متماثلة أو إعادة توزيع الأحداث من واحد إلى آخر. ويشار إلى هذه المرحلة من الفرز باسم "دمج والانقسام".
دمج وتقسيم
لN مجموعات، هناك N * (N -1) / 2 أزواج، وبالتالي عدد أزواج ينمو كما N 2، وهو غير مرغوب فيه. ومع ذلك، فإن العديد من الأزواج يمكن استبعاد من المقارنة لأن اثنين من الزوج الأعضاء هم جسديا متباعدة. وهذا يقلل من الاعتماد على شيء ما يمت أكثر خطيا لعدد من القنوات. وعلى الرغم من هذا الاختصار، ودمج وتقسيم مرحلة يمكن أن يكون لا يزال الوقت طويلا جدا. وهو يعمل بالطريقة التالية. كل زوج الكتلة التي هو أن تقارن (تلك التي هي جسديا قريبة من بعضها البعض، وكما يحكم به التداخل في مجموعات القناة المخصصة لكل) يتم دمج مؤقتا، على الرغم من الحفاظ على هوية المسامير في المجموعات عضوين المعروفة. ثم تحسب المكونات الرئيسية للزوج المدمجة. يتم احتساب مقياس التداخل بين النقاط في كلتا المجموعتين على أساس توزيع اثنين من المكونات الرئيسية الأولى.
طريقة اوف ويحسب مقياس erlap الموضح في المزيد من التفاصيل في مكان آخر (11). قيمته صفرا إذا كانت مجموعات لا تتداخل في كل شيء، أي أقرب الجيران من كل نقطة في نفس المجموعة. قيمتها قريبة إلى 1 إذا الكتل تتداخل تماما، أي احتمال لأقرب جار يجري في نفس المجموعة هو نفسه الذي تنبأ من خلط موحد من النقاط.
يتم اتخاذ القرارات المختلفة التي تأخذ قياس التداخل بعين الاعتبار. إذا كان التداخل أكبر من قيمة معينة، يمكن دمج المجموعات. إذا كان التداخل هو صغير جدا، ويمكن تعريف الزوج العنقودية تمييزا وتترك وحدها. القيم المتوسطة، مشيرا إلى فصل غير مكتمل من الزوج العنقودية، قد يشير إلى أن الزوج ينبغي دمج ثم إعادة تقسيم، والنتيجة المرجوة كونه زوج من الكتل مع أقل تداخل. يتم تشغيل هذه الإجراءات أولا في مرحلة الآلي وثم في مرحلة الموجهة يدويا.
خيمة "> في المرحلة الآلي، ويتم دمج أزواج مجموعة مع قيمة التداخل عالية؛ ثم أزواج عنقودية مع وسيطة ليتم دمج وإعادة تقسيم القيم تداخل منخفضة في الثانية، مرحلة الموجهة المستخدم، يتم تقديم المستخدم مع جميع تبقى أزواج مجموعة غامضة (أي تلك التي القيم التداخل في المدى المتوسط محددة) في تسلسل وطلب منهم أن يختاروا ما إذا كان) لدمج الزوج، ب) دمج وresplit الزوج، ج) أن يعلن الزوج أن تكون متميزة (التي ستتجاوز أهمية قياس التداخل)، أو د) لتحديد العلاقة بين الزوج كما. وتقدم "غامضة" مشيرا إلى أن ارتفاع هذا الزوج من غير المرجح أن يتم فرزها جيدا أدوات مختلفة للمساعدة في هذه القرارات، بما في ذلك السيارات – وعبر correlograms والسلاسل الزمنية قطع ذروة ارتفاع والقيم الكمبيوتر.من الناحية المثالية، في نهاية مراحل دمج وتقسيم، ويجب أن تكون كل مجموعة متميزة من جميع الآخرين،إما لأنه لديه عدد قليل أو أي قنوات مشتركة مع مجموعات أخرى، أو لأن مؤشر تداخل أقل من قيمة محددة. هذه القيمة هي المستخدم اختيار ولكن عادة 0.1. يتم تعريف مجموعات (وحدات) أن اجتياز هذا الاختبار باسم 'مستقر'، تلك التي لا (لأن التداخل مع واحد أو أكثر من المجموعات الأخرى أكبر من عتبة) بأنها "غير مستقرة". في الواقع، فإن الغالبية العظمى من الوحدات في نهاية المطاف التي تعرف بأنها "مستقرة" في النهاية الفرز، وترك الباقي إما أن يتم تجاهل أو التعامل معها على أنها يحتمل أن تكون وحدة متعددة.
متطلبات البرنامج
SpikeSorter متوافق مع الإصدارات 64 بت من ويندوز 7 و ويندوز 10، وكما تم بنجاح تشغيل لينكس باستخدام المحاكي النبيذ. يتم تحميل ملفات البيانات تماما في الذاكرة (للسرعة) من ذاكرة الوصول العشوائي وبالتالي متاح يحتاج إلى توسيع نطاق مع حجم التسجيل (السماح لحوالي 2 غيغابايت للبرنامج نفسه). الكهربيةتم فرز ملفات البيانات آل أكبر من 130 غيغابايت في الحجم بنجاح في كل من ويندوز ولينكس البيئات. يتم الوصول إلى الخيارات من خلال القوائم ويندوز القياسية، شريط أدوات والحوارات. تخطيط العناصر في القائمة مطابقة تقريبا لترتيب العمليات في الفرز، بدءا من القائمة 'ملف' على اليسار لإدخال البيانات والقائمة "تصدير" على حق السماح لتصدير البيانات التي تم فرزها. توفر أزرار شريط الأدوات اختصارات ليشيع استخدامها عناصر القائمة.
ملف تكوين القناة
العديد من الصيغ تسجيل البيانات لا تخزن المواقع القناة. ومع ذلك، مع العلم هذه ضرورية للفرز ارتفاع. ويمكن أيضا أن مرقمة قنوات بطرق مختلفة من قبل برنامج الحصول على: يتطلب SpikeSorter أن قنوات مرقمة بالتسلسل، بدءا قناة 1. وهكذا، ملف تكوين القطب التبعية لابد من خلق التي يمكن إعادة رسم خريطة أرقام القنوات لمتابعة حكم متعاقبة، وإلى قناة مخزن الموضعبالجمع. ملف التكوين قناة هو ملف نصي مع صف واحد من النص لكل قناة. السطر الأول من الملف يخزن اسم النص، تصل إلى 16 حرفا، أن يحدد القطب. الأرقام في خطوط لاحقة يمكن أن تكون مفصولة علامات التبويب، فاصلة واحدة، أو مسافات. هناك أربعة أرقام في كل صف توفير (بالترتيب): رقم القناة في الملف رقم القناة التي هي ليتم تعيينها (أي الرقم الذي سيتم استخدامه بواسطة SpikeSorter)، وإحداثيات س وص من قناة، في ميكرون. س تنسيق عادة يمكن اعتباره عمودي على اتجاه الإدراج القطب وذ التنسيق وفقا لذلك سيكون من عمق في الأنسجة. ملف التكوين لابد من وضعها في نفس الدليل كملف تسجيل. هناك بعض المرونة في الكيفية التي يمكن الكشف عن اسمه. وسيقوم البرنامج أولا بالبحث عن ملف له نفس اسم ملف البيانات الخام ولكن مع ملحق .cfg. إذا كان هذا ط ملفق لم يتم العثور على أنه سيتم البحث عن ملف "electrode.cfg". إذا لم يتم العثور على هذا الملف في المقابل يتم إنشاء رسالة خطأ تشير إلى عدم وجود معلومات تخطيط القناة.
تنسيقات الملفات
وتشمل تنسيقات الملفات المعتمدة حاليا Neuralynx (.ntt و.ncs)، Plexon (.plx)، Neuroscope (. XML + دات)، ونظم قنوات متعددة (.mcd)، بلاك روك (.nev) وIntan (.rhd). لتنسيقات غير معتمد، هناك نوعان من الخيارات. واحد هو أن يطلب إضافة تنسيق الملف الإصدار القاد?…
The authors have nothing to disclose.
We thank those individuals and groups who have used SpikeSorter and who have provided requests for file format support and suggestions and feedback on how to improve it. These include Youping Xiao, Felix Fung, Artak Khachatryan, Eric Kuebler, Curtis Baker, Amol Gharat and Dongsheng Xiao. We thank Adrien Peyrache for the false positive and negative figures given in ‘Representative Results’.
spikesorter.exe | N/A | program file currently available through invited dropbox link |