عندما نمسك بجسم ما، عادة ما تتلامس مناطق متعددة من الأصابع واليد مع سطح الجسم. إن إعادة بناء مناطق التماس هذه أمر صعب. هنا ، نقدم طريقة لتقدير مناطق الاتصال تقريبا من خلال الجمع بين التقاط الحركة القائم على العلامات وإعادة بناء شبكة اليد القائمة على التعلم العميق.
للإمساك بجسم ما بنجاح ، يجب علينا تحديد مناطق التلامس المناسبة لأيدينا على سطح الجسم. ومع ذلك ، فإن تحديد مثل هذه المناطق يمثل تحديا. تصف هذه الورقة سير عمل لتقدير مناطق الاتصال من بيانات التتبع المستندة إلى العلامات. يمسك المشاركون بالأشياء الحقيقية ، بينما نتتبع موضع 3D لكل من الأشياء واليد ، بما في ذلك مفاصل الأصابع. نحدد أولا زوايا أويلر المشتركة من مجموعة مختارة من العلامات المجنزرة الموضوعة على ظهر اليد. بعد ذلك ، نستخدم خوارزميات إعادة بناء شبكة اليد الحديثة لإنشاء نموذج شبكي ليد المشارك في الوضع الحالي وموضع 3D.
إن استخدام الكائنات التي تم طباعتها ثلاثية الأبعاد أو مسحها ضوئيا ثلاثية الأبعاد – وبالتالي فهي متاحة ككائنات حقيقية وبيانات شبكية – يسمح بتسجيل شبكات اليد والكائن بشكل مشترك. وهذا بدوره يسمح بتقدير مناطق الاتصال التقريبية عن طريق حساب التقاطعات بين شبكة اليد وشبكة الكائن 3D المسجلة بشكل مشترك. يمكن استخدام هذه الطريقة لتقدير أين وكيف يمسك البشر بالأشياء في ظل مجموعة متنوعة من الظروف. لذلك ، يمكن أن تكون الطريقة ذات أهمية للباحثين الذين يدرسون الإدراك البصري واللمسي ، والتحكم في المحركات ، والتفاعل بين الإنسان والحاسوب في الواقع الافتراضي والمعزز ، والروبوتات.
القدرة على فهم الأشياء والتلاعب بها هي قدرة أساسية تسمح للبشر بإعادة تشكيل البيئة وفقا لرغباتهم واحتياجاتهم. ومع ذلك ، فإن التحكم في الأيدي متعددة المفاصل بشكل فعال مهمة صعبة تتطلب نظام تحكم متطور. يسترشد نظام التحكم في المحرك هذا بعدة أشكال من المدخلات الحسية ، من بينها الرؤية ذات أهمية قصوى. من خلال الرؤية ، يمكن للأفراد تحديد الأشياء في البيئة وتقدير موقعها وخصائصها الفيزيائية ويمكنهم بعد ذلك الوصول إلى تلك الأشياء وفهمها ومعالجتها بسهولة. يعد فهم النظام المعقد الذي يربط المدخلات في شبكية العين بالأوامر الحركية التي تتحكم في اليدين تحديا رئيسيا لعلم الأعصاب الحسي الحركي. لنمذجة هذا النظام والتنبؤ به وفهمه ، يجب أن نكون قادرين أولا على دراسته بالتفصيل. وهذا يتطلب قياسات عالية الدقة لكل من المدخلات المرئية ومخرجات المحرك اليدوي.
فرضت تقنية تتبع الحركة السابقة عددا من القيود على دراسة الإمساك البشري. على سبيل المثال ، تميل الأنظمة التي تتطلب كابلات متصلة بأيدي المشاركين 1,2 إلى تقييد نطاق حركات الأصابع ، مما قد يؤدي إلى تغيير حركات الإمساك أو القياسات نفسها. على الرغم من هذه القيود ، تمكنت الأبحاث السابقة من تحديد العديد من العوامل التي تؤثر على الإمساك الموجه بصريا. تتضمن بعض هذه العوامل شكل الكائن3،4،5،6 ، وخشونة السطح7،8،9 ، أو اتجاه الجسم بالنسبة إلى اليد 4،8،10. ومع ذلك ، للتغلب على القيود التكنولوجية السابقة ، استخدمت غالبية هذه الأبحاث السابقة محفزات بسيطة ومهام مقيدة للغاية ، وبالتالي ركزت في الغالب على العوامل الفردية 3،4،6،7،10 ، مقابض دقيقة مكونة من رقمين 3،4،6،9،11،12 ، 13،14،15،16،17،18 ، كائنات مفردة19 ، أو أشكال ثنائية الأبعاد بسيطة للغاية20،21. كيف تعمم النتائج السابقة إلى ما وراء هذه الظروف المعملية المخفضة والاصطناعية غير معروفة. بالإضافة إلى ذلك ، غالبا ما يتم تقليل قياس ملامسة اليد والجسم إلى تقدير نقاط الاتصال الرقمية22. قد يكون هذا التبسيط مناسبا لوصف مجموعة فرعية صغيرة من القبضات التي تكون فيها أطراف الأصابع فقط على اتصال بشيء ما. ومع ذلك ، في غالبية عمليات الإمساك في العالم الحقيقي ، تتلامس مناطق واسعة من الأصابع وراحة اليد مع جسم ما. علاوة على ذلك ، أظهرت دراسة حديثة23 ، باستخدام قفاز لمسي ، أنه يمكن التعرف على الأشياء من خلال كيفية اصطدام سطحها باليد. هذا يسلط الضوء على أهمية دراسة مناطق الاتصال الممتدة بين اليدين والأشياء التي تم الإمساك بها ، وليس فقط نقاط الاتصال بين الأشياء وأطراف الأصابع22.
سمحت لنا التطورات الحديثة في التقاط الحركة ونمذجة اليد 3D بتجاوز القيود السابقة ودراسة الإمساك بتعقيدها الكامل. يتوفر الآن تتبع الحركة القائم على العلامات السلبية مع علامات بحجم المليمتر يمكن تثبيتها على الجزء الخلفي من يدي المشارك لتتبع حركات المفاصل24. علاوة على ذلك ، أصبحت خوارزميات تحديد العلامات التلقائية لأنظمة العلامات السلبية قوية الآن بما يكفي للتخلص تقريبا من الحاجة إلى المعالجة اليدوية الشاملة لبيانات العلامات25،26،27. تصل الحلول الخالية من العلامات أيضا إلى مستويات رائعة من الأداء في تتبع أجزاء جسم الحيوان في مقاطع الفيديو28. وبالتالي ، فإن طرق تتبع الحركة هذه تسمح أخيرا بإجراء قياسات موثوقة وغير جراحية لحركات اليد المعقدة متعددة الأرقام24. يمكن أن تخبرنا هذه القياسات عن حركية المفاصل وتمكننا من تقدير نقاط الاتصال بين اليد والجسم. بالإضافة إلى ذلك ، في السنوات الأخيرة ، كان مجتمع رؤية الكمبيوتر يعالج مشكلة بناء نماذج للأيدي البشرية يمكنها تكرار تشوهات الأنسجة الرخوة أثناء الإمساك بالأشياء وحتى أثناء الاتصال الذاتي بين أجزاء اليد29،30،31،32. يمكن اشتقاق عمليات إعادة بناء الشبكة ثلاثية الأبعاد هذه من أنواع مختلفة من البيانات ، مثل لقطات الفيديو 33,34 ، والمفاصل الهيكلية (المستمدة من 35 القائمة على العلامات أو التتبعبدون علامات 36) ، وصور العمق 37. تم تقديم أول تقدم رئيسي في هذا المجال من قبل Romero et al.38 ، الذي اشتق نموذج اليد البارامترية (MANO) من أكثر من 1000 مسح يدوي من 31 شخصا في أوضاع مختلفة. يحتوي النموذج على معلمات لكل من وضع وشكل اليد ، مما يسهل الانحدار من مصادر البيانات المختلفة إلى إعادة بناء اليد بالكامل. يعتمد حل DeepHandMesh29 الأحدث على هذا النهج من خلال بناء نموذج معلمات من خلال التعلم العميق وإضافة تجنب الاختراق ، والذي يكرر التفاعلات المادية بين أجزاء اليد بشكل أكثر دقة. من خلال الجمع بين عمليات إعادة بناء شبكة اليد هذه مع شبكات الكائنات المجنزرة ثلاثية الأبعاد ، أصبح من الممكن الآن تقدير مناطق الاتصال ليس فقط على سطح الكائنات32 ولكن أيضا على سطح اليد.
هنا ، نقترح سير عمل يجمع بين تتبع 3D عالي الدقة للأشياء ومفاصل اليد مع خوارزميات إعادة بناء شبكة اليد الجديدة. تنتج الطريقة خرائط مفصلة لأسطح ملامسة اليد والأشياء. ستساعد هذه القياسات علماء الأعصاب الحسية الحركية في توسيع فهمنا النظري للإمساك البشري الموجه بصريا. علاوة على ذلك ، يمكن أن تكون الطريقة مفيدة للباحثين في المجالات المجاورة. على سبيل المثال ، قد يستخدم باحثو العوامل البشرية هذه الطريقة لبناء أنظمة واجهة أفضل بين الإنسان والآلة في الواقع الافتراضي والمعزز18. يمكن أن تساعد القياسات عالية الدقة لسلوكيات الإمساك البشري أيضا علماء الروبوتات في تصميم أنظمة استيعاب روبوتية مستوحاة من الإنسان بناء على مبادئ الإدراك التفاعلي39،40،41،42،43. وبالتالي، نأمل أن تساعد هذه الطريقة في تطوير أبحاث الاستيعاب عبر مجالات علم الأعصاب والهندسة من الأوصاف المتفرقة للمهام المقيدة للغاية إلى التوصيف الكامل لسلوكيات الإمساك الطبيعية بالأشياء المعقدة ومهام العالم الحقيقي. ويرد النهج العام في الشكل 1.
الشكل 1: الخطوات الرئيسية في الطريقة المقترحة . (أ) تصور كاميرات التقاط الحركة طاولة عمل من زوايا متعددة. (ب) جسم مثير مطبوع ثلاثي الأبعاد من نموذج شبكي مثلث. (ج) أربع علامات عاكسة كروية ملتصقة بسطح الجسم الحقيقي. يحدد الإجراء شبه الآلي أربع نقاط مقابلة على سطح كائن الشبكة. تسمح لنا هذه المراسلات بترجمة نموذج الشبكة إلى الموضع المتعقب 3D للكائن الحقيقي. (د) تعلق علامات عاكسة على معالم مختلفة على ظهر يد المشارك باستخدام شريط لاصق على الوجهين. (E) يكتسب نظام التقاط الحركة المسارات في الفضاء 3D للجسم المتعقب وعلامات اليد خلال تجربة واحدة. (F) يتم إنشاء هيكل عظمي لليد خاص بالمشارك باستخدام برنامج رسومات الكمبيوتر 3D. ثم يتم تقدير أوضاع المفصل الهيكلي لكل إطار من كل تجربة في تجربة من خلال الحركية العكسية. (ز) أوضاع المفاصل هي مدخلات لنسخة معدلة من DeepHandMesh29 ، والتي تنتج شبكة يدوية ثلاثية الأبعاد تقديرية في الوضع والموضع ثلاثي الأبعاد الحالي. (H) أخيرا ، نستخدم تقاطع الشبكة لحساب مناطق ملامسة اليد والجسم. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم.
نقترح طريقة تمكن من تقدير مناطق الاتصال للتفاعلات بين اليد والكائن أثناء عمليات الإمساك متعددة الأرقام. نظرا لأن التتبع الكامل لسطح اليد بالكامل أمر مستعصي حاليا ، فإننا نقترح استخدام إعادة بناء شبكة يدوية يتم تحديد وضعها من خلال نقاط رئيسية متفرقة على اليد. لتتبع هذه النقاط الرئيسية المتناثرة ، يستخدم حلنا نظام التقاط الحركة على مستوى البحث بناء على تتبع العلامات السلبية. بالطبع ، يمكن أيضا استخدام أنظمة التقاط الحركة الأخرى مع الطريقة المقترحة ، بشرط أن تسفر عن بيانات موقع 3D دقيقة بما فيه الكفاية. ننصح بعدم استخدام أنظمة التقاط حركة العلامات النشطة (مثل Optotrak Certus الشائعة ولكن المتوقفة) ، نظرا لأنها تتطلب توصيل الكابلات و / أو الأجهزة الإلكترونية بأيدي المشاركين ، مما قد يقيد الحركات أو على الأقل ينتج عنه قبضات أقل نموذجية حيث يتم جعل المشاركين أكثر وعيا بوضعية أيديهم. قد تكون قفازات تتبع الحركة التي تستخدم وحدات قياس بالقصور الذاتي ممكنة ، على الرغم من أن هذه الأنظمة معروفة بأنها تعاني من الانجراف ، وقد تقيد أيضا حركات اليد ، ولا تسمح لسطح اليد بالتلامس الكامل والمباشر مع أسطح الجسم. قد تكون حلول تتبع اليد التجارية بدون علامات (على سبيل المثال ، Leap Motion46،47،48) ممكنة أيضا ، على الرغم من أنه قد لا يكون من الممكن تتبع مواقع الأشياء باستخدام هذه الأنظمة وحدها. يتم توفير الخيار البديل الواعد لنظام التقاط الحركة على مستوى البحث من خلال حلول تتبع مفتوحة المصدر وخالية من العلامات (على سبيل المثال ، Mathis et al.28). إذا تم استخدامها مع العديد من الكاميرات المسجلةبشكل مشترك 49 ، فمن المحتمل أن تتعقب هذه الأنظمة مواضع مفصل اليد ومواضع الأشياء في 3D دون الحاجة إلى علامات أو قفازات أو كابلات. ومع ذلك ، قد تعاني هذه الحلول ، بالإضافة إلى هذا النظام القائم على العلامات ، من مشكلات فقدان البيانات بسبب الانسداد.
القيود والتوجهات المستقبلية
نظرا لأن عمليات إعادة البناء اليدوية التي تم الحصول عليها من خلال هذه الطريقة لن تكون دقيقة تماما ، فهناك بعض القيود على أنواع التجارب التي يجب استخدام الطريقة من أجلها. ستظهر الانحرافات في إعادة بناء شبكة اليد عن الحقيقة الأرضية في الانحرافات في مناطق ملامسة اليد / الكائن المقدرة. وبالتالي ، فإن تطبيق هذه الطريقة لاشتقاق مقاييس مطلقة سيتطلب تقييم دقة تقديرات منطقة الاتصال. ومع ذلك ، حتى التقديرات التقريبية يمكن أن تظل مفيدة في التصاميم التجريبية داخل المشارك لأن التحيزات المحتملة للطريقة من المحتمل أن تؤثر على الظروف التجريبية المختلفة داخل المشارك بطريقة مماثلة. لذلك ، يجب إجراء التحليلات والاستدلالات الإحصائية فقط على مقاييس مثل الاختلافات في منطقة الاتصال بين الظروف ، حيث يرتبط اتجاه التأثير بالحقيقة الأساسية المعنية. في الأبحاث المستقبلية ، نخطط لمزيد من التحقق من صحة نهجنا ، على سبيل المثال من خلال مقارنة تقديرات منطقة الاتصال بالبصمات الحرارية على الأشياء المغطاة بالطلاء الحراري.
معظم خطوات المعالجة من جمع البيانات إلى تقدير منطقة الاتصال النهائي مؤتمتة بالكامل ، وبالتالي ، تقدم مساهمات مهمة نحو إجراء موحد لتقدير منطقة الاتصال باليد والكائن. ومع ذلك ، لا يزال يتعين إجراء ملاءمة أولية للهياكل العظمية الفردية لمواقع 3D للعلامات المتعقبة يدويا للحصول على تعريف هيكلي لكل مشارك. مع زيادة عدد المشاركين في التجربة ، يزداد عدد التركيبات اليدوية ، وهذه هي الخطوة الأكثر استهلاكا للوقت في الإجراء وتتطلب بعض الإلمام بالتزوير اليدوي في برنامج Autodesk Maya. في المستقبل ، نهدف إلى أتمتة هذه الخطوة لتجنب التأثير البشري على الإجراء عن طريق إضافة إجراء معايرة الهيكل العظمي التلقائي.
يعتمد سير العمل الموضح هنا على أجهزة وبرامج Qualisys (على سبيل المثال ، أداة حل الهيكل العظمي QTM). هذا يحد حاليا من إمكانية الوصول إلى طريقتنا للمختبرات التي لديها إعداد مماثل. ومع ذلك ، من حيث المبدأ ، يمكن تطبيق الطريقة على أي مصدر لبيانات التقاط الحركة. لتوسيع إمكانية الوصول ، في العمل المستمر ، نستكشف البدائل التي من شأنها تعميم سير العمل لدينا وجعله أقل اعتمادا على تراخيص الأجهزة والبرامج المحددة.
هناك قيد مهم آخر للطريقة وهو أنه ، في شكله الحالي ، لا يمكن تطبيقه إلا على الأشياء الصلبة (غير القابلة للتشوه). في المستقبل ، يمكن التغلب على هذا القيد باستخدام طرق لتسجيل شكل سطح الجسم الممسك أثناء تشوهه. بالإضافة إلى ذلك ، نظرا لطبيعتها التقريبية ، فإن الطريقة ليست مناسبة حاليا للأجسام الصغيرة جدا أو الرقيقة.
في الختام ، من خلال دمج أحدث تتبع الحركة مع نمذجة سطح اليد عالية الدقة ، نقدم طريقة لتقدير مناطق ملامسة اليد والأشياء أثناء الإمساك والتلاعب. في الأبحاث المستقبلية ، نخطط لنشر هذه الطريقة للتحقيق ونمذجة سلوك الإمساك الموجه بصريا في البشر16. نخطط أيضا لدمج هذه الأدوات مع تتبع العين 46،50،51،52 وأنظمة الواقع الافتراضي / المعزز 53،54،55 للتحقيق في التحكم في حركة اليد والعين الموجهة بصريا في البيئات الطبيعية الحقيقية والافتراضية18،46،56،57. لهذه الأسباب ، قد تكون الطريقة المقترحة ذات أهمية للباحثين الذين يدرسون الإدراك اللمسي58 ، والتحكم في المحركات ، والتفاعل بين الإنسان والحاسوب في الواقع الافتراضي والمعزز. أخيرا ، يمكن للقياسات الدقيقة لقدرات الإمساك البشري أن تفيد في تصميم أنظمة روبوتية قوية تستند إلى مبادئ الإدراك التفاعلي39،40،41،42،43 وقد يكون لها تطبيقات متعدية للأطراف الاصطناعية العلوية.
The authors have nothing to disclose.
تم تمويل هذا البحث من قبل Deutsche Forschungsgemeinschaft (DFG ، مؤسسة الأبحاث الألمانية: المشروع رقم 222641018-SFB / TRR 135 TP C1 و IRTG-1901 “الدماغ في العمل”) ومن قبل مجموعة الأبحاث “العقل التكيفي” بتمويل من برنامج التميز التابع لوزارة التعليم العالي والعلوم والبحث والفنون في ولاية هيسن. يشكر المؤلفون فريق دعم Qualisys ، بما في ذلك ماتياس بانكاي وجيفري ثينجفولد ، للمساعدة في تطوير أساليبنا. يشكر المؤلفون أيضا ميكايلا جيشكي على التظاهر بأنها نموذج اليد. تتوفر جميع البيانات ونصوص التحليل لإعادة إنتاج الطريقة والنتائج المعروضة في المخطوطة على Zenodo (doi: 10.5281 / zenodo.7458911).
Anaconda Python distribution | (Anaconda 5.3.1 or later); https://repo.anaconda.com/archive/ | scripts and functions were generated in Python version 3.7 | |
Autodesk Maya | Autodesk, Inc. | Maya2022; https://www.autodesk.com/products/maya/overview | 3D computer graphics application. |
Blender | Blender Foundation | Blender 2.92; https://download.blender.org/release/ | 3D computer graphics application. |
Computer Workstation | N/A | N/A | OS: Windows 10 or higher. |
DeepHandMesh | Meta Platforms, Inc. (Meta Open Source) | https://github.com/facebookresearch/DeepHandMesh | Pre-trained hand mesh generation tool. |
Miqus M5 | Qualisys Ab | https://www.qualisys.com/cameras/miqus/ | Passive marker motion tracking camera (8 units). |
Miqus video camera | Qualisys Ab | https://www.qualisys.com/cameras/miqus-video/ | Color video camera, synchronized with Miquis M5 tracking cameras (6 units). |
Project repository | N/A | Data and Code Repository | Data and code to replicate the current project. The repository is currently under construction, but we provide a private link where reviewers can download the current and most up-to-date version of the repository. The final repository will be made publicly available upon acceptance. |
Python 3 | Python Software Foundation | Python Version 3.7 | Python3 and associated built-in libraries. |
QTM Connect for Maya | Qualisys Ab | https://github.com/qualisys/QTM-Connect-For-Maya | Stream skeleton, rigid bodies and marker data from QTM to Maya |
QTM Qualisys Track Manager | Qualisys Ab | Qualisys Track Manager 2021.2; https://www.qualisys.com/software/qualisys-track-manager/ | Motion capture software |
Qualisys SDK for Python | Qualisys Ab | https://github.com/qualisys/qualisys_python_sdk | Implements communication between QTM and Python |