כאשר אנו תופסים אובייקט, אזורים מרובים של האצבעות והיד בדרך כלל יוצרים מגע עם פני השטח של האובייקט. שחזור אזורי מגע כאלה הוא מאתגר. כאן, אנו מציגים שיטה להערכה בקירוב של אזורי המגע על ידי שילוב לכידת תנועה מבוססת סמן עם שחזור רשת יד קיים מבוסס למידה עמוקה.
כדי לתפוס אובייקט בהצלחה, עלינו לבחור אזורי מגע מתאימים לידיים שלנו על פני השטח של האובייקט. עם זאת, זיהוי אזורים כאלה הוא מאתגר. מאמר זה מתאר זרימת עבודה להערכת אזורי אנשי הקשר מנתוני מעקב מבוססי סמנים. המשתתפים תופסים חפצים אמיתיים, בזמן שאנו עוקבים אחר המיקום התלת-ממדי של האובייקטים ושל היד, כולל מפרקי האצבעות. תחילה אנו קובעים את זוויות אוילר המשותפות מתוך מבחר סמנים מסומנים הממוקמים על גב היד. לאחר מכן, אנו משתמשים באלגוריתמים חדישים לשחזור רשת יד כדי ליצור מודל רשת של היד של המשתתף בתנוחה הנוכחית ובמיקום התלת-ממדי.
שימוש באובייקטים שהודפסו בתלת-ממד או נסרקו בתלת-ממד – ולכן זמינים הן כאובייקטים אמיתיים והן כנתוני רשת שינוי – מאפשר רישום משותף של רשתות השינוי של היד והאובייקט. בתורו, זה מאפשר הערכה של אזורי מגע מקורבים על ידי חישוב ההצטלבויות בין רשת היד לבין רשת האובייקט התלת-ממדית הרשומה במשותף. השיטה עשויה לשמש כדי להעריך היכן וכיצד בני אדם תופסים חפצים במגוון תנאים. לכן, השיטה יכולה לעניין חוקרים החוקרים תפיסה חזותית והפטית, שליטה מוטורית, אינטראקציה בין אדם למחשב במציאות מדומה ורבודה ורובוטיקה.
היכולת לתפוס ולתפעל חפצים היא יכולת מפתח המאפשרת לבני אדם לעצב מחדש את הסביבה לרצונותיהם ולצרכיהם. עם זאת, שליטה יעילה בידיים מרובות מפרקים היא משימה מאתגרת הדורשת מערכת בקרה מתוחכמת. מערכת בקרה מוטורית זו מונחית על ידי מספר צורות של קלט חושי, ביניהן ראייה היא בעלת חשיבות עליונה. באמצעות ראייה, אנשים יכולים לזהות את האובייקטים בסביבה ולהעריך את מיקומם ואת תכונותיהם הפיזיות, ואז יכולים להגיע, לתפוס ולתפעל אותם בקלות. הבנת המערכת המורכבת המקשרת את הקלט ברשתית עם הפקודות המוטוריות השולטות בידיים היא אתגר מרכזי של מדעי המוח הסנסומוטוריים. כדי למדל, לחזות ולהבין כיצד מערכת זו פועלת, עלינו להיות מסוגלים תחילה ללמוד אותה בפירוט. זה דורש מדידות נאמנות גבוהה הן של קלט חזותי והן של יציאות מנוע יד.
טכנולוגיית מעקב תנועה בעבר הטילה מספר מגבלות על חקר האחיזה האנושית. לדוגמה, מערכות הדורשות כבלים המחוברים לידיהם של המשתתפים1,2 נוטות להגביל את טווח תנועות האצבעות, מה שעלול לשנות את תנועות האחיזה או את המדידות עצמן. למרות מגבלות אלה, מחקרים קודמים הצליחו לזהות מספר גורמים המשפיעים על תפיסה מונחית חזותית. חלק מגורמים אלה כוללים את צורת האובייקט 3,4,5,6, חספוס פני השטח 7,8,9, או הכיוון של אובייקט ביחס ליד4,8,10. עם זאת, כדי להתגבר על מגבלות טכנולוגיות קודמות, רוב המחקר הקודם הזה השתמש בגירויים פשוטים ובמשימות מוגבלות מאוד, ובכך התמקד בעיקר בגורמים בודדים 3,4,6,7,10, אחיזות דיוק דו-ספרתיות3,4,6,9,11,12, 13,14,15,16,17,18, אובייקטים בודדים19, או צורות דו-ממדיות פשוטות מאוד 20,21. לא ידוע כיצד ממצאים קודמים מכלילים מעבר לתנאי מעבדה מצומצמים ומלאכותיים כאלה. בנוסף, מדידת מגע יד-אובייקט מצטמצמת לעתים קרובות להערכה של נקודות מגע ספרתיות22. פישוט זה עשוי להתאים לתיאור תת-קבוצה קטנה של אחיזות שבה רק קצות האצבעות באות במגע עם אובייקט. עם זאת, ברוב האחיזות בעולם האמיתי, אזורים נרחבים של האצבעות וכף היד באים במגע עם אובייקט. יתר על כן, מחקרשנערך לאחרונה 23 הוכיח, באמצעות כפפה הפטית, כי אובייקטים יכולים להיות מזוהים על ידי איך פני השטח שלהם משפיעים על היד. זה מדגיש את החשיבות של חקר אזורי המגע המורחבים בין הידיים לבין האובייקטים שנאחזו, ולא רק את נקודות המגע בין האובייקטים לבין קצות האצבעות22.
ההתקדמות האחרונה בלכידת תנועה ומידול ידני תלת-ממדי אפשרה לנו להתגבר על מגבלות קודמות ולחקור את האחיזה במלוא מורכבותה. מעקב תנועה פסיבי מבוסס סמן זמין כעת עם סמנים בגודל מילימטרי שניתן לחבר לגב ידיו של המשתתף כדי לעקוב אחר תנועות המפרקים24. יתר על כן, אלגוריתמים אוטומטיים לזיהוי סמנים עבור מערכות סמנים פסיביות הם כעת חזקים מספיק כדי כמעט לבטל את הצורך בעיבוד ידני נרחב של נתוני סמן25,26,27. פתרונות ללא מרקרים מגיעים גם לרמות ביצועים מרשימות במעקב אחר חלקי גוף של בעלי חיים בסרטונים28. שיטות מעקב תנועה אלה, אם כן, מאפשרות לבסוף מדידות אמינות ולא פולשניות של תנועות ידיים מורכבות רב-ספרתיות24. מדידות כאלה יכולות ללמד אותנו על קינמטיקה משותפת ולאפשר לנו להעריך את נקודות המגע בין היד לאובייקט. בנוסף, בשנים האחרונות מתמודדת קהילת הראייה הממוחשבת עם הבעיה של בניית מודלים של ידיים אנושיות שיכולים לשכפל את עיוותים הרקמות הרכות במהלך אחיזת חפצים ואפילו במהלך מגע עצמי בין חלקי יד 29,30,31,32. שחזורי רשת תלת-ממדיים כאלה יכולים להיגזר מסוגים שונים של נתונים, כגון קטעי וידאו 33,34, מפרקי שלד (הנגזרים ממעקב מבוסס סמן 35 או מעקב ללא סמן 36), ותמונות עומק 37. ההתקדמות העיקרית הראשונה בתחום זה סופקה על ידי Romero et al.38, שגזרו מודל יד פרמטרי (MANO) מיותר מ-1,000 סריקות ידיים מ-31 נבדקים בתנוחות שונות. המודל מכיל פרמטרים הן לתנוחה והן לצורת היד, המאפשרים רגרסיה ממקורות נתונים שונים לשחזור מלא של היד. הפתרון העדכני יותר של DeepHandMesh29 מתבסס על גישה זו על ידי בניית מודל פרמטרי באמצעות למידה עמוקה ועל ידי הוספת הימנעות מחדירה, אשר משכפלת בצורה מדויקת יותר אינטראקציות פיזיות בין חלקי יד. על ידי שילוב של שחזורי רשת יד כאלה עם רשתות שינוי תלת-ממדיות של עצמים, ניתן כעת להעריך אזורי מגע לא רק על פני השטח של אובייקטים32 אלא גם על פני היד.
כאן, אנו מציעים זרימת עבודה המשלבת מעקב תלת ממדי באיכות גבוהה של אובייקטים ומפרקי ידיים עם אלגוריתמים חדשניים לשחזור רשת יד. השיטה מניבה מפות מפורטות של משטחי מגע יד-אובייקט. מדידות אלה יסייעו למדעני מוח סנסומוטוריים להרחיב את ההבנה התיאורטית שלנו של תפיסה מונחית ראייה אנושית. יתר על כן, השיטה יכולה להיות שימושית לחוקרים בתחומים סמוכים. לדוגמה, חוקרי גורמים אנושיים עשויים להשתמש בשיטה זו כדי לבנות מערכות ממשק אדם-מכונה טובות יותר במציאות מדומה ורבודה18. מדידות נאמנות גבוהה של התנהגויות אחיזה אנושיות יכולות גם לסייע לרובוטיקאים לתכנן מערכות אחיזה רובוטיות בהשראת בני אדם המבוססות על עקרונות התפיסה האינטראקטיבית 39,40,41,42,43. לפיכך, אנו מקווים ששיטה זו תסייע לקדם את מחקר האחיזה בתחומי מדעי המוח וההנדסה, החל מתיאורים דלילים של משימות מוגבלות מאוד ועד לאפיונים מלאים יותר של התנהגויות אחיזה נטורליסטיות עם אובייקטים מורכבים ומשימות בעולם האמיתי. הגישה הכוללת מתוארת באיור 1.
איור 1: שלבים מרכזיים בשיטה המוצעת . (A) מצלמות לכידת תנועה מצלמות שולחן עבודה מזוויות מרובות. (B) אובייקט גירוי מודפס בתלת-ממד ממודל רשת שינוי משולשת. (C) ארבעה סמנים רפלקטיביים כדוריים מודבקים על פני השטח של האובייקט האמיתי. הליך אוטומטי למחצה מזהה ארבע נקודות תואמות על פני השטח של עצם רשת השינוי. התכתבות זו מאפשרת לנו לתרגם את מודל הרשת למיקום המעקב התלת-ממדי של האובייקט האמיתי. (D) סמנים רפלקטיביים מחוברים לציוני דרך שונים בגב כף ידו של משתתף באמצעות סרט דו-צדדי. (E) מערכת לכידת התנועה רוכשת את המסלולים במרחב התלת-ממדי של האובייקט העוקב וסמני היד במהלך ניסוי יחיד. (ו) שלד יד ספציפי למשתתף נבנה באמצעות תוכנת גרפיקה ממוחשבת תלת-ממדית. לאחר מכן מוערכות תנוחות מפרקי השלד עבור כל פריים של כל ניסוי בניסוי באמצעות קינמטיקה הפוכה. (G) תנוחות המפרקים מוזנות לגרסה שונה של DeepHandMesh29, המפיקה רשת יד תלת-ממדית משוערת בתנוחה ובמיקום התלת-ממדיים הנוכחיים. (H) לבסוף, אנו משתמשים בהצטלבות רשת כדי לחשב את אזורי המגע יד-אובייקט. אנא לחץ כאן כדי להציג גרסה גדולה יותר של איור זה.
אנו מציעים שיטה המאפשרת הערכה של אזורי מגע עבור אינטראקציות יד-אובייקט במהלך אחיזה רב-ספרתית. מכיוון שמעקב מלא אחר כל פני השטח של היד הוא כרגע בלתי פתיר, אנו מציעים להשתמש בשחזור של רשת יד שתנוחתה נקבעת על ידי נקודות מפתח דלילות על היד. כדי לעקוב אחר נקודות מפתח דלילות אלה, הפתרון שלנו משתמש במערכת לכידת תנועה ברמת מחקר המבוססת על מעקב סמנים פסיבי. כמובן, ניתן להשתמש גם במערכות לכידת תנועה אחרות בשיטה המוצעת, בתנאי שהן מניבות נתוני מיקום תלת-ממדיים מדויקים מספיק. אנו ממליצים להימנע ממערכות לכידת תנועה של סמן אקטיבי (כגון Optotrak Certus הפופולרי אך שהופסק), מכיוון שאלו דורשות חיבור כבלים ו / או מכשירים אלקטרוניים לידי המשתתפים, מה שעשוי להגביל תנועות או לפחות להניב אחיזות פחות אופייניות ככל שהמשתתפים נעשים מודעים יותר לתנוחת ידיהם. כפפות מעקב תנועה המשתמשות ביחידות מדידה אינרציאליות עשויות להיות אפשרות, למרות שמערכות אלו ידועות כסובלות מסחיפה, עשויות גם להגביל את תנועות היד ואינן מאפשרות למשטח היד לבוא במגע מלא וישיר עם משטחי האובייקט. פתרונות מסחריים למעקב ידני ללא סמן (לדוגמה, Leap Motion46,47,48) עשויים גם הם להיות אפשרות, אם כי ייתכן שלא ניתן יהיה לעקוב אחר מיקומי אובייקטים באמצעות מערכות אלה בלבד. האפשרות החלופית המבטיחה ביותר למערכת לכידת תנועה ברמת מחקר ניתנת על ידי פתרונות מעקב ללא סמן בקוד פתוח (למשל, Mathis et al.28). אם נעשה בהן שימוש עם מספר מצלמות רשומות49, מערכות כאלה יכולות לעקוב אחר מיקומי מפרקי ידיים ומיקומי אובייקטים בתלת-ממד ללא צורך בסמנים, כפפות או כבלים. פתרונות אלה, כמו גם מערכת מבוססת סמנים זו, עלולים לסבול, עם זאת, מבעיות אובדן נתונים עקב חסימות.
מגבלות וכיוונים עתידיים
מכיוון ששחזורי היד המתקבלים בשיטה זו לא יהיו מדויקים לחלוטין, ישנן מגבלות מסוימות לסוגי הניסויים שעבורם יש להשתמש בשיטה. סטיות בשחזורי רשת היד מהאמת הקרקעית יתבטאו בסטיות באזורי המגע המשוערים של יד/אובייקט. לפיכך, יישום שיטה זו כדי לגזור מדדים מוחלטים יחייב הערכת נאמנות של אומדני אזור המגע. עם זאת, אפילו הערכות מקורבות עדיין יכולות להיות שימושיות בתכנוני ניסוי בתוך המשתתפים מכיוון שההטיות הפוטנציאליות של השיטה עשויות להשפיע על תנאי ניסוי שונים בתוך משתתף באופן דומה. לכן, ניתוחים סטטיסטיים והיסקים צריכים להתבצע רק על מדדים כגון ההבדלים בשטח המגע בין התנאים, כאשר כיוון ההשפעה יהיה מתואם עם האמת הקרקעית בהתאמה. במחקר עתידי, אנו מתכננים לאמת עוד יותר את הגישה שלנו, למשל על ידי השוואת הערכות אזור מגע לטביעות אצבע תרמיות על עצמים המכוסים בצבע תרמוכרומי.
רוב שלבי העיבוד מאיסוף הנתונים ועד להערכת אזור איש הקשר הסופי הם אוטומטיים לחלוטין, ולכן מציעים תרומות חשובות לקראת הליך סטנדרטי להערכת אזור מגע יד-אובייקט. עם זאת, עדיין יש לבצע התאמה ראשונית של השלדים האישיים למיקומים התלת-ממדיים של הסמנים המסומנים באופן ידני כדי לקבל הגדרת שלד עבור כל משתתף. ככל שמספר המשתתפים בניסוי גדל, כך גדל גם מספר ההתאמות הידניות, וזהו כרגע השלב הגוזל הכי הרבה זמן בהליך ודורש היכרות מסוימת עם ריגול ידני בתוכנת אוטודסק מאיה. בעתיד, אנו שואפים להפוך שלב זה לאוטומטי כדי למנוע השפעה אנושית על ההליך על ידי הוספת הליך כיול שלד אוטומטי.
זרימת העבודה המתוארת כאן מסתמכת על החומרה והתוכנה של Qualisys (למשל, פותר השלד QTM). זה כרגע מגביל את הנגישות של השיטה שלנו למעבדות שיש להן מערך דומה. באופן עקרוני, עם זאת, השיטה יכולה להיות מיושמת על כל מקור של נתוני לכידת תנועה. כדי להרחיב את הנגישות, בעבודה השוטפת, אנו בוחנים חלופות שאמורות להכליל את זרימת העבודה שלנו ולהפוך אותה לפחות תלויה ברשיונות חומרה ותוכנה ספציפיים.
מגבלה חשובה נוספת של השיטה היא שבצורתה הנוכחית, ניתן ליישם אותה רק על אובייקטים קשיחים (שאינם ניתנים לצורה). בעתיד, ניתן יהיה להתגבר על מגבלה זו באמצעות שיטות לרישום צורת פני השטח של האובייקט הנתפס כשהוא מתעוות. בנוסף, בשל אופייה המשוער, השיטה אינה מתאימה כיום לעצמים קטנים או דקים מאוד.
לסיכום, על ידי שילוב מעקב תנועה חדשני עם מידול משטח יד באיכות גבוהה, אנו מספקים שיטה להערכת אזורי מגע יד-אובייקט במהלך אחיזה ומניפולציה. במחקר עתידי, אנו מתכננים ליישם שיטה זו כדי לחקור ולמדל התנהגות אחיזה מונחית חזותית בבני אדם16. כמו כן, אנו מתכננים לשלב כלים אלה עם מעקב אחר העיניים 46,50,51,52 ומערכות מציאות מדומה/רבודה 53,54,55 כדי לחקור שליטה מוטורית מונחית חזותית בתנועות ידיים ועיניים בסביבות נטורליסטיות אמיתיות ווירטואליות18,46,56,57. מסיבות אלה, השיטה המוצעת עשויה לעניין חוקרים החוקרים תפיסה הפטית58, שליטה מוטורית ואינטראקציה בין אדם למחשב במציאות מדומה ורבודה. לבסוף, מדידות מדויקות של יכולות אחיזה אנושיות יכולות לסייע בתכנון מערכות רובוטיות חזקות המבוססות על עקרונות התפיסה האינטראקטיבית 39,40,41,42,43 ועשויות להיות להן יישומים תרגומיים לתותבות בגפיים העליונות.
The authors have nothing to disclose.
מחקר זה מומן על ידי Deutsche Forschungsgemeinschaft (DFG, קרן המחקר הגרמנית: פרויקט מס’ 222641018-SFB/TRR 135 TP C1 ו-IRTG-1901 “המוח בפעולה”) ועל ידי אשכול המחקר “המוח המסתגל” שמומן על ידי תוכנית המצוינות של משרד הסיאן להשכלה גבוהה, מדע, מחקר ואמנות. המחברים מודים לצוות התמיכה של Qualisys, כולל מתיאס בנקי וג’פרי תינגוולד, על הסיוע בפיתוח השיטות שלנו. המחברים מודים גם למיכאלה ישקה על שהתחזתה לדוגמנית היד. כל הנתונים וסקריפט הניתוח לשחזור השיטה והתוצאות המוצגות בכתב היד זמינים באתר Zenodo (doi: 10.5281/zenodo.7458911).
Anaconda Python distribution | (Anaconda 5.3.1 or later); https://repo.anaconda.com/archive/ | scripts and functions were generated in Python version 3.7 | |
Autodesk Maya | Autodesk, Inc. | Maya2022; https://www.autodesk.com/products/maya/overview | 3D computer graphics application. |
Blender | Blender Foundation | Blender 2.92; https://download.blender.org/release/ | 3D computer graphics application. |
Computer Workstation | N/A | N/A | OS: Windows 10 or higher. |
DeepHandMesh | Meta Platforms, Inc. (Meta Open Source) | https://github.com/facebookresearch/DeepHandMesh | Pre-trained hand mesh generation tool. |
Miqus M5 | Qualisys Ab | https://www.qualisys.com/cameras/miqus/ | Passive marker motion tracking camera (8 units). |
Miqus video camera | Qualisys Ab | https://www.qualisys.com/cameras/miqus-video/ | Color video camera, synchronized with Miquis M5 tracking cameras (6 units). |
Project repository | N/A | Data and Code Repository | Data and code to replicate the current project. The repository is currently under construction, but we provide a private link where reviewers can download the current and most up-to-date version of the repository. The final repository will be made publicly available upon acceptance. |
Python 3 | Python Software Foundation | Python Version 3.7 | Python3 and associated built-in libraries. |
QTM Connect for Maya | Qualisys Ab | https://github.com/qualisys/QTM-Connect-For-Maya | Stream skeleton, rigid bodies and marker data from QTM to Maya |
QTM Qualisys Track Manager | Qualisys Ab | Qualisys Track Manager 2021.2; https://www.qualisys.com/software/qualisys-track-manager/ | Motion capture software |
Qualisys SDK for Python | Qualisys Ab | https://github.com/qualisys/qualisys_python_sdk | Implements communication between QTM and Python |