الروبوتات

EgoZero: استخدام النظارات الذكية لتدريب الروبوتات متعددة المهام بكفاءة

تدريب الروبوتات متعددة الأغراض يُعد تحديًا صعبًا، إذ أن تحقيق حلم روبوت منزلي مثل “روزي” من مسلسل The Jetsons يتطلب بيانات ضخمة تحاكي ظروف العالم الحقيقي، وهي بيانات يصعب جمعها. غالبًا ما يتم جمعها عبر كاميرات ثابتة متعددة تحتاج لإعداد دقيق. لكن ماذا لو كان بالإمكان تدريب الروبوتات من خلال التفاعلات اليومية التي نقوم بها نحن البشر مع العالم المادي؟

هذا هو السؤال الذي يسعى مختبر الروبوتات والذكاء الاصطناعي متعدد الأغراض بجامعة نيويورك بقيادة الأستاذ المساعد ليريل بينتو للإجابة عنه من خلال مشروع EgoZero، وهو نظام يعتمد على نظارات ذكية مطورة من مشروع Aria لشركة Meta.

في ورقة بحثية حديثة، قام الباحثون بتدريب روبوت على أداء سبع مهام، مثل التقاط قطعة خبز ووضعها على طبق. تم جمع 20 دقيقة من بيانات بشرية لكل مهمة باستخدام النظارات الذكية. عند اختبار الروبوت لأداء هذه المهام بشكل مستقل، حقق النظام نسبة نجاح بلغت 70%.

ميزة البيانات من منظور الشخص (Egocentric Data)

يشير مصطلح “Ego” في EgoZero إلى البيانات التي تُجمع من منظور الشخص نفسه أثناء أداء المهمة. هذا يوفر ميزتين أساسيتين:

  1. سهولة النقل مقارنة بالكاميرات الخارجية الثابتة.

  2. التقاط البيانات المهمة بشكل مباشر، لأن مرتدي النظارات يوجه نظره دائمًا نحو ما يحتاج إلى فعله.

على سبيل المثال، إذا كان هناك خطاف أسفل طاولة وتحتاج لفكه، فإنك ستنحني وتنظر نحوه، وهو ما تلتقطه الكاميرا بدقة، بخلاف الكاميرا الخارجية التي قد لا ترى هذه التفاصيل.

التدريب دون بيانات روبوتية

الجزء الثاني من اسم EgoZero (Zero) يشير إلى أن النظام يُدرّب دون الحاجة إلى بيانات من الروبوت نفسه، وهو ما يُعتبر مكلفًا وصعبًا. يعتمد النظام على إطار عمل طوره مختبر NYU يركز على تتبع النقاط في الفضاء ثلاثي الأبعاد بدلًا من الصور الكاملة.

هذه التقنية تقلل الفجوة بين اختلاف شكل يد الإنسان وذراع الروبوت، إذ تُترجم نقاط حركة اليد البشرية إلى نقاط مقابلة على الروبوت. طالما أن حركة النقاط على الروبوت بالنسبة للشيء المراد التفاعل معه تماثل حركة نقاط اليد البشرية، فإن الروبوت يتمكن من أداء المهمة.

هذا يؤدي إلى نموذج قابل للتعميم، لا يحتاج إلى كميات هائلة من بيانات الروبوت. فإذا تعلم الروبوت التقاط رغيف خبز صغير، يمكنه تعميم المعرفة لالتقاط خبز آخر مختلف مثل “تشاباتا” في بيئة جديدة.

نحو حل قابل للتوسع

يعمل الباحثون إلى جانب EgoZero على عدة مشاريع أخرى لتقريب حلم الروبوتات متعددة الأغراض، مثل تصميمات مفتوحة المصدر للروبوتات، مجسات لمس مرنة، وطرق إضافية لجمع البيانات الواقعية.

على سبيل المثال، ابتكروا أداة بديلة تعتمد على مقبض مطبوع ثلاثي الأبعاد يشبه يد الروبوت، مع هاتف ذكي مثبت عليه لتسجيل الفيديو بنفس منهجية تتبع النقاط. يتيح ذلك جمع البيانات في منازل الناس بسهولة ودون الحاجة لروبوتات فعلية، مما يجعل العملية أكثر قابلية للتوسع.

يؤكد الباحثون أن هدفهم النهائي هو سد الفجوة بين العالم الرقمي والعالم الفيزيائي. فإذا كانت نماذج اللغة الكبيرة تعتمد على بيانات الإنترنت، فإنه لا يوجد “إنترنت موازٍ” للعالم المادي. جمع البيانات من التفاعلات اليومية عبر النظارات الذكية قد يكون خطوة أساسية لبناء قاعدة بيانات فيزيائية شاملة لتدريب الروبوتات المستقبلية.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى