الروبوتات

مايكروسوفت تكشف عن نموذج Rho-alpha للروبوتات

في عالم الروبوتات المتطور، تقدم مايكروسوفت نموذج Rho-alpha، الذي يعد خطوة جديدة نحو تحسين استقلالية الروبوتات.

تم تصميم Rho-alpha لمساعدة الروبوتات بما في ذلك الروبوتات البشرية على أن تصبح أكثر استقلالية. المصدر: مايكروسوفت

لكي تكون مفيدة في بيئات أكثر ديناميكية وأقل تنظيمًا، تحتاج الروبوتات إلى ذكاء اصطناعي مدرب على مجموعة متنوعة من المدخلات الحسية. أعلنت شركة مايكروسوفت اليوم عن Rho-alpha، أو ρα، أول نموذج روبوتي مشتق من سلسلة Phi لنماذج اللغة والرؤية.

تمكن نماذج اللغة والرؤية والعمل (VLAs) أنظمة الذكاء الاصطناعي الفيزيائية من الإدراك والتفكير والعمل بمستويات متزايدة من الاستقلالية، كما ذكرت مايكروسوفت. النماذج الجديدة المبنية على Phi تهدف إلى جعل الروبوتات أكثر قابلية للتكيف وموثوقية، وفقًا لما ذكرته الشركة.

“يترجم Rho-alpha الأوامر باللغة الطبيعية إلى إشارات تحكم للأنظمة الروبوتية التي تؤدي مهام المناولة الثنائية اليدين”، كتب آشلي لورينز، نائب الرئيس التنفيذي ومدير إدارة تسريع أبحاث مايكروسوفت. “يمكن وصفه بأنه نموذج VLA+ لأنه يوسع مجموعة الحواس وطرق التعلم إلى ما هو أبعد من تلك المستخدمة عادةً من قبل VLAs.”

للتعرف، يضيف Rho-alpha الاستشعار اللمسي، وذكرت مايكروسوفت أنها تعمل على تضمين طرق مثل القوة. بالنسبة للتعلم، ادعت الشركة أن Rho-alpha يمكن أن يتحسن باستمرار من خلال التغذية الراجعة المقدمة من الأشخاص.

يوضح الفيديو أدناه كيفية تفاعل Rho-alpha مع BusyBox، وهو معيار تفاعل مادي قدمته أبحاث مايكروسوفت مؤخرًا، استجابةً لتعليمات اللغة الطبيعية.

Rho-alpha يستخدم المحاكاة، والعرض، والويب

يتدرب Rho-alpha بشكل مشترك على الوعي اللمسي من المسارات الناتجة عن العروض المادية والمهام المحاكاة، بالإضافة إلى بيانات الأسئلة والأجوبة المرئية على نطاق الويب، كما قال لورينز في منشور مدونة. “نخطط لاستخدام نفس المخطط لمواصلة توسيع النموذج ليشمل طرق استشعار إضافية عبر مجموعة متنوعة من المهام الواقعية”، أضاف.

هناك نقص في بيانات تدريب الروبوتات القابلة للتوسع، خاصة بالنسبة للاستشعار اللمسي وطرق الاستشعار الأقل شيوعًا، اعترفت مايكروسوفت. مع إطار عمل NVIDIA Isaac Sim المفتوح، يمكن للباحثين توليد بيانات اصطناعية في عملية متعددة المراحل تعتمد على التعلم المعزز.

“بينما أصبح توليد بيانات التدريب عن طريق التحكم عن بُعد في الأنظمة الروبوتية ممارسة قياسية، هناك العديد من الإعدادات حيث يكون التحكم عن بُعد غير عملي أو مستحيل”، قال أبهيسك غوبتا، أستاذ مساعد في جامعة واشنطن. “نحن نعمل مع أبحاث مايكروسوفت لإثراء مجموعات بيانات ما قبل التدريب المجمعة من الروبوتات المادية بعروض اصطناعية متنوعة باستخدام مزيج من المحاكاة والتعلم المعزز.”

“يتطلب تدريب نماذج الأساس التي يمكنها التفكير والعمل التغلب على ندرة البيانات الواقعية المتنوعة”، لاحظ ديبو تالا، نائب رئيس الروبوتات والذكاء الاصطناعي في NVIDIA. “من خلال الاستفادة من NVIDIA Isaac Sim على Azure لتوليد مجموعات بيانات اصطناعية دقيقة فيزيائيًا، تسرع أبحاث مايكروسوفت تطوير نماذج متعددة الاستخدامات مثل Rho-alpha التي يمكنها إتقان مهام المناولة المعقدة.”

البشر يقدمون تصحيح المسار لنماذج مايكروسوفت

حتى مع توسيع الإدراك، يمكن أن ترتكب الروبوتات أخطاء أثناء التشغيل، كما ذكرت مايكروسوفت. وأوضحت أن التغذية الراجعة التصحيحية من أجهزة التحكم عن بُعد مثل الماوس ثلاثي الأبعاد يمكن أن تساعد Rho-alpha على الاستمرار في التعلم.

في الفيديو أدناه، تعرض مايكروسوفت ذراعين من نوع UR5e مزودتين بمستشعرات لمسية تستخدمان Rho-alpha لإدخال قابس. تواجه الذراع اليمنى صعوبة في المهمة ويتم مساعدتها بواسطة توجيه بشري في الوقت الحقيقي.

“يعمل فريقنا نحو تحسينات شاملة لخط أنابيب تدريب Rho-alpha ومجموعة بيانات التدريب من أجل الأداء والكفاءة في مهام المناولة الثنائية اليدين ذات الأهمية لمايكروسوفت وشركائنا”، قال لورينز. “النموذج حاليًا قيد التقييم على إعدادات الذراعين المزدوجة والروبوتات البشرية. سننشر وصفًا تقنيًا في الأشهر القادمة.”

ذكرت مايكروسوفت أنها تتطلع للعمل مع مصنعي الروبوتات، والمكاملين، والمستخدمين النهائيين لرؤية كيف يمكن أن تساعد تقنيات مثل Rho-alpha والأدوات المرتبطة بها في تدريبهم، ونشرهم، والتكيف المستمر مع الذكاء الاصطناعي الفيزيائي المستضاف في السحابة باستخدام بياناتهم الخاصة. ودعت الشركة الأطراف المهتمة للانضمام إلى برنامج الوصول المبكر للبحث الخاص بها.

تسعى مايكروسوفت إلى تعزيز التعاون مع الشركاء في مجال الروبوتات لتوسيع استخدام نموذج Rho-alpha في التطبيقات العملية.

مقالات ذات صلة

زر الذهاب إلى الأعلى