Genie 3 من DeepMind: نموذج العوالم التفاعلية يمهّد الطريق للذكاء العام الاصطناعي AGI

كشفت شركة Google DeepMind عن Genie 3، أحدث نموذج توليدي للعوالم الافتراضية (World Model) يُستخدم لتدريب الوكلاء الذكيين لأداء مهام عامة، وهي قدرة تعتبرها الشركة خطوة محورية نحو الوصول إلى “الذكاء العام الاصطناعي” أو AGI، أي الذكاء المشابه للبشر.
“Genie 3 هو أول نموذج عالمي تفاعلي في الزمن الحقيقي يمكن استخدامه لأغراض عامة”، كما صرّح شلومي فروختر، مدير الأبحاث في DeepMind. “إنه يتجاوز النماذج المحدودة التي سبقته، فهو لا يقتصر على بيئة واحدة، بل بإمكانه توليد عوالم فوتوغرافية أو خيالية، وكل ما بينهما.”
قفزة نوعية مقارنة بالنسخ السابقة
رغم أن Genie 3 لا يزال في مرحلة المعاينة البحثية ولم يُطرح للعامة، إلا أنه يبني على قدرات سابقه Genie 2 (الذي كان يُولّد بيئات جديدة للوكلاء) ونموذج الفيديو المتقدم Veo 3، الذي يُقال إنه يتمتع بفهم عميق للفيزياء.
باستخدام أمر نصي بسيط، يمكن لـ Genie 3 توليد دقائق متعددة من بيئات ثلاثية الأبعاد تفاعلية بدقة 720p وبمعدل 24 إطارًا في الثانية – وهو تطور كبير مقارنة بـ Genie 2 الذي لم يتجاوز 10 إلى 20 ثانية.
كما يتميز Genie 3 بإمكانية إنشاء أحداث داخل العالم المولد استجابة للأوامر النصية، وهي ميزة تُعرف باسم “promptable world events”.
الذاكرة والاتساق الفيزيائي
واحدة من أبرز قدرات Genie 3 هي الاتساق الفيزيائي في المحاكاة. فالنموذج يتذكر ما تم توليده مسبقًا، رغم أن الباحثين في DeepMind لم يبرمجوا هذه القدرة صراحة، بل ظهرت كخاصية ناشئة في البنية.
“النموذج يعمل بطريقة auto-regressive، أي أنه يولد إطارًا واحدًا في كل مرة، ويتعين عليه الرجوع إلى ما وُلد مسبقًا لتحديد ما سيأتي بعده”، أوضح فروختر.
هذا النوع من الذاكرة يعزز واقعية المحاكاة، مما يتيح للنموذج تطوير فهم تلقائي للعالم الفيزيائي، بطريقة مشابهة للطريقة التي يدرك بها البشر أن كوبًا على حافة الطاولة قد يسقط، أو أنه يجب الانحناء لتجنب جسم ساقط.
تدريب الوكلاء الذكيين
يعتقد باحثو DeepMind أن نماذج العوالم هي المفتاح لتدريب وكلاء ذكيين متجسدين (Embodied Agents)، خصوصًا لأن محاكاة سيناريوهات العالم الحقيقي تُعد تحديًا كبيرًا.
“نحن نعتقد أن هذه النماذج ضرورية لتقدم الذكاء العام الاصطناعي”، أضاف جاك باركر-هولدر من فريق Open-Endedness في DeepMind.
كمثال، استخدمت DeepMind Genie 3 لاختبار النسخة الأحدث من وكيلها العام SIMA، الذي طُلب منه تنفيذ مهام مثل: “اقترب من آلة ضغط النفايات الخضراء”، أو “اتجه إلى الرافعة الحمراء الممتلئة”.
“في جميع الحالات، تمكن وكيل SIMA من تنفيذ المهمة بنجاح”، بحسب باركر-هولدر. “Genie 3 كان يحاكي العالم حوله باستمرار، وهو ما مكّن الوكيل من التفاعل بشكل صحيح.”
القيود الحالية
رغم هذه الإنجازات، لا يخلو Genie 3 من التحديات:
-
النموذج لا يزال غير دقيق في بعض الجوانب الفيزيائية (مثال: تفاعل المتزلج مع الثلج).
-
الوكيل لا يمكنه تنفيذ جميع الأحداث التفاعلية داخل البيئة.
-
من الصعب حاليًا نمذجة التفاعلات المعقدة بين وكلاء متعددين.
-
مدة التفاعل ما تزال محدودة لبضع دقائق، بينما يُفترض أن تدوم لساعات في حالات التدريب الواقعي.
الطريق نحو الذكاء العام الاصطناعي AGI
مع ذلك، يُمثّل Genie 3 خطوة كبيرة في تعليم الوكلاء الذكاء الاصطناعي كيف يخطط، يستكشف، ويُجري التجارب الذاتية – وهي عناصر أساسية في الوصول إلى الذكاء العام الاصطناعي.
“لم نشهد بعد لحظة ‘Move 37’ الخاصة بالوكلاء المتجسدين” – في إشارة إلى الحركة الأسطورية التي قام بها AlphaGo ضد بطل العالم لي سيدول عام 2016. “لكن الآن، قد نكون على أعتاب عصر جديد.”