إطلاق Google Gemini Deep Think AI: نموذج التفكير المتقدم

تقوم Google DeepMind بإطلاق Gemini 2.5 Deep Think، والذي تقول الشركة إنه أكثر نماذج الذكاء الاصطناعي تقدمًا في مجال التفكير، حيث يمكنه الإجابة على الأسئلة من خلال استكشاف أفكار متعددة في وقت واحد، ثم استخدام تلك النتائج لاختيار أفضل إجابة.
سيحصل مشتركو خدمة Google البالغة 250 دولارًا شهريًا على إمكانية الوصول إلى Gemini 2.5 Deep Think في تطبيق Gemini اعتبارًا من يوم الجمعة.
ما هو Gemini 2.5 Deep Think؟
تم الكشف عن Gemini 2.5 Deep Think لأول مرة في مايو خلال مؤتمر Google I/O 2025، وهو أول نموذج متعدد الوكلاء متاح للجمهور من Google. تقوم هذه الأنظمة بتوليد عدة وكلاء ذكاء اصطناعي للتعامل مع سؤال ما بشكل متوازي، وهي عملية تتطلب موارد حسابية أكبر بكثير من نموذج واحد، ولكنها تميل إلى تقديم إجابات أفضل.
إنجازات Gemini 2.5 Deep Think
استخدمت Google نسخة معدلة من Gemini 2.5 Deep Think للحصول على ميدالية ذهبية في أولمبياد الرياضيات الدولي (IMO) هذا العام.
بالإضافة إلى Gemini 2.5 Deep Think، تقول الشركة إنها ستقوم بإصدار النموذج الذي استخدمته في IMO لمجموعة مختارة من الرياضيين والأكاديميين. وتقول Google إن هذا النموذج من الذكاء الاصطناعي “يستغرق ساعات للتفكير”، بدلاً من ثوانٍ أو دقائق مثل معظم نماذج الذكاء الاصطناعي الموجهة للمستهلكين. وتأمل الشركة أن يعزز نموذج IMO جهود البحث، وتهدف إلى الحصول على ملاحظات حول كيفية تحسين النظام متعدد الوكلاء للاستخدام الأكاديمي.
تحسينات جديدة
تشير Google إلى أن نموذج Gemini 2.5 Deep Think يمثل تحسينًا كبيرًا عما أعلنته في I/O. وتزعم الشركة أنها طورت “تقنيات جديدة للتعلم المعزز” لتشجيع Gemini 2.5 Deep Think على استخدام مسارات التفكير بشكل أفضل.
“يمكن أن يساعد Deep Think الناس في معالجة المشكلات التي تتطلب الإبداع، والتخطيط الاستراتيجي، وإجراء التحسينات خطوة بخطوة،” كما قالت Google في منشور مدونة شاركته مع TechCrunch.
أداء النموذج
تقول الشركة إن Gemini 2.5 Deep Think يحقق أداءً رائدًا في اختبار “آخر امتحان للبشرية” (HLE) – وهو اختبار صعب يقيس قدرة الذكاء الاصطناعي على الإجابة على الآلاف من الأسئلة المجمعة عبر الرياضيات والعلوم والعلوم الإنسانية. وتزعم Google أن نموذجها سجل 34.8% في HLE (بدون أدوات)، مقارنةً بـ xAI’s Grok 4، الذي سجل 25.4%، وOpenAI’s o3، الذي سجل 20.3%.
تقول Google أيضًا إن Gemini 2.5 Deep Think يتفوق على نماذج الذكاء الاصطناعي من OpenAI وxAI وAnthropic في LiveCodeBench6، وهو اختبار صعب لمهام البرمجة التنافسية. سجل نموذج Google 87.6%، بينما سجل Grok 4 79%، وسجل OpenAI’s o3 72%.
القدرات التلقائية
يعمل Gemini 2.5 Deep Think تلقائيًا مع أدوات مثل تنفيذ الشيفرة وGoogle Search، وتقول الشركة إنه قادر على إنتاج “استجابات أطول بكثير” من نماذج الذكاء الاصطناعي التقليدية.
في اختبارات Google، أنتج النموذج مهام تطوير ويب أكثر تفصيلاً وجاذبية مقارنةً بالنماذج الأخرى. وتزعم الشركة أن النموذج يمكن أن يساعد الباحثين و”قد يسرع الطريق نحو الاكتشاف”.
توجهات جديدة في الذكاء الاصطناعي
يبدو أن العديد من مختبرات الذكاء الاصطناعي الرائدة تتقارب حول النهج متعدد الوكلاء.
أصدرت xAI، التي يرأسها إيلون ماسك، مؤخرًا نظامًا متعدد الوكلاء خاص بها، Grok 4 Heavy، والذي تقول إنه حقق أداءً رائدًا في الصناعة على عدة معايير. قال الباحث في OpenAI، نوام براون، في بودكاست إن النموذج غير المعلن الذي استخدمته الشركة لتحقيق الميدالية الذهبية في أولمبياد الرياضيات الدولي (IMO) هذا العام كان أيضًا نظامًا متعدد الوكلاء. وفي الوقت نفسه، يتم تشغيل وكيل البحث الخاص بـ Anthropic، الذي ينتج ملخصات بحثية شاملة، أيضًا بواسطة نظام متعدد الوكلاء.
على الرغم من الأداء القوي، يبدو أن الأنظمة متعددة الوكلاء تتطلب تكلفة أعلى للخدمة مقارنةً بنماذج الذكاء الاصطناعي التقليدية. وهذا يعني أن شركات التكنولوجيا قد تبقي هذه الأنظمة محصورة خلف خطط الاشتراك الأكثر تكلفة، كما اختارت xAI والآن Google القيام بذلك.
في الأسابيع المقبلة، تقول Google إنها تخطط لمشاركة Gemini 2.5 Deep Think مع مجموعة مختارة من المختبرين عبر واجهة برمجة تطبيقات Gemini. وتقول الشركة إنها تريد أن تفهم بشكل أفضل كيف يمكن للمطورين والشركات استخدام نظامها متعدد الوكلاء.