جوجل تطلق نموذج Gemini 2.5 Deep Think للذكاء الاصطناعي المتقدم

تستعد جوجل لإطلاق نموذجها الجديد Gemini 2.5 Deep Think، الذي يعد ثورة في عالم الذكاء الاصطناعي.
جوجل تطلق نموذج Gemini 2.5 Deep Think للذكاء الاصطناعي
تقوم جوجل بإطلاق نموذج Gemini 2.5 Deep Think، الذي تقول الشركة إنه أكثر نماذج الذكاء الاصطناعي تطورًا، حيث يمكنه الإجابة على الأسئلة من خلال استكشاف أفكار متعددة في وقت واحد واستخدام تلك النتائج لاختيار أفضل إجابة.
الوصول إلى النموذج الجديد
سيحصل المشتركون في اشتراك جوجل الفائق بقيمة 250 دولارًا شهريًا على الوصول إلى Gemini 2.5 Deep Think عبر تطبيق Gemini اعتبارًا من يوم الجمعة.
أداء النموذج في المسابقات
تم الكشف عن Gemini 2.5 Deep Think لأول مرة في مايو خلال مؤتمر Google I/O 2025، وهو أول نموذج متعدد الوكلاء متاح للجمهور. تستخدم هذه الأنظمة وكلاء ذكاء اصطناعي متعددين لمعالجة سؤال ما بشكل متوازي، مما يتطلب موارد حسابية أكبر بكثير من وكيل واحد، لكنه يميل إلى تقديم إجابات أفضل.
استخدمت جوجل إصدارًا من Gemini 2.5 Deep Think لتحقيق ميدالية ذهبية في أولمبياد الرياضيات الدولي (IMO) لهذا العام.
نموذج مخصص للأكاديميين
بالإضافة إلى Gemini 2.5 Deep Think، تقول الشركة إنها ستقوم بإصدار النموذج الذي استخدمته في IMO لمجموعة مختارة من الرياضيين والأكاديميين. تقول جوجل إن هذا النموذج “يستغرق ساعات للتفكير”، بدلاً من ثوانٍ أو دقائق مثل معظم نماذج الذكاء الاصطناعي الموجهة للمستهلكين. تأمل الشركة أن يعزز نموذج IMO جهود البحث، وتهدف إلى الحصول على تعليقات حول كيفية تحسين النظام متعدد الوكلاء للاستخدام الأكاديمي.
تحسينات ملحوظة
تشير جوجل إلى أن نموذج Gemini 2.5 Deep Think يمثل تحسينًا كبيرًا عما أعلنته في I/O. كما تدعي الشركة أنها طورت “تقنيات تعلم تعزيزية جديدة” لتشجيع Gemini 2.5 Deep Think على استخدام مسارات التفكير بشكل أفضل.
“يمكن أن تساعد Deep Think الناس في مواجهة المشكلات التي تتطلب الإبداع والتخطيط الاستراتيجي وتحسينات خطوة بخطوة،” قالت جوجل في منشور مدونة شاركته مع TechCrunch.
أداء النموذج في الاختبارات
تقول الشركة إن Gemini 2.5 Deep Think يحقق أداءً رائدًا في اختبار “اختبار الإنسانية الأخير” (HLE) – وهو اختبار صعب يقيس قدرة الذكاء الاصطناعي على الإجابة على آلاف الأسئلة المستندة إلى الحشود عبر الرياضيات والعلوم الإنسانية والعلوم. تدعي جوجل أن نموذجها سجل 34.8% في HLE (بدون أدوات)، مقارنةً بـ xAI’s Grok 4 الذي سجل 25.4% وOpenAI’s o3 الذي سجل 20.3%.
تقول جوجل أيضًا إن Gemini 2.5 Deep Think يتفوق على نماذج الذكاء الاصطناعي من OpenAI وxAI وAnthropic في LiveCodeBench6، وهو اختبار صعب لمهام البرمجة التنافسية. سجل نموذج جوجل 87.6%، بينما سجل Grok 4 79% وOpenAI’s o3 72%.
التطبيقات العملية للنموذج
يعمل Gemini 2.5 Deep Think تلقائيًا مع أدوات مثل تنفيذ الشيفرة والبحث في جوجل، وتقول الشركة إنه قادر على إنتاج “استجابات أطول بكثير” من النماذج التقليدية.
في اختبارات جوجل، أنتج النموذج مهام تطوير ويب أكثر تفصيلاً وجاذبية من الناحية الجمالية مقارنةً بالنماذج الأخرى. تدعي الشركة أن النموذج يمكن أن يساعد الباحثين و”يُسرع الطريق نحو الاكتشاف”.
الاتجاهات المستقبلية
يبدو أن العديد من مختبرات الذكاء الاصطناعي الرائدة تتجه نحو نهج الوكلاء المتعددين.
أصدرت xAI التابعة لإيلون ماسك مؤخرًا نظامًا متعدد الوكلاء خاص بها، Grok 4 Heavy، الذي تقول إنه حقق أداءً رائدًا في عدة معايير. قال الباحث في OpenAI، نعوم براون، في بودكاست إن النموذج غير المعلن الذي استخدمته الشركة لتحقيق ميدالية ذهبية في أولمبياد الرياضيات الدولي (IMO) لهذا العام كان أيضًا نظامًا متعدد الوكلاء. في غضون ذلك، يتم تشغيل وكيل البحث من Anthropic، الذي ينتج ملخصات بحثية شاملة، أيضًا بواسطة نظام متعدد الوكلاء.
على الرغم من الأداء القوي، يبدو أن الأنظمة متعددة الوكلاء أكثر تكلفة من النماذج التقليدية. وهذا يعني أن شركات التكنولوجيا قد تحتفظ بهذه الأنظمة خلف خطط الاشتراك الأكثر تكلفة، وهو ما اختارته xAI والآن جوجل.
في الأسابيع المقبلة، تقول جوجل إنها تخطط لمشاركة Gemini 2.5 Deep Think مع مجموعة مختارة من المختبرين عبر واجهة برمجة التطبيقات Gemini. تقول الشركة إنها تريد فهم كيفية استخدام المطورين والشركات لنظامها متعدد الوكلاء.
مع استمرار تطور تقنيات الذكاء الاصطناعي، يبقى نموذج Gemini 2.5 Deep Think في طليعة الابتكار، مما يفتح آفاقًا جديدة في مجالات البحث والتطوير.




