الذكاء الاصطناعي

الانطباعات الأولى عن GPT-5.2: تحديث قوي للأعمال

أصدرت OpenAI رسميًا GPT-5.2، وتظهر ردود الفعل من المختبرين الأوائل صورة ثنائية: قفزة هائلة في التفكير العميق والترميز، وتحديث تدريجي للمستخدمين العاديين.

الانطباعات الأولى عن GPT-5.2: تحديث قوي، خاصة للمهام التجارية وسير العمل

أصدرت OpenAI رسميًا GPT-5.2، وتظهر ردود الفعل من المختبرين الأوائل – الذين حصلوا على النموذج قبل الإصدار العام بعدة أيام، في بعض الحالات قبل أسابيع – صورة ثنائية: إنها قفزة هائلة إلى الأمام في التفكير العميق المستقل والترميز، لكنها قد تكون تحديثًا “تدريجيًا” غير مثير للاهتمام بالنسبة للمستخدمين العاديين.

بعد فترات الوصول المبكر وطرح اليوم الأوسع، بدأ التنفيذيون والمطورون والمحللون بمشاركة نتائج اختبارهم الأولى عبر منصة X (تويتر سابقًا) ومدونات الشركات.

إليكم ملخص لأهم ردود الفعل حول النموذج الرائد الأخير من OpenAI.

“الذكاء الاصطناعي كمحلل جاد”

تتركز أقوى الإشادات حول GPT-5.2 على قدرته على التعامل مع “المشكلات الصعبة” التي تتطلب وقت تفكير ممتد.

لم يتردد مات شومر، الرئيس التنفيذي لشركة HyperWriteAI، في وصف GPT-5.2 Pro بأنه “أفضل نموذج في العالم”.

أبرز شومر مثابرة النموذج، مشيرًا إلى أنه “يفكر لأكثر من ساعة في المشكلات الصعبة. ويحقق مهامًا لا يمكن لأي نموذج آخر إنجازها.”

تمت الإشادة بهذا الشعور من قبل ألي ك. ميلر، رائدة الأعمال في مجال الذكاء الاصطناعي والمديرة السابقة في AWS. وصفت ميلر النموذج بأنه خطوة نحو “الذكاء الاصطناعي كمحلل جاد” بدلاً من “رفيق ودود”.

“يبدو أن التفكير وحل المشكلات أقوى بشكل ملحوظ”، كتبت ميلر على X. “يقدم تفسيرات أعمق بكثير مما اعتدت على رؤيته. في إحدى اللحظات، كتب حرفيًا كودًا لتحسين OCR الخاص به في منتصف المهمة.”

مكاسب الشركات: Box تسجل قفزات أداء ملحوظة

يبدو أن التحديث أكثر أهمية لقطاع الشركات.

كشف آرون ليفي، الرئيس التنفيذي لشركة Box، على X أن شركته كانت تختبر GPT-5.2 في الوصول المبكر. وأفاد ليفي بأن النموذج يحقق “7 نقاط أفضل من GPT-5.1” في اختبارات التفكير الموسعة، التي تقارب الأعمال المعرفية في الخدمات المالية وعلوم الحياة.

“أدى النموذج معظم المهام بشكل أسرع بكثير من GPT-5.1 وGPT-5 أيضًا”، أشار ليفي، مؤكدًا أن Box AI ستقوم بطرح تكامل GPT-5.2 قريبًا.

توسعت روتوجا راجواد، مديرة تسويق المنتجات في Box، في هذا الأمر في منشور على مدونة الشركة، مشيرة إلى تحسينات محددة في زمن الاستجابة.

انخفضت مهام “الاستخراج المعقد” من 46 ثانية على GPT-5 إلى 12 ثانية فقط مع GPT-5.2.

كما لاحظت راجواد قفزة في قدرات التفكير لقطاع الإعلام والترفيه، حيث ارتفعت من 76% دقة في GPT-5.1 إلى 81% في النموذج الجديد.

قفزة “جدية” في الترميز والمحاكاة

يجد المطورون أن GPT-5.2 قوي بشكل خاص في “التوليد من مرة واحدة” لهياكل الكود المعقدة.

شارك بييترو شيرانو، الرئيس التنفيذي لشركة magicpathai، فيديو يظهر فيه النموذج وهو يبني محرك رسومات ثلاثية الأبعاد كامل في ملف واحد مع عناصر تحكم تفاعلية. “إنها قفزة جدية إلى الأمام في التفكير المعقد، الرياضيات، الترميز، والمحاكاة”، نشر شيرانو. “سرعة التقدم غير عادية.”

بالمثل، أظهر إيثان مولك، أستاذ في مدرسة وارتون للأعمال بجامعة بنسلفانيا ومستخدم وكاتب طويل الأمد لنماذج اللغة والذكاء الاصطناعي، قدرة النموذج على إنشاء ظل بصري معقد – مدينة نيو قوطية لا نهائية في محيط عاصف – عبر موجه واحد.

عصر الوكالة: الاستقلالية الطويلة الأمد

ربما يكون التحول الأكثر وظيفية هو قدرة النموذج على البقاء على المهمة لساعات دون فقدان الخيط.

أفاد دان شيبر، الرئيس التنفيذي لنشرة Every لاختبار الذكاء الاصطناعي، أن النموذج أجرى تحليل الربح والخسارة (P&L) بنجاح تطلب منه العمل بشكل مستقل لمدة ساعتين. “أجرى تحليل الربح والخسارة حيث عمل لمدة ساعتين وقدم لي نتائج رائعة”، كتب شيبر.

ومع ذلك، أشار شيبر أيضًا إلى أن التحديث يبدو “تدريجيًا في الغالب” بالنسبة للمهام اليومية.

في مقال لـ Every، كتبت كاتي باروت أنه بينما يتفوق GPT-5.2 في اتباع التعليمات، فإنه “أقل ابتكارًا” من المنافسين مثل Claude Opus 4.5 في بعض السياقات، مثل استنتاج موقع المستخدم من بيانات البريد الإلكتروني.

العيوب: السرعة والجمود

على الرغم من قدرات التفكير، إلا أن “الشعور” بالنموذج قد تلقى انتقادات.

أبرز شومر “عقوبة سرعة” كبيرة عند استخدام وضع التفكير للنموذج. “في تجربتي، وضع التفكير بطيء جدًا لمعظم الأسئلة”، كتب شومر في مراجعته المتعمقة. “أستخدم وضع الفوري تقريبًا أبداً.”

كما أشارت ألي ميلر إلى مشكلات في سلوك النموذج الافتراضي. “العيب هو النغمة والتنسيق”، لاحظت. “كانت الصوت الافتراضي أكثر صرامة، وسلوك الطول/التنسيق متطرفًا: سؤال بسيط تحول إلى 58 نقطة وعبارات مرقمة.”

الحكم

تشير ردود الفعل المبكرة إلى أن GPT-5.2 هو أداة موجهة للمستخدمين المحترفين، المطورين، ووكلاء الشركات بدلاً من المحادثات العادية. كما لخص شومر في مراجعته: “للبحث العميق، التفكير المعقد، والمهام التي تستفيد من التفكير الدقيق، يعد GPT-5.2 Pro الخيار الأفضل المتاح الآن.”

ومع ذلك، بالنسبة للمستخدمين الذين يبحثون عن الكتابة الإبداعية أو إجابات سريعة وسلسة، تظل نماذج مثل Claude Opus 4.5 منافسة قوية. “نموذجي المفضل يبقى Claude Opus 4.5″، اعترفت ميلر، “لكن عملي المعقد مع ChatGPT سيحصل على دفعة تدريجية لطيفة.”

تشير ردود الفعل المبكرة إلى أن GPT-5.2 هو أداة موجهة للمستخدمين المحترفين، بينما تظل نماذج أخرى قوية للمستخدمين العاديين.

مقالات ذات صلة

زر الذهاب إلى الأعلى