الذكاء الاصطناعي يتفوق على الإنسان في الإبداع

تستعرض هذه المقالة كيف استطاع الذكاء الاصطناعي تجاوز الإنسان المتوسط في اختبارات الإبداع اللغوي، مما يثير تساؤلات حول طبيعة الإبداع.
الذكاء الاصطناعي يتفوق الآن على الإنسان المتوسط في اختبارات الإبداع
الإبداع هو سمة يقول النقاد إن الذكاء الاصطناعي من المحتمل أن يبقى محصورًا في البشر لفترة طويلة. لكن دراسة واسعة النطاق تجد أن النماذج اللغوية التوليدية الرائدة يمكنها الآن تجاوز أداء الإنسان المتوسط في اختبارات الإبداع اللغوي.
لقد اكتسبت مسألة ما إذا كانت الآلات قادرة على الإبداع أهمية جديدة في السنوات الأخيرة بفضل ظهور أدوات الذكاء الاصطناعي التي يمكنها توليد نصوص وصور بأسلوب وطلاقة. بينما يقول العديد من الخبراء إن الإبداع الحقيقي مستحيل بدون تجربة حية في العالم، فإن المخرجات المتطورة بشكل متزايد لهذه النماذج تتحدى هذه الفكرة.
في محاولة لإلقاء نظرة أكثر موضوعية على القضية، قام باحثون من جامعة مونتريال، بما في ذلك رائد الذكاء الاصطناعي يوشوا بنجيو، بإجراء ما يقولون إنه أكبر تقييم مقارن للإبداع بين الآلات والبشر حتى الآن. قارن الفريق بين مخرجات النماذج الذكية الرائدة وبين ردود من 100,000 مشارك بشري باستخدام اختبار نفسي موحد للإبداع ووجدوا أن أفضل النماذج تتفوق الآن على الإنسان المتوسط، على الرغم من أنها لا تزال تتخلف عن أفضل المؤدين بفارق كبير.
قال كريم جيربي، الذي قاد الدراسة، في بيان صحفي: “قد تكون هذه النتيجة مفاجئة – حتى مزعجة – ولكن دراستنا تسلط الضوء أيضًا على ملاحظة مهمة بنفس القدر: حتى أفضل أنظمة الذكاء الاصطناعي لا تزال تقصر عن المستويات التي يصل إليها أكثر البشر إبداعًا”.
الاختبار الذي يتوسط الدراسة، المنشور في Scientific Reports، يعرف باسم مهمة الارتباط المتباين ويتضمن من المشاركين توليد 10 كلمات بمعاني متباينة قدر الإمكان. كلما زادت المسافة الدلالية المتوسطة بين الكلمات، زادت الدرجة.
يتوافق الأداء في هذا الاختبار لدى البشر مع اختبارات إبداعية أخرى معروفة تركز على توليد الأفكار، والكتابة، وحل المشكلات الإبداعية. ولكن بشكل حاسم، فإنه سريع الإكمال، مما سمح للباحثين باختبار مجموعة أكبر بكثير من البشر عبر الإنترنت.
ما وجدوه كان لافتًا. تفوقت نماذج OpenAI مثل GPT-4، وGoogle’s Gemini Pro 1.5، وMeta’s Llama 3 وLlama 4 على الإنسان المتوسط. ومع ذلك، عند قياس الأداء المتوسط لأفضل 50% من المشاركين البشر، تجاوز كل النماذج المختبرة. اتسع الفارق أكثر عندما أخذوا متوسط أفضل 25% وأفضل 10% من البشر.
أراد الباحثون أن يروا ما إذا كانت هذه الدرجات ستترجم إلى مهام إبداعية أكثر تعقيدًا، لذلك طلبوا من النماذج توليد هايكو، وملخصات حبكة أفلام، وكتابات قصيرة. قاموا بتحليل المخرجات باستخدام مقياس يسمى دمج دلالي متباين، والذي يقدر تنوع الأفكار المدمجة في السرد. بينما أدت النماذج بشكل جيد نسبيًا، وجد الفريق أن العينات المكتوبة بواسطة البشر كانت لا تزال أكثر إبداعًا بكثير من تلك المكتوبة بواسطة الذكاء الاصطناعي.
ومع ذلك، اكتشف الفريق أيضًا أنهم يستطيعون تعزيز إبداع الذكاء الاصطناعي من خلال بعض التعديلات البسيطة. كان الأول يتعلق بضبط إعداد يسمى درجة الحرارة، الذي يتحكم في عشوائية مخرجات النموذج. عندما تم رفعه إلى الحد الأقصى على GPT-4، تجاوزت درجات إبداع النموذج 72% من المشاركين البشر.
كما وجد الباحثون أن ضبط التعليمات المقدمة للنموذج ساعد أيضًا. عندما تم توجيههم بوضوح لاستخدام “استراتيجية تعتمد على تنويع الاشتقاق”، حقق كل من GPT-3.5 وGPT-4 نتائج أفضل من تلك التي حصلوا عليها عند إعطائهم التعليمات الأصلية الأقل تحديدًا.
بالنسبة للمحترفين في مجال الإبداع، يقول جيربي إن الفجوة المستمرة بين أفضل المؤدين البشر حتى مع أكثر النماذج تقدمًا يجب أن توفر بعض الطمأنينة. لكنه يعتقد أيضًا أن النتائج تشير إلى أن الناس يجب أن يأخذوا هذه النماذج على محمل الجد كمتعاونين إبداعيين محتملين.
قال: “لقد أصبح الذكاء الاصطناعي التوليدي أداة قوية للغاية في خدمة الإبداع البشري. لن يحل محل المبدعين، لكنه سيحول بشكل عميق كيف يتخيلون، ويستكشفون، ويبدعون – لأولئك الذين يختارون استخدامه”.
على أي حال، تضيف الدراسة إلى مجموعة متزايدة من الأبحاث التي تثير أسئلة غير مريحة حول ما يعنيه أن تكون مبدعًا وما إذا كانت سمة فريدة للبشر. نظرًا لقوة المشاعر حول هذه القضية، من غير المرجح أن تحل الدراسة الأمر، لكن النتائج تمثل واحدة من أكثر المحاولات الملموسة لقياس السؤال بشكل موضوعي.
تستمر الأبحاث في تسليط الضوء على دور الذكاء الاصطناعي في الإبداع، مما يفتح آفاقًا جديدة لفهم العلاقة بين البشر والتكنولوجيا.




