الذكاء الاصطناعي

أنتروبيك تحل مشكلة الوكيل طويل الأمد مع SDK Claude متعدد الجلسات

تعتبر ذاكرة الوكلاء من التحديات الرئيسية التي تواجه المؤسسات في مجال الذكاء الاصطناعي. في هذا المقال، نستعرض كيف قامت شركة أنتروبيك بحل هذه المشكلة من خلال تطوير مجموعة أدوات Claude Agent SDK.

مشكلة ذاكرة الوكيل

تظل ذاكرة الوكلاء مشكلة يرغب العديد من المؤسسات في حلها، حيث ينسى الوكلاء بعض التعليمات أو المحادثات كلما طالت مدة تشغيلهم.

تعتقد شركة أنتروبيك أنها قد حلت هذه المشكلة من خلال مجموعة أدوات Claude Agent SDK، حيث طورت حلاً مزدوجًا يسمح للوكيل بالعمل عبر نوافذ سياق مختلفة.

“التحدي الأساسي للوكلاء الذين يعملون لفترات طويلة هو أنهم يجب أن يعملوا في جلسات منفصلة، وتبدأ كل جلسة جديدة بدون ذاكرة لما حدث من قبل”، كتبت أنتروبيك في منشور مدونة. “نظرًا لأن نوافذ السياق محدودة، ولأن معظم المشاريع المعقدة لا يمكن إنجازها في نافذة واحدة، يحتاج الوكلاء إلى وسيلة لسد الفجوة بين جلسات البرمجة.”

اقترح مهندسو أنتروبيك نهجًا مزدوجًا لمجموعة أدوات الوكيل: وكيل مبدئي لإعداد البيئة، ووكيل برمجة لتحقيق تقدم تدريجي في كل جلسة وترك آثار للجلسة التالية.

كيف يعمل

حددت أنتروبيك أنه على الرغم من أن مجموعة أدوات Claude Agent SDK كانت تحتوي على قدرات إدارة السياق و”يجب أن يكون من الممكن لوكيل الاستمرار في القيام بعمل مفيد لفترة زمنية غير محددة”، إلا أن ذلك لم يكن كافيًا. قالت الشركة في منشور مدونتها إن نموذجًا مثل Opus 4.5 الذي يعمل على مجموعة أدوات Claude Agent SDK يمكن أن “يفشل في بناء تطبيق ويب بجودة إنتاج إذا تم إعطاؤه فقط موجهًا عالي المستوى، مثل ‘بناء نسخة من claude.ai.'”

تجلت الإخفاقات في نمطين، كما قالت أنتروبيك. أولاً، حاول الوكيل القيام بالكثير، مما تسبب في نفاد سياق النموذج في منتصف العملية. ثم يتعين على الوكيل أن يخمن ما حدث ولا يمكنه تمرير تعليمات واضحة للوكيل التالي. يحدث الفشل الثاني في وقت لاحق، بعد أن تم بناء بعض الميزات بالفعل. يرى الوكيل أن تقدمًا قد تم إحرازه ويعلن ببساطة أن المهمة قد اكتملت.

قسم باحثو أنتروبيك الحل: إعداد بيئة أولية لوضع الأساس للميزات، وتحفيز كل وكيل لتحقيق تقدم تدريجي نحو هدف، مع ترك لوحة نظيفة في النهاية.

هنا يأتي الحل المكون من جزئين لوكيل أنتروبيك. يقوم الوكيل المبدئي بإعداد البيئة، وتسجيل ما قام به الوكلاء وأي ملفات تم إضافتها. ثم يطلب وكيل البرمجة من النماذج تحقيق تقدم تدريجي وترك تحديثات منظمة.

“استلهمت هذه الممارسات من معرفة ما يفعله مهندسو البرمجيات الفعالون كل يوم”، قالت أنتروبيك.

قال الباحثون إنهم أضافوا أدوات اختبار لوكيل البرمجة، مما يحسن قدرته على تحديد وإصلاح الأخطاء التي لم تكن واضحة من الشيفرة وحدها.

البحث المستقبلي

لاحظت أنتروبيك أن نهجها هو “مجموعة ممكنة من الحلول في حزمة الوكيل طويل الأمد.” ومع ذلك، فإن هذه مجرد المرحلة الأولى مما قد يصبح مجال بحث أوسع للعديد في مجال الذكاء الاصطناعي.

قالت الشركة إن تجاربها لتعزيز الذاكرة طويلة الأمد للوكلاء لم تظهر ما إذا كان وكيل برمجة عام واحد يعمل بشكل أفضل عبر السياقات أو هيكل متعدد الوكلاء.

ركزت تجربتها أيضًا على تطوير تطبيق ويب كامل، لذا يجب أن تركز تجارب أخرى على تعميم النتائج عبر مهام مختلفة.

“من المحتمل أن يمكن تطبيق بعض أو كل هذه الدروس على أنواع المهام الوكيلية طويلة الأمد المطلوبة في، على سبيل المثال، البحث العلمي أو النمذجة المالية”، قالت أنتروبيك.

مع استمرار البحث والتطوير في مجال الذكاء الاصطناعي، من المتوقع أن تساهم الحلول المبتكرة مثل SDK Claude في تحسين أداء الوكلاء وتوسيع نطاق استخداماتهم في مختلف المجالات.

مقالات ذات صلة

زر الذهاب إلى الأعلى