لماذا قد يحل بحث ملفات جوجل محل أنظمة RAG التقليدية

تعتبر تقنية الجيل المعزز للاسترجاع (RAG) أداة حيوية للمؤسسات، ولكن هل يمكن أن يحل بحث ملفات جوجل محلها؟
لماذا قد يحل بحث ملفات جوجل محل أنظمة RAG التقليدية في المؤسسات
في الوقت الحالي، تدرك المؤسسات أن تقنية الجيل المعزز للاسترجاع (RAG) تتيح للتطبيقات والوكالات العثور على أفضل المعلومات الموثوقة للاستفسارات. ومع ذلك، فإن إعدادات RAG التقليدية قد تكون تحديًا هندسيًا وتظهر أيضًا سمات غير مرغوب فيها.
لمساعدة المؤسسات في ذلك، أصدرت جوجل أداة بحث الملفات على واجهة برمجة التطبيقات Gemini، وهي نظام RAG مُدار بالكامل “يُبسط عملية الاسترجاع”. تزيل أداة بحث الملفات الكثير من العمليات المعقدة لجمع الأدوات والتطبيقات اللازمة لإعداد خطوط أنابيب RAG، مما يعني أن المهندسين لا يحتاجون إلى تجميع حلول التخزين ومولدات التضمين.
تتنافس هذه الأداة مباشرة مع منتجات RAG الخاصة بالشركات من OpenAI وAWS ومايكروسوفت، والتي تهدف أيضًا إلى تبسيط بنية RAG. ومع ذلك، تدعي جوجل أن عرضها يتطلب تنسيقًا أقل ويكون أكثر استقلالية.
قالت جوجل في منشور على مدونتها: “يوفر بحث الملفات طريقة بسيطة ومتكاملة وقابلة للتوسع لربط Gemini ببياناتك، مما يوفر استجابات أكثر دقة وملاءمة وقابلة للتحقق”.
يمكن للمؤسسات الوصول إلى بعض ميزات بحث الملفات، مثل التخزين وتوليد التضمين، مجانًا عند وقت الاستعلام. سيبدأ المستخدمون في دفع رسوم التضمين عندما يتم فهرسة هذه الملفات بمعدل ثابت قدره 0.15 دولار لكل مليون رمز.
يعمل نموذج التضمين Gemini من جوجل، الذي أصبح في النهاية أفضل نموذج تضمين في معيار Massive Text Embedding، على تشغيل بحث الملفات.
بحث الملفات والتجارب المتكاملة
تقول جوجل إن بحث الملفات يعمل “من خلال التعامل مع تعقيدات RAG من أجلك”.
يدير بحث الملفات تخزين الملفات واستراتيجيات التجزئة والتضمين. يمكن للمطورين استدعاء بحث الملفات ضمن واجهة برمجة التطبيقات generateContent الموجودة، والتي قالت جوجل إنها تجعل الأداة أسهل في الاعتماد.
يستخدم بحث الملفات البحث المتجه “لفهم معنى وسياق استفسار المستخدم”. من الناحية المثالية، سيجد المعلومات ذات الصلة للإجابة على استفسار من الوثائق، حتى لو كانت المطالبة تحتوي على كلمات غير دقيقة.
تحتوي الميزة على اقتباسات مدمجة تشير إلى الأجزاء المحددة من المستند التي استخدمتها لتوليد الإجابات، وتدعم أيضًا مجموعة متنوعة من تنسيقات الملفات. تشمل هذه التنسيقات PDF وDocx وtxt وJSON و”العديد من أنواع ملفات لغات البرمجة الشائعة”، كما تقول جوجل.
التجريب المستمر في RAG
قد تكون المؤسسات قد بدأت بالفعل في بناء خط أنابيب RAG حيث تضع الأساس لوكلائها الذكاء الاصطناعي للوصول إلى البيانات الصحيحة واتخاذ قرارات مستنيرة.
نظرًا لأن RAG يمثل جزءًا رئيسيًا من كيفية الحفاظ على دقة المؤسسات والوصول إلى رؤى حول أعمالهم، يجب على المنظمات أن تكون لديها رؤية سريعة في هذا الخط. يمكن أن يكون RAG مصدر ألم هندسي لأن تنسيق أدوات متعددة معًا يمكن أن يصبح معقدًا.
يتطلب بناء خطوط أنابيب RAG “التقليدية” أن تقوم المنظمات بتجميع وتعديل برنامج إدخال وتحليل الملفات، بما في ذلك التجزئة وتوليد التضمين والتحديثات. يجب عليهم بعد ذلك التعاقد مع قاعدة بيانات متجهة مثل Pinecone، وتحديد منطق الاسترجاع الخاص بها، وملاءمتها جميعًا ضمن نافذة سياق النموذج. بالإضافة إلى ذلك، يمكنهم، إذا رغبوا، إضافة اقتباسات المصدر.
تهدف أداة بحث الملفات إلى تبسيط كل ذلك، على الرغم من أن المنصات المنافسة تقدم ميزات مماثلة. تتيح واجهة برمجة التطبيقات Assistants من OpenAI للمطورين استخدام ميزة بحث الملفات، مما يوجه الوكيل إلى الوثائق ذات الصلة للحصول على استجابات. قدمت AWS خدمة إدارة أتمتة البيانات في ديسمبر.
بينما يقف بحث الملفات بشكل مشابه لهذه المنصات الأخرى، فإن عرض جوجل يُبسط جميع عناصر إنشاء خط أنابيب RAG، وليس بعضًا منها فقط.
قالت Phaser Studio، منشئ منصة توليد الألعاب المدفوعة بالذكاء الاصطناعي Beam، في مدونة جوجل إنها استخدمت بحث الملفات لتصفية مكتبتها المكونة من 3000 ملف.
قال ريتشارد ديفي، المدير الفني لشركة Phaser: “يسمح لنا بحث الملفات بسطح المواد الصحيحة على الفور، سواء كانت مقطعًا برمجيًا لنماذج الرصاص، أو قوالب الأنواع، أو إرشادات معمارية من مجموعة ‘عقل’ Phaser لدينا”. “النتيجة هي أفكار كانت تستغرق أيامًا لتجربتها أصبحت قابلة للعب في دقائق.”
منذ الإعلان، أعرب العديد من المستخدمين عن اهتمامهم باستخدام هذه الميزة.
مع استمرار تطور التكنولوجيا، يبقى أن نرى كيف ستؤثر أداة بحث الملفات على مستقبل أنظمة RAG في المؤسسات.




