الذكاء الاصطناعي

Google تطلق نموذج Gemini Embedding: الأول عالميًا في تصنيف MTEB

أعلنت Google رسميًا عن الإتاحة العامة لنموذجها الجديد عالي الأداء Gemini Embedding، والذي أصبح جزءًا أساسيًا من Gemini API ومنصة Vertex AI. ويأتي هذا النموذج متصدرًا الترتيب العام في معيار Massive Text Embedding Benchmark (MTEB)، المرموق في تقييم نماذج التضمين.

وتم تصميم هذا النموذج لتمكين المطورين من بناء تطبيقات متقدمة مثل البحث الدلالي (semantic search) وأنظمة الاسترجاع المعزز بالتوليد (RAG).

ما هو نموذج Gemini Embedding؟

نماذج التضمين (Embeddings) تقوم بتحويل النصوص أو البيانات إلى قوائم عددية تمثل المعنى الدلالي، ما يسمح بقياس التشابه بين الكلمات أو الجمل أو حتى الصور والفيديو والصوت. وهذا يمكّن الذكاء الاصطناعي من فهم العلاقات العميقة بين المحتويات بعيدًا عن مطابقة الكلمات فقط.

مثلاً، يمكن لشركات التجارة الإلكترونية استخدام نموذج متعدد الوسائط لتوليد تمثيلات رقمية موحدة لمنتجات تجمع بين النص والصورة.

أبرز مزايا نموذج Gemini Embedding:

  • تقنية Matryoshka Representation Learning (MRL): تتيح استخراج تضمينات عالية الدقة (3072 بُعدًا)، أو تقليصها إلى 1536 أو 768 مع الحفاظ على المعلومات الأهم، مما يسمح بتحقيق توازن بين الدقة والتكلفة والأداء.

  • جاهزية متعددة المجالات: يمكن للنموذج العمل بكفاءة في مجالات مثل القانون، التمويل، والهندسة دون الحاجة إلى إعادة تدريب.

  • دعم أكثر من 100 لغة.

  • تكلفة منخفضة: بسعر تنافسي يبلغ 0.15 دولار لكل مليون رمز إدخال.

حالات استخدام المؤسسات

يمكن استخدام نموذج Gemini في:

المنافسة المحتدمة

رغم تصدّر Google، إلا أن المنافسة شديدة، خاصة من نماذج المصدر المفتوح. ويُعد نموذج Qwen3-Embedding من علي بابا الأقرب، إذ يأتي في المركز الثاني مباشرة ضمن نفس تصنيف MTEB، مع توفره برخصة Apache 2.0 المفتوحة للاستخدام التجاري.

من أبرز المنافسين الآخرين:

  • OpenAI Embedding Models: مستخدمة على نطاق واسع عالميًا.

  • Mistral: يقدّم نموذجًا مخصصًا لاسترجاع الشيفرات البرمجية.

  • Cohere Embed 4: يُركّز على البيانات الفوضوية داخل الشركات (أخطاء إملائية، مستندات ممسوحة، إلخ) ويتيح نشر النموذج محليًا على السحابة الخاصة أو الخوادم الداخلية، وهو مثالي للقطاعات الحساسة مثل الصحة والتمويل.

  • Qodo-Embed-1-1.5B: نموذج مفتوح المصدر متخصص في الشيفرة البرمجية ويتفوّق على نماذج أكبر في بعض التخصصات.

بين الملكية والمصدر المفتوح

تعتمد المؤسسات اليوم على اختيار استراتيجي بين:

  • نموذج Google المغلق: متكامل بسلاسة في بيئة Google Cloud، سهل الاستخدام، يدعم MLOps، وفعال عبر المجالات.

  • نماذج مفتوحة المصدر مثل Qwen3: تمنح تحكمًا أكبر، وخيارات نشر مرنة، وتحسينًا لتكلفة البنية التحتية، مع أداء لا يقل عن النماذج المغلقة.

في وقتٍ تُسرّع فيه الشركات من تبنّي تقنيات الذكاء الاصطناعي التوليدي، يشكل نموذج Gemini Embedding خيارًا قويًا من Google للمؤسسات الباحثة عن حل شامل وسهل النشر. ومع ذلك، فإن ظهور نماذج مفتوحة المصدر قوية قد يُعيد رسم ملامح المنافسة في هذا المجال الحساس.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى