تقنية “نسيان” الذكاء الاصطناعي: كيف يمكن لبرامج تحويل النص إلى كلام أن تنسى أصواتًا معينة؟

تحرص شركات الذكاء الاصطناعي عادةً على التحكم الكامل في نماذجها لمنع سوء الاستخدام، فتضع ضوابط تمنع الكشف عن معلومات محظورة أو حساسة. لكن، قد تبقى المعلومات غير المرغوبة مخبأة داخل النموذج، ويمكن استرجاعها عبر تقنيات متقدمة. هنا يظهر مفهوم “نسيان” النموذج أو machine unlearning، وهو أسلوب يهدف إلى جعل النموذج ينسى بيانات معينة تمامًا كأنها لم تُدرّب عليها من الأصل.
ما هو نسيان النموذج (Machine Unlearning)؟
تقنية machine unlearning تعني إعادة بناء نموذج جديد يعتمد على البيانات الأصلية مع استبعاد البيانات التي ترغب الشركة أو الباحثون في حذفها. هذا يختلف عن “الضوابط” (guardrails) التي تمنع فقط ظهور هذه البيانات عند الاستعلامات.
بالنسبة لنماذج تحويل النص إلى كلام، تزداد التعقيدات بسبب خاصية “الصفرية اللقطات” (zero-shot) التي تتيح للنموذج تقليد أصوات لم يسمعها مسبقًا عبر عينات صغيرة فقط.
كيف تُطبق التقنية على نماذج تحويل النص إلى كلام؟
قام فريق بحثي بتعليم نموذج VoiceBox من شركة Meta، بحيث عندما يُطلب منه تقليد صوت معين تمت “نسيانه”، يستجيب بصوت عشوائي بديل. يعتمد النموذج في هذه العملية على إنشاء أصوات عشوائية بنفسه لتعلم كيفية الاستعاضة عن الأصوات التي تم حذفها.
نتائج الدراسة أظهرت أن تقليد الأصوات المنسية انخفض بنسبة تفوق 75% مقارنة بالنموذج الأصلي، ما يعني اختلافًا واضحًا في الصوت. ومع ذلك، فإن أداء النموذج في تقليد الأصوات المسموح بها تراجع بنسبة 2.8% فقط، مما يوضح توازنًا جيدًا بين النسيان والحفاظ على جودة الأداء.
تكاليف وقيود التقنية
-
عملية النسيان قد تستغرق عدة أيام حسب عدد الأصوات المراد نسيانها.
-
تتطلب كل صوت يريد الباحثون نسيانه ملفًا صوتيًا مدته حوالي خمس دقائق.
-
تُستبدل بيانات الأصوات المنسية بعشوائية عالية لضمان عدم استعادتها.
أهمية البحث وتطبيقاته
تقنية machine unlearning في تحويل النص إلى كلام تُعد خطوة مبتكرة في مجال خصوصية البيانات والتحكم في نماذج الذكاء الاصطناعي. يمكن استخدامها لحماية الأصوات الشخصية، الامتثال لقوانين حماية البيانات، أو إزالة معلومات غير مرغوب فيها من نماذج مدربة.
كما أنها تمثل تحديًا جديدًا ومثيرًا في تصميم نماذج قادرة على الأداء المتوازن بين نسيان البيانات والحفاظ على جودة المهام الأخرى.
يمثل نسيان الذكاء الاصطناعي تطورًا مهمًا في مجال الذكاء الاصطناعي المسؤول، مع إمكانيات كبيرة لتعزيز الخصوصية وحماية البيانات. وبينما لا تزال التقنية في مراحلها الأولى، فإن النتائج الحالية واعدة وتفتح المجال لمزيد من الأبحاث.
المصدر:- MIT Technology Review