الروبوتات

الدمج الثلاثي الأبعاد لوحدات معالجة الرسوميات: مستقبل الذكاء الاصطناعي

تعتبر وحدات معالجة الرسوميات (GPUs) عنصرًا أساسيًا في مجال الذكاء الاصطناعي، ومع تقدم التكنولوجيا، يبرز الدمج الثلاثي الأبعاد كحل واعد لتحسين الأداء.

الدمج الثلاثي الأبعاد المثالي سيُحسن من أداء وحدات معالجة الرسوميات المستقبلية

عند النظر إلى حزمة أكثر منتجات الذكاء الاصطناعي تقدماً من AMD أو Nvidia، ستجد ترتيباً مألوفاً: وحدة معالجة الرسوميات (GPU) محاطة من الجانبين بذاكرة عالية النطاق (HBM)، وهي أكثر شرائح الذاكرة تقدماً المتاحة. تُوضع هذه الشرائح بالقرب من الشرائح الحاسوبية التي تخدمها لتقليل أكبر عنق زجاجة في حسابات الذكاء الاصطناعي – الطاقة والتأخير في نقل مليارات البتات في الثانية من الذاكرة إلى المنطق. ولكن ماذا لو كان بإمكانك تقريب الحوسبة والذاكرة أكثر من خلال تكديس HBM فوق وحدة معالجة الرسوميات؟

استكشفت شركة Imec مؤخراً هذا السيناريو باستخدام محاكاة حرارية متقدمة، وكانت الإجابة – التي تم تقديمها في ديسمبر في اجتماع IEEE الدولي لأجهزة الإلكترونيات (IEDM) لعام 2025 – مقلقة بعض الشيء. يضاعف التكديس الثلاثي الأبعاد درجة الحرارة التشغيلية داخل وحدة معالجة الرسوميات، مما يجعلها غير قابلة للتشغيل. لكن الفريق، الذي يقوده جيمس مايرز من Imec، لم يستسلم. لقد حددوا عدة تحسينات هندسية يمكن أن تقلل في النهاية من فرق درجة الحرارة إلى ما يقرب من الصفر.

بدأت Imec بمحاكاة حرارية لوحدة معالجة الرسوميات وأربع شرائح HBM كما تجدها اليوم، داخل ما يُسمى حزمة 2.5D. أي أن وحدة معالجة الرسوميات وذاكرة HBM تجلسان على ركيزة تُسمى interposer، مع مسافة ضئيلة بينهما. ترتبط النوعان من الشرائح بواسطة آلاف من الموصلات النحاسية على مقياس الميكرومتر المدمجة في سطح interposer. في هذا التكوين، تستهلك وحدة معالجة الرسوميات النموذجية 414 واط وتصل إلى درجة حرارة قصوى تقل قليلاً عن 70 درجة مئوية – وهو ما يعد طبيعياً بالنسبة لمعالج. تستهلك شرائح الذاكرة حوالي 40 واط إضافية وتصبح أقل سخونة قليلاً. يتم إزالة الحرارة من أعلى الحزمة بواسطة نوع من التبريد السائل الذي أصبح شائعاً في مراكز بيانات الذكاء الاصطناعي الجديدة.

“بينما يُستخدم هذا الأسلوب حالياً، إلا أنه لا يتوسع بشكل جيد في المستقبل – خاصة لأنه يغلق جانبي وحدة معالجة الرسوميات، مما يحد من الاتصالات المستقبلية بين وحدات معالجة الرسوميات داخل الحزمة”، قال يوكاي تشين، باحث أول في Imec، للمهندسين في IEDM. على النقيض من ذلك، “يؤدي الأسلوب الثلاثي الأبعاد إلى زيادة عرض النطاق الترددي، وتقليل التأخير.… التحسين الأكثر أهمية هو حجم الحزمة.”

التعاون في تكنولوجيا النظام

بدأ فريق Imec في محاولة عدد من التحسينات التكنولوجية والنظامية بهدف خفض درجة الحرارة. أول شيء حاولوه هو التخلص من طبقة من السيليكون التي أصبحت الآن زائدة عن الحاجة. لفهم السبب، عليك أولاً أن تفهم ما هي HBM حقاً.

هذه الشكل من الذاكرة هو عبارة عن كومة من ما يصل إلى 12 شريحة DRAM عالية الكثافة. تم تقليل سمك كل منها إلى عشرات الميكرومترات وتم تمريرها عبر اتصالات عمودية. تُكدس هذه الشرائح المقلصة واحدة فوق الأخرى وتُربط بواسطة كرات لحام صغيرة، وتكون هذه الكومة من الذاكرة متصلة عمودياً بقطعة أخرى من السيليكون، تُسمى القاعدة. تُعتبر القاعدة شريحة منطقية مصممة لتعدد البيانات – تعبئتها في العدد المحدود من الأسلاك التي يمكن أن تتناسب عبر الفجوة بمقياس المليمتر إلى وحدة معالجة الرسوميات.

لكن مع وجود HBM الآن فوق وحدة معالجة الرسوميات، لم يعد هناك حاجة لمثل هذه المضخة البيانات. يمكن أن تتدفق البتات مباشرة إلى المعالج دون اعتبار لعدد الأسلاك التي يمكن أن تتناسب على جانب الشريحة. بالطبع، يعني هذا التغيير نقل دوائر التحكم في الذاكرة من القاعدة إلى وحدة معالجة الرسوميات وبالتالي تغيير مخطط المعالج، كما يقول مايرز. لكن يجب أن يكون هناك متسع كافٍ، كما يقترح، لأن وحدة معالجة الرسوميات لن تحتاج بعد الآن إلى الدوائر المستخدمة لفك تعدد بيانات الذاكرة الواردة.

تسبب التخلص من هذه الوسيط في خفض درجة الحرارة بمقدار أقل من 4 درجات مئوية. ولكن، من المهم، أنه يجب أن يعزز بشكل كبير عرض النطاق الترددي بين الذاكرة والمعالج، وهو أمر مهم لتحسين آخر حاول الفريق القيام به – إبطاء وحدة معالجة الرسوميات.

قد يبدو ذلك متعارضاً مع الهدف العام من تحسين حسابات الذكاء الاصطناعي، ولكن في هذه الحالة، إنه ميزة. تعتبر النماذج اللغوية الكبيرة ما يُسمى بـ “مشاكل مقيدة بالذاكرة”. أي أن عرض النطاق الترددي للذاكرة هو العامل المحدد الرئيسي. لكن فريق مايرز قدر أن تكديس HBM ثلاثي الأبعاد على وحدة معالجة الرسوميات سيعزز عرض النطاق الترددي أربع مرات. مع تلك المساحة الإضافية، حتى إبطاء ساعة وحدة معالجة الرسوميات بنسبة 50 في المئة لا يزال يؤدي إلى فوز في الأداء، بينما يبرد كل شيء بأكثر من 20 درجة مئوية. في الممارسة العملية، قد لا تحتاج وحدة معالجة الرسوميات إلى أن تُبطأ إلى هذا الحد. أدى زيادة تردد الساعة إلى 70 في المئة إلى وحدة معالجة الرسوميات التي كانت فقط 1.7 درجة مئوية أكثر سخونة، كما يقول مايرز.

تحسين HBM

جاءت انخفاض كبير آخر في درجة الحرارة من جعل كومة HBM والمنطقة المحيطة بها أكثر توصيلًا. شمل ذلك دمج الأربع كومات إلى كومتين أوسع، مما أزال منطقة حبس الحرارة؛ وتخفيف الشريحة العليا – التي عادة ما تكون أكثر سمكاً – من الكومة؛ وملء المزيد من المساحة حول HBM بقطع من السيليكون الفارغ لنقل المزيد من الحرارة.

مع كل ذلك، أصبحت الكومة تعمل الآن عند حوالي 88 درجة مئوية. جلب تحسين أخير الأمور مرة أخرى إلى قرب 70 درجة مئوية. بشكل عام، يتم إزالة حوالي 95 في المئة من حرارة الشريحة من أعلى الحزمة، حيث تحمل المياه الحرارة بعيداً. ولكن إضافة تبريد مشابه إلى الجانب السفلي أيضاً خفض درجات حرارة الشرائح المكدسة بمقدار 17 درجة مئوية أخيرة.

على الرغم من أن البحث المقدم في IEDM يُظهر أنه قد يكون من الممكن، إلا أن HBM على وحدة معالجة الرسوميات ليس بالضرورة الخيار الأفضل، كما يقول مايرز. “نحن نحاكي تكوينات نظام أخرى للمساعدة في بناء الثقة بأن هذا هو أو ليس الخيار الأفضل”، كما يقول. “وحدة معالجة الرسوميات على HBM تهم بعض الأشخاص في الصناعة”، لأنها تضع وحدة معالجة الرسوميات أقرب إلى التبريد. ولكن من المحتمل أن يكون تصميم أكثر تعقيداً، لأن طاقة وحدة معالجة الرسوميات وبياناتها ستحتاج إلى التدفق عمودياً عبر HBM للوصول إليها.

في ختام هذا البحث، يتضح أن الدمج الثلاثي الأبعاد لوحدات معالجة الرسوميات يحمل إمكانيات كبيرة، ولكنه يتطلب المزيد من البحث لضمان فعاليته في المستقبل.

مقالات ذات صلة

زر الذهاب إلى الأعلى