HPC Application Parameter Autotuning on Edge Devices: A Bandit Learning Approach
Hossain, Badawy, Islam et al.
The growing necessity for enhanced processing capabilities in edge devices with limited resources has led us to develop effective methods for improving high-performance computing (HPC) applications. In this paper, we introduce LASP (Lightweight Autotuning of Scientific Application Parameters), a novel strategy designed to address the parameter search space challenge in edge devices. Our strategy employs a multi-armed bandit (MAB) technique focused on online exploration and exploitation. Notably, LASP takes a dynamic approach, adapting seamlessly to changing environments. We tested LASP with four HPC applications: Lulesh, Kripke, Clomp, and Hypre. Its lightweight nature makes it particularly well-suited for resource-constrained edge devices. By employing the MAB framework to efficiently navigate the search space, we achieved significant performance improvements while adhering to the stringent computational limits of edge devices. Our experimental results demonstrate the effectiveness of LASP in optimizing parameter search on edge devices.
academic
ضبط معاملات تطبيقات الحوسبة عالية الأداء على أجهزة الحافة: نهج التعلم بالعصابات
مع تزايد الطلب على زيادة قدرات معالجة أجهزة الحافة، تطور هذا البحث طرقاً محسّنة لتحسين تطبيقات الحوسبة عالية الأداء (HPC). تقدم الورقة LASP (الضبط الخفيف لمعاملات تطبيقات العلوم)، وهي استراتيجية جديدة مصممة خصيصاً للتعامل مع تحديات فضاء البحث عن المعاملات على أجهزة الحافة. تستخدم الاستراتيجية تقنية العصابات متعددة الأذرع (MAB)، مع التركيز على الاستكشاف والاستغلال عبر الإنترنت. يعتمد LASP على نهج ديناميكي يمكنه التكيف بسلاسة مع البيئات المتغيرة. اختبر المؤلفون LASP على أربعة تطبيقات HPC (Lulesh و Kripke و Clomp و Hypre). تجعله خصائصه الخفيفة الوزن مناسباً بشكل خاص لأجهزة الحافة ذات الموارد المحدودة. من خلال اعتماد إطار عمل MAB للتنقل الفعال في فضاء البحث، تحقق الحل تحسينات أداء كبيرة مع الامتثال للقيود الحسابية الصارمة لأجهزة الحافة.
تتمثل المشكلة الأساسية التي يعالجها هذا البحث في الضبط التلقائي الفعال لمعاملات تطبيقات HPC على أجهزة الحافة ذات الموارد المحدودة. تم تصميم طرق الضبط التقليدية بشكل أساسي لأنظمة HPC التقليدية، وهذه الطرق نفسها تتطلب موارد حسابية كبيرة وغير مناسبة للبيئات المقيدة على أجهزة الحافة.
الطرق التقليدية: الضبط اليدوي القائم على المعرفة الخبيرة يستغرق وقتاً طويلاً وغير قابل للتوسع؛ الطرق القائمة على الاستدلال تفتقر إلى المرونة وتميل إلى الوقوع في الحد الأدنى المحلي
طرق التعلم الآلي: على الرغم من فعاليتها، إلا أنها تجلب تكاليف إضافية غير مناسبة لأجهزة الحافة
التحسين البايزي: يؤدي أداءً ضعيفاً في العلاقات المعقدة، ويتطلب عدداً كبيراً من التكرارات، ويفتقر إلى الاستفادة من المعرفة التاريخية
اقتراح نهج مبتكر يستفيد من قدرة أجهزة الحافة على تشغيل تطبيقات HPC بدقة منخفضة (LF) لتحديد معاملات التطبيق المثلى، ثم نقل هذه المعاملات إلى منصات HPC التقليدية للتنفيذ بدقة عالية (HF)، مما يقلل بشكل كبير من الوقت والطاقة المستهلكة في ضبط المعاملات على أنظمة HPC التقليدية.
يميل الندم التراكمي لجميع التطبيقات إلى التشبع بعد عدد معين من التكرارات، مما يثبت التقارب الفعال للخوارزمية. يتفوق تأثير تحسين وقت التنفيذ على تحسين الطاقة، وهذا يرجع إلى خصائص التشبع للطاقة في تطبيقات HPC كثيفة الحسابات.
تشمل الطرق التقليدية الطرق القائمة على البحث (مثل التحسين البايزي) وطرق التعلم الآلي. تتمثل مزايا هذا العمل مقارنة بالأعمال الموجودة في التصميم الخفيف الوزن المتخصص لأجهزة الحافة والقدرة على التكيف عبر الإنترنت.
تستشهد الورقة بـ 48 مرجعاً ذا صلة، تغطي مجالات متعددة بما في ذلك الحوسبة الطرفية وضبط HPC والعصابات متعددة الأذرع وغيرها، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الإجمالي: هذه ورقة بحثية عالية الجودة تقترح حلاً مبتكراً في مجال التقاطع بين الحوسبة الطرفية و HPC. تم تصميم خوارزمية LASP بشكل معقول، والتحقق التجريبي شامل، وتتمتع بقيمة عملية جيدة وآفاق ترويج واعدة. على الرغم من وجود مجال للتحسن في العمق النظري وتجارب المقارنة، فإن المساهمة الإجمالية كبيرة وتوفر مرجعاً قيماً للبحث في المجالات ذات الصلة.