HPC Application Parameter Autotuning on Edge Devices: A Bandit Learning Approach
Hossain, Badawy, Islam et al.
The growing necessity for enhanced processing capabilities in edge devices with limited resources has led us to develop effective methods for improving high-performance computing (HPC) applications. In this paper, we introduce LASP (Lightweight Autotuning of Scientific Application Parameters), a novel strategy designed to address the parameter search space challenge in edge devices. Our strategy employs a multi-armed bandit (MAB) technique focused on online exploration and exploitation. Notably, LASP takes a dynamic approach, adapting seamlessly to changing environments. We tested LASP with four HPC applications: Lulesh, Kripke, Clomp, and Hypre. Its lightweight nature makes it particularly well-suited for resource-constrained edge devices. By employing the MAB framework to efficiently navigate the search space, we achieved significant performance improvements while adhering to the stringent computational limits of edge devices. Our experimental results demonstrate the effectiveness of LASP in optimizing parameter search on edge devices.
academic
Autoajuste de Parámetros de Aplicaciones HPC en Dispositivos Edge: Un Enfoque de Aprendizaje Bandido
Título: HPC Application Parameter Autotuning on Edge Devices: A Bandit Learning Approach
Autores: Abrar Hossain¹, Abdel-Hameed A. Badawy², Mohammad A. Islam³, Tapasya Patki⁴, Kishwar Ahmed¹
Instituciones: ¹Universidad de Toledo, ²Universidad Estatal de Nuevo México, ³Universidad de Texas en Arlington, ⁴Laboratorio Nacional Lawrence Livermore
Con la creciente demanda de mayor capacidad de procesamiento en dispositivos edge, este artículo desarrolla métodos mejorados para optimizar aplicaciones de computación de alto rendimiento (HPC). Se presenta LASP (Lightweight Autotuning of Scientific Application Parameters), una estrategia novedosa diseñada específicamente para abordar los desafíos del espacio de búsqueda de parámetros en dispositivos edge. La estrategia utiliza técnicas de máquinas tragaperras multibrazo (MAB), enfocándose en exploración y explotación en línea. LASP adopta un enfoque dinámico capaz de adaptarse sin problemas a entornos cambiantes. Los autores prueban LASP con cuatro aplicaciones HPC (Lulesh, Kripke, Clomp e Hypre). Su naturaleza ligera la hace particularmente adecuada para dispositivos edge con recursos limitados. Al adoptar el marco MAB para navegar eficientemente el espacio de búsqueda, se logran mejoras significativas de rendimiento mientras se respetan las estrictas limitaciones computacionales de los dispositivos edge.
El problema central que aborda esta investigación es realizar autoajuste eficiente de parámetros de aplicaciones HPC en dispositivos edge con recursos limitados. Los métodos tradicionales de ajuste de parámetros fueron diseñados principalmente para sistemas HPC convencionales, que en sí mismos requieren abundantes recursos computacionales, lo que los hace inadecuados para entornos con restricciones de dispositivos edge.
Rápido desarrollo de la computación edge: Según informes, se espera que el mercado de aplicaciones de procesamiento edge de datos crezca un 75% para 2026
Complejidad de aplicaciones HPC: Las aplicaciones HPC implican configuraciones de parámetros complejas que impactan significativamente el rendimiento, pudiendo incluso causar fallos de ejecución
Desafíos de restricciones de recursos: La capacidad computacional limitada de los dispositivos edge y los recursos distribuidos heterogéneos presentan desafíos únicos para la ejecución de HPC
Métodos tradicionales: El ajuste manual basado en conocimiento experto consume tiempo y no es escalable; los métodos basados en heurísticas carecen de flexibilidad y tienden a quedar atrapados en óptimos locales
Métodos de aprendizaje automático: Aunque efectivos, introducen sobrecarga adicional inadecuada para dispositivos edge
Optimización bayesiana: Desempeño deficiente en relaciones complejas, requiere muchas iteraciones, carece de aprovechamiento del conocimiento histórico
Proponer un método innovador que aproveche dispositivos edge para ejecutar aplicaciones HPC en baja fidelidad (LF) a fin de determinar parámetros óptimos a nivel de aplicación, luego transferir estos parámetros a plataformas HPC convencionales para ejecución de alta fidelidad (HF), reduciendo significativamente el tiempo y el consumo energético del ajuste de parámetros en sistemas HPC tradicionales.
Primer algoritmo LASP propuesto: Método de autoajuste ligero de parámetros HPC específicamente diseñado para dispositivos edge
Aplicación innovadora de técnica MAB: Primera aplicación de máquinas tragaperras multibrazo al autoajuste en dispositivos edge
Capacidad de adaptación dinámica: El algoritmo puede adaptarse en tiempo real a cambios ambientales, adecuado para entornos edge volátiles
Optimización multiobjetivo: Optimiza simultáneamente tiempo de ejecución y consumo de potencia, proporcionando equilibrio de optimización personalizable por el usuario
Portabilidad entre plataformas: El enfoque de parámetros a nivel de aplicación basado en técnicas estocásticas es portable entre diversas plataformas edge y HPC
Dado un espacio de configuración de parámetros χ = {1, ..., x} de una aplicación HPC, seleccionar la configuración óptima en T rondas de iteración para maximizar la función de recompensa ponderada:
freward(x) = α × (1/μ(τx)) + β × (1/μ(ρx))
donde τx es el tiempo de ejecución normalizado, ρx es el consumo de potencia normalizado, y α y β son parámetros de peso definidos por el usuario.
LASP se basa en el modelo estocástico de máquinas tragaperras multibrazo, asumiendo K acciones (configuraciones) ejecutadas en T rondas. Cada configuración x corresponde a una distribución de recompensa Dx, inicialmente desconocida.
Diseño ligero: El consumo de CPU y memoria de LASP es significativamente menor en comparación con métodos ML tradicionales
Aprendizaje en línea: Se adapta en tiempo real a cambios ambientales sin necesidad de preentrenamiento
Método de múltiples fidelidades: Aprovecha la ejecución de dispositivos edge de baja fidelidad para identificar parámetros óptimos para sistemas HPC de alta fidelidad
Participación del usuario: Permite a los usuarios personalizar objetivos de optimización mediante parámetros α y β
LASP mantiene buen rendimiento bajo errores sintéticos del 5%, 10% y 15%, demostrando su capacidad de adaptación a problemas del mundo real como fluctuaciones de red.
El arrepentimiento acumulado de todas las aplicaciones se satura después de cierto número de iteraciones, demostrando la convergencia efectiva del algoritmo. El efecto de optimización del tiempo de ejecución es superior al de optimización de potencia, debido a las características de saturación de potencia en aplicaciones HPC intensivas en computación.
Los métodos tradicionales incluyen métodos basados en búsqueda (como optimización bayesiana) y métodos de aprendizaje automático. La ventaja de este trabajo sobre trabajos existentes radica en su diseño ligero específicamente para dispositivos edge y su capacidad de adaptación en línea.
Los proyectos relacionados incluyen la plataforma de sensores Waggle y Sage Continuum, siendo este el primer trabajo específicamente dedicado al ajuste de parámetros HPC en dispositivos edge.
La técnica MAB tiene aplicaciones en ajuste de hiperparámetros, pero este es el primer trabajo que la aplica al escenario de ajuste HPC en dispositivos edge.
Limitaciones de escalabilidad: A medida que aumenta el número de configuraciones, el algoritmo UCB necesita explorar muchas opciones, volviéndose ineficiente en dispositivos con recursos limitados
Problemas de coordinación de red: La comunicación de bajo ancho de banda entre múltiples dispositivos edge volátiles afecta la eficiencia del sistema
Desafíos de dispositivos heterogéneos: Manejar dispositivos con diferentes capacidades computacionales requiere diseño de algoritmos adaptativos
Efecto de optimización de potencia: La optimización de potencia es más limitada en comparación con la optimización de tiempo de ejecución
Experimentos de comparación limitados: Comparación principal con BLISS y configuración predeterminada, carece de comparación con otros métodos ligeros
Análisis teórico insuficiente: Aunque proporciona límite de arrepentimiento, carece de análisis teórico detallado de convergencia
Verificación insuficiente de dispositivos heterogéneos: Los experimentos se realizan principalmente en un único dispositivo edge, careciendo de verificación de coordinación multidevice
Análisis de sensibilidad de parámetros: El análisis de sensibilidad de parámetros α y β es relativamente simple
El artículo cita 48 referencias relacionadas, cubriendo múltiples campos incluyendo computación edge, ajuste de parámetros HPC y máquinas tragaperras multibrazo, proporcionando una base teórica sólida para la investigación.
Evaluación General: Este es un artículo de investigación de alta calidad que propone una solución innovadora en el campo de intersección de computación edge y HPC. El algoritmo LASP está bien diseñado, la verificación experimental es suficiente y tiene buen valor práctico y perspectivas de promoción. Aunque hay espacio para mejora en profundidad teórica y experimentos de comparación, la contribución general es significativa y proporciona referencias valiosas para investigación relacionada.