A High-Level Feature Model to Predict the Encoding Energy of a Hardware Video Encoder
Reddy, Herglotz, Kaup
In today's society, live video streaming and user generated content streamed from battery powered devices are ubiquitous. Live streaming requires real-time video encoding, and hardware video encoders are well suited for such an encoding task. In this paper, we introduce a high-level feature model using Gaussian process regression that can predict the encoding energy of a hardware video encoder. In an evaluation setup restricted to only P-frames and a single keyframe, the model can predict the encoding energy with a mean absolute percentage error of approximately 9%. Further, we demonstrate with an ablation study that spatial resolution is a key high-level feature for encoding energy prediction of a hardware encoder. A practical application of our model is that it can be used to perform a prior estimation of the energy required to encode a video at various spatial resolutions, with different coding standards and codec presets.
academic
Un Modelo de Características de Alto Nivel para Predecir la Energía de Codificación de un Codificador de Video de Hardware
En la sociedad actual, la transmisión de video en tiempo real y el contenido generado por usuarios desde dispositivos alimentados por batería se ha vuelto ubicuo. La transmisión en tiempo real requiere codificación de video en tiempo real, y los codificadores de video de hardware son muy adecuados para tales tareas de codificación. Este artículo presenta un modelo de características de alto nivel que utiliza regresión de procesos gaussianos para predecir el consumo de energía de codificación de un codificador de video de hardware. En una configuración de evaluación limitada a fotogramas P y un fotograma clave único, el modelo puede predecir el consumo de energía de codificación con un error porcentual absoluto medio de aproximadamente el 9%. Además, a través de estudios de ablación, se demuestra que la resolución espacial es una característica de alto nivel clave para la predicción del consumo de energía de codificación en codificadores de hardware. La aplicación práctica del modelo es que puede utilizarse para realizar estimaciones previas de la energía requerida para codificar video bajo diferentes resoluciones espaciales, diferentes estándares de codificación y presets de códec.
Esta investigación se dedica a resolver el problema de la predicción del consumo de energía en codificadores de video de hardware. Con la proliferación de transmisión de video en tiempo real y contenido generado por usuarios, particularmente en dispositivos alimentados por batería, la predicción precisa del consumo de energía de codificación es importante para:
Gestión de la vida útil de la batería
Codificación consciente de la energía
Reducción de la huella de carbono de la transmisión de video
Requisitos de Tiempo Real: La transmisión en tiempo real requiere codificación de video en tiempo real, y los codificadores de hardware pueden proporcionar codificación acelerada y eficiente en energía
Eficiencia Energética: Al crear contenido generado por usuarios en dispositivos portátiles alimentados por batería, la codificación de video consciente de la energía es crucial
Impacto Ambiental: La codificación de video consciente de la energía es importante para reducir la huella de carbono de la transmisión de video
Existen más modelos de predicción de consumo de energía para codificadores de software, pero la investigación relacionada con codificadores de hardware es limitada
Los modelos existentes de predicción de consumo de energía para decodificadores de hardware no pueden transferirse directamente a codificadores (porque características como el tamaño del flujo de bits no están disponibles antes de la codificación)
Falta un modelo unificado que pueda manejar múltiples estándares de codificación y presets
Extensión del Modelo Existente: Extender el modelo de características de alto nivel de Herglotz et al. para decodificadores de hardware a codificadores de hardware
Optimización del Modelo de Características: Modificar el modelo de características de alto nivel para incluir solo características disponibles antes de la codificación, resolviendo el problema de que características como el tamaño del flujo de bits no están disponibles en codificadores
Método de Modelado Unificado: Proponer un modelo único para predecir el consumo de energía de codificadores de hardware, considerando tres estándares diferentes (H.264, H.265, AV1) y dos presets de codificador
Predicción de Alta Precisión: Lograr una predicción del consumo de energía de codificación con un error porcentual absoluto medio de aproximadamente el 9.08%
Identificación de Características Clave: A través de estudios de ablación, demostrar que la resolución espacial es una característica de alto nivel clave para la predicción del consumo de energía de codificación en codificadores de hardware
Entrada: Características de alto nivel de la secuencia de video (resolución, número de fotogramas, estándar de codificación, preset, valor QP, etc.)
Salida: Valor predicho del consumo de energía de codificación del codificador de video de hardware
Restricciones: Utilizar solo características disponibles antes de la codificación, aplicable a escenarios de codificación de fotogramas P y un fotograma clave único
Innovación en Selección de Características: Eliminar características que solo se pueden obtener después de la codificación, como el tamaño del flujo de bits, asegurando que el modelo sea utilizable para predicción de consumo de energía antes de la codificación
Estrategia de Modelado Unificado: A diferencia del enfoque de construir modelos separados para cada estándar, adoptar características booleanas para manejar unificadamente múltiples estándares de codificación y presets
Capacidad de Procesamiento de Ruido: GPR posee naturalmente la capacidad de manejar ruido de medición, adecuado para escenarios de medición de consumo de energía de hardware
Prueba de Intervalo de Confianza: Adoptar métodos estadísticos rigurosos para asegurar la confiabilidad de los resultados de medición
Características de Contenido Ausentes: No se consideran características relacionadas con el contenido de video, lo que podría mejorar aún más la precisión
Restricciones de Configuración de Codificación: Solo se consideran escenarios de fotogramas P y fotograma clave único
Plataforma de Hardware Única: Solo se verifica en la plataforma NVIDIA Jetson
Selección de Preset: Solo se consideran dos presets (ultrafast, slow)
El artículo cita 24 referencias relacionadas, que incluyen principalmente:
Investigación sobre eficiencia energética en codificación de video (Katsenou et al., 2022)
Modelado de consumo de energía en codificadores de software HEVC (Ramasubbu et al., 2022)
Predicción de consumo de energía en decodificadores de hardware (Herglotz & Kaup, 2018)
Teoría de regresión de procesos gaussianos (Rasmussen & Williams, 2006)
Evaluación General: Este artículo aborda un campo de investigación importante y relativamente vacío en la predicción del consumo de energía de codificadores de video de hardware, proponiendo una solución innovadora. El método es científicamente riguroso, el diseño experimental es razonable y los resultados tienen valor práctico. Aunque aún hay espacio para mejora en ingeniería de características y análisis teórico, sienta una base sólida para investigaciones posteriores en este campo.