A High-Level Feature Model to Predict the Encoding Energy of a Hardware Video Encoder
Reddy, Herglotz, Kaup
In today's society, live video streaming and user generated content streamed from battery powered devices are ubiquitous. Live streaming requires real-time video encoding, and hardware video encoders are well suited for such an encoding task. In this paper, we introduce a high-level feature model using Gaussian process regression that can predict the encoding energy of a hardware video encoder. In an evaluation setup restricted to only P-frames and a single keyframe, the model can predict the encoding energy with a mean absolute percentage error of approximately 9%. Further, we demonstrate with an ablation study that spatial resolution is a key high-level feature for encoding energy prediction of a hardware encoder. A practical application of our model is that it can be used to perform a prior estimation of the energy required to encode a video at various spatial resolutions, with different coding standards and codec presets.
academic
Высокоуровневая модель признаков для прогнозирования энергопотребления аппаратного видеокодера
В современном обществе потоковая передача видео в реальном времени и пользовательский контент с устройств, работающих от батареи, стали повсеместными. Потоковая передача в реальном времени требует кодирования видео в реальном времени, и аппаратные видеокодеры идеально подходят для таких задач кодирования. В данной статье представлена высокоуровневая модель признаков с использованием гауссовской процессной регрессии, которая может прогнозировать энергопотребление при кодировании аппаратного видеокодера. В условиях оценки, ограниченных P-кадрами и одним ключевым кадром, модель может прогнозировать энергопотребление при кодировании со средней абсолютной процентной ошибкой примерно 9%. Кроме того, исследование абляции показывает, что пространственное разрешение является ключевым высокоуровневым признаком для прогнозирования энергопотребления при кодировании аппаратного кодера. Практическое применение модели заключается в возможности предварительной оценки энергии, необходимой для кодирования видео при различных пространственных разрешениях, различных стандартах кодирования и предустановках кодека.
Данное исследование направлено на решение проблемы прогнозирования энергопотребления аппаратного видеокодера. С распространением потоковой передачи видео в реальном времени и пользовательского контента, особенно на устройствах, работающих от батареи, точное прогнозирование энергопотребления при кодировании имеет важное значение для:
Требования к реальному времени: потоковая передача в реальном времени требует кодирования видео в реальном времени, аппаратные кодеры обеспечивают ускорение и энергоэффективное кодирование;
Энергоэффективность: при создании пользовательского контента на портативных устройствах, работающих от батареи, энергосознательное кодирование видео имеет решающее значение;
Экологическое воздействие: энергосознательное кодирование видео важно для снижения углеродного следа видеопотоков.
существует множество моделей прогнозирования энергопотребления программных кодеров, но исследований аппаратных кодеров относительно мало;
существующие модели прогнозирования энергопотребления аппаратных декодеров не могут быть напрямую перенесены на кодеры (так как такие признаки, как размер битового потока, недоступны до кодирования);
отсутствуют унифицированные модели, способные работать с несколькими стандартами кодирования и предустановками.
Расширение существующей модели: расширение высокоуровневой модели признаков аппаратных декодеров Herglotz и др. на аппаратные кодеры.
Оптимизация модели признаков: модификация высокоуровневой модели признаков для включения только признаков, доступных до кодирования, решение проблемы недоступности признака размера битового потока в модели декодера для кодера.
Унифицированный подход к моделированию: предложение единой модели для прогнозирования энергопотребления аппаратного кодера, учитывающей три различных стандарта (H.264, H.265, AV1) и две предустановки кодера.
Высокоточное прогнозирование: достижение прогнозирования энергопотребления при кодировании со средней абсолютной процентной ошибкой примерно 9,08%.
Идентификация ключевых признаков: доказательство посредством исследования абляции того, что пространственное разрешение является ключевым высокоуровневым признаком для прогнозирования энергопотребления аппаратного кодера.
Входные данные: высокоуровневые признаки видеопоследовательности (разрешение, количество кадров, стандарт кодирования, предустановка, значение QP и т. д.)
Выходные данные: прогнозируемое значение энергопотребления при кодировании аппаратного видеокодера
Ограничения: использование только признаков, доступных до кодирования, применимость к сценариям кодирования P-кадров и одного ключевого кадра
Инновация в выборе признаков: исключение признаков, доступных только после кодирования (таких как размер битового потока), обеспечение применимости модели для прогнозирования энергопотребления до кодирования.
Стратегия унифицированного моделирования: в отличие от подхода создания отдельных моделей для каждого стандарта, использование булевых признаков для унифицированной обработки нескольких стандартов кодирования и предустановок.
Способность обработки шума: GPR естественным образом обладает способностью обработки шума измерения, что подходит для сценариев измерения энергопотребления аппаратного обеспечения.
Тестирование доверительных интервалов: применение строгих статистических методов для обеспечения надежности результатов измерения.
теорию гауссовской процессной регрессии (Rasmussen & Williams, 2006).
Общая оценка: Данная статья предлагает инновационное решение для важной и относительно малоизученной области прогнозирования энергопотребления аппаратного видеокодера. Методология научна и строга, экспериментальная конструкция рациональна, результаты имеют практическую ценность. Хотя в инженерии признаков и теоретическом анализе остается место для улучшения, работа закладывает хорошую основу для последующих исследований в этой области.