A High-Level Feature Model to Predict the Encoding Energy of a Hardware Video Encoder
Reddy, Herglotz, Kaup
In today's society, live video streaming and user generated content streamed from battery powered devices are ubiquitous. Live streaming requires real-time video encoding, and hardware video encoders are well suited for such an encoding task. In this paper, we introduce a high-level feature model using Gaussian process regression that can predict the encoding energy of a hardware video encoder. In an evaluation setup restricted to only P-frames and a single keyframe, the model can predict the encoding energy with a mean absolute percentage error of approximately 9%. Further, we demonstrate with an ablation study that spatial resolution is a key high-level feature for encoding energy prediction of a hardware encoder. A practical application of our model is that it can be used to perform a prior estimation of the energy required to encode a video at various spatial resolutions, with different coding standards and codec presets.
academic
Un Modello di Caratteristiche di Alto Livello per Predire l'Energia di Codifica di un Codificatore Video Hardware
Nella società contemporanea, lo streaming video in tempo reale e i contenuti generati dagli utenti trasmessi da dispositivi alimentati a batteria sono diventati ubiquitari. Lo streaming in tempo reale richiede la codifica video in tempo reale, e i codificatori video hardware sono particolarmente adatti a tali compiti di codifica. Questo articolo introduce un modello di caratteristiche di alto livello che utilizza la regressione del processo gaussiano per predire il consumo energetico della codifica di un codificatore video hardware. In un'impostazione di valutazione limitata a fotogrammi P e un singolo fotogramma chiave, il modello può predire il consumo energetico della codifica con un errore percentuale assoluto medio di circa il 9%. Inoltre, uno studio di ablazione dimostra che la risoluzione spaziale è una caratteristica di alto livello cruciale per la previsione del consumo energetico della codifica nei codificatori hardware. L'applicazione pratica del modello consiste nella possibilità di effettuare stime a priori dell'energia necessaria per la codifica video a diverse risoluzioni spaziali, diversi standard di codifica e preset di codec.
Questa ricerca affronta il problema della previsione del consumo energetico dei codificatori video hardware. Con la diffusione dello streaming video in tempo reale e dei contenuti generati dagli utenti, in particolare su dispositivi alimentati a batteria, la previsione accurata del consumo energetico della codifica è importante per:
Gestione della durata della batteria
Codifica consapevole dell'energia
Riduzione dell'impronta di carbonio dello streaming video
Requisiti di Tempo Reale: Lo streaming in tempo reale richiede la codifica video in tempo reale; i codificatori hardware possono fornire accelerazione e codifica efficiente dal punto di vista energetico
Efficienza Energetica: Durante la creazione di contenuti generati dagli utenti su dispositivi portatili alimentati a batteria, la codifica video consapevole dell'energia è cruciale
Impatto Ambientale: La codifica video consapevole dell'energia è importante per ridurre l'impronta di carbonio dello streaming video
Esistono numerosi modelli di previsione del consumo energetico per codificatori software, ma la ricerca relativa ai codificatori hardware è limitata
I modelli di previsione del consumo energetico dei decodificatori hardware esistenti non possono essere direttamente trasferiti ai codificatori (poiché caratteristiche come la dimensione del bitstream non sono disponibili prima della codifica)
Mancano modelli unificati in grado di gestire molteplici standard di codifica e preset
Estensione del Modello Esistente: Estensione del modello di caratteristiche di alto livello di Herglotz et al. per i decodificatori hardware ai codificatori hardware
Ottimizzazione del Modello di Caratteristiche: Modifica del modello di caratteristiche di alto livello per includere solo caratteristiche disponibili prima della codifica, risolvendo il problema dell'indisponibilità della caratteristica della dimensione del bitstream nel modello del decodificatore
Metodo di Modellazione Unificato: Proposta di un singolo modello per predire il consumo energetico dei codificatori hardware, considerando tre diversi standard (H.264, H.265, AV1) e due preset di codificatori
Previsione ad Alta Precisione: Realizzazione della previsione del consumo energetico della codifica con un errore percentuale assoluto medio di circa il 9,08%
Identificazione delle Caratteristiche Chiave: Dimostrazione attraverso uno studio di ablazione che la risoluzione spaziale è la caratteristica di alto livello cruciale per la previsione del consumo energetico della codifica nei codificatori hardware
Input: Caratteristiche di alto livello della sequenza video (risoluzione, numero di fotogrammi, standard di codifica, preset, valore QP, ecc.)
Output: Valore previsto del consumo energetico della codifica del codificatore video hardware
Vincoli: Utilizzo solo di caratteristiche disponibili prima della codifica, applicabile a scenari di codifica di fotogrammi P e un singolo fotogramma chiave
Innovazione nella Selezione delle Caratteristiche: Rimozione di caratteristiche come la dimensione del bitstream che possono essere ottenute solo dopo la codifica, garantendo che il modello possa essere utilizzato per la previsione del consumo energetico prima della codifica
Strategia di Modellazione Unificata: A differenza dell'approccio di costruzione di modelli separati per ogni standard, utilizzo di caratteristiche booleane per gestire uniformemente molteplici standard di codifica e preset
Capacità di Gestione del Rumore: GPR possiede naturalmente la capacità di gestire il rumore di misurazione, adatto a scenari di misurazione del consumo energetico hardware
Test dell'Intervallo di Confidenza: Adozione di metodi statistici rigorosi per garantire l'affidabilità dei risultati di misurazione
I risultati dello studio di ablazione (Tabella III) mostrano l'ordine di importanza di ogni caratteristica:
Scenario
Caratteristica Rimossa
MAPE (%)
a
Numero di pixel (larghezza × altezza)
164,70
b
Informazioni sul preset
37,38
c
Numero di fotogrammi codificati
17,43
d
Informazioni sullo standard
10,25
e
Valore QP
8,74
Scoperte Chiave:
Risoluzione Spaziale è la caratteristica più importante; la sua rimozione causa un aumento drastico del MAPE a 164,70%
Informazioni sul Preset è la seconda più importante, con un impatto significativo
Rimozione delle Informazioni QP porta a un leggero miglioramento della precisione, probabilmente perché la relazione tra QP e consumo energetico è incoerente
Mancanza di Caratteristiche di Contenuto: Non sono state considerate caratteristiche relative al contenuto video, che potrebbero ulteriormente migliorare la precisione
Limitazioni della Configurazione di Codifica: Considerazione solo di scenari con fotogrammi P e un singolo fotogramma chiave
Piattaforma Hardware Singola: Verifica solo sulla piattaforma NVIDIA Jetson
Scelta del Preset: Considerazione solo di due preset (ultrafast, slow)
L'articolo cita 24 riferimenti correlati, principalmente includenti:
Ricerca sull'efficienza energetica della codifica video (Katsenou et al., 2022)
Modellazione del consumo energetico del codificatore software HEVC (Ramasubbu et al., 2022)
Previsione del consumo energetico dei decodificatori hardware (Herglotz & Kaup, 2018)
Teoria della regressione del processo gaussiano (Rasmussen & Williams, 2006)
Valutazione Complessiva: Questo articolo affronta un importante e relativamente inesplorato campo di ricerca sulla previsione del consumo energetico dei codificatori video hardware, proponendo una soluzione innovativa. Il metodo è scientificamente rigoroso, la progettazione sperimentale è ragionevole e i risultati hanno valore pratico. Sebbene vi sia ancora spazio per miglioramenti nell'ingegneria delle caratteristiche e nell'analisi teorica, l'articolo pone una solida base per la ricerca futura in questo campo.