A High-Level Feature Model to Predict the Encoding Energy of a Hardware Video Encoder
Reddy, Herglotz, Kaup
In today's society, live video streaming and user generated content streamed from battery powered devices are ubiquitous. Live streaming requires real-time video encoding, and hardware video encoders are well suited for such an encoding task. In this paper, we introduce a high-level feature model using Gaussian process regression that can predict the encoding energy of a hardware video encoder. In an evaluation setup restricted to only P-frames and a single keyframe, the model can predict the encoding energy with a mean absolute percentage error of approximately 9%. Further, we demonstrate with an ablation study that spatial resolution is a key high-level feature for encoding energy prediction of a hardware encoder. A practical application of our model is that it can be used to perform a prior estimation of the energy required to encode a video at various spatial resolutions, with different coding standards and codec presets.
academic
Ein hochstufiges Merkmalsmodell zur Vorhersage der Codierungsenergie eines Hardware-Videoencoders
In der heutigen Gesellschaft ist das Streaming von Echtzeitvideos und benutzergenerierten Inhalten von batteriebetriebenen Geräten allgegenwärtig geworden. Das Echtzeitstreaming erfordert Echtzeitvideokodierung, und Hardware-Videoencodern eignen sich hervorragend für solche Kodierungsaufgaben. Dieses Papier stellt ein hochstufiges Merkmalsmodell vor, das Gaußsche Prozessregression verwendet, um die Codierungsenergie eines Hardware-Videoencoders vorherzusagen. In einer Evaluierungseinstellung, die auf P-Frames und einen einzelnen Keyframe beschränkt ist, kann das Modell die Codierungsenergie mit einem durchschnittlichen absoluten prozentualen Fehler von etwa 9% vorhersagen. Darüber hinaus wird durch Ablationsstudien nachgewiesen, dass die räumliche Auflösung ein Schlüsselmerkmal für die Vorhersage der Codierungsenergie von Hardware-Encodern ist. Die praktische Anwendung des Modells besteht darin, dass es zur Vorhersage der für die Kodierung von Videos bei verschiedenen räumlichen Auflösungen, verschiedenen Kodierungsstandards und Codec-Voreinstellungen erforderlichen Energie verwendet werden kann.
Diese Forschung befasst sich mit dem Problem der Vorhersage des Energieverbrauchs von Hardware-Videoencodern. Mit der Verbreitung von Echtzeitvideostrom und benutzergenerierten Inhalten, insbesondere auf batteriebetriebenen Geräten, ist die genaue Vorhersage des Codierungsenergieaufwands wichtig für:
Verwaltung der Akkulaufzeit
Energiebewusste Kodierung
Verringerung des CO₂-Fußabdrucks von Videostreams
und andere Aspekte.
Echtzeitanforderungen: Das Echtzeitstreaming erfordert Echtzeitvideokodierung, und Hardware-Encoder können beschleunigte und energieeffiziente Kodierung bieten
Energieeffizienz: Bei der Erstellung benutzergenerierten Inhalts auf batteriebetriebenen tragbaren Geräten ist energiebewusste Videokodierung von entscheidender Bedeutung
Umweltauswirkungen: Energiebewusste Videokodierung ist wichtig, um den CO₂-Fußabdruck von Videostreams zu verringern
Es gibt mehr Modelle zur Vorhersage des Energieverbrauchs von Software-Encodern, aber begrenzte Forschung zu Hardware-Encodern
Bestehende Modelle zur Vorhersage des Energieverbrauchs von Hardware-Decodern können nicht direkt auf Encoder übertragen werden (da Merkmale wie Bitstromgröße vor der Kodierung nicht verfügbar sind)
Es fehlt ein einheitliches Modell, das mehrere Kodierungsstandards und Voreinstellungen verarbeiten kann
Erweiterung bestehender Modelle: Erweiterung des hochstufigen Merkmalsmodells von Herglotz et al. für Hardware-Decoder auf Hardware-Encoder
Optimierung des Merkmalsmodells: Änderung des hochstufigen Merkmalsmodells, um nur vor der Kodierung verfügbare Merkmale einzubeziehen, was das Problem der Bitstromgrößenmerkmal in Encoder-Modellen löst
Einheitliche Modellierungsmethode: Vorschlag eines einzelnen Modells zur Vorhersage des Energieverbrauchs von Hardware-Encodern unter Berücksichtigung von drei verschiedenen Standards (H.264, H.265, AV1) und zwei Encoder-Voreinstellungen
Hochpräzisions-Vorhersage: Erreichung einer Codierungsenergieprognose mit einem durchschnittlichen absoluten prozentualen Fehler von etwa 9,08%
Identifizierung von Schlüsselmerkmalen: Nachweis durch Ablationsstudien, dass die räumliche Auflösung ein Schlüsselmerkmal für die Vorhersage der Codierungsenergie von Hardware-Encodern ist
Eingabe: Hochstufige Merkmale der Videosequenz (Auflösung, Bildanzahl, Kodierungsstandard, Voreinstellung, QP-Wert usw.)
Ausgabe: Vorhersagewert der Codierungsenergie des Hardware-Videoencoders
Einschränkungen: Verwendung nur vor der Kodierung verfügbarer Merkmale, anwendbar auf Kodierungsszenarien mit P-Frames und einzelnem Keyframe
Merkmalsauswahl-Innovation: Entfernung von Merkmalen, die nur nach der Kodierung verfügbar sind (wie Bitstromgröße), um sicherzustellen, dass das Modell für die Energieprognose vor der Kodierung verwendet werden kann
Einheitliche Modellierungsstrategie: Im Gegensatz zum Aufbau separater Modelle für jeden Standard werden boolesche Merkmale verwendet, um mehrere Kodierungsstandards und Voreinstellungen einheitlich zu behandeln
Rauschbehandlungsfähigkeit: GPR hat die natürliche Fähigkeit, Messunsicherheiten zu behandeln, was sich für Szenarien der Hardware-Energiemessung eignet
Konfidenzintervall-Tests: Strenge statistische Methoden werden verwendet, um die Zuverlässigkeit der Messergebnisse zu gewährleisten
Das Papier zitiert 24 verwandte Literaturquellen, hauptsächlich einschließlich:
Forschung zur Videokodierungs-Energieeffizienz (Katsenou et al., 2022)
Energieverbrauchsmodellierung von HEVC-Software-Encodern (Ramasubbu et al., 2022)
Energieverbrauchsprognose für Hardware-Decoder (Herglotz & Kaup, 2018)
Theorie der Gaußschen Prozessregression (Rasmussen & Williams, 2006)
Gesamtbewertung: Dieses Papier befasst sich mit dem wichtigen und relativ unerforschten Gebiet der Energieverbrauchsprognose für Hardware-Videoencodern und schlägt eine innovative Lösung vor. Die Methode ist wissenschaftlich streng, das Experimentaldesign ist angemessen, und die Ergebnisse haben praktischen Wert. Obwohl es noch Raum für Verbesserungen im Merkmalsengineering und in der theoretischen Analyse gibt, legt das Papier eine solide Grundlage für zukünftige Forschung in diesem Bereich.