A High-Level Feature Model to Predict the Encoding Energy of a Hardware Video Encoder
Reddy, Herglotz, Kaup
In today's society, live video streaming and user generated content streamed from battery powered devices are ubiquitous. Live streaming requires real-time video encoding, and hardware video encoders are well suited for such an encoding task. In this paper, we introduce a high-level feature model using Gaussian process regression that can predict the encoding energy of a hardware video encoder. In an evaluation setup restricted to only P-frames and a single keyframe, the model can predict the encoding energy with a mean absolute percentage error of approximately 9%. Further, we demonstrate with an ablation study that spatial resolution is a key high-level feature for encoding energy prediction of a hardware encoder. A practical application of our model is that it can be used to perform a prior estimation of the energy required to encode a video at various spatial resolutions, with different coding standards and codec presets.
academic
हार्डवेयर वीडियो एनकोडर की एन्कोडिंग ऊर्जा की भविष्यवाणी के लिए एक उच्च-स्तरीय फीचर मॉडल
आज के समाज में, रीयल-टाइम वीडियो स्ट्रीमिंग और उपयोगकर्ता-जनित सामग्री बैटरी से चलने वाले उपकरणों से स्ट्रीम ट्रांसमिशन सर्वव्यापी हो गई है। रीयल-टाइम स्ट्रीमिंग के लिए रीयल-टाइम वीडियो एन्कोडिंग की आवश्यकता होती है, और हार्डवेयर वीडियो एनकोडर ऐसे एन्कोडिंग कार्यों के लिए अत्यधिक उपयुक्त हैं। यह पेपर गॉसियन प्रक्रिया प्रतिगमन का उपयोग करके एक उच्च-स्तरीय फीचर मॉडल प्रस्तुत करता है जो हार्डवेयर वीडियो एनकोडर की एन्कोडिंग ऊर्जा खपत की भविष्यवाणी कर सकता है। केवल P फ्रेम और एकल कीफ्रेम तक सीमित मूल्यांकन सेटिंग में, मॉडल एन्कोडिंग ऊर्जा खपत की भविष्यवाणी कर सकता है जिसमें लगभग 9% की औसत निरपेक्ष प्रतिशत त्रुटि है। इसके अलावा, विलोपन अध्ययन के माध्यम से यह प्रदर्शित किया गया है कि स्थानिक संकल्प हार्डवेयर एनकोडर की एन्कोडिंग ऊर्जा खपत भविष्यवाणी के लिए एक महत्वपूर्ण उच्च-स्तरीय फीचर है। इस मॉडल का व्यावहारिक अनुप्रयोग विभिन्न स्थानिक संकल्प, विभिन्न एन्कोडिंग मानकों और कोडेक प्रीसेट के तहत एन्कोडेड वीडियो के लिए आवश्यक ऊर्जा का पूर्व अनुमान लगाने के लिए है।
यह अनुसंधान हार्डवेयर वीडियो एनकोडर की ऊर्जा खपत भविष्यवाणी की समस्या को हल करने के लिए समर्पित है। रीयल-टाइम वीडियो स्ट्रीमिंग और उपयोगकर्ता-जनित सामग्री के प्रसार के साथ, विशेष रूप से बैटरी से चलने वाले उपकरणों पर, सटीक एन्कोडिंग ऊर्जा खपत की भविष्यवाणी के लिए महत्वपूर्ण है:
रीयल-टाइम आवश्यकता: रीयल-टाइम स्ट्रीमिंग के लिए रीयल-टाइम वीडियो एन्कोडिंग की आवश्यकता होती है, हार्डवेयर एनकोडर त्वरण और ऊर्जा-कुशल एन्कोडिंग प्रदान कर सकते हैं
ऊर्जा दक्षता: बैटरी से चलने वाले हैंडहेल्ड उपकरणों पर उपयोगकर्ता-जनित सामग्री बनाते समय ऊर्जा-जागरूक वीडियो एन्कोडिंग महत्वपूर्ण है
पर्यावरणीय प्रभाव: ऊर्जा-सचेत वीडियो एन्कोडिंग वीडियो स्ट्रीमिंग के कार्बन पदचिह्न को कम करने के लिए महत्वपूर्ण है
सॉफ्टवेयर एनकोडर की ऊर्जा खपत भविष्यवाणी मॉडल अधिक हैं, लेकिन हार्डवेयर एनकोडर संबंधित अनुसंधान सीमित है
मौजूदा हार्डवेयर डिकोडर की ऊर्जा खपत भविष्यवाणी मॉडल सीधे एनकोडर में स्थानांतरित नहीं किए जा सकते (क्योंकि बिटस्ट्रीम आकार जैसी विशेषताएं एन्कोडिंग से पहले उपलब्ध नहीं हैं)
कई एन्कोडिंग मानकों और प्रीसेट को संभालने में सक्षम एकीकृत मॉडल की कमी है
मौजूदा मॉडल का विस्तार: हर्गलोट्ज़ आदि द्वारा हार्डवेयर डिकोडर के लिए प्रस्तावित उच्च-स्तरीय फीचर मॉडल को हार्डवेयर एनकोडर तक विस्तारित करना
फीचर मॉडल अनुकूलन: उच्च-स्तरीय फीचर मॉडल को संशोधित करना, केवल एन्कोडिंग से पहले उपलब्ध विशेषताओं को शामिल करना, डिकोडर मॉडल में बिटस्ट्रीम आकार की विशेषता एनकोडर में उपलब्ध न होने की समस्या को हल करना
एकीकृत मॉडलिंग दृष्टिकोण: हार्डवेयर एनकोडर की ऊर्जा खपत की भविष्यवाणी के लिए एकल मॉडल का प्रस्ताव करना, तीन विभिन्न मानकों (H.264, H.265, AV1) और दो एनकोडर प्रीसेट पर विचार करना
उच्च सटीकता भविष्यवाणी: लगभग 9.08% की औसत निरपेक्ष प्रतिशत त्रुटि के साथ एन्कोडिंग ऊर्जा खपत भविष्यवाणी प्राप्त करना
महत्वपूर्ण फीचर पहचान: विलोपन अध्ययन के माध्यम से यह प्रदर्शित करना कि स्थानिक संकल्प हार्डवेयर एनकोडर की ऊर्जा खपत भविष्यवाणी के लिए एक महत्वपूर्ण उच्च-स्तरीय फीचर है
इनपुट: वीडियो अनुक्रम की उच्च-स्तरीय विशेषताएं (संकल्प, फ्रेम संख्या, एन्कोडिंग मानक, प्रीसेट, QP मान आदि)
आउटपुट: हार्डवेयर वीडियो एनकोडर की एन्कोडिंग ऊर्जा खपत की भविष्यवाणी मूल्य
बाधाएं: केवल एन्कोडिंग से पहले प्राप्त विशेषताओं का उपयोग करना, P फ्रेम और एकल कीफ्रेम के एन्कोडिंग परिदृश्य के लिए लागू
फीचर चयन नवाचार: बिटस्ट्रीम आकार जैसी एन्कोडिंग के बाद प्राप्त विशेषताओं को हटाना, यह सुनिश्चित करना कि मॉडल एन्कोडिंग से पहले की ऊर्जा खपत भविष्यवाणी के लिए उपयोगी है
एकीकृत मॉडलिंग रणनीति: प्रत्येक मानक के लिए अलग-अलग मॉडल बनाने के तरीके के विपरीत, बूलियन विशेषताओं का उपयोग करके कई एन्कोडिंग मानकों और प्रीसेट को एकीकृत रूप से संभालना
शोर प्रसंस्करण क्षमता: GPR स्वाभाविक रूप से माप शोर को संभालने की क्षमता रखता है, जो हार्डवेयर ऊर्जा खपत माप परिदृश्य के लिए उपयुक्त है
आत्मविश्वास अंतराल परीक्षण: माप परिणामों की विश्वसनीयता सुनिश्चित करने के लिए कठोर सांख्यिकीय विधियों का उपयोग करना
हार्डवेयर डिकोडर की ऊर्जा खपत भविष्यवाणी (हर्गलोट्ज़ और काउप, 2018)
गॉसियन प्रक्रिया प्रतिगमन सिद्धांत (रास्मुसेन और विलियम्स, 2006)
समग्र मूल्यांकन: यह पेपर हार्डवेयर वीडियो एनकोडर की ऊर्जा खपत भविष्यवाणी के इस महत्वपूर्ण और अपेक्षाकृत खाली अनुसंधान क्षेत्र के लिए एक नवीन समाधान प्रस्तावित करता है। विधि वैज्ञानिक रूप से कठोर है, प्रायोगिक डिजाइन तर्कसंगत है, और परिणामों का व्यावहारिक मूल्य है। हालांकि फीचर इंजीनियरिंग और सैद्धांतिक विश्लेषण में सुधार की गुंजाइश है, लेकिन यह इस क्षेत्र के बाद के अनुसंधान के लिए एक अच्छी नींव प्रदान करता है।