আজকের সমাজে, রিয়েল-টাইম ভিডিও স্ট্রিম এবং ব্যবহারকারী-উৎপাদিত সামগ্রী ব্যাটারি-চালিত ডিভাইস থেকে স্ট্রিম করা সর্বব্যাপী হয়ে উঠেছে। রিয়েল-টাইম স্ট্রিমিং রিয়েল-টাইম ভিডিও এনকোডিং প্রয়োজন, এবং হার্ডওয়্যার ভিডিও এনকোডার এই ধরনের এনকোডিং কাজের জন্য অত্যন্ত উপযুক্ত। এই পেপারটি গাউসিয়ান প্রক্রিয়া রিগ্রেশন ব্যবহার করে একটি উচ্চ-স্তরের বৈশিষ্ট্য মডেল উপস্থাপন করে যা হার্ডওয়্যার ভিডিও এনকোডারের এনকোডিং শক্তি খরচ পূর্বাভাস দিতে পারে। P ফ্রেম এবং একটি একক কী ফ্রেমের মধ্যে সীমাবদ্ধ মূল্যায়ন সেটিংয়ে, মডেলটি এনকোডিং শক্তি খরচ পূর্বাভাস দিতে পারে যার গড় পরম শতাংশ ত্রুটি প্রায় ৯%। অতিরিক্তভাবে, অ্যাবলেশন অধ্যয়নের মাধ্যমে প্রমাণিত হয় যে স্থানিক রেজোলিউশন হার্ডওয়্যার এনকোডারের এনকোডিং শক্তি খরচ পূর্বাভাসের জন্য একটি মূল উচ্চ-স্তরের বৈশিষ্ট্য। মডেলটির ব্যবহারিক প্রয়োগ হল বিভিন্ন স্থানিক রেজোলিউশন, বিভিন্ন এনকোডিং মান এবং কোডেক প্রিসেটের অধীনে এনকোডিত ভিডিওর জন্য প্রয়োজনীয় শক্তির পূর্ব অনুমান প্রদান করা।
এই গবেষণা হার্ডওয়্যার ভিডিও এনকোডারের শক্তি খরচ পূর্বাভাসের সমস্যা সমাধানের জন্য নিবেদিত। রিয়েল-টাইম ভিডিও স্ট্রিম এবং ব্যবহারকারী-উৎপাদিত সামগ্রীর বিস্তৃতির সাথে, বিশেষত ব্যাটারি-চালিত ডিভাইসে, নির্ভুল শক্তি খরচ পূর্বাভাস নিম্নলিখিত ক্ষেত্রে গুরুত্বপূর্ণ:
সাহিত্য পর্যালোচনা দেখায়:
উপরোক্ত সীমাবদ্ধতার উপর ভিত্তি করে, এই পেপারের গবেষণা প্রেরণা অন্তর্ভুক্ত করে:
১. বিদ্যমান মডেল সম্প্রসারণ: Herglotz এবং অন্যদের দ্বারা হার্ডওয়্যার ডিকোডারের জন্য প্রস্তাবিত উচ্চ-স্তরের বৈশিষ্ট্য মডেল হার্ডওয়্যার এনকোডারে প্রসারিত করা २. বৈশিষ্ট্য মডেল অপ্টিমাইজেশন: উচ্চ-স্তরের বৈশিষ্ট্য মডেল সংশোধন করা যাতে শুধুমাত্র এনকোডিংয়ের আগে উপলব্ধ বৈশিষ্ট্য অন্তর্ভুক্ত থাকে, ডিকোডার মডেলে বিটস্ট্রিম আকারের বৈশিষ্ট্য এনকোডারে অনুপলব্ধ সমস্যা সমাধান করা ३. একীভূত মডেলিং পদ্ধতি: হার্ডওয়্যার এনকোডারের শক্তি খরচ পূর্বাভাস দিতে একটি একক মডেল প্রস্তাব করা, তিনটি ভিন্ন মান (H.264, H.265, AV1) এবং দুটি এনকোডার প্রিসেট বিবেচনা করে ४. উচ্চ নির্ভুলতা পূর্বাভাস: এনকোডিং শক্তি খরচ পূর্বাভাসে প্রায় ৯.০৮% গড় পরম শতাংশ ত্রুটি অর্জন করা ५. মূল বৈশিষ্ট্য সনাক্তকরণ: অ্যাবলেশন অধ্যয়নের মাধ্যমে প্রমাণ করা যে স্থানিক রেজোলিউশন হার্ডওয়্যার এনকোডারের শক্তি খরচ পূর্বাভাসের জন্য একটি মূল উচ্চ-স্তরের বৈশিষ্ট্য
ইনপুট: ভিডিও সিকোয়েন্সের উচ্চ-স্তরের বৈশিষ্ট্য (রেজোলিউশন, ফ্রেম সংখ্যা, এনকোডিং মান, প্রিসেট, QP মান ইত্যাদি) আউটপুট: হার্ডওয়্যার ভিডিও এনকোডারের এনকোডিং শক্তি খরচ পূর্বাভাস মূল্য সীমাবদ্ধতা: শুধুমাত্র এনকোডিংয়ের আগে অর্জনযোগ্য বৈশিষ্ট্য ব্যবহার করা, P ফ্রেম এবং একটি একক কী ফ্রেমের এনকোডিং দৃশ্যে প্রযোজ্য
পার্থক্য শক্তি খরচ পরিমাপ পদ্ধতি গ্রহণ করা:
E_enc = E_dynamic - E_static
যেখানে:
E_dynamic: এনকোডিং প্রক্রিয়ার সময় গতিশীল শক্তি খরচE_static: নিষ্ক্রিয় মোডে স্থির শক্তি খরচমডেলটি ৯টি উচ্চ-স্তরের বৈশিষ্ট্য ব্যবহার করে (টেবিল I):
| বৈশিষ্ট্য সনাক্তকারী | বৈশিষ্ট্য বর্ণনা |
|---|---|
| x₀ | অফসেট শক্তি খরচ (পক্ষপাত পদ, সর্বদা ১) |
| x₁ | এনকোডিত ফ্রেম সংখ্যা |
| x₂ | পিক্সেল সংখ্যা (প্রস্থ × উচ্চতা) |
| x₃ | মান H264 (বুলিয়ান বৈশিষ্ট্য) |
| x₄ | মান H265 (বুলিয়ান বৈশিষ্ট্য) |
| x₅ | মান AV1 (বুলিয়ান বৈশিষ্ট্য) |
| x₆ | প্রিসেট ultrafast (বুলিয়ান বৈশিষ্ট্য) |
| x₇ | প্রিসেট slow (বুলিয়ান বৈশিষ্ট্য) |
| x₈ | পরিমাণীকরণ প্যারামিটার QP |
গাউসিয়ান প্রক্রিয়া রিগ্রেশন (GPR) মডেলিংয়ের জন্য গ্রহণ করা:
রৈখিক রিগ্রেশন মডেল (পরিমাপ শব্দ সহ):
Ê_enc = x^T w + ε
গাউসিয়ান প্রক্রিয়া ফাংশন অনুমান:
f(x) ~ GP(m(x), Σ)
শূন্য-মধ্য গাউসিয়ান প্রক্রিয়া:
f(x) ~ b(x) + GP(0, Σ)
সহভেদ কার্নেল ফাংশন (সূচক কার্নেল):
k(x_p, x_q) = σ²_f exp(-|x_p - x_q|/l) + σ²_n · δ_st
মডেল আউটপুট:
Ê_enc = h(x)^T β + g(x)
যেখানে g(x) ~ GP(0, Σ)
१. বৈশিষ্ট্য নির্বাচন উদ্ভাবন: বিটস্ট্রিম আকারের মতো এনকোডিংয়ের পরে অর্জনযোগ্য বৈশিষ্ট্য অপসারণ করা, নিশ্চিত করা যে মডেলটি এনকোডিংয়ের আগে শক্তি খরচ পূর্বাভাসের জন্য ব্যবহারযোগ্য २. একীভূত মডেলিং কৌশল: প্রতিটি মানের জন্য আলাদা মডেল তৈরির পদ্ধতির বিপরীতে, বুলিয়ান বৈশিষ্ট্য ব্যবহার করে একাধিক এনকোডিং মান এবং প্রিসেট একীভূতভাবে পরিচালনা করা ३. শব্দ প্রক্রিয়াকরণ ক্ষমতা: GPR স্বাভাবিকভাবে পরিমাপ শব্দ পরিচালনা করার ক্ষমতা রাখে, হার্ডওয়্যার শক্তি খরচ পরিমাপ দৃশ্যের জন্য উপযুক্ত ४. আত্মবিশ্বাস ব্যবধান পরীক্ষা: পরিমাপ ফলাফলের নির্ভরযোগ্যতা নিশ্চিত করতে কঠোর পরিসংখ্যানগত পদ্ধতি গ্রহণ করা
গড় পরম শতাংশ ত্রুটি (MAPE) ব্যবহার করা:
MAPE = (1/B) × Σ|E_true,i - E_est,i|/E_true,i × 100
অ্যাবলেশন অধ্যয়ন ফলাফল (টেবিল III) প্রতিটি বৈশিষ্ট্যের গুরুত্ব র্যাঙ্কিং দেখায়:
| দৃশ্য | অপসারিত বৈশিষ্ট্য | MAPE (%) |
|---|---|---|
| a | পিক্সেল সংখ্যা (প্রস্থ × উচ্চতা) | 164.70 |
| b | প্রিসেট তথ্য | 37.38 |
| c | এনকোডিত ফ্রেম সংখ্যা | 17.43 |
| d | মান তথ্য | 10.25 |
| e | QP মূল্য | 8.74 |
মূল আবিষ্কার: १. স্থানিক রেজোলিউশন সবচেয়ে গুরুত্বপূর্ণ বৈশিষ্ট্য, অপসারণের পরে MAPE দ্রুত 164.70% এ বৃদ্ধি পায় २. প্রিসেট তথ্য দ্বিতীয়, উল্লেখযোগ্য প্রভাব ३. QP তথ্য অপসারণের পরে নির্ভুলতা সামান্য উন্নত হয়, সম্ভবত QP এবং শক্তি খরচের মধ্যে অসামঞ্জস্যপূর্ণ সম্পর্কের কারণে
ভিজ্যুয়ালাইজেশন বিশ্লেষণের মাধ্যমে আবিষ্কার করা: १. রেজোলিউশন ক্লাস্টারিং: বিভিন্ন রেজোলিউশন স্পষ্ট শক্তি খরচ ক্লাস্টার গঠন করে २. মান পার্থক্য: 4K ভিডিও বিভিন্ন এনকোডিং মান জুড়ে স্পষ্ট শক্তি খরচ পার্থক্য দেখায় ३. প্রিসেট প্রভাব: slow প্রিসেট বিভিন্ন মান জুড়ে আরও উল্লেখযোগ্য শক্তি খরচ পরিবর্তন দেখায় ४. QP সম্পর্ক: H.264/H.265 QP এর সাথে একঘেয়ে সম্পর্ক দেখায়, AV1 কোন স্পষ্ট সম্পর্ক নেই
१. রেজোলিউশন প্রাধান্য: এনকোডিং শক্তি খরচ ভিডিও রেজোলিউশনের সাথে অত্যন্ত সম্পর্কিত २. ফ্রেম সংখ্যা রৈখিকতা: এনকোডিং শক্তি খরচ ফ্রেম সংখ্যার সাথে রৈখিক সম্পর্ক দেখায় ३. মান পার্থক্য: বিভিন্ন এনকোডিং মানের শক্তি খরচ পার্থক্য উচ্চ রেজোলিউশনে আরও স্পষ্ট ४. GPR সুবিধা: GPR রৈখিক রিগ্রেশনের চেয়ে উল্লেখযোগ্যভাবে উন্নত, শক্তি খরচ পূর্বাভাসের অরৈখিক বৈশিষ্ট্য প্রমাণ করে
হার্ডওয়্যার এনকোডার শক্তি খরচ পূর্বাভাস গবেষণা তুলনামূলকভাবে সীমিত, এই পেপার এই ফাঁক পূরণ করে।
१. হার্ডওয়্যার ভিডিও এনকোডারের শক্তি খরচ পূর্বাভাসের জন্য প্রথম উচ্চ-স্তরের বৈশিষ্ট্য-ভিত্তিক মডেল প্রস্তাব করা २. প্রায় ৯% MAPE অর্জন করা, ব্যবহারিক মূল্য সহ ३. স্থানিক রেজোলিউশন শক্তি খরচ পূর্বাভাসের মূল বৈশিষ্ট্য প্রমাণ করা ४. রৈখিক রিগ্রেশনের তুলনায় GPR এর উল্লেখযোগ্য সুবিধা যাচাই করা
१. সামগ্রী বৈশিষ্ট্য অনুপস্থিত: ভিডিও সামগ্রী সম্পর্কিত বৈশিষ্ট্য বিবেচনা করা হয়নি, সম্ভবত নির্ভুলতা আরও উন্নত করতে পারে २. এনকোডিং কনফিগারেশন সীমাবদ্ধতা: শুধুমাত্র P ফ্রেম এবং একক কী ফ্রেম দৃশ্য বিবেচনা করা ३. হার্ডওয়্যার প্ল্যাটফর্ম একক: শুধুমাত্র NVIDIA Jetson প্ল্যাটফর্মে যাচাই করা ४. প্রিসেট নির্বাচন: শুধুমাত্র দুটি প্রিসেট (ultrafast, slow) বিবেচনা করা
१. সামগ্রী-সচেতন মডেলিং: ভিডিও সামগ্রী জটিলতার মতো বৈশিষ্ট্য প্রবর্তন করা २. সম্পূর্ণ এনকোডিং বিশ্লেষণ: B ফ্রেম সহ সম্পূর্ণ এনকোডিং দৃশ্যে প্রসারিত করা ३. মাল্টি-প্ল্যাটফর্ম যাচাইকরণ: বিভিন্ন হার্ডওয়্যার প্ল্যাটফর্মে মডেল সার্বজনীনতা যাচাই করা ४. সফটওয়্যার-হার্ডওয়্যার তুলনা: হার্ডওয়্যার এবং সফটওয়্যার এনকোডার শক্তি খরচের সম্পূর্ণ তুলনামূলক বিশ্লেষণ
१. উচ্চ ব্যবহারিক মূল্য: বাস্তব প্রয়োগে শক্তি খরচ পূর্বাভাসের চাহিদা সমাধান করে २. পদ্ধতি বৈজ্ঞানিক: পরিমাপ নির্ভরযোগ্যতা নিশ্চিত করতে কঠোর পরিসংখ্যানগত পরীক্ষা গ্রহণ করে ३. বিশ্লেষণ ব্যাপক: অ্যাবলেশন অধ্যয়নের মাধ্যমে প্রতিটি বৈশিষ্ট্য অবদান গভীরভাবে বিশ্লেষণ করে ४. উদ্ভাবনী শক্তিশালী: হার্ডওয়্যার এনকোডারের জন্য প্রথম একীভূত মাল্টি-মান শক্তি খরচ পূর্বাভাস মডেল
१. বৈশিষ্ট্য প্রকৌশল: আরও ভিডিও সামগ্রী সম্পর্কিত বৈশিষ্ট্য বিবেচনা করা যেতে পারে २. ডেটা স্কেল: পরীক্ষা ডেটা তুলনামূলকভাবে সীমিত, আরও ভিডিও প্রকার সম্প্রসারণ করা যেতে পারে ३. তাত্ত্বিক বিশ্লেষণ: শক্তি খরচ পূর্বাভাস প্রক্রিয়ার গভীর তাত্ত্বিক বিশ্লেষণের অভাব ४. রিয়েল-টাইম যাচাইকরণ: রিয়েল-টাইম দৃশ্যে মডেল কর্মক্ষমতা সম্পূর্ণভাবে যাচাই করা হয়নি
१. একাডেমিক অবদান: হার্ডওয়্যার এনকোডার শক্তি খরচ পূর্বাভাস গবেষণা ফাঁক পূরণ করে २. ব্যবহারিক মূল্য: মোবাইল ডিভাইস ব্যাটারি ব্যবস্থাপনা এবং সবুজ ভিডিও এনকোডিংয়ে ব্যবহার করা যেতে পারে ३. পুনরুৎপাদনযোগ্যতা: পদ্ধতি বর্ণনা স্পষ্ট, পরীক্ষা সেটআপ বিস্তারিত
१. মোবাইল ডিভাইস: ব্যাটারি-চালিত ডিভাইসের শক্তি খরচ ব্যবস্থাপনা २. এজ কম্পিউটিং: এজ ভিডিও প্রক্রিয়াকরণের সম্পদ পরিকল্পনা ३. সবুজ কম্পিউটিং: ডেটা সেন্টার ভিডিও এনকোডিং শক্তি খরচ অপ্টিমাইজেশন ४. রিয়েল-টাইম অ্যাপ্লিকেশন: লাইভ স্ট্রিমিং, ভিডিও কনফারেন্সিং ইত্যাদি রিয়েল-টাইম এনকোডিং দৃশ্য
পেপারটি ২৪টি সম্পর্কিত রেফারেন্স উদ্ধৃত করে, প্রধানত অন্তর্ভুক্ত করে:
সামগ্রিক মূল্যায়ন: এই পেপারটি হার্ডওয়্যার ভিডিও এনকোডার শক্তি খরচ পূর্বাভাসের এই গুরুত্বপূর্ণ এবং তুলনামূলকভাবে ফাঁক গবেষণা ক্ষেত্রে উদ্ভাবনী সমাধান প্রস্তাব করে। পদ্ধতি বৈজ্ঞানিক এবং কঠোর, পরীক্ষা ডিজাইন যুক্তিসঙ্গত, ফলাফল ব্যবহারিক মূল্য সহ। যদিও বৈশিষ্ট্য প্রকৌশল এবং তাত্ত্বিক বিশ্লেষণে উন্নতির অবকাশ রয়েছে, এটি এই ক্ষেত্রের পরবর্তী গবেষণার জন্য একটি ভাল ভিত্তি স্থাপন করে।