2025-11-13T17:19:11.429701

Dedelayed: Deleting remote inference delay via on-device correction

Jacobellis, Ulhaq, Racapé et al.
Remote inference allows lightweight devices to leverage powerful cloud models. However, communication network latency makes predictions stale and unsuitable for real-time tasks. To address this, we introduce Dedelayed, a delay-corrective method that mitigates arbitrary remote inference delays, allowing the local device to produce low-latency outputs in real time. Our method employs a lightweight local model that processes the current frame and fuses in features that a heavyweight remote model computes from past frames. On video from the BDD100K driving dataset, Dedelayed improves semantic segmentation accuracy over the stronger of the local-only and remote-only baselines across all realistic communication network delays beyond 33 ms. Without incurring additional delay, it improves accuracy by 6.4 mIoU compared to fully local inference and 9.8 mIoU compared to remote inference, for a round-trip delay of 100 ms. The advantage grows under longer delays and higher-motion scenes, as delay-mitigated split inference sustains accuracy more effectively, providing clear advantages for real-time tasks that must remain aligned with the current world state.
academic

Dedelayed: দূরবর্তী অনুমান বিলম্ব অন-ডিভাইস সংশোধনের মাধ্যমে দূর করা

মৌলিক তথ্য

  • পেপার আইডি: 2510.13714
  • শিরোনাম: Dedelayed: Deleting remote inference delay via on-device correction
  • লেখক: Dan Jacobellis, Mateen Ulhaq, Fabien Racapé, Hyomin Choi, Neeraja J. Yadwadkar
  • শ্রেণীবিভাগ: eess.IV cs.AI cs.CV cs.LG
  • প্রকাশনার সময়: ২০২৫ সালের ১৫ অক্টোবর (arXiv প্রি-প্রিন্ট)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2510.13714

সারসংক্ষেপ

দূরবর্তী অনুমান হালকা ওজনের ডিভাইসগুলিকে শক্তিশালী ক্লাউড মডেলগুলি ব্যবহার করতে দেয়। তবে যোগাযোগ নেটওয়ার্ক বিলম্ব পূর্বাভাসের ফলাফলগুলিকে পুরানো করে তোলে, যা রিয়েল-টাইম কাজের জন্য অনুপযুক্ত। এই সমস্যার সমাধানের জন্য, এই পেপারটি Dedelayed প্রবর্তন করে, একটি বিলম্ব সংশোধন পদ্ধতি যা যেকোনো দূরবর্তী অনুমান বিলম্ব প্রশমিত করতে পারে, স্থানীয় ডিভাইসগুলিকে রিয়েল-টাইমে কম বিলম্ব আউটপুট তৈরি করতে দেয়। এই পদ্ধতিটি বর্তমান ফ্রেম প্রক্রিয়া করার জন্য একটি হালকা স্থানীয় মডেল ব্যবহার করে এবং অতীত ফ্রেম থেকে গণনা করা ভারী দূরবর্তী মডেলের বৈশিষ্ট্যগুলি একীভূত করে। BDD100K ড্রাইভিং ডেটাসেটের ভিডিওতে, Dedelayed সমস্ত ৩৩ms এর বেশি বাস্তব যোগাযোগ নেটওয়ার্ক বিলম্বে বিশুদ্ধ স্থানীয় এবং বিশুদ্ধ দূরবর্তী ভিত্তিরেখার শক্তিশালী সংস্করণের তুলনায় সিমান্টিক বিভাজন নির্ভুলতা উন্নত করে। অতিরিক্ত বিলম্ব ছাড়াই, ১০০ms রাউন্ড-ট্রিপ বিলম্বের জন্য, বিশুদ্ধ স্থানীয় অনুমানের তুলনায় ৬.৪ mIoU এবং দূরবর্তী অনুমানের তুলনায় ৯.৮ mIoU উন্নতি হয়।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

এই গবেষণা যে মূল সমস্যাটি সমাধান করতে চায় তা হল: রিয়েল-টাইম ভিডিও প্রক্রিয়াকরণ অ্যাপ্লিকেশনে, পূর্বাভাস নির্ভুলতা নিশ্চিত করার সাথে সাথে দূরবর্তী অনুমানের নেটওয়ার্ক বিলম্ব কীভাবে অতিক্রম করতে হয়।

সমস্যার গুরুত্ব

১. রিয়েল-টাইম অ্যাপ্লিকেশন প্রয়োজন: স্বয়ংচালিত গাড়ি, রোবট নিয়ন্ত্রণ, পরিধানযোগ্য ডিভাইস ইত্যাদি অ্যাপ্লিকেশনগুলি বিলম্বের প্রতি অত্যন্ত সংবেদনশীল, পুরানো পূর্বাভাস বিপর্যয়কর পরিণতি হতে পারে ২. সম্পদ সীমাবদ্ধতা: মোবাইল ডিভাইসগুলি শক্তি খরচ এবং গণনা ক্ষমতা দ্বারা সীমাবদ্ধ, জটিল গভীর শিক্ষা মডেল চালাতে পারে না ३. ক্লাউড সুবিধা: ক্লাউড GPU শক্তিশালী গণনা ক্ষমতা রয়েছে, উচ্চ রেজোলিউশন ভিডিও এবং জটিল মডেল পরিচালনা করতে পারে

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

বিদ্যমান বিতরণকৃত গণনা পদ্ধতিতে তিনটি প্রধান ত্রুটি রয়েছে: १. সমস্ত ডিভাইস সম্পদ একটি একক রৈখিক অনুমান পাইপলাইনে বরাদ্দ করে, স্থানীয় ব্যাকআপ বিকল্পের জন্য কোনো সম্পদ সংরক্ষণ করে না २. বিলম্বের পূর্বাভাস নির্ভুলতার উপর প্রভাব বিবেচনা করে না ३. গণনা খরচ পরিচালনা করার জন্য স্থানকালীন রেজোলিউশন উল্লেখযোগ্যভাবে হ্রাস করে, আধুনিক ক্যামেরা সিস্টেমের সমৃদ্ধ ভিজ্যুয়াল বিবরণ হারায়

গবেষণা প্রেরণা

মানব ভিজ্যুয়াল সিস্টেম দ্বারা অনুপ্রাণিত, অপটিক স্নায়ু শুধুমাত্র রেটিনা দ্বারা গৃহীত তথ্যের একটি ছোট অংশ প্রেরণ করতে পারে, প্রাথমিক প্রক্রিয়াকরণ প্রধানত সংকোচন সম্পাদন করে, তারপর ভিজ্যুয়াল কর্টেক্সের গভীর স্তরে বিপাকীয় নিবিড় প্রক্রিয়াকরণ ঘটে। একইভাবে, ডিজিটাল ভিডিও সেন্সর দিয়ে সজ্জিত মেশিনগুলি অনুরূপ সীমাবদ্ধতার সম্মুখীন হয়।

মূল অবদান

१. Dedelayed ফ্রেমওয়ার্ক প্রস্তাব: একটি বিলম্ব-সচেতন বিতরণকৃত অনুমান ফ্রেমওয়ার্ক যা স্থানীয় রিয়েল-টাইম তথ্য এবং দূরবর্তী বিলম্বিত বৈশিষ্ট্যগুলি একীভূত করে নেটওয়ার্ক বিলম্বের প্রভাব প্রশমিত করে २. বিলম্ব পরিমাণকরণ বিশ্লেষণ: ঘন ভিজ্যুয়াল পূর্বাভাস নির্ভুলতার উপর বিলম্বের প্রভাবের পরিমাণগত পরিমাপ প্রদান করে ३. বাস্তব সিস্টেম যাচাইকরণ: শহুরে ড্রাইভিং দৃশ্য ভিডিও বিভাজন কাজে সিস্টেম কার্যকারিতা যাচাই করে, বিদ্যমান স্থানীয় বা দূরবর্তী অনুমান পরিকল্পনা অতিক্রম করে ४. সহজ এবং কার্যকর সংমিশ্রণ কৌশল: সংযোজন-ভিত্তিক বৈশিষ্ট্য সংমিশ্রণ ব্যবহার করে, স্থাপনা এবং অন্যান্য রিয়েল-টাইম পদ্ধতিতে সম্প্রসারণ সহজ

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

সময় t-তে নতুন ইনপুট ফ্রেম x_t দেওয়া, চূড়ান্ত পূর্বাভাস ŷ_t হালকা স্থানীয় মডেল f_light দ্বারা গণনা করা হয়, যা x_t প্রক্রিয়া করে এবং ভারী দূরবর্তী মডেল f_heavy থেকে সময়ের বিলম্বিত বৈশিষ্ট্য z_{t-τ} একীভূত করে।

গাণিতিক প্রতিনিধিত্ব:

z_{t-τ} = f_heavy(τ, x_{≤t-τ})     (1)
ŷ_t = f_light(x_t, z_{t-τ})        (2)

মডেল আর্কিটেকচার

সিস্টেম সামগ্রিক আর্কিটেকচার

Dedelayed সিস্টেমে দুটি প্রধান উপাদান রয়েছে: १. স্থানীয় হালকা মডেল: বর্তমান ফ্রেম প্রক্রিয়া করে, রিয়েল-টাইম প্রতিক্রিয়া ক্ষমতা প্রদান করে २. দূরবর্তী পূর্বাভাস মডেল: ঐতিহাসিক ফ্রেম ক্রম প্রক্রিয়া করে, উচ্চ মানের বৈশিষ্ট্য প্রদান করে

দূরবর্তী পূর্বাভাস মডিউল

  • ২D ViT মেরুদণ্ড হিসাবে EfficientViT-L1 ব্যবহার করে, কার্যকর প্যাচ আকার ৮×८
  • সর্বশেষ K ফ্রেমের প্রসঙ্গ উইন্ডো বজায় রাখে
  • প্রতিটি ফ্রেম বৈশিষ্ট্য সময় অক্ষ বরাবর সংযুক্ত করে, স্থানিক একীকরণ বৃহত্তর १६×१६ প্যাচে
  • পরিমাপ করা বিলম্ব τ এর উপর ভিত্তি করে শেখা বিলম্ব এম্বেডিং যোগ করে
  • ३D ViT এনকোডার এবং শেখা পুলিং (MLP-pool-MLP) এর মাধ্যমে বিলম্ব শর্তযুক্ত বৈশিষ্ট্য তৈরি করে

স্থানীয় মডেল এবং সংমিশ্রণ

  • প্রথম পর্যায়ের বৈশিষ্ট্য গণনা করে: h = T1(x_t)
  • উপাদান-ভিত্তিক সংযোজনের মাধ্যমে প্রাথমিক সংমিশ্রণ: h' = h + z_{t-τ}
  • উভয় টেনসর আকার ९६ × H/८ × W/८, কোনো প্রজেকশন বা আকার সমন্বয়ের প্রয়োজন নেই
  • যদি z_{t-τ} উপলব্ধ না থাকে, স্থানীয় মডেল h' = h এ ফিরে যায়

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. বিলম্ব এম্বেডিং প্রক্রিয়া: পাঠ্য বা ভিজ্যুয়াল ট্রান্সফর্মারে অবস্থান এম্বেডিং এর মতো, দূরবর্তী মডেলকে চ্যানেল পরিবর্তনের সাথে খাপ খাইয়ে নিতে দেয় २. সময়গত পূর্বাভাস প্রশিক্ষণ: তত্ত্বাবধানকৃত প্রশিক্ষণের সময় D ফ্রেম বিলম্ব অনুকরণ করে, দূরবর্তী মডেলকে ভবিষ্যত পূর্বাভাস দিতে প্রশিক্ষণ দেয় ३. মিশ্র রেজোলিউশন অনুমান: স্থানীয় মডেল কম রেজোলিউশন ব্যবহার করে, দূরবর্তী মডেল উচ্চ রেজোলিউশন মাল্টি-ফ্রেম প্রক্রিয়াকরণ ব্যবহার করে ४. কর্মক্ষমতা গ্যারান্টি: সিস্টেম কর্মক্ষমতা কখনও কোনো স্বাধীন মডেলের চেয়ে খারাপ নয়

পরীক্ষামূলক সেটআপ

ডেটাসেট

  • BDD100K ভিডিও ডেটাসেট: ३०fps ড্রাইভিং দৃশ্য ভিডিও রয়েছে
  • প্রশিক্ষিত EoMT মডেল ব্যবহার করে সিউডো লেবেল তৈরি করে, কম আত্মবিশ্বাস পিক্সেল উপেক্ষা করে
  • Cityscapes এর १९টি লেবেল সাবসেট ব্যবহার করে
  • আপলিংক ভিডিও স্ট্রিমে সংকোচনের জন্য WebP ইমেজ কোডেক (গুণমান ८५) প্রয়োগ করে

মূল্যায়ন মেট্রিক্স

  • mIoU (গড় ইন্টারসেকশন ওভার ইউনিয়ন): সিমান্টিক বিভাজনের মান মূল্যায়ন মেট্রিক
  • বিলম্ব পরিসীমা: ०-५ ফ্রেম (०-१६५ms), সাধারণ রাউন্ড-ট্রিপ বিলম্ব প্রতিনিধিত্ব করে

তুলনা পদ্ধতি

१. স্থানীয় ছবি: ঐতিহ্যবাহী একক-ফ্রেম স্থানীয় অনুমান २. দূরবর্তী ছবি: ঐতিহ্যবাহী একক-ফ্রেম দূরবর্তী অনুমান ३. দূরবর্তী ভিডিও: দূরবর্তী ভিডিও প্রক্রিয়াকরণ কিন্তু ভবিষ্যত পূর্বাভাস নয় ४. দূরবর্তী পূর্বাভাসমূলক: বিলম্ব-সচেতন দূরবর্তী পূর্বাভাস মডেল ५. স্থানীয় + দূরবর্তী পূর্বাভাসমূলক: সম্পূর্ণ Dedelayed সিস্টেম

বাস্তবায়ন বিবরণ

  • বহু-পর্যায়ের প্রশিক্ষণ কৌশল: দূরবর্তী এবং স্থানীয় মডেল প্রথমে স্বাধীনভাবে প্রশিক্ষিত, তারপর যৌথভাবে সূক্ষ্ম-সুর করা
  • অপ্টিমাইজার: Adan অপ্টিমাইজার
  • শিক্ষার হার সময়সূচী: ট্র্যাপেজয়েড কোসাইন শিক্ষার হার সময়সূচী
  • ক্ষতি ফাংশন: ক্রস-এন্ট্রপি ক্ষতি
  • প্রাক-প্রশিক্ষণ: ImageNet শ্রেণীবিভাগ → Cityscapes বিভাজন → BDD100K সূক্ষ্ম-সুর

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

१. উল্লেখযোগ্য কর্মক্ষমতা উন্নতি:

  • १००ms রাউন্ড-ট্রিপ বিলম্বে, বিশুদ্ধ স্থানীয় অনুমানের তুলনায় ६.४ mIoU উন্নতি
  • দূরবর্তী অনুমানের তুলনায় ९.८ mIoU উন্নতি
  • সমস্ত ३३ms এর বেশি বাস্তব বিলম্বে শক্তিশালী ভিত্তিরেখা অতিক্রম করে

२. বিলম্ব স্থিতিস্থাপকতা:

  • বিলম্ব যত দীর্ঘ, Dedelayed এর সুবিধা তত স্পষ্ট
  • উচ্চ গতির দৃশ্যে আরও ভাল কর্মক্ষমতা
  • বিলম্ব প্রশমন বিতরণকৃত অনুমান আরও কার্যকরভাবে নির্ভুলতা বজায় রাখে

অ্যাবলেশন পরীক্ষা

পরীক্ষা প্রতিটি উপাদানের অবদান যাচাই করে:

  • দূরবর্তী ভিডিও বনাম দূরবর্তী ছবি: শুধুমাত্র ঐতিহাসিক ফ্রেম প্রসঙ্গ ব্যবহার করা কর্মক্ষমতা উন্নত করার জন্য অপর্যাপ্ত
  • দূরবর্তী পূর্বাভাসমূলক বনাম দূরবর্তী ভিডিও: সময়গত পূর্বাভাস প্রশিক্ষণ বিলম্ব স্থিতিস্থাপকতা উল্লেখযোগ্যভাবে উন্নত করে
  • স্থানীয় + দূরবর্তী পূর্বাভাসমূলক বনাম দূরবর্তী পূর্বাভাসমূলক: স্থানীয় তথ্য সংমিশ্রণ আরও কর্মক্ষমতা উন্নত করে

বিলম্ব জিটার বিশ্লেষণ

  • মডেল বিলম্ব ইনপুট এবং পর্যবেক্ষিত বিলম্ব মিলে না এমন সময়েও ভাল কর্মক্ষমতা বজায় রাখে
  • যখন পর্যবেক্ষিত বিলম্ব বিলম্ব ইনপুট অতিক্রম করে, কর্মক্ষমতা হ্রাস ধীর
  • σ=१५ms উচ্চ জিটার নেটওয়ার্কে সুবিধা বজায় রাখে

রেজোলিউশন অভিযোজনযোগ্যতা

দূরবর্তী সহায়তাপ্রাপ্ত স্থানীয় মডেল নির্ভুলতা হ্রাস ছাড়াই কম রেজোলিউশনে চলতে পারে, সিস্টেমের সম্পদ দক্ষতা প্রদর্শন করে।

সম্পর্কিত কাজ

হালকা ওজনের আর্কিটেকচার গবেষণা

EfficientViT, MobileNetV4 এর মতো বিদ্যমান কাজ ডিভাইস কর্মক্ষমতা রিয়েল-টাইম অর্জনের জন্য গণনা ন্যূনতম করার উপর দৃষ্টি নিবদ্ধ করে, কিন্তু ডিভাইস শক্তি খরচ এবং গণনা সীমাবদ্ধতা দ্বারা সীমাবদ্ধ।

বিতরণকৃত গণনা পদ্ধতি

  • MPEG AI এবং JPEG AI: ব্যান্ডউইথ হ্রাসে মনোনিবেশ করে, বিলম্ব ক্ষতিপূরণ প্রক্রিয়া অভাব
  • Clockwork Convnets: পুরানো বৈশিষ্ট্য পুনরায় ব্যবহার করে বিলম্ব হ্রাস করে, কিন্তু সময়গত অনুমান ক্ষমতা সীমিত
  • Accel: অপটিক্যাল প্রবাহ ফরওয়ার্ড রূপান্তর ভারী মডেল বৈশিষ্ট্য ব্যবহার করে, কিন্তু নেটওয়ার্ক জুড়ে অপারেশনের জন্য উপযুক্ত নয়
  • জ্ঞান বুস্টিং: এই পেপারের সাথে সবচেয়ে প্রাসঙ্গিক, কিন্তু স্থির বিলম্ব অনুমান করে

এই পেপারের সুবিধা

সম্পর্কিত কাজের তুলনায়, Dedelayed সামঞ্জস্যযোগ্য বিলম্ম শর্তকরণের মাধ্যমে দীর্ঘ এবং পরিবর্তনশীল বিলম্বে সাধারণীকরণ করে, ডিজাইন সরলতা এবং পুনরায় ব্যবহারযোগ্যতা বজায় রেখে।

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. Dedelayed রিয়েল-টাইম সিস্টেমে দূরবর্তী গণনার মূল চ্যালেঞ্জ সফলভাবে সমাধান করে: নেটওয়ার্ক বিলম্ব দ্বারা সৃষ্ট পূর্বাভাস পুরানো সমস্যা २. বিলম্বকে প্রথম-শ্রেণীর পরিবর্তনশীল হিসাবে উন্নীত করে, সিস্টেম বাস্তব নেটওয়ার্ক অবস্থার অধীনে শক্তিশালী ভিত্তিরেখা অতিক্রম করে ३. ফ্রেমওয়ার্ক বিস্তৃত রিয়েল-টাইম সমস্যা ডোমেনে প্রযোজ্য, স্মার্ট সিস্টেমগুলিকে সঠিক এবং সময়োপযোগী নির্ভরযোগ্য করে তোলে

সীমাবদ্ধতা

१. স্থির বিলম্ব অনুমান: বর্তমান বাস্তবায়ন প্রধানত তুলনামূলকভাবে স্থিতিশীল বিলম্বের জন্য, চরম জিটারের অভিযোজনযোগ্যতা সীমিত २. গণনা ওভারহেড: যদিও স্থানীয় মডেল হালকা, তবুও অতিরিক্ত সংমিশ্রণ গণনা প্রয়োজন ३. ডেটাসেট সীমাবদ্ধতা: প্রধানত ড্রাইভিং দৃশ্যে যাচাই করা হয়, অন্যান্য ডোমেনে সাধারণীকরণ যাচাই করা প্রয়োজন ४. নেটওয়ার্ক নির্ভরতা: সম্পূর্ণভাবে নেটওয়ার্ক সংযোগের উপর নির্ভর করে, নেটওয়ার্ক বাধা হলে শুধুমাত্র স্থানীয় মডেলের উপর নির্ভর করতে পারে

ভবিষ্যত দিকনির্দেশনা

পেপারটি ভবিষ্যত গবেষণা প্রস্তাব করে যার মধ্যে রয়েছে: १. পরিবর্তনশীল এবং র্যান্ডম বিলম্ব বিতরণ গবেষণা २. উচ্চ গতির ডেটা পরিচালনা ३. আরও হালকা স্থানীয় মডেল বিকাশ ४. স্থানীয় ভবিষ্যত পূর্বাভাস ক্ষমতা অন্বেষণ

গভীর মূল্যায়ন

সুবিধা

१. সমস্যার গুরুত্ব: প্রান্ত গণনায় মূল সমস্যা সমাধান করে, গুরুত্বপূর্ণ ব্যবহারিক মূল্য রয়েছে २. পদ্ধতি উদ্ভাবন: বিলম্ম এম্বেডিং এবং সময়গত পূর্বাভাস প্রশিক্ষণের সমন্বয় নতুনত্ব রয়েছে ३. পরীক্ষা সম্পূর্ণতা: ব্যাপক অ্যাবলেশন পরীক্ষা এবং বিলম্ব জিটার বিশ্লেষণ ४. ব্যবহারিক শক্তি: বিদ্যমান মডেলের উপর ভিত্তি করে সহজ সংমিশ্রণ কৌশল, স্থাপনা সহজ ५. তাত্ত্বিক ভিত্তি: মানব ভিজ্যুয়াল সিস্টেম দ্বারা অনুপ্রাণিত, জৈবিক যুক্তিসঙ্গততা রয়েছে

অপূর্ণতা

१. মূল্যায়ন পরিসীমা সীমিত: শুধুমাত্র সিমান্টিক বিভাজন কাজে যাচাই করা হয়, অন্যান্য কাজের যাচাইকরণ অভাব २. বিলম্ব পরিসীমা: সর্বাধিক १६५ms বিলম্ব সমস্ত বাস্তব দৃশ্যকল্প কভার করার জন্য যথেষ্ট নাও হতে পারে ३. গণনা খরচ বিশ্লেষণ অপর্যাপ্ত: বিস্তারিত গণনা এবং যোগাযোগ খরচ বিশ্লেষণ অভাব ४. আরও ভিত্তিরেখার সাথে তুলনা: আরও সাম্প্রতিক প্রান্ত গণনা পদ্ধতির সাথে তুলনা করা যেতে পারে

প্রভাব

१. একাডেমিক অবদান: প্রান্ত-ক্লাউড সহযোগী অনুমানের জন্য নতুন সমাধান চিন্তাভাবনা প্রদান করে २. ব্যবহারিক মূল্য: স্বয়ংচালিত গাড়ি, রোবট ইত্যাদি ক্ষেত্রে সরাসরি প্রয়োগ সম্ভাবনা রয়েছে ३. পুনরুৎপাদনযোগ্যতা: বিস্তারিত বাস্তবায়ন কোড প্রদান করে, পুনরুৎপাদন এবং সম্প্রসারণ সহজতর করে

প্রযোজ্য দৃশ্য

१. স্বয়ংচালিত গাড়ি: গাড়ি-চালিত সিস্টেম রিয়েল-টাইম এবং নির্ভুল পরিবেশ উপলব্ধি প্রয়োজন २. মোবাইল রোবট: নেভিগেশন এবং বাধা এড়ানো কম বিলম্ব প্রতিক্রিয়া প্রয়োজন ३. AR/VR অ্যাপ্লিকেশন: রিয়েল-টাইম দৃশ্য বোঝা এবং রেন্ডারিং ४. ভিডিও নজরদারি: রিয়েল-টাইম লক্ষ্য সনাক্তকরণ এবং ট্র্যাকিং

রেফারেন্স

পেপারটি সম্পর্কিত ক্ষেত্রের গুরুত্বপূর্ণ কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:

  • EfficientViT সিরিজ হালকা মডেল
  • BDD100K এবং Cityscapes ডেটাসেট
  • প্রান্ত গণনা এবং বিতরণকৃত অনুমান সম্পর্কিত গবেষণা
  • মানব ভিজ্যুয়াল সিস্টেমের জৈবিক গবেষণা

সামগ্রিক মূল্যায়ন: এটি একটি ব্যবহারিক সমস্যা সমাধানকারী উচ্চ মানের পেপার, যা প্রস্তাবিত Dedelayed ফ্রেমওয়ার্ক তত্ত্ব এবং অনুশীলন উভয় ক্ষেত্রেই গুরুত্বপূর্ণ মূল্য রাখে। পদ্ধতি সহজ এবং কার্যকর, পরীক্ষা যাচাইকরণ সম্পূর্ণ, প্রান্ত-ক্লাউড সহযোগী অনুমান ক্ষেত্রে মূল্যবান অবদান প্রদান করে। যদিও মূল্যায়ন পরিসীমা এবং বিলম্ম প্রক্রিয়াকরণ ক্ষমতায় উন্নতির জায়গা রয়েছে, সামগ্রিকভাবে এটি একটি অর্থপূর্ণ গবেষণা কাজ।