2025-11-16T06:07:12.262321

Spatio-Temporal Multi-Subgraph GCN for 3D Human Motion Prediction

Wang, Guo, Su
Human motion prediction (HMP) involves forecasting future human motion based on historical data. Graph Convolutional Networks (GCNs) have garnered widespread attention in this field for their proficiency in capturing relationships among joints in human motion. However, existing GCN-based methods tend to focus on either temporal-domain or spatial-domain features, or they combine spatio-temporal features without fully leveraging the complementarity and cross-dependency of these two features. In this paper, we propose the Spatial-Temporal Multi-Subgraph Graph Convolutional Network (STMS-GCN) to capture complex spatio-temporal dependencies in human motion. Specifically, we decouple the modeling of temporal and spatial dependencies, enabling cross-domain knowledge transfer at multiple scales through a spatio-temporal information consistency constraint mechanism. Besides, we utilize multiple subgraphs to extract richer motion information and enhance the learning associations of diverse subgraphs through a homogeneous information constraint mechanism. Extensive experiments on the standard HMP benchmarks demonstrate the superiority of our method.
academic

স্পেটিও-টেম্পোরাল মাল্টি-সাবগ্রাফ জিসিএন ৩ডি মানব গতি পূর্বাভাসের জন্য

মৌলিক তথ্য

  • পেপার আইডি: 2501.00317
  • শিরোনাম: Spatio-Temporal Multi-Subgraph GCN for 3D Human Motion Prediction
  • লেখক: জিয়েক্সিন ওয়াং, ইয়িজু গুও, বিং সু (চীন জনগণ বিশ্ববিদ্যালয়ের কৃত্রিম বুদ্ধিমত্তা কলেজ)
  • শ্রেণীবিভাগ: cs.CV (কম্পিউটার ভিশন), cs.LG (মেশিন লার্নিং)
  • প্রকাশনার সময়: ২০২৪ সালের ৩১ ডিসেম্বর (arXiv প্রিপ্রিন্ট)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2501.00317

সারসংক্ষেপ

মানব গতি পূর্বাভাস (এইচএমপি) ঐতিহাসিক ডেটার উপর ভিত্তি করে ভবিষ্যতের মানব গতি পূর্বাভাস দেওয়ার সাথে জড়িত। গ্রাফ কনভোলিউশনাল নেটওয়ার্ক (জিসিএন) মানব গতিতে সংযোগস্থলের মধ্যে সম্পর্ক ক্যাপচার করার ক্ষমতার কারণে এই ক্ষেত্রে ব্যাপক মনোযোগ পেয়েছে। তবে, বিদ্যমান জিসিএন-ভিত্তিক পদ্ধতিগুলি প্রায়শই শুধুমাত্র সময়গত বা স্থানগত বৈশিষ্ট্যগুলিতে ফোকাস করে, অথবা স্পেটিও-টেম্পোরাল বৈশিষ্ট্যগুলি একত্রিত করার সময় এই দুটি বৈশিষ্ট্যের পরিপূরকতা এবং ক্রস-নির্ভরতা সম্পূর্ণভাবে কাজে লাগায় না। এই পেপারটি স্পেটিও-টেম্পোরাল মাল্টি-সাবগ্রাফ গ্রাফ কনভোলিউশনাল নেটওয়ার্ক (এসটিএমএস-জিসিএন) প্রস্তাব করে যা মানব গতিতে জটিল স্পেটিও-টেম্পোরাল নির্ভরতা ক্যাপচার করে। নির্দিষ্টভাবে, আমরা সময়গত এবং স্থানগত নির্ভরতা মডেলিং বিচ্ছিন্ন করি, স্পেটিও-টেম্পোরাল তথ্য সামঞ্জস্য সীমাবদ্ধতা প্রক্রিয়ার মাধ্যমে মাল্টি-স্কেল ক্রস-ডোমেইন জ্ঞান স্থানান্তর অর্জন করি। অতিরিক্তভাবে, আমরা আরও সমৃদ্ধ গতি তথ্য নিষ্কাশনের জন্য একাধিক সাবগ্রাফ ব্যবহার করি এবং সমজাতীয় তথ্য সীমাবদ্ধতা প্রক্রিয়ার মাধ্যমে বিভিন্ন সাবগ্রাফের শেখার সংযোগ উন্নত করি। মান এইচএমপি বেঞ্চমার্ক পরীক্ষায় ব্যাপক পরীক্ষা আমাদের পদ্ধতির উচ্চতর কর্মক্ষমতা প্রমাণ করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার সংজ্ঞা

৩ডি কঙ্কাল-ভিত্তিক মানব গতি পূর্বাভাস প্রদত্ত ঐতিহাসিক গতি ক্রম থেকে ভবিষ্যতের গতি ক্রম পূর্বাভাস দেওয়ার লক্ষ্য রাখে। এই গবেষণা মানব গতি আচরণ বোঝার জন্য গুরুত্বপূর্ণ এবং রোবোটিক সহযোগিতা, স্বয়ংচালিত চালনা, ক্রিয়া স্বীকৃতি এবং অন্যান্য অনেক ক্ষেত্রে ব্যাপক প্রয়োগ রয়েছে।

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

১. একক-ডোমেইন মডেলিং সীমাবদ্ধতা: বেশিরভাগ জিসিএন পদ্ধতি শুধুমাত্র সময়গত বা স্থানগত বৈশিষ্ট্য মডেলিংয়ে ফোকাস করে, স্পেটিও-টেম্পোরাল বৈশিষ্ট্যগুলির মধ্যে পরিপূরকতা উপেক্ষা করে २. অপর্যাপ্ত বৈশিষ্ট্য সংমিশ্রণ: কিছু পদ্ধতি মিশ্র কনভোলিউশন কার্নেল দ্বারা স্পেটিও-টেম্পোরাল সম্পর্ক একীভূত করে, কিন্তু অনন্য সময়গত এবং স্থানগত তথ্য নিষ্কাশন করা কঠিন ३. অপর্যাপ্তভাবে ব্যবহৃত ক্রস-ডোমেইন নির্ভরতা: বিদ্যমান বিচ্ছিন্ন মডেলিং পদ্ধতি প্রধানত জটিল কাঠামো ডিজাইনে ফোকাস করে, স্পেটিও-টেম্পোরাল সম্পর্কে লুকানো ক্রস-নির্ভরতা উপেক্ষা করে

গবেষণা প্রেরণা

উপরোক্ত সমস্যাগুলির সমাধানের জন্য, এই পেপারটি অর্থোগোনাল স্পেটিও-টেম্পোরাল শাখার মাধ্যমে যথাক্রমে সময়গত এবং স্থানগত তথ্য মডেল করার প্রস্তাব দেয়, স্পেটিও-টেম্পোরাল তথ্যের অনন্যতা সম্পূর্ণভাবে কাজে লাগায় এবং সামঞ্জস্য সীমাবদ্ধতার মাধ্যমে স্পেটিও-টেম্পোরাল তথ্য বুনন এবং ক্রস-ডোমেইন জ্ঞান স্থানান্তর প্রচার করে।

মূল অবদান

१. এসটিএমএস-জিসিএন আর্কিটেকচার প্রস্তাব: স্পেটিও-টেম্পোরাল তথ্যের স্বাধীনতা এবং পরিপূরকতা বিবেচনা করে, বৈচিত্র্যময় শিক্ষণযোগ্য সাবগ্রাফ ব্যবহার করে আরও সমৃদ্ধ গতি প্যাটার্ন ক্যাপচার করে २. ক্রস-ডোমেইন তথ্য বৈসাদৃশ্য প্রক্রিয়া: মাল্টি-স্কেল স্থানগত এবং সময়গত তথ্য মিথস্ক্রিয়া উন্নত করার জন্য ক্রস-ডোমেইন তথ্য বৈসাদৃশ্য প্রক্রিয়া ३. সমজাতীয় তথ্য সীমাবদ্ধতা প্রক্রিয়া: সাবগ্রাফ শেখার সূক্ষ্ম সমন্বয়ের জন্য সমজাতীয় তথ্য সীমাবদ্ধতা প্রক্রিয়া ४. পরীক্ষামূলক যাচাইকরণ: মান এইচএমপি বেঞ্চমার্ক পরীক্ষায় ব্যাপক পরীক্ষা, বিভিন্ন পরিস্থিতিতে মানব গতি সঠিকভাবে পূর্বাভাস দেওয়ার পদ্ধতির কার্যকারিতা এবং উচ্চতর কর্মক্ষমতা প্রমাণ করে

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

X=[X1,,XTp]RTp×J×DX = [X_1, \cdots, X_{T_p}] \in \mathbb{R}^{T_p \times J \times D} দ্বারা প্রদত্ত ঐতিহাসিক ভঙ্গি নির্দেশ করুন, Y=[XTp+1,,XTp+Tf]RTf×J×DY = [X_{T_p+1}, \cdots, X_{T_p+T_f}] \in \mathbb{R}^{T_f \times J \times D} ভবিষ্যতের TfT_f সময় পদক্ষেপের পূর্বাভাসিত গতি ক্রম নির্দেশ করুন। প্রতিটি ভঙ্গি XtRJ×DX_t \in \mathbb{R}^{J \times D} সময় tt-তে JJ সংযোগস্থল সহ DD-মাত্রিক মানব ভঙ্গি বর্ণনা করে।

মডেল আর্কিটেকচার

স্পেটিও-টেম্পোরাল মাল্টি-সাবগ্রাফ ব্লক (এসটিএমএসবি)

এসটিএমএসবি দুটি মূল মডিউল নিয়ে গঠিত: १. স্পেটিও-টেম্পোরাল ডুয়াল-ব্র্যাঞ্চ: যথাক্রমে সময়গত এবং স্থানগত ডোমেইন মডেল করে २. মাল্টি-সাবগ্রাফ শেখা: আরও সমৃদ্ধ গতি তথ্য নিষ্কাশনের জন্য একাধিক সাবগ্রাফ ব্যবহার করে

স্পেটিও-টেম্পোরাল ডুয়াল-ব্র্যাঞ্চ ডিজাইন

সময়গত মডেলিং:

  • ইনপুট XX কে XT={XT,i}i=1Tp+TfR(Tp+Tf)×JDX^T = \{X^{T,i}\}_{i=1}^{T_p+T_f} \in \mathbb{R}^{(T_p+T_f) \times J \cdot D} হিসাবে পুনর্গঠন করুন
  • ফ্রেম এম্বেডিং দ্বারা XTX^T কে CC-মাত্রিক বৈশিষ্ট্য স্থানে প্রজেক্ট করুন: X^T,i=W2(σ(W1XT,i+b1))+b2\hat{X}^{T,i} = W_2 \cdot (\sigma(W_1 \cdot X^{T,i} + b_1)) + b_2
  • ফ্রেম-মধ্যে সময়গত নির্ভরতা ক্যাপচার করতে জিসিএন ব্যবহার করুন

স্থানগত মডেলিং:

  • XX কে স্থানগত ফর্ম XS={XS,n}n=1J×DR(J×D)×(Tp+Tf)X^S = \{X^{S,n}\}_{n=1}^{J \times D} \in \mathbb{R}^{(J \times D) \times (T_p+T_f)} হিসাবে পুনর্গঠন করুন
  • সংযোগস্থল প্রতিনিধিত্ব পেতে বিচ্ছিন্ন কোসাইন রূপান্তর এবং সংযোগস্থল এম্বেডিং প্রয়োগ করুন
  • স্থানগত নির্ভরতা ক্যাপচার করতে জিসিএন ব্যবহার করুন

স্পেটিও-টেম্পোরাল তথ্য মিথস্ক্রিয়া

গড় প্রতি-সংযোগস্থল অবস্থান ত্রুটি (এমপিজেপিই) ব্যবহার করে ডোমেইন-মধ্যে জ্ঞান স্থানান্তর প্রচার করুন: LST=l=1L1(Tp+Tf)Jt=1Tp+Tfj=1JYT,t,jlYS,t,jl2L_{ST} = \sum_{l=1}^L \frac{1}{(T_p + T_f) \cdot J} \sum_{t=1}^{T_p+T_f} \sum_{j=1}^J \|Y_{T,t,j}^l - Y_{S,t,j}^l\|_2

মাল্টি-সাবগ্রাফ শেখা

বৈশিষ্ট্য শেখার জন্য KK গ্রাফ কনভোলিউশন কার্নেল ΥTl={ΥTl,1,ΥTl,2,,ΥTl,K}\Upsilon_T^l = \{\Upsilon_{T}^{l,1}, \Upsilon_{T}^{l,2}, \cdots, \Upsilon_{T}^{l,K}\} ব্যবহার করুন: MTl=Ave(HTl,1,HTl,2,,HTl,K)M_T^l = \text{Ave}(H_T^{l,1}, H_T^{l,2}, \cdots, H_T^{l,K})

কার্নেল-মধ্যে অত্যধিক পার্থক্য প্রতিরোধ করতে, সমজাতীয় তথ্য শেখার বর্ধন কৌশল প্রস্তাব করুন: LconT=l=1Lk=1Ku=k+1KATl,kATl,u22L_{con}^T = \sum_{l=1}^L \sum_{k=1}^K \sum_{u=k+1}^K \|A_T^{l,k} - A_T^{l,u}\|_2^2

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. বিচ্ছিন্ন মডেলিং: অর্থোগোনাল শাখার মাধ্যমে যথাক্রমে স্পেটিও-টেম্পোরাল নির্ভরতা মডেল করুন, বৈশিষ্ট্য বিভ্রান্তি এড়ান २. ক্রস-ডোমেইন সীমাবদ্ধতা: কার্যকর ক্রস-ডোমেইন জ্ঞান স্থানান্তর অর্জনের জন্য মাল্টি-স্কেল সামঞ্জস্য সীমাবদ্ধতা ३. মাল্টি-সাবগ্রাফ প্রক্রিয়া: বিশেষজ্ঞ মিশ্রণ মডেল দ্বারা অনুপ্রাণিত, বিভিন্ন গতি প্যাটার্ন ক্যাপচার করতে একাধিক প্রশিক্ষণযোগ্য সাবগ্রাফ ব্যবহার করুন ४. সমজাতীয় সীমাবদ্ধতা: সংলগ্ন ম্যাট্রিক্স সাদৃশ্য সীমাবদ্ধতার মাধ্যমে সাবগ্রাফ-মধ্যে সামঞ্জস্যপূর্ণ তথ্য প্রচার নিশ্চিত করুন

পরীক্ষামূলক সেটআপ

ডেটাসেট

  • Human3.6M (H3.6M): মান মানব গতি ডেটাসেট
  • CMU Motion Capture (CMU Mocap): সিএমইউ গতি ক্যাপচার ডেটাসেট

মূল্যায়ন মেট্রিক্স

গড় প্রতি-সংযোগস্থল অবস্থান ত্রুটি (এমপিজেপিই) ব্যবহার করে কর্মক্ষমতা মূল্যায়ন করুন, নিম্ন মান ভাল পূর্বাভাস কর্মক্ষমতা নির্দেশ করে।

তুলনামূলক পদ্ধতি

ট্র্যাজ-জিসিএন, ডিএমজিএনএন, এসটিএস-জিসিএন, এমএসআর-জিসিএন, এসপিজিএসএন, পিজিবিআইজি, এসটিবিএমপি এবং অন্যান্য বর্তমান প্রধান জিসিএন পদ্ধতি অন্তর্ভুক্ত করুন।

বাস্তবায়ন বিবরণ

  • নেটওয়ার্ক স্তর: L=4L = 4
  • গ্রাফ কনভোলিউশন কার্নেল সংখ্যা: K=4K = 4
  • হাইপারপ্যারামিটার: λ=0.1\lambda = 0.1

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

H3.6M ডেটাসেট ফলাফল:

  • ৮০মিলিসেকেন্ড পূর্বাভাসে, এমপিজেপিই ৯.৬১, সেরা বেসলাইন (এসটিবিএমপির ৯.৯৮) এর তুলনায় ৩.৭১% উন্নতি
  • ১৬০মিলিসেকেন্ড পূর্বাভাসে, এমপিজেপিই ২১.৬३, সেরা বেসলাইনের তুলনায় ३.१३% উন্নতি
  • একাধিক সময় পদক্ষেপে সর্বোত্তম কর্মক্ষমতা অর্জন করুন

সিএমইউ মোকাপ ডেটাসেট ফলাফল:

  • গড় এমপিজেপিই ३२.४३, সমস্ত তুলনামূলক পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে ভাল
  • সমস্ত পূর্বাভাস সময় পদক্ষেপে সর্বোত্তম কর্মক্ষমতা অর্জন করুন

অ্যাবলেশন পরীক্ষা

१. মডিউল অবদান বিশ্লেষণ:

  • স্পেটিও-টেম্পোরাল ডুয়াল-ব্র্যাঞ্চ: উভয় শাখা কর্মক্ষমতায় অবদান রাখে
  • সীমাবদ্ধতা প্রক্রিয়া: LconL_{con} এবং LSTL_{ST} উভয়ই কর্মক্ষমতা উন্নত করতে পারে
  • সম্পূর্ণ মডেল সর্বোত্তম কর্মক্ষমতা অর্জন করে (३३.८०)

२. হাইপারপ্যারামিটার প্রভাব:

  • λ=0.1\lambda = 0.1 এ কর্মক্ষমতা সর্বোত্তম
  • বড় λ\lambda মান (१.०) শাখা তথ্য অনন্যতা সীমাবদ্ধ করে

३. নেটওয়ার্ক কাঠামো প্রভাব:

  • স্তর সংখ্যা LL এবং কার্নেল সংখ্যা KK বৃদ্ধি সাধারণত কর্মক্ষমতা উন্নত করে
  • L=4,K=4L=4, K=4 সর্বোত্তম কনফিগারেশন

পরীক্ষামূলক অনুসন্ধান

१. সীমাবদ্ধতা প্রক্রিয়া কার্যকারিতা: সংলগ্ন ম্যাট্রিক্স সীমাবদ্ধতা ওজন প্যারামিটার সীমাবদ্ধতার চেয়ে আরও কার্যকর २. সামঞ্জস্য বনাম বৈচিত্র্য: গ্রাফ নির্মাণ সাদৃশ্য বৈচিত্র্য সীমাবদ্ধতার চেয়ে ভাল প্রভাব ফেলে ३. শাখা নির্বাচন: স্থানগত শাখা আউটপুট চূড়ান্ত পূর্বাভাস হিসাবে সর্বোত্তম প্রভাব ফেলে

সম্পর্কিত কাজ

প্রধান গবেষণা দিকনির্দেশনা

१. সিএনএন/আরএনএন পদ্ধতি: প্রাথমিক কনভোলিউশন এবং পুনরাবৃত্তিমূলক নেটওয়ার্ক ব্যবহার করে, কিন্তু ফিল্টার নির্ভরতা এবং ত্রুটি সঞ্চয় সমস্যা রয়েছে २. জিসিএন পদ্ধতি: বর্তমান প্রধান, সংযোগস্থল-মধ্যে গতিশীল নির্ভরতা মডেলিংয়ে দক্ষ ३. ট্রান্সফর্মার পদ্ধতি: সম্প্রতি উদ্ভূত, ক্রম মডেলিংয়ে চমৎকার কর্মক্ষমতা

এই পেপারের সুবিধা

বিদ্যমান জিসিএন পদ্ধতির তুলনায়, এই পেপারটি বিচ্ছিন্ন স্পেটিও-টেম্পোরাল মডেলিং, ক্রস-ডোমেইন সীমাবদ্ধতা এবং মাল্টি-সাবগ্রাফ শেখার মাধ্যমে স্পেটিও-টেম্পোরাল বৈশিষ্ট্যের পরিপূরকতা এবং ক্রস-নির্ভরতা আরও ভালভাবে কাজে লাগায়।

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. বিচ্ছিন্ন স্পেটিও-টেম্পোরাল মডেলিং প্রতিটি ডোমেইনের অনন্য তথ্য আরও ভালভাবে ক্যাপচার করতে পারে २. ক্রস-ডোমেইন সামঞ্জস্য সীমাবদ্ধতা কার্যকরভাবে জ্ঞান স্থানান্তর প্রচার করে ३. মাল্টি-সাবগ্রাফ শেখা গতি প্যাটার্ন ক্যাপচার ক্ষমতা বৃদ্ধি করে ४. মান বেঞ্চমার্ক পরীক্ষায় এসওটিএ কর্মক্ষমতা অর্জন করেছে

সীমাবদ্ধতা

१. মডেল জটিলতা তুলনামূলকভাবে বেশি, কর্মক্ষমতা এবং গণনা দক্ষতার মধ্যে ভারসাম্য প্রয়োজন २. হাইপারপ্যারামিটার λ\lambda বিভিন্ন ডেটাসেটের জন্য সামঞ্জস্য করা প্রয়োজন ३. অত্যন্ত দীর্ঘমেয়াদী পূর্বাভাসের প্রভাব আরও যাচাইকরণের প্রয়োজন

ভবিষ্যত দিকনির্দেশনা

१. আরও দক্ষ স্পেটিও-টেম্পোরাল বৈশিষ্ট্য সংমিশ্রণ প্রক্রিয়া অন্বেষণ করুন २. স্ব-অভিযোজিত সাবগ্রাফ সংখ্যা নির্বাচন কৌশল গবেষণা করুন ३. আরও বৈচিত্র্যময় মানব গতি পরিস্থিতিতে সম্প্রসারণ করুন

গভীর মূল্যায়ন

সুবিধা

१. শক্তিশালী উদ্ভাবনী: বিচ্ছিন্ন স্পেটিও-টেম্পোরাল মডেলিং চিন্তাভাবনা উপন্যাস, ক্রস-ডোমেইন সীমাবদ্ধতা প্রক্রিয়া ডিজাইন কৌশলী २. দৃঢ় তাত্ত্বিক ভিত্তি: জিসিএন-ভিত্তিক স্থানগত মডেলিং এবং সময় ক্রম মডেলিং পর্যাপ্ত তাত্ত্বিক সমর্থন রয়েছে ३. ব্যাপক পরীক্ষা: বিস্তারিত অ্যাবলেশন পরীক্ষা এবং প্যারামিটার বিশ্লেষণ অন্তর্ভুক্ত করে ४. চমৎকার কর্মক্ষমতা: একাধিক বেঞ্চমার্ক ডেটাসেটে এসওটিএ ফলাফল অর্জন করে ५. স্পষ্ট লেখা: পেপার কাঠামো যুক্তিসঙ্গত, প্রযুক্তিগত বর্ণনা নির্ভুল

অপূর্ণতা

१. গণনা জটিলতা: মাল্টি-ব্র্যাঞ্চ এবং মাল্টি-সাবগ্রাফ ডিজাইন মডেল জটিলতা বৃদ্ধি করে २. প্যারামিটার সংবেদনশীলতা: হাইপারপ্যারামিটার λ\lambda কর্মক্ষমতায় উল্লেখযোগ্য প্রভাব ফেলে, সাবধানে সমন্বয় প্রয়োজন ३. সাধারণীকরণ বিশ্লেষণ অভাব: বিভিন্ন ধরনের গতির (যেমন নৃত্য, জিমন্যাস্টিক্স ইত্যাদি) সাধারণীকরণ ক্ষমতার বিশ্লেষণ অভাব ४. রিয়েল-টাইম বিবেচনা: মডেলের অনুমান গতি এবং রিয়েল-টাইম প্রয়োগ সম্ভাবনা আলোচনা করা হয়নি

প্রভাব

१. একাডেমিক অবদান: স্পেটিও-টেম্পোরাল বৈশিষ্ট্য মডেলিংয়ের জন্য নতুন বিচ্ছিন্ন চিন্তাভাবনা প্রদান করে २. ব্যবহারিক মূল্য: রোবোটিক্স, গেমিং, সেন্সর ইন্টারঅ্যাকশন এবং অন্যান্য ক্ষেত্রে প্রয়োগের সম্ভাবনা রয়েছে ३. পুনরুৎপাদনযোগ্যতা: বিস্তারিত বাস্তবায়ন বিবরণ এবং প্যারামিটার সেটিংস প্রদান করে

প্রযোজ্য পরিস্থিতি

१. উচ্চ নির্ভুলতা প্রয়োজনীয়তা: পূর্বাভাস নির্ভুলতার উচ্চ প্রয়োজনীয় প্রয়োগ পরিস্থিতিতে উপযুক্ত २. মান ক্রিয়া পূর্বাভাস: দৈনন্দিন কার্যকলাপ, ক্রীড়া কার্যকলাপ এবং অন্যান্য মান ক্রিয়া পূর্বাভাসে ভাল কর্মক্ষমতা ३. স্বল্প-মধ্যমেয়াদী পূর্বাভাস: ১০০০মিলিসেকেন্ডের মধ্যে পূর্বাভাস কাজে চমৎকার কর্মক্ষমতা

রেফারেন্স

পেপারটি ৬০টিরও বেশি সম্পর্কিত রেফারেন্স উদ্ধৃত করে, যা মানব গতি পূর্বাভাসের প্রধান পদ্ধতি অন্তর্ভুক্ত করে, সিএনএন, আরএনএন, এলএসটিএম, ট্রান্সফর্মার এবং জিসিএন সহ বিভিন্ন পদ্ধতি, পাঠকদের জন্য ব্যাপক পটভূমি জ্ঞান প্রদান করে।


সামগ্রিক মূল্যায়ন: এটি কম্পিউটার ভিশনে একটি উচ্চ-মানের পেপার, মানব গতি পূর্বাভাসের এই গুরুত্বপূর্ণ কাজে উদ্ভাবনী সমাধান প্রস্তাব করে। বিচ্ছিন্ন স্পেটিও-টেম্পোরাল মডেলিংয়ের মূল ধারণা একটি নির্দিষ্ট সার্বজনীনতা রয়েছে, পরীক্ষামূলক ফলাফল প্রভাবশালী। যদিও মডেল জটিলতা এবং প্যারামিটার সমন্বয়ের ক্ষেত্রে কিছু চ্যালেঞ্জ রয়েছে, সামগ্রিক অবদান উল্লেখযোগ্য এবং আরও গবেষণা এবং মনোযোগের যোগ্য।