এই পেপারটি তাৎক্ষণিক স্কিনড গাউসিয়ান অ্যাভাটার প্রস্তাব করে, যা একটি রিয়েল-টাইম ক্রস-প্ল্যাটফর্ম ৩ডি অ্যাভাটার সিস্টেম। বিদ্যমান গাউসিয়ান স্প্ল্যাটিং অ্যানিমেশন পদ্ধতিগুলি সাধারণত ক্যামেরা অ্যারে, দীর্ঘ প্রি-প্রসেসিং বা উচ্চ-স্তরের জিপিইউ প্রয়োজন। কিছু পদ্ধতি গাউসিয়ান স্প্ল্যাটিংকে মেশ-ভিত্তিক প্রতিনিধিত্বে রূপান্তরিত করার চেষ্টা করে, যদিও এটি হালকা-ওজনের কর্মক্ষমতা অর্জন করে তবে ভিজ্যুয়াল আনুগত্য ত্যাগ করে। এর বিপরীতে, এই সিস্টেমটি সমান্তরাল স্প্ল্যাট প্রসেসিংয়ের মাধ্যমে গাউসিয়ান স্প্ল্যাটিংকে দক্ষতার সাথে অ্যানিমেট করে, রিয়েল-টাইমে অন্তর্নিহিত স্কিনড মেশের গতিশীল পরিবর্তনগুলি অনুসরণ করে, একই সাথে উচ্চ ভিজ্যুয়াল আনুগত্য বজায় রাখে। স্মার্টফোন-ভিত্তিক ৩ডি স্ক্যানিং থেকে ডিভাইস-অন-ডিভাইস প্রি-প্রসেসিং পর্যন্ত, সম্পূর্ণ প্রক্রিয়াটি মাত্র প্রায় ৫ মিনিট সময় নেয়, যেখানে অ্যাভাটার জেনারেশন ধাপটি নিজেই মাত্র প্রায় ৩০ সেকেন্ড সময় নেয়। এই সিস্টেমটি ব্যবহারকারীদের বাস্তব-বিশ্বের চেহারাকে তাৎক্ষণিকভাবে ৩ডি অ্যাভাটারে রূপান্তরিত করতে সক্ষম করে, যা সোশ্যাল মিডিয়া এবং মেটাভার্স অ্যাপ্লিকেশনের সাথে নিরবচ্ছিন্ন একীকরণের জন্য অত্যন্ত উপযুক্ত।
ঐতিহ্যবাহী ৩ডি চরিত্র অ্যাভাটার তৈরি ম্যানুয়াল মডেলিং বা ফটোগ্রামেট্রি পাইপলাইনের উপর নির্ভর করে, যা পদ্ধতিগুলি হয় সময়-সাপেক্ষ এবং শ্রম-নিবিড়, অথবা পেশাদার সরঞ্জাম প্রয়োজন। যদিও গাউসিয়ান স্প্ল্যাটিং প্রযুক্তি উচ্চ-আনুগত্য দৃশ্য পুনর্নির্মাণ এবং রিয়েল-টাইম রেন্ডারিংয়ে উৎকর্ষ প্রদর্শন করে, বিদ্যমান গাউসিয়ান স্প্ল্যাটিং অ্যানিমেশন পদ্ধতিগুলির নিম্নলিখিত সীমাবদ্ধতা রয়েছে:
১. উচ্চ হার্ডওয়্যার প্রয়োজনীয়তা: ক্যামেরা অ্যারে, উচ্চ-স্তরের জিপিইউ ইত্যাদি ব্যয়বহুল সরঞ্জাম প্রয়োজন ২. দীর্ঘ প্রি-প্রসেসিং সময়: এক্সঅ্যাভাটারের মতো পদ্ধতিগুলির ২-৩ ঘন্টার প্রি-প্রসেসিং সময় প্রয়োজন ३. ভিজ্যুয়াল আনুগত্য হ্রাস: মেশ প্রতিনিধিত্বে রূপান্তর অভিব্যক্তিশীলতা হ্রাস করে ४. দুর্বল অ্যাক্সেসযোগ্যতা: সাধারণ ব্যবহারকারীদের জন্য ব্যবহার করা কঠিন
এই গবেষণাটি ৩ডি অ্যাভাটার তৈরির অ্যাক্সেসযোগ্যতা সমস্যা সমাধানের লক্ষ্য রাখে, যা সাধারণ ব্যবহারকারীদের দ্রুত এবং সুবিধাজনকভাবে উচ্চ-মানের ৩ডি অ্যাভাটার তৈরি করতে সক্ষম করে। এটি নিম্নলিখিত ক্ষেত্রগুলির জন্য গুরুত্বপূর্ণ:
१. দ্রুত অ্যাভাটার জেনারেশন সিস্টেম: স্ক্যান থেকে অ্যাভাটার তৈরি পর্যন্ত মাত্র ৫ মিনিটের সম্পূর্ণ প্রবাহ প্রস্তাব করে, যেখানে মূল জেনারেশন ধাপটি মাত্র ৩০ সেকেন্ড সময় নেয় २. দক্ষ অ্যানিমেশন পদ্ধতি: সমান্তরাল স্প্ল্যাট প্রসেসিংয়ের মাধ্যমে গাউসিয়ান স্প্ল্যাটিংয়ের রিয়েল-টাইম অ্যানিমেশন অর্জন করে, উচ্চ ভিজ্যুয়াল আনুগত্য বজায় রাখে ३. ক্রস-প্ল্যাটফর্ম সামঞ্জস্য: ওয়েবএক্সআর-ভিত্তিক বাস্তবায়ন মোবাইল ডিভাইস, ভিআর হেডসেট এবং ওয়েব প্ল্যাটফর্ম সমর্থন করে ४. মোবাইল ডিভাইস অপটিমাইজেশন: আইফোন ১३ প্রোতে ৪০-৫০ এফপিএস অর্জন করে, মোবাইল ডিভাইসের কর্মক্ষমতার জন্য বিশেষভাবে অপটিমাইজ করা হয়েছে
ইনপুট: একটি একক ক্যামেরা দিয়ে ধারণ করা সংক্ষিপ্ত ভিডিও (স্ক্যানিভার্স অ্যাপ্লিকেশনের মাধ্যমে) আউটপুট: রিয়েল-টাইম অ্যানিমেটযোগ্য উচ্চ-আনুগত্য ৩ডি অ্যাভাটার সীমাবদ্ধতা:
সিস্টেমের মূল ধারণা হল গাউসিয়ান স্প্ল্যাটগুলিকে পটভূমি ৩ডি মেশের শীর্ষবিন্দু গতিবিধি অনুসরণ করতে দেওয়া। প্রি-প্রসেসিং পর্যায়ে, স্প্ল্যাটগুলি মেশ শীর্ষবিন্দুতে বরাদ্দ করা হয় এবং আপেক্ষিক রূপান্তর সম্পর্ক সংরক্ষণ করা হয়। রানটাইমে, পটভূমি মেশ অ্যানিমেট করে এবং গাউসিয়ান স্প্ল্যাট অবস্থান সমান্তরালভাবে আপডেট করে রিয়েল-টাইম অ্যানিমেশন অর্জন করা হয়।
ধাপ ১: ৩ডি স্ক্যানিং
ধাপ २: পয়েন্ট ক্লাউড ফিল্টারিং
ধাপ ३: পোজ অনুমান এবং মেশ স্থাপন
ধাপ ४: স্প্ল্যাট-শীর্ষবিন্দু বাঁধাই
ধাপ ५: ডেটা আউটপুট
প্রতিটি ফ্রেমে তিনটি ধাপ: १. মেশ অ্যানিমেশন: পটভূমি স্কিনড মেশ অ্যানিমেট করা २. স্প্ল্যাট আপডেট: গাউসিয়ান স্প্ল্যাটের অবস্থান এবং দিকনির্দেশনা সমান্তরালভাবে আপডেট করা ३. গভীরতা সাজানো: পর্যবেক্ষকের দৃষ্টিভঙ্গি অনুযায়ী স্প্ল্যাটগুলি সাজানো
ঐতিহ্যবাহী গতিশীল গাউসিয়ান স্প্ল্যাটিং প্রতিটি ফ্রেমে অবস্থান ডেটা আপডেট করার প্রয়োজন, যা কর্মক্ষমতা গুরুতরভাবে হ্রাস করে। এই পেপারটি সমান্তরাল স্প্ল্যাট প্রসেসিংয়ের মাধ্যমে এই সমস্যার সমাধান করে।
সর্টিংয়ের গণনামূলক খরচ কমাতে, গ্রুপড সর্টিং কৌশল গ্রহণ করা হয়:
সময় দক্ষতা:
রেন্ডারিং কর্মক্ষমতা:
१. উচ্চ স্বয়ংক্রিয়করণ স্তর: প্রি-প্রসেসিং ধাপগুলি সম্পূর্ণভাবে স্বয়ংক্রিয় २. ক্রস-প্ল্যাটফর্ম সামঞ্জস্য: মোবাইল ডিভাইস, ভিআর হেডসেট, ওয়েব প্ল্যাটফর্ম সমর্থন করে ३. মান ফর্ম্যাট সমর্থন: ভিআরএম ফর্ম্যাট ব্যবহার করে, বিদ্যমান অ্যাপ্লিকেশনের সাথে একীকরণ সহজ করে ४. রিয়েল-টাইম কর্মক্ষমতা: রিয়েল-টাইম রেন্ডারিং বজায় রেখে উচ্চ ভিজ্যুয়াল গুণমান বজায় রাখে
পেপারটি একাধিক সম্পর্কিত কাজ উদ্ধৃত করে:
বিদ্যমান পদ্ধতির তুলনায়, এই পেপারের প্রধান সুবিধাগুলি হল: १. প্রসেসিং গতি: এক্সঅ্যাভাটারের २-३ ঘন্টার তুলনায়, এই পেপারটি মাত্র ३० সেকেন্ড সময় নেয় २. ডিভাইস প্রয়োজনীয়তা: উচ্চ-স্তরের জিপিইউ বা ক্যামেরা অ্যারের প্রয়োজন নেই ३. অ্যাক্সেসযোগ্যতা: সম্পূর্ণভাবে মোবাইল ডিভাইস এবং ব্রাউজার-ভিত্তিক ४. আনুগত্য: গাউসিয়ান স্প্ল্যাটিংয়ের উচ্চ ভিজ্যুয়াল গুণমান বজায় রাখে
१. দ্রুত, উচ্চ-মানের ३ডি অ্যাভাটার জেনারেশন সিস্টেম সফলভাবে বাস্তবায়ন করা হয়েছে २. সমান্তরাল প্রসেসিং এবং গ্রুপড সর্টিংয়ের মাধ্যমে গতিশীল গাউসিয়ান স্প্ল্যাটিংয়ের কর্মক্ষমতা সমস্যা কার্যকরভাবে সমাধান করা হয়েছে ३. ওয়েবএক্সআর-ভিত্তিক বাস্তবায়ন ক্রস-প্ল্যাটফর্ম সামঞ্জস্য নিশ্চিত করে ४. মোবাইল ডিভাইস অপটিমাইজেশন সাধারণ ব্যবহারকারীদের সুবিধাজনকভাবে ব্যবহার করতে সক্ষম করে
१. তৃতীয় পক্ষের অ্যাপ্লিকেশনের উপর নির্ভরতা: ३ডি স্ক্যানিংয়ের জন্য স্ক্যানিভার্স ব্যবহার করার প্রয়োজন २. পোজ সীমাবদ্ধতা: প্রি-প্রসেসিংয়ের সময় এ-পোজ প্রয়োজন, ব্যবহারের ক্ষেত্রগুলি সীমাবদ্ধ করে ३. মেশ নির্ভুলতা: পটভূমি মেশের গুণমান চূড়ান্ত ফলাফলকে প্রভাবিত করতে পারে ४. গ্রুপড সর্টিং ট্রেড-অফ: মোবাইল সামঞ্জস্যের জন্য কিছু রেন্ডারিং নির্ভুলতা ত্যাগ করা হয়েছে
१. আরও বেশি ३ডি স্ক্যানিং সমাধান একীভূত করা, নির্দিষ্ট অ্যাপ্লিকেশনের উপর নির্ভরতা হ্রাস করা २. আরও বৈচিত্র্যময় প্রাথমিক পোজ সমর্থন করা ३. গ্রুপড সর্টিং অ্যালগরিদম অপটিমাইজ করা, রেন্ডারিং গুণমান উন্নত করা ४. আরও জটিল অ্যানিমেশন দৃশ্যে সম্প্রসারণ করা
१. সোশ্যাল মিডিয়া অ্যাপ্লিকেশন: দ্রুত ব্যক্তিগত অ্যাভাটার তৈরি করা २. মেটাভার্স প্ল্যাটফর্ম: ব্যবহারকারী পরিচয় প্রতিনিধিত্ব ३. ভার্চুয়াল সম্মেলন: উপস্থিতির অনুভূতি বৃদ্ধি করা ४. গেম অ্যাপ্লিকেশন: চরিত্র কাস্টমাইজেশন ५. এআর/ভিআর অভিজ্ঞতা: ব্যক্তিগতকৃত ভার্চুয়াল ইমেজ
পেপারটি १२টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা প্রধানত নিম্নলিখিত বিষয়গুলি কভার করে:
এই সংদর্ভগুলি সম্পর্কিত গবেষণা ক্ষেত্রকে ভালভাবে কভার করে এবং এই পেপারের কাজের জন্য পর্যাপ্ত পটভূমি সমর্থন প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি একটি অত্যন্ত ব্যবহারিক সিস্টেম পেপার, যদিও অ্যালগরিদম উদ্ভাবনে তুলনামূলকভাবে সীমিত, তবে বাস্তব সমস্যা সমাধান এবং অ্যাক্সেসযোগ্যতা উন্নত করার ক্ষেত্রে গুরুত্বপূর্ণ অবদান রেখেছে। সিস্টেমের দ্রুততা এবং মোবাইল সামঞ্জস্য এটিকে অত্যন্ত ব্যবহারিক মূল্য প্রদান করে এবং বাস্তব অ্যাপ্লিকেশনে স্থাপনের জন্য উপযুক্ত।