বাক্য এমবেডিং পদ্ধতি উল্লেখযোগ্য অগ্রগতি অর্জন করেছে, কিন্তু বাক্যের মধ্যে অন্তর্নিহিত শব্দার্থ ক্যাপচার করার ক্ষেত্রে এখনও কঠিনতা রয়েছে। এটি ঐতিহ্যবাহী বাক্য এমবেডিং পদ্ধতির অন্তর্নিহিত সীমাবদ্ধতার জন্য দায়ী যা প্রতিটি বাক্যে একটি একক ভেক্টর নির্ধারণ করে। এই সীমাবদ্ধতা অতিক্রম করার জন্য, এই গবেষণাপত্রটি DualCSE প্রস্তাব করে, একটি পদ্ধতি যা প্রতিটি বাক্যে দুটি এমবেডিং নির্ধারণ করে: একটি স্পষ্ট শব্দার্থ প্রতিনিধিত্ব করে, অন্যটি অন্তর্নিহিত শব্দার্থ প্রতিনিধিত্ব করে। এই এমবেডিংগুলি একটি ভাগ করা স্থানে সহাবস্থান করে, যা তথ্য পুনরুদ্ধার এবং পাঠ্য শ্রেণীবিভাগের মতো নির্দিষ্ট উদ্দেশ্যের জন্য প্রয়োজনীয় শব্দার্থ নির্বাচন করতে সক্ষম করে। পরীক্ষামূলক ফলাফলগুলি দেখায় যে DualCSE কার্যকরভাবে স্পষ্ট এবং অন্তর্নিহিত অর্থ এনকোড করতে পারে এবং ডাউনস্ট্রিম কাজের কর্মক্ষমতা উন্নত করে।
বিদ্যমান বাক্য এমবেডিং পদ্ধতিগুলি অন্তর্নিহিত শব্দার্থ পরিচালনায় উল্লেখযোগ্য ত্রুটি প্রদর্শন করে। Sun এবং অন্যান্যরা (২০২৫) নির্দেশ করেছেন যে এমনকি অত্যাধুনিক বাক্য এমবেডিং পদ্ধতিগুলিও MTEB শ্রেণীবিভাগ বেঞ্চমার্কে স্পষ্ট শব্দার্থ এবং অন্তর্নিহিত শব্দার্থের মধ্যে প্রায় ২০% কর্মক্ষমতা ব্যবধান প্রদর্শন করে।
১. শব্দার্থিক বোঝাপড়ার সম্পূর্ণতা: প্রাকৃতিক ভাষায় শাব্দিক অর্থ (স্পষ্ট শব্দার্থ) এবং রূপক বা ব্যবহারিক অর্থ (অন্তর্নিহিত শব্দার্থ) উভয়ই রয়েছে २. ব্যবহারিক প্রয়োগের চাহিদা: তথ্য পুনরুদ্ধার, পাঠ্য শ্রেণীবিভাগ এবং অন্যান্য কাজগুলি শব্দার্থের বিভিন্ন স্তর বোঝার প্রয়োজন ३. মডেল সীমাবদ্ধতা: ঐতিহ্যবাহী পদ্ধতিগুলি শুধুমাত্র একটি একক ভেক্টর দিয়ে বাক্য প্রতিনিধিত্ব করে, একাধিক ব্যাখ্যার অস্তিত্ব উপেক্ষা করে
१. DualCSE কাঠামো প্রস্তাব: প্রতিটি বাক্যের জন্য দুটি এমবেডিং ভেক্টর তৈরি করে, যা যথাক্রমে স্পষ্ট এবং অন্তর্নিহিত শব্দার্থ প্রতিনিধিত্ব করে २. উপন্যাস বৈপরীত্যমূলক ক্ষতি ফাংশন ডিজাইন: বাক্য-মধ্যে এবং বাক্য-অভ্যন্তরীণ সম্পর্ক একযোগে অপ্টিমাইজ করে ३. দ্বৈত-শব্দার্থিক ভাগ করা স্থান নির্মাণ: স্পষ্ট এবং অন্তর্নিহিত এমবেডিংগুলিকে একই স্থানে তুলনা করতে সক্ষম করে ४. পদ্ধতির কার্যকারিতা যাচাই: RTE এবং EIS কাজে পদ্ধতির শ্রেষ্ঠত্ব প্রমাণ করে ५. অন্তর্নিহিত মূল্যায়ন ক্ষমতা প্রদান: বাক্যের অন্তর্নিহিত ডিগ্রি অনুমান করতে পারে
বাক্য s দেওয়া হলে, DualCSE এটিকে দুটি এমবেডিং হিসাবে এনকোড করে:
গবেষণাপত্রটি দুটি এনকোডার স্থাপত্য প্রস্তাব করে:
१. ক্রস-এনকোডার:
२. দ্বি-এনকোডার:
INLI ডেটাসেটের উপর ভিত্তি করে ডিজাইন করা ক্ষতি ফাংশন:
v(h₁,h₂) = e^(sim(h₁,h₂)/τ)
lᵢ = -log(v(rᵢ,r⁺ᵢ₁)/∑ⱼ(v(rᵢ,r⁺ⱼ₁) + v(rᵢ,r⁻ⱼ) + v(rᵢ,uⱼ)))
-log(v(uᵢ,r⁺ᵢ₂)/∑ⱼ(v(uᵢ,r⁺ⱼ₂) + v(uᵢ,r⁻ⱼ) + v(uᵢ,rⱼ)))
-log(v(r⁺ᵢ₁,u⁺ᵢ₁)/∑ⱼv(r⁺ᵢ₁,u⁺ⱼ₁))
-log(v(r⁺ᵢ₂,u⁺ᵢ₂)/∑ⱼv(r⁺ᵢ₂,u⁺ⱼ₂))
-log(v(r⁻ᵢ,u⁻ᵢ)/∑ⱼv(r⁻ᵢ,u⁻ⱼ))
१. দ্বৈত শব্দার্থিক প্রতিনিধিত্ব: একক-ভেক্টর সীমাবদ্ধতা অতিক্রম করে, বাক্যকে দুটি ভিন্ন মাত্রার প্রতিনিধিত্ব প্রদান করে २. বাক্য-মধ্যে এবং বাক্য-অভ্যন্তরীণ সম্পর্ক মডেলিং:
१. SimCSE (SNLI+MNLI): মান NLI ডেটাসেটে প্রশিক্ষিত २. SimCSE (INLI): INLI ডেটাসেটে প্রশিক্ষিত SimCSE ३. ImpScore: অন্তর্নিহিত মূল্যায়ন স্কোরিংয়ের জন্য বিশেষভাবে ডিজাইন করা পদ্ধতি ४. বড় ভাষা মডেল: GPT-4, Gemini-1.5-Pro ইত্যাদি রেফারেন্স হিসাবে
| মডেল | স্পষ্ট | অন্তর্নিহিত | নিরপেক্ষ | বিরোধিতা | গড় |
|---|---|---|---|---|---|
| SimCSE (SNLI+MNLI) | 79.80 | 49.00 | 74.30 | 67.60 | 67.68 |
| SimCSE (INLI) | 90.60 | 69.10 | 66.90 | 91.00 | 79.40 |
| DualCSE-Cross | 90.20 | 73.40 | 68.40 | 88.70 | 80.18 |
| DualCSE-Bi | 91.90 | 69.90 | 72.10 | 87.60 | 80.38 |
| Gemini-1.5-Pro | 97.90 | 80.30 | 92.00 | 95.40 | 91.40 |
| মডেল | INLI | Wang এবং অন্যান্যদের ডেটাসেট |
|---|---|---|
| LENGTH | 99.90 | 73.37 |
| ImpScore (মূল) | 80.55 | 95.20 |
| ImpScore (INLI) | 99.97 | 81.56 |
| DualCSE-Cross | 99.97 | 79.31 |
| DualCSE-Bi | 100 | 77.48 |
বিলোপন পরীক্ষা ক্ষতি ফাংশনের প্রতিটি উপাদানের গুরুত্ব যাচাই করে:
| ক্ষতি ফাংশন কনফিগারেশন | RTE | EIS |
|---|---|---|
| সম্পূর্ণ DualCSE | 80.18 | 99.97 |
| বিরোধিতা পদ ছাড়া | 64.57 | 99.88 |
| বাক্য-অভ্যন্তরীণ সম্পর্ক ছাড়া | 80.10 | 92.25 |
| বিরোধিতা পদ এবং বাক্য-অভ্যন্তরীণ সম্পর্ক ছাড়া | 64.68 | 32.75 |
আবিষ্কার:
অনুসন্ধান বাক্য: "She conquered his heart."
স্পষ্ট শব্দার্থ পুনরুদ্ধার ফলাফল: १. "She defeated his heart in battle."(শাব্দিক যুদ্ধ অর্থ) २. "She overcame his cardiac defenses." ३. "She vanquished his emotional barriers."
অন্তর্নিহিত শব্দার্থ পুনরুদ্ধার ফলাফল: १. "She won his affection and love."(প্রেম অর্থ) २. "She captured his romantic interest." ३. "She gained his deep emotional attachment."
१. প্রথম সিস্টেমেটিক: স্পষ্ট/অন্তর্নিহিত শব্দার্থের দ্বৈত প্রতিনিধিত্বের জন্য বিশেষভাবে २. শেষ-থেকে-শেষ প্রশিক্ষণ: একটি একীভূত কাঠামোতে দুটি শব্দার্থ একযোগে শিখুন ३. শক্তিশালী ব্যবহারিকতা: সরাসরি একাধিক ডাউনস্ট্রিম কাজে প্রয়োগ করা যায়
१. DualCSE কার্যকারিতা: RTE এবং EIS কাজ উভয়েই ভিত্তি পদ্ধতির চেয়ে উন্নত २. দ্বৈত প্রতিনিধিত্ব মূল্য: স্পষ্ট এবং অন্তর্নিহিত শব্দার্থের পৃথক প্রতিনিধিত্ব সত্যিই বোঝায় সহায়তা করে ३. ক্ষতি ফাংশন ডিজাইন যুক্তিসঙ্গত: বাক্য-মধ্যে এবং বাক্য-অভ্যন্তরীণ সম্পর্ক মডেলিং উভয়ই গুরুত্বপূর্ণ ४. স্থাপত্য নমনীয়তা: ক্রস-এনকোডার এবং দ্বি-এনকোডার উভয়ই কার্যকরভাবে কাজ করতে পারে
१. ডেটাসেট নির্ভরতা: শুধুমাত্র INLI ডেটাসেটে প্রশিক্ষিত, ডোমেইন বৈচিত্র্য সীমিত २. মূল্যায়ন কাজ সীমিত: শুধুমাত্র দুটি কাজে যাচাই করা হয়েছে, ব্যাপক মূল্যায়ন অভাব ३. গণনা ওভারহেড: প্রতিটি বাক্যের জন্য দুটি এমবেডিং তৈরি করতে হয়, গণনা খরচ বৃদ্ধি করে ४. ক্রস-ডোমেইন সাধারণীকরণ: Wang এবং অন্যান্যদের ডেটাসেটে বিশেষায়িত পদ্ধতির মতো ভাল পারফরম্যান্স নয়
१. ডেটাসেট সম্প্রসারণ: ঘৃণা বক্তৃতা সনাক্তকরণ, অনুভূতি বিশ্লেষণ ইত্যাদি ডেটা INLI ফর্ম্যাটে রূপান্তরিত করুন २. বড় মডেল একীকরণ: পদ্ধতি বড় ভাষা মডেলে প্রসারিত করুন ३. ব্যবহারিক প্রয়োগ: গ্রাহক পর্যালোচনা বিশ্লেষণ, অনুসন্ধান ইঞ্জিন ইত্যাদি দৃশ্যে যাচাই করুন ४. তাত্ত্বিক বিশ্লেষণ: স্পষ্ট/অন্তর্নিহিত শব্দার্থের গাণিতিক বৈশিষ্ট্য গভীরভাবে অধ্যয়ন করুন
१. সমস্যা সংজ্ঞা স্পষ্ট: বিদ্যমান পদ্ধতির মূল সমস্যা সঠিকভাবে চিহ্নিত করে २. পদ্ধতি উদ্ভাবন শক্তিশালী: দ্বৈত শব্দার্থিক প্রতিনিধিত্ব একটি নতুন এবং যুক্তিসঙ্গত ধারণা ३. পরীক্ষামূলক ডিজাইন সম্পূর্ণ: প্রধান পরীক্ষা, বিলোপন পরীক্ষা এবং গুণগত বিশ্লেষণ অন্তর্ভুক্ত ४. প্রযুক্তিগত বাস্তবায়ন সম্ভব: দুটি ভিন্ন স্থাপত্য পছন্দ প্রদান করে ५. কোড ওপেন সোর্স: পুনরুৎপাদনযোগ্যতা বৃদ্ধি করে
१. তাত্ত্বিক ভিত্তি দুর্বল: স্পষ্ট/অন্তর্নিহিত শব্দার্থ বিভাজনের তাত্ত্বিক বিশ্লেষণ অভাব २. মূল্যায়ন পরিসীমা সীমিত: শুধুমাত্র দুটি কাজে যাচাই করা হয়েছে, প্রমাণ শক্তি অপর্যাপ্ত ३. ভিত্তি তুলনা অপর্যাপ্ত: অন্যান্য বহু-শব্দার্থিক প্রতিনিধিত্ব পদ্ধতির সাথে তুলনা অভাব ४. দক্ষতা বিশ্লেষণ অনুপস্থিত: দ্বৈত এমবেডিং নিয়ে আসা গণনা ওভারহেড বিশ্লেষণ করা হয়নি ५. ক্রস-ভাষা ক্ষমতা অজানা: শুধুমাত্র ইংরেজিতে যাচাই করা হয়েছে
१. একাডেমিক মূল্য: বাক্য এমবেডিং গবেষণায় নতুন দৃষ্টিভঙ্গি প্রদান করে २. ব্যবহারিক মূল্য: অন্তর্নিহিত অর্থ বোঝার প্রয়োজন এমন NLP কাজে প্রয়োগ করা যায় ३. অনুপ্রেরণামূলক: বহু-শব্দার্থিক প্রতিনিধিত্ব সম্পর্কে আরও গবেষণা অনুপ্রাণিত করতে পারে ४. সীমাবদ্ধতা: প্রভাব পদ্ধতির সাধারণতা দ্বারা সীমাবদ্ধ হতে পারে
१. তথ্য পুনরুদ্ধার: শাব্দিক এবং অন্তর্নিহিত অর্থ উভয়ই বিবেচনা করার প্রয়োজন এমন অনুসন্ধান २. পাঠ্য শ্রেণীবিভাগ: অনুভূতি বিশ্লেষণ, অভিপ্রায় স্বীকৃতি ইত্যাদি কাজ ३. কথোপকথন সিস্টেম: ব্যবহারকারীর কথার বাইরের অর্থ বোঝা ४. বিষয়বস্তু পর্যালোচনা: লুকানো অনুপযুক্ত বিষয়বস্তু সনাক্ত করা ५. ভাষা শিক্ষা: ভাষার বহুস্তরীয় অর্থ বোঝায় সহায়তা করা
এই গবেষণাপত্রটি বাক্য এমবেডিং, প্রাকৃতিক ভাষা অনুমান, বৈপরীত্যমূলক শিক্ষা এবং অন্যান্য ক্ষেত্রের গুরুত্বপূর্ণ কাজ উদ্ধৃত করে, যার মধ্যে রয়েছে:
সামগ্রিক মূল্যায়ন: এটি একটি প্রযুক্তিগত উদ্ভাবন শক্তিশালী গবেষণাপত্র যা একটি আকর্ষণীয় এবং ব্যবহারিক দ্বৈত শব্দার্থিক প্রতিনিধিত্ব পদ্ধতি প্রস্তাব করে। যদিও তাত্ত্বিক গভীরতা এবং মূল্যায়ন প্রশস্ততায় উন্নতির জায়গা রয়েছে, তবে এটি বাক্য এমবেডিং গবেষণায় নতুন দিকনির্দেশনা খুলে দেয় এবং নির্দিষ্ট একাডেমিক মূল্য এবং প্রয়োগ সম্ভাবনা রয়েছে।