2025-11-20T07:34:14.820650

CardRewriter: Leveraging Knowledge Cards for Long-Tail Query Rewriting on Short-Video Platforms

Gong, Zhu, Yin et al.
Short-video platforms have rapidly become a new generation of information retrieval systems, where users formulate queries to access desired videos. However, user queries, especially long-tail ones, often suffer from spelling errors, incomplete phrasing, and ambiguous intent, resulting in mismatches between user expectations and retrieved results. While large language models (LLMs) have shown success in long-tail query rewriting within e-commerce, they struggle on short-video platforms, where proprietary content such as short videos, live streams, micro dramas, and user social networks falls outside their training distribution. To address this challenge, we introduce \textbf{CardRewriter}, an LLM-based framework that incorporates domain-specific knowledge to enhance long-tail query rewriting. For each query, our method aggregates multi-source knowledge relevant to the query and summarizes it into an informative and query-relevant knowledge card. This card then guides the LLM to better capture user intent and produce more effective query rewrites. We optimize CardRewriter using a two-stage training pipeline: supervised fine-tuning followed by group relative policy optimization, with a tailored reward system balancing query relevance and retrieval effectiveness. Offline experiments show that CardRewriter substantially improves rewriting quality for queries targeting proprietary content. Online A/B testing further confirms significant gains in long-view rate (LVR) and click-through rate (CTR), along with a notable reduction in initiative query reformulation rate (IQRR). Since September 2025, CardRewriter has been deployed on Kuaishou, one of China's largest short-video platforms, serving hundreds of millions of users daily.
academic

CardRewriter: স্বল্প-ভিডিও প্ল্যাটফর্মে দীর্ঘ-লেজ কোয়েরি পুনর্লিখনের জন্য জ্ঞান কার্ড ব্যবহার করা

মৌলিক তথ্য

  • পেপার আইডি: 2510.10095
  • শিরোনাম: CardRewriter: স্বল্প-ভিডিও প্ল্যাটফর্মে দীর্ঘ-লেজ কোয়েরি পুনর্লিখনের জন্য জ্ঞান কার্ড ব্যবহার করা
  • লেখক: Peiyuan Gong, Feiran Zhu, Yaqi Yin, Chenglei Dai, Chao Zhang, Kai Zheng, Wentian Bao, Jiaxin Mao, Yi Zhang
  • শ্রেণীবিভাগ: cs.IR (তথ্য পুনরুদ্ধার), cs.CL (গণনামূলক ভাষাবিজ্ঞান)
  • প্রকাশনার সময়: ২০২৫ সালের ১১ অক্টোবর
  • পেপার লিংক: https://arxiv.org/abs/2510.10095

সারসংক্ষেপ

স্বল্প-ভিডিও প্ল্যাটফর্মগুলি দ্রুত নতুন প্রজন্মের তথ্য পুনরুদ্ধার ব্যবস্থায় পরিণত হয়েছে, যেখানে ব্যবহারকারীরা কোয়েরির মাধ্যমে পছন্দের ভিডিও অ্যাক্সেস করেন। তবে ব্যবহারকারীর কোয়েরি, বিশেষত দীর্ঘ-লেজ কোয়েরি, প্রায়শই বানান ত্রুটি, অসম্পূর্ণ প্রকাশ এবং অস্পষ্ট অভিপ্রায়ের সমস্যায় ভুগে থাকে, যা ব্যবহারকারীর প্রত্যাশা এবং পুনরুদ্ধার ফলাফলের মধ্যে অমিল সৃষ্টি করে। যদিও বড় ভাষা মডেল (LLM) ই-কমার্স ক্ষেত্রে দীর্ঘ-লেজ কোয়েরি পুনর্লিখনে চমৎকার পারফরম্যান্স প্রদর্শন করে, তবে স্বল্প-ভিডিও প্ল্যাটফর্মে চ্যালেঞ্জের সম্মুখীন হয়, কারণ প্ল্যাটফর্ম-নির্দিষ্ট সামগ্রী (যেমন স্বল্প-ভিডিও, লাইভ স্ট্রিম, মাইক্রো-ড্রামা এবং ব্যবহারকারী সামাজিক নেটওয়ার্ক) তাদের প্রশিক্ষণ বিতরণের বাইরে রয়েছে। এই চ্যালেঞ্জ মোকাবেলার জন্য, এই পেপারটি CardRewriter প্রস্তাব করে, যা একটি LLM-ভিত্তিক কাঠামো যা ডোমেইন-নির্দিষ্ট জ্ঞান অন্তর্ভুক্ত করে দীর্ঘ-লেজ কোয়েরি পুনর্লিখন উন্নত করে। এই পদ্ধতি প্রতিটি কোয়েরির জন্য বহু-উৎস সম্পর্কিত জ্ঞান সংগ্রহ করে এবং এটিকে তথ্যপূর্ণ এবং কোয়েরি-সম্পর্কিত জ্ঞান কার্ডে সংক্ষিপ্ত করে, তারপর LLM-কে ব্যবহারকারীর অভিপ্রায় আরও ভালভাবে ক্যাপচার করতে এবং আরও কার্যকর কোয়েরি পুনর্লিখন তৈরি করতে গাইড করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

স্বল্প-ভিডিও প্ল্যাটফর্ম ব্যবহারকারী কোয়েরি তিনটি প্রধান চ্যালেঞ্জের সম্মুখীন:

  1. বানান ত্রুটি: ব্যবহারকারী দ্বারা প্রবেশ করা কোয়েরি শব্দে বানান ত্রুটি থাকতে পারে
  2. অসম্পূর্ণ প্রকাশ: ব্যবহারকারী কোয়েরি মূল তথ্য অনুপস্থিত, যা পুনরুদ্ধার ফলাফল অনির্ভুল করে তোলে
  3. অস্পষ্ট অভিপ্রায়: বিশেষত প্ল্যাটফর্ম-নির্দিষ্ট সামগ্রী জড়িত থাকলে, কোয়েরি অভিপ্রায় অস্পষ্ট থাকে

সমস্যার গুরুত্ব

  • স্বল্প-ভিডিও প্ল্যাটফর্মগুলি গুরুত্বপূর্ণ তথ্য পুনরুদ্ধার ব্যবস্থায় পরিণত হয়েছে, যা লক্ষ লক্ষ ব্যবহারকারীকে সেবা প্রদান করে
  • কোয়েরির গুণমান সরাসরি ব্যবহারকারীর অভিজ্ঞতা এবং প্ল্যাটফর্মের বাণিজ্যিক মূল্যকে প্রভাবিত করে
  • দীর্ঘ-লেজ কোয়েরি উল্লেখযোগ্য অনুপাত দখল করে, কিন্তু প্রক্রিয়াকরণ কঠিনতর

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

  1. এমবেডিং-ভিত্তিক পদ্ধতি: শব্দার্থিক সমান কোয়েরি পুনরুদ্ধারের উপর নির্ভর করে, দীর্ঘ-লেজ কোয়েরিতে সীমিত প্রভাব
  2. উৎপাদনশীল পদ্ধতি: LLM ই-কমার্স ক্ষেত্রে ভাল পারফরম্যান্স করে, কিন্তু স্বল্প-ভিডিও প্ল্যাটফর্ম-নির্দিষ্ট সামগ্রী বোঝায় অপর্যাপ্ত
  3. ডোমেইন অভিযোজন সমস্যা: বিদ্যমান LLM স্বল্প-ভিডিও, লাইভ স্ট্রিম, মাইক্রো-ড্রামা ইত্যাদি প্ল্যাটফর্ম-নির্দিষ্ট সামগ্রীতে প্রশিক্ষিত নয়

গবেষণা প্রেরণা

প্ল্যাটফর্ম-নির্দিষ্ট জ্ঞান প্রবর্তনের মাধ্যমে, স্বল্প-ভিডিও প্ল্যাটফর্ম কোয়েরি সম্পর্কে LLM-এর বোঝাপড়া এবং পুনর্লিখন ক্ষমতা বৃদ্ধি করা, বিশেষত প্ল্যাটফর্ম-নির্দিষ্ট সামগ্রী জড়িত দীর্ঘ-লেজ কোয়েরির জন্য।

মূল অবদান

  1. CardRewriter কাঠামো প্রস্তাব: স্বল্প-ভিডিও প্ল্যাটফর্ম দীর্ঘ-লেজ কোয়েরি পুনর্লিখনের জন্য প্রথম LLM-ভিত্তিক কাঠামো, জ্ঞান কার্ডের মাধ্যমে প্ল্যাটফর্ম-নির্দিষ্ট জ্ঞান কার্যকরভাবে একীভূত করে
  2. দুই-পর্যায়ের প্রশিক্ষণ কৌশল ডিজাইন: তত্ত্বাবধানকৃত সূক্ষ্ম-সুর (SFT) এবং গোষ্ঠী আপেক্ষিক নীতি অপ্টিমাইজেশন (GRPO) একত্রিত করে, প্রাসঙ্গিকতা এবং কার্যকারিতা ভারসাম্য রাখতে কাস্টমাইজড পুরস্কার ব্যবস্থা ব্যবহার করে
  3. বাস্তব প্রভাব যাচাই: Kuaishou প্ল্যাটফর্মে স্থাপনা যাচাই, অফলাইন এবং অনলাইন পরীক্ষা উভয়ই উল্লেখযোগ্য উন্নতি প্রদর্শন করে
  4. সম্পূর্ণ সমাধান প্রদান: জ্ঞান সংগ্রহ, কার্ড প্রজন্ম থেকে কোয়েরি পুনর্লিখন পর্যন্ত সম্পূর্ণ সমাধান

পদ্ধতির বিস্তারিত ব্যাখ্যা

কাজের সংজ্ঞা

প্রদত্ত ইনপুট কোয়েরি x, CardRewriter-এর লক্ষ্য হল পুনর্লিখন কোয়েরি y উৎপন্ন করা, যাতে এটি ব্যবহারকারীর অভিপ্রায়ের সাথে আরও সামঞ্জস্যপূর্ণ ভিডিও সামগ্রী পুনরুদ্ধার করতে পারে। সম্পূর্ণ প্রক্রিয়া এভাবে প্রকাশ করা যায়:

y = G_θ(x, c), c = C_θ(x, M)

যেখানে c হল জ্ঞান কার্ড, M হল বহু-উৎস জ্ঞান, C_θ হল কার্ড প্রজন্ম মডেল, G_θ হল কোয়েরি পুনর্লিখন মডেল।

মডেল আর্কিটেকচার

১. জ্ঞান সংগ্রহ পর্যায়

বহুমাধ্যম ভিডিও জ্ঞান নিষ্কাশন:

  • ভিজ্যুয়াল সামগ্রী: ভিডিওর তিনটি মূল ফ্রেম নিষ্কাশন
  • পাঠ্য সামগ্রী: শিরোনাম, সাবটাইটেল, কভার OCR পাঠ্য, লেখক নাম, পটভূমি সঙ্গীত

সমান কোয়েরি সম্প্রসারণ:

  • নিয়ম-ভিত্তিক ম্যাচিং (Q2Q): মূল কোয়েরির সাথে শব্দ ওভারল্যাপ এবং পুনরুদ্ধার ভিডিও তালিকা ছেদ সহ কোয়েরি নির্বাচন করা
  • এমবেডিং-ভিত্তিক ম্যাচিং (EMB): কোয়েরি মধ্যে এমবেডিং সাদৃশ্য গণনা করা

খোলা ডোমেইন ডকুমেন্ট সম্পূরক: API সেবার মাধ্যমে সম্পর্কিত খোলা ডোমেইন ডকুমেন্ট অর্জন করা সম্পূরক জ্ঞান উৎস হিসাবে

২. কার্ড-ভিত্তিক পুনর্লিখন পর্যায়

জ্ঞান কার্ড প্রজন্ম:

  • ইনপুট: মূল কোয়েরি x এবং বহু-উৎস জ্ঞান M
  • আউটপুট: সংক্ষিপ্ত এবং সম্পর্কিত জ্ঞান কার্ড c
  • লক্ষ্য: শব্দ দূর করা, একীভূত করা, কোয়েরির সাথে সরাসরি সম্পর্কিত সামগ্রী তুলে ধরা

কোয়েরি পুনর্লিখন:

  • ইনপুট: মূল কোয়েরি x এবং জ্ঞান কার্ড c
  • আউটপুট: পুনর্লিখন কোয়েরি y
  • লক্ষ্য: কার্ড তথ্য ব্যবহার করে অনুসন্ধান প্রসঙ্গ আরও ভালভাবে বোঝা

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

  1. জ্ঞান কার্ড ডিজাইন: বহু-উৎস জ্ঞান সরাসরি ইনজেক্ট করার তুলনায়, জ্ঞান কার্ড কাঠামো অসামঞ্জস্য, অত্যধিক শব্দ এবং সীমিত প্রাসঙ্গিকতার সমস্যা কার্যকরভাবে সমাধান করে
  2. দুই-পর্যায়ের প্রশিক্ষণ কৌশল:
    • SFT পর্যায়: উচ্চ-মানের ডেটা ব্যবহার করে তত্ত্বাবধানকৃত সূক্ষ্ম-সুর
    • GRPO পর্যায়: শক্তিশালী শিক্ষার মাধ্যমে আরও অপ্টিমাইজ করা
  3. কাস্টমাইজড পুরস্কার ব্যবস্থা:
    R_Overall = {
        R_Sys, if R_Sys > 0
        0.1, if R_Sys = 0 and R_Rel > 0  
        0, if R_Sys = R_Rel = 0
    }
    

    শব্দার্থিক প্রাসঙ্গিকতা এবং সিস্টেম পছন্দ ভারসাম্য রাখা

পরীক্ষা সেটআপ

ডেটাসেট

প্রশিক্ষণ ডেটাসেট:

  • কার্ড প্রজন্ম: ২০ লক্ষ কোয়েরি, ১৬০ লক্ষ চতুর্ভুজ উৎপন্ন, পরিস্রাবণের পর ৩০,০০০ উচ্চ-মানের ত্রিভুজ সংরক্ষিত
  • কোয়েরি পুনর্লিখন: ৪০ লক্ষ কোয়েরি, ৩২০ লক্ষ ত্রিভুজ উৎপন্ন, পরিস্রাবণের পর SFT-এর জন্য ৫০,০০০ জোড়া সংরক্ষিত
  • পুরস্কার মডেলিং: ১৫ লক্ষ কোয়েরি, ২৪ লক্ষ পছন্দ জোড়া উৎপন্ন

পরীক্ষা ডেটাসেট:

  • কার্ড প্রজন্ম: ১০,০০০ কোয়েরি
  • পুরস্কার মডেলিং: ১০,০০০ কোয়েরি
  • কোয়েরি পুনর্লিখন: ১৫,০০০ কোয়েরি

মূল্যায়ন মেট্রিক্স

অফলাইন মেট্রিক্স:

  1. Rel (প্রাসঙ্গিকতা): মডেল আউটপুটের শব্দার্থিক গুণমান মূল্যায়ন করা
  2. Increment (পুনরুদ্ধার সম্প্রসারণ): পুনরুদ্ধার কভারেজ পরিসরের আপেক্ষিক উন্নতি পরিমাপ করা
  3. Hitrate@K (ব্যবহারকারী সন্তুষ্টি): পুনর্লিখন কোয়েরি শীর্ষ K ফলাফলে ব্যবহারকারীর অভিপ্রায়ের সাথে সামঞ্জস্যপূর্ণ ভিডিও পুনরুদ্ধার করার অনুপাত

অনলাইন মেট্রিক্স:

  1. LVR (দীর্ঘ দেখার হার): ব্যবহারকারী দীর্ঘ সময় ভিডিও দেখার হার
  2. IQRR (সক্রিয় কোয়েরি পুনর্নির্মাণ হার): ব্যবহারকারী সক্রিয়ভাবে কোয়েরি পুনরায় প্রকাশ করার হার
  3. CTR (ক্লিক-থ্রু রেট): ব্যবহারকারী পুনরুদ্ধার ফলাফলে ক্লিক করার হার

তুলনা পদ্ধতি

  • প্রম্পট-ভিত্তিক পুনর্লিখন পদ্ধতি
  • SFT এবং SFT+DPO বেসলাইন
  • সরাসরি জ্ঞান ইনজেকশন পদ্ধতি (Naive RAG)
  • অভিযোজিত CSA-QR পদ্ধতি

বাস্তবায়ন বিবরণ

  • কার্ড প্রজন্ম: Qwen2.5-VL-7B-Instruct-এর উপর ভিত্তি করে সূক্ষ্ম-সুর
  • কোয়েরি পুনর্লিখন: Qwen3-8B-এর উপর ভিত্তি করে সূক্ষ্ম-সুর
  • প্রশিক্ষণ সেটিংস: শিক্ষার হার 1×10^-5, AdamW অপ্টিমাইজার, DeepSpeed ZeRO-3 বিতরণকৃত প্রশিক্ষণ

পরীক্ষা ফলাফল

প্রধান ফলাফল

পদ্ধতিজ্ঞান প্রকারQR-RelIncrementHitrate@50Hitrate@300
মূল কোয়েরি---31.40%53.07%
SFT+GRPO-78.98%65.19%41.68%65.71%
SFT+GRPONaive RAG74.28%70.86%41.05%65.63%
CardRewriterCard RAG85.73%74.17%46.64%76.04%

মূল আবিষ্কার:

  1. CardRewriter বেশিরভাগ মেট্রিকে সর্বোত্তম পারফরম্যান্স অর্জন করে
  2. জ্ঞান কার্ড সরাসরি জ্ঞান ইনজেকশনের তুলনায় পুনর্লিখন গুণমান উল্লেখযোগ্যভাবে উন্নত করে
  3. SFT+GRPO প্রশিক্ষণ কৌশল সেরা ফলাফল প্রদান করে

অপসারণ পরীক্ষা

বহু-উৎস জ্ঞান অবদান বিশ্লেষণ:

  • ভিজ্যুয়াল সামগ্রী অপসারণ: QC-Rel 91.16% থেকে 89.37%-এ হ্রাস
  • পাঠ্য সামগ্রী অপসারণ: QC-Rel 86.18%-এ হ্রাস (আরও বড় প্রভাব)
  • সম্পর্কিত ভিডিও অপসারণ: QC-Rel 78.27%-এ হ্রাস (সর্বাধিক প্রভাব)

পুরস্কার ব্যবস্থা বিশ্লেষণ:

  • শুধুমাত্র প্রাসঙ্গিকতা পুরস্কার ব্যবহার: কোয়েরি প্রাসঙ্গিকতা সর্বোচ্চ কিন্তু পুনরুদ্ধার সম্প্রসারণ সীমিত
  • শুধুমাত্র সিস্টেম পুরস্কার ব্যবহার: আরও নতুন ভিডিও পুনরুদ্ধার করে কিন্তু মূল অভিপ্রায় থেকে বিচ্যুত হতে পারে
  • সমন্বিত পুরস্কার: প্রাসঙ্গিকতা এবং কার্যকারিতার মধ্যে সর্বোত্তম ভারসাম্য অর্জন করে

কেস বিশ্লেষণ

পেপারটি একটি সাধারণ কেস প্রদর্শন করে:

  • মূল কোয়েরি: "可口可乐寄人篱下的痛" (ব্যবহারকারী সৃজনশীল "可可可乐"-কে "可口可乐" হিসাবে ভুলভাবে লিখেছেন)
  • LLM পুনর্লিখন: "可口可乐 寄人篱下 创意广告" (পানীয় ব্র্যান্ডে ভুল সংযোগ)
  • CardRewriter: "可可可乐 被寄养的孩子系列" (ব্যবহারকারীর অভিপ্রায় সঠিকভাবে বোঝা)

অনলাইন পরীক্ষা ফলাফল

ট্রাফিক প্রকারLVR ↑IQRR ↓CTR ↑
কভারেজ ট্রাফিক+1.853%-2.630%+3.729%
সম্পূর্ণ ট্রাফিক+0.235%-0.229%+0.342%

অনলাইন A/B পরীক্ষা উল্লেখযোগ্য উন্নতি নিশ্চিত করে, বিশেষত কভারেজ ট্রাফিকে স্পষ্ট প্রভাব।

সম্পর্কিত কাজ

কোয়েরি পুনর্লিখন গবেষণা

  1. এমবেডিং-ভিত্তিক পদ্ধতি: কোয়েরি পুনর্লিখনকে পুনরুদ্ধার কাজ হিসাবে বিবেচনা করা, সমান কোয়েরি পুনরুদ্ধারের মাধ্যমে মূল কোয়েরি উন্নত করা
  2. উৎপাদনশীল পদ্ধতি: সরাসরি সংশোধিত কোয়েরি উৎপন্ন করা, সাম্প্রতিক LLM পদ্ধতি ই-কমার্স ক্ষেত্রে চমৎকার পারফরম্যান্স প্রদর্শন করে
  3. ডোমেইন অভিযোজন: বিদ্যমান পদ্ধতি প্রধানত ই-কমার্স দৃশ্যের জন্য, স্বল্প-ভিডিও প্ল্যাটফর্ম গবেষণা তুলনামূলকভাবে কম

পুনরুদ্ধার-বর্ধিত প্রজন্ম

RAG প্রযুক্তি সম্পর্কিত তথ্য পুনরুদ্ধারের মাধ্যমে প্রজন্ম গুণমান বৃদ্ধি করে, এই পেপারটি এটি কোয়েরি পুনর্লিখন কাজে প্রয়োগ করে, জ্ঞান কার্ডের মাধ্যমে বহু-উৎস তথ্য কার্যকরভাবে একীভূত করে।

উপসংহার এবং আলোচনা

প্রধান উপসংহার

  1. CardRewriter জ্ঞান কার্ডের মাধ্যমে স্বল্প-ভিডিও প্ল্যাটফর্ম দীর্ঘ-লেজ কোয়েরি পুনর্লিখন সমস্যা কার্যকরভাবে সমাধান করে
  2. দুই-পর্যায়ের প্রশিক্ষণ কৌশল এবং কাস্টমাইজড পুরস্কার ব্যবস্থা পুনর্লিখন গুণমান উল্লেখযোগ্যভাবে উন্নত করে
  3. Kuaishou প্ল্যাটফর্মে স্থাপনা যাচাই পদ্ধতির ব্যবহারিক মূল্য প্রদর্শন করে

সীমাবদ্ধতা

  1. গণনা ওভারহেড: LLM অনুমান উল্লেখযোগ্য গণনা সম্পদ প্রয়োজন, কাছাকাছি-লাইন স্থাপনা কৌশল গ্রহণ করা
  2. কভারেজ পরিসর: বর্তমানে দৈনিক অনুসন্ধান ট্রাফিকের মাত্র 15-20% কভার করে
  3. ডোমেইন নির্ভরতা: পদ্ধতি স্বল্প-ভিডিও প্ল্যাটফর্মের জন্য ডিজাইন করা, অন্যান্য ক্ষেত্রে প্রযোজ্যতা আরও যাচাইয়ের প্রয়োজন

ভবিষ্যত দিকনির্দেশনা

  1. কভারকৃত কোয়েরি পরিসর প্রসারিত করা
  2. অনলাইন অনুমান দক্ষতা অপ্টিমাইজ করা
  3. ক্রস-প্ল্যাটফর্ম এবং ক্রস-ডোমেইন প্রযোজ্যতা অন্বেষণ করা

গভীর মূল্যায়ন

শক্তি

  1. সমস্যা লক্ষ্যীকরণ শক্তিশালী: স্বল্প-ভিডিও প্ল্যাটফর্ম কোয়েরি পুনর্লিখনের অনন্য চ্যালেঞ্জ সঠিকভাবে চিহ্নিত করা
  2. প্রযুক্তিগত সমাধান সম্পূর্ণ: জ্ঞান সংগ্রহ থেকে মডেল প্রশিক্ষণ পর্যন্ত সম্পূর্ণ সমাধান
  3. পরীক্ষা মূল্যায়ন পর্যাপ্ত: অফলাইন পরীক্ষা ব্যাপক, অনলাইন স্থাপনা বাস্তব প্রভাব যাচাই করে
  4. প্রকৌশল অনুশীলন মূল্য উচ্চ: বড় আকারের প্ল্যাটফর্মে স্থাপিত, লক্ষ লক্ষ ব্যবহারকারীকে সেবা প্রদান করে

অপূর্ণতা

  1. গণনা দক্ষতা: LLM অনুমান বিলম্ব উচ্চ, রিয়েল-টাইম প্রয়োগ সীমিত করে
  2. ডেটা নির্ভরতা: প্রশিক্ষণ সেট নির্মাণের জন্য বড় পরিমাণ মন্তব্যকৃত ডেটা প্রয়োজন
  3. ব্যাখ্যাযোগ্যতা: জ্ঞান কার্ড প্রজন্ম প্রক্রিয়ার ব্যাখ্যাযোগ্যতা উন্নতির প্রয়োজন
  4. সাধারণীকরণ ক্ষমতা: পদ্ধতি নির্দিষ্ট প্ল্যাটফর্মের জন্য ডিজাইন করা, ক্রস-ডোমেইন সাধারণীকরণ ক্ষমতা সম্পূর্ণভাবে যাচাই করা হয়নি

প্রভাব

  1. একাডেমিক অবদান: স্বল্প-ভিডিও প্ল্যাটফর্ম কোয়েরি বোঝার জন্য নতুন চিন্তাভাবনা প্রদান করে
  2. ব্যবহারিক মূল্য: বাস্তব ব্যবসায়িক সমস্যা সমাধান করে, সরাসরি বাণিজ্যিক মূল্য রয়েছে
  3. প্রযুক্তি প্রচার: জ্ঞান কার্ড ডিজাইন চিন্তাভাবনা অন্যান্য RAG প্রয়োগে প্রচার করা যায়

প্রযোজ্য দৃশ্যকল্প

  1. স্বল্প-ভিডিও, লাইভ স্ট্রিম ইত্যাদি সামগ্রী প্ল্যাটফর্মের অনুসন্ধান অপ্টিমাইজেশন
  2. বড় পরিমাণ প্ল্যাটফর্ম-নির্দিষ্ট সামগ্রী সহ উল্লম্ব ডোমেইন অনুসন্ধান
  3. বহুমাধ্যম তথ্য একত্রিত করার প্রয়োজন এমন কোয়েরি বোঝার কাজ

সংদর্ভ

পেপারটি 33টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা কোয়েরি পুনর্লিখন, পুনরুদ্ধার-বর্ধিত প্রজন্ম, বড় ভাষা মডেল ইত্যাদি একাধিক গবেষণা দিক কভার করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।


সারসংক্ষেপ: CardRewriter স্বল্প-ভিডিও প্ল্যাটফর্ম দীর্ঘ-লেজ কোয়েরি পুনর্লিখনের জন্য একটি উদ্ভাবনী গবেষণা, জ্ঞান কার্ডের মাধ্যমে প্ল্যাটফর্ম-নির্দিষ্ট জ্ঞান কার্যকরভাবে একীভূত করে, তাত্ত্বিক পদ্ধতি এবং প্রকৌশল অনুশীলন উভয় ক্ষেত্রে উল্লেখযোগ্য ফলাফল অর্জন করে। এই কাজ প্ল্যাটফর্ম-নির্দিষ্ট সামগ্রী সহ কোয়েরি বোঝার কাজ প্রক্রিয়াকরণের জন্য মূল্যবান সমাধান প্রদান করে।