2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu
Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.
academic

अनुशंसाओं में प्रतिकारक तर्क के माध्यम से तुलनात्मक व्याख्याएं

बुनियादी जानकारी

  • पेपर ID: 2510.10920
  • शीर्षक: अनुशंसाओं में प्रतिकारक तर्क के माध्यम से तुलनात्मक व्याख्याएं
  • लेखक: यी यू (हुआवेई टेक्नोलॉजीज लिमिटेड), झेनक्सिंग हू (हुआवेई टेक्नोलॉजीज लिमिटेड)
  • वर्गीकरण: cs.IR (सूचना पुनः प्राप्ति), cs.AI (कृत्रिम बुद्धिमत्ता)
  • प्रकाशन समय/सम्मेलन: 2025 में सम्मेलन में प्रस्तुत (विशिष्ट सम्मेलन अभी निर्धारित होना बाकी है)
  • पेपर लिंक: https://arxiv.org/abs/2510.10920

सारांश

व्याख्यात्मक अनुशंसा प्रतिकारक तर्क के माध्यम से अनुशंसाओं में वस्तुओं के प्रभाव कारकों की पहचान करने का प्रयास करती है, जिन्हें व्याख्याओं के रूप में उपयोग किया जा सकता है। हालांकि, मौजूदा अत्याधुनिक विधियां उत्पाद विशेषताओं में परिवर्तन को कम करने का लक्ष्य रखती हैं, जबकि एकत्रित निर्णय सीमा स्कोर के अनुसार अनुशंसा निर्णयों को उलट देती हैं, जिससे अक्सर व्याख्याओं में तथ्यात्मक अशुद्धि होती है। इस समस्या को हल करने के लिए, यह पेपर अनुशंसाओं के लिए एक नई तुलनात्मक प्रतिकारक व्याख्या विधि (CoCountER) प्रस्तावित करता है। CoCountER नरम विनिमय संचालन के आधार पर प्रतिकारक डेटा बनाता है, जो किसी भी तुलनात्मक वस्तु जोड़ी के लिए अनुशंसाओं की व्याख्या प्रदान कर सकता है। अनुभवजन्य प्रयोग विधि की प्रभावशीलता को सत्यापित करते हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

व्याख्यात्मक अनुशंसा प्रणालियां उपयोगकर्ताओं को उच्च गुणवत्ता की अनुशंसाएं प्रदान करने के साथ-साथ स्पष्ट व्याख्याएं देने का लक्ष्य रखती हैं ताकि उपयोगकर्ताओं को अनुशंसा के पीछे के तर्क को समझने में मदद मिले, जिससे सिस्टम के प्रति उपयोगकर्ता विश्वास और संतुष्टि बढ़े।

मौजूदा विधियों की सीमाएं

  1. मिलान-आधारित विधियों की समस्या: टेम्पलेट-आधारित व्याख्या विधियां (जैसे EFM, MTER, A2CF) टेंसर अपघटन तकनीकों का उपयोग करके अनुशंसा और विशेषता प्रतिनिधित्व को अनुकूलित करती हैं, लेकिन उच्च मिलान स्कोर वाली लेकिन वास्तविक प्रदर्शन में कमजोर विशेषताओं को व्याख्या के रूप में चुन सकती हैं।
  2. मौजूदा प्रतिकारक विधियों के दोष: CountER जैसी विधियां विशेषता में कमी को कम करके निर्णयों को उलट देती हैं, लेकिन तथ्यात्मक अशुद्धि की समस्या है। पेपर में दिए गए हेडफोन उदाहरण के अनुसार, CountER आराम को हेडफोन A की अनुशंसा की व्याख्या के रूप में चुन सकता है, लेकिन वास्तव में हेडफोन A आराम के मामले में हेडफोन B से कम है।
  3. मूल कारण: मौजूदा विधियां सभी कम की गई विशेषताओं के योग को निर्णय सीमा स्कोर की ओर धकेलने को अनुकूलित करती हैं, न कि प्रत्येक विशेषता को निर्णय सीमा की ओर, जिससे व्याख्याएं सहज ज्ञान के विरुद्ध होती हैं।

अनुसंधान प्रेरणा

यह पेपर तुलनात्मक प्रतिकारक तर्क के माध्यम से उपरोक्त समस्या को हल करने का प्रस्ताव देता है, वस्तु जोड़ी के बीच विशेषता-स्तरीय विनिमय संचालन करके अधिक विश्वसनीय और सहज व्याख्याएं उत्पन्न करता है।

मुख्य योगदान

  1. प्रतिकारक डेटा निर्माण की नई विधि प्रस्तावित की: नरम विनिमय संचालन के आधार पर प्रतिकारक डेटा जनन तंत्र
  2. नवीन तुलनात्मक प्रतिकारक व्याख्या ढांचा: CoCountER किसी भी तुलनात्मक वस्तु जोड़ी के लिए अनुशंसाओं की व्याख्या प्रदान कर सकता है
  3. प्रायोगिक सत्यापन: कई डेटासेट पर विधि की प्रभावशीलता को सत्यापित किया गया है, प्रतिकारक प्रासंगिकता मेट्रिक्स पर मौजूदा विधियों को पार किया गया है

विधि विवरण

कार्य परिभाषा

लक्ष्य उपयोगकर्ता u, व्याख्या वस्तु i और संदर्भ वस्तु j दिए गए हैं, जहां अनुशंसा स्कोर r_{u,i} > r_{u,j} को संतुष्ट करता है, लक्ष्य न्यूनतम विनिमय संचालन के माध्यम से अनुशंसा निर्णय को प्रभावित करने वाली मुख्य विशेषताओं की पहचान करना है।

मॉडल आर्किटेक्चर

1. डेटा पूर्व-प्रसंस्करण

उपयोगकर्ता समीक्षाओं से (उपयोगकर्ता, वस्तु, विशेषता, भावना) चतुर्भुज निकालने के लिए Sentires उपकरण का उपयोग करते हुए, निर्माण:

  • उपयोगकर्ता-विशेषता ध्यान मैट्रिक्स X: X_{u,a} उपयोगकर्ता u द्वारा विशेषता a पर ध्यान दर्शाता है
  • वस्तु-विशेषता गुणवत्ता मैट्रिक्स Y: Y_{i,a} विशेषता a पर वस्तु i के प्रदर्शन को दर्शाता है

गणना सूत्र:

X_{u,a} = {
  0, यदि उपयोगकर्ता u ने विशेषता a का उल्लेख नहीं किया
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), अन्यथा
}

Y_{i,a} = {
  0, यदि वस्तु i को विशेषता a पर उल्लेख नहीं किया गया
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), अन्यथा
}

2. अनुशंसा मॉडल

सरल संलयन परत आर्किटेक्चर को अपनाता है:

r_{u,i} = g_θ(X_u, Y_i)

तीन-परत पूरी तरह से जुड़े नेटवर्क + ReLU सक्रियण फ़ंक्शन + Sigmoid आउटपुट के माध्यम से कार्यान्वित।

3. तुलनात्मक प्रतिकारक व्याख्या मुख्य

विनिमय फ़ंक्शन डिजाइन:

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

जहां σ(ψ) sigmoid फ़ंक्शन है, ψ प्रशिक्षणीय विनिमय चर वेक्टर है।

अनुकूलन उद्देश्य:

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

जहां L सीमा रैंकिंग हानि है:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

तकनीकी नवाचार बिंदु

  1. नरम विनिमय संचालन: Sigmoid फ़ंक्शन के माध्यम से अवकलनीय विनिमय संचालन को कार्यान्वित करता है, 0 के करीब मान विनिमय न करने को दर्शाता है, 1 के करीब पूर्ण विनिमय को दर्शाता है
  2. तुलनात्मक ढांचा: पारंपरिक एकल वस्तु व्याख्या के विपरीत, वस्तुओं के बीच तुलनात्मक व्याख्या प्रदान करता है
  3. सार्वभौमिकता: जब संदर्भ वस्तु को ठीक किया जाता है और केवल विनिमय फ़ंक्शन के पहले भाग की गणना की जाती है, तो यह कमी-आधारित प्रतिकारक विधि में कम हो सकता है

प्रायोगिक सेटअप

डेटासेट

Amazon समीक्षा डेटासेट की तीन श्रेणियों का उपयोग:

  • Electronics: 963 उपयोगकर्ता, 1,112 वस्तुएं, 19,418 समीक्षाएं, 877 विशेषताएं
  • CDs & Vinyl: 2,129 उपयोगकर्ता, 2,907 वस्तुएं, 56,045 समीक्षाएं, 810 विशेषताएं
  • Movies: 5,586 उपयोगकर्ता, 6,703 वस्तुएं, 187,490 समीक्षाएं, 1,530 विशेषताएं

डेटा पूर्व-प्रसंस्करण: 10 से कम इंटरैक्शन वाले उपयोगकर्ताओं और वस्तुओं को फ़िल्टर करें, प्रशिक्षण/सत्यापन/परीक्षण सेट को 8:1:1 में विभाजित करें।

मूल्यांकन मेट्रिक्स

  • उपयोगकर्ता-उन्मुख मेट्रिक्स: Precision और Recall
  • मॉडल-उन्मुख मेट्रिक्स: Probability of Necessity (PN) और Probability of Sufficiency (PS)

तुलनात्मक विधियां

  1. यादृच्छिक विधि: Random
  2. रैंकिंग विधि: Sort-i (वस्तु विशेषता प्रदर्शन द्वारा रैंक), Sort-u (उपयोगकर्ता ध्यान द्वारा रैंक)
  3. मिलान-आधारित विधि: EFM, A2CF
  4. प्रतिकारक विधि: CountER, CoCountER (यह पेपर की विधि)

कार्यान्वयन विवरण

  • सीखने की दर η ग्रेडिएंट डिसेंट द्वारा अनुकूलित
  • सीमा थ्रेशोल्ड m रैंकिंग हानि के लिए उपयोग किया जाता है
  • संतुलन कारक λ दो अनुकूलन उद्देश्यों को समन्वय करता है
  • व्याख्या विशेषताओं की पहचान के लिए विनिमय थ्रेशोल्ड 0.5 पर सेट

प्रायोगिक परिणाम

मुख्य परिणाम

सभी तीन डेटासेट पर, CoCountER प्रतिकारक प्रासंगिकता मेट्रिक्स PN और PS पर सभी आधारभूत विधियों को लगातार पार करता है:

Electronics डेटासेट:

  • PN: 0.734 (vs CountER का 0.511)
  • PS: 0.931 (vs CountER का 0.894)

CDs & Vinyl डेटासेट:

  • PN: 0.773 (vs CountER का 0.526)
  • PS: 0.936 (vs CountER का 0.921)

Movies डेटासेट:

  • PN: 0.744 (vs CountER का 0.496)
  • PS: 0.928 (vs CountER का 0.889)

हाइपरपैरामीटर विश्लेषण

  1. संदर्भ वस्तु स्थिति प्रभाव: निम्न रैंकिंग वाली संदर्भ वस्तुएं कम अनुकूलन बाधाएं प्रदान करती हैं, अधिक प्रभावी प्रतिकारक विशेषताओं की खोज कर सकती हैं, PN और PS प्रदर्शन में सुधार करती हैं
  2. संदर्भ वस्तु संख्या प्रभाव: उपयुक्त संदर्भ वस्तुओं की संख्या बढ़ाने से प्रदर्शन में सुधार हो सकता है, लेकिन अत्यधिक शोर का परिचय देता है जिससे हल्का प्रदर्शन में गिरावट आती है

प्रायोगिक निष्कर्ष

  • CoCountER विशेषता-स्तरीय विनिमय संचालन के माध्यम से CountER की तुलना में अधिक विश्वसनीय और संदर्भ-जागरूक व्याख्याएं प्रदान करता है
  • तुलनात्मक प्रतिकारक डिजाइन अनुशंसा के पीछे की वास्तविक कारण विशेषताओं को पकड़ सकता है
  • विधि व्यापक सेटिंग्स में स्थिर रहती है, अच्छी मजबूती प्रदर्शित करती है

संबंधित कार्य

व्याख्यात्मक अनुशंसा प्रणालियां

  1. विशेषता-आधारित विधियां: EFM, MTER, A2CF आदि टेंसर अपघटन तकनीकों का उपयोग करके टेम्पलेट-शैली व्याख्याएं बनाते हैं
  2. प्रतिकारक तर्क विधियां: CountER पहली बार प्रतिकारक तर्क को व्याख्यात्मक अनुशंसा में लाया
  3. पाठ जनन विधियां: BERT जैसे पूर्व-प्रशिक्षित भाषा मॉडल को पाठ व्याख्याएं उत्पन्न करने के लिए जोड़ते हैं

तुलनात्मक व्याख्याएं

Yang आदि ने तुलनात्मक व्याख्या की अवधारणा प्रस्तावित की, लेकिन स्व-प्रतिगामी डिकोडर का उपयोग करके पाठ व्याख्याएं उत्पन्न करते हैं, जो इस पेपर के प्रतिकारक तर्क दृष्टिकोण से भिन्न है।

अनुशंसा में कारण तर्क का अनुप्रयोग

हाल के वर्षों में कारण तर्क को अनुशंसा प्रणालियों के डेटा वृद्धि और निष्पक्षता सुधार में व्यापक रूप से लागू किया गया है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. CoCountER ढांचा प्रस्तावित किया गया है, जो तुलनात्मक प्रतिकारक तर्क के माध्यम से अधिक विश्वसनीय अनुशंसा व्याख्याएं उत्पन्न करता है
  2. नरम विनिमय संचालन अनुशंसा निर्णय को प्रभावित करने वाली मुख्य विशेषताओं की प्रभावी ढंग से पहचान कर सकता है
  3. प्रयोग प्रमाणित करते हैं कि यह विधि प्रतिकारक मेट्रिक्स पर मौजूदा विधियों से काफी बेहतर है

सीमाएं

  1. अनुशंसा मॉडल सरलीकरण: व्याख्यात्मकता पर ध्यान केंद्रित करने के लिए, अपेक्षाकृत सरल अनुशंसा मॉडल आर्किटेक्चर को अपनाया गया है
  2. कम्प्यूटेशनल जटिलता: प्रत्येक संदर्भ वस्तु के लिए अनुकूलन की आवश्यकता होती है, जिससे कम्प्यूटेशनल लागत बढ़ती है
  3. विशेषता निर्भरता: विधि समीक्षाओं से निकाली गई विशेषताओं पर निर्भर है, विशेषता गुणवत्ता के प्रति संवेदनशील है

भविष्य की दिशाएं

पेपर प्रतिकारक तर्क को जनरेटिव मॉडल के साथ जोड़ने का प्रस्ताव देता है, प्रतिकारक परिदृश्यों की प्राकृतिक भाषा व्याख्याएं उत्पन्न करता है।

गहन मूल्यांकन

शक्तियां

  1. मजबूत नवाचार: पहली बार तुलनात्मक प्रतिकारक व्याख्या ढांचा प्रस्तावित किया गया है, मौजूदा विधियों की तथ्यात्मक अशुद्धि समस्या को हल करता है
  2. ठोस सैद्धांतिक आधार: विशिष्ट उदाहरणों के माध्यम से मौजूदा विधियों की समस्याओं को स्पष्ट रूप से समझाता है, सैद्धांतिक विश्लेषण प्रदान करता है
  3. तर्कसंगत विधि डिजाइन: नरम विनिमय संचालन का डिजाइन अवकलनीयता सुनिश्चित करता है और सहज व्याख्या प्रदान करता है
  4. व्यापक प्रयोग: कई डेटासेट पर सत्यापित, हाइपरपैरामीटर संवेदनशीलता विश्लेषण शामिल है

कमियां

  1. मूल्यांकन मेट्रिक्स सीमाएं: मुख्य रूप से प्रतिकारक मेट्रिक्स पर ध्यान केंद्रित करता है, व्याख्याओं की वास्तविक उपयोगिता को सत्यापित करने के लिए उपयोगकर्ता अध्ययन की कमी है
  2. आधारभूत विधि सीमित: मुख्य तुलनात्मक विधियां शामिल हैं, लेकिन अधिक हाल की प्रतिकारक व्याख्या विधियों की कमी है
  3. स्केलेबिलिटी समस्या: वस्तुओं की संख्या बढ़ने के साथ, विचार करने योग्य वस्तु जोड़ी की संख्या द्विघात रूप से बढ़ती है
  4. व्यावहारिक तैनाती विचार अपर्याप्त: वास्तविक अनुशंसा प्रणाली तैनाती के समय दक्षता और स्केलेबिलिटी पर चर्चा की कमी है

प्रभाव

  1. शैक्षणिक योगदान: व्याख्यात्मक अनुशंसा क्षेत्र के लिए नई अनुसंधान दिशा प्रदान करता है
  2. व्यावहारिक मूल्य: अधिक सहज व्याख्याएं उत्पन्न कर सकता है, उपयोगकर्ता अनुभव में सुधार करने में सहायता करता है
  3. पुनरुत्पादनीयता: विस्तृत एल्गोरिदम विवरण और कार्यान्वयन विवरण प्रदान करता है

लागू परिदृश्य

  1. ई-कॉमर्स अनुशंसा: विशेष रूप से उन परिदृश्यों के लिए उपयुक्त जहां यह समझाने की आवश्यकता है कि किसी उत्पाद की अन्य उत्पादों के बजाय अनुशंसा क्यों की गई है
  2. सामग्री अनुशंसा: फिल्म, संगीत आदि सामग्री अनुशंसा प्रणालियों में लागू किया जा सकता है
  3. उच्च जोखिम निर्णय: उच्च स्तर की व्याख्यात्मकता की आवश्यकता वाले अनुशंसा परिदृश्यों के लिए उपयुक्त

संदर्भ

पेपर 30 संबंधित संदर्भों का हवाला देता है, जो व्याख्यात्मक अनुशंसा, प्रतिकारक तर्क, कारण तर्क और अन्य कई संबंधित क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हैं, अनुसंधान के लिए ठोस सैद्धांतिक आधार प्रदान करते हैं।


समग्र मूल्यांकन: यह एक उच्च गुणवत्ता वाला अनुसंधान पेपर है जो एक नवीन तुलनात्मक प्रतिकारक व्याख्या ढांचा प्रस्तावित करता है, मौजूदा विधियों की महत्वपूर्ण समस्याओं को हल करता है। विधि डिजाइन तर्कसंगत है, प्रायोगिक सत्यापन व्यापक है, व्याख्यात्मक अनुशंसा क्षेत्र में महत्वपूर्ण योगदान देता है। हालांकि कुछ सीमाएं हैं, लेकिन समग्र रूप से यह एक मूल्यवान अनुसंधान कार्य है।