Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.
論文ID : 2510.10920タイトル : Comparative Explanations via Counterfactual Reasoning in Recommendations著者 : Yi Yu (ファーウェイ・テクノロジーズ・リミテッド), Zhenxing Hu (ファーウェイ・テクノロジーズ・リミテッド)分類 : cs.IR (情報検索), cs.AI (人工知能)投稿時期/学会 : 2025年投稿予定 (具体的な学会は未定)論文リンク : https://arxiv.org/abs/2510.10920 解釈可能な推奨システムは、反事実推論を通じて推奨アイテムの影響要因を特定し、これらを説明として利用することを目指している。しかし、既存の最先端手法は、製品属性の変化を最小化しながら、集約された決定境界スコアに基づいて推奨決定を逆転させることを目指しており、これは説明における事実の不正確性につながることが多い。この問題に対処するため、本論文は推奨システム用の新しい比較反事実説明手法(CoCountER)を提案する。CoCountERはソフト交換操作に基づいて反事実データを生成し、任意の比較アイテムペアの推奨に対する説明を提供することができる。実証実験により、本手法の有効性が検証されている。
解釈可能な推奨システムは、ユーザーに高品質な推奨を提供しながら、推奨の背後にある論理を理解するのに役立つ明確な説明を提供することを目指している。これにより、ユーザーのシステムに対する信頼度と満足度が向上する。
マッチング型手法の問題 :テンプレートベースの説明手法(EFM、MTER、A2CFなど)はテンソル分解技術を用いて推奨と属性表現を最適化するが、マッチングスコアは高いが実際の性能が低い属性を説明として選択する可能性がある。既存の反事実手法の欠陥 :CountERなどの手法は特徴削減を最小化することで決定を逆転させるが、事実の不正確性の問題が存在する。論文中のヘッドフォンの例では、CountERは快適性をヘッドフォンAの推奨理由として挙げるかもしれないが、実際にはヘッドフォンAはヘッドフォンBよりも快適性で劣っている。根本原因 :既存手法が最適化するのは、すべての削減属性の合計を決定境界スコアに向かわせることであり、各属性を決定境界に向かわせることではないため、説明が直感と矛盾する。本論文は、比較反事実推論を通じて上記の問題に対処することを提案し、アイテムペア間で属性レベルの交換操作を実行することで、より忠実で直感的な説明を生成する。
新しい反事実データ生成手法の提案 :ソフト交換操作に基づいた反事実データ生成メカニズム革新的な比較反事実説明フレームワーク :CoCountERは任意の比較アイテムペアの推奨に対する説明を提供可能実験検証 :複数のデータセットで手法の有効性を検証し、反事実関連指標で既存手法を上回る目標ユーザーu、説明対象アイテムi、参照アイテムjが与えられたとき、推奨スコアがr_{u,i} > r_{u,j}を満たす場合、推奨決定に影響を与える重要な属性を最小限の交換操作で特定することが目標である。
Sentiresツールを使用してユーザーレビューから(ユーザー、アイテム、属性、感情)四元組を抽出し、以下を構築する:
ユーザー-属性注意行列X:X_{u,a}はユーザーuが属性aに対する関心度を表す アイテム-属性品質行列Y:Y_{i,a}はアイテムiが属性aにおける性能を表す 計算式:
X_{u,a} = {
0, ユーザーuが属性aを言及していない場合
1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), その他の場合
}
Y_{i,a} = {
0, アイテムiが属性aで言及されていない場合
1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), その他の場合
}
シンプルな融合層アーキテクチャを採用:
3層の全結合ネットワーク + ReLU活性化関数 + Sigmoid出力で実装される。
交換関数の設計 :
f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j
ここでσ(ψ)はシグモイド関数、ψは訓練可能な交換変数ベクトルである。
最適化目標 :
min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})
ここでLは境界順序付け損失:
L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)
ソフト交換操作 :シグモイド関数を通じて微分可能な交換操作を実現。値が0に近いと交換なし、1に近いと完全交換を示す比較フレームワーク :従来の単一アイテム説明と異なり、アイテム間の比較説明を提供汎用性 :参照アイテムを固定し、交換関数の最初の部分のみを計算する場合、削減ベースの反事実手法に退化可能Amazon評論データセットの3つのカテゴリを使用:
Electronics:963ユーザー、1,112アイテム、19,418レビュー、877属性 CDs & Vinyl:2,129ユーザー、2,907アイテム、56,045レビュー、810属性 Movies:5,586ユーザー、6,703アイテム、187,490レビュー、1,530属性 データ前処理:インタラクション数が10未満のユーザーとアイテムをフィルタリング、訓練/検証/テストセットを8:1:1で分割。
ユーザー指向指標 :PrecisionとRecallモデル指向指標 :Probability of Necessity (PN)とProbability of Sufficiency (PS)ランダム手法 :Randomソート手法 :Sort-i(アイテム属性性能でソート)、Sort-u(ユーザー注意度でソート)マッチング型手法 :EFM、A2CF反事実手法 :CountER、CoCountER(本論文の手法)学習率ηは勾配降下法で最適化 境界閾値mはソート損失に使用 バランス係数λは2つの最適化目標を調整 交換閾値は説明属性の特定に0.5に設定 3つのデータセットすべてにおいて、CoCountERは反事実関連指標PNとPSで全てのベースライン手法を一貫して上回る:
Electronicsデータセット :
PN: 0.734 (CountERの0.511に対して) PS: 0.931 (CountERの0.894に対して) CDs & Vinylデータセット :
PN: 0.773 (CountERの0.526に対して) PS: 0.936 (CountERの0.921に対して) Moviesデータセット :
PN: 0.744 (CountERの0.496に対して) PS: 0.928 (CountERの0.889に対して) 参照アイテム位置の影響 :ランキングが低い参照アイテムほど最適化制約が少なくなり、より多くの有効な反事実属性を発見でき、PNとPS性能が向上する参照アイテム数の影響 :適切な量の参照アイテム数の増加は性能を向上させるが、過剰になるとノイズが導入され、わずかな低下が生じるCoCountERは属性レベルの交換操作を通じて、CountERよりも忠実でコンテキスト認識的な説明を提供する 比較反事実設計は推奨の背後にある真の因果属性を捉えることができる 手法は広範な設定で安定性を保ち、良好なロバスト性を示す 属性ベースの手法 :EFM、MTER、A2CFなどはテンソル分解技術を使用してテンプレート型説明を構築反事実推論手法 :CountERは反事実推論を解釈可能な推奨に初めて導入テキスト生成手法 :BERTなどの事前学習言語モデルを組み合わせてテキスト説明を生成Yangらは比較説明の概念を提案したが、自己回帰デコーダを使用してテキスト説明を生成しており、本論文の反事実推論の視点とは異なる。
近年、因果推論は推奨システムのデータ拡張と公平性改善に広く応用されている。
比較反事実推論を通じてより忠実な推奨説明を生成するCoCountERフレームワークを提案 ソフト交換操作は推奨決定に影響を与える重要な属性を効果的に特定できる 実験により、本手法が反事実指標で既存手法を大幅に上回ることを証明 推奨モデルの簡略化 :解釈可能性に焦点を当てるため、比較的シンプルな推奨モデルアーキテクチャを採用計算複雑性 :各参照アイテムに対して最適化を実行する必要があり、計算コストが増加属性依存性 :手法はレビューから抽出された属性に依存し、属性品質に敏感論文は反事実推論と生成モデルを組み合わせ、反事実シナリオの自然言語説明を生成することを提案している。
革新性が高い :比較反事実説明フレームワークを初めて提案し、既存手法の事実不正確性の問題を解決理論基礎が堅実 :具体例を通じて既存手法の問題を明確に説明し、理論分析を提供手法設計が合理的 :ソフト交換操作の設計は微分可能性を保証しながら、直感的な説明を提供実験が充分 :複数のデータセットで検証し、ハイパーパラメータ感度分析を含む評価指標の限界 :主に反事実指標に焦点を当て、説明の実際の有用性を検証するユーザー研究が不足ベースライン手法が限定的 :主要な比較手法を含むが、より多くの最近の反事実説明手法が不足スケーラビリティの問題 :アイテム数の増加に伴い、考慮すべきアイテムペア数が二次関数的に増加実装展開の考慮不足 :実際の推奨システム展開時の効率性とスケーラビリティについての議論が不足学術的貢献 :解釈可能な推奨領域に新しい研究方向を提供実用的価値 :より直感的な説明を生成でき、ユーザー体験の向上に役立つ再現性 :詳細なアルゴリズム説明と実装詳細を提供電子商取引推奨 :特定の商品が他の商品ではなく推奨される理由を説明する必要があるシーンに特に適用可能コンテンツ推奨 :映画、音楽などのコンテンツ推奨システムに応用可能高リスク決定 :高度な解釈可能性が必要な推奨シーンに適用可能論文は解釈可能な推奨、反事実推論、因果推論など複数の関連領域の重要な研究を含む30篇の関連文献を引用し、研究に堅実な理論基礎を提供している。
総合評価 :これは高品質な研究論文であり、革新的な比較反事実説明フレームワークを提案し、既存手法の重要な問題を解決している。手法設計が合理的で、実験検証が充分であり、解釈可能な推奨領域に重要な貢献をしている。いくつかの限界は存在するが、全体的には価値のある研究成果である。