2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu
Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.
academic

Explications Comparatives via Raisonnement Contrefactuel dans les Recommandations

Informations Fondamentales

  • ID de l'article: 2510.10920
  • Titre: Comparative Explanations via Counterfactual Reasoning in Recommendations
  • Auteurs: Yi Yu (Huawei Technologies Co., Ltd.), Zhenxing Hu (Huawei Technologies Co., Ltd.)
  • Classification: cs.IR (Récupération d'Information), cs.AI (Intelligence Artificielle)
  • Date de publication/Conférence: Soumis à une conférence en 2025 (conférence spécifique à déterminer)
  • Lien de l'article: https://arxiv.org/abs/2510.10920

Résumé

Les recommandations explicables cherchent à identifier les facteurs d'influence des articles dans les recommandations via le raisonnement contrefactuel, ces facteurs pouvant servir d'explications. Cependant, les méthodes de pointe existantes visent à minimiser les variations d'attributs des produits tout en inversant les décisions de recommandation selon les scores de frontière de décision agrégés, ce qui conduit souvent à des inexactitudes factuelles dans les explications. Pour résoudre ce problème, cet article propose une nouvelle méthode d'explication contrefactuelle comparative pour les recommandations (CoCountER). CoCountER crée des données contrefactuelles basées sur des opérations d'échange logiciel, capable de fournir des explications pour les recommandations de paires d'articles comparatifs arbitraires. Les expériences empiriques valident l'efficacité de la méthode.

Contexte de Recherche et Motivation

Définition du Problème

Les systèmes de recommandation explicables visent à fournir aux utilisateurs des recommandations de haute qualité tout en donnant des explications claires pour aider les utilisateurs à comprendre la logique derrière les recommandations, améliorant ainsi la confiance et la satisfaction des utilisateurs envers le système.

Limitations des Méthodes Existantes

  1. Problèmes des méthodes basées sur la correspondance: Les méthodes d'explication basées sur des modèles (telles que EFM, MTER, A2CF) optimisent les représentations de recommandation et d'attributs via des techniques de factorisation tensorielle, mais peuvent sélectionner des attributs avec des scores de correspondance élevés mais des performances réelles faibles comme explications.
  2. Défauts des méthodes contrefactuelles existantes: Les méthodes telles que CountER inversent les décisions en minimisant la réduction de caractéristiques, mais souffrent de problèmes d'inexactitude factuelle. Selon l'exemple des écouteurs dans l'article, CountER peut sélectionner le confort comme explication pour la recommandation des écouteurs A, alors que les écouteurs A sont en réalité moins confortables que les écouteurs B.
  3. Cause fondamentale: Les méthodes existantes optimisent la somme de tous les attributs réduits vers le score de frontière de décision, plutôt que de pousser chaque attribut vers la frontière de décision, ce qui conduit à des explications contradictoires avec l'intuition.

Motivation de la Recherche

Cet article propose de résoudre les problèmes susmentionnés via le raisonnement contrefactuel comparatif, en générant des explications plus fidèles et intuitives par des opérations d'échange au niveau des attributs entre les paires d'articles.

Contributions Principales

  1. Proposition d'une nouvelle méthode de création de données contrefactuelles: Mécanisme de génération de données contrefactuelles basé sur des opérations d'échange logiciel
  2. Cadre d'explication contrefactuelle comparative innovant: CoCountER capable de fournir des explications pour les recommandations de paires d'articles comparatifs arbitraires
  3. Validation expérimentale: Validation de l'efficacité de la méthode sur plusieurs ensembles de données, surpassant les méthodes existantes sur les métriques contrefactuelles pertinentes

Détails de la Méthode

Définition de la Tâche

Étant donné un utilisateur cible u, un article d'explication i et un article de référence j, où le score de recommandation satisfait r_{u,i} > r_{u,j}, l'objectif est d'identifier les attributs clés affectant la décision de recommandation via les opérations d'échange minimales.

Architecture du Modèle

1. Prétraitement des Données

Utilisation de l'outil Sentires pour extraire des quadruplets (utilisateur, article, attribut, sentiment) des commentaires utilisateurs, construisant:

  • Matrice d'attention utilisateur-attribut X: X_{u,a} représente l'attention de l'utilisateur u sur l'attribut a
  • Matrice de qualité article-attribut Y: Y_{i,a} représente la performance de l'article i sur l'attribut a

Formules de calcul:

X_{u,a} = {
  0, si l'utilisateur u n'a pas mentionné l'attribut a
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), sinon
}

Y_{i,a} = {
  0, si l'article i n'a pas été mentionné sur l'attribut a
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), sinon
}

2. Modèle de Recommandation

Adoption d'une architecture de couche de fusion simple:

r_{u,i} = g_θ(X_u, Y_i)

Implémentée via un réseau entièrement connecté à trois couches + fonction d'activation ReLU + sortie Sigmoid.

3. Noyau d'Explication Contrefactuelle Comparative

Conception de la fonction d'échange:

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

où σ(ψ) est la fonction sigmoid, ψ est le vecteur de variables d'échange entraînable.

Objectif d'optimisation:

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

où L est la perte de classement de frontière:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

Points d'Innovation Technique

  1. Opération d'échange logiciel: Implémentation d'une opération d'échange différentiable via la fonction sigmoid, les valeurs proches de 0 indiquant pas d'échange, proches de 1 indiquant un échange complet
  2. Cadre comparatif: Contrairement aux explications d'article unique traditionnelles, fournit des explications comparatives entre articles
  3. Universalité: Lorsque l'article de référence est fixé et que seule la première partie de la fonction d'échange est calculée, la méthode peut se réduire à une méthode contrefactuelle basée sur la réduction

Configuration Expérimentale

Ensembles de Données

Utilisation de trois catégories de l'ensemble de données d'avis Amazon:

  • Électronique: 963 utilisateurs, 1 112 articles, 19 418 avis, 877 attributs
  • CD et Vinyle: 2 129 utilisateurs, 2 907 articles, 56 045 avis, 810 attributs
  • Films: 5 586 utilisateurs, 6 703 articles, 187 490 avis, 1 530 attributs

Prétraitement des données: Filtrage des utilisateurs et articles avec moins de 10 interactions, division 8:1:1 pour les ensembles d'entraînement/validation/test.

Métriques d'Évaluation

  • Métriques orientées utilisateur: Précision et Rappel
  • Métriques orientées modèle: Probabilité de Nécessité (PN) et Probabilité de Suffisance (PS)

Méthodes de Comparaison

  1. Méthode aléatoire: Random
  2. Méthodes de classement: Sort-i (classement par performance d'attribut d'article), Sort-u (classement par attention utilisateur)
  3. Méthodes basées sur la correspondance: EFM, A2CF
  4. Méthodes contrefactuelles: CountER, CoCountER (méthode proposée)

Détails d'Implémentation

  • Taux d'apprentissage η optimisé via descente de gradient
  • Seuil de frontière m utilisé pour la perte de classement
  • Facteur d'équilibre λ coordonnant les deux objectifs d'optimisation
  • Seuil d'échange défini à 0,5 pour identifier les attributs d'explication

Résultats Expérimentaux

Résultats Principaux

Sur les trois ensembles de données, CoCountER surpasse systématiquement toutes les méthodes de base sur les métriques contrefactuelles pertinentes PN et PS:

Ensemble de données Électronique:

  • PN: 0,734 (vs 0,511 pour CountER)
  • PS: 0,931 (vs 0,894 pour CountER)

Ensemble de données CD et Vinyle:

  • PN: 0,773 (vs 0,526 pour CountER)
  • PS: 0,936 (vs 0,921 pour CountER)

Ensemble de données Films:

  • PN: 0,744 (vs 0,496 pour CountER)
  • PS: 0,928 (vs 0,889 pour CountER)

Analyse des Hyperparamètres

  1. Impact de la position de l'article de référence: Les articles de référence classés plus bas imposent moins de contraintes d'optimisation, permettant de découvrir plus d'attributs contrefactuels efficaces, améliorant les performances PN et PS
  2. Impact du nombre d'articles de référence: L'augmentation appropriée du nombre d'articles de référence améliore les performances, mais un excès introduit du bruit entraînant une légère baisse

Découvertes Expérimentales

  • CoCountER fournit des explications plus fidèles et conscientes du contexte que CountER via des opérations d'échange au niveau des attributs
  • La conception contrefactuelle comparative capture les véritables attributs causaux derrière les recommandations
  • La méthode maintient une stabilité dans un large éventail de paramètres, démontrant une bonne robustesse

Travaux Connexes

Systèmes de Recommandation Explicables

  1. Méthodes basées sur les attributs: EFM, MTER, A2CF et autres utilisant des techniques de factorisation tensorielle pour construire des explications basées sur des modèles
  2. Méthodes de raisonnement contrefactuel: CountER introduisant pour la première fois le raisonnement contrefactuel dans les recommandations explicables
  3. Méthodes de génération de texte: Combinaison de modèles de langage pré-entraînés tels que BERT pour générer des explications textuelles

Explications Comparatives

Yang et al. ont proposé le concept d'explications comparatives, mais adoptent un décodeur autorégressif pour générer des explications textuelles, différent de la perspective du raisonnement contrefactuel de cet article.

Application du Raisonnement Causal dans les Recommandations

Le raisonnement causal a été largement appliqué récemment à l'augmentation des données et à l'amélioration de l'équité dans les systèmes de recommandation.

Conclusion et Discussion

Conclusions Principales

  1. Proposition du cadre CoCountER générant des explications de recommandation plus fidèles via le raisonnement contrefactuel comparatif
  2. L'opération d'échange logiciel peut identifier efficacement les attributs clés affectant les décisions de recommandation
  3. Les expériences démontrent que cette méthode surpasse significativement les méthodes existantes sur les métriques contrefactuelles

Limitations

  1. Simplification du modèle de recommandation: Pour se concentrer sur l'explicabilité, une architecture de modèle de recommandation relativement simple a été adoptée
  2. Complexité computationnelle: Nécessite une optimisation pour chaque article de référence, augmentant les coûts computationnels
  3. Dépendance aux attributs: La méthode dépend des attributs extraits des avis, sensible à la qualité des attributs

Directions Futures

L'article propose de combiner le raisonnement contrefactuel avec des modèles génératifs pour produire des explications en langage naturel de scénarios contrefactuels.

Évaluation Approfondie

Points Forts

  1. Innovation forte: Premier cadre d'explication contrefactuelle comparative proposé, résolvant le problème d'inexactitude factuelle des méthodes existantes
  2. Fondations théoriques solides: Explication claire des problèmes des méthodes existantes via des exemples concrets avec analyse théorique
  3. Conception de méthode raisonnable: La conception de l'opération d'échange logiciel garantit à la fois la différentiabilité et fournit des explications intuitives
  4. Expériences complètes: Validation sur plusieurs ensembles de données, incluant l'analyse de sensibilité des hyperparamètres

Insuffisances

  1. Limitations des métriques d'évaluation: Accent principal sur les métriques contrefactuelles, manque d'études utilisateur pour valider l'utilité pratique des explications
  2. Méthodes de base limitées: Bien qu'incluant les principales méthodes de comparaison, manque de méthodes d'explication contrefactuelle plus récentes
  3. Problèmes d'extensibilité: Avec l'augmentation du nombre d'articles, le nombre de paires d'articles à considérer croît quadratiquement
  4. Considérations insuffisantes pour le déploiement pratique: Manque de discussion sur l'efficacité et l'extensibilité lors du déploiement dans les systèmes de recommandation réels

Impact

  1. Contribution académique: Fournit une nouvelle direction de recherche pour le domaine des recommandations explicables
  2. Valeur pratique: Capable de générer des explications plus intuitives, contribuant à améliorer l'expérience utilisateur
  3. Reproductibilité: Fournit des descriptions d'algorithmes détaillées et des détails d'implémentation

Scénarios d'Application

  1. Recommandations de commerce électronique: Particulièrement adapté aux scénarios nécessitant d'expliquer pourquoi un produit est recommandé plutôt qu'un autre
  2. Recommandations de contenu: Applicable aux systèmes de recommandation de films, musique et autres contenus
  3. Décisions à haut risque: Applicable aux scénarios de recommandation nécessitant une explicabilité élevée

Références

L'article cite 37 références pertinentes, couvrant plusieurs domaines connexes tels que les recommandations explicables, le raisonnement contrefactuel et le raisonnement causal, fournissant une base théorique solide pour la recherche.


Évaluation Globale: Ceci est un article de recherche de haute qualité proposant un cadre d'explication contrefactuelle comparative innovant, résolvant des problèmes importants des méthodes existantes. La conception de la méthode est raisonnable, la validation expérimentale est complète, et elle apporte une contribution importante au domaine des recommandations explicables. Bien que présentant certaines limitations, c'est globalement un travail de recherche de valeur.