2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu

Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.

academic

Explications Comparatives via Raisonnement Contrefactuel dans les Recommandations

Informations Fondamentales

ID de l'article: 2510.10920
Titre: Comparative Explanations via Counterfactual Reasoning in Recommendations
Auteurs: Yi Yu (Huawei Technologies Co., Ltd.), Zhenxing Hu (Huawei Technologies Co., Ltd.)
Classification: cs.IR (Récupération d'Information), cs.AI (Intelligence Artificielle)
Date de publication/Conférence: Soumis à une conférence en 2025 (conférence spécifique à déterminer)
Lien de l'article: https://arxiv.org/abs/2510.10920

Résumé

Les recommandations explicables cherchent à identifier les facteurs d'influence des articles dans les recommandations via le raisonnement contrefactuel, ces facteurs pouvant servir d'explications. Cependant, les méthodes de pointe existantes visent à minimiser les variations d'attributs des produits tout en inversant les décisions de recommandation selon les scores de frontière de décision agrégés, ce qui conduit souvent à des inexactitudes factuelles dans les explications. Pour résoudre ce problème, cet article propose une nouvelle méthode d'explication contrefactuelle comparative pour les recommandations (CoCountER). CoCountER crée des données contrefactuelles basées sur des opérations d'échange logiciel, capable de fournir des explications pour les recommandations de paires d'articles comparatifs arbitraires. Les expériences empiriques valident l'efficacité de la méthode.

Contexte de Recherche et Motivation

Définition du Problème

Les systèmes de recommandation explicables visent à fournir aux utilisateurs des recommandations de haute qualité tout en donnant des explications claires pour aider les utilisateurs à comprendre la logique derrière les recommandations, améliorant ainsi la confiance et la satisfaction des utilisateurs envers le système.

Limitations des Méthodes Existantes

Problèmes des méthodes basées sur la correspondance: Les méthodes d'explication basées sur des modèles (telles que EFM, MTER, A2CF) optimisent les représentations de recommandation et d'attributs via des techniques de factorisation tensorielle, mais peuvent sélectionner des attributs avec des scores de correspondance élevés mais des performances réelles faibles comme explications.
Défauts des méthodes contrefactuelles existantes: Les méthodes telles que CountER inversent les décisions en minimisant la réduction de caractéristiques, mais souffrent de problèmes d'inexactitude factuelle. Selon l'exemple des écouteurs dans l'article, CountER peut sélectionner le confort comme explication pour la recommandation des écouteurs A, alors que les écouteurs A sont en réalité moins confortables que les écouteurs B.
Cause fondamentale: Les méthodes existantes optimisent la somme de tous les attributs réduits vers le score de frontière de décision, plutôt que de pousser chaque attribut vers la frontière de décision, ce qui conduit à des explications contradictoires avec l'intuition.

Motivation de la Recherche

Cet article propose de résoudre les problèmes susmentionnés via le raisonnement contrefactuel comparatif, en générant des explications plus fidèles et intuitives par des opérations d'échange au niveau des attributs entre les paires d'articles.

Contributions Principales

Proposition d'une nouvelle méthode de création de données contrefactuelles: Mécanisme de génération de données contrefactuelles basé sur des opérations d'échange logiciel
Cadre d'explication contrefactuelle comparative innovant: CoCountER capable de fournir des explications pour les recommandations de paires d'articles comparatifs arbitraires
Validation expérimentale: Validation de l'efficacité de la méthode sur plusieurs ensembles de données, surpassant les méthodes existantes sur les métriques contrefactuelles pertinentes

Détails de la Méthode

Définition de la Tâche

Étant donné un utilisateur cible u, un article d'explication i et un article de référence j, où le score de recommandation satisfait r_{u,i} > r_{u,j}, l'objectif est d'identifier les attributs clés affectant la décision de recommandation via les opérations d'échange minimales.

Architecture du Modèle

1. Prétraitement des Données

Utilisation de l'outil Sentires pour extraire des quadruplets (utilisateur, article, attribut, sentiment) des commentaires utilisateurs, construisant:

Matrice d'attention utilisateur-attribut X: X_{u,a} représente l'attention de l'utilisateur u sur l'attribut a
Matrice de qualité article-attribut Y: Y_{i,a} représente la performance de l'article i sur l'attribut a

Formules de calcul:

X_{u,a} = {
  0, si l'utilisateur u n'a pas mentionné l'attribut a
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), sinon
}

Y_{i,a} = {
  0, si l'article i n'a pas été mentionné sur l'attribut a
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), sinon
}

2. Modèle de Recommandation

Adoption d'une architecture de couche de fusion simple:

r_{u,i} = g_θ(X_u, Y_i)

Implémentée via un réseau entièrement connecté à trois couches + fonction d'activation ReLU + sortie Sigmoid.

3. Noyau d'Explication Contrefactuelle Comparative

Conception de la fonction d'échange:

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

où σ(ψ) est la fonction sigmoid, ψ est le vecteur de variables d'échange entraînable.

Objectif d'optimisation:

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

où L est la perte de classement de frontière:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

Points d'Innovation Technique

Opération d'échange logiciel: Implémentation d'une opération d'échange différentiable via la fonction sigmoid, les valeurs proches de 0 indiquant pas d'échange, proches de 1 indiquant un échange complet
Cadre comparatif: Contrairement aux explications d'article unique traditionnelles, fournit des explications comparatives entre articles
Universalité: Lorsque l'article de référence est fixé et que seule la première partie de la fonction d'échange est calculée, la méthode peut se réduire à une méthode contrefactuelle basée sur la réduction

Configuration Expérimentale

Ensembles de Données

Utilisation de trois catégories de l'ensemble de données d'avis Amazon:

Électronique: 963 utilisateurs, 1 112 articles, 19 418 avis, 877 attributs
CD et Vinyle: 2 129 utilisateurs, 2 907 articles, 56 045 avis, 810 attributs
Films: 5 586 utilisateurs, 6 703 articles, 187 490 avis, 1 530 attributs

Prétraitement des données: Filtrage des utilisateurs et articles avec moins de 10 interactions, division 8:1:1 pour les ensembles d'entraînement/validation/test.

Métriques d'Évaluation

Métriques orientées utilisateur: Précision et Rappel
Métriques orientées modèle: Probabilité de Nécessité (PN) et Probabilité de Suffisance (PS)

Méthodes de Comparaison

Méthode aléatoire: Random
Méthodes de classement: Sort-i (classement par performance d'attribut d'article), Sort-u (classement par attention utilisateur)
Méthodes basées sur la correspondance: EFM, A2CF
Méthodes contrefactuelles: CountER, CoCountER (méthode proposée)

Détails d'Implémentation

Taux d'apprentissage η optimisé via descente de gradient
Seuil de frontière m utilisé pour la perte de classement
Facteur d'équilibre λ coordonnant les deux objectifs d'optimisation
Seuil d'échange défini à 0,5 pour identifier les attributs d'explication

Résultats Expérimentaux

Résultats Principaux

Sur les trois ensembles de données, CoCountER surpasse systématiquement toutes les méthodes de base sur les métriques contrefactuelles pertinentes PN et PS:

Ensemble de données Électronique:

PN: 0,734 (vs 0,511 pour CountER)
PS: 0,931 (vs 0,894 pour CountER)

Ensemble de données CD et Vinyle:

PN: 0,773 (vs 0,526 pour CountER)
PS: 0,936 (vs 0,921 pour CountER)

Ensemble de données Films:

PN: 0,744 (vs 0,496 pour CountER)
PS: 0,928 (vs 0,889 pour CountER)

Analyse des Hyperparamètres

Impact de la position de l'article de référence: Les articles de référence classés plus bas imposent moins de contraintes d'optimisation, permettant de découvrir plus d'attributs contrefactuels efficaces, améliorant les performances PN et PS
Impact du nombre d'articles de référence: L'augmentation appropriée du nombre d'articles de référence améliore les performances, mais un excès introduit du bruit entraînant une légère baisse

Découvertes Expérimentales

CoCountER fournit des explications plus fidèles et conscientes du contexte que CountER via des opérations d'échange au niveau des attributs
La conception contrefactuelle comparative capture les véritables attributs causaux derrière les recommandations
La méthode maintient une stabilité dans un large éventail de paramètres, démontrant une bonne robustesse

Travaux Connexes

Systèmes de Recommandation Explicables

Méthodes basées sur les attributs: EFM, MTER, A2CF et autres utilisant des techniques de factorisation tensorielle pour construire des explications basées sur des modèles
Méthodes de raisonnement contrefactuel: CountER introduisant pour la première fois le raisonnement contrefactuel dans les recommandations explicables
Méthodes de génération de texte: Combinaison de modèles de langage pré-entraînés tels que BERT pour générer des explications textuelles

Explications Comparatives

Yang et al. ont proposé le concept d'explications comparatives, mais adoptent un décodeur autorégressif pour générer des explications textuelles, différent de la perspective du raisonnement contrefactuel de cet article.

Application du Raisonnement Causal dans les Recommandations

Le raisonnement causal a été largement appliqué récemment à l'augmentation des données et à l'amélioration de l'équité dans les systèmes de recommandation.

Conclusion et Discussion

Conclusions Principales

Proposition du cadre CoCountER générant des explications de recommandation plus fidèles via le raisonnement contrefactuel comparatif
L'opération d'échange logiciel peut identifier efficacement les attributs clés affectant les décisions de recommandation
Les expériences démontrent que cette méthode surpasse significativement les méthodes existantes sur les métriques contrefactuelles

Limitations

Simplification du modèle de recommandation: Pour se concentrer sur l'explicabilité, une architecture de modèle de recommandation relativement simple a été adoptée
Complexité computationnelle: Nécessite une optimisation pour chaque article de référence, augmentant les coûts computationnels
Dépendance aux attributs: La méthode dépend des attributs extraits des avis, sensible à la qualité des attributs

Directions Futures

L'article propose de combiner le raisonnement contrefactuel avec des modèles génératifs pour produire des explications en langage naturel de scénarios contrefactuels.

Évaluation Approfondie

Points Forts

Innovation forte: Premier cadre d'explication contrefactuelle comparative proposé, résolvant le problème d'inexactitude factuelle des méthodes existantes
Fondations théoriques solides: Explication claire des problèmes des méthodes existantes via des exemples concrets avec analyse théorique
Conception de méthode raisonnable: La conception de l'opération d'échange logiciel garantit à la fois la différentiabilité et fournit des explications intuitives
Expériences complètes: Validation sur plusieurs ensembles de données, incluant l'analyse de sensibilité des hyperparamètres

Insuffisances

Limitations des métriques d'évaluation: Accent principal sur les métriques contrefactuelles, manque d'études utilisateur pour valider l'utilité pratique des explications
Méthodes de base limitées: Bien qu'incluant les principales méthodes de comparaison, manque de méthodes d'explication contrefactuelle plus récentes
Problèmes d'extensibilité: Avec l'augmentation du nombre d'articles, le nombre de paires d'articles à considérer croît quadratiquement
Considérations insuffisantes pour le déploiement pratique: Manque de discussion sur l'efficacité et l'extensibilité lors du déploiement dans les systèmes de recommandation réels

Impact

Contribution académique: Fournit une nouvelle direction de recherche pour le domaine des recommandations explicables
Valeur pratique: Capable de générer des explications plus intuitives, contribuant à améliorer l'expérience utilisateur
Reproductibilité: Fournit des descriptions d'algorithmes détaillées et des détails d'implémentation

Scénarios d'Application

Recommandations de commerce électronique: Particulièrement adapté aux scénarios nécessitant d'expliquer pourquoi un produit est recommandé plutôt qu'un autre
Recommandations de contenu: Applicable aux systèmes de recommandation de films, musique et autres contenus
Décisions à haut risque: Applicable aux scénarios de recommandation nécessitant une explicabilité élevée

Références

L'article cite 37 références pertinentes, couvrant plusieurs domaines connexes tels que les recommandations explicables, le raisonnement contrefactuel et le raisonnement causal, fournissant une base théorique solide pour la recherche.

Évaluation Globale: Ceci est un article de recherche de haute qualité proposant un cadre d'explication contrefactuelle comparative innovant, résolvant des problèmes importants des méthodes existantes. La conception de la méthode est raisonnable, la validation expérimentale est complète, et elle apporte une contribution importante au domaine des recommandations explicables. Bien que présentant certaines limitations, c'est globalement un travail de recherche de valeur.