Comparative Explanations via Counterfactual Reasoning in Recommendations
Yu, Hu
Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.
academic
Explications Comparatives via Raisonnement Contrefactuel dans les Recommandations
Les recommandations explicables cherchent à identifier les facteurs d'influence des articles dans les recommandations via le raisonnement contrefactuel, ces facteurs pouvant servir d'explications. Cependant, les méthodes de pointe existantes visent à minimiser les variations d'attributs des produits tout en inversant les décisions de recommandation selon les scores de frontière de décision agrégés, ce qui conduit souvent à des inexactitudes factuelles dans les explications. Pour résoudre ce problème, cet article propose une nouvelle méthode d'explication contrefactuelle comparative pour les recommandations (CoCountER). CoCountER crée des données contrefactuelles basées sur des opérations d'échange logiciel, capable de fournir des explications pour les recommandations de paires d'articles comparatifs arbitraires. Les expériences empiriques valident l'efficacité de la méthode.
Les systèmes de recommandation explicables visent à fournir aux utilisateurs des recommandations de haute qualité tout en donnant des explications claires pour aider les utilisateurs à comprendre la logique derrière les recommandations, améliorant ainsi la confiance et la satisfaction des utilisateurs envers le système.
Problèmes des méthodes basées sur la correspondance: Les méthodes d'explication basées sur des modèles (telles que EFM, MTER, A2CF) optimisent les représentations de recommandation et d'attributs via des techniques de factorisation tensorielle, mais peuvent sélectionner des attributs avec des scores de correspondance élevés mais des performances réelles faibles comme explications.
Défauts des méthodes contrefactuelles existantes: Les méthodes telles que CountER inversent les décisions en minimisant la réduction de caractéristiques, mais souffrent de problèmes d'inexactitude factuelle. Selon l'exemple des écouteurs dans l'article, CountER peut sélectionner le confort comme explication pour la recommandation des écouteurs A, alors que les écouteurs A sont en réalité moins confortables que les écouteurs B.
Cause fondamentale: Les méthodes existantes optimisent la somme de tous les attributs réduits vers le score de frontière de décision, plutôt que de pousser chaque attribut vers la frontière de décision, ce qui conduit à des explications contradictoires avec l'intuition.
Cet article propose de résoudre les problèmes susmentionnés via le raisonnement contrefactuel comparatif, en générant des explications plus fidèles et intuitives par des opérations d'échange au niveau des attributs entre les paires d'articles.
Proposition d'une nouvelle méthode de création de données contrefactuelles: Mécanisme de génération de données contrefactuelles basé sur des opérations d'échange logiciel
Cadre d'explication contrefactuelle comparative innovant: CoCountER capable de fournir des explications pour les recommandations de paires d'articles comparatifs arbitraires
Validation expérimentale: Validation de l'efficacité de la méthode sur plusieurs ensembles de données, surpassant les méthodes existantes sur les métriques contrefactuelles pertinentes
Étant donné un utilisateur cible u, un article d'explication i et un article de référence j, où le score de recommandation satisfait r_{u,i} > r_{u,j}, l'objectif est d'identifier les attributs clés affectant la décision de recommandation via les opérations d'échange minimales.
Utilisation de l'outil Sentires pour extraire des quadruplets (utilisateur, article, attribut, sentiment) des commentaires utilisateurs, construisant:
Matrice d'attention utilisateur-attribut X: X_{u,a} représente l'attention de l'utilisateur u sur l'attribut a
Matrice de qualité article-attribut Y: Y_{i,a} représente la performance de l'article i sur l'attribut a
Formules de calcul:
X_{u,a} = {
0, si l'utilisateur u n'a pas mentionné l'attribut a
1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), sinon
}
Y_{i,a} = {
0, si l'article i n'a pas été mentionné sur l'attribut a
1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), sinon
}
Opération d'échange logiciel: Implémentation d'une opération d'échange différentiable via la fonction sigmoid, les valeurs proches de 0 indiquant pas d'échange, proches de 1 indiquant un échange complet
Cadre comparatif: Contrairement aux explications d'article unique traditionnelles, fournit des explications comparatives entre articles
Universalité: Lorsque l'article de référence est fixé et que seule la première partie de la fonction d'échange est calculée, la méthode peut se réduire à une méthode contrefactuelle basée sur la réduction
Prétraitement des données: Filtrage des utilisateurs et articles avec moins de 10 interactions, division 8:1:1 pour les ensembles d'entraînement/validation/test.
Sur les trois ensembles de données, CoCountER surpasse systématiquement toutes les méthodes de base sur les métriques contrefactuelles pertinentes PN et PS:
Impact de la position de l'article de référence: Les articles de référence classés plus bas imposent moins de contraintes d'optimisation, permettant de découvrir plus d'attributs contrefactuels efficaces, améliorant les performances PN et PS
Impact du nombre d'articles de référence: L'augmentation appropriée du nombre d'articles de référence améliore les performances, mais un excès introduit du bruit entraînant une légère baisse
Méthodes basées sur les attributs: EFM, MTER, A2CF et autres utilisant des techniques de factorisation tensorielle pour construire des explications basées sur des modèles
Méthodes de raisonnement contrefactuel: CountER introduisant pour la première fois le raisonnement contrefactuel dans les recommandations explicables
Méthodes de génération de texte: Combinaison de modèles de langage pré-entraînés tels que BERT pour générer des explications textuelles
Yang et al. ont proposé le concept d'explications comparatives, mais adoptent un décodeur autorégressif pour générer des explications textuelles, différent de la perspective du raisonnement contrefactuel de cet article.
Le raisonnement causal a été largement appliqué récemment à l'augmentation des données et à l'amélioration de l'équité dans les systèmes de recommandation.
Simplification du modèle de recommandation: Pour se concentrer sur l'explicabilité, une architecture de modèle de recommandation relativement simple a été adoptée
Complexité computationnelle: Nécessite une optimisation pour chaque article de référence, augmentant les coûts computationnels
Dépendance aux attributs: La méthode dépend des attributs extraits des avis, sensible à la qualité des attributs
L'article propose de combiner le raisonnement contrefactuel avec des modèles génératifs pour produire des explications en langage naturel de scénarios contrefactuels.
Innovation forte: Premier cadre d'explication contrefactuelle comparative proposé, résolvant le problème d'inexactitude factuelle des méthodes existantes
Fondations théoriques solides: Explication claire des problèmes des méthodes existantes via des exemples concrets avec analyse théorique
Conception de méthode raisonnable: La conception de l'opération d'échange logiciel garantit à la fois la différentiabilité et fournit des explications intuitives
Expériences complètes: Validation sur plusieurs ensembles de données, incluant l'analyse de sensibilité des hyperparamètres
Limitations des métriques d'évaluation: Accent principal sur les métriques contrefactuelles, manque d'études utilisateur pour valider l'utilité pratique des explications
Méthodes de base limitées: Bien qu'incluant les principales méthodes de comparaison, manque de méthodes d'explication contrefactuelle plus récentes
Problèmes d'extensibilité: Avec l'augmentation du nombre d'articles, le nombre de paires d'articles à considérer croît quadratiquement
Considérations insuffisantes pour le déploiement pratique: Manque de discussion sur l'efficacité et l'extensibilité lors du déploiement dans les systèmes de recommandation réels
Recommandations de commerce électronique: Particulièrement adapté aux scénarios nécessitant d'expliquer pourquoi un produit est recommandé plutôt qu'un autre
Recommandations de contenu: Applicable aux systèmes de recommandation de films, musique et autres contenus
Décisions à haut risque: Applicable aux scénarios de recommandation nécessitant une explicabilité élevée
L'article cite 37 références pertinentes, couvrant plusieurs domaines connexes tels que les recommandations explicables, le raisonnement contrefactuel et le raisonnement causal, fournissant une base théorique solide pour la recherche.
Évaluation Globale: Ceci est un article de recherche de haute qualité proposant un cadre d'explication contrefactuelle comparative innovant, résolvant des problèmes importants des méthodes existantes. La conception de la méthode est raisonnable, la validation expérimentale est complète, et elle apporte une contribution importante au domaine des recommandations explicables. Bien que présentant certaines limitations, c'est globalement un travail de recherche de valeur.