2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu

Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.

academic

Сравнительные объяснения посредством контрфактического рассуждения в рекомендациях

Основная информация

ID статьи: 2510.10920
Название: Comparative Explanations via Counterfactual Reasoning in Recommendations
Авторы: Yi Yu (Huawei Technologies Co., Ltd.), Zhenxing Hu (Huawei Technologies Co., Ltd.)
Классификация: cs.IR (информационный поиск), cs.AI (искусственный интеллект)
Время публикации/конференция: Подано в 2025 году на конференцию (конкретная конференция уточняется)
Ссылка на статью: https://arxiv.org/abs/2510.10920

Аннотация

Интерпретируемые рекомендации посредством контрфактического рассуждения стремятся выявить факторы влияния товаров в рекомендациях, которые могут использоваться в качестве объяснений. Однако существующие передовые методы направлены на минимизацию изменений атрибутов продукта при одновременном обращении решений рекомендации на основе агрегированных оценок границы решения, что часто приводит к фактической неточности в объяснениях. Для решения этой проблемы в данной работе предлагается новый метод сравнительного контрфактического объяснения рекомендаций (CoCountER). CoCountER создает контрфактические данные на основе операций мягкого обмена, обеспечивая объяснения рекомендаций для произвольных пар сравниваемых товаров. Эмпирические эксперименты подтверждают эффективность предложенного метода.

Исследовательский контекст и мотивация

Определение проблемы

Системы интерпретируемых рекомендаций направлены на предоставление пользователям высококачественных рекомендаций одновременно с четкими объяснениями, помогающими пользователям понять логику, лежащую в основе рекомендаций, тем самым повышая доверие пользователей к системе и их удовлетворенность.

Ограничения существующих методов

Проблемы методов на основе сопоставления: Методы объяснения на основе шаблонов (такие как EFM, MTER, A2CF) оптимизируют представления рекомендаций и атрибутов с использованием техники тензорной факторизации, но могут выбирать атрибуты с высокими оценками сопоставления, но плохой фактической производительностью в качестве объяснений.
Недостатки существующих контрфактических методов: Методы, такие как CountER, обращают решения путем минимизации сокращения признаков, но страдают от проблем фактической неточности. На примере наушников в статье CountER может выбрать комфортность в качестве объяснения рекомендации наушников A, хотя на самом деле наушники A менее удобны, чем наушники B.
Основная причина: Существующие методы оптимизируют направление суммы всех сокращаемых атрибутов к оценке границы решения, а не каждого атрибута отдельно к границе решения, что приводит к объяснениям, противоречащим интуиции.

Исследовательская мотивация

В данной работе предлагается решить вышеупомянутые проблемы посредством сравнительного контрфактического рассуждения, создавая более верные и интуитивные объяснения путем выполнения операций обмена на уровне атрибутов между парами товаров.

Основные вклады

Предложен новый метод создания контрфактических данных: Механизм генерации контрфактических данных на основе операций мягкого обмена
Инновационная структура сравнительного контрфактического объяснения: CoCountER обеспечивает объяснения рекомендаций для произвольных пар сравниваемых товаров
Экспериментальная верификация: Метод проверен на нескольких наборах данных и превосходит существующие методы по показателям контрфактической релевантности

Подробное описание метода

Определение задачи

Дана целевая пользователь u, товар объяснения i и эталонный товар j, где оценка рекомендации удовлетворяет r_{u,i} > r_{u,j}. Цель состоит в выявлении ключевых атрибутов, влияющих на решение рекомендации, посредством минимальных операций обмена.

Архитектура модели

1. Предварительная обработка данных

Использование инструмента Sentires для извлечения четырехкортежей (пользователь, товар, атрибут, тональность) из пользовательских отзывов с построением:

Матрица внимания пользователь-атрибут X: X_{u,a} представляет степень внимания пользователя u к атрибуту a
Матрица качества товар-атрибут Y: Y_{i,a} представляет производительность товара i по атрибуту a

Формулы расчета:

X_{u,a} = {
  0, если пользователь u не упомянул атрибут a
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), иначе
}

Y_{i,a} = {
  0, если товар i не упомянут по атрибуту a
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), иначе
}

2. Модель рекомендации

Применяется простая архитектура слоя слияния:

r_{u,i} = g_θ(X_u, Y_i)

Реализуется через трехслойную полносвязную сеть с активацией ReLU и выходом Sigmoid.

3. Ядро сравнительного контрфактического объяснения

Проектирование функции обмена:

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

где σ(ψ) — сигмоидная функция, ψ — вектор обучаемых переменных обмена.

Целевая функция оптимизации:

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

где L — потеря граничного ранжирования:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

Технические инновации

Операция мягкого обмена: Реализация дифференцируемой операции обмена посредством сигмоидной функции, где значения близкие к 0 означают отсутствие обмена, а близкие к 1 — полный обмен
Сравнительная структура: В отличие от традиционных объяснений одного товара, обеспечивает сравнительные объяснения между товарами
Универсальность: При фиксировании эталонного товара и расчете только первой части функции обмена может деградировать до контрфактического метода на основе сокращения

Экспериментальная установка

Наборы данных

Использованы три категории из набора данных отзывов Amazon:

Electronics: 963 пользователя, 1 112 товаров, 19 418 отзывов, 877 атрибутов
CDs & Vinyl: 2 129 пользователей, 2 907 товаров, 56 045 отзывов, 810 атрибутов
Movies: 5 586 пользователей, 6 703 товара, 187 490 отзывов, 1 530 атрибутов

Предварительная обработка данных: фильтрация пользователей и товаров с менее чем 10 взаимодействиями, разделение на наборы обучения/валидации/тестирования в соотношении 8:1:1.

Показатели оценки

Показатели, ориентированные на пользователя: Precision и Recall
Показатели, ориентированные на модель: Probability of Necessity (PN) и Probability of Sufficiency (PS)

Методы сравнения

Случайный метод: Random
Методы ранжирования: Sort-i (ранжирование по производительности атрибутов товара), Sort-u (ранжирование по вниманию пользователя)
Методы на основе сопоставления: EFM, A2CF
Контрфактические методы: CountER, CoCountER (предложенный в данной работе метод)

Детали реализации

Скорость обучения η оптимизируется посредством градиентного спуска
Пороговое значение границы m используется для потери ранжирования
Коэффициент балансировки λ координирует две целевые функции оптимизации
Пороговое значение обмена установлено на 0,5 для выявления атрибутов объяснения

Результаты экспериментов

Основные результаты

На всех трех наборах данных CoCountER последовательно превосходит все базовые методы по показателям контрфактической релевантности PN и PS:

Набор данных Electronics:

PN: 0,734 (против 0,511 для CountER)
PS: 0,931 (против 0,894 для CountER)

Набор данных CDs & Vinyl:

PN: 0,773 (против 0,526 для CountER)
PS: 0,936 (против 0,921 для CountER)

Набор данных Movies:

PN: 0,744 (против 0,496 для CountER)
PS: 0,928 (против 0,889 для CountER)

Анализ гиперпараметров

Влияние позиции эталонного товара: Эталонные товары с более низким рейтингом создают меньше ограничений оптимизации, позволяя обнаружить больше эффективных контрфактических атрибутов и улучшить производительность PN и PS
Влияние количества эталонных товаров: Надлежащее увеличение количества эталонных товаров улучшает производительность, но избыточное количество вводит шум, приводящий к незначительному снижению

Экспериментальные выводы

CoCountER обеспечивает более верные и контекстно-ориентированные объяснения через операции обмена на уровне атрибутов по сравнению с CountER
Проектирование сравнительного контрфактического подхода способно выявить истинные причинные атрибуты, лежащие в основе рекомендаций
Метод демонстрирует стабильность в широком диапазоне условий, проявляя хорошую робастность

Связанные работы

Системы интерпретируемых рекомендаций

Методы на основе атрибутов: EFM, MTER, A2CF и другие используют технику тензорной факторизации для построения объяснений на основе шаблонов
Методы контрфактического рассуждения: CountER первым внедрил контрфактическое рассуждение в интерпретируемые рекомендации
Методы генерации текста: Интеграция предварительно обученных языковых моделей, таких как BERT, для генерации текстовых объяснений

Сравнительные объяснения

Yang и соавторы предложили концепцию сравнительных объяснений, но использовали авторегрессивный декодер для генерации текстовых объяснений, что отличается от контрфактического подхода рассуждения в данной работе.

Применение причинного вывода в рекомендациях

В последние годы причинный вывод широко применяется для увеличения данных и улучшения справедливости в системах рекомендаций.

Заключение и обсуждение

Основные выводы

Предложена структура CoCountER, генерирующая более верные объяснения рекомендаций посредством сравнительного контрфактического рассуждения
Операция мягкого обмена эффективно выявляет ключевые атрибуты, влияющие на решение рекомендации
Эксперименты доказывают, что данный метод значительно превосходит существующие методы по показателям контрфактической релевантности

Ограничения

Упрощение модели рекомендации: Для сосредоточения внимания на интерпретируемости использована относительно простая архитектура модели рекомендации
Вычислительная сложность: Требуется оптимизация для каждого эталонного товара, что увеличивает вычислительные затраты
Зависимость от атрибутов: Метод зависит от атрибутов, извлеченных из отзывов, и чувствителен к качеству атрибутов

Направления будущих исследований

В статье предлагается интеграция контрфактического рассуждения с генеративными моделями для создания объяснений на естественном языке контрфактических сценариев.

Глубокая оценка

Преимущества

Высокая инновационность: Впервые предложена структура сравнительного контрфактического объяснения, решающая проблему фактической неточности существующих методов
Прочная теоретическая база: Посредством конкретных примеров четко демонстрируются проблемы существующих методов с теоретическим анализом
Рациональное проектирование метода: Проектирование операции мягкого обмена обеспечивает как дифференцируемость, так и интуитивное объяснение
Полные эксперименты: Верификация на нескольких наборах данных с включением анализа чувствительности гиперпараметров

Недостатки

Ограничения показателей оценки: Основное внимание уделяется показателям контрфактической релевантности, отсутствуют пользовательские исследования для верификации практической применимости объяснений
Ограниченные базовые методы: Хотя включены основные методы сравнения, отсутствуют более новые методы контрфактического объяснения
Проблемы масштабируемости: С увеличением количества товаров количество рассматриваемых пар товаров растет квадратично
Недостаточное рассмотрение практического развертывания: Отсутствует обсуждение эффективности и масштабируемости при развертывании в реальных системах рекомендаций

Влияние

Академический вклад: Обеспечивает новое направление исследований в области интерпретируемых рекомендаций
Практическая ценность: Способность генерировать более интуитивные объяснения способствует улучшению пользовательского опыта
Воспроизводимость: Предоставляет подробное описание алгоритма и детали реализации

Применимые сценарии

Электронная коммерция: Особенно подходит для сценариев, требующих объяснения, почему рекомендуется определенный товар вместо других
Рекомендации контента: Может применяться к системам рекомендации фильмов, музыки и другого контента
Высокорисковые решения: Подходит для сценариев, требующих высокой степени интерпретируемости рекомендаций

Библиография

Статья цитирует 30 связанных работ, охватывающих интерпретируемые рекомендации, контрфактическое рассуждение, причинный вывод и другие смежные области, обеспечивая прочную теоретическую базу для исследования.

Общая оценка: Это высококачественная исследовательская работа, предлагающая инновационную структуру сравнительного контрфактического объяснения, решающую важные проблемы существующих методов. Метод рационально спроектирован, эксперименты полны, работа вносит значительный вклад в область интерпретируемых рекомендаций. Несмотря на некоторые ограничения, это ценное исследование.