2025-11-18T12:37:13.469298

Comparative Explanations via Counterfactual Reasoning in Recommendations

Yu, Hu

Explainable recommendation through counterfactual reasoning seeks to identify the influential aspects of items in recommendations, which can then be used as explanations. However, state-of-the-art approaches, which aim to minimize changes in product aspects while reversing their recommended decisions according to an aggregated decision boundary score, often lead to factual inaccuracies in explanations. To solve this problem, in this work we propose a novel method of Comparative Counterfactual Explanations for Recommendation (CoCountER). CoCountER creates counterfactual data based on soft swap operations, enabling explanations for recommendations of arbitrary pairs of comparative items. Empirical experiments validate the effectiveness of our approach.

academic

추천 시스템에서 반사실적 추론을 통한 비교 설명

기본 정보

논문 ID: 2510.10920
제목: Comparative Explanations via Counterfactual Reasoning in Recommendations
저자: Yi Yu (화웨이 기술 유한회사), Zhenxing Hu (화웨이 기술 유한회사)
분류: cs.IR (정보 검색), cs.AI (인공지능)
발표 시간/학회: 2025년 학회 제출 (구체적 학회 미정)
논문 링크: https://arxiv.org/abs/2510.10920

초록

설명 가능한 추천은 반사실적 추론을 통해 추천 항목의 영향 요인을 식별하려고 하며, 이러한 요인들을 설명으로 사용할 수 있습니다. 그러나 기존의 최첨단 방법들은 제품 속성의 변화를 최소화하면서 집계된 의사결정 경계 점수에 따라 추천 의사결정을 역전시키는 것을 목표로 하므로, 종종 설명의 사실적 부정확성을 초래합니다. 이 문제를 해결하기 위해 본 논문은 추천을 위한 새로운 비교 반사실적 설명 방법(CoCountER)을 제안합니다. CoCountER은 소프트 교환 연산을 기반으로 반사실적 데이터를 생성하며, 임의의 비교 항목 쌍에 대한 추천 설명을 제공할 수 있습니다. 실증 실험은 이 방법의 효과를 검증합니다.

연구 배경 및 동기

문제 정의

설명 가능한 추천 시스템은 사용자에게 고품질 추천을 제공하는 동시에, 추천 뒤의 논리를 이해하도록 돕는 명확한 설명을 제공하여 시스템에 대한 사용자의 신뢰도와 만족도를 높이는 것을 목표로 합니다.

기존 방법의 한계

매칭형 방법의 문제점: 템플릿 기반 설명 방법(예: EFM, MTER, A2CF)은 텐서 분해 기술을 통해 추천 및 속성 표현을 최적화하지만, 매칭 점수는 높지만 실제 성능이 낮은 속성을 설명으로 선택할 수 있습니다.
기존 반사실적 방법의 결함: CountER 등의 방법은 특성 감소를 최소화하여 의사결정을 역전시키지만, 사실적 부정확성 문제가 존재합니다. 논문의 헤드폰 예시에서 CountER은 편안함을 헤드폰 A 추천의 설명으로 제시할 수 있지만, 실제로는 헤드폰 A가 편안함 측면에서 헤드폰 B보다 떨어집니다.
근본 원인: 기존 방법은 모든 감소된 속성의 합을 의사결정 경계 점수로 밀어붙이는 것을 최적화하지만, 각 속성을 의사결정 경계로 밀어붙이지 않아 설명이 직관과 모순됩니다.

연구 동기

본 논문은 비교 반사실적 추론을 통해 위의 문제를 해결하고, 항목 쌍 간의 속성 수준 교환 연산을 수행하여 더욱 충실하고 직관적인 설명을 생성하는 것을 제안합니다.

핵심 기여

새로운 반사실적 데이터 생성 방법 제안: 소프트 교환 연산 기반의 반사실적 데이터 생성 메커니즘
혁신적인 비교 반사실적 설명 프레임워크: CoCountER은 임의의 비교 항목 쌍에 대한 추천 설명을 제공할 수 있음
실험 검증: 여러 데이터셋에서 방법의 효과를 검증하였으며, 반사실적 관련 지표에서 기존 방법을 초과함

방법론 상세 설명

작업 정의

목표 사용자 u, 설명 항목 i, 참조 항목 j가 주어졌을 때, r_{u,i} > r_{u,j}를 만족하는 추천 점수에서 교환 연산을 최소화하여 추천 의사결정에 영향을 미치는 핵심 속성을 식별하는 것이 목표입니다.

모델 아키텍처

1. 데이터 전처리

Sentires 도구를 사용하여 사용자 리뷰에서 (사용자, 항목, 속성, 감정) 4-튜플을 추출하고 다음을 구성합니다:

사용자-속성 주의 행렬 X: X_{u,a}는 사용자 u의 속성 a에 대한 관심도를 나타냄
항목-속성 품질 행렬 Y: Y_{i,a}는 항목 i의 속성 a에서의 성능을 나타냄

계산 공식:

X_{u,a} = {
  0, 사용자 u가 속성 a를 언급하지 않은 경우
  1 + (N-1) · (1-exp^{-t_{u,a}})/(1+exp^{-t_{u,a}}), 그 외의 경우
}

Y_{i,a} = {
  0, 항목 i가 속성 a에서 언급되지 않은 경우
  1 + (N-1)/(1+exp^{-t_{i,a}·s_{i,a}}), 그 외의 경우
}

2. 추천 모델

간단한 융합 계층 아키텍처를 채택합니다:

r_{u,i} = g_θ(X_u, Y_i)

3계층 완전 연결 네트워크 + ReLU 활성화 함수 + Sigmoid 출력으로 구현됩니다.

3. 비교 반사실적 설명 핵심

교환 함수 설계:

f(Y_i, Y_j, ψ) = (1-σ(ψ)) ⊙ Y_i + σ(ψ) ⊙ Y_j

여기서 σ(ψ)는 시그모이드 함수이고, ψ는 학습 가능한 교환 변수 벡터입니다.

최적화 목표:

min_ψ ||σ(ψ)||_1 + λL(r_{u,i*}, r_{u,j*})

여기서 L은 경계 순위 손실입니다:

L(r_{u,i*}, r_{u,j*}) = max(0, (r_{u,i*} - r_{u,j*}) + m)

기술 혁신점

소프트 교환 연산: 시그모이드 함수를 통해 미분 가능한 교환 연산을 구현하며, 값이 0에 가까우면 교환하지 않음을, 1에 가까우면 완전히 교환함을 나타냅니다.
비교 프레임워크: 기존의 단일 항목 설명과 달리 항목 간 비교 설명을 제공합니다.
범용성: 참조 항목을 고정하고 교환 함수의 첫 번째 부분만 계산할 때, 감소 기반의 반사실적 방법으로 축소될 수 있습니다.

실험 설정

데이터셋

Amazon 리뷰 데이터셋의 세 가지 카테고리를 사용합니다:

Electronics: 963명 사용자, 1,112개 항목, 19,418개 리뷰, 877개 속성
CDs & Vinyl: 2,129명 사용자, 2,907개 항목, 56,045개 리뷰, 810개 속성
Movies: 5,586명 사용자, 6,703개 항목, 187,490개 리뷰, 1,530개 속성

데이터 전처리: 상호작용이 10회 미만인 사용자 및 항목을 필터링하고, 8:1:1로 훈련/검증/테스트 세트를 분할합니다.

평가 지표

사용자 지향 지표: Precision과 Recall
모델 지향 지표: Probability of Necessity (PN)과 Probability of Sufficiency (PS)

비교 방법

무작위 방법: Random
정렬 방법: Sort-i (항목 속성 성능 순 정렬), Sort-u (사용자 주의도 순 정렬)
매칭형 방법: EFM, A2CF
반사실적 방법: CountER, CoCountER (본 논문 방법)

구현 세부사항

학습률 η는 경사 하강법으로 최적화됨
경계 임계값 m은 순위 손실에 사용됨
균형 계수 λ는 두 최적화 목표를 조율함
교환 임계값은 설명 속성 식별을 위해 0.5로 설정됨

실험 결과

주요 결과

세 데이터셋 모두에서 CoCountER은 반사실적 관련 지표 PN과 PS에서 모든 기준 방법을 지속적으로 초과합니다:

Electronics 데이터셋:

PN: 0.734 (CountER의 0.511 대비)
PS: 0.931 (CountER의 0.894 대비)

CDs & Vinyl 데이터셋:

PN: 0.773 (CountER의 0.526 대비)
PS: 0.936 (CountER의 0.921 대비)

Movies 데이터셋:

PN: 0.744 (CountER의 0.496 대비)
PS: 0.928 (CountER의 0.889 대비)

하이퍼파라미터 분석

참조 항목 위치의 영향: 순위가 낮을수록 최적화 제약이 적어서 더 많은 유효한 반사실적 속성을 발견할 수 있으며, PN과 PS 성능을 향상시킵니다.
참조 항목 수의 영향: 적절한 수의 참조 항목 증가는 성능을 향상시키지만, 과도하면 노이즈가 도입되어 경미한 성능 저하를 초래합니다.

실험 발견

CoCountER은 속성 수준 교환 연산을 통해 CountER보다 더욱 충실하고 문맥 인식적인 설명을 제공합니다.
비교 반사실적 설계는 추천 뒤의 진정한 인과 속성을 포착할 수 있습니다.
방법은 광범위한 설정에서 안정성을 유지하며 우수한 견고성을 보여줍니다.

CoCountER 프레임워크를 제안하여 비교 반사실적 추론을 통해 더욱 충실한 추천 설명을 생성합니다.
소프트 교환 연산은 추천 의사결정에 영향을 미치는 핵심 속성을 효과적으로 식별할 수 있습니다.
실험은 이 방법이 반사실적 지표에서 기존 방법을 현저히 능가함을 증명합니다.

한계

추천 모델 단순화: 설명 가능성에 집중하기 위해 상대적으로 단순한 추천 모델 아키텍처를 채택했습니다.
계산 복잡도: 각 참조 항목에 대해 최적화를 수행해야 하므로 계산 비용이 증가합니다.
속성 의존성: 방법은 리뷰에서 추출된 속성에 의존하며, 속성 품질에 민감합니다.

향후 방향

논문은 반사실적 추론을 생성 모델과 결합하여 반사실적 시나리오의 자연어 설명을 생성할 것을 제안합니다.

심층 평가

장점

높은 혁신성: 비교 반사실적 설명 프레임워크를 처음 제안하여 기존 방법의 사실적 부정확성 문제를 해결합니다.
견고한 이론적 기초: 구체적인 예시를 통해 기존 방법의 문제를 명확히 설명하고 이론적 분석을 제공합니다.
합리적인 방법 설계: 소프트 교환 연산의 설계는 미분 가능성을 보장하면서도 직관적인 설명을 제공합니다.
충분한 실험: 여러 데이터셋에서 검증하며, 하이퍼파라미터 민감도 분석을 포함합니다.

부족한 점

평가 지표의 한계: 주로 반사실적 지표에 초점을 맞추며, 설명의 실제 유용성을 검증하기 위한 사용자 연구가 부족합니다.
기준 방법의 제한: 주요 비교 방법을 포함하지만, 더 많은 최근 반사실적 설명 방법이 부족합니다.
확장성 문제: 항목 수가 증가하면 고려해야 할 항목 쌍의 수가 제곱으로 증가합니다.
실제 배포 고려 부족: 실제 추천 시스템 배포 시 효율성 및 확장성에 대한 논의가 부족합니다.

영향력

학술적 기여: 설명 가능한 추천 분야에 새로운 연구 방향을 제공합니다.
실용적 가치: 더욱 직관적인 설명을 생성할 수 있어 사용자 경험 향상에 도움이 됩니다.
재현성: 상세한 알고리즘 설명 및 구현 세부사항을 제공합니다.

적용 시나리오

전자상거래 추천: 특히 특정 상품을 다른 상품보다 추천하는 이유를 설명해야 하는 경우에 적합합니다.
콘텐츠 추천: 영화, 음악 등 콘텐츠 추천 시스템에 적용할 수 있습니다.
고위험 의사결정: 높은 설명 가능성이 필요한 추천 시나리오에 적합합니다.

참고문헌

논문은 설명 가능한 추천, 반사실적 추론, 인과 추론 등 여러 관련 분야의 중요한 연구를 포함하는 30개의 관련 문헌을 인용하여 연구에 견고한 이론적 기초를 제공합니다.

종합 평가: 이는 혁신적인 비교 반사실적 설명 프레임워크를 제안하고 기존 방법의 중요한 문제를 해결하는 고품질 연구 논문입니다. 방법 설계가 합리적이고 실험 검증이 충분하며, 설명 가능한 추천 분야에 중요한 기여를 합니다. 일부 한계가 있지만, 전반적으로 가치 있는 연구 작업입니다.