2025-11-25T04:46:17.326463

ChatThero: An LLM-Supported Chatbot for Behavior Change and Therapeutic Support in Addiction Recovery

Wang, Yao, Li et al.

Substance use disorders (SUDs) affect millions of people, and relapses are common, requiring multi-session treatments. Access to care is limited, which contributes to the challenge of recovery support. We present \textbf{ChatThero}, an innovative low-cost, multi-session, stressor-aware, and memory-persistent autonomous \emph{language agent} designed to facilitate long-term behavior change and therapeutic support in addiction recovery. Unlike existing work that mostly finetuned large language models (LLMs) on patient-therapist conversation data, ChatThero was trained in a multi-agent simulated environment that mirrors real therapy. We created anonymized patient profiles from recovery communities (e.g., Reddit). We classify patients as \texttt{easy}, \texttt{medium}, and \texttt{difficult}, three scales representing their resistance to recovery. We created an external environment by introducing stressors (e.g., social determinants of health) to simulate real-world situations. We dynamically inject clinically-grounded therapeutic strategies (motivational interview and cognitive behavioral therapy). Our evaluation, conducted by both human (blinded clinicians) and LLM-as-Judge, shows that ChatThero is superior in empathy and clinical relevance. We show that stressor simulation improves robustness of ChatThero. Explicit stressors increase relapse-like setbacks, matching real-world patterns. We evaluate ChatThero with behavioral change metrics. On a 1--5 scale, ChatThero raises \texttt{motivation} by $+1.71$ points (from $2.39$ to $4.10$) and \texttt{confidence} by $+1.67$ points (from $1.52$ to $3.19$), substantially outperforming GPT-5. On \texttt{difficult} patients, ChatThero reaches the success milestone with $26\%$ fewer turns than GPT-5.

academic

ChatThero: 중독 회복에서의 행동 변화 및 치료 지원을 위한 LLM 기반 챗봇

기본 정보

논문 ID: 2508.20996
제목: ChatThero: A Language Agent for Recovery Support
저자: Junda Wang, Zonghai Yao, Lingxi Li, Junhui Qian, Zhichao Yang, Hong Yu
분류: cs.AI
발표 시간/학회: arXiv preprint 2025
논문 링크: https://arxiv.org/abs/2508.20996v2

초록

물질 사용 장애(SUDs)는 수백만 명에게 영향을 미치며 높은 재발률을 보이고 반복적인 치료가 필요합니다. 제한된 의료 자원으로 인해 회복 지원은 거대한 도전에 직면해 있습니다. 본 논문은 ChatThero를 제안하며, 이는 중독 회복에서 장기적인 행동 변화와 치료 지원을 촉진하기 위해 설계된 혁신적인 저비용, 다중 세션, 스트레스 인식, 메모리 지속형 자율 언어 에이전트입니다. 기존의 환자-치료사 대화 데이터에 대해 미세 조정된 대규모 언어 모델 작업과 달리, ChatThero는 실제 치료를 모방하는 다중 에이전트 환경에서 훈련됩니다. 연구팀은 회복 커뮤니티(예: Reddit)에서 익명 환자 프로필을 생성하고, 환자를 회복 저항 수준을 나타내는 쉬움, 중간, 어려움의 세 등급으로 분류합니다. 스트레스원 시뮬레이션을 통해 실제 상황을 반영하고, 임상 기반 치료 전략(동기 면담 및 인지행동 치료)을 동적으로 주입합니다. 평가 결과는 ChatThero가 공감 및 임상 관련성 측면에서 우수한 성능을 보이며, 스트레스 시뮬레이션이 시스템의 견고성을 향상시킴을 보여줍니다.

연구 배경 및 동기

문제의 중요성

대규모 사회 문제: 미국에서 약 250만 명이 오피오이드 사용 장애를 앓고 있으며, 600만 명 이상이 최근 불법 약물 사용을 보고함
높은 재발률: 지속적인 지원이 없는 경우 첫 해 재발률은 80-90%에 달할 수 있음
치료 자원 부족: 오피오이드 사용 장애 환자의 4분의 1 미만만 치료를 받음
다중 장애물: 낙인, 비용, 접근성 어려움, 낮은 참여도 등 포함

기존 방법의 한계

단일 개입의 제한된 효과: 단일 세션 개입은 효과를 유지하기 어렵고 반복적인 치료와 지속적인 관리가 필요함
기존 AI 시스템의 부족: 대부분의 시스템은 단일 세션 또는 짧은 맥락에서 미세 조정되어 실제 회복 치료 과정을 대표할 수 없음
평가 방법의 한계: 대부분의 평가는 단일 라운드 품질 점수를 사용하여 궤적과 재발 유사 좌절을 놓침

연구 동기

여러 세션에 걸쳐 지속적이고 개인화된 치료 지원을 제공할 수 있는 AI 시스템을 구축하여 실제 치료 환경에서의 스트레스와 도전을 모방합니다.

핵심 기여

다중 세션, 스트레스 인식 언어 에이전트 프레임워크: 메모리 지속성을 갖춘 재현 가능한 시뮬레이션 시스템 제안
데이터-환경 구축 프로세스: 회복 포럼에서 환자 프로필 획득, 명시적 스트레스 프로세스 도입으로 상태 변경
2단계 훈련 방안: SFT→DPO의 어려운 사례 커리큘럼 학습을 통한 다중 세션 전략 채택
결과 지향적 다중 세션 평가 스위트: 동기/신뢰도 궤적, 성공 시간, 스트레스 견고성 및 인간-기계 일치 평가 포함

방법론 상세 설명

작업 정의

회복 지원을 다중 세션, 부분 관찰 가능한 의사 결정 및 생성 문제로 모델링하며, 세션 간 교란과 갈망을 포함합니다. 시스템은 다음을 수행해야 합니다:

환자 상태의 연속성 유지
환경 스트레스원에 적응
MI/CBT/해악 감소 전략 선택 및 순서 지정
세션 간 메모리 유지

모델 아키텍처

3개 에이전트 시스템

환자 에이전트(PA):
- 지속적인 상태 및 저항 수준 유지(쉬움/중간/어려움)
- 회복 커뮤니티 프로필 기반, 선별 및 익명화 처리됨
- 구조화된 프로필 및 동적 메모리 포함
환경 에이전트(EA):
- 세션 간 명시적 스트레스원 주입
- 실제 상황 시뮬레이션(동료 압력, 업무 스트레스, 가족 갈등 등)
- 환자 메모리 상태 업데이트
치료 에이전트(TA) - ChatThero:
- 훈련 가능한 핵심 구성 요소
- MI/CBT 전략 선택 및 순서 지정
- 종단 메모리 유지

환자 프로필 생성

구조화된 프로필: 성격 특성, 물질 사용 이력, 주요 생활 사건, 사용 동기 포함
동적 메모리: 상호작용, 정서 상태, 대처 메커니즘, 환경 영향 기록
개인정보 보호: PII 제거 및 익명화를 보장하는 다단계 파이프라인

기술 혁신 포인트

1. 다중 세션 치료 단계화

6단계 CBT 프레임워크 채택:

S1: 신뢰 구축 및 평가
S2: 부정적 인지 식별
S3: 오류 신념 도전
S4: 인지 패턴 재구성
S5: 행동 기술 구축
S6: 통합 및 종료

2. 스트레스원 시뮬레이션

3가지 스트레스원 범주:

동료/가용성(초대, 사용 동료 접근)
업무/학업(마감일, 근무 변경)
가족/환경(가족 갈등, 주거 불안정)

3. 2단계 훈련

SFT 단계: 안전한 MI/CBT 구조 학습
DPO 단계: 어려운 사례 커리큘럼을 사용하여 전략 선택 시기 최적화

실험 설정

데이터셋

Reddit 데이터: 57,471명의 고유 저자, 저자당 평균 18.25개 게시물
합성 대화: 60,471개 대화, 평균 45.72 라운드
다중 세션 궤적: 8,240개 대화(6회 세션 아크)

평가 지표

결과 지표:
- 동기(Motivation): 1-5점
- 신뢰도(Confidence): 1-5점
프로세스 지표:
- 성공 시간(Time-to-Success): 성공 임계값 도달 라운드 수의 백분율
인간 평가 차원:
- 반응성(Responsiveness)
- 공감(Empathy)
- 설득 전략 적절성(Persuasive Strategy Appropriateness)
- 임상 관련성(Clinical Relevance)
- 행동 현실성(Behavioral Realism)