Few-Shot Class-Incremental Learning (FSCIL) challenges models to sequentially learn new classes from minimal examples without forgetting prior knowledge, a task complicated by the stability-plasticity dilemma and data scarcity. Current FSCIL methods often struggle with generalization due to their reliance on limited datasets. While diffusion models offer a path for data augmentation, their direct application can lead to semantic misalignment or ineffective guidance. This paper introduces Diffusion-Classifier Synergy (DCS), a novel framework that establishes a mutual boosting loop between diffusion model and FSCIL classifier. DCS utilizes a reward-aligned learning strategy, where a dynamic, multi-faceted reward function derived from the classifier's state directs the diffusion model. This reward system operates at two levels: the feature level ensures semantic coherence and diversity using prototype-anchored maximum mean discrepancy and dimension-wise variance matching, while the logits level promotes exploratory image generation and enhances inter-class discriminability through confidence recalibration and cross-session confusion-aware mechanisms. This co-evolutionary process, where generated images refine the classifier and an improved classifier state yields better reward signals, demonstrably achieves state-of-the-art performance on FSCIL benchmarks, significantly enhancing both knowledge retention and new class learning.
- 논문 ID: 2510.03608
- 제목: Diffusion-Classifier Synergy: Reward-Aligned Learning via Mutual Boosting Loop for FSCIL
- 저자: Ruitao Wu, Yifan Zhao, Guangyao Chen, Jia Li
- 분류: cs.CV
- 발표 학회: NeurIPS 2025
- 논문 링크: https://arxiv.org/abs/2510.03608
소수 샷 클래스 증분 학습(Few-Shot Class-Incremental Learning, FSCIL)은 극소수의 샘플로부터 새로운 클래스를 순차적으로 학습하면서 동시에 이전 지식을 잊지 않아야 하는 과제로, 안정성-가소성 딜레마와 데이터 부족으로 인해 복잡해진다. 현재 FSCIL 방법들은 제한된 데이터셋에 의존하기 때문에 일반화 능력에 어려움을 겪고 있다. 확산 모델이 데이터 증강을 위한 경로를 제공하지만, 직접 적용하면 의미론적 오정렬이나 부적절한 지도가 발생할 수 있다. 본 논문은 확산-분류기 협력(DCS) 프레임워크를 제안하며, 이는 확산 모델과 FSCIL 분류기 간의 상호 촉진 루프를 구축한다. DCS는 보상 정렬 학습 전략을 채택하여 분류기 상태에서 파생된 동적 다면 보상 함수를 통해 확산 모델을 지도한다. 이 보상 시스템은 두 가지 수준에서 작동한다: 특징 수준에서는 프로토타입 앵커링 최대 평균 차이와 차원 분산 매칭을 통해 의미론적 일관성과 다양성을 보장하고, 로짓 수준에서는 신뢰도 재보정과 교차 세션 혼동 인식 메커니즘을 통해 탐색적 이미지 생성을 촉진하고 클래스 간 구별 가능성을 향상시킨다. 이러한 공동 진화 과정에서 생성된 이미지는 분류기를 최적화하고, 개선된 분류기 상태는 더 나은 보상 신호를 생성하여 FSCIL 벤치마크에서 최첨단 성능을 달성하고 지식 보존과 새로운 클래스 학습 능력을 크게 향상시킨다.
소수 샷 클래스 증분 학습(FSCIL)은 매우 도전적인 과제로, 모델이 다음을 요구한다:
- 순차 학습: 연속적인 데이터 스트림에서 새로운 클래스 학습
- 소수 샷 제약: 새로운 클래스는 소수의 훈련 샘플만 보유(일반적으로 5-shot)
- 망각 방지: 이전에 학습한 클래스에 대한 지식 유지
- 안정성-가소성 딜레마: 새로운 지식 학습과 기존 지식 보존 간의 균형 유지
- 데이터 부족: 새로운 클래스의 극소수 샘플로 인한 신뢰할 수 없는 경험적 위험 최소화
- 불충분한 일반화 능력: 기존 방법들이 제한된 초기 데이터셋에 과도하게 의존
전통적인 FSCIL 방법은 주로 두 가지 문제를 가지고 있다:
- 의미론적 오정렬 및 다양성 부족: 확산 모델에서 직접 생성한 이미지는 의미론적 편차나 다양성 부족이 있을 수 있다
- 피드백 메커니즘 부재: 확산 모델이 분류기의 현재 상태에 따라 출력을 조정할 메커니즘 부재
- DCS 프레임워크 제안: 확산 모델과 FSCIL 분류기 간의 상호 촉진 루프를 최초로 제안하며, DAS 알고리즘을 통해 보상 정렬 생성 구현
- 다층 보상 설계: 특징 수준과 로짓 수준에서 작동하는 다면 보상 함수 설계
- 특징 수준: 의미론적 일관성 보장 및 클래스 내 다양성 촉진
- 로짓 수준: 탐색적이고 일반화된 클래스 내 이미지 생성 지도 및 클래스 간 구별 가능성 향상
- 최첨단 성능: FSCIL 벤치마크 데이터셋에서 최첨단 결과 달성, 기존 클래스 지식 보존 및 새로운 클래스 학습 효과 대폭 개선
FSCIL은 연속 데이터 스트림 Dtrain={Dtraint}t=0T에서 순차적으로 학습하는 것을 포함하며, 여기서:
- 각 세션 t는 새로운 분리된 클래스 집합 Ct의 훈련 샘플 (xi,yi)를 도입
- 기본 세션 (t=0)은 충분한 데이터를 가지고 있으며, 증분 세션 (t>0)은 N-way K-shot 형식 채택
- 모델은 Dtraint에서 훈련 후 모든 관찰된 클래스 Cseent=⋃s=0tCs에서 평가 필요
DCS의 핵심 개념은 확산 모델과 분류기 간의 양방향 피드백 구축:
- 보상 계산: 분류기 σ (매개변수 θ)의 생성 이미지 x에 대한 출력을 기반으로 여러 보상 구성 요소 Ri 계산
- 확산 모델 최적화:
ϕ∗=argmaxϕ∑iRi(σθ(D(x;ϕ)))
- 분류기 개선:
θ∗=argminθLcls(σθ;x∪D(x;ϕ∗),y)
1. 프로토타입 앵커링 최대 평균 차이 보상 (R_PAMMD)RPAMMD(xgen,Igen(c,N))=−αN21∑i=1N∑j=1Nk(zi,zj)+βN1∑i=1Nk(zi,μc)
여기서:
- 첫 번째 항(다양성): 생성 이미지 간의 차이 장려
- 두 번째 항(일관성): 클래스 프로토타입과의 의미론적 일관성 보장
- k(⋅,⋅)는 양정부호 커널 함수, μc는 클래스 프로토타입
2. 차원 분산 매칭 보상 (R_VM)RVM(xgen,Igen(c,N))=−∑d=1D(vgend−vreald)2
생성 이미지와 실제 이미지 간의 각 차원에서의 분산 매칭을 통해 특징 분포의 일관성 유지.
1. 신뢰도 재보정 보상 (R_RC)RRC(xgen,yc)=log(p^(yc∣xgen;T))
여기서 온도 매개변수 T는 분류기의 원본 신뢰도에 따라 자동으로 조정:
T(xgen)=Tbase+Tscale⋅1−1/Ncp^c(yc∣xgen)−1/Nc
2. 교차 세션 혼동 인식 보상 (R_CSCA)RCSCA(xgen,yc)=∑y∈Cwy(xgen)log(p^(y∣xgen;Ts))
여기서 동적 가중치:
wyt(xgen)=1+γ⋅dcos(xgen,μt)1
- 양방향 피드백 메커니즘: 확산 모델과 분류기의 협력 진화를 최초로 구현
- 다층 보상 설계: 특징 및 결정 공간에서 동시에 생성 과정 최적화
- 자동 온도 조절: 분류기 신뢰도에 따라 보상 평활도 동적 조정
- 혼동 인식 생성: 어려운 샘플을 적극적으로 생성하여 클래스 간 구별 가능성 향상
- CIFAR-100: 기본 세션 60개 클래스, 증분 세션 40개 클래스(8-way 5-shot)
- miniImageNet: 기본 세션 60개 클래스, 증분 세션 40개 클래스(8-way 5-shot)
- CUB-200: 기본 세션 100개 클래스, 증분 세션 40개 클래스(10-way 5-shot)
- 세션 정확도: 특정 학습 세션 내 모델 성능
- 평균 정확도: 초기부터 현재 세션까지의 모든 세션 정확도 평균
TOPIC, CEC, FACT, TEEN, SAVC, DyCR, ALFSCIL, OrCo, ADBS 등 주류 FSCIL 방법 포함
- 확산 모델: Stable Diffusion 3.5 Medium
- 이미지 생성: 기본 세션 클래스당 30장, 새 세션 새 클래스 30장/기존 클래스 10장
- 백본 네트워크: ResNet-18 (CUB-200), ResNet-12 (miniImageNet, CIFAR-100)
- 최적화기: SGD, 모멘텀 0.9, 가중치 감소 0.0005
miniImageNet 데이터셋 결과:
- DCS 평균 정확도: 68.14%
- 최고 기준선 (OrCo): 66.90%
- 개선 폭: +1.24%
CUB-200 데이터셋 결과:
- DCS 평균 정확도: 69.73%
- 최고 기준선 (SAVC): 69.35%
- 개선 폭: +0.38%
CIFAR-100 데이터셋 결과:
- DCS 평균 정확도: 66.36%
- 최고 기준선 (ALFSCIL): 66.75%
CIFAR-100에서의 소거 연구는 각 구성 요소의 기여도를 보여줌:
- R_PAMMD만: +1.24%
- +R_VM: +1.86%
- +R_RC: +3.50%
- +R_CSCA (완전한 DCS): +5.64%
결과는 로짓 수준 보상이 성능 향상에 더욱 중요함을 보여줌.
- FID 개선: 특징 수준 보상이 FID 및 CLIP 점수를 크게 개선
- CLIP 점수 향상: R_RC가 최고의 CLIP 점수 획득
- 전략적 품질 저하: R_CSCA는 경계 근처의 어려운 샘플을 생성하기 위해 의도적으로 생성 품질 저하
- 효율성 우위: DCS는 소량의 생성 이미지로 대규모 생성의 성능 달성
- 구성 요소 협력: 모든 보상 구성 요소가 최종 성능에 긍정적 기여
- 교차 데이터셋 일관성: 보상 설계가 다양한 데이터셋에서 일관된 성능 표현
- 데이터 재생 방법: 이전 작업 데이터 저장 또는 생성
- 네트워크 확장 방법: 모델 아키텍처 동적 조정
- 매개변수 정규화 방법: 고정 네트워크 구조 하에서 매개변수 조정
- 동적 네트워크 방법: 네트워크 구조 조정을 통한 특징 공간 관계 유지
- 메타 학습 방법: 메타 학습 개념 도입
- 특징 공간 방법: 가상 클래스 인스턴스를 통한 특징 공간 강건성 향상
- 사전 훈련 모델 방법: CLIP 등 시각-언어 모델 활용
- 대규모 데이터 증강: 합성 추가 훈련 데이터로 분류기 개선
- 조건 메커니즘: 의미론적 제어 및 샘플 다양성 향상
- 특정 시나리오 응용: 소수 샷 학습 또는 지속적 학습
- DCS는 확산 모델과 FSCIL 분류기 간의 협력 메커니즘을 성공적으로 구축
- 다층 보상 설계는 의미론적 정렬 및 다양성 문제를 효과적으로 해결
- 표준 FSCIL 벤치마크에서 최첨단 성능 달성
- 사전 훈련 모델 의존성: 성능이 고품질 사전 훈련 확산 모델에 의존
- 도메인 특화 제한: 확산 모델 훈련 데이터 커버리지가 부족한 전문 분야에서 성능 저하 가능
- 계산 복잡도: 다중 구성 요소 보상 시스템 및 반복 촉진 루프로 인한 조정 및 계산 부담 증가
- 더 효율적인 보상 계산 방법 탐색
- 더 많은 전문 분야에서의 적용 가능성 연구
- 더 가벼운 프레임워크 변형 개발
- 높은 혁신성: 확산 모델과 분류기의 상호 촉진 메커니즘을 최초로 제안하며 개념이 참신함
- 정교한 기술 설계: 다층 보상 설계가 주의 깊게 고려되었으며 이론적 기초가 견고함
- 충분한 실험: 여러 표준 데이터셋에서 포괄적인 평가 수행, 상세한 소거 연구 포함
- 명확한 성능 향상: 도전적인 FSCIL 과제에서 현저한 개선 달성
- 계산 오버헤드: 생성 과정 및 다중 보상 계산으로 인한 훈련 시간 및 자원 요구 증가
- 초매개변수 민감성: 여러 보상 구성 요소의 가중치가 신중한 조정 필요
- 일반화 검증 부족: 주로 컴퓨터 비전 분야에서 검증, 다른 분야의 적용 가능성 미지수
- 제한된 이론 분석: 수렴성 및 안정성에 대한 이론적 보장 부재
- 학술적 가치: FSCIL 분야에 새로운 연구 사고 및 기술 경로 제공
- 실용적 가치: 자원이 제한된 지속적 학습 시나리오에서 응용 잠재력 보유
- 재현 가능성: 상세한 구현 세부사항 및 초매개변수 설정 제공
- 지속적 학습 시스템: 새로운 클래스를 지속적으로 학습해야 하는 실제 응용
- 자원 제한 환경: 대량의 과거 데이터를 저장할 수 없는 시나리오
- 소수 샷 학습: 새 클래스 샘플이 부족한 도메인 응용
논문은 82개의 관련 문헌을 인용하며, 클래스 증분 학습, 소수 샷 학습, 확산 모델 등 여러 관련 분야의 중요한 연구를 포함하여 연구에 견고한 이론적 기초 및 기술 지원을 제공한다.