2025-11-22T20:19:15.981080

Diffusion-Classifier Synergy: Reward-Aligned Learning via Mutual Boosting Loop for FSCIL

Wu, Zhao, Chen et al.

Few-Shot Class-Incremental Learning (FSCIL) challenges models to sequentially learn new classes from minimal examples without forgetting prior knowledge, a task complicated by the stability-plasticity dilemma and data scarcity. Current FSCIL methods often struggle with generalization due to their reliance on limited datasets. While diffusion models offer a path for data augmentation, their direct application can lead to semantic misalignment or ineffective guidance. This paper introduces Diffusion-Classifier Synergy (DCS), a novel framework that establishes a mutual boosting loop between diffusion model and FSCIL classifier. DCS utilizes a reward-aligned learning strategy, where a dynamic, multi-faceted reward function derived from the classifier's state directs the diffusion model. This reward system operates at two levels: the feature level ensures semantic coherence and diversity using prototype-anchored maximum mean discrepancy and dimension-wise variance matching, while the logits level promotes exploratory image generation and enhances inter-class discriminability through confidence recalibration and cross-session confusion-aware mechanisms. This co-evolutionary process, where generated images refine the classifier and an improved classifier state yields better reward signals, demonstrably achieves state-of-the-art performance on FSCIL benchmarks, significantly enhancing both knowledge retention and new class learning.

academic

拡散-分類器シナジー：FSCIL向け相互ブースティングループによる報酬整列学習

基本情報

論文ID: 2510.03608
タイトル: Diffusion-Classifier Synergy: Reward-Aligned Learning via Mutual Boosting Loop for FSCIL
著者: Ruitao Wu, Yifan Zhao, Guangyao Chen, Jia Li
分類: cs.CV
発表会議: NeurIPS 2025
論文リンク: https://arxiv.org/abs/2510.03608

要旨

少数ショット類増分学習（FSCIL）は、極めて少ないサンプルから新しいクラスを順序立てて学習しながら、先行知識を忘れないという課題に直面しており、この問題は安定性-可塑性のジレンマとデータ不足によって複雑化しています。現在のFSCIL手法は限定的なデータセットへの依存により、汎化能力に困難を抱えています。拡散モデルはデータ拡張への道を提供しますが、直接的な適用は意味論的ズレまたは無効な指導をもたらす可能性があります。本論文は、拡散モデルとFSCIL分類器間の相互促進ループを確立する拡散-分類器シナジー（DCS）フレームワークを提案します。DCSは報酬整列学習戦略を採用し、分類器の状態に由来する動的多面的報酬関数を通じて拡散モデルを指導します。この報酬システムは2つのレベルで動作します：特徴レベルではプロトタイプアンカー付き最大平均差異と次元分散マッチングにより意味論的一貫性と多様性を確保し、ロジットレベルでは信頼度再較正とセッション間混同認識メカニズムにより探索的画像生成を促進し、クラス間識別性を強化します。この共進化プロセスにおいて、生成画像は分類器を最適化し、改善された分類器の状態はより良い報酬信号を生成し、FSCILベンチマークテストで最先端の性能を達成し、知識保持と新規クラス学習能力を大幅に向上させます。

研究背景と動機

問題定義

少数ショット類増分学習（FSCIL）は極めてチャレンジングなタスクであり、モデルに以下を要求します：

順序立てた学習: 連続的なデータストリームから新しいクラスを学習する
少数ショット制約: 新しいクラスは少量の訓練サンプルのみを有する（通常5-shot）
忘却の回避: 先行して学習したクラスの知識を保持する

中核的課題

安定性-可塑性のジレンマ: 新しい知識の学習と旧知識の保持間のバランスを見出す
データ不足: 新しいクラスの極めて少ないサンプルが信頼性のない経験的リスク最小化をもたらす
汎化能力の不足: 既存手法は限定的な初期データセットへの過度な依存を示す

既存手法の限界

従来的なFSCIL手法は主に2つの問題を抱えています：

意味論的ズレと多様性不足: 拡散モデルから直接生成された画像は意味論的偏差または多様性不足を示す可能性がある
フィードバック機構の欠如: 拡散モデルが分類器の現在の状態に基づいて出力を調整するメカニズムが欠けている

中核的貢献

DCSフレームワークの提案: 拡散モデルとFSCIL分類器間の相互促進ループを初めて創出し、DASアルゴリズムを通じて報酬整列生成を実現
多層的報酬設計: 特徴レベルとロジットレベルで動作する多面的報酬関数を設計
- 特徴レベル：意味論的一貫性を確保し、クラス内多様性を促進
- ロジットレベル：探索的で汎化的なクラス内画像生成を指導し、クラス間識別性を強化
最先端性能: FSCILベンチマークデータセットで最先端の結果を達成し、旧クラス知識保持と新規クラス学習を大幅に改善

方法の詳細解説

タスク定義

FSCILは連続的なデータストリーム $D_{train} = \{D^t_{train}\}^T_{t=0}$ から順序立てて学習することを含みます。ここで：

各セッション $t$ は新しい互いに素なクラスセット $C_t$ の訓練サンプル $(x_i, y_i)$ を導入する
基本セッション $(t=0)$ は十分なデータを有し、増分セッション $(t>0)$ はN-way K-shot形式を採用する
モデルは $D^t_{train}$ で訓練後、すべての観察済みクラス $C^t_{seen} = \bigcup^t_{s=0} C_s$ で評価される必要がある

モデルアーキテクチャ

相互促進ループメカニズム

DCSの中核的思想は拡散モデルと分類器間の双方向フィードバックを確立することです：

報酬計算: 分類器 $\sigma$ （パラメータ $\theta$ ）の生成画像 $x$ への出力に基づいて複数の報酬成分 $R_i$ を計算
拡散モデル最適化: $\phi^* = \arg\max_\phi \sum_i R_i(\sigma_\theta(D(x;\phi)))$
分類器改善: $\theta^* = \arg\min_\theta L_{cls}(\sigma_\theta; x \cup D(x;\phi^*), y)$

特徴レベル報酬設計

1. プロトタイプアンカー付き最大平均差異報酬（R_PAMMD） $R_{PAMMD}(x_{gen}, I^{(c,N)}_{gen}) = -\alpha \frac{1}{N^2}\sum_{i=1}^N\sum_{j=1}^N k(z_i,z_j) + \beta \frac{1}{N}\sum_{i=1}^N k(z_i,\mu_c)$