Continual learning the ability of a neural network to learn multiple sequential tasks without catastrophic forgetting remains a central challenge in developing adaptive artificial intelligence systems. While deep learning models achieve state-of-the-art performance across domains, they remain limited by overfitting and forgetting. This paper introduces Cluster-Aware Replay (CAR), a hybrid continual learning framework that integrates a small, class-balanced replay buffer with a regularization term based on Inter-Cluster Fitness (ICF) in the feature space. The ICF loss penalizes overlapping feature representations between new and previously learned tasks, encouraging geometric separation in the latent space and reducing interference. Using the standard five-task Split CIFAR-10 benchmark with a ResNet-18 backbone, initial experiments demonstrate that CAR better preserves earlier task performance compared to fine-tuning alone. These findings are preliminary but highlight feature-space regularization as a promising direction for mitigating catastrophic forgetting.
論文ID : 2510.07648タイトル : Continual Learning for Adaptive AI Systems著者 : Md Hasibul Amin, Tamzid Tanvi Alam分類 : cs.LG(機械学習)発表日時 : 2025年10月12日(arXiv v2)論文リンク : https://arxiv.org/abs/2510.07648 継続学習——神経ネットワークが破滅的忘却を起こさずに複数の連続タスクを学習する能力——は、適応型人工知能システムの開発における中核的な課題のままである。深層学習モデルは様々な領域で最先端の性能を達成しているが、過適合と忘却の制限を受けている。本論文では、クラスタリング認識リプレイ(CAR)を紹介する。これは小規模でクラスバランスの取れたリプレイバッファを、特徴空間内のクラスタ間適応度(ICF)に基づく正則化項と組み合わせたハイブリッド継続学習フレームワークである。ICF損失は新しいタスクと以前学習したタスク間で重複する特徴表現にペナルティを課し、潜在空間における幾何学的分離を促進し、干渉を減少させる。
本研究は神経ネットワークにおける破滅的忘却 の問題に対処することを目的としている。これはモデルが新しいタスクを学習する際に、以前学習した知識を急速に失うことである。これは生物学的知能と対照的であり、人間の脳は先前のスキルを忘却することなく継続的に学習することができる。
実務的応用の必要性 :現実世界のAIシステムは異なる時点で新しいタスクを学習する必要があり、例えば推奨システムはユーザー嗜好の変化に適応する必要があるリソース効率 :モデル全体の再トレーニングは高コストであり、継続学習は段階的更新を実現できる生物学的インスピレーション :人間の脳の学習メカニズムのシミュレーションは人工知能発展の重要な方向である正則化手法 :EWCなどはメモリ効率的だが、タスク差が大きい場合は可塑性を制限するリプレイ手法 :効果的だがメモリとプライバシーの問題が存在するパラメータ分離 :Progressive Networksなどは忘却を保証するが、モデルサイズの急速な増加につながる特徴空間手法 :比較的未探索で、発展の余地がある著者は既存手法がパラメータまたは出力層での制約に主に焦点を当てており、モデル内部の特徴空間の幾何学的構造への関心が不足していると考えている。タスク間の特徴空間分離を明示的に制御することは、破滅的忘却を緩和する効果的な手段である可能性がある。
CARフレームワークの提案 :小規模リプレイバッファと特徴空間正則化を組み合わせたハイブリッド手法ICF損失の設計 :クラスタ間適応度に基づく新規な正則化項で、タスク間特徴分離を促進幾何学的制約の革新 :パラメータ正則化のみでなく、特徴空間の幾何学的構造を強調実験検証 :Split CIFAR-10ベンチマークで手法の有効性を検証新しい方向の開拓 :特徴空間認識型継続学習研究に新しい視点を提供タスク列 T = ( T 1 , . . . , T N ) T = (T_1, ..., T_N) T = ( T 1 , ... , T N ) が与えられた場合、目標はタスク T N T_N T N を学習した後、すべての先前タスク T i T_i T i (i < N i < N i < N )で良好な性能を維持することである。
ネットワーク構造 :
ResNet-18をバックボーンネットワークとして採用 特徴抽出器:f θ ( ⋅ ) f_θ(·) f θ ( ⋅ ) (グローバル平均プーリング層まで) 分類器:c φ ( ⋅ ) c_φ(·) c φ ( ⋅ ) (最終全結合層) 入力 x x x に対して、埋め込みは z = f θ ( x ) z = f_θ(x) z = f θ ( x ) 、ロジットは y = c φ ( z ) y = c_φ(z) y = c φ ( z ) 重心計算 :
タスク T k T_k T k のトレーニング完了後、各クラス c c c に対して重心を計算:
μ c = 1 ∣ D c ∣ ∑ x i ∈ D c f θ ( x i ) ∥ f θ ( x i ) ∥ 2 \mu_c = \frac{1}{|D_c|} \sum_{x_i \in D_c} \frac{f_θ(x_i)}{\|f_θ(x_i)\|_2} μ c = ∣ D c ∣ 1 ∑ x i ∈ D c ∥ f θ ( x i ) ∥ 2 f θ ( x i )
ICF損失 :
タスク T k + 1 T_{k+1} T k + 1 をトレーニングする際、各サンプル x j x_j x j に対してすべての先前学習クラスの重心からの分離を促進:
L I C F = − ∑ c ∈ C p r e v ∥ f θ ( x j ) ∥ f θ ( x j ) ∥ 2 − μ c ∥ 2 L_{ICF} = -\sum_{c \in C_{prev}} \left\|\frac{f_θ(x_j)}{\|f_θ(x_j)\|_2} - \mu_c\right\|_2 L I CF = − ∑ c ∈ C p re v ∥ f θ ( x j ) ∥ 2 f θ ( x j ) − μ c 2
ここで C p r e v C_{prev} C p re v は先前タスクのクラス集合を表す。
総合損失 :
L t o t a l = L C E + λ ⋅ L I C F L_{total} = L_{CE} + λ · L_{ICF} L t o t a l = L CE + λ ⋅ L I CF
ここで L C E L_{CE} L CE は現在のタスクサンプルとリプレイサンプルで計算された交差エントロピー損失、λ λ λ は可塑性と安定性のバランスを取る超パラメータである。
特徴空間幾何学的制約 :従来手法がパラメータまたはロジットに焦点を当てるのに対し、CARは特徴空間に直接幾何学的制約を適用正規化距離度量 :L2正規化特徴ベクトルを使用して距離を計算し、度量の一貫性を確保重心駆動分離 :先前タスク重心との距離を最大化することでタスク間分離を実現ハイブリッド戦略 :リプレイと正則化の利点を組み合わせ、相互に補強Split CIFAR-10 :標準的な5タスク設定で、各タスクは2つのクラスを含む分割方式 :Task 1: クラス0-1、Task 2: クラス2-3、...、Task 5: クラス8-9バックボーンネットワーク :ResNet-18、ゼロから訓練オプティマイザ :Adam、学習率0.001トレーニング設定 :各タスク20エポック、バッチサイズ32リプレイバッファ :クラスあたり20サンプル平均精度 :すべてのタスク完了後の各タスク上の平均精度タスク特定精度 :各タスクの保持状況の分析忘却程度 :タスクピーク精度と最終精度の差Fine-tuning :単純なファインチューニングベースラインEWC :弾性重み統合iCaRL :増分分類器と表現学習SCR :対比的リプレイ手法性能比較 (Split CIFAR-10平均精度):
Fine-tuning: 20-25% EWC: 35-45% iCaRL: 65-75% SCR: >80% CAR : 39.8%タスク特定性能 :
完了後 T1 T2 T3 T4 T5 平均 Task 1 57 - - - - 57.0 Task 2 50 67 - - - 58.5 Task 3 28 10 72 - - 36.7 Task 4 12 12 40 70 - 33.5 Task 5 12 12 40 65 70 39.8
初期保持効果が良好 :Task 2完了後、Task 1精度は7ポイント低下のみ(57%→50%)複雑度増加時の劣化 :Task 3後に顕著な低下が見られ、現在の正則化重み λ λ λ が不十分である可能性を示唆単純ベースラインより優位 :fine-tuningより明らかに優位だが、成熟したリプレイ手法とはまだ差がある手法 平均精度 Fine-tuning(リプレイなし、λ=0) 22.0% リプレイのみ(λ=0) 28.5% ICFのみ(リプレイなし) 25.9% CAR(リプレイ+ICF) 51.1%
分析 :ICF損失はリプレイ手法に追加の改善をもたらし、特徴空間正則化の有効性を検証している。
各タスクの忘却程度(ピーク精度 - 最終精度):
Task 1: 45ポイント Task 2: 55ポイント Task 3: 32ポイント Task 4: 5ポイント 明らかな時間勾配効果を示し、より早いタスクほど忘却が深刻である。
正則化手法 :EWC:Fisher情報行列に基づく重要度推定 SI:パラメータが損失変化に与える貢献をオンライン測定 知識蒸留:ロジット一致による先前機能の保持 リプレイ手法 :選択的リプレイ:サンプル選択戦略の改善 iCaRL:増分学習のためのクラスサンプル維持 GEM:勾配投影で過去サンプルの損失増加を回避 生成的リプレイ :GANs/VAEsを使用した疑似サンプル合成 明示的保存の必要性を減らすが訓練複雑性を増加 パラメータ分離 :Progressive Networks:各タスクに独立容量を割当 PackNet:反復的剪定と重み割当 本論文はLiuらの重心距離蒸留およびGuらの線形可分性保持研究と関連しているが、CARはクラスタ間分離を明示的に最大化することで異なる視点を提供している。
特徴空間正則化の有効性 :ICF損失は初期タスクの忘却を減少させることができるハイブリッド手法の利点 :リプレイと特徴制約の組み合わせは単独使用より効果的適応的調整の必要性 :タスク複雑度の増加に伴い、正則化強度を動的に調整する必要がある幾何学的視点の有望性 :特徴空間幾何学の観点から継続学習問題を解決することは有望である性能ギャップ :最先端手法(SCRなど)とはまだ顕著な差がある超パラメータ感度 :λ λ λ の選択は性能に大きな影響を与え、より良い適応メカニズムが必要スケーラビリティ問題 :比較的単純なSplit CIFAR-10でのみ検証され、より大規模な検証が必要理論分析不足 :ICF損失の収束性と最適性に関する理論的保証が欠ける体系的超パラメータ調整 :適応的 λ λ λ 調整メカニズムの開発距離認識目標 :より複雑な距離度量と分離目標の探索より大規模データセットへの拡張 :CIFAR-100、ImageNetなどでの検証理論的基礎 :特徴空間分離と忘却緩和の理論的関連性の確立革新的視点 :特徴空間幾何学の観点から継続学習問題に切り込み、新しい思考を提供手法の簡潔性 :ICF損失の設計は単純で直感的、理解と実装が容易合理的な実験設計 :適切なアブレーション実験と比較分析を含む誠実な報告 :著者は率直にこれが初期段階の結果であり、さらなる改善が必要であることを認めている性能の限界 :標準ベンチマークでの性能は十分に優れておらず、SOTA手法との差が大きい実験規模の小ささ :Split CIFAR-10でのみ検証され、より広範な実験が欠ける理論的深さの不足 :手法の有効性に関する深い理論分析が欠ける超パラメータ依存性 :手法は λ λ λ の選択に対して比較的敏感で、実用性が制限される学術的貢献 :継続学習分野に新しい研究方向を提供実用的価値 :現段階では実用的価値は限定的で、さらなる改善が必要再現性 :手法の説明は明確で、実装は比較的単純示唆性 :後続研究に有価値な思考を提供リソース制約環境 :リプレイバッファが小さい場面タスク類似性が高い場合 :特徴空間分離効果がより顕著なタスク研究プロトタイプ :特徴空間正則化研究の出発点として教育目的 :概念が明確で、教育デモンストレーションに適している論文は継続学習分野の重要な研究を引用しており、以下を含む:
Kirkpatrick et al. (2017): EWC手法 Rebuffi et al. (2017): iCaRL手法 Lopez-Paz & Ranzato (2017): GEM手法 Liu et al. (2023): 重心距離蒸留 Gu et al. (2023): 線形可分性保持 総合評価 :これは特徴空間幾何学の観点から継続学習問題を解決する新しい思考を提案する探索的研究である。現在の実験結果はまだ十分に優れていないが、この分野に有価値な研究方向を提供している。著者は方法の限界を率直に認め、明確な改善方向を提案しており、良好な学術的態度を示している。