2025-11-16T12:19:12.111003

Towards Robust Knowledge Removal in Federated Learning with High Data Heterogeneity

Santi, Salami, Calderara
Nowdays, there are an abundance of portable devices capable of collecting large amounts of data and with decent computational power. This opened the possibility to train AI models in a distributed manner, preserving the participating clients' privacy. However, because of privacy regulations and safety requirements, elimination upon necessity of a client contribution to the model has become mandatory. The cleansing process must satisfy specific efficacy and time requirements. In recent years, research efforts have produced several knowledge removal methods, but these require multiple communication rounds between the data holders and the process coordinator. This can cause the unavailability of an effective model up to the end of the removal process, which can result in a disservice to the system users. In this paper, we introduce an innovative solution based on Task Arithmetic and the Neural Tangent Kernel, to rapidly remove a client's influence from a model.
academic

高データ異質性を伴う連邦学習における堅牢な知識削除に向けて

基本情報

  • 論文ID: 2510.13606
  • タイトル: Towards Robust Knowledge Removal in Federated Learning with High Data Heterogeneity
  • 著者: Riccardo Santi、Riccardo Salami、Simone Calderara(イタリア、モデナ・レッジョ・エミリア大学)
  • 分類: cs.LG(機械学習)
  • 発表日: 2025年10月15日(arXiv プレプリント)
  • 論文リンク: https://arxiv.org/abs/2510.13606v1

要旨

携帯デバイスの計算能力とデータ収集能力の向上に伴い、参加クライアントのプライバシーを保護しながら分散型AI モデルの訓練が可能になった。しかし、プライバシー規制とセキュリティ要件により、必要に応じてクライアントのモデルへの貢献を削除することが強制的な要件となっている。削除プロセスは特定の効率性と時間要件を満たす必要がある。近年の研究により複数の知識削除方法が提案されているが、これらの方法はデータ保有者とプロセス調整者間の複数ラウンドの通信を必要とし、削除プロセスの終了前に有効なモデルが利用不可となり、システムユーザーへのサービス中断をもたらす可能性がある。本論文はタスク算術(Task Arithmetic)とニューラルタンジェントカーネル(Neural Tangent Kernel)に基づき、クライアント影響の高速削除のための革新的なソリューションを提案する。

研究背景と動機

問題定義

本研究が解決する中核的な問題は**連邦忘却(Federated Unlearning, FU)**である:連邦学習環境において、特定クライアントのグローバルモデルへの貢献を迅速かつ効果的に削除しながら、モデル性能とプライバシー保護を維持すること。

問題の重要性

  1. 規制遵守:GDPR、CCPA等のプライバシー規制が「忘れられる権利」を要求
  2. セキュリティ要件:悪意のある、または汚染されたクライアントデータ貢献の削除が必要
  3. 医療等の機密分野:患者データ撤回要求
  4. サービス継続性:従来の方法は複数ラウンドの通信を必要とし、モデルの長時間の利用不可をもたらす

既存方法の限界

  • FedEraser等の方法は有効な削除モデルを生成するために複数ラウンドの通信が必要
  • 忘却プロセス中にモデルが利用不可となり、サービスが中断
  • 高データ異質性環境における堅牢性が不十分

研究動機

単一ラウンド通信内でクライアント忘却を完了でき、サービス中断時間を最小化しながら、高データ異質性環境で良好な性能を維持する方法を提案すること。

核心的貢献

  1. SATA方法の提案:タスク算術とニューラルタンジェントカーネルに基づく新型連邦忘却方法であり、単一ラウンド通信内でクライアント忘却を完了可能
  2. 革新的な双タスクベクトル機構:各クライアントが2つの独立したタスクベクトルを維持し、独立タスクベクトルは忘却操作専用
  3. NTK強化タスク算術:ニューラルタンジェントカーネル訓練を利用してタスクベクトルの分離性を向上させ、タスク間干渉を低減
  4. 包括的な実験検証:Cars-196およびResisc45データセット上で複数のベースライン方法と比較し、方法の有効性を実証

方法の詳細

タスク定義

入力

  • 事前訓練済みモデルパラメータ θ₀
  • K個のクライアントのローカルデータセット {D₁, D₂, ..., Dₖ}
  • 目標忘却クライアント tgt

出力

  • 削除後のグローバルモデル θ̂clean(目標クライアントの影響を削除)
  • 他のクライアント貢献を保持するモデル性能

制約条件

  • 単一ラウンド通信で忘却を完了
  • クライアントプライバシーを保護
  • 非目標クライアントデータ上のモデル性能を維持

モデルアーキテクチャ

1. 双タスクベクトル機構

各クライアントkは2つの独立したタスクベクトルを維持:

  • 主タスクベクトル τₖ:分散訓練プロセスに参加し、グローバルモデル計算に貢献
  • 独立タスクベクトル τₖˢᵃ:隔離状態を保ち、他のクライアント情報に汚染されず、将来の忘却操作専用

2. タスク算術フレームワーク

タスク算術理論に基づき、タスクベクトル τₜ = θₜ - θ₀ は特定タスク上での微調整後のパラメータ変化を表す。複数のタスクベクトルを組み合わせ:

θnew = θ₀ + ∑ᵢ₌₁ᵀ λᵢτᵢ

ここで λᵢ はスカラー重み係数。

3. 忘却操作

目標クライアント tgt を忘却する必要がある場合、グローバルモデルから単純にその独立タスクベクトルを減算:

θ̂clean = θ̂ - λtgt τₜₒₜˢᵃ

4. NTK強化

無限幅極限下でニューラルネットワーク学習動態を線形化するニューラルタンジェントカーネルの特性を利用:

flin(x; θ) = f(x; θ₀) + (θ - θ₀)ᵀ∇θf(x; θ₀)

NTK体制下での訓練によってタスクベクトルの分離性を向上させ、最終モデルは以下のように表現可能:

flin(x; θᵣ₋₁ + ∑ₖ₌₁ᴷ λₖτₖ - λtgt τₜₒₜˢᵃ) = f(x; θᵣ₋₁) + (∑ₖ₌₁ᴷ λₖτₖ - λtgt τₜₒₜˢᵃ)ᵀ∇θf(x; θᵣ₋₁)

技術的革新点

  1. 単一ラウンド忘却:複数ラウンド通信を必要とする従来の方法と異なり、SATAは単一ラウンド内で忘却を完了
  2. 独立タスクベクトル設計:独立タスクベクトルの維持により再訓練の必要性を回避
  3. NTK強化:タスクベクトル間の分離性を向上させ、忘却操作が他のクライアント貢献に与える影響を低減
  4. 理論的基礎:タスク算術に基づく堅実な理論的基礎により、解釈可能な忘却メカニズムを提供

実験設定

データセット

  1. Cars-196:196のカテゴリを含む自動車画像データセット。カテゴリは車両ブランド、モデル、年式に対応
  2. Resisc45:45のカテゴリを含むリモートセンシング画像データセット

両データセットはDirichlet分布を使用して非IID分割を行い、パラメータβがデータ傾斜度を制御(βが小さいほどデータ分布がより傾斜)。

評価指標

  1. グローバルモデル精度:テストセット上の分類精度
  2. 目標クライアント忘却効果:目標クライアントテストデータ上の精度(低いほど良好)
  3. 目標クライアント訓練データ忘却:目標クライアント訓練データ上の精度(低いほど良好)

比較方法

  1. Train From Scratch (TFS):事前訓練から再訓練(上界ベースライン)
  2. Continue to Train (CTT):目標クライアントを除外して継続訓練。破滅的忘却を利用
  3. FedEraser:履歴クライアント更新に基づくグローバルモデル再構成の最も知られたFU方法

実装詳細

  • モデル:OpenAI CLIPに基づくViT-B/16。分類ヘッドは固定
  • オプティマイザ:AdamW
  • 実験設定
    • Resisc45: 3ラウンドFL + 3ラウンドFU + 拡張PUラウンド
    • Cars-196: 10ラウンドFL + 10ラウンドFU + 5ラウンドPU
  • ハイパーパラメータ:グリッドサーチにより λtgt と学習率を最適化

実験結果

主要結果

忘却効果(表1)

目標クライアントテストセット精度において、SATA NTKはすべての設定で競争方法を大幅に上回る:

Resisc45データセット

  • β=0.05: FUステージ9.96% vs FedEraserの56.79%
  • β=0.1: FUステージ31.69% vs FedEraserの80.10%
  • β=0.5: FUステージ14.29% vs FedEraserの89.95%

Cars196データセット

  • β=0.05: FUステージ1.48% vs FedEraserの56.04%
  • β=0.1: FUステージ6.36% vs FedEraserの58.32%
  • β=0.5: FUステージ0.27% vs FedEraserの69.93%

グローバルモデル性能(表2)

SATAは忘却効果で優れた性能を示す一方、グローバルモデル精度では他の方法をやや下回る。特にFUステージで顕著:

性能低下分析

  • 高異質性(低β値)環境下でより明らかな性能低下
  • PUステージ後、性能は他の方法に近いレベルまで回復可能

アブレーション実験

NTK効果検証(表3-4)

NTK訓練の有無による効果を比較:

  • SATA vs SATA NTK:NTK訓練は常に忘却性能を向上
  • SAFA vs SAFA NTK:SAFA(Stand Alone FedAvg)はグローバル精度がより高いが、忘却効果はやや劣る

異なる忘却戦略の比較

  1. θ₀ + ∑ᵢ≠tgt λᵢτᵢˢᵃ:残存クライアントの独立タスクベクトルのみを使用
  2. θ̂ - λtgt τₜₒₜˢᵃ:グローバルモデルから目標クライアント貢献を減算(SATA方法)

結果はSATA方法が忘却効果において優れていることを示す。

ケース分析

図1の可視化結果から以下が観察される:

  • SATAは目標クライアント精度で最低値を実現
  • グローバル精度では低下があるものの、PUステージで迅速に回復
  • β値が高い(データ異質性が低い)ほど、方法の性能が良好

実験的発見

  1. 単一ラウンド忘却の有効性:SATAは単一ラウンド通信内で有効な忘却を実現
  2. NTKの重要性:NTK訓練はタスク算術効果を著しく向上
  3. データ異質性の影響:高異質性環境下で方法はより大きな課題に直面
  4. 迅速な回復能力:PUステージはモデル性能の迅速な回復が可能

関連研究

連邦学習アルゴリズム

  • FedAvg:基本的なパラメータ平均集約方法
  • FedProx:異質性処理のための近接項を導入
  • SCAFFOLD:制御変数を使用してクライアントドリフトを軽減
  • FedDC:ローカルドリフト推定と補正による更新調整

機械忘却

  • 集中型忘却:従来の機械忘却方法は連邦設定に適用不可
  • 連邦忘却:FedEraser、FedRecover、FedRecovery等の方法

タスク算術関連研究

  • 事前訓練済みモデル編集の線形操作フレームワーク
  • NTK強化タスク算術の理論的基礎

結論と考察

主要な結論

  1. 単一ラウンド通信内で連邦忘却を完了できる初の有効な方法を提案
  2. タスク算術とNTKに基づく理論的フレームワークは良好な解釈可能性を有する
  3. 複数のデータ異質性設定下で方法の有効性を検証
  4. 忘却プロセス中のサービス中断時間を著しく短縮

限界

  1. 高異質性の課題:高Dirichlet係数(低異質性)環境下での性能が制限
  2. グローバル性能低下:忘却プロセス中にグローバルモデル精度が低下
  3. 双ベクトルオーバーヘッド:追加の独立タスクベクトル維持により、ストレージと計算コストが増加
  4. ハイパーパラメータ感度:λtgt等のパラメータは慎重な調整が必要

今後の方向性

  1. 高Dirichlet係数下での性能制限の解決
  2. 他のモダリティと連邦設定への適応性の探索
  3. グローバルモデル性能保持のさらなる最適化
  4. 適応的ハイパーパラメータ選択方法の研究

深層的評価

利点

  1. 革新性が高い:単一ラウンド連邦忘却を初めて実現し、実際のアプリケーションにおける重要な問題を解決
  2. 理論的基礎が堅実:タスク算術とNTKに基づく堅実な理論的基礎
  3. 実用価値が高い:サービス中断時間を著しく短縮し、システム可用性を向上
  4. 実験が充分:複数のデータセットと異質性設定下での包括的な評価
  5. 方法が簡潔:核となる考え方は単純直観的で、理解と実装が容易

不足

  1. 性能トレードオフ:忘却効果とグローバル性能間に明らかなトレードオフが存在
  2. 異質性制限:特定の異質性設定下での性能が理想的でない
  3. リソースオーバーヘッド:双タスクベクトル機構により追加のストレージと計算コストが増加
  4. 理論分析不足:方法の収束性と理論的保証に関する深い分析が欠如

影響力

  1. 学術的貢献:連邦忘却分野に新しい研究方向を提供
  2. 実用価値:実際の展開における重要な問題を解決し、重要なアプリケーション前景を有する
  3. 技術的示唆:タスク算術の連邦学習への応用は示唆に富む

適用シナリオ

  1. 時間敏感なシステム:迅速な忘却応答が必要なリアルタイムサービス
  2. 高頻度忘却需要:クライアント削除が頻繁に必要な動的環境
  3. リソース充足環境:双ベクトルストレージオーバーヘッドを負担可能なシステム
  4. 中低異質性環境:データ分布が比較的均一な連邦学習シナリオ

参考文献

本論文は34篇の関連文献を引用しており、連邦学習、機械忘却、タスク算術等の複数の関連分野における重要な研究をカバーし、研究に充分な理論的基礎と比較ベースラインを提供している。


総合評価:これは連邦忘却分野における重要な貢献を有する論文であり、提案された単一ラウンド忘却方法は実際のアプリケーションにおける重要な問題を解決する。いくつかの側面で限界が存在するものの、その革新性と実用価値により、本分野における重要な進展となっている。