Classical optimization theory deals with fixed, time-invariant objective functions. However, time-varying optimization has emerged as an important subject for decision-making in dynamic environments. In this work, we study the problem of learning from streaming data through a time-varying optimization lens. Unlike prior works that focus on generic formulations, we introduce a structured, \emph{weight-based} formulation that explicitly captures the streaming-data origin of the time-varying objective, where at each time step, an agent aims to minimize a weighted average loss over all the past data samples. We focus on two specific weighting strategies: (1) uniform weights, which treat all samples equally, and (2) discounted weights, which geometrically decay the influence of older data. For both schemes, we derive tight bounds on the ``tracking error'' (TE), defined as the deviation between the model parameter and the time-varying optimum at a given time step, under gradient descent (GD) updates. We show that under uniform weighting, the TE vanishes asymptotically with a $\mathcal{O}(1/t)$ decay rate, whereas discounted weighting incurs a nonzero error floor controlled by the discount factor and the number of gradient updates performed at each time step. Our theoretical findings are validated through numerical simulations.
論文ID : 2510.13052タイトル : Time-Varying Optimization for Streaming Data Via Temporal Weighting著者 : Muhammad Faraz Ul Abrar (アリゾナ州立大学)、Nicolò Michelusi (アリゾナ州立大学)、Erik G. Larsson (リンショーピング大学)分類 : cs.LG cs.AI cs.SY eess.SP eess.SY math.OC発表日 : 2025年10月15日 (arXiv プレプリント)論文リンク : https://arxiv.org/abs/2510.13052 従来の最適化理論は固定的で時間不変の目的関数を扱っています。しかし、時変最適化は動的環境における意思決定の重要なテーマとなっています。本論文は時変最適化の観点からストリーミングデータ学習問題を研究しています。一般的な定式化に焦点を当てた先行研究とは異なり、時変目的の構造化された重み付けベースの定式化を導入し、ストリーミングデータソースを明示的に捉えています。ここで、エージェントは各時間ステップで過去のすべてのデータサンプルの加重平均損失を最小化することを目指しています。2つの特定の重み付け戦略に焦点を当てています:(1) 均一重み付け(すべてのサンプルを等しく扱う)、(2) 割引重み付け(旧データの影響を幾何学的に減衰させる)。両方のスキームについて、勾配降下法(GD)更新下での「追跡誤差」(TE)の厳密な界を導出しました。TEはモデルパラメータと与えられた時間ステップの時変最適解との偏差として定義されます。均一加重下では、TEはO(1/t)の減衰率で漸近的に消失することを証明しました。一方、割引加重は割引因子と各時間ステップで実行される勾配更新回数によって制御される非ゼロの誤差下界を生成します。
本論文が解決する核心的な問題は、ストリーミングデータ環境における時変最適化学習問題です。具体的には:
従来の最適化の限界 :古典的機械学習は静的目的関数を最適化し、静的データ分布を仮定していますが、現実世界のソリューションは動的に進化する環境で動作しますストリーミングデータの課題 :データは順序立てて到着し、目的関数は時間とともに進化し、非定常最適化問題をもたらします計算上の制約 :リアルタイムまたはリソース制限設定では、各時間ステップで限定回数の更新のみが実行可能ですこの問題は複数の重要な応用分野で重要な意義を持ちます:
自動運転車両における移動ロボット追跡 移動目標の位置推定 ポートフォリオ最適化 変動する金融市場におけるリスク管理 時変システムダイナミクスのコントローラ適応 一般的定式化の緩い界 :ほとんどの既存研究は一般的な時変定式化に焦点を当てており、ストリーミングデータの固有構造を無視し、追跡誤差の緩い界をもたらす可能性があります構造化分析の欠如 :既存手法はストリーミングデータの重み付け構造を明示的に活用してより厳密な性能界を得ていません理論と実践の乖離 :継続学習分野の手法はほとんど経験的であり、理論的基礎が不足しています構造化重み付け定式化の提案 :ストリーミングデータの構造を明示的に捉える時変目的関数を導入し、すべての過去のサンプル損失の加重平均として定義2つの重み付け戦略の理論分析 :
均一重み付け:追跡誤差がO(1/t)速度で漸近的に消失することを証明 割引重み付け:明示的な非ゼロ漸近追跡誤差界を導出 厳密な界の導出 :ストリーミングデータ構造を活用して、既存の一般的な時変分析よりも厳密なTE界を取得理論と実験の検証 :数値シミュレーションを通じて理論的発見の有効性を検証単一エージェント(エッジまたはクラウドサーバーなど)が時変機械学習モデルパラメータを追跡することを目指す学習設定を考えます:
入力 :各反復t≥1で、エージェントは新しいデータサンプル(x_t, y_t)を受け取ります出力 :モデルパラメータw_t、累積データの加重平均損失を最小化制約 :各時間ステップで最大E回の勾配更新のみ実行可能時変目的関数 :
w t ∗ = arg min w ∈ R d F t ( w ) , ここで F t ( w ) = ∑ i = 1 t a i ( t ) f i ( w ) w_t^* = \arg\min_{w \in \mathbb{R}^d} F_t(w), \quad \text{ここで} \quad F_t(w) = \sum_{i=1}^t a_i(t)f_i(w) w t ∗ = arg min w ∈ R d F t ( w ) , ここで F t ( w ) = ∑ i = 1 t a i ( t ) f i ( w )
ここで:
a i ( t ) a_i(t) a i ( t ) は時間tにおける第iサンプルの重みf i ( w ) f_i(w) f i ( w ) は第iデータサンプルの損失関数重みは以下を満たします:0 ≤ a i ( t ) ≤ 1 0 \leq a_i(t) \leq 1 0 ≤ a i ( t ) ≤ 1 かつ∑ i = 1 t a i ( t ) = 1 \sum_{i=1}^t a_i(t) = 1 ∑ i = 1 t a i ( t ) = 1 勾配降下法更新 :
w t , k + 1 = w t , k − η ∇ F t + 1 ( w t , k ) = w t , k − η ∑ i = 1 t + 1 a i ( t + 1 ) ∇ f i ( w t , k ) w_{t,k+1} = w_{t,k} - \eta\nabla F_{t+1}(w_{t,k}) = w_{t,k} - \eta\sum_{i=1}^{t+1} a_i(t+1)\nabla f_i(w_{t,k}) w t , k + 1 = w t , k − η ∇ F t + 1 ( w t , k ) = w t , k − η ∑ i = 1 t + 1 a i ( t + 1 ) ∇ f i ( w t , k )
追跡誤差の定義 :
TE ( t ) = ∥ w t − w t ∗ ∥ \text{TE}(t) = \|w_t - w_t^*\| TE ( t ) = ∥ w t − w t ∗ ∥
すべてのi = 1 , … , t i = 1, \ldots, t i = 1 , … , t に対してa i ( t ) = 1 / t a_i(t) = 1/t a i ( t ) = 1/ t を設定し、目的関数は以下のようになります:
F t + 1 ( w ) = t t + 1 F t ( w ) + 1 t + 1 f t + 1 ( w ) F_{t+1}(w) = \frac{t}{t+1}F_t(w) + \frac{1}{t+1}f_{t+1}(w) F t + 1 ( w ) = t + 1 t F t ( w ) + t + 1 1 f t + 1 ( w )
幾何学的割引を使用します:a i ( t ) = 1 − γ 1 − γ t γ t − i a_i(t) = \frac{1-\gamma}{1-\gamma^t}\gamma^{t-i} a i ( t ) = 1 − γ t 1 − γ γ t − i 、ここで0 < γ < 1 0 < \gamma < 1 0 < γ < 1 は割引因子です。
構造化分析 :一般的な時変最適化とは異なり、ストリーミングデータの重み付け構造を明示的に活用最小化子ドリフト分析 :∥ w i + 1 ∗ − w i ∗ ∥ \|w_{i+1}^* - w_i^*\| ∥ w i + 1 ∗ − w i ∗ ∥ の分析を通じて目的関数の変化を理解再帰的誤差分析 :誤差進化を追跡するための再帰関係を確立仮定1(L-滑らかさとμ-強凸性) :各データサンプルの損失関数は以下を満たします:
∥ ∇ f t ( x ) − ∇ f t ( y ) ∥ ≤ L ∥ x − y ∥ \|\nabla f_t(x) - \nabla f_t(y)\| \leq L\|x-y\| ∥∇ f t ( x ) − ∇ f t ( y ) ∥ ≤ L ∥ x − y ∥ f t ( y ) ≥ f t ( x ) + ∇ f t ( x ) T ( y − x ) + μ 2 ∥ y − x ∥ 2 f_t(y) \geq f_t(x) + \nabla f_t(x)^T(y-x) + \frac{\mu}{2}\|y-x\|^2 f t ( y ) ≥ f t ( x ) + ∇ f t ( x ) T ( y − x ) + 2 μ ∥ y − x ∥ 2 仮定2(有界最小化子) :∥ w t ∗ ∥ ≤ C \|w_t^*\| \leq C ∥ w t ∗ ∥ ≤ C がすべてのtに対して成立するようなC > 0 C > 0 C > 0 が存在します。
命題1 :均一重み付けに対して、追跡誤差は以下を満たします:
TE ( t ) ≤ α t ∥ w 0 − w 1 ∗ ∥ + C ′ A t \text{TE}(t) \leq \alpha^t\|w_0 - w_1^*\| + \frac{C'A}{t} TE ( t ) ≤ α t ∥ w 0 − w 1 ∗ ∥ + t C ′ A
ここでα = ( 1 − η μ ) E < 1 \alpha = (1-\eta\mu)^E < 1 α = ( 1 − η μ ) E < 1 、C ′ = ( 1 + L / μ ) L C μ C' = (1+\sqrt{L/\mu})\frac{LC}{\mu} C ′ = ( 1 + L / μ ) μ L C です。
重要な結論 :TEはO(1/t)速度で減衰し、漸近追跡誤差はゼロです。
命題2 :割引重み付けに対して、漸近追跡誤差は以下を満たします:
ATE γ = lim sup t → ∞ ∥ w t − w t ∗ ∥ ≤ ( 1 + L μ ) L C μ ⋅ ( 1 − γ ) α 1 − α \text{ATE}_\gamma = \limsup_{t\to\infty} \|w_t - w_t^*\| \leq \left(1+\sqrt{\frac{L}{\mu}}\right)\frac{LC}{\mu} \cdot \frac{(1-\gamma)\alpha}{1-\alpha} ATE γ = lim sup t → ∞ ∥ w t − w t ∗ ∥ ≤ ( 1 + μ L ) μ L C ⋅ 1 − α ( 1 − γ ) α
重要な結論 :非ゼロの誤差下界が存在し、割引因子γと勾配更新回数Eによって制御されます。
スカラー二次損失関数を使用します:f t ( w ) = μ 2 ( w − c t ) 2 f_t(w) = \frac{\mu}{2}(w-c_t)^2 f t ( w ) = 2 μ ( w − c t ) 2
パラメータ設定:
c t c_t c t は有界ランダムウォークで生成:c t + 1 = max ( − C max , min ( c t + z t + 1 , C max ) ) c_{t+1} = \max(-C_{\max}, \min(c_t + z_{t+1}, C_{\max})) c t + 1 = max ( − C m a x , min ( c t + z t + 1 , C m a x )) z t ∼ N ( 0 , σ 2 ) z_t \sim \mathcal{N}(0, \sigma^2) z t ∼ N ( 0 , σ 2 ) 、C max = 100 C_{\max} = 100 C m a x = 100 、σ 2 = 100 \sigma^2 = 100 σ 2 = 100 、μ = 0.1 \mu = 0.1 μ = 0.1 二乗平均平方根追跡誤差 最大(最悪ケース)追跡誤差 1000回の独立実行の統計結果 O(1/t)減衰の検証 :実験は理論予測と一致する明確な単調減衰を示しています勾度更新回数の影響 :Eを10から20に増加させると、経験的TEの改善係数は約0.09で、理論予測と定量的に一致しています長期的動作 :大きなtに対して、TEは最小化子ドリフトの残差誤差によって支配されます非ゼロ誤差下界 :すべての誤差指標は消失しない漸近誤差下界に収束します割引因子の影響 :より大きなγはより低い漸近追跡誤差をもたらします理論検証 :γ=0.99の場合、TEは均一重み付けの場合に近く、理論分析を検証しています命題3 :ATE γ ≤ ϵ \text{ATE}_\gamma \leq \epsilon ATE γ ≤ ϵ を保証するには、以下を実行する必要があります:
E ≥ ln ( ϵ C ′ ( 1 − γ ) + ϵ ) ln ( 1 − η μ ) E \geq \frac{\ln\left(\frac{\epsilon}{C'(1-\gamma)+\epsilon}\right)}{\ln(1-\eta\mu)} E ≥ l n ( 1 − η μ ) l n ( C ′ ( 1 − γ ) + ϵ ϵ )
回の勾配更新、O(ln(1/ε))の勾配反復複雑度をもたらします。
初期の研究 :ニュートン型アルゴリズムは二階情報を活用して指数収束を実現有界ドリフト条件 :∥ w t + 1 ∗ − w t ∗ ∥ ≤ C \|w_{t+1}^* - w_t^*\| \leq C ∥ w t + 1 ∗ − w t ∗ ∥ ≤ C を仮定する手法予測-補正スキーム :予測と勾配補正を組み合わせた手法タスク列学習 :タスク列上でMLモデルを学習カタストロフィック忘却 :新しいタスク学習時に旧タスク性能が低下する課題経験的手法 :既存手法はほとんど経験的で、理論的基礎が不足しています本論文は初めて時変最適化と継続学習を理論的観点から橋渡しし、明示的なストリーミングデータ構造分析を提供しています。
均一重み付け :O(1/t)減衰の追跡誤差を実現し、漸近的に完全追跡割引重み付け :明示的に定量化可能な非ゼロ漸近誤差を生成し、旧データの忘却を反映構造化分析 :ストリーミングデータ構造を活用して、一般的手法より厳密な界を取得均一対割引 :均一重み付けは各新規サンプルの影響をO(1/t)に希釈し、割引重み付けはO(1)のドリフトを維持重み収束性 :γ→1のとき、割引重み付けは均一重み付けに収束し、対応してATE_γ→0計算予算トレードオフ :より多くの勾度更新Eは追跡誤差を減少させますが、計算コストを増加させますメモリ仮定 :すべての履歴サンプル勾配へのアクセスを仮定し、メモリ制約を考慮していません特定の損失関数 :理論分析はL-滑らかさとμ-強凸性の仮定に基づいています有界最小化子 :最小化子が均一に有界であることを仮定する必要がありますメモリ制限分析 :メモリ制約下での時変学習を研究より一般的な損失関数 :非凸またはその他のタイプの損失への拡張分散設定 :フェデレーテッド学習などの分散環境での応用適応的重み付け :データ駆動の動的重み付け戦略を研究理論的厳密性 :完全な数学分析と厳密な界の導出を提供構造化アプローチ :ストリーミングデータ構造を明示的に活用し、一般的手法より正確な結果を取得実用的価値 :2つの重み付け戦略は異なる実際の応用シナリオに対応実験検証 :数値結果は理論予測と高度に一致明確な表現 :論文は良好に組織され、数学的導出は明確です仮定の制限 :L-滑らかさとμ-強凸性の仮定は実際の応用では過度に厳格かもしれませんメモリ要件 :すべての履歴勾配を保存する必要があり、大規模応用では非現実的です単一エージェント :単一エージェント設定のみを考慮し、マルチエージェントまたは分散シナリオを含みません簡単な実験 :実験は単純な二次損失関数を使用し、複雑なシナリオの検証が不足しています理論的貢献 :時変最適化と継続学習に重要な理論的基礎を提供方法論的価値 :構造化分析手法は他の時変学習問題に一般化可能実際の応用 :オンライン学習と適応システム設計に理論的指導を提供再現性 :理論結果と実験設定の説明が詳細で、再現が容易ですオンライン学習システム :新しいデータに継続的に適応する必要がある機械学習システム適応制御 :時変システムのコントローラ設計金融モデリング :市場変化に適応する必要がある投資戦略IoTアプリケーション :センサーネットワークにおけるリアルタイムデータ処理推奨システム :ユーザー嗜好の変化に適応する必要がある推奨アルゴリズム論文は時変最適化、継続学習、凸最適化などの重要分野の40の関連文献を引用し、研究に堅実な理論的基礎を提供しています。