2025-11-18T22:10:13.514792

Time-Varying Optimization for Streaming Data Via Temporal Weighting

Abrar, Michelusi, Larsson

Classical optimization theory deals with fixed, time-invariant objective functions. However, time-varying optimization has emerged as an important subject for decision-making in dynamic environments. In this work, we study the problem of learning from streaming data through a time-varying optimization lens. Unlike prior works that focus on generic formulations, we introduce a structured, \emph{weight-based} formulation that explicitly captures the streaming-data origin of the time-varying objective, where at each time step, an agent aims to minimize a weighted average loss over all the past data samples. We focus on two specific weighting strategies: (1) uniform weights, which treat all samples equally, and (2) discounted weights, which geometrically decay the influence of older data. For both schemes, we derive tight bounds on the ``tracking error'' (TE), defined as the deviation between the model parameter and the time-varying optimum at a given time step, under gradient descent (GD) updates. We show that under uniform weighting, the TE vanishes asymptotically with a $\mathcal{O}(1/t)$ decay rate, whereas discounted weighting incurs a nonzero error floor controlled by the discount factor and the number of gradient updates performed at each time step. Our theoretical findings are validated through numerical simulations.

academic

Time-Varying Optimization for Streaming Data Via Temporal Weighting

基本信息

论文ID: 2510.13052
标题: Time-Varying Optimization for Streaming Data Via Temporal Weighting
作者: Muhammad Faraz Ul Abrar (Arizona State University), Nicolò Michelusi (Arizona State University), Erik G. Larsson (Linköping University)
分类: cs.LG cs.AI cs.SY eess.SP eess.SY math.OC
发表时间: 2025年10月15日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2510.13052

摘要

传统优化理论处理的是固定、时不变的目标函数。然而，时变优化已成为动态环境中决策制定的重要主题。本文通过时变优化的视角研究流数据学习问题。与专注于通用公式的先前工作不同，我们引入了一种结构化的基于权重的公式，明确捕获时变目标的流数据来源，其中智能体在每个时间步旨在最小化所有过去数据样本的加权平均损失。我们专注于两种特定的加权策略：(1) 均匀权重，平等对待所有样本；(2) 折扣权重，几何衰减旧数据的影响。对于两种方案，我们在梯度下降(GD)更新下推导了"跟踪误差"(TE)的紧界，TE定义为模型参数与给定时间步的时变最优解之间的偏差。我们证明在均匀加权下，TE以O(1/t)的衰减率渐近消失，而折扣加权产生由折扣因子和每个时间步执行的梯度更新次数控制的非零误差下界。

研究背景与动机

问题定义

本文要解决的核心问题是在流数据环境中的时变优化学习问题。具体来说：

传统优化的局限性：经典机器学习优化静态目标函数，假设静态数据分布，但现实世界的解决方案在动态演化环境中运行
流数据的挑战：数据顺序到达，目标函数随时间演化，导致非平稳优化问题
计算约束：在实时或资源受限设置中，每个时间步只能执行有限次数的更新

重要性

该问题在多个关键应用领域具有重要意义：

自动驾驶车辆中的移动机器人跟踪
移动目标定位
投资组合优化
波动金融市场中的风险管理
时变系统动态的控制器适应

现有方法的局限性

通用公式的松散界限：大多数现有工作专注于通用时变公式(1)，忽略了流数据的固有结构，可能导致跟踪误差的松散界限
缺乏结构化分析：现有方法没有明确利用流数据的权重结构来获得更紧的性能界限
理论与实践脱节：持续学习领域的方法大多是经验性的，缺乏理论基础

核心贡献

提出结构化权重公式：引入明确捕获流数据结构的时变目标函数，定义为所有过去样本损失的加权平均
两种加权策略的理论分析：
- 均匀权重：证明跟踪误差以O(1/t)速率渐近消失
- 折扣权重：推导出明确的非零渐近跟踪误差界限
紧致界限推导：利用流数据结构获得比现有通用时变分析更紧的TE界限
理论与实验验证：通过数值仿真验证理论发现的有效性

方法详解

任务定义

考虑单个智能体(如边缘或云服务器)旨在跟踪时变机器学习模型参数的学习设置：

输入：在每次迭代t≥1，智能体接收新数据样本(xt, yt)
输出：模型参数wt，最小化累积数据的加权平均损失
约束：每个时间步只能执行E次梯度更新

核心数学公式

时变目标函数： $w_t^* = \arg\min_{w \in \mathbb{R}^d} F_t(w), \quad \text{其中} \quad F_t(w) = \sum_{i=1}^t a_i(t)f_i(w)$

其中：

$a_i(t)$ 是第i个样本在时间t的权重
$f_i(w)$ 是第i个数据样本的损失函数
权重满足： $0 \leq a_i(t) \leq 1$ 且 $\sum_{i=1}^t a_i(t) = 1$

梯度下降更新： $w_{t,k+1} = w_{t,k} - \eta\nabla F_{t+1}(w_{t,k}) = w_{t,k} - \eta\sum_{i=1}^{t+1} a_i(t+1)\nabla f_i(w_{t,k})$

跟踪误差定义： $\text{TE}(t) = \|w_t - w_t^*\|$

两种加权策略

1. 均匀权重

设置 $a_i(t) = 1/t$ 对所有 $i = 1, \ldots, t$ ，目标函数变为： $F_{t+1}(w) = \frac{t}{t+1}F_t(w) + \frac{1}{t+1}f_{t+1}(w)$

2. 折扣权重

使用几何折扣： $a_i(t) = \frac{1-\gamma}{1-\gamma^t}\gamma^{t-i}$ ，其中 $0 < \gamma < 1$ 是折扣因子。

技术创新点

结构化分析：与通用时变优化不同，明确利用流数据的权重结构
最小化器漂移分析：通过分析 $\|w_{i+1}^* - w_i^*\|$ 来理解目标函数变化
递归误差分析：建立递归关系来跟踪误差演化

理论分析

基础假设

假设1（L-光滑和μ-强凸）：每个数据样本的损失函数满足：

$\|\nabla f_t(x) - \nabla f_t(y)\| \leq L\|x-y\|$
$f_t(y) \geq f_t(x) + \nabla f_t(x)^T(y-x) + \frac{\mu}{2}\|y-x\|^2$

假设2（有界最小化器）：存在 $C > 0$ 使得 $\|w_t^*\| \leq C$ 对所有t成立。

主要理论结果

均匀权重的跟踪误差

命题1：对于均匀权重，跟踪误差满足： $\text{TE}(t) \leq \alpha^t\|w_0 - w_1^*\| + \frac{C'A}{t}$

其中 $\alpha = (1-\eta\mu)^E < 1$ ， $C' = (1+\sqrt{L/\mu})\frac{LC}{\mu}$ 。

关键结论：TE以O(1/t)速率衰减，渐近跟踪误差为零。

折扣权重的跟踪误差

命题2：对于折扣权重，渐近跟踪误差为： $\text{ATE}_\gamma = \limsup_{t\to\infty} \|w_t - w_t^*\| \leq \left(1+\sqrt{\frac{L}{\mu}}\right)\frac{LC}{\mu} \cdot \frac{(1-\gamma)\alpha}{1-\alpha}$

关键结论：存在非零误差下界，由折扣因子γ和梯度更新次数E控制。

实验设置

数据生成

使用标量二次损失函数： $f_t(w) = \frac{\mu}{2}(w-c_t)^2$

参数设置：

$c_t$ 按有界随机游走生成： $c_{t+1} = \max(-C_{\max}, \min(c_t + z_{t+1}, C_{\max}))$
$z_t \sim \mathcal{N}(0, \sigma^2)$ ， $C_{\max} = 100$ ， $\sigma^2 = 100$ ， $\mu = 0.1$