2025-11-22T22:52:16.673046

Finite sample learning of moving targets

Vertovec, Margellos, Prandini

We consider a moving target that we seek to learn from samples. Our results extend randomized techniques developed in control and optimization for a constant target to the case where the target is changing. We derive a novel bound on the number of samples that are required to construct a probably approximately correct (PAC) estimate of the target. Furthermore, when the moving target is a convex polytope, we provide a constructive method of generating the PAC estimate using a mixed integer linear program (MILP). The proposed method is demonstrated on an application to autonomous emergency braking.

academic

Finite sample learning of moving targets

基本信息

论文ID: 2408.04406
标题: Finite sample learning of moving targets
作者: Nikolaus Vertovec (University of Oxford), Kostas Margellos (University of Oxford), Maria Prandini (Politecnico di Milano)
分类: math.OC (Optimization and Control), cs.LG (Machine Learning)
提交时间: 2024年8月 (v3: 2025年11月10日)
论文链接: https://arxiv.org/abs/2408.04406

摘要

本文研究从样本中学习移动目标（moving target）的问题。研究将控制和优化领域中针对恒定目标开发的随机化技术扩展到目标变化的情况。论文推导了构造概率近似正确（PAC）目标估计所需样本数量的新界。此外，当移动目标是凸多面体时，提供了使用混合整数线性规划（MILP）生成PAC估计的构造性方法。该方法在自动紧急制动应用中得到验证。

研究背景与动机

要解决的问题

传统的统计学习理论（如PAC学习）假设目标标记函数是固定不变的。然而，在许多实际应用中，学习目标会随时间变化。本文研究如何从有限样本中学习这种结构化变化的标记机制，并提供概率保证。

问题的重要性

实际需求：在控制系统、机器人、自动驾驶等领域，环境和系统参数会随时间漂移（如制动性能退化、车辆质量变化）
理论挑战：经典PAC理论无法直接应用于移动目标，需要新的理论框架
安全关键应用：在自动驾驶等安全关键系统中，需要提供严格的概率保证

现有方法的局限性

场景方法（Scenario Approach）：主要针对恒定目标的不确定性优化，未考虑目标随时间变化
VC理论：需要有限的VC维度，且主要针对静态目标
已有移动目标学习：如2,3,15,20,22,23等工作，但多数提供期望值评估而非PAC类型的双层概率保证
缺乏构造性方法：现有分析多为存在性证明，缺少实际构造假设的算法

研究动机

本文旨在：

为移动目标学习提供PAC类型的有限样本复杂度界
开发构造性算法（MILP）来生成满足理论保证的假设
纠正文献20中的数学疏漏（关于目标变化下界的处理）

核心贡献

先验样本复杂度界：在Section 3中提供了生成PAC假设所需的最小样本数量的先验界（Theorem 2），扩展了20的工作但采用PAC类型结果而非期望值评估
数学修正：纠正了20, Theorem 1中的数学疏漏，引入目标变化的下界μ（而非仅上界μ̄）
构造性MILP方法：在Section 4中提出首个构造性方法，使用混合整数线性规划生成凸多面体类别的最小分歧假设（这是首次针对追踪问题的构造性方法）
实际应用验证：在Section 5中通过自动紧急制动（AEB）系统案例验证理论结果，并提出样本剔除策略提高计算效率（剔除95%的冗余样本）

方法详解

任务定义

输入：

标记的m-多样本：{(x₁, f₁(x₁)), ..., (xₘ, fₘ(xₘ))}
样本xᵢ ∈ X ⊆ ℝⁿ独立同分布地从概率分布P中抽取
每个样本由不同的目标函数fᵢ: X → {0,1}标记

输出：

假设hₘ: X → {0,1}，用于预测下一个样本x的标签fₘ₊₁(x)

约束条件：

所有目标和假设函数属于同一类H，具有有限VC维度（Assumption 1）
目标变化满足结构化假设：平均分歧概率μ = (1/m)∑ᵢ₌₁ᵐ er(fᵢ, fₘ₊₁)满足μ ≤ μ ≤ μ̄（Assumption 2）

目标：找到m₀(ε, δ)使得对m ≥ m₀，构造的假设满足：

Pᵐ{(x₁,...,xₘ) ∈ Xᵐ : P{x ∈ X : hₘ(x) ≠ fₘ₊₁(x)} ≤ ε₀ + ε} ≥ 1-δ

其中ε₀依赖于目标移动速度。

理论框架

关键定义

概率分歧：

er(f, h) := P{x ∈ X : h(x) ≠ f(x)}

经验分歧：

êrₘ(f, h) := (1/m)∑ᵢ₌₁ᵐ |f(xᵢ) - h(xᵢ)|

最小分歧假设集（Definition 1）：

Mₘ := argminₕ∈H (1/m)∑ᵢ₌₁ᵐ |fᵢ(xᵢ) - h(xᵢ)|

主要理论结果（Theorem 2）

对于ε, δ ∈ (0,1)，如果μ < 1/4且m ≥ m₀(ε, δ)，其中：

m₀(ε, δ) = max{
    (1/(2μ²))ln(2/δ),
    (5(4μ̄ + ε)/ε²)(ln(8/δ) + d·ln(40(4μ̄ + ε)/ε²))
}

则对任意hₘ ∈ Mₘ：

Pᵐ{(x₁,...,xₘ) ∈ Xᵐ : er(fₘ₊₁, hₘ) ≤ 4μ̄ + ε} ≥ 1-δ

证明思路：

定义两个事件：
- E = {真实误差 > 4μ̄ + ε}（错误集）
- A = {经验平均分歧 > 2μ̄}（近似集）
分解概率：Pᵐ{E} ≤ Pᵐ{A} + Pᵐ{E ∩ Ā}
界定Pᵐ{A}：使用Hoeffding不等式（Proposition 1），要求m ≥ (1/(2μ²))ln(2/δ)
界定Pᵐ{E ∩ Ā}：
- 利用最小分歧性质：∑|fᵢ(xᵢ) - hₘ(xᵢ)| ≤ ∑|fᵢ(xᵢ) - fₘ₊₁(xᵢ)|
- 应用三角不等式：êrₘ(fₘ₊₁, hₘ) ≤ 2·(1/m)∑|fᵢ(xᵢ) - fₘ₊₁(xᵢ)|
- 应用Theorem 1（VC理论结果），要求第二个样本界

构造性MILP方法

问题设置

假设目标和假设是凸多面体的指示函数：

fᵢ(x) = 1_{Bᵢ}(x), hₘ(x) = 1_{Bhₘ}(x)

其中Bₕₘ由Ax + b ≤ 0参数化，最多nf个面。

MILP构造步骤

步骤1：处理标签为1的样本（i ∈ I₁）

如果hₘ(xᵢ) = fᵢ(xᵢ) = 1，则xᵢ ∈ Bₕₘ，即：

aⱼxᵢ + bⱼ ≤ 0, ∀j = 1,...,nf

引入松弛变量sᵢⱼ ≥ 0允许分歧：

aⱼxᵢ + bⱼ ≤ sᵢⱼ, ∀j = 1,...,nf

步骤2：处理标签为0的样本（i ∈ I₀）

如果hₘ(xᵢ) = fᵢ(xᵢ) = 0，则xᵢ ∉ Bₕₘ。使用二进制变量zᵢⱼ ∈ {0,1}和大M方法：

aⱼxᵢ + bⱼ ≤ Mⱼ(1 - zᵢⱼ), ∀j
aⱼxᵢ + bⱼ ≥ ϱ + (mⱼ - ϱ)zᵢⱼ - sᵢⱼ, ∀j
∑ⱼzᵢⱼ ≤ nf - 1

步骤3：最小化分歧

引入二进制变量vᵢ ∈ {0,1}表示是否分歧：

vᵢ = 1 ⟺ ∑ⱼsᵢⱼ > 0

通过约束实现：

∑ⱼsᵢⱼ - vᵢ∑ⱼMⱼ ≤ 0 (if i ∈ I₁)
∑ⱼsᵢⱼ + vᵢ∑ⱼmⱼ ≤ 0 (if i ∈ I₀)

步骤4：完整MILP

minimize ∑ᵢ₌₁ᵐ vᵢ
subject to:
  ∀i ∈ I₁: 约束(35)
  ∀i ∈ I₀: 约束(36)

技术创新点

双层概率保证：相比20的期望值评估，提供更强的PAC类型保证
目标变化下界：引入μ修正20的数学错误，使界更加精确
构造性算法：首次提供追踪问题的构造性方法（所有先前工作仅为存在性证明）
样本剔除策略：在AEB应用中，通过几何分析剔除95%冗余样本，大幅提高计算效率
理论统一：恒定目标作为特例（μ = μ̄ = 0时，Theorem 2退化为Theorem 1）

实验设置

应用场景：自动紧急制动（AEB）系统

问题描述：

车辆接收到前方障碍物距离l和自身速度v的测量
安全条件：制动距离 ≤ 可用距离，即 (1/2)v²(m/F) ≤ l
制动力F和车辆质量m随时间变化（制动磨损、燃料/乘客变化）

标记函数：

fᵢ(x) = 1 if (1/2)v²(mᵢ/Fᵢ) ≤ l, else 0

其中x = (l, v²)

数据生成

分布设置：

距离l：均匀分布于40m, 120m
速度平方v²：正态分布，均值(70km/h)²，标准差(20km/h)²

目标变化：

制动力退化：Fᵢ₊₁ = ωF·Fᵢ，ωF ~ N(1-3×10⁻⁷, 10⁻⁶)
质量变化：mᵢ₊₁ = ωₘ·mᵢ，ωₘ ~ N(1, 10⁻³)
初始质量：m = 900kg

参数设置

理论参数：

置信度：δ = 10⁻⁶
精度：ε = 1%
目标变化界：μ = 0.78%, μ̄ = 2%
VC维度：d = 1（由于单个半平面决定标签）

理论要求样本数：根据Theorem 2，m₀(ε, δ) = 119,237

实现细节

多面体参数化：
- 固定旋转角度θ = tan⁻¹(m/(2F))简化非线性
- 只考虑相关面（第3个面决定标签）
样本剔除：
- 剔除青色区域样本（在所有I₁样本左侧）
- 剔除洋红色区域样本（在所有I₀样本右侧）
- 剔除率：95%
MILP求解：
- 使用商业求解器
- 求解时间：561秒
- 目标函数：最小化分歧数 + 体积作为tie-break

实验结果

主要结果

MILP求解：

总违反数（分歧数）：v = 1,335
求解时间：561秒
样本利用：119,237个样本中保留5%用于MILP

理论预测 vs 实际表现：

理论保证：er(fₘ₊₁, hₘ) ≤ 4μ̄ + ε = 9%（置信度1-δ）
实际平均经验分歧：≈ 2.4%（通过500次Monte Carlo运行）
结论：实际性能显著优于理论保证

Monte Carlo验证

验证方法：

500次独立运行
每次：生成新的fₘ₊₁（随机制动退化和质量变化）
每次：抽取5000个测试样本计算êrₘ(fₘ₊₁, hₘ)

结果分布（Figure 7）：

经验分歧集中在2-3%区间
远低于理论上界9%
验证了理论保证的有效性和保守性

可视化分析

Figure 3：展示制动性能随时间演化

红色半平面：真实安全边界（随迭代变化）
透明半平面：历史安全边界
绿色圆圈：标签0（安全）
蓝色三角：标签1（不安全）

Figure 5：样本剔除策略

青色/洋红色区域：冗余样本（被剔除）
红色样本：保留用于MILP
剔除率：95%

Figure 6：生成的假设

红色半平面：构造的假设hₘ
红色样本：违反点（1,335个）
假设有效追踪移动的安全边界

样本复杂度分析（Figure 2）

趋势观察：

高ε区域：第一项样本界占主导（常数部分），取决于μ
低ε区域：第二项样本界占主导（非常数部分），取决于μ̄
μ影响：μ越小，所需样本越多（学习真实变化率困难）
μ̄影响：μ̄越大，所需样本越多（快速移动目标难追踪）

结论与讨论

主要结论

理论贡献：移动目标在结构化变化假设下仍是PAC可学习的，精度为4μ̄ + ε
样本复杂度：提供明确的样本数界，依赖于：
- 精度ε（多项式依赖1/ε）
- 置信度δ（对数依赖）
- 目标变化界μ, μ̄
- VC维度d
构造性方法：首次提供MILP构造最小分歧假设
实用性：在AEB系统上验证，实际性能优于理论保证

局限性

变化界假设：需要预先知道μ和μ̄
- 实践中可能难以准确估计
- 保守估计会导致样本需求增加
精度退化：相比恒定目标，精度退化4μ̄
- 仅当μ̄相对较小时才有意义
- 快速变化目标可能不适用
MILP计算复杂度：
- 样本数大时计算代价高
- 虽然剔除策略有效，但依赖问题几何结构
凸多面体限制：构造性方法仅适用于凸多面体类
- 更一般的假设类需要其他方法
固定分布假设：样本分布P固定
- 23考虑了分布也变化的情况，本文未涉及

未来方向

分布漂移：考虑样本分布P也随时间变化（如23）
自适应方法：
- 在线估计μ和μ̄
- 自适应调整样本数
更一般的假设类：
- 扩展MILP方法到其他结构
- 神经网络等非凸假设
计算优化：
- 更高效的MILP求解
- 近似算法权衡精度和效率
理论改进：
- 更紧的样本复杂度界
- 降低对μ̄的依赖

深度评价

优点

1. 理论严谨性

数学推导完整，纠正了文献20的错误
提供双层概率保证（PAC类型），比期望值评估更强
恒定目标作为特例，理论统一

2. 方法创新性

首次为移动目标追踪提供构造性算法
MILP形式化优雅，约束设计巧妙（大M方法、松弛变量）
样本剔除策略实用（95%剔除率）

3. 实验充分性

选择安全关键的AEB应用，动机明确
Monte Carlo验证充分（500次运行）
理论与实践对比清晰

4. 写作清晰度

结构清晰，从问题定义到理论到构造到应用层层递进
图示丰富（Figure 1概念图，Figure 3-7结果图）
数学符号规范

不足

1. 假设的实用性

μ和μ̄的预知：实际中难以准确获得
- 论文未讨论估计方法
- 错误估计的影响未分析
μ < 1/4限制：较强约束，快速变化系统不适用

2. 实验局限

单一应用：仅AEB案例，缺乏多样性
简化假设：固定旋转角θ避免非线性，但失去一般性
与其他方法对比：缺少与20等方法的直接实验对比

3. 计算效率

样本数大：119,237个样本在某些应用中可能不现实
MILP求解时间：561秒仍较长，实时应用受限
扩展性：高维、复杂多面体的扩展性未充分探讨

4. 理论界的紧度

实际误差2.4% vs 理论9%：差距较大
可能存在改进空间，但论文未深入分析

5. 分布漂移缺失

固定P假设在许多实际场景不成立
虽然提出作为未来工作，但限制了当前适用性

影响力

1. 学术贡献

理论进展：扩展PAC学习到移动目标，填补理论空白
方法论贡献：构造性MILP方法可启发其他追踪问题
跨领域：连接统计学习、优化、控制理论

2. 实用价值

安全关键系统：AEB等应用的理论基础
工业相关性：制动退化等问题实际存在
可扩展性：框架可应用于其他时变系统

3. 可复现性

代码开源：https://github.com/nikovert/lrn-moving-targets
参数明确：所有实验参数详细给出
MILP详细：约束完整列出，易于实现

4. 后续研究方向

启发分布+目标同时漂移的研究
在线学习和自适应方法
其他假设类的构造性方法

适用场景

适合的场景：

缓慢变化系统：μ̄较小（<5%），如制动缓慢退化
凸结构问题：目标可表示为凸多面体
离线学习：有足够时间收集样本和求解MILP
安全关键应用：需要严格概率保证

不适合的场景：

快速变化：μ̄接近1/4或更大
实时要求：无法承受大样本和长求解时间
复杂非凸目标：超出凸多面体类
分布漂移：样本分布P也显著变化
未知变化率：无法估计μ和μ̄

潜在改进方向

自适应估计：在线估计μ和μ̄，动态调整样本需求
分布式MILP：并行求解加速计算
神经网络近似：用NN快速近似MILP解
主动学习：智能选择样本位置减少样本需求
鲁棒性分析：μ和μ̄估计误差的敏感性分析

参考文献（精选）

1 Alamo et al., 2009. "Randomized strategies for probabilistic solutions" - 随机化方法基础

5-7,9,12 Calafiore & Campi系列. "The scenario approach" - 场景方法核心文献

20 Helmbold & Long, 1994. "Tracking drifting concepts by minimizing disagreements" - 本文主要扩展对象

29 Vidyasagar, 2003. "Learning and Generalisation" - PAC学习和VC理论经典教材

28 Tempo et al., 2005. "Randomized algorithms for analysis and control" - 控制中的随机化方法

总体评价：这是一篇理论严谨、方法创新的优秀论文。主要贡献在于将PAC学习扩展到移动目标并提供首个构造性算法。理论推导完整，纠正了文献错误，实验验证充分。主要局限在于需要预知变化界、计算复杂度较高、以及固定分布假设。论文适合缓慢变化的安全关键系统，对控制理论和统计学习的交叉研究有重要贡献。建议后续工作关注自适应估计、分布漂移和计算效率优化。