We consider a moving target that we seek to learn from samples. Our results extend randomized techniques developed in control and optimization for a constant target to the case where the target is changing. We derive a novel bound on the number of samples that are required to construct a probably approximately correct (PAC) estimate of the target. Furthermore, when the moving target is a convex polytope, we provide a constructive method of generating the PAC estimate using a mixed integer linear program (MILP). The proposed method is demonstrated on an application to autonomous emergency braking.
论文ID : 2408.04406标题 : Finite sample learning of moving targets作者 : Nikolaus Vertovec (University of Oxford), Kostas Margellos (University of Oxford), Maria Prandini (Politecnico di Milano)分类 : math.OC (Optimization and Control), cs.LG (Machine Learning)提交时间 : 2024年8月 (v3: 2025年11月10日)论文链接 : https://arxiv.org/abs/2408.04406 本文研究从样本中学习移动目标(moving target)的问题。研究将控制和优化领域中针对恒定目标开发的随机化技术扩展到目标变化的情况。论文推导了构造概率近似正确(PAC)目标估计所需样本数量的新界。此外,当移动目标是凸多面体时,提供了使用混合整数线性规划(MILP)生成PAC估计的构造性方法。该方法在自动紧急制动应用中得到验证。
传统的统计学习理论(如PAC学习)假设目标标记函数是固定不变的。然而,在许多实际应用中,学习目标会随时间变化。本文研究如何从有限样本中学习这种结构化变化的标记机制 ,并提供概率保证。
实际需求 :在控制系统、机器人、自动驾驶等领域,环境和系统参数会随时间漂移(如制动性能退化、车辆质量变化)理论挑战 :经典PAC理论无法直接应用于移动目标,需要新的理论框架安全关键应用 :在自动驾驶等安全关键系统中,需要提供严格的概率保证场景方法(Scenario Approach) :主要针对恒定目标的不确定性优化,未考虑目标随时间变化VC理论 :需要有限的VC维度,且主要针对静态目标已有移动目标学习 :如2,3,15,20,22,23 等工作,但多数提供期望值评估而非PAC类型的双层概率保证缺乏构造性方法 :现有分析多为存在性证明,缺少实际构造假设的算法本文旨在:
为移动目标学习提供PAC类型的有限样本复杂度界 开发构造性算法(MILP)来生成满足理论保证的假设 纠正文献20 中的数学疏漏(关于目标变化下界的处理) 先验样本复杂度界 :在Section 3中提供了生成PAC假设所需的最小样本数量的先验界(Theorem 2),扩展了20 的工作但采用PAC类型结果而非期望值评估数学修正 :纠正了20, Theorem 1 中的数学疏漏,引入目标变化的下界μ(而非仅上界μ̄)构造性MILP方法 :在Section 4中提出首个构造性方法,使用混合整数线性规划生成凸多面体类别的最小分歧假设(这是首次针对追踪问题的构造性方法)实际应用验证 :在Section 5中通过自动紧急制动(AEB)系统案例验证理论结果,并提出样本剔除策略提高计算效率(剔除95%的冗余样本)输入 :
标记的m-多样本:{(x₁, f₁(x₁)), ..., (xₘ, fₘ(xₘ))} 样本xᵢ ∈ X ⊆ ℝⁿ独立同分布地从概率分布P中抽取 每个样本由不同的目标函数fᵢ: X → {0,1}标记 输出 :
假设hₘ: X → {0,1},用于预测下一个样本x的标签fₘ₊₁(x) 约束条件 :
所有目标和假设函数属于同一类H,具有有限VC维度(Assumption 1) 目标变化满足结构化假设:平均分歧概率μ = (1/m)∑ᵢ₌₁ᵐ er(fᵢ, fₘ₊₁)满足μ ≤ μ ≤ μ̄(Assumption 2) 目标 :找到m₀(ε, δ)使得对m ≥ m₀,构造的假设满足:
Pᵐ{(x₁,...,xₘ) ∈ Xᵐ : P{x ∈ X : hₘ(x) ≠ fₘ₊₁(x)} ≤ ε₀ + ε} ≥ 1-δ
其中ε₀依赖于目标移动速度。
概率分歧 :er(f, h) := P{x ∈ X : h(x) ≠ f(x)}
经验分歧 :êrₘ(f, h) := (1/m)∑ᵢ₌₁ᵐ |f(xᵢ) - h(xᵢ)|
最小分歧假设集 (Definition 1):Mₘ := argminₕ∈H (1/m)∑ᵢ₌₁ᵐ |fᵢ(xᵢ) - h(xᵢ)|
对于ε, δ ∈ (0,1),如果μ < 1/4且m ≥ m₀(ε, δ),其中:
m₀(ε, δ) = max{
(1/(2μ²))ln(2/δ),
(5(4μ̄ + ε)/ε²)(ln(8/δ) + d·ln(40(4μ̄ + ε)/ε²))
}
则对任意hₘ ∈ Mₘ:
Pᵐ{(x₁,...,xₘ) ∈ Xᵐ : er(fₘ₊₁, hₘ) ≤ 4μ̄ + ε} ≥ 1-δ
证明思路 :
定义两个事件:E = {真实误差 > 4μ̄ + ε}(错误集) A = {经验平均分歧 > 2μ̄}(近似集) 分解概率:Pᵐ{E} ≤ Pᵐ{A} + Pᵐ{E ∩ Ā} 界定Pᵐ{A}:使用Hoeffding不等式(Proposition 1),要求m ≥ (1/(2μ²))ln(2/δ) 界定Pᵐ{E ∩ Ā}:利用最小分歧性质:∑|fᵢ(xᵢ) - hₘ(xᵢ)| ≤ ∑|fᵢ(xᵢ) - fₘ₊₁(xᵢ)| 应用三角不等式:êrₘ(fₘ₊₁, hₘ) ≤ 2·(1/m)∑|fᵢ(xᵢ) - fₘ₊₁(xᵢ)| 应用Theorem 1(VC理论结果),要求第二个样本界 假设目标和假设是凸多面体的指示函数:
fᵢ(x) = 1_{Bᵢ}(x), hₘ(x) = 1_{Bhₘ}(x)
其中Bₕₘ由Ax + b ≤ 0参数化,最多nf个面。
步骤1:处理标签为1的样本(i ∈ I₁)
如果hₘ(xᵢ) = fᵢ(xᵢ) = 1,则xᵢ ∈ Bₕₘ,即:
aⱼxᵢ + bⱼ ≤ 0, ∀j = 1,...,nf
引入松弛变量sᵢⱼ ≥ 0允许分歧:
aⱼxᵢ + bⱼ ≤ sᵢⱼ, ∀j = 1,...,nf
步骤2:处理标签为0的样本(i ∈ I₀)
如果hₘ(xᵢ) = fᵢ(xᵢ) = 0,则xᵢ ∉ Bₕₘ。使用二进制变量zᵢⱼ ∈ {0,1}和大M方法:
aⱼxᵢ + bⱼ ≤ Mⱼ(1 - zᵢⱼ), ∀j
aⱼxᵢ + bⱼ ≥ ϱ + (mⱼ - ϱ)zᵢⱼ - sᵢⱼ, ∀j
∑ⱼzᵢⱼ ≤ nf - 1
步骤3:最小化分歧
引入二进制变量vᵢ ∈ {0,1}表示是否分歧:
通过约束实现:
∑ⱼsᵢⱼ - vᵢ∑ⱼMⱼ ≤ 0 (if i ∈ I₁)
∑ⱼsᵢⱼ + vᵢ∑ⱼmⱼ ≤ 0 (if i ∈ I₀)
步骤4:完整MILP
minimize ∑ᵢ₌₁ᵐ vᵢ
subject to:
∀i ∈ I₁: 约束(35)
∀i ∈ I₀: 约束(36)
双层概率保证 :相比20 的期望值评估,提供更强的PAC类型保证目标变化下界 :引入μ修正20 的数学错误,使界更加精确构造性算法 :首次提供追踪问题的构造性方法(所有先前工作仅为存在性证明)样本剔除策略 :在AEB应用中,通过几何分析剔除95%冗余样本,大幅提高计算效率理论统一 :恒定目标作为特例(μ = μ̄ = 0时,Theorem 2退化为Theorem 1)问题描述 :
车辆接收到前方障碍物距离l和自身速度v的测量 安全条件:制动距离 ≤ 可用距离,即 (1/2)v²(m/F) ≤ l 制动力F和车辆质量m随时间变化(制动磨损、燃料/乘客变化) 标记函数 :
fᵢ(x) = 1 if (1/2)v²(mᵢ/Fᵢ) ≤ l, else 0
其中x = (l, v²)
分布设置 :
距离l:均匀分布于40m, 120m 速度平方v²:正态分布,均值(70km/h)²,标准差(20km/h)² 目标变化 :
制动力退化:Fᵢ₊₁ = ωF·Fᵢ,ωF ~ N(1-3×10⁻⁷, 10⁻⁶) 质量变化:mᵢ₊₁ = ωₘ·mᵢ,ωₘ ~ N(1, 10⁻³) 初始质量:m = 900kg 理论参数 :
置信度:δ = 10⁻⁶ 精度:ε = 1% 目标变化界:μ = 0.78%, μ̄ = 2% VC维度:d = 1(由于单个半平面决定标签) 理论要求样本数 :
根据Theorem 2,m₀(ε, δ) = 119,237
多面体参数化 :固定旋转角度θ = tan⁻¹(m/(2F))简化非线性 只考虑相关面(第3个面决定标签) 样本剔除 :剔除青色区域样本(在所有I₁样本左侧) 剔除洋红色区域样本(在所有I₀样本右侧) 剔除率:95% MILP求解 :使用商业求解器 求解时间:561秒 目标函数:最小化分歧数 + 体积作为tie-break MILP求解 :
总违反数(分歧数):v = 1,335 求解时间:561秒 样本利用:119,237个样本中保留5%用于MILP 理论预测 vs 实际表现 :
理论保证:er(fₘ₊₁, hₘ) ≤ 4μ̄ + ε = 9%(置信度1-δ) 实际平均经验分歧:≈ 2.4%(通过500次Monte Carlo运行) 结论 :实际性能显著优于理论保证验证方法 :
500次独立运行 每次:生成新的fₘ₊₁(随机制动退化和质量变化) 每次:抽取5000个测试样本计算êrₘ(fₘ₊₁, hₘ) 结果分布 (Figure 7):
经验分歧集中在2-3%区间 远低于理论上界9% 验证了理论保证的有效性和保守性 Figure 3 :展示制动性能随时间演化
红色半平面:真实安全边界(随迭代变化) 透明半平面:历史安全边界 绿色圆圈:标签0(安全) 蓝色三角:标签1(不安全) Figure 5 :样本剔除策略
青色/洋红色区域:冗余样本(被剔除) 红色样本:保留用于MILP 剔除率:95% Figure 6 :生成的假设
红色半平面:构造的假设hₘ 红色样本:违反点(1,335个) 假设有效追踪移动的安全边界 趋势观察 :
高ε区域 :第一项样本界占主导(常数部分),取决于μ低ε区域 :第二项样本界占主导(非常数部分),取决于μ̄μ影响 :μ越小,所需样本越多(学习真实变化率困难)μ̄影响 :μ̄越大,所需样本越多(快速移动目标难追踪)VC理论 29 :提供有限VC维度类的PAC学习界 本文扩展到移动目标场景 场景方法 5-7,9,12 :针对不确定凸优化的随机化方法 提供先验可行性保证 本文将其思想应用于非凸和移动目标 压缩学习 11,24 :概念漂移学习 2,3,15,22,23 :2,22 :利用变化结构学习3 :从漂移分布学习的复杂度23 :考虑分布和目标同时变化区别 :多数提供期望值评估,本文提供PAC保证追踪漂移概念 20 :通过最小化分歧追踪 本文改进 :纠正数学错误,提供PAC而非期望保证自适应变化率 19 :控制综合 13,14,16,28 :博弈论 17 :强化学习 14 :理论贡献 :移动目标在结构化变化假设下仍是PAC可学习的,精度为4μ̄ + ε样本复杂度 :提供明确的样本数界,依赖于:精度ε(多项式依赖1/ε) 置信度δ(对数依赖) 目标变化界μ, μ̄ VC维度d 构造性方法 :首次提供MILP构造最小分歧假设实用性 :在AEB系统上验证,实际性能优于理论保证变化界假设 :需要预先知道μ和μ̄精度退化 :相比恒定目标,精度退化4μ̄MILP计算复杂度 :样本数大时计算代价高 虽然剔除策略有效,但依赖问题几何结构 凸多面体限制 :构造性方法仅适用于凸多面体类固定分布假设 :样本分布P固定分布漂移 :考虑样本分布P也随时间变化(如23 )自适应方法 :更一般的假设类 :计算优化 :理论改进 :1. 理论严谨性
数学推导完整,纠正了文献20 的错误 提供双层概率保证(PAC类型),比期望值评估更强 恒定目标作为特例,理论统一 2. 方法创新性
首次为移动目标追踪提供构造性算法 MILP形式化优雅,约束设计巧妙(大M方法、松弛变量) 样本剔除策略实用(95%剔除率) 3. 实验充分性
选择安全关键的AEB应用,动机明确 Monte Carlo验证充分(500次运行) 理论与实践对比清晰 4. 写作清晰度
结构清晰,从问题定义到理论到构造到应用层层递进 图示丰富(Figure 1概念图,Figure 3-7结果图) 数学符号规范 1. 假设的实用性
μ和μ̄的预知 :实际中难以准确获得
μ < 1/4限制 :较强约束,快速变化系统不适用2. 实验局限
单一应用 :仅AEB案例,缺乏多样性简化假设 :固定旋转角θ避免非线性,但失去一般性与其他方法对比 :缺少与20 等方法的直接实验对比3. 计算效率
样本数大 :119,237个样本在某些应用中可能不现实MILP求解时间 :561秒仍较长,实时应用受限扩展性 :高维、复杂多面体的扩展性未充分探讨4. 理论界的紧度
实际误差2.4% vs 理论9%:差距较大 可能存在改进空间,但论文未深入分析 5. 分布漂移缺失
固定P假设在许多实际场景不成立 虽然提出作为未来工作,但限制了当前适用性 1. 学术贡献
理论进展 :扩展PAC学习到移动目标,填补理论空白方法论贡献 :构造性MILP方法可启发其他追踪问题跨领域 :连接统计学习、优化、控制理论2. 实用价值
安全关键系统 :AEB等应用的理论基础工业相关性 :制动退化等问题实际存在可扩展性 :框架可应用于其他时变系统3. 可复现性
4. 后续研究方向
启发分布+目标同时漂移的研究 在线学习和自适应方法 其他假设类的构造性方法 适合的场景 :
缓慢变化系统 :μ̄较小(<5%),如制动缓慢退化凸结构问题 :目标可表示为凸多面体离线学习 :有足够时间收集样本和求解MILP安全关键应用 :需要严格概率保证不适合的场景 :
快速变化 :μ̄接近1/4或更大实时要求 :无法承受大样本和长求解时间复杂非凸目标 :超出凸多面体类分布漂移 :样本分布P也显著变化未知变化率 :无法估计μ和μ̄自适应估计 :在线估计μ和μ̄,动态调整样本需求分布式MILP :并行求解加速计算神经网络近似 :用NN快速近似MILP解主动学习 :智能选择样本位置减少样本需求鲁棒性分析 :μ和μ̄估计误差的敏感性分析1 Alamo et al., 2009. "Randomized strategies for probabilistic solutions" - 随机化方法基础
5-7,9,12 Calafiore & Campi系列. "The scenario approach" - 场景方法核心文献
20 Helmbold & Long, 1994. "Tracking drifting concepts by minimizing disagreements" - 本文主要扩展对象
29 Vidyasagar, 2003. "Learning and Generalisation" - PAC学习和VC理论经典教材
28 Tempo et al., 2005. "Randomized algorithms for analysis and control" - 控制中的随机化方法
总体评价 :这是一篇理论严谨、方法创新的优秀论文。主要贡献在于将PAC学习扩展到移动目标并提供首个构造性算法。理论推导完整,纠正了文献错误,实验验证充分。主要局限在于需要预知变化界、计算复杂度较高、以及固定分布假设。论文适合缓慢变化的安全关键系统,对控制理论和统计学习的交叉研究有重要贡献。建议后续工作关注自适应估计、分布漂移和计算效率优化。