2025-11-12T09:37:10.141820

Epistemic Errors of Imperfect Multitask Learners When Distributions Shift

Sloman, Caprio, Kaski
Uncertainty-aware machine learners, such as Bayesian neural networks, output a quantification of uncertainty instead of a point prediction. In this work, we provide uncertainty-aware learners with a principled framework to characterize, and identify ways to eliminate, errors that arise from reducible (epistemic) uncertainty. We introduce a principled definition of epistemic error, and provide a decompositional epistemic error bound which operates in the very general setting of imperfect multitask learning under distribution shift. In this setting, the training (source) data may arise from multiple tasks, the test (target) data may differ systematically from the source data tasks, and/or the learner may not arrive at an accurate characterization of the source data. Our bound separately attributes epistemic errors to each of multiple aspects of the learning procedure and environment. As corollaries of the general result, we provide epistemic error bounds specialized to the settings of Bayesian transfer learning and distribution shift within $ε$-neighborhoods. We additionally leverage the terms in our bound to provide a novel definition of negative transfer.
academic

Epistemic Errors of Imperfect Multitask Learners When Distributions Shift

基本信息

  • 论文ID: 2505.23496
  • 标题: Epistemic Errors of Imperfect Multitask Learners When Distributions Shift
  • 作者: Sabina J. Sloman, Michele Caprio, Samuel Kaski
  • 分类: cs.LG stat.ML
  • 发表时间: October 13, 2025 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2505.23496

摘要

本文为不确定性感知机器学习模型(如贝叶斯神经网络)提供了一个原则性框架,用于刻画和消除由可约(认知)不确定性引起的错误。论文引入了认知误差的原则性定义,并在分布偏移下的不完美多任务学习这一非常一般的设置中提供了分解性认知误差界。在此设置下,训练(源)数据可能来自多个任务,测试(目标)数据可能与源数据任务存在系统性差异,和/或学习器可能无法准确刻画源数据。该界将认知误差分别归因于学习过程和环境的多个方面。

研究背景与动机

问题定义

该研究要解决的核心问题是:如何为不确定性感知学习器提供理论框架来刻画和减少认知误差?具体而言:

  1. 传统学习理论的局限性:现有的统计学习理论主要关注泛化误差,但对于输出不确定性量化的学习器,预测误差是一个不相关、不完整或无信息的性能度量。
  2. 不确定性类型混淆:传统方法将可约的认知不确定性和不可约的随机不确定性混为一谈,无法有效指导模型改进。
  3. 复杂学习场景缺乏理论支持:在多任务学习、分布偏移、不完美学习等复杂现实场景下,缺乏理论指导。

研究重要性

  1. 实际应用价值:在医疗等高风险领域,准确的不确定性量化至关重要
  2. 理论完善:填补了不确定性感知学习理论的空白
  3. 指导实践:为模型选择和优化提供理论依据

现有方法局限性

  • PAC学习理论等传统框架无法区分认知误差和随机误差
  • 缺乏针对多任务学习和分布偏移场景的统一理论框架
  • 现有界限通常假设完美学习或无分布偏移

核心贡献

  1. 引入认知误差界概念:提出了认知误差界这一新的理论工具,专门针对不确定性感知学习器
  2. 分解性认知误差界:在不完美多任务学习和分布偏移的一般设置下,提供了将认知误差分解为三个组成部分的界限
  3. 特殊情况的协变量:为贝叶斯迁移学习和ε-邻域内分布偏移提供了专门的认知误差界
  4. 负迁移的新定义:基于界限中的项提供了负迁移现象的新理论刻画

方法详解

任务定义

认知误差定义为学习器对数据生成过程(DGP)认识错误的程度,形式化为: e:=dTV(P^,Qt)e := d_{TV}(\hat{P}, Q^t)

其中P^\hat{P}是学习器的预测分布,QtQ^t是目标任务分布,dTVd_{TV}是全变分距离。

核心理论框架

多任务学习设置

  • 任务分布:任务本身从二阶任务分布QΔ(ΔX)\mathcal{Q} \in \Delta(\Delta_X)中采样
  • 源任务:训练数据来自nn个源任务,每个任务QQSQ \sim \mathcal{Q}^S
  • 目标任务:测试任务QtQTQ^t \sim \mathcal{Q}^T
  • 分布偏移:当QSQT\mathcal{Q}^S \neq \mathcal{Q}^T时发生

关键定义

  1. 任务分布的重心 (Definition 1): Qˉ(x):=ΔXQ(x)q(Q)dQ=EQQ[Q(x)]\bar{Q}(x) := \int_{\Delta_X} Q(x) q(Q) dQ = \mathbb{E}_{Q \sim \mathcal{Q}}[Q(x)]
  2. 任务分布的变异性 (Definition 2): V[Q]:=supxXΔX[Q(x)Qˉ(x)]2q(Q)dQV[\mathcal{Q}] := \sup_{x \in X} \int_{\Delta_X} [Q(x) - \bar{Q}(x)]^2 q(Q) dQ
  3. 近似偏差 (Definition 7): B:=dTV(P,QˉS)B := d_{TV}(P^*, \bar{Q}^S) 其中P=argminPπdTV(P,QˉS)P^* = \arg\min_{P \in \pi} d_{TV}(P, \bar{Q}^S)
  4. 收敛不足 (Definition 8): C:=dTV(P^,P)C := d_{TV}(\hat{P}, P^*)
  5. 分布偏移程度 (Definition 9): D:=dTV(QˉS,QˉT)D := d_{TV}(\bar{Q}^S, \bar{Q}^T)

主要理论结果

定理1(主要结果)

给定模型类π\pi,预测器P^π\hat{P} \in \pi,源任务分布QS\mathcal{Q}^S,和二阶有界目标任务分布QT\mathcal{Q}^T

Pr(eα+B+C+D)V[QT]α2\Pr(e \geq \alpha + B + C + D) \leq \frac{V[\mathcal{Q}^T]}{\alpha^2}

这个界将认知误差分解为:

  • B: 模型限制(近似偏差)
  • C: 数据稀缺(收敛不足)
  • D: 分布偏移
  • V[QT]V[\mathcal{Q}^T]: 目标任务变异性

证明思路

使用三角不等式在度量空间中构建路径: dTV(P^,Qt)dTV(P^,P)+dTV(P,QˉS)+dTV(QˉS,QˉT)+dTV(QˉT,Qt)d_{TV}(\hat{P}, Q^t) \leq d_{TV}(\hat{P}, P^*) + d_{TV}(P^*, \bar{Q}^S) + d_{TV}(\bar{Q}^S, \bar{Q}^T) + d_{TV}(\bar{Q}^T, Q^t)

结合Chebyshev不等式控制任务变异性的影响。

技术创新点

  1. 统一框架:首次在单一框架下处理多任务学习、不完美学习和分布偏移
  2. 分解性分析:将复杂的认知误差分解为可解释的组成部分
  3. 实用指导:每个组件都对应具体的改进策略
  4. 理论严谨性:基于严格的度量空间分析和概率论

特殊情况分析

贝叶斯迁移学习(协变量1)

对于贝叶斯学习器,收敛不足项可以表示为参数后验的收敛: CΘ:=dTV(P1Θ,PΘ)C^{\Theta} := d_{TV}(P^{\Theta}_1, P^{\Theta}_*)

这直接连接了后验收敛与认知误差。

全变分邻域(协变量2)

ε\varepsilon-邻域约束下: Pr(eα+B+C+D)βα2(V[QS]+vol(QT))\Pr(e \geq \alpha + B + C + D) \leq \frac{\beta}{\alpha^2}(V[\mathcal{Q}^S] + \text{vol}(\mathcal{Q}^T))

其中β=(1bT)/bS\beta = (1-b_T)/b_Svol(QT)=(diam(QS)+ε)2\text{vol}(\mathcal{Q}^T) = (\text{diam}(\mathcal{Q}^S) + \varepsilon)^2

实验验证

实验设置

  • 模型:贝叶斯线性回归
  • 数据生成xN(β1Sξ1+β2Sξ2,σS)x \sim N(\beta_1^S \xi_1 + \beta_2^S \xi_2, \sigma^S)
  • 先验:Normal-Inverse-Gamma模型
  • 度量近似:使用Pinsker不等式近似全变分距离

主要实验结果

  1. 后验收敛效应(图1a):认知误差随后验对源数据生成参数的概率增加而减少
  2. 邻域大小效应(图1b):认知误差随ε\varepsilon邻域大小增加而增加
  3. 负迁移现象(图3):界限松紧度与负迁移现象高度相关

实验发现

  • 理论预测与实验观察高度一致
  • 界限在负迁移情况下变松,符合理论分析
  • 各组成部分的相对重要性随场景变化

相关工作

统计学习理论

  • 多任务领域泛化:Baxter (2000), Maurer等人的工作,但未考虑分布偏移
  • 领域自适应理论:Redko等人 (2019),但假设学习器知晓分布偏移
  • Credal学习理论:Caprio等人 (2024),但限制于特定学习器

不确定性量化

  • 贝叶斯深度学习:Papamarkou等人 (2024)
  • 保形预测:Angelopoulos和Bates (2023)
  • Credal学习:Caprio等人 (2024)

本文优势

  1. 更一般的设置:同时处理多任务学习、不完美学习和分布偏移
  2. 学习器无关:不依赖特定的学习算法
  3. 分解性分析:提供可操作的改进指导

结论与讨论

主要结论

  1. 提供了首个针对不确定性感知学习器的分解性认知误差界
  2. 在非常一般的设置下工作,涵盖多种实际场景
  3. 为模型选择和优化提供了理论指导框架

局限性

  1. 计算复杂性:全变分距离通常难以精确计算
  2. 假设条件:需要二阶有界分布等技术假设
  3. 保形预测:框架无法完全刻画保形预测设置
  4. 实验验证:仅在低维合成数据上验证

未来方向

  1. 扩展到时间依赖的任务和数据
  2. 完整刻画保形预测设置
  3. 高维和真实数据的实验验证
  4. 开发更易计算的界限版本

深度评价

优点

  1. 理论创新性强:首次系统性地为不确定性感知学习提供理论框架
  2. 实用价值高:分解性分析直接指导实践改进
  3. 数学严谨性:证明完整,理论基础扎实
  4. 写作清晰:结构合理,概念定义清楚

不足

  1. 计算可行性:理论结果的实际计算存在挑战
  2. 实验局限:实验规模和复杂度有限
  3. 假设严格:某些技术假设在实践中可能难以满足
  4. 应用范围:对某些不确定性量化方法(如保形预测)支持不完整

影响力

  1. 理论贡献:为不确定性感知学习理论奠定基础
  2. 实践指导:为高风险应用中的模型选择提供依据
  3. 研究启发:开辟了新的研究方向

适用场景

  1. 医疗诊断:需要准确不确定性量化的临床预测
  2. 金融风险:多市场环境下的风险建模
  3. 自动驾驶:环境变化下的安全决策
  4. 科学发现:跨领域知识迁移

参考文献

本文引用了统计学习理论、贝叶斯推理、不确定性量化等领域的重要工作,包括:

  • Shalev-Shwarz & Ben-David (2014): 统计学习理论基础
  • Papamarkou et al. (2024): 贝叶斯深度学习
  • Angelopoulos & Bates (2023): 保形预测
  • Redko et al. (2019): 领域自适应理论

这是一篇在不确定性感知机器学习理论方面具有重要贡献的论文,为该领域提供了坚实的理论基础和实用的分析框架。尽管在计算可行性和实验验证方面还有改进空间,但其理论创新和实用价值使其成为该领域的重要工作。