2025-11-10T02:47:10.641667

On the natural domain of Bregman operators

Themelis, Wang
The Bregman proximal mapping and Bregman-Moreau envelope are traditionally studied for functions defined on the entire space $\mathbb{R}^n$, even though these constructions depend only on the values of the function within (the interior of) the domain of the distance-generating function (dgf). While this convention is largely harmless in the convex setting, it leads to substantial limitations in the nonconvex case, as it fails to embrace important classes of functions such as relatively weakly convex ones. In this work, we revisit foundational aspects of Bregman analysis by adopting a domain-aware perspective: we define functions on the natural domain induced by the dgf and impose properties only relative to this set. This framework not only generalizes existing results but also rectifies and simplifies their statements and proofs. Several examples illustrate both the necessity of our assumptions and the advantages of this refined approach.
academic

On the natural domain of Bregman operators

基本信息

  • 论文ID: 2506.00465
  • 标题: On the natural domain of Bregman operators
  • 作者: Andreas Themelis (九州大学), Ziyuan Wang (维也纳大学)
  • 分类: math.OC (数学优化与控制)
  • 提交时间: 2025年1月
  • 论文链接: https://arxiv.org/abs/2506.00465v2

摘要

传统上,Bregman近似映射和Bregman-Moreau包络被研究用于定义在整个空间Rn\mathbb{R}^n上的函数,尽管这些构造仅依赖于距离生成函数(dgf)定义域(内部)内的函数值。虽然这种约定在凸设置中基本无害,但在非凸情况下会导致实质性限制,因为它无法包含重要的函数类别,如相对弱凸函数。本文通过采用域感知视角重新审视Bregman分析的基础方面:在由dgf诱导的自然域上定义函数,并仅相对于这个集合施加性质。这个框架不仅推广了现有结果,还修正和简化了它们的陈述和证明。

研究背景与动机

问题背景

  1. 传统Bregman理论的局限性: 现有文献通常将函数定义在整个空间Rn\mathbb{R}^n上,要求函数在全空间上满足适当性(properness)和下半连续性(lower semicontinuity)
  2. 实际依赖性的不匹配: Bregman近似映射和Moreau包络实际上只依赖于函数在domϕ\text{dom}\phiintdomϕ\text{int}\text{dom}\phi上的值,其中ϕ\phi是距离生成函数
  3. 重要函数类的排除: 传统方法排除了相对弱凸函数等重要类别,这些函数通过添加适当的ϕ\phi倍数可以变为凸函数

研究动机

  1. 理论完整性: 建立更自然且完整的Bregman分析框架
  2. 应用扩展: 包含更广泛的函数类,特别是在非凸优化中重要的相对弱凸函数
  3. 简化理论: 消除不必要的技术假设,简化证明和陈述

核心贡献

  1. 提出域感知框架: 将函数定义在自然域X:=domϕX := \text{dom}\phiY:=intdomϕY := \text{int}\text{dom}\phi上,而非整个Rn\mathbb{R}^n
  2. 修正现有结果: 纠正文献中关于连续性和半连续性的不精确陈述
  3. 扩展适用范围: 包含无法扩展到全空间同时保持性质的函数类
  4. 建立Φ\Phi-共轭联系: 将Bregman算子置于Φ\Phi-凸性理论框架中
  5. 新的相对光滑性刻画: 提供相对光滑性的新等价条件,连接Bregman余强制性和各向异性强凸性

方法详解

基础设置

距离生成函数: ϕ:RnR\phi: \mathbb{R}^n \to \overline{\mathbb{R}}是适当的、下半连续的、凸的,且在intdomϕ\text{int}\text{dom}\phi \neq \emptyset上可微。定义:

  • X:=domϕX := \text{dom}\phi
  • Y:=intdomϕY := \text{int}\text{dom}\phi

Bregman距离:

\phi(x) - \phi(y) - \langle\nabla\phi(y), x-y\rangle & \text{if } y \in \text{int}\text{dom}\phi \\ \infty & \text{otherwise} \end{cases}$$ ### 核心算子定义 **左Bregman近似映射**: 对于$f: X \to \overline{\mathbb{R}}$, $$\overleftarrow{\text{prox}}^{\phi}_{\lambda f}(\bar{y}) := \arg\min_{x \in X} \left\{f(x) + \frac{1}{\lambda}D_\phi(x, \bar{y})\right\}$$ **右Bregman近似映射**: 对于$g: Y \to \overline{\mathbb{R}}$, $$\overrightarrow{\text{prox}}^{\phi}_{\lambda g}(\bar{x}) := \arg\min_{y \in Y} \left\{g(y) + \frac{1}{\lambda}D_\phi(\bar{x}, y)\right\}$$ **Bregman-Moreau包络**: 相应地定义左右包络函数。 ### 技术创新点 1. **域限制方法**: 通过将算子的定义域和值域限制在自然集合上,避免了扩展函数时的技术困难 2. **相对拓扑处理**: 系统地处理子集上的拓扑性质,如相对连续性和紧性 3. **规范扩展理论**: 建立函数和算子到全空间的规范扩展理论,保持关键性质 ## 理论结果 ### 左算子的性质 **定理3.10**: 设$\phi$是1-强制的,$f: X \to \overline{\mathbb{R}}$是适当的、下半连续的、$\phi$-近似有界的。对任意$\lambda \in (0, \lambda^{\phi}_f)$: 1. $\text{dom}\overleftarrow{\text{env}}^{\phi}_{\lambda f} = \text{dom}\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = Y$ 2. $\overleftarrow{\text{env}}^{\phi}_{\lambda f}: Y \to \mathbb{R}$是连续的 3. $\overleftarrow{\text{prox}}^{\phi}_{\lambda f}: Y \rightrightarrows X$是紧值的和上半连续的 ### 右算子的分析 **定理3.23**: 设$\text{dom}\phi = \mathbb{R}^n$,$g: Y \to \overline{\mathbb{R}}$是适当的、右$\phi$-近似有界的。对$\lambda \in (0, \lambda^{\phi}_{\vec{g}})$: 1. $\overrightarrow{\text{env}}^{\phi}_{\lambda g}: X \to \mathbb{R}$是局部Lipschitz连续的 2. 在适当条件下,$\nabla\phi \circ \overrightarrow{\text{prox}}^{\phi}_{\lambda g}$是局部有界、外半连续、上半连续的 ### $\Phi$-共轭视角 通过设置$\Phi = -\frac{1}{\lambda}D_\phi$,建立与$\Phi$-凸性理论的联系: **推论4.6**: - $f^{\Phi} = -\overleftarrow{\text{env}}^{\phi}_{\lambda f}$ - $f^{\Phi\Psi} = \overleftarrow{\text{hull}}^{\phi}_{\lambda f}$ - $\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = (\partial_{\Phi}f)^{-1}$ ### 相对光滑性新刻画 **定理4.10**: 设$\phi$是Legendre且1-强制的,$f: X \to \overline{\mathbb{R}}$是适当、下半连续、凸的。以下等价: 1. $f$是$B_\phi$-光滑的 2. $\text{dom}f = X$且在$\text{int}X$上$f = \phi - \tilde{f}^{*\hat{\Phi}*}(-\cdot)$ 3. $f$满足扩展$B_\phi$-余强制性不等式 4. Fenchel共轭$\tilde{f}^*$满足$a_{\phi^*}$-强凸性不等式 ## 实例分析 ### 例3.12: 对数情形 设$\phi(x) = -\ln(x)$对$x \in X = (0,\infty)$,$f(x) = \ln(x)$。虽然$f$不能扩展为$\mathbb{R}$上的适当下半连续函数,但在框架内仍享有良好性质。 ### 例3.24: 右近似映射的重要性 构造例子说明仅有Legendre性和实值性不足以保证右近似映射的非空性,需要额外的下半连续性条件。 ## 相关工作 本文建立在以下重要工作基础上: 1. **Kan & Song (2012)**: Bregman意义下的Moreau包络和近似映射的基础理论 2. **Laude et al. (2023)**: $\Phi$-凸性理论和对偶性 3. **Bauschke & Combettes (2017)**: 凸分析和单调算子理论 4. **Rockafellar & Wets (1998)**: 变分分析基础 相比现有工作,本文的主要区别在于: - 系统性地采用域限制视角 - 修正文献中的不精确陈述 - 扩展到更广泛的函数类 ## 结论与讨论 ### 主要结论 1. **域感知方法的优势**: 通过在自然域上定义算子,获得了更简洁、更一般的理论 2. **现有结果的修正**: 纠正了关于连续性和半连续性的不精确陈述 3. **理论统一**: 将Bregman算子置于$\Phi$-凸性的统一框架中 ### 局限性 1. **凸性假设**: 许多结果仍需要底层的凸性假设 2. **技术条件**: 某些结果需要1-强制性等技术条件 3. **计算复杂性**: 未详细讨论算法实现的计算复杂性 ### 未来方向 1. **Klee包络研究**: 将域感知方法扩展到Klee包络 2. **非可微dgf**: 放松距离生成函数的可微性要求 3. **算法应用**: 开发基于新理论框架的优化算法 ## 深度评价 ### 优点 1. **理论严谨性**: 系统地处理了域限制问题,填补了理论空白 2. **实用价值**: 扩展了可处理的函数类,特别是相对弱凸函数 3. **写作清晰**: 论文结构清晰,证明详细,例子丰富 4. **修正价值**: 纠正了现有文献中的不精确之处 ### 不足 1. **应用示例有限**: 缺乏具体优化问题的应用案例 2. **计算方面**: 对算法实现和计算复杂性讨论不足 3. **非凸扩展**: 虽然动机涉及非凸情况,但主要结果仍集中在凸设置 ### 影响力 1. **理论贡献**: 为Bregman分析提供了更坚实的理论基础 2. **方法论价值**: 域感知方法可能启发其他领域的类似研究 3. **实用潜力**: 为处理约束优化和非标准函数类提供了新工具 ### 适用场景 1. **约束优化**: 函数自然定义在约束集上的优化问题 2. **相对光滑优化**: 涉及相对光滑函数的优化算法设计 3. **Bregman方法**: 各种Bregman迭代方法的理论分析 ## 参考文献 论文引用了43篇重要文献,主要包括: - 凸分析经典教材(Rockafellar, Bauschke & Combettes) - Bregman方法基础文献(Kan & Song, Bauschke et al.) - 最新$\Phi$-凸性理论(Laude et al.) - 相对光滑性理论(Lu et al., Bauschke et al.)