2025-11-10T02:47:10.641667

On the natural domain of Bregman operators

Themelis, Wang
The Bregman proximal mapping and Bregman-Moreau envelope are traditionally studied for functions defined on the entire space $\mathbb{R}^n$, even though these constructions depend only on the values of the function within (the interior of) the domain of the distance-generating function (dgf). While this convention is largely harmless in the convex setting, it leads to substantial limitations in the nonconvex case, as it fails to embrace important classes of functions such as relatively weakly convex ones. In this work, we revisit foundational aspects of Bregman analysis by adopting a domain-aware perspective: we define functions on the natural domain induced by the dgf and impose properties only relative to this set. This framework not only generalizes existing results but also rectifies and simplifies their statements and proofs. Several examples illustrate both the necessity of our assumptions and the advantages of this refined approach.
academic

О естественной области операторов Брегмана

Основная информация

  • ID статьи: 2506.00465
  • Название: On the natural domain of Bregman operators
  • Авторы: Andreas Themelis (Университет Кюсю), Ziyuan Wang (Венский университет)
  • Классификация: math.OC (математическая оптимизация и управление)
  • Время подачи: январь 2025
  • Ссылка на статью: https://arxiv.org/abs/2506.00465v2

Аннотация

Традиционно проксимальные отображения Брегмана и огибающие Брегмана-Моро изучались для функций, определённых на всём пространстве Rn\mathbb{R}^n, хотя эти конструкции зависят только от значений функции внутри области определения функции расстояния-генератора (dgf). Хотя это соглашение практически безвредно в выпуклом случае, в невыпуклом случае оно приводит к существенным ограничениям, поскольку не может включать важные классы функций, такие как относительно слабо выпуклые функции. В данной работе мы пересматриваем фундаментальные аспекты анализа Брегмана, принимая точку зрения, учитывающую область определения: функции определяются на естественной области, индуцированной dgf, и свойства налагаются только относительно этого множества. Этот подход не только обобщает существующие результаты, но также исправляет и упрощает их формулировки и доказательства.

Исследовательский контекст и мотивация

Постановка проблемы

  1. Ограничения традиционной теории Брегмана: существующая литература обычно определяет функции на всём пространстве Rn\mathbb{R}^n, требуя, чтобы функции удовлетворяли собственности (properness) и полунепрерывности снизу (lower semicontinuity) на всём пространстве
  2. Несоответствие фактической зависимости: проксимальные отображения Брегмана и огибающие Моро фактически зависят только от значений функции на domϕ\text{dom}\phi и intdomϕ\text{int}\text{dom}\phi, где ϕ\phi — функция расстояния-генератор
  3. Исключение важных классов функций: традиционный подход исключает важные классы, такие как относительно слабо выпуклые функции, которые становятся выпуклыми при добавлении надлежащего кратного ϕ\phi

Исследовательская мотивация

  1. Теоретическая полнота: установить более естественную и полную структуру анализа Брегмана
  2. Расширение приложений: включить более широкий класс функций, особенно важных в невыпуклой оптимизации
  3. Упрощение теории: устранить ненужные технические предположения, упростить доказательства и формулировки

Основные вклады

  1. Предложение структуры, учитывающей область определения: функции определяются на естественной области X:=domϕX := \text{dom}\phi и Y:=intdomϕY := \text{int}\text{dom}\phi, а не на всём Rn\mathbb{R}^n
  2. Исправление существующих результатов: уточнение неточных утверждений в литературе о непрерывности и полунепрерывности
  3. Расширение области применения: включение классов функций, которые не могут быть расширены на всё пространство с сохранением свойств
  4. Установление связи Φ\Phi-сопряжённости: размещение операторов Брегмана в рамках теории Φ\Phi-выпуклости
  5. Новая характеризация относительной гладкости: предоставление новых эквивалентных условий для относительной гладкости, связывающих остаточную коэрцитивность Брегмана и анизотропную сильную выпуклость

Детальное описание методов

Базовая установка

Функция расстояния-генератор: ϕ:RnR\phi: \mathbb{R}^n \to \overline{\mathbb{R}} является собственной, полунепрерывной снизу, выпуклой и дифференцируемой на intdomϕ\text{int}\text{dom}\phi \neq \emptyset. Определим:

  • X:=domϕX := \text{dom}\phi
  • Y:=intdomϕY := \text{int}\text{dom}\phi

Расстояние Брегмана: Dϕ(x,y)={ϕ(x)ϕ(y)ϕ(y),xyесли yintdomϕиначеD_\phi(x,y) = \begin{cases} \phi(x) - \phi(y) - \langle\nabla\phi(y), x-y\rangle & \text{если } y \in \text{int}\text{dom}\phi \\ \infty & \text{иначе} \end{cases}

Определение основных операторов

Левое проксимальное отображение Брегмана: для f:XRf: X \to \overline{\mathbb{R}}, proxλfϕ(yˉ):=argminxX{f(x)+1λDϕ(x,yˉ)}\overleftarrow{\text{prox}}^{\phi}_{\lambda f}(\bar{y}) := \arg\min_{x \in X} \left\{f(x) + \frac{1}{\lambda}D_\phi(x, \bar{y})\right\}

Правое проксимальное отображение Брегмана: для g:YRg: Y \to \overline{\mathbb{R}}, proxλgϕ(xˉ):=argminyY{g(y)+1λDϕ(xˉ,y)}\overrightarrow{\text{prox}}^{\phi}_{\lambda g}(\bar{x}) := \arg\min_{y \in Y} \left\{g(y) + \frac{1}{\lambda}D_\phi(\bar{x}, y)\right\}

Огибающая Брегмана-Моро: соответственно определяются левая и правая функции огибающей.

Технические инновации

  1. Метод ограничения области: избежание технических трудностей при расширении функций путём ограничения области определения и значений операторов на естественные множества
  2. Обработка относительной топологии: систематическое рассмотрение свойств топологии на подмножествах, таких как относительная непрерывность и компактность
  3. Теория канонического расширения: установление теории канонического расширения функций и операторов на всё пространство с сохранением ключевых свойств

Теоретические результаты

Свойства левых операторов

Теорема 3.10: Пусть ϕ\phi является 1-коэрцитивной, f:XRf: X \to \overline{\mathbb{R}} является собственной, полунепрерывной снизу, ϕ\phi-приближённо ограниченной. Для любого λ(0,λfϕ)\lambda \in (0, \lambda^{\phi}_f):

  1. domenvλfϕ=domproxλfϕ=Y\text{dom}\overleftarrow{\text{env}}^{\phi}_{\lambda f} = \text{dom}\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = Y
  2. envλfϕ:YR\overleftarrow{\text{env}}^{\phi}_{\lambda f}: Y \to \mathbb{R} является непрерывной
  3. proxλfϕ:YX\overleftarrow{\text{prox}}^{\phi}_{\lambda f}: Y \rightrightarrows X является компактнозначным и полунепрерывным сверху

Анализ правых операторов

Теорема 3.23: Пусть domϕ=Rn\text{dom}\phi = \mathbb{R}^n, g:YRg: Y \to \overline{\mathbb{R}} является собственной, правой ϕ\phi-приближённо ограниченной. Для λ(0,λgϕ)\lambda \in (0, \lambda^{\phi}_{\vec{g}}):

  1. envλgϕ:XR\overrightarrow{\text{env}}^{\phi}_{\lambda g}: X \to \mathbb{R} является локально липшицевой
  2. При надлежащих условиях ϕproxλgϕ\nabla\phi \circ \overrightarrow{\text{prox}}^{\phi}_{\lambda g} является локально ограниченной, внешне полунепрерывной, полунепрерывной сверху

Перспектива Φ\Phi-сопряжённости

Посредством установления Φ=1λDϕ\Phi = -\frac{1}{\lambda}D_\phi устанавливается связь с теорией Φ\Phi-выпуклости:

Следствие 4.6:

  • fΦ=envλfϕf^{\Phi} = -\overleftarrow{\text{env}}^{\phi}_{\lambda f}
  • fΦΨ=hullλfϕf^{\Phi\Psi} = \overleftarrow{\text{hull}}^{\phi}_{\lambda f}
  • proxλfϕ=(Φf)1\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = (\partial_{\Phi}f)^{-1}

Новая характеризация относительной гладкости

Теорема 4.10: Пусть ϕ\phi является Лежандровой и 1-коэрцитивной, f:XRf: X \to \overline{\mathbb{R}} является собственной, полунепрерывной снизу, выпуклой. Следующие условия эквивалентны:

  1. ff является BϕB_\phi-гладкой
  2. domf=X\text{dom}f = X и на intX\text{int}X имеем f=ϕf~Φ^()f = \phi - \tilde{f}^{*\hat{\Phi}*}(-\cdot)
  3. ff удовлетворяет расширённому неравенству BϕB_\phi-остаточной коэрцитивности
  4. Преобразование Фенхеля f~\tilde{f}^* удовлетворяет неравенству aϕa_{\phi^*}-сильной выпуклости

Анализ примеров

Пример 3.12: Логарифмический случай

Пусть ϕ(x)=ln(x)\phi(x) = -\ln(x) для xX=(0,)x \in X = (0,\infty), f(x)=ln(x)f(x) = \ln(x). Хотя ff не может быть расширена на R\mathbb{R} как собственная полунепрерывная снизу функция, в рамках данного подхода она обладает хорошими свойствами.

Пример 3.24: Значимость правого проксимального отображения

Построение примера, демонстрирующего, что лишь свойства Лежандра и вещественнозначности недостаточны для гарантирования непустоты правого проксимального отображения; требуется дополнительное условие полунепрерывности снизу.

Связанные работы

Данная работа основана на следующих важных исследованиях:

  1. Kan & Song (2012): фундаментальная теория огибающих Моро и проксимальных отображений в смысле Брегмана
  2. Laude et al. (2023): теория Φ\Phi-выпуклости и двойственность
  3. Bauschke & Combettes (2017): выпуклый анализ и теория монотонных операторов
  4. Rockafellar & Wets (1998): основы вариационного анализа

По сравнению с существующими работами, основные отличия данной статьи заключаются в:

  • Систематическом применении точки зрения, учитывающей область определения
  • Исправлении неточных утверждений в литературе
  • Расширении на более широкий класс функций

Заключение и обсуждение

Основные выводы

  1. Преимущества метода, учитывающего область определения: получение более лаконичной и общей теории путём определения операторов на естественной области
  2. Исправление существующих результатов: уточнение неточных утверждений о непрерывности и полунепрерывности
  3. Теоретическое объединение: размещение операторов Брегмана в единой структуре Φ\Phi-выпуклости

Ограничения

  1. Предположения о выпуклости: многие результаты по-прежнему требуют базовых предположений о выпуклости
  2. Технические условия: некоторые результаты требуют технических условий, таких как 1-коэрцитивность
  3. Вычислительная сложность: недостаточное обсуждение вычислительной сложности алгоритмической реализации

Направления будущих исследований

  1. Исследование огибающих Кли: расширение метода, учитывающего область определения, на огибающие Кли
  2. Недифференцируемые функции расстояния-генераторы: ослабление требования дифференцируемости функции расстояния-генератора
  3. Алгоритмические приложения: разработка алгоритмов оптимизации на основе новой теоретической структуры

Глубокая оценка

Достоинства

  1. Теоретическая строгость: систематическое рассмотрение проблем ограничения области, заполнение пробелов в теории
  2. Практическая ценность: расширение класса обрабатываемых функций, особенно относительно слабо выпуклых функций
  3. Ясность изложения: чёткая структура статьи, подробные доказательства, богатые примеры
  4. Ценность исправления: уточнение неточностей в существующей литературе

Недостатки

  1. Ограниченные примеры приложений: отсутствие конкретных примеров применения к задачам оптимизации
  2. Вычислительные аспекты: недостаточное обсуждение реализации алгоритмов и вычислительной сложности
  3. Расширение на невыпуклый случай: хотя мотивация касается невыпуклого случая, основные результаты сосредоточены на выпуклом случае

Влияние

  1. Теоретический вклад: предоставление более прочной теоретической базы для анализа Брегмана
  2. Методологическая ценность: метод, учитывающий область определения, может вдохновить аналогичные исследования в других областях
  3. Практический потенциал: предоставление новых инструментов для обработки задач с ограничениями и нестандартных классов функций

Сценарии применения

  1. Условная оптимизация: задачи оптимизации, где функции естественно определены на ограниченных множествах
  2. Оптимизация с относительной гладкостью: разработка алгоритмов оптимизации для функций с относительной гладкостью
  3. Методы Брегмана: теоретический анализ различных итерационных методов Брегмана

Библиография

Статья цитирует 43 важных источника, включающих:

  • Классические учебники по выпуклому анализу (Rockafellar, Bauschke & Combettes)
  • Фундаментальные работы по методам Брегмана (Kan & Song, Bauschke et al.)
  • Современную теорию Φ\Phi-выпуклости (Laude et al.)
  • Теорию относительной гладкости (Lu et al., Bauschke et al.)