2025-11-10T02:47:10.641667

On the natural domain of Bregman operators

Themelis, Wang

The Bregman proximal mapping and Bregman-Moreau envelope are traditionally studied for functions defined on the entire space $\mathbb{R}^n$, even though these constructions depend only on the values of the function within (the interior of) the domain of the distance-generating function (dgf). While this convention is largely harmless in the convex setting, it leads to substantial limitations in the nonconvex case, as it fails to embrace important classes of functions such as relatively weakly convex ones. In this work, we revisit foundational aspects of Bregman analysis by adopting a domain-aware perspective: we define functions on the natural domain induced by the dgf and impose properties only relative to this set. This framework not only generalizes existing results but also rectifies and simplifies their statements and proofs. Several examples illustrate both the necessity of our assumptions and the advantages of this refined approach.

academic

О естественной области операторов Брегмана

Основная информация

ID статьи: 2506.00465
Название: On the natural domain of Bregman operators
Авторы: Andreas Themelis (Университет Кюсю), Ziyuan Wang (Венский университет)
Классификация: math.OC (математическая оптимизация и управление)
Время подачи: январь 2025
Ссылка на статью: https://arxiv.org/abs/2506.00465v2

Аннотация

Традиционно проксимальные отображения Брегмана и огибающие Брегмана-Моро изучались для функций, определённых на всём пространстве $\mathbb{R}^n$ , хотя эти конструкции зависят только от значений функции внутри области определения функции расстояния-генератора (dgf). Хотя это соглашение практически безвредно в выпуклом случае, в невыпуклом случае оно приводит к существенным ограничениям, поскольку не может включать важные классы функций, такие как относительно слабо выпуклые функции. В данной работе мы пересматриваем фундаментальные аспекты анализа Брегмана, принимая точку зрения, учитывающую область определения: функции определяются на естественной области, индуцированной dgf, и свойства налагаются только относительно этого множества. Этот подход не только обобщает существующие результаты, но также исправляет и упрощает их формулировки и доказательства.

Исследовательский контекст и мотивация

Постановка проблемы

Ограничения традиционной теории Брегмана: существующая литература обычно определяет функции на всём пространстве $\mathbb{R}^n$ , требуя, чтобы функции удовлетворяли собственности (properness) и полунепрерывности снизу (lower semicontinuity) на всём пространстве
Несоответствие фактической зависимости: проксимальные отображения Брегмана и огибающие Моро фактически зависят только от значений функции на $\text{dom}\phi$ и $\text{int}\text{dom}\phi$ , где $\phi$ — функция расстояния-генератор
Исключение важных классов функций: традиционный подход исключает важные классы, такие как относительно слабо выпуклые функции, которые становятся выпуклыми при добавлении надлежащего кратного $\phi$

Исследовательская мотивация

Теоретическая полнота: установить более естественную и полную структуру анализа Брегмана
Расширение приложений: включить более широкий класс функций, особенно важных в невыпуклой оптимизации
Упрощение теории: устранить ненужные технические предположения, упростить доказательства и формулировки

Основные вклады

Предложение структуры, учитывающей область определения: функции определяются на естественной области $X := \text{dom}\phi$ и $Y := \text{int}\text{dom}\phi$ , а не на всём $\mathbb{R}^n$
Исправление существующих результатов: уточнение неточных утверждений в литературе о непрерывности и полунепрерывности
Расширение области применения: включение классов функций, которые не могут быть расширены на всё пространство с сохранением свойств
Установление связи $\Phi$ -сопряжённости: размещение операторов Брегмана в рамках теории $\Phi$ -выпуклости
Новая характеризация относительной гладкости: предоставление новых эквивалентных условий для относительной гладкости, связывающих остаточную коэрцитивность Брегмана и анизотропную сильную выпуклость

Детальное описание методов

Базовая установка

Функция расстояния-генератор: $\phi: \mathbb{R}^n \to \overline{\mathbb{R}}$ является собственной, полунепрерывной снизу, выпуклой и дифференцируемой на $\text{int}\text{dom}\phi \neq \emptyset$ . Определим:

$X := \text{dom}\phi$
$Y := \text{int}\text{dom}\phi$

Расстояние Брегмана: $D_\phi(x,y) = \begin{cases} \phi(x) - \phi(y) - \langle\nabla\phi(y), x-y\rangle & \text{если } y \in \text{int}\text{dom}\phi \\ \infty & \text{иначе} \end{cases}$

Определение основных операторов

Левое проксимальное отображение Брегмана: для $f: X \to \overline{\mathbb{R}}$ , $\overleftarrow{\text{prox}}^{\phi}_{\lambda f}(\bar{y}) := \arg\min_{x \in X} \left\{f(x) + \frac{1}{\lambda}D_\phi(x, \bar{y})\right\}$

Правое проксимальное отображение Брегмана: для $g: Y \to \overline{\mathbb{R}}$ , $\overrightarrow{\text{prox}}^{\phi}_{\lambda g}(\bar{x}) := \arg\min_{y \in Y} \left\{g(y) + \frac{1}{\lambda}D_\phi(\bar{x}, y)\right\}$

Огибающая Брегмана-Моро: соответственно определяются левая и правая функции огибающей.

Технические инновации

Метод ограничения области: избежание технических трудностей при расширении функций путём ограничения области определения и значений операторов на естественные множества
Обработка относительной топологии: систематическое рассмотрение свойств топологии на подмножествах, таких как относительная непрерывность и компактность
Теория канонического расширения: установление теории канонического расширения функций и операторов на всё пространство с сохранением ключевых свойств

Теоретические результаты

Свойства левых операторов

Теорема 3.10: Пусть $\phi$ является 1-коэрцитивной, $f: X \to \overline{\mathbb{R}}$ является собственной, полунепрерывной снизу, $\phi$ -приближённо ограниченной. Для любого $\lambda \in (0, \lambda^{\phi}_f)$ :

$\text{dom}\overleftarrow{\text{env}}^{\phi}_{\lambda f} = \text{dom}\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = Y$
$\overleftarrow{\text{env}}^{\phi}_{\lambda f}: Y \to \mathbb{R}$ является непрерывной
$\overleftarrow{\text{prox}}^{\phi}_{\lambda f}: Y \rightrightarrows X$ является компактнозначным и полунепрерывным сверху

Анализ правых операторов

Теорема 3.23: Пусть $\text{dom}\phi = \mathbb{R}^n$ , $g: Y \to \overline{\mathbb{R}}$ является собственной, правой $\phi$ -приближённо ограниченной. Для $\lambda \in (0, \lambda^{\phi}_{\vec{g}})$ :

$\overrightarrow{\text{env}}^{\phi}_{\lambda g}: X \to \mathbb{R}$ является локально липшицевой
При надлежащих условиях $\nabla\phi \circ \overrightarrow{\text{prox}}^{\phi}_{\lambda g}$ является локально ограниченной, внешне полунепрерывной, полунепрерывной сверху

Перспектива $\Phi$ -сопряжённости

Посредством установления $\Phi = -\frac{1}{\lambda}D_\phi$ устанавливается связь с теорией $\Phi$ -выпуклости:

Следствие 4.6:

$f^{\Phi} = -\overleftarrow{\text{env}}^{\phi}_{\lambda f}$
$f^{\Phi\Psi} = \overleftarrow{\text{hull}}^{\phi}_{\lambda f}$
$\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = (\partial_{\Phi}f)^{-1}$

Новая характеризация относительной гладкости

Теорема 4.10: Пусть $\phi$ является Лежандровой и 1-коэрцитивной, $f: X \to \overline{\mathbb{R}}$ является собственной, полунепрерывной снизу, выпуклой. Следующие условия эквивалентны:

$f$ является $B_\phi$ -гладкой
$\text{dom}f = X$ и на $\text{int}X$ имеем $f = \phi - \tilde{f}^{*\hat{\Phi}*}(-\cdot)$
$f$ удовлетворяет расширённому неравенству $B_\phi$ -остаточной коэрцитивности
Преобразование Фенхеля $\tilde{f}^*$ удовлетворяет неравенству $a_{\phi^*}$ -сильной выпуклости

Kan & Song (2012): фундаментальная теория огибающих Моро и проксимальных отображений в смысле Брегмана
Laude et al. (2023): теория $\Phi$ -выпуклости и двойственность
Bauschke & Combettes (2017): выпуклый анализ и теория монотонных операторов
Rockafellar & Wets (1998): основы вариационного анализа

По сравнению с существующими работами, основные отличия данной статьи заключаются в:

Систематическом применении точки зрения, учитывающей область определения
Исправлении неточных утверждений в литературе
Расширении на более широкий класс функций

Заключение и обсуждение

Основные выводы

Преимущества метода, учитывающего область определения: получение более лаконичной и общей теории путём определения операторов на естественной области
Исправление существующих результатов: уточнение неточных утверждений о непрерывности и полунепрерывности
Теоретическое объединение: размещение операторов Брегмана в единой структуре $\Phi$ -выпуклости

Ограничения

Предположения о выпуклости: многие результаты по-прежнему требуют базовых предположений о выпуклости
Технические условия: некоторые результаты требуют технических условий, таких как 1-коэрцитивность
Вычислительная сложность: недостаточное обсуждение вычислительной сложности алгоритмической реализации

Направления будущих исследований

Исследование огибающих Кли: расширение метода, учитывающего область определения, на огибающие Кли
Недифференцируемые функции расстояния-генераторы: ослабление требования дифференцируемости функции расстояния-генератора
Алгоритмические приложения: разработка алгоритмов оптимизации на основе новой теоретической структуры

Глубокая оценка

Достоинства

Теоретическая строгость: систематическое рассмотрение проблем ограничения области, заполнение пробелов в теории
Практическая ценность: расширение класса обрабатываемых функций, особенно относительно слабо выпуклых функций
Ясность изложения: чёткая структура статьи, подробные доказательства, богатые примеры
Ценность исправления: уточнение неточностей в существующей литературе

Недостатки

Ограниченные примеры приложений: отсутствие конкретных примеров применения к задачам оптимизации
Вычислительные аспекты: недостаточное обсуждение реализации алгоритмов и вычислительной сложности
Расширение на невыпуклый случай: хотя мотивация касается невыпуклого случая, основные результаты сосредоточены на выпуклом случае

Влияние

Теоретический вклад: предоставление более прочной теоретической базы для анализа Брегмана
Методологическая ценность: метод, учитывающий область определения, может вдохновить аналогичные исследования в других областях
Практический потенциал: предоставление новых инструментов для обработки задач с ограничениями и нестандартных классов функций

Сценарии применения

Условная оптимизация: задачи оптимизации, где функции естественно определены на ограниченных множествах
Оптимизация с относительной гладкостью: разработка алгоритмов оптимизации для функций с относительной гладкостью
Методы Брегмана: теоретический анализ различных итерационных методов Брегмана

Библиография

Статья цитирует 43 важных источника, включающих:

Классические учебники по выпуклому анализу (Rockafellar, Bauschke & Combettes)
Фундаментальные работы по методам Брегмана (Kan & Song, Bauschke et al.)
Современную теорию $\Phi$ -выпуклости (Laude et al.)
Теорию относительной гладкости (Lu et al., Bauschke et al.)