2025-11-10T02:47:10.641667

On the natural domain of Bregman operators

Themelis, Wang
The Bregman proximal mapping and Bregman-Moreau envelope are traditionally studied for functions defined on the entire space $\mathbb{R}^n$, even though these constructions depend only on the values of the function within (the interior of) the domain of the distance-generating function (dgf). While this convention is largely harmless in the convex setting, it leads to substantial limitations in the nonconvex case, as it fails to embrace important classes of functions such as relatively weakly convex ones. In this work, we revisit foundational aspects of Bregman analysis by adopting a domain-aware perspective: we define functions on the natural domain induced by the dgf and impose properties only relative to this set. This framework not only generalizes existing results but also rectifies and simplifies their statements and proofs. Several examples illustrate both the necessity of our assumptions and the advantages of this refined approach.
academic

Bregman 연산자의 자연 정의역에 관하여

기본 정보

  • 논문 ID: 2506.00465
  • 제목: Bregman 연산자의 자연 정의역에 관하여
  • 저자: Andreas Themelis (규슈대학교), Ziyuan Wang (빈 대학교)
  • 분류: math.OC (수학 최적화 및 제어)
  • 제출 시간: 2025년 1월
  • 논문 링크: https://arxiv.org/abs/2506.00465v2

초록

전통적으로 Bregman 근사 사상(proximal mapping)과 Bregman-Moreau 포락선(envelope)은 전체 공간 Rn\mathbb{R}^n에서 정의된 함수에 대해 연구되어 왔습니다. 그러나 이러한 구성은 거리 생성 함수(distance generating function, dgf)의 정의역(내부)에서만 함수값에 의존합니다. 볼록 설정에서는 이러한 관례가 본질적으로 무해하지만, 비볼록의 경우 상대적으로 약볼록인 함수(relatively weakly convex functions)와 같은 중요한 함수 클래스를 포함할 수 없다는 실질적인 제약을 초래합니다. 본 논문은 정의역 인식 관점을 채택하여 Bregman 분석의 기초적 측면을 재검토합니다. dgf가 유도하는 자연 정의역 위에서 함수를 정의하고, 이 집합에 대해서만 성질을 부과합니다. 이 프레임워크는 기존 결과를 일반화할 뿐만 아니라 그 진술과 증명을 수정하고 단순화합니다.

연구 배경 및 동기

문제 배경

  1. 전통적 Bregman 이론의 한계: 기존 문헌은 일반적으로 함수를 전체 공간 Rn\mathbb{R}^n에서 정의하며, 함수가 전체 공간에서 적절성(properness)과 하반연속성(lower semicontinuity)을 만족하도록 요구합니다.
  2. 실제 의존성의 불일치: Bregman 근사 사상과 Moreau 포락선은 실제로 domϕ\text{dom}\phiintdomϕ\text{int}\text{dom}\phi에서의 함수값에만 의존합니다. 여기서 ϕ\phi는 거리 생성 함수입니다.
  3. 중요한 함수 클래스의 배제: 전통적 방법은 상대적으로 약볼록인 함수 등 중요한 클래스를 배제합니다. 이들 함수는 적절한 ϕ\phi의 배수를 더함으로써 볼록 함수가 될 수 있습니다.

연구 동기

  1. 이론적 완전성: 더욱 자연스럽고 완전한 Bregman 분석 프레임워크 수립
  2. 응용 확대: 더 광범위한 함수 클래스, 특히 비볼록 최적화에서 중요한 상대적으로 약볼록인 함수 포함
  3. 이론 단순화: 불필요한 기술적 가정 제거, 증명과 진술 단순화

핵심 기여

  1. 정의역 인식 프레임워크 제안: 함수를 자연 정의역 X:=domϕX := \text{dom}\phiY:=intdomϕY := \text{int}\text{dom}\phi 위에서 정의하며, 전체 Rn\mathbb{R}^n에서 정의하지 않음
  2. 기존 결과 수정: 문헌의 연속성과 반연속성에 관한 부정확한 진술 수정
  3. 적용 범위 확대: 전체 공간으로 확장하면서 성질을 유지할 수 없는 함수 클래스 포함
  4. Φ\Phi-켤레 관계 수립: Bregman 연산자를 Φ\Phi-볼록성 이론 프레임워크에 배치
  5. 상대적 매끄러움의 새로운 특성화: 상대적 매끄러움의 새로운 동치 조건 제공, Bregman 잉여 강제성과 이방성 강볼록성 연결

방법론 상세 설명

기초 설정

거리 생성 함수: ϕ:RnR\phi: \mathbb{R}^n \to \overline{\mathbb{R}}는 적절하고, 하반연속이며, 볼록이고, intdomϕ\text{int}\text{dom}\phi \neq \emptyset에서 미분가능합니다. 다음을 정의합니다:

  • X:=domϕX := \text{dom}\phi
  • Y:=intdomϕY := \text{int}\text{dom}\phi

Bregman 거리:

\phi(x) - \phi(y) - \langle\nabla\phi(y), x-y\rangle & \text{if } y \in \text{int}\text{dom}\phi \\ \infty & \text{otherwise} \end{cases}$$ ### 핵심 연산자 정의 **좌측 Bregman 근사 사상**: $f: X \to \overline{\mathbb{R}}$에 대해, $$\overleftarrow{\text{prox}}^{\phi}_{\lambda f}(\bar{y}) := \arg\min_{x \in X} \left\{f(x) + \frac{1}{\lambda}D_\phi(x, \bar{y})\right\}$$ **우측 Bregman 근사 사상**: $g: Y \to \overline{\mathbb{R}}$에 대해, $$\overrightarrow{\text{prox}}^{\phi}_{\lambda g}(\bar{x}) := \arg\min_{y \in Y} \left\{g(y) + \frac{1}{\lambda}D_\phi(\bar{x}, y)\right\}$$ **Bregman-Moreau 포락선**: 상응하는 좌측 및 우측 포락선 함수를 정의합니다. ### 기술적 혁신점 1. **정의역 제한 방법**: 연산자의 정의역과 치역을 자연 집합으로 제한함으로써 함수 확장 시 기술적 어려움 회피 2. **상대적 위상 처리**: 부분집합 위의 위상 성질(상대적 연속성과 컴팩트성 등) 체계적 처리 3. **정준 확장 이론**: 함수와 연산자의 전체 공간으로의 정준 확장 이론 수립, 핵심 성질 유지 ## 이론적 결과 ### 좌측 연산자의 성질 **정리 3.10**: $\phi$가 1-강제적이고, $f: X \to \overline{\mathbb{R}}$가 적절하고, 하반연속이며, $\phi$-근사 유계라고 하자. 모든 $\lambda \in (0, \lambda^{\phi}_f)$에 대해: 1. $\text{dom}\overleftarrow{\text{env}}^{\phi}_{\lambda f} = \text{dom}\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = Y$ 2. $\overleftarrow{\text{env}}^{\phi}_{\lambda f}: Y \to \mathbb{R}$는 연속 3. $\overleftarrow{\text{prox}}^{\phi}_{\lambda f}: Y \rightrightarrows X$는 컴팩트값이고 상반연속 ### 우측 연산자의 분석 **정리 3.23**: $\text{dom}\phi = \mathbb{R}^n$이고, $g: Y \to \overline{\mathbb{R}}$가 적절하고 우측 $\phi$-근사 유계라고 하자. $\lambda \in (0, \lambda^{\phi}_{\vec{g}})$에 대해: 1. $\overrightarrow{\text{env}}^{\phi}_{\lambda g}: X \to \mathbb{R}$는 국소 Lipschitz 연속 2. 적절한 조건 하에서, $\nabla\phi \circ \overrightarrow{\text{prox}}^{\phi}_{\lambda g}$는 국소 유계, 외반연속, 상반연속 ### $\Phi$-켤레 관점 $\Phi = -\frac{1}{\lambda}D_\phi$를 설정함으로써 $\Phi$-볼록성 이론과의 연결을 수립합니다: **따름정리 4.6**: - $f^{\Phi} = -\overleftarrow{\text{env}}^{\phi}_{\lambda f}$ - $f^{\Phi\Psi} = \overleftarrow{\text{hull}}^{\phi}_{\lambda f}$ - $\overleftarrow{\text{prox}}^{\phi}_{\lambda f} = (\partial_{\Phi}f)^{-1}$ ### 상대적 매끄러움의 새로운 특성화 **정리 4.10**: $\phi$가 Legendre이고 1-강제적이며, $f: X \to \overline{\mathbb{R}}$가 적절하고 하반연속이며 볼록이라고 하자. 다음은 동치입니다: 1. $f$는 $B_\phi$-매끄러움 2. $\text{dom}f = X$이고 $\text{int}X$에서 $f = \phi - \tilde{f}^{*\hat{\Phi}*}(-\cdot)$ 3. $f$는 확장된 $B_\phi$-잉여 강제성 부등식 만족 4. Fenchel 켤레 $\tilde{f}^*$는 $a_{\phi^*}$-강볼록성 부등식 만족 ## 구체적 예시 분석 ### 예 3.12: 로그 경우 $\phi(x) = -\ln(x)$ (단, $x \in X = (0,\infty)$), $f(x) = \ln(x)$라 하자. $f$는 $\mathbb{R}$에서 적절한 하반연속 함수로 확장될 수 없지만, 본 프레임워크 내에서는 여전히 좋은 성질을 누립니다. ### 예 3.24: 우측 근사 사상의 중요성 Legendre 성질과 실수값성만으로는 우측 근사 사상의 비공성을 보장하기에 충분하지 않으며, 추가적인 하반연속성 조건이 필요함을 보이는 예시를 구성합니다. ## 관련 연구 본 논문은 다음의 중요한 연구를 기반으로 합니다: 1. **Kan & Song (2012)**: Bregman 의미의 Moreau 포락선과 근사 사상의 기초 이론 2. **Laude et al. (2023)**: $\Phi$-볼록성 이론과 쌍대성 3. **Bauschke & Combettes (2017)**: 볼록 분석과 단조 연산자 이론 4. **Rockafellar & Wets (1998)**: 변분 분석 기초 기존 연구와 비교한 본 논문의 주요 차이점: - 정의역 제한 관점의 체계적 채택 - 문헌의 부정확한 진술 수정 - 더 광범위한 함수 클래스로의 확대 ## 결론 및 논의 ### 주요 결론 1. **정의역 인식 방법의 장점**: 자연 정의역 위에서 연산자를 정의함으로써 더욱 간결하고 일반적인 이론 획득 2. **기존 결과의 수정**: 연속성과 반연속성에 관한 부정확한 진술 수정 3. **이론적 통일**: Bregman 연산자를 $\Phi$-볼록성의 통일된 프레임워크에 배치 ### 한계점 1. **볼록성 가정**: 많은 결과가 여전히 기저의 볼록성 가정 필요 2. **기술적 조건**: 일부 결과는 1-강제성 등의 기술적 조건 필요 3. **계산 복잡성**: 알고리즘 구현의 계산 복잡성에 대한 상세 논의 부족 ### 향후 방향 1. **Klee 포락선 연구**: 정의역 인식 방법을 Klee 포락선으로 확대 2. **비미분가능 dgf**: 거리 생성 함수의 미분가능성 요구 완화 3. **알고리즘 응용**: 새로운 이론 프레임워크 기반 최적화 알고리즘 개발 ## 심층 평가 ### 장점 1. **이론적 엄밀성**: 정의역 제한 문제를 체계적으로 처리하여 이론적 공백 메움 2. **실용적 가치**: 처리 가능한 함수 클래스 확대, 특히 상대적으로 약볼록인 함수 3. **명확한 저술**: 논문 구조가 명확하고 증명이 상세하며 예시가 풍부 4. **수정의 가치**: 기존 문헌의 부정확한 부분 수정 ### 부족한 점 1. **응용 예시 제한**: 구체적 최적화 문제의 응용 사례 부족 2. **계산 측면**: 알고리즘 구현 및 계산 복잡성 논의 부족 3. **비볼록 확대**: 동기는 비볼록 경우를 포함하지만, 주요 결과는 여전히 볼록 설정에 집중 ### 영향력 1. **이론적 기여**: Bregman 분석에 더욱 견고한 이론적 기초 제공 2. **방법론적 가치**: 정의역 인식 방법이 다른 분야의 유사 연구에 영감 제공 가능 3. **실용적 잠재력**: 제약 최적화 및 비표준 함수 클래스 처리를 위한 새로운 도구 제공 ### 적용 분야 1. **제약 최적화**: 함수가 자연스럽게 제약 집합에서 정의되는 최적화 문제 2. **상대적 매끄러움 최적화**: 상대적으로 매끄러운 함수를 포함하는 최적화 알고리즘 설계 3. **Bregman 방법**: 다양한 Bregman 반복 방법의 이론적 분석 ## 참고문헌 논문은 43편의 중요 문헌을 인용하며, 주요 내용은 다음을 포함합니다: - 볼록 분석 고전 교과서 (Rockafellar, Bauschke & Combettes) - Bregman 방법 기초 문헌 (Kan & Song, Bauschke et al.) - 최신 $\Phi$-볼록성 이론 (Laude et al.) - 상대적 매끄러움 이론 (Lu et al., Bauschke et al.)