We define a stochastic variant of the proximal point algorithm in the general setting of nonlinear (separable) Hadamard spaces for approximating zeros of the mean of a stochastically perturbed monotone vector field and prove its convergence under a suitable strong monotonicity assumption, together with a probabilistic independence assumption and a separability assumption on the tangent spaces. As a particular case, our results transfer previous work by P. Bianchi on that method in Hilbert spaces for the first time to Hadamard manifolds. Moreover, our convergence proof is fully effective and allows for the construction of explicit rates of convergence for the iteration towards the (unique) solution both in mean and almost surely. These rates are moreover highly uniform, being independent of most data surrounding the iteration, space or distribution. In that generality, these rates are novel already in the context of Hilbert spaces. Linear nonasymptotic guarantees under additional second-moment conditions on the Yosida approximates and special cases of stochastic convex minimization are discussed.
- 論文ID: 2510.10697
- タイトル: Mean-square and linear convergence of a stochastic proximal point algorithm in metric spaces of nonpositive curvature
- 著者: Nicholas Pischke (University of Bath)
- 分類: math.OC (最適化と制御)、cs.LG (機械学習)
- 発表日時: 2025年10月14日 (arXiv プレプリント)
- 論文リンク: https://arxiv.org/abs/2510.10697
本論文は、可分離Hadamard空間の一般的な非線形設定において、確率的に摂動された単調ベクトル場の平均値の零点を近似するための確率的近接点アルゴリズムの確率的変種を定義する。適切な強単調性仮定、確率的独立性仮定、および接空間の可分性仮定の下で、アルゴリズムの収束性を証明する。特殊な場合として、P. Bianchによるヒルベルト空間での関連研究をHadamard多様体に初めて一般化する。収束証明は完全に有効であり、反復から唯一解への明示的な収束率の構成を可能にする。これには平均収束と概ほぼ確実収束が含まれる。これらの収束率は高度に一貫性があり、反復、空間、または分布のほとんどのデータに依存しない。
- 解決すべき問題:
- 非線形度量空間における確率的最適化問題の求解:minx∈X∫f(ξ,x)dμ(ξ)
- ヒルベルト空間から非正曲率度量空間へのより一般的な確率的近接点アルゴリズムの一般化
- 問題の重要性:
- 確率的近似は機械学習と最適化の中核的課題である
- 非線形空間上の最適化は機械学習で広く応用されている(例:多様体学習)
- 既存理論は主にヒルベルト空間に限定され、非線形空間の理論的基礎が不足している
- 既存手法の限界:
- Bianchの研究はヒルベルト空間にのみ適用可能
- 明示的な収束率分析が不足している
- 非線形空間における確率的近接点アルゴリズム理論が不完全である
- 研究動機:
- 成熟したヒルベルト空間理論をCAT(0)空間とHadamard多様体に一般化する
- 明示的で一貫性のある収束率分析を提供する
- 非線形空間における確率的最適化の理論的基礎を確立する
- 理論的一般化:確率的近接点アルゴリズムをヒルベルト空間から可分離Hadamard空間に初めて一般化
- 収束性分析:強単調性仮定の下での強収束性を証明。平均収束とほぼ確実収束を含む
- 明示的収束率:反復パラメータの大部分に依存しない高度に一貫性のある明示的収束率を構成
- 技術的革新:度量空間における確率的単調ベクトル場理論とAumann-Sturm積分を発展させた
- 応用拡張:ヒルベルト空間とHadamard多様体を特殊な場合として包含
確率空間(E,E,μ)と可分離Hadamard空間Xが与えられたとき、確率的単調ベクトル場A:E×X→2TXを考える。ここでA(s,x)⊆TxXである。目標は平均作用素Aˉ(x):=∫A(s,x)dμ(s)の零点を見つけることである。
確率的近接点アルゴリズム (SPPA):
xn+1:=Jλn(ξn+1,xn)
ここで:
- x0∈Xは初期点
- (λn)⊆(0,∞)はパラメータ列で、(λn)∈ℓ+2∖ℓ+1を満たす
- (ξn+1)は分布μを持つ独立同分布確率変数列
- Jλ(s,x):={z∈X∣λ1logzx∈A(s,z)}は解作用素
- 度量空間の幾何学的構造:
- CAT(0)空間:非正曲率条件を満たす完備測地度量空間
- 接空間TxX:Aleksandrov角度とユークリッド錐を通じて構成
- 準内積:gx(tγ,sη):=tscos∠x(γ,η)
- 単調ベクトル場:
(x,u),(y,v)∈Aに対して、以下を満たす:
gx(u,logxy)≤−gy(v,logyx)
強単調性(パラメータα>0):
gx(u,logxy)≤−gy(v,logyx)−αd2(x,y) - Yosida近似:
Aλ(s,x):=λ1logJλ(s,x)x
- 度量空間における確率論:Stumの積分理論を利用して度量空間上の確率変数理論を確立
- Aumann-Sturm積分:Aumann積分を度量空間の集値写像に一般化
- 確率的準Fejér単調性:反復の確率的挙動を制御するための2つの主要な不等式を確立
- 独立性仮定:非線形空間の技術的困難に対処するため、En[gx∗(ϕ∗(ξn+1),logx∗xn)]=0という条件を導入
- (A0) パラメータ条件:(λn)∈ℓ+2∖ℓ+1、(ξn+1)は独立同分布
- (A1) 強単調性:A(s,⋅)は強単調で、モジュラスα(s)>0、かつ∫αdμ>0
- (A2) 零点の存在性:唯一の零点x∗∈ZA(2)が存在
- (A3) 独立性:En[gx∗(ϕ∗(ξn+1),logx∗xn)]=0
定理 4.7(主要収束結果):
仮定(A0)-(A3)の下で、確率的近接点アルゴリズムは以下を満たす:
- 平均収束:E[d2(xn,x∗)]→0
- ほぼ確実収束:d2(xn,x∗)→0 a.s.
- 明示的収束率:
∀ε>0,∀n≥ρ(ε):E[d2(xn,x∗)]<ε
ここでρ(ε):=θ(χ(ε/2c),2D/ε)
定理 4.11(高速収束率):
追加の二次モーメント有界性仮定(A4)の下で、λn=1/[α(n+2)]に対して:
E[d2(xn,x∗)]≤n+2u
系 4.10:強凸積分関数F(x):=∫f(s,x)dτ(s)に対して、アルゴリズムxn+1:=proxλnf(ξn+1,xn)はFの最小値点に収束する。
- ヒルベルト空間:特殊な場合として、Bianchの元の結果を回復し、新しい収束率を提供
- Hadamard多様体:この設定における確率的近接点アルゴリズム理論を初めて確立
- その他のCAT(0)空間:例えば、木空間、特定の度量グラフなど
補題 4.1(確率的準Fejér単調性I):
En[d2(xn+1,x∗)]≤d2(xn,x∗)−λn2(1−2β)En[∥Aλn(ξn+1,xn)∥xn+12]+2βλn2∫∥ϕ∗∥x∗2dμ
補題 4.3(確率的準Fejér単調性II):
En[d2(xn+1,x∗)]≤(1+2λn2)d2(xn,x∗)−2λnαd2(xn,x∗)+λn2Vn
- Berg-Nikolaev準内積の幾何学的性質を利用
- 強単調性とCAT(0)空間の非正曲率性を適用
- 上マルチンゲールを構成し、Villeの不等式を適用
- Robbins-Siegmund補題の量化版を使用
- Bianchi (2016):ヒルベルト空間における確率的近接点アルゴリズム
- Li, López, Martín-Márquez (2009):Hadamard多様体上の決定論的近接点アルゴリズム
- Bačák (2013, 2018):CAT(0)空間における近接点アルゴリズムと確率的凸最小化
- Chaipunya, Kohsaka, Kumam (2021):CAT(0)空間における単調ベクトル場理論
- 確率的近接点アルゴリズムを非正曲率度量空間に成功裏に一般化
- 強単調性仮定の下での強収束性を証明
- 高度に一貫性のある明示的収束率を提供
- 非線形空間における確率的最適化の理論的基礎を確立
- 接空間の可分性仮定が必要であり、一般的なCAT(0)空間では検証が困難
- 独立性仮定(A3)は適用範囲を制限し、主に平坦曲率の接空間に適用可能
- 一般的な場合の収束率は指数的であり、比較的遅い
- 強単調性仮定が必要であり、多くの実用的応用を除外している
- 弱収束結果の研究、強単調性仮定の緩和
- 高速収束率をより一般的な設定に拡張
- 他の非線形空間上の確率的最適化アルゴリズムの研究
- 多様体上の機械学習問題など実用的応用の探索
- 理論的革新:確率的近接点アルゴリズムを非線形空間に初めて体系的に一般化
- 技術的深さ:度量幾何学、確率論、最適化理論を巧みに組み合わせた
- 結果の完全性:定性的および定量的な収束分析を提供
- 方法論の汎用性:複数の重要な幾何学的空間に適用可能
- 仮定の制限:独立性仮定と可分性仮定が適用範囲を制限
- 収束速度:一般的な場合の収束率が遅い
- 実験的検証:理論結果を検証する数値実験が不足
- 実用性:理論的性質が強く、実用的応用の開発が必要
- 学術的価値:非線形空間における確率的最適化に重要な理論的基礎を提供
- 方法論的貢献:線形空間の最適化理論を非線形設定に一般化する方法を示す
- 後続研究:関連分野のさらなる研究の基礎を確立
- Hadamard多様体上の最適化問題
- 木空間における統計的推論
- 非正曲率空間における機械学習アルゴリズム
- 幾何統計と形状分析
本論文は64篇の関連文献を引用しており、主に以下を含む:
- CAT(0)空間理論の基礎文献(Bridson & Haefliger, 1999)
- 度量空間上の確率論の開拓的研究(Sturm, 2002, 2003)
- 単調作用素理論の古典文献(Bauschke & Combettes, 2017)
- 関連する確率的最適化アルゴリズム研究
本論文は理論的に重要な意義を持ち、非線形空間における確率的最適化に厳密な数学的基礎を提供するが、実用的応用の面ではさらなる発展が必要である。