We study Whitney-type estimates for approximation of convex functions in the uniform norm on various convex multivariate domains while paying a particular attention to the dependence of the involved constants on the dimension and the geometry of the domain.
论文ID : 2311.00912标题 : Whitney-type estimates for convex functions作者 : Jaskaran Singh Kaire, Andriy Prymak (University of Manitoba)分类 : math.CA cs.NA math.NA发表时间 : 2023年11月 (arXiv预印本,最新版本2025年8月)论文链接 : https://arxiv.org/abs/2311.00912 本文研究了在各种凸多变量域上用一致范数逼近凸函数的Whitney型估计,特别关注相关常数对维数和域几何的依赖性。
本文研究Whitney型不等式在凸函数逼近中的应用。传统的Whitney不等式建立了函数的逼近误差与其光滑性模量之间的关系,但对于凸函数这一特殊类别,现有理论尚不完善。
理论意义 : Whitney型估计是逼近理论的基础工具,用于构造分片多项式逼近并界定局部逼近误差实际应用 : 在数据科学中处理高维数据时,理解常数对维数的依赖性至关重要几何洞察 : 研究域的几何形状如何影响逼近性质一般函数的Whitney常数随维数增长较快 对于凸函数的特殊性质利用不充分 保形逼近(要求逼近多项式也为凸函数)的理论不完善 通过利用凸性约束,期望获得更好的逼近率和更小的Whitney常数,特别是在高维情况下。
建立了凸函数Whitney常数的精确渐近行为 :证明了 lim n → ∞ w ^ 2 , n log 2 n = 1 4 \lim_{n→∞} \frac{\widehat{w}_{2,n}}{\log_2 n} = \frac{1}{4} lim n → ∞ l o g 2 n w 2 , n = 4 1 ,比一般函数的 1 2 \frac{1}{2} 2 1 小一半给出了中心对称域上的精确结果 :对任意中心对称凸域 K K K ,有 w ^ 2 ( K ) = 1 2 \widehat{w}_2(K) = \frac{1}{2} w 2 ( K ) = 2 1 证明了高阶情况下的等价性 :当 m ≥ 3 m ≥ 3 m ≥ 3 时,w ^ m ( K ) = w m ( K ) \widehat{w}_m(K) = w_m(K) w m ( K ) = w m ( K ) 建立了保凸逼近的理论框架 :给出了保凸逼近常数的上界,依赖于域的Banach-Mazur距离提供了保凸逼近的负面结果 :证明了 m ≥ 4 m ≥ 4 m ≥ 4 时保凸Whitney常数为无穷大设 K ⊂ R n K \subset \mathbb{R}^n K ⊂ R n 为凸体,定义三类Whitney常数:
一般Whitney常数 : w m ( K ) : = sup { E m − 1 ( f ; K ) : f ∈ C ( K ) , ω m ( f ; K ) ≤ 1 } w_m(K) := \sup\{E_{m-1}(f;K) : f \in C(K), \omega_m(f;K) \leq 1\} w m ( K ) := sup { E m − 1 ( f ; K ) : f ∈ C ( K ) , ω m ( f ; K ) ≤ 1 } 凸函数Whitney常数 : w ^ m ( K ) : = sup { E m − 1 ( f ; K ) : f ∈ C ^ ( K ) , ω m ( f ; K ) ≤ 1 } \widehat{w}_m(K) := \sup\{E_{m-1}(f;K) : f \in \widehat{C}(K), \omega_m(f;K) \leq 1\} w m ( K ) := sup { E m − 1 ( f ; K ) : f ∈ C ( K ) , ω m ( f ; K ) ≤ 1 } 保凸Whitney常数 : w ^ ^ m ( K ) : = sup { E ^ m − 1 ( f ; K ) : f ∈ C ^ ( K ) , ω m ( f ; K ) ≤ 1 } \widehat{\widehat{w}}_m(K) := \sup\{\widehat{E}_{m-1}(f;K) : f \in \widehat{C}(K), \omega_m(f;K) \leq 1\} w m ( K ) := sup { E m − 1 ( f ; K ) : f ∈ C ( K ) , ω m ( f ; K ) ≤ 1 } 其中 E m ( f ; K ) E_m(f;K) E m ( f ; K ) 表示 m m m 次多项式逼近误差,ω m ( f ; K ) \omega_m(f;K) ω m ( f ; K ) 表示 m m m 阶光滑性模量。
定理1.2 :
1 4 log 2 ( n + 1 ) ≤ w ^ 2 , n ≤ 1 4 [ log 2 n ] + 3 4 \frac{1}{4}\log_2(n+1) \leq \widehat{w}_{2,n} \leq \frac{1}{4}[\log_2 n] + \frac{3}{4} 4 1 log 2 ( n + 1 ) ≤ w 2 , n ≤ 4 1 [ log 2 n ] + 4 3
定理1.3 : 对任意中心对称凸域 K K K ,有 w ^ 2 ( K ) = 1 2 \widehat{w}_2(K) = \frac{1}{2} w 2 ( K ) = 2 1
定理1.4 : 对任意 K ∈ K n K \in \mathcal{K}_n K ∈ K n 和 m ≥ 3 m ≥ 3 m ≥ 3 ,有 w ^ m ( K ) = w m ( K ) \widehat{w}_m(K) = w_m(K) w m ( K ) = w m ( K )
定理1.5 : 对任意 K ∈ K n K \in \mathcal{K}_n K ∈ K n 和 m ≥ 4 m ≥ 4 m ≥ 4 ,有 w ^ ^ m ( K ) = ∞ \widehat{\widehat{w}}_m(K) = ∞ w m ( K ) = ∞
定理1.6 : 对任意凸函数 f f f 和二次多项式 P P P ,存在凸二次多项式 Q Q Q 使得
∥ f − Q ∥ K ≤ a ( K ) ∥ f − P ∥ K \|f-Q\|_K \leq a(K)\|f-P\|_K ∥ f − Q ∥ K ≤ a ( K ) ∥ f − P ∥ K
其中 a ( K ) = 2 ( d ( K ) ) 2 a(K) = 2(d(K))^2 a ( K ) = 2 ( d ( K ) ) 2 ,d ( K ) d(K) d ( K ) 是 K K K 与单位球的Banach-Mazur距离。
利用支撑超平面 : 对中心对称域,利用凸函数在对称中心处存在支撑超平面的性质凸化技术 : 通过添加适当的二次项使光滑函数变为凸函数几何分析 : 将逼近问题与域的几何性质(Banach-Mazur距离)联系起来上界 : 利用Brudnyi-Kalton的递归技术和凸函数的Jensen不等式下界 : 构造特殊的凸函数 f n ( x ) = 1 2 ∑ k = 1 n + 1 x k log 2 x k f_n(x) = \frac{1}{2}\sum_{k=1}^{n+1} x_k \log_2 x_k f n ( x ) = 2 1 ∑ k = 1 n + 1 x k log 2 x k 在标准单纯形上上界 : 利用凸函数在原点的支撑性质,将问题简化为非负凸函数的逼近下界 : 构造一维凸函数 g δ ( x 1 ) = max { 0 , x 1 − 1 + δ δ } g_δ(x_1) = \max\{0, \frac{x_1-1+δ}{δ}\} g δ ( x 1 ) = max { 0 , δ x 1 − 1 + δ } 核心思想是"凸化":对任意光滑函数 g g g ,添加足够大的二次项 L ∥ x ∥ 2 L\|x\|^2 L ∥ x ∥ 2 使其变为凸函数,同时不改变高阶逼近性质。
论文主要是理论性工作,通过构造具体的函数例子验证理论界的紧性:
命题1.8 : 构造了具体的凸函数 f ( x , y ) = 2 max { 1 − y , ∣ x ∣ } f(x,y) = 2\max\{1-y, |x|\} f ( x , y ) = 2 max { 1 − y , ∣ x ∣ } ,证明了最佳逼近二次多项式的集合可能包含非凸多项式在 [ − 1 , 1 ] × [ 0 , 1 ] [−1,1] × [0,1] [ − 1 , 1 ] × [ 0 , 1 ] 上,函数 f ( x , y ) = 2 max { 1 − y , ∣ x ∣ } f(x,y) = 2\max\{1-y, |x|\} f ( x , y ) = 2 max { 1 − y , ∣ x ∣ } 的最佳二次逼近误差为 1 2 \frac{1}{2} 2 1 非凸最佳逼近多项式:P ( x , y ) = 3 2 + x 2 − y 2 P(x,y) = \frac{3}{2} + x^2 - y^2 P ( x , y ) = 2 3 + x 2 − y 2 凸最佳逼近多项式:Q ( x , y ) = 3 2 + x 2 + y 2 − 2 y Q(x,y) = \frac{3}{2} + x^2 + y^2 - 2y Q ( x , y ) = 2 3 + x 2 + y 2 − 2 y Whitney (1957) : 建立了一维情况下的基本不等式Gilewicz, Kryakin, Shevchuk : 获得了最佳已知的Whitney常数上界 w ( m ) ≤ 2 + e − 2 w(m) ≤ 2 + e^{-2} w ( m ) ≤ 2 + e − 2 Brudnyi-Kalton (2000) : 系统研究了多变量Whitney常数,建立了维数依赖性Dekel-Leviatan : 证明了Whitney常数不依赖于凸域的具体几何Dai-Prymak : 研究了非凸域上的方向性Whitney不等式Shvedov : 在保凸多变量多项式逼近方面做出重要贡献一维保形逼近理论相对完善,但多变量情况研究较少 维数效应减半 : 凸函数的Whitney常数随维数的增长率比一般函数小一半对称性的重要作用 : 中心对称域上的凸函数Whitney常数为常数 1 2 \frac{1}{2} 2 1 高阶等价性 : 三次及以上逼近时,凸性约束不提供额外优势保凸逼近的困难 : 四次及以上保凸逼近常数为无穷大二次保凸逼近 : 仅给出了依赖于Banach-Mazur距离的上界,可能不是最优的构造性 : 理论结果主要是存在性的,缺乏具体的构造算法计算复杂性 : 未讨论实际计算Whitney常数的复杂性开放问题 : 是否总能选择凸的最佳逼近二次多项式?算法开发 : 设计高效计算保凸逼近的算法应用拓展 : 将理论结果应用到机器学习中的凸优化问题理论深度 : 建立了完整的凸函数Whitney估计理论框架技术创新 : 巧妙结合了凸分析、逼近理论和几何分析结果精确 : 给出了渐近精确的界,特别是中心对称情况下的精确值系统性 : 全面研究了不同逼近度数和约束条件下的情况实用性有限 : 主要是理论结果,缺乏实际应用的考虑计算方面 : 未提供计算Whitney常数的有效方法特殊情况 : 某些结果(如定理1.6)的常数可能不是最优的理论贡献 : 为逼近理论提供了新的视角,特别是在高维情况下方法论价值 : 展示了如何利用函数的特殊性质改进一般估计未来研究 : 为保凸逼近和高维逼近理论奠定了基础理论研究 : 逼近理论、调和分析、凸分析的交叉研究数值分析 : 高维数据的多项式逼近优化理论 : 凸优化中的函数逼近问题本文主要参考了以下关键文献:
Brudnyi, Y.A. and Kalton, N.J. (2000): 多变量Whitney常数的系统研究 Whitney, H. (1957): 经典一维Whitney不等式 Shvedov, A.S. (1981): 保凸多项式逼近的开创性工作 DeVore, R.A. and Lorentz, G.G. (1993): 构造逼近理论的标准教材 这篇论文在逼近理论领域做出了重要的理论贡献,特别是在理解凸性约束如何改进逼近估计方面。虽然主要是理论性工作,但为未来的应用研究奠定了坚实的数学基础。