2025-11-10T02:43:53.338320

Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization

Huang
In this paper, we propose a novel extrapolation coefficient scheme within a new extrapolation term and develop an accelerated proximal gradient algorithm. We establish that the algorithm achieves a sublinear convergence rate. The proposed scheme only requires the Lipschitz constant estimate sequence to satisfy mild initial conditions, under which a key equality property can be derived to support the convergence analysis. Numerical experiments are provided to demonstrate the effectiveness and practical performance of the proposed method.
academic

다목적 최적화를 위한 새로운 외삽 항을 포함한 빠른 가속 근접 경사 방법

기본 정보

  • 논문 ID: 2507.06737
  • 제목: Fast Accelerated Proximal Gradient Method with New Extrapolation Term for Multiobjective Optimization
  • 저자: Huang Chengzhi
  • 분류: math.OC (최적화 및 제어)
  • 발표 시간: 2025년 10월 17일
  • 논문 링크: https://arxiv.org/abs/2507.06737

초록

본 논문은 새로운 외삽 계수 방안과 외삽 항을 제안하고, 가속 근접 경사 알고리즘을 개발했습니다. 이 알고리즘은 준선형 수렴률을 달성합니다. 제안된 방안은 Lipschitz 상수 추정 수열이 온화한 초기 조건만을 만족하도록 요구하며, 이 조건 하에서 수렴성 분석을 지원하는 핵심 등식 성질을 도출할 수 있습니다. 수치 실험은 제안된 방법의 유효성과 실제 성능을 검증합니다.

연구 배경 및 동기

  1. 해결해야 할 문제: 다목적 최적화 문제, 특히 복합 무제약 다목적 최적화 문제: minxRnF(x)(f1(x)+g1(x),,fm(x)+gm(x))T\min_{x \in \mathbb{R}^n} F(x) \equiv (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T 여기서 fif_i는 매끄러운 볼록 함수이고, gig_i는 볼록 함수(비매끄러울 수 있음)입니다.
  2. 문제의 중요성: 다목적 최적화는 이미지 복원, 압축 센싱 등 실제 응용에서 광범위하게 존재합니다. 이러한 문제는 일반적으로 단일 최적해가 존재하지 않으며, 파레토 최적해로 구성된 해 집합이 존재합니다.
  3. 기존 방법의 한계:
    • Tanabe 등이 FISTA를 다목적 최적화로 확장하여 O(1/k2)O(1/k^2) 수렴률을 달성했습니다.
    • Sonntag 등과 Zhang 등의 연구에서 이론적 증명이 불완전한 문제가 있으며, 수렴성 분석이 보조 함수 σ(z)=mini=1,,mFi(xk)Fi(z)\sigma(z) = \min_{i=1,\ldots,m} F_i(x_k) - F_i(z)의 비음성에 의존하는데, 이 조건은 보장하기 어렵습니다.
  4. 연구 동기: 기존 방법의 이론 분석 결함을 극복하고, Lipschitz 상수의 초기 추정에 대한 요구를 더 온화하게 하며, 핵심 등식을 통해 σ\sigma의 비음성에 대한 의존성을 피합니다.

핵심 기여

  1. 새로운 외삽 항 방안 제안: yk=xk+k+α4k+α1(xkxk1)y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1})의 외삽 형태 사용, 여기서 α3\alpha \geq 3
  2. 온화한 초기 조건 수립: Lipschitz 상수 추정 수열이 더 약한 초기 조건만을 만족하도록 요구
  3. 핵심 등식 성질 도출: 보조 함수의 비음성에 대한 의존성을 피하고 이론 분석을 완성
  4. 준선형 수렴률 증명: 매끄러운 경우 O(1/k2)O(1/k^2) 수렴률, 비매끄러운 경우 O(1/k)O(1/k) 수렴률 달성
  5. 비매끄러운 경우로 확장: 평활화 기법을 통해 완전히 비매끄러운 다목적 최적화 문제 처리

방법 상세 설명

작업 정의

복합 무제약 다목적 최적화 문제(MOP) 고려: minxRnF(x)=(f1(x)+g1(x),,fm(x)+gm(x))T\min_{x \in \mathbb{R}^n} F(x) = (f_1(x) + g_1(x), \ldots, f_m(x) + g_m(x))^T

여기서:

  • fi:RnRf_i: \mathbb{R}^n \to \mathbb{R}는 연속 미분 가능한 볼록 함수
  • gi:RnRg_i: \mathbb{R}^n \to \mathbb{R}는 볼록 함수(비매끄러울 수 있음)
  • 목표는 약한 파레토 최적해를 찾는 것

모델 구조

매끄러운 경우 알고리즘 (Algorithm 1)

핵심 부분 문제: minzRnϕL(f)(z;x,y)=maxi=1,,m[fi(y),zy+gi(z)+fi(y)Fi(x)]+L(f)2zy2\min_{z \in \mathbb{R}^n} \phi_{L(f)}(z; x, y) = \max_{i=1,\ldots,m}[\langle\nabla f_i(y), z-y\rangle + g_i(z) + f_i(y) - F_i(x)] + \frac{L(f)}{2}\|z-y\|^2

알고리즘 단계:

  1. 외삽점 계산: yk=xk+k+α4k+α1(xkxk1)y_k = x_k + \frac{k+\alpha-4}{k+\alpha-1}(x_k - x_{k-1})
  2. 부분 문제 해결: xk+1=psk(xk,yk)x_{k+1} = p_{s_k}(x_k, y_k)
  3. 매개변수 업데이트: sk+1=ηsks_{k+1} = \eta s_k, 여기서 η=(k+α2)2(k+α1)(k+α3)\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)}

매개변수 조건:

  • α>3\alpha > 3일 때: 0<α2α3s0<1L(f)0 < \frac{\alpha-2}{\alpha-3}s_0 < \frac{1}{L(f)}
  • α=3\alpha = 3일 때: 0<s0<1L(f)0 < s_0 < \frac{1}{L(f)}

비매끄러운 경우 알고리즘 (Algorithm 2)

평활화 함수 f~i(x,μ)\tilde{f}_i(x, \mu)를 통해 비매끄러운 함수 fi(x)f_i(x)를 근사하며, 평활화 함수는 다음을 만족합니다:

  • 연속 미분 가능성: 고정된 μ>0\mu > 0에 대해 f~(,μ)\tilde{f}(\cdot, \mu)는 연속 미분 가능
  • 일관성: limzx,μ0f~(z,μ)=f(x)\lim_{z \to x, \mu \downarrow 0} \tilde{f}(z, \mu) = f(x)
  • 경사 일관성: {limzx,μ0f~(z,μ)}f(x)\{\lim_{z \to x, \mu \downarrow 0} \nabla\tilde{f}(z, \mu)\} \subseteq \partial f(x)

기술적 혁신점

  1. 새로운 외삽 계수 설계: 특정 매개변수 업데이트 방식 η=(k+α2)2(k+α1)(k+α3)\eta = \frac{(k+\alpha-2)^2}{(k+\alpha-1)(k+\alpha-3)}을 통해 sk<1L(f)s_k < \frac{1}{L(f)}가 항상 성립하도록 보장
  2. 핵심 등식 도출: 정교한 대수 조작과 매개변수 선택을 통해 σk(z)\sigma_k(z)의 비음성에 대한 의존성 회피
  3. 통일된 프레임워크: α=3\alpha = 3일 때 기존 방법으로 축퇴되지만 더 완전한 이론 분석 제공

실험 설정

데이터 집합

논문은 세 개의 삼목적 최적화 문제의 수치 실험을 언급합니다:

  • BK1&ℓ1 문제
  • JOS1&ℓ1 문제
  • SP1&ℓ1 문제

평가 지표

merit 함수 u0(x)=supzRnmini=1,,m[Fi(x)Fi(z)]u_0(x) = \sup_{z \in \mathbb{R}^n} \min_{i=1,\ldots,m}[F_i(x) - F_i(z)]를 사용하여 알고리즘 성능을 평가하며, 이 함수는 다음을 만족합니다:

  • 모든 xx에 대해 u0(x)0u_0(x) \geq 0
  • xx는 약한 파레토 최적해 ⟺ u0(x)=0u_0(x) = 0

구현 세부사항

  • 정지 기준: xkxk+1<ε\|x_k - x_{k+1}\| < \varepsilon
  • 비매끄러운 경우 추가로 μk<ε\mu_k < \varepsilon 필요
  • 매개변수 업데이트: μk+1=k+α2k+α1μk\mu_{k+1} = \frac{k+\alpha-2}{k+\alpha-1}\mu_k, sk+1=k+α2k+α3sks_{k+1} = \frac{k+\alpha-2}{k+\alpha-3}s_k

실험 결과

주요 결과

논문은 세 개의 삼목적 최적화 문제의 파레토 프론티어 그래프를 제시하지만, 제공된 문서에서 구체적인 수치 결과와 성능 비교 데이터는 완전하지 않습니다.

수렴성 이론 결과

매끄러운 경우 (Theorem 4.3): u0(xk)L(f)(α1)22(k+α1)2Ru_0(x_k) \leq \frac{L(f)(\alpha-1)^2}{2(k+\alpha-1)^2}RO(1/k2)O(1/k^2)의 수렴률을 달성합니다.

비매끄러운 경우 (Theorem 6.2): u0(xk+1)O(1k)u_0(x_{k+1}) \leq O\left(\frac{1}{k}\right)O(1/k)O(1/k)의 수렴률을 달성합니다.

관련 연구

  1. 다목적 FISTA 확장: Tanabe 등이 FISTA를 다목적 최적화로 처음 확장하여 O(1/k2)O(1/k^2) 수렴률 달성
  2. 단조 변형: Nishimura 등이 다목적 FISTA의 단조 변형 제안
  3. 일반화된 프레임워크: Tanabe 등이 초매개변수 도입을 통해 단일 목적 경우로 프레임워크 일반화
  4. Nesterov 방식 방안: Sonntag 등과 Zhang 등이 더 효과적인 외삽 항 사용 시도, 하지만 이론 분석 불완전
  5. 비매끄러운 방법: Gebken 등이 비매끄러운 다목적 최적화를 위한 부분 경사 하강 알고리즘 제안

결론 및 논의

주요 결론

  1. 매끄러운 경우와 비매끄러운 경우 다목적 최적화에 적용 가능한 새로운 외삽 항을 포함한 가속 근접 경사 방법 제안
  2. 완전한 수렴성 이론 수립, 기존 방법의 이론적 결함 회피
  3. 매끄러운 경우 O(1/k2)O(1/k^2) 수렴률, 비매끄러운 경우 O(1/k)O(1/k) 수렴률 달성

한계

  1. 실험 부분 불충분: 수치 실험 결과 표시 불완전, 상세한 성능 비교 부족
  2. 매개변수 선택 제한: 초기 매개변수 s0s_0α\alpha에 특정 요구사항 존재
  3. 비매끄러운 경우 수렴률 느림: 매끄러운 경우와 비교하여 비매끄러운 버전의 수렴률이 O(1/k)O(1/k)로 감소

향후 방향

  1. 더 나은 평활화 기법 탐색으로 비매끄러운 경우의 수렴률 개선
  2. 자적응 매개변수 선택 전략 연구
  3. 제약 다목적 최적화 문제로 확장

심층 평가

장점

  1. 이론적 기여 현저함: 기존 방법의 이론 분석 핵심 결함 해결, 완전한 수렴성 증명 제공
  2. 방법 설계 정교함: 특정 매개변수 업데이트 전략을 통해 알고리즘의 이론적 보장 확보
  3. 프레임워크 통일성: 매끄러운 경우와 비매끄러운 경우를 통일된 프레임워크에 포함
  4. 수학적 엄밀성: 증명 과정 상세, 논리 명확

부족한 점

  1. 실험 검증 부족: 수치 실험 부분이 과도하게 단순하며, 다른 선진 방법과의 상세한 비교 부족
  2. 실용성 분석 결여: 알고리즘 계산 복잡도 및 실제 응용 시나리오에 대한 심층 분석 부족
  3. 매개변수 민감성 미논의: 매개변수 선택이 알고리즘 성능에 미치는 영향 분석 없음

영향력

  1. 이론적 가치 높음: 다목적 최적화 가속 방법에 더 완전한 이론적 기초 제공
  2. 실용적 가치 검증 필요: 실제 문제에서의 유효성을 검증하기 위해 더 많은 실험 필요
  3. 재현성 우수: 알고리즘 설명 명확, 이론 분석 완전

적용 시나리오

  1. 복합 구조의 다목적 최적화 문제
  2. 이미지 처리 및 압축 센싱 등 응용 분야
  3. 이론적 보장이 필요한 최적화 시나리오

참고 문헌

논문은 다목적 최적화 분야의 중요 문헌을 인용하며, 다음을 포함합니다:

  • Tanabe 등의 다목적 FISTA에 관한 개척적 연구
  • Nesterov 가속 방법의 관련 이론
  • 평활화 기법의 관련 문헌
  • 다목적 최적화의 고전 이론 기초

종합 평가: 이는 이론적 기여가 두드러진 논문으로, 기존 다목적 가속 근접 경사 방법의 이론적 결함을 성공적으로 해결하고 완전한 수렴성 분석을 제공합니다. 그러나 논문은 실험 검증 및 실용성 분석 측면에서 개선의 여지가 있습니다.