We consider a moving target that we seek to learn from samples. Our results extend randomized techniques developed in control and optimization for a constant target to the case where the target is changing. We derive a novel bound on the number of samples that are required to construct a probably approximately correct (PAC) estimate of the target. Furthermore, when the moving target is a convex polytope, we provide a constructive method of generating the PAC estimate using a mixed integer linear program (MILP). The proposed method is demonstrated on an application to autonomous emergency braking.
논문 ID : 2408.04406제목 : Finite sample learning of moving targets (이동 목표의 유한 표본 학습)저자 : Nikolaus Vertovec (옥스포드 대학교), Kostas Margellos (옥스포드 대학교), Maria Prandini (밀라노 공과대학교)분류 : math.OC (최적화 및 제어), cs.LG (기계학습)제출 시간 : 2024년 8월 (v3: 2025년 11월 10일)논문 링크 : https://arxiv.org/abs/2408.04406 본 논문은 표본으로부터 이동 목표(moving target)를 학습하는 문제를 연구한다. 본 연구는 제어 및 최적화 분야에서 상수 목표를 위해 개발된 확률화 기법을 목표가 변화하는 경우로 확장한다. 논문은 확률 근사 정확(PAC) 목표 추정을 구성하는 데 필요한 표본 수량의 새로운 상한을 도출한다. 또한 이동 목표가 볼록 다면체일 때, 혼합 정수 선형 계획법(MILP)을 사용하여 PAC 추정을 생성하는 구성적 방법을 제공한다. 이 방법은 자동 긴급 제동 응용에서 검증된다.
전통적인 통계 학습 이론(예: PAC 학습)은 목표 레이블 함수가 고정되어 있다고 가정한다. 그러나 많은 실제 응용에서 학습 목표는 시간에 따라 변한다. 본 논문은 이러한 구조화된 변화의 레이블 메커니즘 을 유한 표본으로부터 학습하고 확률적 보장을 제공하는 방법을 연구한다.
실제 필요성 : 제어 시스템, 로봇, 자율주행 등의 분야에서 환경 및 시스템 매개변수가 시간에 따라 변한다(예: 제동 성능 저하, 차량 질량 변화)이론적 도전 : 고전적 PAC 이론을 이동 목표에 직접 적용할 수 없으므로 새로운 이론 프레임워크가 필요하다안전 관련 응용 : 자율주행 등 안전 관련 시스템에서 엄격한 확률적 보장이 필요하다시나리오 방법(Scenario Approach) : 주로 상수 목표의 불확실성 최적화를 다루며, 목표가 시간에 따라 변하는 경우를 고려하지 않음VC 이론 : 유한한 VC 차원이 필요하며, 주로 정적 목표를 대상으로 함기존 이동 목표 학습 : 2,3,15,20,22,23 등의 연구가 있지만, 대부분 기댓값 평가를 제공하며 PAC 유형의 이중 확률 보장을 제공하지 않음구성적 방법 부재 : 기존 분석은 대부분 존재성 증명이며, 가설을 실제로 구성하는 알고리즘이 부족함본 논문의 목표:
이동 목표 학습을 위한 PAC 유형의 유한 표본 복잡도 상한 제공 이론적 보장을 만족하는 가설을 생성하는 구성적 알고리즘(MILP) 개발 문헌 20 의 수학적 오류 수정(목표 변화 하한 처리) 사전 표본 복잡도 상한 : 제3절에서 PAC 가설을 생성하는 데 필요한 최소 표본 수의 사전 상한 제공(정리 2). 20 의 연구를 확장하되 기댓값 평가 대신 PAC 유형 결과 사용수학적 수정 : 20, 정리 1 의 수학적 오류 수정. 목표 변화의 하한 μ 도입(상한 μ̄만 아님)구성적 MILP 방법 : 제4절에서 혼합 정수 선형 계획법을 사용하여 볼록 다면체 클래스의 최소 불일치 가설을 생성하는 첫 번째 구성적 방법 제시(추적 문제에 대한 첫 번째 구성적 방법)실제 응용 검증 : 제5절에서 자동 긴급 제동(AEB) 시스템 사례를 통해 이론적 결과 검증. 표본 제거 전략을 제안하여 계산 효율성 향상(중복 표본의 95% 제거)입력 :
레이블된 m-다중 표본: {(x₁, f₁(x₁)), ..., (xₘ, fₘ(xₘ))} 표본 xᵢ ∈ X ⊆ ℝⁿ은 확률 분포 P에서 독립동일분포로 추출됨 각 표본은 서로 다른 목표 함수 fᵢ: X → {0,1}로 레이블됨 출력 :
가설 hₘ: X → {0,1}. 다음 표본 x의 레이블 fₘ₊₁(x)를 예측하는 데 사용됨 제약 조건 :
모든 목표 및 가설 함수는 동일한 클래스 H에 속하며, 유한한 VC 차원을 가짐(가정 1) 목표 변화는 구조화된 가정을 만족함: 평균 불일치 확률 μ = (1/m)∑ᵢ₌₁ᵐ er(fᵢ, fₘ₊₁)이 μ ≤ μ ≤ μ̄를 만족(가정 2) 목표 : m₀(ε, δ)를 찾아서 m ≥ m₀일 때 구성된 가설이 다음을 만족하도록 함:
Pᵐ{(x₁,...,xₘ) ∈ Xᵐ : P{x ∈ X : hₘ(x) ≠ fₘ₊₁(x)} ≤ ε₀ + ε} ≥ 1-δ
여기서 ε₀는 목표 이동 속도에 따라 결정됨.
확률적 불일치 :er(f, h) := P{x ∈ X : h(x) ≠ f(x)}
경험적 불일치 :êrₘ(f, h) := (1/m)∑ᵢ₌₁ᵐ |f(xᵢ) - h(xᵢ)|
최소 불일치 가설 집합 (정의 1):Mₘ := argminₕ∈H (1/m)∑ᵢ₌₁ᵐ |fᵢ(xᵢ) - h(xᵢ)|
ε, δ ∈ (0,1)에 대해, μ < 1/4이고 m ≥ m₀(ε, δ)일 때. 여기서:
m₀(ε, δ) = max{
(1/(2μ²))ln(2/δ),
(5(4μ̄ + ε)/ε²)(ln(8/δ) + d·ln(40(4μ̄ + ε)/ε²))
}
임의의 hₘ ∈ Mₘ에 대해:
Pᵐ{(x₁,...,xₘ) ∈ Xᵐ : er(fₘ₊₁, hₘ) ≤ 4μ̄ + ε} ≥ 1-δ
증명 개요 :
두 가지 사건 정의:E = {실제 오류 > 4μ̄ + ε}(오류 집합) A = {경험적 평균 불일치 > 2μ̄}(근사 집합) 확률 분해: Pᵐ{E} ≤ Pᵐ{A} + Pᵐ{E ∩ Ā} Pᵐ{A} 상한: Hoeffding 부등식(명제 1) 사용. m ≥ (1/(2μ²))ln(2/δ) 필요 Pᵐ{E ∩ Ā} 상한:최소 불일치 성질 활용: ∑|fᵢ(xᵢ) - hₘ(xᵢ)| ≤ ∑|fᵢ(xᵢ) - fₘ₊₁(xᵢ)| 삼각 부등식 적용: êrₘ(fₘ₊₁, hₘ) ≤ 2·(1/m)∑|fᵢ(xᵢ) - fₘ₊₁(xᵢ)| 정리 1 적용(VC 이론 결과). 두 번째 표본 상한 필요 목표와 가설이 볼록 다면체의 지시 함수라고 가정:
fᵢ(x) = 1_{Bᵢ}(x), hₘ(x) = 1_{Bhₘ}(x)
여기서 Bₕₘ은 Ax + b ≤ 0으로 매개변수화되며, 최대 nf개의 면을 가짐.
단계 1: 레이블이 1인 표본 처리(i ∈ I₁)
hₘ(xᵢ) = fᵢ(xᵢ) = 1이면, xᵢ ∈ Bₕₘ, 즉:
aⱼxᵢ + bⱼ ≤ 0, ∀j = 1,...,nf
불일치를 허용하기 위해 슬랙 변수 sᵢⱼ ≥ 0 도입:
aⱼxᵢ + bⱼ ≤ sᵢⱼ, ∀j = 1,...,nf
단계 2: 레이블이 0인 표본 처리(i ∈ I₀)
hₘ(xᵢ) = fᵢ(xᵢ) = 0이면, xᵢ ∉ Bₕₘ. 이진 변수 zᵢⱼ ∈ {0,1}과 큰 M 방법 사용:
aⱼxᵢ + bⱼ ≤ Mⱼ(1 - zᵢⱼ), ∀j
aⱼxᵢ + bⱼ ≥ ϱ + (mⱼ - ϱ)zᵢⱼ - sᵢⱼ, ∀j
∑ⱼzᵢⱼ ≤ nf - 1
단계 3: 불일치 최소화
불일치 여부를 나타내는 이진 변수 vᵢ ∈ {0,1} 도입:
제약을 통해 구현:
∑ⱼsᵢⱼ - vᵢ∑ⱼMⱼ ≤ 0 (i ∈ I₁인 경우)
∑ⱼsᵢⱼ + vᵢ∑ⱼmⱼ ≤ 0 (i ∈ I₀인 경우)
단계 4: 완전 MILP
minimize ∑ᵢ₌₁ᵐ vᵢ
subject to:
∀i ∈ I₁: 제약(35)
∀i ∈ I₀: 제약(36)
이중 확률 보장 : 20 의 기댓값 평가와 비교하여 더 강한 PAC 유형 보장 제공목표 변화 하한 : μ 도입으로 20 의 수학적 오류 수정. 상한을 더 정확하게 함구성적 알고리즘 : 추적 문제에 대한 첫 번째 구성적 방법 제시(모든 이전 연구는 존재성 증명만 제공)표본 제거 전략 : AEB 응용에서 기하학적 분석을 통해 중복 표본의 95% 제거. 계산 효율성 대폭 향상이론적 통일 : 상수 목표가 특수한 경우(μ = μ̄ = 0일 때, 정리 2는 정리 1로 축약됨)문제 설명 :
차량이 전방 장애물까지의 거리 l과 자신의 속도 v 측정값을 수신 안전 조건: 제동 거리 ≤ 사용 가능 거리, 즉 (1/2)v²(m/F) ≤ l 제동력 F와 차량 질량 m은 시간에 따라 변함(제동 마모, 연료/승객 변화) 레이블 함수 :
fᵢ(x) = 1 if (1/2)v²(mᵢ/Fᵢ) ≤ l, else 0
여기서 x = (l, v²)
분포 설정 :
거리 l: 40m, 120m 에서 균등 분포 속도 제곱 v²: 정규 분포, 평균 (70km/h)², 표준편차 (20km/h)² 목표 변화 :
제동력 저하: Fᵢ₊₁ = ωF·Fᵢ, ωF ~ N(1-3×10⁻⁷, 10⁻⁶) 질량 변화: mᵢ₊₁ = ωₘ·mᵢ, ωₘ ~ N(1, 10⁻³) 초기 질량: m = 900kg 이론적 매개변수 :
신뢰도: δ = 10⁻⁶ 정확도: ε = 1% 목표 변화 상한: μ = 0.78%, μ̄ = 2% VC 차원: d = 1(단일 반평면이 레이블 결정) 이론적 필요 표본 수 :
정리 2에 따르면, m₀(ε, δ) = 119,237
다면체 매개변수화 :회전 각도 θ = tan⁻¹(m/(2F)) 고정하여 비선형성 단순화 관련 면만 고려(세 번째 면이 레이블 결정) 표본 제거 :모든 I₁ 표본의 왼쪽에 있는 청색 영역 표본 제거 모든 I₀ 표본의 오른쪽에 있는 자홍색 영역 표본 제거 제거율: 95% MILP 해결 :상용 솔버 사용 해결 시간: 561초 목표 함수: 불일치 수 최소화 + 부피를 동점 해제로 사용 MILP 해결 :
총 위반 수(불일치 수): v = 1,335 해결 시간: 561초 표본 활용: 119,237개 표본 중 5%를 MILP에 사용 이론적 예측 vs 실제 성능 :
이론적 보장: er(fₘ₊₁, hₘ) ≤ 4μ̄ + ε = 9%(신뢰도 1-δ) 실제 평균 경험적 불일치: ≈ 2.4%(500회 몬테카를로 실행) 결론 : 실제 성능이 이론적 보장을 크게 초과함검증 방법 :
500회 독립 실행 각 실행: 새로운 fₘ₊₁ 생성(무작위 제동 저하 및 질량 변화) 각 실행: 5000개 테스트 표본 추출하여 êrₘ(fₘ₊₁, hₘ) 계산 결과 분포 (그림 7):
경험적 불일치가 2-3% 구간에 집중 이론적 상한 9%보다 훨씬 낮음 이론적 보장의 유효성 및 보수성 검증 그림 3 : 제동 성능의 시간 경과에 따른 진화 표시
빨간색 반평면: 실제 안전 경계(반복에 따라 변함) 투명한 반평면: 과거 안전 경계 녹색 원: 레이블 0(안전) 파란색 삼각형: 레이블 1(불안전) 그림 5 : 표본 제거 전략
청색/자홍색 영역: 중복 표본(제거됨) 빨간색 표본: MILP에 사용하기 위해 보관됨 제거율: 95% 그림 6 : 생성된 가설
빨간색 반평면: 구성된 가설 hₘ 빨간색 표본: 위반 지점(1,335개) 가설이 이동하는 안전 경계를 효과적으로 추적함 추세 관찰 :
높은 ε 영역 : 첫 번째 항 표본 상한이 지배적(상수 부분). μ에 따라 결정됨낮은 ε 영역 : 두 번째 항 표본 상한이 지배적(비상수 부분). μ̄에 따라 결정됨μ 영향 : μ가 작을수록 필요한 표본이 많음(실제 변화율 학습 어려움)μ̄ 영향 : μ̄가 클수록 필요한 표본이 많음(빠르게 이동하는 목표 추적 어려움)VC 이론 29 :유한 VC 차원 클래스의 PAC 학습 상한 제공 본 논문은 이를 이동 목표 시나리오로 확장 시나리오 방법 5-7,9,12 :불확실한 볼록 최적화를 위한 확률화 방법 사전 실행 가능성 보장 제공 본 논문은 이 아이디어를 비볼록 및 이동 목표에 적용 압축 학습 11,24 :시나리오 방법과 통계 학습의 연결 압축 개념 기반의 일반화 상한 개념 드리프트 학습 2,3,15,22,23 :2,22 : 변화 구조를 활용한 학습3 : 드리프트 분포로부터의 학습 복잡도23 : 분포와 목표의 동시 변화 고려차이점 : 대부분 기댓값 평가 제공. 본 논문은 PAC 보장 제공드리프트 개념 추적 20 :불일치 최소화를 통한 추적 본 논문의 개선 : 수학적 오류 수정. 기댓값 대신 PAC 보장 제공자적응 변화율 19 :가변 목표 변화율에 적응 본 논문은 변화율 상한이 알려져 있다고 가정 제어 합성 13,14,16,28 :제어 설계에서 확률화 방법의 응용 표본 복잡도 상한 게임 이론 17 :강화 학습 14 :이론적 기여 : 구조화된 변화 가정 하에서 이동 목표는 정확도 4μ̄ + ε로 PAC 학습 가능표본 복잡도 : 명확한 표본 수 상한 제공. 다음에 따라 결정됨:정확도 ε(1/ε에 대한 다항식 의존) 신뢰도 δ(로그 의존) 목표 변화 상한 μ, μ̄ VC 차원 d 구성적 방법 : 최소 불일치 가설을 생성하는 MILP를 위한 첫 번째 구성적 방법 제시실용성 : AEB 시스템에서 검증. 실제 성능이 이론적 보장을 초과함변화 상한 가정 : μ와 μ̄를 사전에 알아야 함실제로는 정확하게 추정하기 어려울 수 있음 보수적 추정은 표본 필요량 증가로 이어짐 정확도 저하 : 상수 목표와 비교하여 정확도가 4μ̄만큼 저하됨μ̄가 상대적으로 작을 때만 의미 있음 빠르게 변하는 목표는 적용 불가능할 수 있음 MILP 계산 복잡도 :표본 수가 클 때 계산 비용이 높음 표본 제거 전략이 효과적이지만 문제 기하학 구조에 따라 다름 볼록 다면체 제한 : 구성적 방법은 볼록 다면체 클래스에만 적용 가능고정 분포 가정 : 표본 분포 P가 고정됨23 은 분포도 시간에 따라 변하는 경우를 고려했으나, 본 논문은 미포함분포 드리프트 : 표본 분포 P도 시간에 따라 변하는 경우 고려(23 참고)자적응 방법 :더 일반적인 가설 클래스 :MILP 방법을 다른 구조로 확장 신경망 등 비볼록 가설 계산 최적화 :더 효율적인 MILP 해결 정확도와 효율성의 균형을 맞추는 근사 알고리즘 이론적 개선 :더 타이트한 표본 복잡도 상한 μ̄에 대한 의존성 감소 1. 이론적 엄밀성
수학적 유도가 완전하고 문헌 20 의 오류 수정 이중 확률 보장(PAC 유형) 제공. 기댓값 평가보다 강함 상수 목표가 특수한 경우로 포함되어 이론이 통일됨 2. 방법의 혁신성
이동 목표 추적을 위한 첫 번째 구성적 알고리즘 MILP 형식화가 우아하고 제약 설계가 정교함(큰 M 방법, 슬랙 변수) 표본 제거 전략이 실용적(95% 제거율) 3. 실험의 충분성
안전 관련 AEB 응용 선택. 동기가 명확함 몬테카를로 검증이 충분함(500회 실행) 이론과 실제의 비교가 명확함 4. 작문의 명확성
구조가 명확함. 문제 정의에서 이론, 구성, 응용까지 단계적으로 진행 그림이 풍부함(그림 1 개념도, 그림 3-7 결과도) 수학 기호가 규범적임 1. 가정의 실용성
μ와 μ̄의 사전 인식 : 실제로는 정확하게 얻기 어려움
논문에서 추정 방법 미논의 잘못된 추정의 영향 미분석 μ < 1/4 제한 : 상당히 강한 제약. 빠르게 변하는 시스템에 부적합2. 실험의 한계
단일 응용 : AEB 사례만 있음. 다양성 부족단순화된 가정 : 고정 회전 각도 θ로 비선형성 회피. 일반성 손상다른 방법과의 비교 : 20 등 다른 방법과의 직접 실험 비교 부재3. 계산 효율성
큰 표본 수 : 119,237개 표본은 일부 응용에서 비현실적일 수 있음MILP 해결 시간 : 561초는 여전히 길어서 실시간 응용 제한확장성 : 고차원, 복잡한 다면체의 확장성 미충분 탐색4. 이론적 상한의 타이트성
실제 오류 2.4% vs 이론 9%: 차이가 큼 개선 가능성이 있지만 논문에서 깊이 있게 분석하지 않음 5. 분포 드리프트 부재
고정 P 가정은 많은 실제 시나리오에서 성립하지 않음 향후 연구로 제시되었지만 현재 적용성 제한 1. 학술적 기여
이론적 진전 : PAC 학습을 이동 목표로 확장. 이론적 공백 메움방법론적 기여 : 구성적 MILP 방법이 다른 추적 문제에 영감을 줄 수 있음학제 간 : 통계 학습, 최적화, 제어 이론을 연결2. 실용적 가치
안전 관련 시스템 : AEB 등 응용의 이론적 기초산업 관련성 : 제동 저하 등 문제가 실제로 존재함확장 가능성 : 프레임워크를 다른 시변 시스템에 적용 가능3. 재현성
코드 공개 : https://github.com/nikovert/lrn-moving-targets 매개변수 명확 : 모든 실험 매개변수 상세히 제시MILP 상세 : 제약이 완전히 나열되어 구현 용이4. 후속 연구 방향
분포 + 목표 동시 드리프트 연구에 영감 온라인 학습 및 자적응 방법 연구 다른 가설 클래스의 구성적 방법 연구 적합한 시나리오 :
천천히 변하는 시스템 : μ̄가 작음(<5%). 예: 제동의 점진적 저하볼록 구조 문제 : 목표를 볼록 다면체로 표현 가능오프라인 학습 : 표본 수집 및 MILP 해결에 충분한 시간 있음안전 관련 응용 : 엄격한 확률적 보장 필요부적합한 시나리오 :
빠르게 변하는 경우 : μ̄가 1/4에 가깝거나 더 큼실시간 요구 : 큰 표본 수와 긴 해결 시간 감당 불가복잡한 비볼록 목표 : 볼록 다면체 클래스 초과분포 드리프트 : 표본 분포 P도 크게 변함미지의 변화율 : μ와 μ̄를 추정할 수 없음자적응 추정 : μ와 μ̄를 온라인으로 추정하고 표본 필요량 동적 조정분산 MILP : 병렬 처리로 계산 가속화신경망 근사 : NN으로 MILP 해를 빠르게 근사능동 학습 : 표본 위치를 지능적으로 선택하여 표본 필요량 감소강건성 분석 : μ와 μ̄ 추정 오류의 민감도 분석1 Alamo et al., 2009. "Randomized strategies for probabilistic solutions" - 확률화 방법 기초
5-7,9,12 Calafiore & Campi 시리즈. "The scenario approach" - 시나리오 방법 핵심 문헌
20 Helmbold & Long, 1994. "Tracking drifting concepts by minimizing disagreements" - 본 논문의 주요 확장 대상
29 Vidyasagar, 2003. "Learning and Generalisation" - PAC 학습 및 VC 이론 고전 교재
28 Tempo et al., 2005. "Randomized algorithms for analysis and control" - 제어의 확률화 방법
종합 평가 : 이것은 이론적으로 엄밀하고 방법적으로 혁신적인 우수한 논문이다. 주요 기여는 PAC 학습을 이동 목표로 확장하고 첫 번째 구성적 알고리즘을 제시한 것이다. 이론 유도가 완전하고 문헌 오류를 수정했으며 실험 검증이 충분하다. 주요 한계는 변화 상한을 사전에 알아야 하고, 계산 복잡도가 높으며, 고정 분포 가정이 있다는 점이다. 본 논문은 천천히 변하는 안전 관련 시스템에 적합하며, 제어 이론과 통계 학습의 교차 연구에 중요한 기여를 한다. 후속 연구는 자적응 추정, 분포 드리프트, 계산 효율성 최적화에 초점을 맞추기를 권장한다.