We introduce the \textit{almost goodness-of-fit} test, a procedure to assess whether a (parametric) model provides a good representation of the probability distribution generating the observed sample. Specifically, given a distribution function $F$ and a parametric family $\mathcal{G}=\{ G(\boldsymbolθ) : \boldsymbolθ \in Î\}$, we consider the testing problem \[ H_0: \| F - G(\boldsymbolθ_F) \|_p \geq ε\quad \text{vs} \quad H_1: \| F - G(\boldsymbolθ_F) \|_p < ε, \] where $ε>0$ is a margin of error and $G(\boldsymbolθ_F)$ denotes a representative of $F$ within the parametric class. The approximate model is determined via an M-estimator of the parameters. %The objective is the approximate validation of a distribution or an entire parametric family up to a pre-specified threshold value. The methodology also quantifies the percentage improvement of the proposed model relative to a non-informative (constant) benchmark. The test statistic is the $\mathrm{L}^p$-distance between the empirical distribution function and that of the estimated model. We present two consistent, easy-to-implement, and flexible bootstrap schemes to carry out the test. The performance of the proposal is illustrated through simulation studies and analysis and real-data applications.
논문 ID : 2410.20918제목 : Bootstrap tests for almost goodness-of-fit저자 : Amparo Báıllo (Universidad Autónoma de Madrid), Javier Cárcamo (Universidad del Páıs Vasco)분류 : stat.ME (통계 방법론), math.ST (수리통계), stat.AP (응용통계), stat.TH (통계 이론)발표 시간 : 2025년 10월 15일 (arXiv 사전인쇄본)논문 링크 : https://arxiv.org/abs/2410.20918 본 논문은 매개변수 모형이 관측 표본의 확률분포를 얼마나 잘 나타낼 수 있는지 평가하기 위한 "거의 적합도"(almost goodness-of-fit, AGoF) 검정을 제시한다. 구체적으로, 분포함수 F F F 와 매개변수족 G = { G ( θ ) : θ ∈ Θ } \mathcal{G}=\{G(\theta) : \theta \in \Theta\} G = { G ( θ ) : θ ∈ Θ } 가 주어졌을 때, 다음의 가설검정 문제를 고려한다:
H 0 : ∥ F − G ( θ F ) ∥ p ≥ ϵ vs H 1 : ∥ F − G ( θ F ) ∥ p < ϵ H_0: \|F - G(\theta_F)\|_p \geq \epsilon \quad \text{vs} \quad H_1: \|F - G(\theta_F)\|_p < \epsilon H 0 : ∥ F − G ( θ F ) ∥ p ≥ ϵ vs H 1 : ∥ F − G ( θ F ) ∥ p < ϵ
여기서 ϵ > 0 \epsilon > 0 ϵ > 0 은 오차 허용도이고, G ( θ F ) G(\theta_F) G ( θ F ) 는 매개변수 클래스에서 F F F 의 대표이다. M-추정을 통해 근사 모형을 결정하고, 검정을 수행하기 위한 두 가지 일관되고 구현하기 쉬운 부트스트랩 방안을 제공한다.
전통적인 적합도 검정은 근본적인 문제를 가지고 있다: "모형이 데이터의 합리적인 근사"라는 진술을 영가설 H 0 H_0 H 0 에 놓기 때문에, 모형의 "부적합"에 대한 통계적 증거만 제공할 수 있으며, 실제의 "적합도"에 대한 증거는 제공할 수 없다.
전통적 GoF 검정의 한계 : 고전적 방법은 모형을 거부할 수만 있고, 모형의 적용 가능성을 검증할 수 없다실제 필요성 : 실무에서는 모형이 "충분히 좋은지" 여부가 완전히 정확한지 여부보다 더 중요하다근사 모형의 중요성 : 현실에서는 데이터를 완벽하게 설명할 수 있는 모형이 거의 없으므로, 일정 수준의 편차를 허용할 필요가 있다Kolmogorov-Smirnov 클래스 통계량의 극한분포는 매개변수 추정 상황에서 복잡하고 비가우스적이다 부트스트랩 방법은 상한-노름 추정 시 일반적으로 일관되지 않는다 매개변수족의 근사 검증을 다루기 위한 통일된 프레임워크가 부족하다 AGoF 검정 프레임워크 제시 : "근사 적합"을 대립가설에 놓아 모형의 적용 가능성에 대한 통계적 증거를 제공할 수 있다L p L^p L p 거리 사용 : 전통적인 상한-노름과 비교하여 L p L^p L p 노름은 더 나은 이론적 성질과 계산상 이점을 가진다두 가지 부트스트랩 방안 개발 : 일관성을 증명하고 실용적인 구현 알고리즘을 제공한다AGoF 통계량 도입 : 비정보적 기준선에 대한 모형의 개선 백분율을 정량화한다완전한 이론 분석 제공 : 점근분포, 부트스트랩 일관성 등 이론적 보장을 포함한다미지의 분포 F F F 에서 추출한 표본 X 1 , … , X n X_1, \ldots, X_n X 1 , … , X n 과 매개변수 모형족 G = { G ( θ ) : θ ∈ Θ ⊂ R k } \mathcal{G} = \{G(\theta) : \theta \in \Theta \subset \mathbb{R}^k\} G = { G ( θ ) : θ ∈ Θ ⊂ R k } 이 주어졌을 때, 다음을 검정한다:
H 0 : ∥ F − G ( θ F ) ∥ p ≥ ϵ vs H 1 : ∥ F − G ( θ F ) ∥ p < ϵ H_0: \|F - G(\theta_F)\|_p \geq \epsilon \quad \text{vs} \quad H_1: \|F - G(\theta_F)\|_p < \epsilon H 0 : ∥ F − G ( θ F ) ∥ p ≥ ϵ vs H 1 : ∥ F − G ( θ F ) ∥ p < ϵ
여기서 θ F \theta_F θ F 는 M-추정을 통해 결정된다: E F [ ψ θ F ( X ) ] = 0 E_F[\psi_{\theta_F}(X)] = 0 E F [ ψ θ F ( X )] = 0 .
M-추정기를 사용하여 다음을 풀이한다:
Ψ n ( θ ) = 1 n ∑ i = 1 n ψ θ ( X i ) = 0 \Psi_n(\theta) = \frac{1}{n}\sum_{i=1}^n \psi_\theta(X_i) = 0 Ψ n ( θ ) = n 1 ∑ i = 1 n ψ θ ( X i ) = 0
표준화된 통계량은 다음과 같다:
T n ( F , G ( θ F ) , p ) = n ( ∥ F n − G ( θ ^ n ) ∥ p − ∥ F − G ( θ F ) ∥ p ) T_n(F,G(\theta_F),p) = \sqrt{n}(\|F_n - G(\hat{\theta}_n)\|_p - \|F - G(\theta_F)\|_p) T n ( F , G ( θ F ) , p ) = n ( ∥ F n − G ( θ ^ n ) ∥ p − ∥ F − G ( θ F ) ∥ p )
기각역을 다음과 같이 제시한다:
R n = { ∥ F n − G ( θ ^ n ) ∥ p < ϵ − c n ( α ) } R_n = \{\|F_n - G(\hat{\theta}_n)\|_p < \epsilon - c_n(\alpha)\} R n = { ∥ F n − G ( θ ^ n ) ∥ p < ϵ − c n ( α )}
여기서 c n ( α ) = − Q T ( α ) / n c_n(\alpha) = -Q_T(\alpha)/\sqrt{n} c n ( α ) = − Q T ( α ) / n 이고, Q T ( α ) Q_T(\alpha) Q T ( α ) 는 극한분포의 α \alpha α 분위수이다.
Hadamard 미분가능성 : 1 < p < ∞ 1 < p < \infty 1 < p < ∞ 에 대해, L p L^p L p 노름은 Hadamard 미분가능하여 함수 델타 방법의 적용이 용이하다가우스 극한 : 일반적인 가정 하에서, 점근분포는 가우스이다부트스트랩 일관성 : 적절한 조건 하에서, 표준 부트스트랩 추정량은 일관되다유연성 : p p p 값을 조절하여 분포 꼬리에 대한 민감도를 제어할 수 있다완전한 점근 이론을 수립하였으며, 다음을 포함한다:
L p L^p L p 공간에서의 경험적 과정의 약한 수렴추정된 매개변수를 포함한 과정의 극한분포 부트스트랩 과정의 일관성 가정 1-2 하에서, X ∈ L 2 / p , 1 X \in L^{2/p,1} X ∈ L 2/ p , 1 은 다음과 동치이다:
G n ( θ F ) ⇝ G θ F in L p G_n(\theta_F) \rightsquigarrow G_{\theta_F} \text{ in } L^p G n ( θ F ) ⇝ G θ F in L p
여기서 G θ F G_{\theta_F} G θ F 는 중심화된 가우스 과정이다.
p = 1 p = 1 p = 1 일 때: T ( F , G ( θ F ) , 1 ) = ∫ C θ F ∣ G θ F ∣ + ∫ R ∖ C θ F G θ F sgn ( F − G ( θ F ) ) T(F,G(\theta_F),1) = \int_{C_{\theta_F}} |G_{\theta_F}| + \int_{\mathbb{R}\setminus C_{\theta_F}} G_{\theta_F}\text{sgn}(F-G(\theta_F)) T ( F , G ( θ F ) , 1 ) = ∫ C θ F ∣ G θ F ∣ + ∫ R ∖ C θ F G θ F sgn ( F − G ( θ F )) 1 < p < ∞ 1 < p < \infty 1 < p < ∞ 일 때: T ( F , G ( θ F ) , p ) = 1 ∥ F − G ( θ F ) ∥ p p − 1 ∫ G θ F ∣ F − G ( θ F ) ∣ p − 1 sgn ( F − G ( θ F ) ) T(F,G(\theta_F),p) = \frac{1}{\|F-G(\theta_F)\|_p^{p-1}} \int G_{\theta_F} |F-G(\theta_F)|^{p-1}\text{sgn}(F-G(\theta_F)) T ( F , G ( θ F ) , p ) = ∥ F − G ( θ F ) ∥ p p − 1 1 ∫ G θ F ∣ F − G ( θ F ) ∣ p − 1 sgn ( F − G ( θ F )) 극한분포가 정규인 필요충분조건:
p = 1 p = 1 p = 1 : 접촉 집합 C θ F = { F = G ( θ F ) } C_{\theta_F} = \{F = G(\theta_F)\} C θ F = { F = G ( θ F )} 의 르벡 측도가 0이다1 < p < ∞ 1 < p < \infty 1 < p < ∞ : F ≠ G ( θ F ) F \neq G(\theta_F) F = G ( θ F ) 정리 3 과 추론 2 는 적절한 가정 하에서 부트스트랩 통계량이 동일한 극한분포로 약하게 수렴함을 증명한다.
표본 크기 : n = 30 , 50 , 100 , 500 n = 30, 50, 100, 500 n = 30 , 50 , 100 , 500 부트스트랩 횟수 : B = 2000 B = 2000 B = 2000 유의수준 : α = 0.05 \alpha = 0.05 α = 0.05 몬테카를로 반복 : 1000회Weibull vs 지수 모형 : p = 1 p = 1 p = 1 , 실제 분포는 Weibull(2,1)가우스 혼합 vs 정규 모형 : p = 2 p = 2 p = 2 , 실제 분포는 2-성분 가우스 혼합음이항 vs 포아송 모형 : p = 1 p = 1 p = 1 , 이산분포 경우Kumaraswamy vs 베타 모형 : p = 1 p = 1 p = 1 , 유한 지지 경우Student t vs 정규 모형 : p = 4 p = 4 p = 4 , 무거운 꼬리 분포 경우로그정규 vs 감마 모형 : p = 1 p = 1 p = 1 , 비대칭 분포 경우부트스트랩 1 : 분위수 기반 방법, 기각 조건: 2 ∥ F n − G ( θ ^ n ) ∥ p − ϵ ^ ∗ ( α ) < ϵ 2\|F_n - G(\hat{\theta}_n)\|_p - \hat{\epsilon}^*(\alpha) < \epsilon 2∥ F n − G ( θ ^ n ) ∥ p − ϵ ^ ∗ ( α ) < ϵ 부트스트랩 2 : 정규 근사 기반 방법, 기각 조건: ∥ F n − G ( θ ^ n ) ∥ p − σ ^ boot z α < ϵ \|F_n - G(\hat{\theta}_n)\|_p - \hat{\sigma}_{\text{boot}}z_\alpha < \epsilon ∥ F n − G ( θ ^ n ) ∥ p − σ ^ boot z α < ϵ 중간 표본 크기 (n = 500 n = 500 n = 500 ): 두 방법의 성능이 유사하며, 검정 수준을 잘 제어한다소표본 (n ≤ 100 n \leq 100 n ≤ 100 ): 부트스트랩 2가 일반적으로 명목 유의수준을 더 잘 제어한다높은 AGoF 통계량 (> 0.9): 부트스트랩 1이 더 나은 성능을 보인다Weibull vs 지수 모형의 경우:
∥ F − G ( θ F ) ∥ 1 = 0.3002 \|F - G(\theta_F)\|_1 = 0.3002 ∥ F − G ( θ F ) ∥ 1 = 0.3002 AGoF 통계량: G ( F , G ) = 0.194 G(F,G) = 0.194 G ( F , G ) = 0.194 (상수 모형 대비 19.4% 개선) 검정력 함수는 n = 500 n = 500 n = 500 일 때 두 방법이 거의 구별되지 않음을 보여준다 AGoF 통계량이 0-0.9 사이: 부트스트랩 2 권장 AGoF 통계량이 0.9 초과: 부트스트랩 1 권장 표본 크기가 작을 때는 결과 해석에 주의 필요 데이터 : 아이티 전국 혈청 조사에서 4308개의 IgG 항체 표본 (Bm33 항원)
분석 : 1-5 성분 정규 혼합 모형의 AGoF 검정
2-성분 모형이 최고 성능: ϵ 2 ∗ ( 0.05 ) ≈ 0.022 \epsilon^*_2(0.05) \approx 0.022 ϵ 2 ∗ ( 0.05 ) ≈ 0.022 (L 1 L^1 L 1 ), G ∗ ( F , G 2 ) > 0.97 G^*(F,G_2) > 0.97 G ∗ ( F , G 2 ) > 0.97 단일 성분 정규 모형 부족: 개선율 < 78% 3-성분 이상 모형의 개선 제한적 (< 1%) 데이터 : 약 1200개의 탄소섬유의 다양한 표준 길이에서의 인장 성능
모형 비교 : Weibull, 3-매개변수 Weibull, 편향 정규, 쌍봉 Weibull
주요 발견 :
쌍봉 Weibull이 대부분의 표준 길이에서 최고 성능 모형 성능이 표준 길이에 따라 현저히 감소 (쌍봉 Weibull 제외) 선형 회귀 분석이 이러한 추세의 통계적 유의성을 확인 Kolmogorov-Smirnov 검정 및 그 한계 Cramér-von Mises 검정의 분포 의존성 문제 Wellek (2021)의 Lehmann 대립가설 방법 Liu and Lindsay (2009)의 다항식 모형 허용역 Romano (2005)의 최적 동등성 검정 Berger and Delampady (1987)의 정확 가설 검정 Dette and Sen (2013)의 관련 가설 일관 검정 절차 Baringhaus and Henze (2024)의 근방 검증 검정 방법의 유효성 : AGoF 검정은 전통적 GoF 검정이 "부적합" 증거만 제공할 수 있는 문제를 성공적으로 해결한다이론의 완전성 : 완전한 점근 이론과 부트스트랩 일관성 증명을 제공한다실용성 : 두 가지 부트스트랩 방안은 구현이 용이하며 광범위한 매개변수 모형에 적용 가능하다적분가능성 조건 : X ∈ L 2 / p , 1 X \in L^{2/p,1} X ∈ L 2/ p , 1 조건을 만족해야 하므로 적용 범위가 제한된다매개변수 선택 : 오차 허용도 ϵ \epsilon ϵ 의 선택은 여전히 영역 전문 지식이 필요하다계산 복잡도 : 단순한 GoF 검정에 비해 계산 비용이 높다다변량 확장 : 방법을 다변량 분포 경우로 확장비모수적 대안 : 비모수 또는 반모수 모형의 근사 검증 고려적응적 방법 : ϵ \epsilon ϵ 을 자동으로 선택하는 데이터 기반 방법 개발이론적 혁신 : 처음으로 "근사 적합"을 대립가설에 체계적으로 놓아 중요한 개념적 돌파구를 제시한다방법론의 완전성 : 이론 분석에서 구현 알고리즘까지 매우 완전하다실용적 가치 : AGoF 통계량은 모형 품질의 직관적인 측도를 제공한다기술적 우수성 : L p L^p L p 거리의 선택은 이론과 계산 측면에서 명백한 이점을 가진다가정 조건 : M-추정 프레임워크와 적분가능성 조건이 적용 가능성을 제한할 수 있다매개변수 조절 : p p p 값과 ϵ \epsilon ϵ 의 선택에 대한 체계적 지침이 부족하다계산 효율 : 부트스트랩 과정의 계산 비용이 높다학술적 기여 : 적합도 검정 분야에 새로운 연구 방향을 제공한다실용적 가치 : 모형 선택 및 검증에서 중요한 응용 전망을 가진다재현성 : 이론 결과가 완전하고 알고리즘 설명이 명확하여 재현이 용이하다매개변수 모형의 적용 가능성을 검증해야 하는 경우 모형 선택 및 비교 규제 및 품질 관리에서의 모형 검증 위험 관리에서의 분포 모형 평가 논문은 경험적 과정 이론, M-추정, 부트스트랩 방법 등 여러 분야의 중요한 연구를 포함한 풍부한 관련 문헌을 인용하여 연구에 견고한 이론적 기초를 제공한다.