2025-11-12T17:04:10.344292

Bootstrap tests for almost goodness-of-fit

BaÃllo, CÃ¡rcamo

We introduce the \textit{almost goodness-of-fit} test, a procedure to assess whether a (parametric) model provides a good representation of the probability distribution generating the observed sample. Specifically, given a distribution function $F$ and a parametric family $\mathcal{G}=\{ G(\boldsymbolÎ¸) : \boldsymbolÎ¸ \in Î\}$, we consider the testing problem \[ H_0: \| F - G(\boldsymbolÎ¸_F) \|_p \geq Îµ\quad \text{vs} \quad H_1: \| F - G(\boldsymbolÎ¸_F) \|_p < Îµ, \] where $Îµ>0$ is a margin of error and $G(\boldsymbolÎ¸_F)$ denotes a representative of $F$ within the parametric class. The approximate model is determined via an M-estimator of the parameters. %The objective is the approximate validation of a distribution or an entire parametric family up to a pre-specified threshold value. The methodology also quantifies the percentage improvement of the proposed model relative to a non-informative (constant) benchmark. The test statistic is the $\mathrm{L}^p$-distance between the empirical distribution function and that of the estimated model. We present two consistent, easy-to-implement, and flexible bootstrap schemes to carry out the test. The performance of the proposal is illustrated through simulation studies and analysis and real-data applications.

academic

거의 적합도에 대한 부트스트랩 검정

기본 정보

논문 ID: 2410.20918
제목: Bootstrap tests for almost goodness-of-fit
저자: Amparo Báıllo (Universidad Autónoma de Madrid), Javier Cárcamo (Universidad del Páıs Vasco)
분류: stat.ME (통계 방법론), math.ST (수리통계), stat.AP (응용통계), stat.TH (통계 이론)
발표 시간: 2025년 10월 15일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2410.20918

초록

본 논문은 매개변수 모형이 관측 표본의 확률분포를 얼마나 잘 나타낼 수 있는지 평가하기 위한 "거의 적합도"(almost goodness-of-fit, AGoF) 검정을 제시한다. 구체적으로, 분포함수 $F$ 와 매개변수족 $\mathcal{G}=\{G(\theta) : \theta \in \Theta\}$ 가 주어졌을 때, 다음의 가설검정 문제를 고려한다: $H_0: \|F - G(\theta_F)\|_p \geq \epsilon \quad \text{vs} \quad H_1: \|F - G(\theta_F)\|_p < \epsilon$ 여기서 $\epsilon > 0$ 은 오차 허용도이고, $G(\theta_F)$ 는 매개변수 클래스에서 $F$ 의 대표이다. M-추정을 통해 근사 모형을 결정하고, 검정을 수행하기 위한 두 가지 일관되고 구현하기 쉬운 부트스트랩 방안을 제공한다.

연구 배경 및 동기

문제 배경

전통적인 적합도 검정은 근본적인 문제를 가지고 있다: "모형이 데이터의 합리적인 근사"라는 진술을 영가설 $H_0$ 에 놓기 때문에, 모형의 "부적합"에 대한 통계적 증거만 제공할 수 있으며, 실제의 "적합도"에 대한 증거는 제공할 수 없다.

연구 동기

전통적 GoF 검정의 한계: 고전적 방법은 모형을 거부할 수만 있고, 모형의 적용 가능성을 검증할 수 없다
실제 필요성: 실무에서는 모형이 "충분히 좋은지" 여부가 완전히 정확한지 여부보다 더 중요하다
근사 모형의 중요성: 현실에서는 데이터를 완벽하게 설명할 수 있는 모형이 거의 없으므로, 일정 수준의 편차를 허용할 필요가 있다

기존 방법의 부족함

Kolmogorov-Smirnov 클래스 통계량의 극한분포는 매개변수 추정 상황에서 복잡하고 비가우스적이다
부트스트랩 방법은 상한-노름 추정 시 일반적으로 일관되지 않는다
매개변수족의 근사 검증을 다루기 위한 통일된 프레임워크가 부족하다

핵심 기여

AGoF 검정 프레임워크 제시: "근사 적합"을 대립가설에 놓아 모형의 적용 가능성에 대한 통계적 증거를 제공할 수 있다
$L^p$ 거리 사용: 전통적인 상한-노름과 비교하여 $L^p$ 노름은 더 나은 이론적 성질과 계산상 이점을 가진다
두 가지 부트스트랩 방안 개발: 일관성을 증명하고 실용적인 구현 알고리즘을 제공한다
AGoF 통계량 도입: 비정보적 기준선에 대한 모형의 개선 백분율을 정량화한다
완전한 이론 분석 제공: 점근분포, 부트스트랩 일관성 등 이론적 보장을 포함한다

Hadamard 미분가능성: $1 < p < \infty$ 에 대해, $L^p$ 노름은 Hadamard 미분가능하여 함수 델타 방법의 적용이 용이하다
가우스 극한: 일반적인 가정 하에서, 점근분포는 가우스이다
부트스트랩 일관성: 적절한 조건 하에서, 표준 부트스트랩 추정량은 일관되다
유연성: $p$ 값을 조절하여 분포 꼬리에 대한 민감도를 제어할 수 있다

2. 이론적 프레임워크

완전한 점근 이론을 수립하였으며, 다음을 포함한다:

$L^p$ 공간에서의 경험적 과정의 약한 수렴
추정된 매개변수를 포함한 과정의 극한분포
부트스트랩 과정의 일관성

$p = 1$ 일 때: $T(F,G(\theta_F),1) = \int_{C_{\theta_F}} |G_{\theta_F}| + \int_{\mathbb{R}\setminus C_{\theta_F}} G_{\theta_F}\text{sgn}(F-G(\theta_F))$
$1 < p < \infty$ 일 때: $T(F,G(\theta_F),p) = \frac{1}{\|F-G(\theta_F)\|_p^{p-1}} \int G_{\theta_F} |F-G(\theta_F)|^{p-1}\text{sgn}(F-G(\theta_F))$

추론 1: 정규성 조건

극한분포가 정규인 필요충분조건:

$p = 1$ : 접촉 집합 $C_{\theta_F} = \{F = G(\theta_F)\}$ 의 르벡 측도가 0이다
$1 < p < \infty$ : $F \neq G(\theta_F)$

표본 크기: $n = 30, 50, 100, 500$
부트스트랩 횟수: $B = 2000$
유의수준: $\alpha = 0.05$
몬테카를로 반복: 1000회

검정 시나리오

Weibull vs 지수 모형: $p = 1$ , 실제 분포는 Weibull(2,1)
가우스 혼합 vs 정규 모형: $p = 2$ , 실제 분포는 2-성분 가우스 혼합
음이항 vs 포아송 모형: $p = 1$ , 이산분포 경우
Kumaraswamy vs 베타 모형: $p = 1$ , 유한 지지 경우
Student t vs 정규 모형: $p = 4$ , 무거운 꼬리 분포 경우
로그정규 vs 감마 모형: $p = 1$ , 비대칭 분포 경우

두 가지 부트스트랩 방법

부트스트랩 1: 분위수 기반 방법, 기각 조건: $2\|F_n - G(\hat{\theta}_n)\|_p - \hat{\epsilon}^*(\alpha) < \epsilon$
부트스트랩 2: 정규 근사 기반 방법, 기각 조건: $\|F_n - G(\hat{\theta}_n)\|_p - \hat{\sigma}_{\text{boot}}z_\alpha < \epsilon$

중간 표본 크기 ( $n = 500$ ): 두 방법의 성능이 유사하며, 검정 수준을 잘 제어한다
소표본 ( $n \leq 100$ ): 부트스트랩 2가 일반적으로 명목 유의수준을 더 잘 제어한다
높은 AGoF 통계량 (> 0.9): 부트스트랩 1이 더 나은 성능을 보인다