2025-11-25T20:55:18.544254

Earthquake Forecasting with ETAS.inlabru

Zhong
The ETAS models are currently the most popular in the field of earthquake forecasting. The MCMC method is time-consuming and limited by parameter correlation while bringing parameter uncertainty. The INLA-based method "inlabru" solves these problems and performs better at Bayesian inference. The report introduces the composition of the ETAS model, then provides the model's log-likelihood and approximates it using Taylor expansion and binning strategies. We also present the general procedure of Bayesian inference in inlabru. The report follows three experiments. The first one explores the effect of fixing one parameter at its actual or wrong values on the posterior distribution of other parameters. We found that $α$ and $K$ have an apparent mutual influence relationship. At the same time, fixing $α$ or $K$ to its actual value can reduce the model fitting time by more than half. The second experiment compares normalised inter-event-time distribution on real data and synthetic catalogues. The distributions of normalised inter-event-time of real data and synthetic catalogues are consistent. Compared with Exp(1), they have more short and long inter-event-time, indicating the existence of clustering. Change on $μ$ and $p$ will influence the inter-event-time distribution. In the last one, we use events before the mainshock to predict events ten weeks after the mainshock. We use the number test and Continuous Ranked Probability Score (CRPS) to measure the accuracy and precision of the predictions. We found that we need at least one mainshock and corresponding offspring to make reliable forecasting. And when we have more mainshocks in our data, our forecasting will be better. Besides, we also figure out what is needed to obtain a good posterior distribution for each parameter.
academic

ETAS.inlabru을 이용한 지진 예측

기본 정보

  • 논문 ID: 2510.13930
  • 제목: Earthquake Forecasting with ETAS.inlabru
  • 저자: Ziwen Zhong
  • 분류: stat.AP (통계학 - 응용)
  • 발표 시간: 2025년 10월 15일 (arXiv 사전인쇄본)
  • 논문 링크: https://arxiv.org/abs/2510.13930v1

초록

본 논문은 ETAS 모델을 이용한 지진 예측을 연구하며, 전통적인 MCMC 방법의 계산 시간 소요 및 강한 매개변수 상관성 문제를 해결하기 위해 INLA 기반의 "inlabru" 방법을 이용한 베이지안 추론을 제안한다. 논문은 세 가지 실험을 통해 방법의 유효성을 검증한다: (1) 고정된 매개변수가 다른 매개변수의 사후분포에 미치는 영향을 탐색하여 α와 K 매개변수 간의 명확한 상호 영향 관계를 발견; (2) 실제 데이터와 합성 카탈로그의 정규화된 사건 간 시간 분포 비교; (3) 본진 전 사건을 이용하여 본진 후 10주 내의 지진 사건을 예측하며, 개수 검정(N-test)과 연속 순위 확률 점수(CRPS)를 이용한 예측 정확도 평가.

연구 배경 및 동기

문제 정의

지진은 인류의 생명과 재산 안전을 위협하는 자연재해 중 하나로, 돌발성이 강하고 적시에 회피하기 어려운 특징을 가진다. 현재 본진 예측이라는 연구의 최고 이상을 실현할 수는 없지만, 여진 예측 분야에서는 좋은 진전을 이루었다. 신뢰할 수 있는 여진 예측은 정부와 구조 인력이 지진 후 구조 활동을 더 잘 계획하도록 도울 수 있다.

중요성

여진 예측의 정확성은 다음과 직접 관련된다:

  1. 피해 주민을 위한 생존 기회 확보
  2. 구조 인력의 생명 안전 보호 강화
  3. 지진 후 구조 자원 배치 최적화

기존 방법의 한계

  1. 최대우도추정(MLE): 방법이 직접적이고 단순하지만, 매개변수 추정의 불확실성을 얻을 수 없음
  2. 마르코프 연쇄 몬테카를로(MCMC): 베이지안 방법으로서 매개변수 사후분포를 얻을 수 있지만 다음의 문제가 있음:
    • 계산 시간이 오래 소요됨
    • 모델 매개변수 간 높은 상관성
    • 양호한 매개변수 사후분포 획득 보장 어려움

연구 동기

'inlabru' 방법은 적분 중첩 라플라스 근사(INLA)에 기반하여 다음을 수행할 수 있다:

  • 사후분포 근사를 통해 모델 적합 시간을 현저히 감소
  • 공분산 매개변수와 잠재 변수 간 의존성이 근사적으로 선형일 때 우수한 성능 발휘
  • 내부 가우스 근사 추정으로 베이지안 추론 효과 향상

핵심 기여

  1. 방법론적 기여: INLA 기반의 inlabru 방법을 ETAS 모델의 지진 예측에 적용하여 전통적인 MCMC 방법의 계산 효율 문제 해결
  2. 매개변수 상호관계 발견: 체계적인 실험을 통해 ETAS 모델의 매개변수 간 상호 영향 관계를 규명하며, 특히 α와 K 매개변수의 강한 상관성 발견
  3. 계산 효율 향상: α 또는 K 매개변수를 실제값으로 고정하면 모델 적합 시간을 50% 이상 감소시킬 수 있음을 증명
  4. 예측 능력 검증: 실제 지진 데이터를 기반으로 한 예측 평가 프레임워크 구축 및 신뢰할 수 있는 예측에 필요한 최소 데이터 요구사항 결정
  5. 이론적 통찰: 양호한 매개변수 사후분포 획득에 필요한 조건을 명확히 하여 실제 응용에 지침 제공

방법 상세 설명

작업 정의

입력: 발생 시간 t, 위치 s, 규모 m을 포함한 역사적 지진 사건 수열 출력: 미래 시간 창 내 지진 사건의 확률분포 예측 제약: 자기 여기 점 과정의 ETAS 모델 프레임워크 기반

모델 구조

ETAS 모델 기초

ETAS 모델은 Hawkes 과정에 기반하며, 그 강도 함수는:

λ_ETAS(t,m|H_t) = (μ + Σ K·e^(α(m_h-M_0))·(t-t_h/c + 1)^(-p))·π(m)

여기서:

  • μ: 배경 발생률
  • K: 생산률, 트리거 함수 강도 제어
  • α: 규모 척도, 역사 사건 규모 영향 제어
  • c: 시간 오프셋
  • p: 여진 감쇠 매개변수
  • π(m): Gutenberg-Richter 법칙을 따르는 규모 분포

로그우도 근사

Taylor 전개와 분할 전략을 이용한 로그우도 근사:

L(θ|H) = -Λ_0(T_1,T_2) - Σ Σ Λ_i(t_j^(bi), t_{j+1}^(bi)) + Σ log λ(t_i|H_{t_i})

베이지안 추론 과정

  1. 초기 매개변수 θ_0를 이용하여 Taylor 급수 근사 로그우도 함수 획득
  2. 로그 사전분포와 합산하여 사후분포의 최빈값 θ_1* 계산
  3. 선형 탐색을 통한 매개변수 업데이트: θ* = αθ_0 + (1-α)θ_1*
  4. 수렴할 때까지 반복 (차이 < 1%)

기술 혁신점

  1. 분할 전략 최적화: 적응형 분할 사용, 좌측 좁은 분할로 정확도 향상, 우측 넓은 분할로 계산량 감소
  2. 역 확률 적분 변환: 가우스 분포 표본을 목표 사전분포 표본으로 변환
  3. 선형 근사: Taylor 전개를 통한 효율적인 우도 함수 근사

실험 설정

데이터셋

  1. Aquila 지진: 합성 카탈로그 생성 및 매개변수 분석에 사용
  2. Amatrice 지진(2016-2017년 이탈리아): 세 번의 본진을 포함한 실제 지진 수열
  3. 합성 카탈로그: Aquila 지진 매개변수 기반 생성, 제어 실험에 사용

평가 지표

  1. 개수 검정(N-test): 예측 사건 개수의 정확성 평가
    δ_2 = |{N_j|N_j ≤ N_obs, j=1,...,m}|/m
    
  2. 연속 순위 확률 점수(CRPS): 정확성과 정밀도를 동시에 평가
    S(F,N_true) = Σ(F(k) - I(N_true ≤ k))²
    

비교 방법

  • 완전 ETAS 모델 vs 단일 매개변수 고정 모델
  • 서로 다른 역사 본진 개수의 모델 비교
  • 실제 데이터 vs 합성 데이터의 분포 비교

구현 세부사항

사전분포:

  • μ ~ Gamma(0.3, 0.6)
  • K, α, c ~ U(0, 10)
  • p ~ U(1, 10)

초기값: μ₀=0.5, K₀=0.1, α₀=1, c₀=0.1, p₀=1.1

실험 결과

주요 결과

실험 1: 매개변수 고정 효과

핵심 발견:

  • α와 K는 명확한 상호 영향 관계 존재: 하나를 실제값으로 고정하면 다른 하나의 사후분포 개선 가능
  • c와 p 간에도 상호 영향 관계 존재
  • μ는 상대적으로 독립적이며, 다른 매개변수 고정이 μ의 사후분포에 영향 없음

계산 효율 향상:

모델 구성카탈로그 1카탈로그 2카탈로그 3
완전 모델41.73s46.51s44.92s
K 고정26.00s20.95s21.47s
α 고정18.25s7.75s15.15s

실험 2: 사건 간 시간 분포

  • 실제 데이터와 합성 카탈로그의 정규화된 사건 간 시간 분포가 기본적으로 일치
  • 지수분포 Exp(1)에 비해 더 많은 단시간 및 장시간 간격 사건 존재, 집계성 존재 나타냄
  • μ 증가로 분포가 Exp(1)(균일 포아송 과정)에 더 가까워짐
  • p 증가로 단시간 간격 사건 개수 현저히 증가

실험 3: 예측 성능 평가

Amatrice 지진 예측 결과:

  • 두 번째 본진 사용: 모든 10주에서 과다 예측 존재하나, 실제값이 95% 신뢰 구간 내
  • 세 번째 본진 사용: δ₂ 값이 0.5에 근접하여 예측이 더 정확함
  • CRPS는 세 번째 본진 예측이 두 번째 본진 예측보다 현저히 우수함을 보여줌

제거 실험

역사 본진 개수의 영향:

  1. 본진 없음: μ 제외 모든 매개변수의 사후분포가 극히 불량
  2. 한 번의 본진: 기본적으로 사용 가능한 예측 획득 가능하나, 정밀도 제한적
  3. 두 번의 본진: 예측 성능 현저히 개선, 특히 α 매개변수의 사후분포 개선

사례 분석

매개변수 추정 난이도 순서:

  1. μ(가장 용이): 소량의 사건으로도 추정 가능
  2. c, p(중간): 더 많은 지진 사건 필요, 조용한 카탈로그에서 추정 가능
  3. α, K(가장 어려움): 최소한 한 번의 본진 및 해당 여진 필요; 더 많은 본진이 α의 사후분포를 현저히 개선 가능

실험 발견

  1. 매개변수 상관성: α-K와 c-p 간 강한 상관성 존재, 연합적 고려 필요
  2. 데이터 요구사항: 신뢰할 수 있는 예측을 위해 최소한 한 번의 완전한 본진-여진 수열 필요
  3. 예측 개선: 역사 본진 개수 증가로 예측 성능 현저히 향상
  4. 계산 최적화: 사전정보의 합리적 활용으로 계산 효율 대폭 향상 가능

관련 연구

주요 연구 방향

  1. ETAS 모델 발전: Ogata (1988)의 원래 모델에서 다양한 확장 버전으로의 진화
  2. 매개변수 추정 방법: MLE에서 MCMC를 거쳐 INLA 기반 방법으로의 진화
  3. 지진 예측 평가: 개수 검정, CRPS 등 평가 지표의 발전

본 논문과 관련 연구의 관계

  • Hawkes 과정 이론 기초 위에 구축
  • ETAS 모델의 핵심 사상 계승
  • Serafini et al. (2023)과 Naylor et al. (2023)의 inlabru 응용 기초 위에 심화 연구

상대적 장점

  1. 전통적인 MCMC 방법 대비 계산 효율 현저히 향상
  2. 매개변수 간 상호관계를 체계적으로 분석
  3. 실용적인 예측 평가 프레임워크 제공

결론 및 논의

주요 결론

  1. 방법 유효성: inlabru 방법이 ETAS 모델에서 우수한 성능 발휘, 계산 효율 현저히 향상
  2. 매개변수 관계: α와 K의 상호 의존 관계가 모델 성능에 영향을 미치는 핵심 요소
  3. 예측 능력: 모델이 신뢰할 수 있는 여진 예측 능력 보유, 예측 품질이 역사 데이터 풍부도에 따라 향상
  4. 데이터 요구사항: 신뢰할 수 있는 예측을 위해 최소한 한 번의 본진-여진 수열 필요

한계

  1. 데이터 제한: 합성 카탈로그가 단일 본진만 포함하여 결론의 보편성 제한
  2. 사건 간 시간 정의: 인접 사건 간 시간만 고려하며, 본진 집단 내부 구조 미고려
  3. 계산 도전: 본진 개수 증가 시 모델 적합 시간 현저히 증가, 수렴 어려움
  4. 특성 분석 부족: 본진 개수 외 다른 지진 특성이 사후분포에 미치는 영향 충분히 탐색되지 않음

향후 방향

  1. 매개변수 업데이트 전략: 증분 학습 방법 개발, 이전 본진의 사후분포를 다음 사전분포로 사용
  2. 다중 본진 실험: 더 많은 본진을 포함한 합성 카탈로그에서 실험 반복
  3. 사건 집단 분석: 본진 집단 내부 및 집단 간 사건 간 시간 분포 연구
  4. 특성 영향 연구: 다양한 지진 특성이 모델 성능에 미치는 영향을 체계적으로 분석

심층 평가

장점

  1. 방법 혁신성: INLA 방법을 ETAS 모델에 성공적으로 적용하여 실제 계산 문제 해결
  2. 실험 설계 완비: 세 가지 실험이 다양한 각도에서 방법 성능을 종합적으로 평가
  3. 매개변수 분석 심화: ETAS 모델 매개변수 간 상호관계를 체계적으로 규명
  4. 실용 가치 높음: 실제 지진 예측 응용을 위한 명확한 데이터 요구사항 지침 제공
  5. 결과 신뢰도 높음: 실제 지진 데이터 사용으로 검증, 결론이 실제 의미 보유

부족점

  1. 이론 분석 부족: 매개변수 상관성에 대한 이론적 설명 부재
  2. 실험 범위 제한: 주로 이탈리아 지진 데이터 기반, 지역 대표성 부족
  3. 방법 비교 불충분: 다른 현대적 베이지안 방법과의 상세 비교 미흡
  4. 불확실성 정량화: 예측 불확실성 분석이 충분히 심화되지 않음

영향력

  1. 학술 기여: 지진학과 통계학 교차 분야에 새로운 방법론 제공
  2. 실용 가치: 실제 지진 예측 및 위험 평가에 직접 적용 가능
  3. 재현성: 오픈소스 R 패키지 inlabru 기반으로 양호한 재현성 보유
  4. 확산 잠재력: 방법이 다른 자기 여기 점 과정 응용 분야로 확장 가능

적용 시나리오

  1. 여진 예측: 지진 후 단기 여진 활동 예측
  2. 지진 위험 평가: 역사 데이터 기반 지진 위험 평가
  3. 응급 대응 계획: 지진 후 구조 활동을 위한 과학적 의사결정 지원
  4. 지진학 연구: 지진 활동의 시공간 분포 규칙 이해에 활용

참고문헌

주요 참고문헌:

  • Ogata (1988): ETAS 모델의 원래 제안
  • Hawkes (1971): Hawkes 과정의 이론 기초
  • Rue et al. (2017): INLA 방법의 이론 프레임워크
  • Serafini et al. (2023): Hawkes 과정에서의 inlabru 응용
  • Naylor et al. (2023): ETAS 모델의 베이지안 모델링

종합 평가: 본 논문은 지진 예측 분야에서 중요한 실용 가치를 가진 논문으로, ETAS 모델의 계산 효율 문제를 성공적으로 해결하였으며, 체계적인 실험을 통해 가치 있는 매개변수 분석 및 예측 평가를 제공한다. 이론적 깊이와 실험 광범위성에서 개선 여지가 있지만, 방법의 실용성과 결론의 실행 가능성으로 인해 해당 분야의 중요한 기여가 된다.