2025-11-25T20:55:18.544254

Earthquake Forecasting with ETAS.inlabru

Zhong
The ETAS models are currently the most popular in the field of earthquake forecasting. The MCMC method is time-consuming and limited by parameter correlation while bringing parameter uncertainty. The INLA-based method "inlabru" solves these problems and performs better at Bayesian inference. The report introduces the composition of the ETAS model, then provides the model's log-likelihood and approximates it using Taylor expansion and binning strategies. We also present the general procedure of Bayesian inference in inlabru. The report follows three experiments. The first one explores the effect of fixing one parameter at its actual or wrong values on the posterior distribution of other parameters. We found that $α$ and $K$ have an apparent mutual influence relationship. At the same time, fixing $α$ or $K$ to its actual value can reduce the model fitting time by more than half. The second experiment compares normalised inter-event-time distribution on real data and synthetic catalogues. The distributions of normalised inter-event-time of real data and synthetic catalogues are consistent. Compared with Exp(1), they have more short and long inter-event-time, indicating the existence of clustering. Change on $μ$ and $p$ will influence the inter-event-time distribution. In the last one, we use events before the mainshock to predict events ten weeks after the mainshock. We use the number test and Continuous Ranked Probability Score (CRPS) to measure the accuracy and precision of the predictions. We found that we need at least one mainshock and corresponding offspring to make reliable forecasting. And when we have more mainshocks in our data, our forecasting will be better. Besides, we also figure out what is needed to obtain a good posterior distribution for each parameter.
academic

Earthquake Forecasting with ETAS.inlabru

基本信息

  • 论文ID: 2510.13930
  • 标题: Earthquake Forecasting with ETAS.inlabru
  • 作者: Ziwen Zhong
  • 分类: stat.AP (Statistics - Applications)
  • 发表时间: 2025年10月15日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2510.13930v1

摘要

本文研究使用ETAS模型进行地震预测,针对传统MCMC方法计算耗时且参数相关性强的问题,提出采用基于INLA的"inlabru"方法进行贝叶斯推断。论文通过三个实验验证了方法的有效性:(1)探索固定参数对其他参数后验分布的影响,发现α和K参数存在明显相互影响关系;(2)比较真实数据和合成目录的标准化事件间隔时间分布;(3)使用主震前事件预测主震后十周内的地震事件,采用数量测试和连续排序概率分数(CRPS)评估预测准确性。

研究背景与动机

问题定义

地震作为威胁人类生命财产安全的自然灾害之一,具有突发性强、难以及时逃避的特点。虽然目前尚无法实现主震预测这一研究最高理想,但在余震预测方面已取得良好进展。可靠的余震预测能够帮助政府和救援人员更好地规划震后救援工作。

重要性

余震预测的准确性直接关系到:

  1. 为受灾人员争取更多生存机会
  2. 更好地保护救援人员生命安全
  3. 优化震后救援资源配置

现有方法局限性

  1. 最大似然估计(MLE):方法直接简单,但无法获得参数估计的不确定性
  2. 马尔可夫链蒙特卡洛(MCMC):作为贝叶斯方法能获得参数后验分布,但存在以下问题:
    • 计算耗时长
    • 模型参数间高度相关性
    • 难以保证获得良好的参数后验分布

研究动机

'inlabru'方法基于积分嵌套拉普拉斯近似(INLA),能够:

  • 通过近似后验分布显著减少模型拟合时间
  • 在协方差参数和潜在变量间依赖关系近似线性时表现优异
  • 内部估计高斯近似,提高贝叶斯推断效果

核心贡献

  1. 方法论贡献:将INLA-based的inlabru方法应用于ETAS模型的地震预测,解决了传统MCMC方法的计算效率问题
  2. 参数相互关系发现:通过系统实验揭示了ETAS模型中参数间的相互影响关系,特别是α和K参数的强相关性
  3. 计算效率提升:证明固定α或K参数到真实值可将模型拟合时间减少一半以上
  4. 预测能力验证:建立了基于真实地震数据的预测评估框架,确定了可靠预测所需的最小数据要求
  5. 理论洞察:阐明了获得良好参数后验分布所需的条件,为实际应用提供指导

方法详解

任务定义

输入:历史地震事件序列,包含发生时间t、位置s和震级m 输出:未来时间窗口内地震事件的概率分布预测 约束:基于自激发点过程的ETAS模型框架

模型架构

ETAS模型基础

ETAS模型基于Hawkes过程,其强度函数为:

λ_ETAS(t,m|H_t) = (μ + Σ K·e^(α(m_h-M_0))·(t-t_h/c + 1)^(-p))·π(m)

其中:

  • μ: 背景发生率
  • K: 生产率,控制触发函数强度
  • α: 震级标度,控制历史事件震级影响
  • c: 时间偏移
  • p: 余震衰减参数
  • π(m): 遵循Gutenberg-Richter定律的震级分布

对数似然近似

采用Taylor展开和分箱策略近似对数似然:

L(θ|H) = -Λ_0(T_1,T_2) - Σ Σ Λ_i(t_j^(bi), t_{j+1}^(bi)) + Σ log λ(t_i|H_{t_i})

贝叶斯推断流程

  1. 使用初始参数θ_0获得Taylor级数近似对数似然函数
  2. 与对数先验相加,计算后验分布的众数θ_1*
  3. 通过线搜索更新参数:θ* = αθ_0 + (1-α)θ_1*
  4. 迭代直到收敛(差异小于1%)

技术创新点

  1. 分箱策略优化:采用自适应分箱,左侧窄分箱提高精度,右侧宽分箱减少计算量
  2. 逆概率积分变换:将高斯分布样本转换为目标先验分布样本
  3. 线性近似:通过Taylor展开实现高效的似然函数近似

实验设置

数据集

  1. Aquila地震:用于生成合成目录和参数分析
  2. Amatrice地震(2016-2017年意大利):包含三次主震的真实地震序列
  3. 合成目录:基于Aquila地震参数生成,用于控制实验

评价指标

  1. 数量测试(N-test):评估预测事件数量的准确性
    δ_2 = |{N_j|N_j ≤ N_obs, j=1,...,m}|/m
    
  2. 连续排序概率分数(CRPS):同时评估准确性和精度
    S(F,N_true) = Σ(F(k) - I(N_true ≤ k))²
    

对比方法

  • 完整ETAS模型 vs 固定单一参数的模型
  • 不同历史主震数量的模型比较
  • 真实数据 vs 合成数据的分布比较

实现细节

先验分布

  • μ ~ Gamma(0.3, 0.6)
  • K, α, c ~ U(0, 10)
  • p ~ U(1, 10)

初始值:μ₀=0.5, K₀=0.1, α₀=1, c₀=0.1, p₀=1.1

实验结果

主要结果

实验1:参数固定效应

关键发现

  • α和K存在明显相互影响关系:固定其中一个到真实值能改善另一个的后验分布
  • c和p之间也存在相互影响关系
  • μ相对独立,固定其他参数不影响μ的后验分布

计算效率提升

模型配置目录1目录2目录3
完整模型41.73s46.51s44.92s
固定K26.00s20.95s21.47s
固定α18.25s7.75s15.15s

实验2:事件间隔时间分布

  • 真实数据与合成目录的标准化事件间隔时间分布基本一致
  • 相比指数分布Exp(1),存在更多短间隔和长间隔事件,表明聚集性存在
  • μ增大使分布更接近Exp(1)(均匀泊松过程)
  • p增大显著增加短间隔事件数量

实验3:预测性能评估

Amatrice地震预测结果

  • 使用第二次主震:所有十周都存在过预测,但真实值在95%置信区间内
  • 使用第三次主震:δ₂值接近0.5,预测更准确
  • CRPS显示第三次主震预测显著优于第二次主震预测

消融实验

历史主震数量影响

  1. 无主震:除μ外所有参数后验分布极差
  2. 一次主震:可获得基本可用的预测,但精度有限
  3. 两次主震:显著改善预测性能,特别是α参数的后验分布

案例分析

参数估计难易程度排序

  1. μ(最易):少量事件即可估计
  2. c, p(中等):需要更多地震事件,在平静目录中可估计
  3. α, K(最难):需要至少一次主震及相应余震;更多主震能显著改善α的后验分布

实验发现

  1. 参数相关性:α-K和c-p存在强相关性,需要联合考虑
  2. 数据需求:可靠预测至少需要一次完整的主震-余震序列
  3. 预测改善:历史主震数量增加能显著提升预测性能
  4. 计算优化:先验信息的合理利用能大幅提升计算效率

相关工作

主要研究方向

  1. ETAS模型发展:从Ogata (1988)的原始模型到各种扩展版本
  2. 参数估计方法:从MLE到MCMC再到INLA-based方法的演进
  3. 地震预测评估:数量测试、CRPS等评估指标的发展

本文与相关工作关系

  • 建立在Hawkes过程理论基础上
  • 继承ETAS模型的核心思想
  • 在Serafini et al. (2023)和Naylor et al. (2023)的inlabru应用基础上进行深入研究

相对优势

  1. 计算效率显著优于传统MCMC方法
  2. 系统分析了参数间相互关系
  3. 提供了实用的预测评估框架

结论与讨论

主要结论

  1. 方法有效性:inlabru方法在ETAS模型中表现优异,显著提升计算效率
  2. 参数关系:α和K的相互依赖关系是影响模型性能的关键因素
  3. 预测能力:模型具备可靠的余震预测能力,预测质量随历史数据丰富度提升
  4. 数据要求:至少需要一次主震-余震序列才能进行可靠预测

局限性

  1. 数据限制:合成目录仅包含单次主震,限制了结论的普遍性
  2. 事件间隔定义:仅考虑相邻事件间隔,未考虑主震聚类内部结构
  3. 计算挑战:主震数量增加时模型拟合时间显著增长,收敛困难
  4. 特征分析不足:除主震数量外,其他地震特征对后验分布的影响尚未充分探索

未来方向

  1. 参数更新策略:开发增量学习方法,使用前一主震的后验分布作为下一次的先验
  2. 多主震实验:在包含更多主震的合成目录上重复实验
  3. 事件聚类分析:研究主震聚类内部和之间的事件间隔分布
  4. 特征影响研究:系统分析各种地震特征对模型性能的影响

深度评价

优点

  1. 方法创新性:成功将INLA方法应用于ETAS模型,解决了实际计算问题
  2. 实验设计完备:三个实验从不同角度全面评估了方法性能
  3. 参数分析深入:系统揭示了ETAS模型参数间的相互关系
  4. 实用价值高:为实际地震预测应用提供了明确的数据需求指导
  5. 结果可信度高:使用真实地震数据验证,结论具有实际意义

不足

  1. 理论分析不足:缺乏对参数相关性的理论解释
  2. 实验范围有限:主要基于意大利地震数据,地域代表性不足
  3. 方法比较不充分:未与其他现代贝叶斯方法进行详细比较
  4. 不确定性量化:对预测不确定性的分析还不够深入

影响力

  1. 学术贡献:为地震学和统计学交叉领域提供了新的方法论
  2. 实用价值:可直接应用于实际地震预测和风险评估
  3. 可复现性:基于开源R包inlabru,具有良好的可复现性
  4. 推广潜力:方法可扩展到其他自激发点过程应用领域

适用场景

  1. 余震预测:震后短期内的余震活动预测
  2. 地震风险评估:基于历史数据的地震风险评估
  3. 应急响应规划:为震后救援提供科学决策支持
  4. 地震学研究:用于理解地震活动的时空分布规律

参考文献

主要参考文献包括:

  • Ogata (1988): ETAS模型的原始提出
  • Hawkes (1971): Hawkes过程的理论基础
  • Rue et al. (2017): INLA方法的理论框架
  • Serafini et al. (2023): inlabru在Hawkes过程中的应用
  • Naylor et al. (2023): ETAS模型的贝叶斯建模

总体评价:这是一篇在地震预测领域具有重要实用价值的论文,成功解决了ETAS模型计算效率问题,并通过系统实验提供了有价值的参数分析和预测评估。虽然在理论深度和实验广度上还有提升空间,但其方法的实用性和结论的可操作性使其成为该领域的重要贡献。