2025-11-25T20:55:18.544254

Earthquake Forecasting with ETAS.inlabru

Zhong
The ETAS models are currently the most popular in the field of earthquake forecasting. The MCMC method is time-consuming and limited by parameter correlation while bringing parameter uncertainty. The INLA-based method "inlabru" solves these problems and performs better at Bayesian inference. The report introduces the composition of the ETAS model, then provides the model's log-likelihood and approximates it using Taylor expansion and binning strategies. We also present the general procedure of Bayesian inference in inlabru. The report follows three experiments. The first one explores the effect of fixing one parameter at its actual or wrong values on the posterior distribution of other parameters. We found that $α$ and $K$ have an apparent mutual influence relationship. At the same time, fixing $α$ or $K$ to its actual value can reduce the model fitting time by more than half. The second experiment compares normalised inter-event-time distribution on real data and synthetic catalogues. The distributions of normalised inter-event-time of real data and synthetic catalogues are consistent. Compared with Exp(1), they have more short and long inter-event-time, indicating the existence of clustering. Change on $μ$ and $p$ will influence the inter-event-time distribution. In the last one, we use events before the mainshock to predict events ten weeks after the mainshock. We use the number test and Continuous Ranked Probability Score (CRPS) to measure the accuracy and precision of the predictions. We found that we need at least one mainshock and corresponding offspring to make reliable forecasting. And when we have more mainshocks in our data, our forecasting will be better. Besides, we also figure out what is needed to obtain a good posterior distribution for each parameter.
academic

Prévision des tremblements de terre avec ETAS.inlabru

Informations de base

  • ID de l'article: 2510.13930
  • Titre: Earthquake Forecasting with ETAS.inlabru
  • Auteur: Ziwen Zhong
  • Classification: stat.AP (Statistiques - Applications)
  • Date de publication: 15 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.13930v1

Résumé

Cet article étudie la prévision des tremblements de terre à l'aide du modèle ETAS, en réponse aux problèmes de temps de calcul élevé et de forte corrélation des paramètres des méthodes MCMC traditionnelles. L'article propose l'utilisation de la méthode « inlabru » basée sur INLA pour l'inférence bayésienne. Trois expériences valident l'efficacité de la méthode : (1) exploration de l'impact des paramètres fixes sur les distributions a posteriori d'autres paramètres, révélant une influence mutuelle évidente entre les paramètres α et K ; (2) comparaison des distributions des intervalles de temps normalisés entre événements pour les données réelles et les catalogues synthétiques ; (3) utilisation d'événements précédant le séisme principal pour prédire les événements sismiques dans les dix semaines suivant le séisme principal, en évaluant la précision des prédictions à l'aide du test de nombre et du score de probabilité continue classée (CRPS).

Contexte et motivation de la recherche

Définition du problème

Les tremblements de terre, en tant que catastrophes naturelles menaçant la vie et les biens des humains, se caractérisent par leur soudaineté et la difficulté à s'échapper à temps. Bien que la prédiction des séismes principaux reste l'idéal suprême de la recherche et n'ait pas encore été réalisée, des progrès significatifs ont été réalisés dans la prédiction des répliques. Les prédictions fiables des répliques aident les gouvernements et les équipes de secours à mieux planifier les opérations de secours après les tremblements de terre.

Importance

La précision de la prédiction des répliques est directement liée à :

  1. Donner plus de chances de survie aux personnes sinistrées
  2. Mieux protéger la vie des équipes de secours
  3. Optimiser l'allocation des ressources de secours après les tremblements de terre

Limitations des méthodes existantes

  1. Estimation du maximum de vraisemblance (MLE) : méthode directe et simple, mais incapable d'obtenir l'incertitude des estimations de paramètres
  2. Chaîne de Markov Monte-Carlo (MCMC) : en tant que méthode bayésienne capable d'obtenir les distributions a posteriori des paramètres, elle présente les problèmes suivants :
    • Temps de calcul élevé
    • Corrélation élevée entre les paramètres du modèle
    • Difficulté à garantir l'obtention de bonnes distributions a posteriori des paramètres

Motivation de la recherche

La méthode « inlabru » basée sur l'approximation de Laplace imbriquée intégrée (INLA) peut :

  • Réduire considérablement le temps d'ajustement du modèle par approximation de la distribution a posteriori
  • Montrer d'excellentes performances lorsque la relation de dépendance entre les paramètres de covariance et les variables latentes est approximativement linéaire
  • Estimer l'approximation gaussienne en interne, améliorant l'inférence bayésienne

Contributions principales

  1. Contribution méthodologique : application de la méthode inlabru basée sur INLA au modèle ETAS pour la prévision des tremblements de terre, résolvant les problèmes d'efficacité de calcul des méthodes MCMC traditionnelles
  2. Découverte des relations entre paramètres : révélation systématique des relations d'influence mutuelle entre les paramètres du modèle ETAS par des expériences, en particulier la forte corrélation entre les paramètres α et K
  3. Amélioration de l'efficacité de calcul : démonstration que la fixation des paramètres α ou K à leurs valeurs réelles peut réduire le temps d'ajustement du modèle de plus de 50 %
  4. Vérification de la capacité de prédiction : établissement d'un cadre d'évaluation des prédictions basé sur les données réelles de tremblements de terre, déterminant les exigences minimales en matière de données pour une prédiction fiable
  5. Aperçu théorique : clarification des conditions nécessaires pour obtenir une bonne distribution a posteriori des paramètres, fournissant des orientations pour les applications pratiques

Explication détaillée de la méthode

Définition de la tâche

Entrée : séquence historique d'événements sismiques, incluant le temps d'occurrence t, la localisation s et la magnitude m Sortie : prédiction de la distribution de probabilité des événements sismiques dans une fenêtre de temps future Contrainte : cadre du modèle ETAS basé sur le processus ponctuel auto-excité

Architecture du modèle

Fondements du modèle ETAS

Le modèle ETAS est basé sur le processus de Hawkes, dont la fonction d'intensité est :

λ_ETAS(t,m|H_t) = (μ + Σ K·e^(α(m_h-M_0))·(t-t_h/c + 1)^(-p))·π(m)

Où :

  • μ : taux d'occurrence de fond
  • K : taux de production, contrôlant l'intensité de la fonction de déclenchement
  • α : échelle de magnitude, contrôlant l'impact de la magnitude des événements historiques
  • c : décalage temporel
  • p : paramètre d'amortissement des répliques
  • π(m) : distribution de magnitude suivant la loi de Gutenberg-Richter

Approximation de la log-vraisemblance

Utilisation de l'expansion de Taylor et d'une stratégie de binning pour approximer la log-vraisemblance :

L(θ|H) = -Λ_0(T_1,T_2) - Σ Σ Λ_i(t_j^(bi), t_{j+1}^(bi)) + Σ log λ(t_i|H_{t_i})

Processus d'inférence bayésienne

  1. Utilisation des paramètres initiaux θ_0 pour obtenir l'approximation de la série de Taylor de la fonction log-vraisemblance
  2. Addition avec le log a priori, calcul du mode de la distribution a posteriori θ_1*
  3. Mise à jour des paramètres par recherche linéaire : θ* = αθ_0 + (1-α)θ_1*
  4. Itération jusqu'à convergence (différence inférieure à 1%)

Points d'innovation technique

  1. Optimisation de la stratégie de binning : utilisation du binning adaptatif, avec des bacs étroits à gauche pour améliorer la précision et des bacs larges à droite pour réduire la charge de calcul
  2. Transformation intégrale de probabilité inverse : conversion d'échantillons de distribution gaussienne en échantillons de distribution a priori cible
  3. Approximation linéaire : réalisation d'une approximation efficace de la fonction de vraisemblance par expansion de Taylor

Configuration expérimentale

Ensembles de données

  1. Tremblement de terre d'Aquila : utilisé pour générer des catalogues synthétiques et l'analyse des paramètres
  2. Tremblement de terre d'Amatrice (2016-2017, Italie) : séquence sismique réelle contenant trois séismes principaux
  3. Catalogues synthétiques : générés basés sur les paramètres du tremblement de terre d'Aquila, utilisés pour les expériences contrôlées

Indicateurs d'évaluation

  1. Test de nombre (N-test) : évaluation de la précision du nombre d'événements prédits
    δ_2 = |{N_j|N_j ≤ N_obs, j=1,...,m}|/m
    
  2. Score de probabilité continue classée (CRPS) : évaluation simultanée de la précision et de la fiabilité
    S(F,N_true) = Σ(F(k) - I(N_true ≤ k))²
    

Méthodes de comparaison

  • Modèle ETAS complet vs modèles avec paramètres uniques fixes
  • Comparaison de modèles avec différents nombres de séismes principaux historiques
  • Comparaison de la distribution des données réelles vs données synthétiques

Détails de mise en œuvre

Distributions a priori :

  • μ ~ Gamma(0,3, 0,6)
  • K, α, c ~ U(0, 10)
  • p ~ U(1, 10)

Valeurs initiales : μ₀=0,5, K₀=0,1, α₀=1, c₀=0,1, p₀=1,1

Résultats expérimentaux

Résultats principaux

Expérience 1 : Effet de la fixation des paramètres

Découvertes clés :

  • Influence mutuelle évidente entre α et K : la fixation de l'un à sa valeur réelle améliore la distribution a posteriori de l'autre
  • Relation d'influence mutuelle existe également entre c et p
  • μ est relativement indépendant, la fixation d'autres paramètres n'affecte pas la distribution a posteriori de μ

Amélioration de l'efficacité de calcul :

Configuration du modèleCatalogue 1Catalogue 2Catalogue 3
Modèle complet41,73s46,51s44,92s
K fixé26,00s20,95s21,47s
α fixé18,25s7,75s15,15s

Expérience 2 : Distribution des intervalles de temps entre événements

  • La distribution des intervalles de temps normalisés entre événements pour les données réelles et les catalogues synthétiques est essentiellement cohérente
  • Comparée à la distribution exponentielle Exp(1), il existe plus d'événements à intervalles courts et longs, indiquant une agrégation
  • L'augmentation de μ rapproche la distribution de Exp(1) (processus de Poisson uniforme)
  • L'augmentation de p augmente significativement le nombre d'événements à intervalles courts

Expérience 3 : Évaluation des performances de prédiction

Résultats de prédiction du tremblement de terre d'Amatrice :

  • Utilisation du deuxième séisme principal : surprédiction sur les dix semaines, mais la valeur réelle se situe dans l'intervalle de confiance à 95%
  • Utilisation du troisième séisme principal : valeur δ₂ proche de 0,5, prédiction plus précise
  • Le CRPS montre que la prédiction du troisième séisme principal est significativement meilleure que celle du deuxième

Expériences d'ablation

Impact du nombre de séismes principaux historiques :

  1. Aucun séisme principal : distributions a posteriori extrêmement mauvaises pour tous les paramètres sauf μ
  2. Un séisme principal : obtention de prédictions basiquement utilisables, mais précision limitée
  3. Deux séismes principaux : amélioration significative des performances de prédiction, particulièrement pour la distribution a posteriori du paramètre α

Analyse de cas

Classement de la difficulté d'estimation des paramètres :

  1. μ (le plus facile) : peut être estimé avec peu d'événements
  2. c, p (moyen) : nécessite plus d'événements sismiques, estimable dans les catalogues calmes
  3. α, K (le plus difficile) : nécessite au moins un séisme principal complet et ses répliques ; plus de séismes principaux améliorent significativement la distribution a posteriori de α

Découvertes expérimentales

  1. Corrélation des paramètres : forte corrélation entre α-K et c-p, nécessitant une considération conjointe
  2. Exigences en matière de données : une prédiction fiable nécessite au moins une séquence complète de séisme principal-répliques
  3. Amélioration de la prédiction : l'augmentation du nombre de séismes principaux historiques améliore significativement les performances de prédiction
  4. Optimisation du calcul : l'utilisation judicieuse de l'information a priori peut considérablement améliorer l'efficacité de calcul

Travaux connexes

Principaux domaines de recherche

  1. Développement du modèle ETAS : du modèle original d'Ogata (1988) à diverses versions étendues
  2. Méthodes d'estimation des paramètres : évolution du MLE au MCMC et aux méthodes basées sur INLA
  3. Évaluation de la prévision des tremblements de terre : développement des indicateurs d'évaluation tels que le test de nombre et le CRPS

Relation de cet article avec les travaux connexes

  • Basé sur la théorie des processus de Hawkes
  • Hérite des idées fondamentales du modèle ETAS
  • Approfondit les applications d'inlabru sur la base de Serafini et al. (2023) et Naylor et al. (2023)

Avantages relatifs

  1. Efficacité de calcul significativement supérieure aux méthodes MCMC traditionnelles
  2. Analyse systématique des relations entre les paramètres
  3. Fourniture d'un cadre d'évaluation des prédictions pratique

Conclusions et discussion

Conclusions principales

  1. Efficacité de la méthode : la méthode inlabru montre d'excellentes performances dans le modèle ETAS, améliorant significativement l'efficacité de calcul
  2. Relations entre paramètres : la dépendance mutuelle entre α et K est un facteur clé affectant les performances du modèle
  3. Capacité de prédiction : le modèle possède une capacité fiable de prédiction des répliques, la qualité des prédictions s'améliorant avec l'enrichissement des données historiques
  4. Exigences en matière de données : au moins une séquence de séisme principal-répliques est nécessaire pour une prédiction fiable

Limitations

  1. Limitation des données : les catalogues synthétiques ne contiennent qu'un seul séisme principal, limitant la généralité des conclusions
  2. Définition des intervalles d'événements : seuls les intervalles entre événements adjacents sont considérés, sans tenir compte de la structure interne des grappes de séismes principaux
  3. Défi de calcul : le temps d'ajustement du modèle augmente significativement avec l'augmentation du nombre de séismes principaux, avec des difficultés de convergence
  4. Analyse insuffisante des caractéristiques : l'impact d'autres caractéristiques sismiques sur la distribution a posteriori, au-delà du nombre de séismes principaux, n'a pas été suffisamment exploré

Directions futures

  1. Stratégies de mise à jour des paramètres : développement de méthodes d'apprentissage incrémental, utilisant la distribution a posteriori du séisme principal précédent comme a priori pour le suivant
  2. Expériences avec plusieurs séismes principaux : répétition des expériences sur des catalogues synthétiques contenant plus de séismes principaux
  3. Analyse du clustering d'événements : étude de la distribution des intervalles d'événements à l'intérieur et entre les grappes de séismes principaux
  4. Étude de l'impact des caractéristiques : analyse systématique de l'impact de diverses caractéristiques sismiques sur les performances du modèle

Évaluation approfondie

Points forts

  1. Innovativité de la méthode : application réussie de la méthode INLA au modèle ETAS, résolvant les problèmes de calcul pratiques
  2. Conception expérimentale complète : trois expériences évaluant complètement les performances de la méthode sous différents angles
  3. Analyse approfondie des paramètres : révélation systématique des relations mutuelles entre les paramètres du modèle ETAS
  4. Valeur pratique élevée : fourniture de directives claires sur les exigences en matière de données pour les applications pratiques de prévision des tremblements de terre
  5. Crédibilité élevée des résultats : vérification à l'aide de données réelles de tremblements de terre, conclusions ayant une signification pratique

Insuffisances

  1. Analyse théorique insuffisante : manque d'explication théorique de la corrélation des paramètres
  2. Portée expérimentale limitée : basée principalement sur les données sismiques italiennes, représentativité géographique insuffisante
  3. Comparaison de méthodes insuffisante : pas de comparaison détaillée avec d'autres méthodes bayésiennes modernes
  4. Quantification insuffisante de l'incertitude : analyse insuffisante de l'incertitude des prédictions

Impact

  1. Contribution académique : fourniture d'une nouvelle méthodologie pour le domaine interdisciplinaire de la sismologie et des statistiques
  2. Valeur pratique : application directe à la prévision des tremblements de terre et à l'évaluation des risques sismiques
  3. Reproductibilité : basée sur le package R open-source inlabru, avec bonne reproductibilité
  4. Potentiel de généralisation : la méthode peut être étendue à d'autres applications de processus ponctuels auto-excités

Scénarios d'application

  1. Prévision des répliques : prédiction de l'activité des répliques à court terme après les tremblements de terre
  2. Évaluation du risque sismique : évaluation du risque sismique basée sur les données historiques
  3. Planification des interventions d'urgence : fourniture d'un soutien à la prise de décision scientifique pour les opérations de secours après les tremblements de terre
  4. Recherche en sismologie : compréhension des lois de distribution spatio-temporelle de l'activité sismique

Références bibliographiques

Les principales références incluent :

  • Ogata (1988) : proposition originale du modèle ETAS
  • Hawkes (1971) : fondements théoriques du processus de Hawkes
  • Rue et al. (2017) : cadre théorique de la méthode INLA
  • Serafini et al. (2023) : application d'inlabru aux processus de Hawkes
  • Naylor et al. (2023) : modélisation bayésienne du modèle ETAS

Évaluation globale : Cet article est une contribution importante dans le domaine de la prévision des tremblements de terre, résolvant avec succès le problème d'efficacité de calcul du modèle ETAS et fournissant une analyse précieuse des paramètres et une évaluation des prédictions par des expériences systématiques. Bien qu'il y ait de la place pour l'amélioration en termes de profondeur théorique et de largeur expérimentale, la praticité de sa méthode et l'opérabilité de ses conclusions en font une contribution importante dans ce domaine.