2025-11-25T15:43:18.160640

On goodness-of-fit testing for volatility in McKean-Vlasov models

Heidari, Podolskij
This paper develops a statistical framework for goodness-of-fit testing of volatility functions in McKean-Vlasov stochastic differential equations, which describe large systems of interacting particles with distribution-dependent dynamics. While integrated volatility estimation in classical SDEs is now well established, formal model validation and goodness-of-fit testing for McKean-Vlasov systems remain largely unexplored, particularly in regimes with both large particle limits and high-frequency sampling. We propose a test statistic based on discrete observations of particle systems, analysed in a joint regime where both the number of particles and the sampling frequency increase. The estimators involved are proven to be consistent, and the test statistic is shown to satisfy a central limit theorem, converging in distribution to a centred Gaussian law.
academic

Sur les tests de qualité d'ajustement pour la volatilité dans les modèles de McKean-Vlasov

Informations fondamentales

  • ID de l'article: 2510.12607
  • Titre: On goodness-of-fit testing for volatility in McKean-Vlasov models
  • Auteurs: Akram Heidari, Mark Podolskij (Université du Luxembourg)
  • Classification: stat.ME (Statistique - Méthodologie)
  • Date de publication: 14 octobre 2025 (prépublication arXiv)
  • Lien de l'article: https://arxiv.org/abs/2510.12607

Résumé

Cet article développe un cadre statistique de test de qualité d'ajustement pour les fonctions de volatilité dans les équations différentielles stochastiques de McKean-Vlasov. Les équations de McKean-Vlasov décrivent les systèmes de grandes particules interactives avec une dynamique dépendant de la distribution. Bien que l'estimation de la volatilité intégrée dans les EDS classiques soit bien établie, la validation formelle des modèles et les tests de qualité d'ajustement pour les systèmes de McKean-Vlasov restent largement inexplorés, particulièrement dans le cas conjoint de la limite de grandes particules et de l'échantillonnage haute fréquence. Les auteurs proposent des statistiques de test basées sur les observations discrètes du système de particules, analysées dans le cadre asymptotique conjoint où le nombre de particules et la fréquence d'échantillonnage augmentent simultanément. Ils démontrent la convergence des estimateurs pertinents et montrent que la statistique de test satisfait un théorème central limite, convergeant en distribution vers une loi gaussienne centrée.

Contexte et motivation de la recherche

Description du problème

Les équations différentielles stochastiques de McKean-Vlasov constituent un outil mathématique important pour décrire les systèmes de grandes particules interactives, où la dynamique de chaque particule dépend non seulement de son état individuel, mais aussi de la distribution statistique de l'ensemble du système. Cette dépendance distributionnelle rend les modèles de McKean-Vlasov particulièrement adaptés pour capturer les interactions systémiques et les comportements émergents.

Importance de la recherche

  1. Applicabilité générale: Les modèles de McKean-Vlasov ont des applications étendues en finance, physique, ingénierie, etc., incluant la modélisation du risque systémique, les jeux à champ moyen, l'analyse des systèmes à grande interaction
  2. Lacune théorique: Bien que la théorie de l'estimation et du test de volatilité pour les EDS classiques soit mature, les méthodes de validation des modèles pour les systèmes de McKean-Vlasov manquent encore
  3. Besoin pratique: Dans les applications réelles, il est nécessaire de vérifier rigoureusement les hypothèses structurelles de la fonction de volatilité, car une mauvaise spécification peut affecter significativement les prévisions en aval et les mesures de risque

Limitations des méthodes existantes

  1. Inapplicabilité des méthodes classiques: Les méthodes existantes de test de volatilité pour les EDS (comme Dette & Podolskij, 2008) ne s'appliquent qu'aux systèmes non interactifs
  2. Recherche insuffisante: La littérature existante sur McKean-Vlasov se concentre principalement sur l'estimation paramétrique de la fonction de dérive, le test de volatilité n'ayant pratiquement pas été abordé
  3. Vide méthodologique: Absence d'un cadre de test statistique capable de traiter la dépendance distributionnelle et les effets non linéaires

Contributions principales

  1. Cadre novateur: Proposition du premier cadre statistique rigoureux pour le test de qualité d'ajustement des fonctions de volatilité dans les modèles de McKean-Vlasov
  2. Théorie asymptotique double: Établissement de la théorie dans le cadre asymptotique conjoint où N→∞ et la fréquence d'échantillonnage augmente (Δₙ→0)
  3. Preuve de convergence: Démonstration de la convergence des estimateurs impliqués et du théorème central limite pour la statistique de test
  4. Procédure de test pratique: Construction d'une procédure de test avec un niveau asymptotique correct et convergente pour toute hypothèse alternative fixe
  5. Innovation technique: Dépassement des défis techniques posés par la non-linéarité et les effets de dépendance de chemin résultant de la dépendance distributionnelle

Détails méthodologiques

Définition de la tâche

Considérons un système de N particules interactives:

dX^i_t = b(X^i_t, μₜ)dt + a(X^i_t, μₜ)dW^i_t, i = 1,...,N, t ∈ [0,T]

où μₜ est la distribution de X^i_t, et l'objectif est de tester si la fonction de volatilité a(x,μ) appartient à une famille paramétrique donnée.

Architecture du modèle

Cadre de test d'hypothèse

Hypothèse nulle:

H₀: L := min_{(λ₁,...,λₐ)∈ℝᵈ} ∫₀ᵀ ∫_ℝ (a²(x,μₜ) - Σᵈₖ₌₁ λₖa²ₖ(x,μₜ))² μₜ(dx)dt = 0

Hypothèse alternative: H₁: L > 0

Construction de la statistique de test

Expression en forme fermée de la mesure de distance L:

L = B - (Γ₁,...,Γₐ)Λ⁻¹(Γ₁,...,Γₐ)ᵀ

où:

  • B = ∫₀ᵀ ∫_ℝ a⁴(x,μₜ)μₜ(dx)dt
  • Γₖ = ∫₀ᵀ ∫_ℝ a²ₖ(x,μₜ)a²(x,μₜ)μₜ(dx)dt
  • Λₖ,ₗ = ∫₀ᵀ ∫_ℝ a²ₖ(x,μₜ)a²ₗ(x,μₜ)μₜ(dx)dt

Estimateurs empiriques

Basés sur les observations discrètes (X^i_{tⱼ}), les estimateurs sont construits comme:

B̂ := 1/(3NΔₙ) Σᵢ₌₁ᴺ Σⱼ₌₁ⁿ |X^i_{tⱼ₊₁} - X^i_{tⱼ}|⁴

Γ̂ₖ := 1/N Σᵢ₌₁ᴺ Σⱼ₌₁ⁿ a²ₖ(X^i_{tⱼ}, μᴺ_{tⱼ})|X^i_{tⱼ₊₁} - X^i_{tⱼ}|²

Λ̂ₖ,ₗ := Δₙ/N Σᵢ₌₁ᴺ Σⱼ₌₁ⁿ a²ₖ(X^i_{tⱼ}, μᴺ_{tⱼ})a²ₗ(X^i_{tⱼ}, μᴺ_{tⱼ})

Statistique de test finale:

ŜN = B̂ - Γ̂ᵀΛ̂⁻¹Γ̂

Points d'innovation technique

  1. Dérivée fonctionnelle linéaire: Utilisation de la dérivée fonctionnelle linéaire pour traiter la dépendance distributionnelle, outil technique clé pour les équations de McKean-Vlasov
  2. Analyse asymptotique double: Traitement simultané du comportement asymptotique de N→∞ et Δₙ→0, nécessitant une condition d'équilibre NΔ²ₙ→0
  3. Décomposition en U-statistiques: Utilisation de la technique de décomposition de Hoeffding pour traiter la différence entre la distribution empirique et la distribution réelle
  4. Application de la théorie des semi-martingales: Utilisation de la formule d'Itô et des propriétés de semi-martingale pour l'estimation des erreurs en statistique haute fréquence

Configuration expérimentale

Cadre de vérification théorique

Cet article est principalement un travail théorique, validant l'efficacité de la méthode par des preuves mathématiques plutôt que par des expériences numériques traditionnelles.

Conditions d'hypothèses clés

  1. Hypothèse 1: Conditions de moment de la distribution initiale
  2. Hypothèse 2: Continuité de Lipschitz des coefficients et conditions de croissance linéaire
  3. Hypothèse 3: Existence et régularité de la dérivée fonctionnelle linéaire de la fonction de volatilité

Conditions asymptotiques

  • Nombre de particules N→∞
  • Intervalle d'échantillonnage Δₙ→0
  • Condition d'équilibre: NΔ²ₙ→0

Résultats expérimentaux

Résultats théoriques principaux

Théorème 4.1 (Convergence)

Sous les conditions d'hypothèse:

√N(Λ̂ - Λ) = √NMΛ + oP(1)

Théorème 4.2 (Développement stochastique)

√N(Γ̂ₖ - Γₖ) = √NMₖ + oP(1)
√N(B̂ - B) = √NMB + oP(1)

Corollaire 4.3 (Normalité asymptotique)

√N(ŜN - L) →^L N(0, τ²)

Procédure de test

Au niveau de signification α, on rejette l'hypothèse nulle lorsque:

√NŜN/τ̂ > z₁₋α

où τ̂² est un estimateur convergent de τ².

Garanties théoriques

  1. Niveau asymptotique correct: La procédure de test atteint le niveau α correct sous l'hypothèse nulle
  2. Convergence: Pour toute hypothèse alternative fixe H₁: L > 0, on a √NŜN →^P +∞
  3. Mesure relative: Introduction d'une statistique normalisée G = L/B ∈ 0,1 pour faciliter l'interprétation

Travaux connexes

Théorie de l'estimation de McKean-Vlasov

  • Amorino et al. (2024): Taux de convergence polynomiale pour l'estimation non paramétrique
  • Belomestny et al. (2022): Estimation semi-paramétrique
  • Comte & Genon-Catalot (2024): Inférence paramétrique
  • Della Maestra & Hoffmann (2022): Estimation non paramétrique

Méthodes de test classiques pour les EDS

  • Dette & Podolskij (2008): Test de volatilité pour les modèles de diffusion classiques
  • Ait-Sahalia (1996): Test de modèles en temps continu
  • Corradi & White (1999): Test de spécification de variance de diffusion

Avantages relatifs de cet article

  1. Première approche de McKean-Vlasov: Les méthodes existantes ne s'appliquent qu'aux EDS classiques
  2. Dépendance distributionnelle: Capacité à traiter la dépendance de la volatilité à l'égard de l'ensemble de la distribution
  3. Asymptotique double: Considération conjointe de l'asymptotique haute fréquence et grand échantillon

Conclusions et discussion

Conclusions principales

  1. Établissement avec succès d'une théorie statistique complète pour le test de qualité d'ajustement des fonctions de volatilité dans les modèles de McKean-Vlasov
  2. Démonstration de la convergence des estimateurs dans le cadre asymptotique double et de la normalité asymptotique de la statistique de test
  3. Construction d'une procédure de test pratique avec des propriétés asymptotiques correctes

Limitations

  1. Travail théorique: Absence d'expériences numériques pour vérifier l'efficacité des résultats théoriques
  2. Conditions d'hypothèse: Nécessité de conditions de régularité et de moment relativement fortes
  3. Complexité computationnelle: L'implémentation pratique nécessite le calcul de dérivées fonctionnelles, ce qui peut être complexe
  4. Propriétés en échantillon fini: Absence d'analyse des performances en échantillon fini

Directions futures

  1. Vérification numérique: Validation des résultats théoriques par simulation Monte-Carlo
  2. Application pratique: Test de l'utilité pratique de la méthode sur données financières
  3. Extension: Généralisation aux cas multidimensionnels et structures d'interaction plus générales
  4. Optimisation computationnelle: Développement d'algorithmes numériques efficaces

Évaluation approfondie

Avantages

  1. Rigueur théorique: Preuves mathématiques complètes, traitement technique raffiné, approche particulièrement innovante du traitement de la dépendance distributionnelle
  2. Importance du problème: Comble une lacune importante dans les tests statistiques pour les modèles de McKean-Vlasov
  3. Innovation méthodologique: Combinaison ingénieuse de l'analyse fonctionnelle, de la théorie des processus stochastiques et de la statistique haute fréquence
  4. Valeur pratique: Fournit une procédure de test implémentable avec de bonnes propriétés asymptotiques

Insuffisances

  1. Absence de vérification numérique: Travail purement théorique sans expériences de simulation
  2. Hypothèses fortes: Les hypothèses telles que l'existence de dérivées fonctionnelles linéaires peuvent être difficiles à vérifier en pratique
  3. Défis computationnels: L'implémentation pratique peut faire face à des problèmes de complexité computationnelle
  4. Guidance d'application insuffisante: Manque de directives spécifiques pour les applications pratiques

Impact

  1. Contribution académique: Signification pionnière dans le domaine de l'inférence statistique pour McKean-Vlasov
  2. Valeur théorique: Fournit une base théorique importante pour les recherches ultérieures
  3. Potentiel d'application: Perspectives d'application en gestion des risques financiers, modélisation du risque systémique, etc.

Scénarios d'application

  1. Modélisation financière: Vérification des modèles de risque systémique et de jeux à champ moyen
  2. Systèmes physiques: Validation de la modélisation des systèmes de grandes particules interactives
  3. Sciences sociales: Test statistique des modèles de comportement collectif
  4. Applications d'ingénierie: Validation de la modélisation dynamique des systèmes de réseaux complexes

Références bibliographiques

L'article cite 30 références pertinentes, incluant principalement:

  • Littérature fondamentale sur la théorie de McKean-Vlasov (Sznitman, 1991; Carmona & Delarue, 2018)
  • Méthodes d'estimation statistique (Amorino et al., 2024; Belomestny et al., 2022)
  • Méthodes de test classiques pour les EDS (Dette & Podolskij, 2008; Corradi & White, 1999)
  • Théorie de la statistique haute fréquence (Barndorff-Nielsen et al., 2006)

Cet article apporte une contribution théorique importante dans le domaine des tests statistiques pour les équations différentielles stochastiques de McKean-Vlasov, fournissant une base mathématique solide pour ce domaine interdisciplinaire émergent. Bien qu'il manque de vérification numérique, l'établissement de son cadre théorique pose les fondations pour les recherches d'application ultérieures.