2025-11-25T15:43:18.160640

On goodness-of-fit testing for volatility in McKean-Vlasov models

Heidari, Podolskij

This paper develops a statistical framework for goodness-of-fit testing of volatility functions in McKean-Vlasov stochastic differential equations, which describe large systems of interacting particles with distribution-dependent dynamics. While integrated volatility estimation in classical SDEs is now well established, formal model validation and goodness-of-fit testing for McKean-Vlasov systems remain largely unexplored, particularly in regimes with both large particle limits and high-frequency sampling. We propose a test statistic based on discrete observations of particle systems, analysed in a joint regime where both the number of particles and the sampling frequency increase. The estimators involved are proven to be consistent, and the test statistic is shown to satisfy a central limit theorem, converging in distribution to a centred Gaussian law.

academic

Sur les tests de qualité d'ajustement pour la volatilité dans les modèles de McKean-Vlasov

Informations fondamentales

ID de l'article: 2510.12607
Titre: On goodness-of-fit testing for volatility in McKean-Vlasov models
Auteurs: Akram Heidari, Mark Podolskij (Université du Luxembourg)
Classification: stat.ME (Statistique - Méthodologie)
Date de publication: 14 octobre 2025 (prépublication arXiv)
Lien de l'article: https://arxiv.org/abs/2510.12607

Résumé

Cet article développe un cadre statistique de test de qualité d'ajustement pour les fonctions de volatilité dans les équations différentielles stochastiques de McKean-Vlasov. Les équations de McKean-Vlasov décrivent les systèmes de grandes particules interactives avec une dynamique dépendant de la distribution. Bien que l'estimation de la volatilité intégrée dans les EDS classiques soit bien établie, la validation formelle des modèles et les tests de qualité d'ajustement pour les systèmes de McKean-Vlasov restent largement inexplorés, particulièrement dans le cas conjoint de la limite de grandes particules et de l'échantillonnage haute fréquence. Les auteurs proposent des statistiques de test basées sur les observations discrètes du système de particules, analysées dans le cadre asymptotique conjoint où le nombre de particules et la fréquence d'échantillonnage augmentent simultanément. Ils démontrent la convergence des estimateurs pertinents et montrent que la statistique de test satisfait un théorème central limite, convergeant en distribution vers une loi gaussienne centrée.

Contexte et motivation de la recherche

Description du problème

Les équations différentielles stochastiques de McKean-Vlasov constituent un outil mathématique important pour décrire les systèmes de grandes particules interactives, où la dynamique de chaque particule dépend non seulement de son état individuel, mais aussi de la distribution statistique de l'ensemble du système. Cette dépendance distributionnelle rend les modèles de McKean-Vlasov particulièrement adaptés pour capturer les interactions systémiques et les comportements émergents.

Importance de la recherche

Applicabilité générale: Les modèles de McKean-Vlasov ont des applications étendues en finance, physique, ingénierie, etc., incluant la modélisation du risque systémique, les jeux à champ moyen, l'analyse des systèmes à grande interaction
Lacune théorique: Bien que la théorie de l'estimation et du test de volatilité pour les EDS classiques soit mature, les méthodes de validation des modèles pour les systèmes de McKean-Vlasov manquent encore
Besoin pratique: Dans les applications réelles, il est nécessaire de vérifier rigoureusement les hypothèses structurelles de la fonction de volatilité, car une mauvaise spécification peut affecter significativement les prévisions en aval et les mesures de risque

Limitations des méthodes existantes

Inapplicabilité des méthodes classiques: Les méthodes existantes de test de volatilité pour les EDS (comme Dette & Podolskij, 2008) ne s'appliquent qu'aux systèmes non interactifs
Recherche insuffisante: La littérature existante sur McKean-Vlasov se concentre principalement sur l'estimation paramétrique de la fonction de dérive, le test de volatilité n'ayant pratiquement pas été abordé
Vide méthodologique: Absence d'un cadre de test statistique capable de traiter la dépendance distributionnelle et les effets non linéaires

Contributions principales

Cadre novateur: Proposition du premier cadre statistique rigoureux pour le test de qualité d'ajustement des fonctions de volatilité dans les modèles de McKean-Vlasov
Théorie asymptotique double: Établissement de la théorie dans le cadre asymptotique conjoint où N→∞ et la fréquence d'échantillonnage augmente (Δₙ→0)
Preuve de convergence: Démonstration de la convergence des estimateurs impliqués et du théorème central limite pour la statistique de test
Procédure de test pratique: Construction d'une procédure de test avec un niveau asymptotique correct et convergente pour toute hypothèse alternative fixe
Innovation technique: Dépassement des défis techniques posés par la non-linéarité et les effets de dépendance de chemin résultant de la dépendance distributionnelle

Détails méthodologiques

Définition de la tâche

Considérons un système de N particules interactives:

dX^i_t = b(X^i_t, μₜ)dt + a(X^i_t, μₜ)dW^i_t, i = 1,...,N, t ∈ [0,T]

où μₜ est la distribution de X^i_t, et l'objectif est de tester si la fonction de volatilité a(x,μ) appartient à une famille paramétrique donnée.

Architecture du modèle

Cadre de test d'hypothèse

Hypothèse nulle:

H₀: L := min_{(λ₁,...,λₐ)∈ℝᵈ} ∫₀ᵀ ∫_ℝ (a²(x,μₜ) - Σᵈₖ₌₁ λₖa²ₖ(x,μₜ))² μₜ(dx)dt = 0

Hypothèse alternative: H₁: L > 0

Construction de la statistique de test

Expression en forme fermée de la mesure de distance L:

L = B - (Γ₁,...,Γₐ)Λ⁻¹(Γ₁,...,Γₐ)ᵀ

où:

B = ∫₀ᵀ ∫_ℝ a⁴(x,μₜ)μₜ(dx)dt
Γₖ = ∫₀ᵀ ∫_ℝ a²ₖ(x,μₜ)a²(x,μₜ)μₜ(dx)dt
Λₖ,ₗ = ∫₀ᵀ ∫_ℝ a²ₖ(x,μₜ)a²ₗ(x,μₜ)μₜ(dx)dt

Estimateurs empiriques

Basés sur les observations discrètes (X^i_{tⱼ}), les estimateurs sont construits comme:

B̂ := 1/(3NΔₙ) Σᵢ₌₁ᴺ Σⱼ₌₁ⁿ |X^i_{tⱼ₊₁} - X^i_{tⱼ}|⁴

Γ̂ₖ := 1/N Σᵢ₌₁ᴺ Σⱼ₌₁ⁿ a²ₖ(X^i_{tⱼ}, μᴺ_{tⱼ})|X^i_{tⱼ₊₁} - X^i_{tⱼ}|²

Λ̂ₖ,ₗ := Δₙ/N Σᵢ₌₁ᴺ Σⱼ₌₁ⁿ a²ₖ(X^i_{tⱼ}, μᴺ_{tⱼ})a²ₗ(X^i_{tⱼ}, μᴺ_{tⱼ})

Statistique de test finale:

ŜN = B̂ - Γ̂ᵀΛ̂⁻¹Γ̂

Points d'innovation technique

Dérivée fonctionnelle linéaire: Utilisation de la dérivée fonctionnelle linéaire pour traiter la dépendance distributionnelle, outil technique clé pour les équations de McKean-Vlasov
Analyse asymptotique double: Traitement simultané du comportement asymptotique de N→∞ et Δₙ→0, nécessitant une condition d'équilibre NΔ²ₙ→0
Décomposition en U-statistiques: Utilisation de la technique de décomposition de Hoeffding pour traiter la différence entre la distribution empirique et la distribution réelle
Application de la théorie des semi-martingales: Utilisation de la formule d'Itô et des propriétés de semi-martingale pour l'estimation des erreurs en statistique haute fréquence

Configuration expérimentale

Cadre de vérification théorique

Cet article est principalement un travail théorique, validant l'efficacité de la méthode par des preuves mathématiques plutôt que par des expériences numériques traditionnelles.

Conditions d'hypothèses clés

Hypothèse 1: Conditions de moment de la distribution initiale
Hypothèse 2: Continuité de Lipschitz des coefficients et conditions de croissance linéaire
Hypothèse 3: Existence et régularité de la dérivée fonctionnelle linéaire de la fonction de volatilité

Conditions asymptotiques

Nombre de particules N→∞
Intervalle d'échantillonnage Δₙ→0
Condition d'équilibre: NΔ²ₙ→0

Résultats expérimentaux

Résultats théoriques principaux

Théorème 4.1 (Convergence)

Sous les conditions d'hypothèse:

√N(Λ̂ - Λ) = √NMΛ + oP(1)

Théorème 4.2 (Développement stochastique)

√N(Γ̂ₖ - Γₖ) = √NMₖ + oP(1)
√N(B̂ - B) = √NMB + oP(1)

Corollaire 4.3 (Normalité asymptotique)

√N(ŜN - L) →^L N(0, τ²)

Procédure de test

Au niveau de signification α, on rejette l'hypothèse nulle lorsque:

√NŜN/τ̂ > z₁₋α

où τ̂² est un estimateur convergent de τ².

Garanties théoriques

Niveau asymptotique correct: La procédure de test atteint le niveau α correct sous l'hypothèse nulle
Convergence: Pour toute hypothèse alternative fixe H₁: L > 0, on a √NŜN →^P +∞
Mesure relative: Introduction d'une statistique normalisée G = L/B ∈ 0,1 pour faciliter l'interprétation

Travaux connexes

Théorie de l'estimation de McKean-Vlasov

Amorino et al. (2024): Taux de convergence polynomiale pour l'estimation non paramétrique
Belomestny et al. (2022): Estimation semi-paramétrique
Comte & Genon-Catalot (2024): Inférence paramétrique
Della Maestra & Hoffmann (2022): Estimation non paramétrique

Méthodes de test classiques pour les EDS

Dette & Podolskij (2008): Test de volatilité pour les modèles de diffusion classiques
Ait-Sahalia (1996): Test de modèles en temps continu
Corradi & White (1999): Test de spécification de variance de diffusion

Avantages relatifs de cet article

Première approche de McKean-Vlasov: Les méthodes existantes ne s'appliquent qu'aux EDS classiques
Dépendance distributionnelle: Capacité à traiter la dépendance de la volatilité à l'égard de l'ensemble de la distribution
Asymptotique double: Considération conjointe de l'asymptotique haute fréquence et grand échantillon

Conclusions et discussion

Conclusions principales

Établissement avec succès d'une théorie statistique complète pour le test de qualité d'ajustement des fonctions de volatilité dans les modèles de McKean-Vlasov
Démonstration de la convergence des estimateurs dans le cadre asymptotique double et de la normalité asymptotique de la statistique de test
Construction d'une procédure de test pratique avec des propriétés asymptotiques correctes

Limitations

Travail théorique: Absence d'expériences numériques pour vérifier l'efficacité des résultats théoriques
Conditions d'hypothèse: Nécessité de conditions de régularité et de moment relativement fortes
Complexité computationnelle: L'implémentation pratique nécessite le calcul de dérivées fonctionnelles, ce qui peut être complexe
Propriétés en échantillon fini: Absence d'analyse des performances en échantillon fini

Directions futures

Vérification numérique: Validation des résultats théoriques par simulation Monte-Carlo
Application pratique: Test de l'utilité pratique de la méthode sur données financières
Extension: Généralisation aux cas multidimensionnels et structures d'interaction plus générales
Optimisation computationnelle: Développement d'algorithmes numériques efficaces

Évaluation approfondie

Avantages

Rigueur théorique: Preuves mathématiques complètes, traitement technique raffiné, approche particulièrement innovante du traitement de la dépendance distributionnelle
Importance du problème: Comble une lacune importante dans les tests statistiques pour les modèles de McKean-Vlasov
Innovation méthodologique: Combinaison ingénieuse de l'analyse fonctionnelle, de la théorie des processus stochastiques et de la statistique haute fréquence
Valeur pratique: Fournit une procédure de test implémentable avec de bonnes propriétés asymptotiques

Insuffisances

Absence de vérification numérique: Travail purement théorique sans expériences de simulation
Hypothèses fortes: Les hypothèses telles que l'existence de dérivées fonctionnelles linéaires peuvent être difficiles à vérifier en pratique
Défis computationnels: L'implémentation pratique peut faire face à des problèmes de complexité computationnelle
Guidance d'application insuffisante: Manque de directives spécifiques pour les applications pratiques

Impact

Contribution académique: Signification pionnière dans le domaine de l'inférence statistique pour McKean-Vlasov
Valeur théorique: Fournit une base théorique importante pour les recherches ultérieures
Potentiel d'application: Perspectives d'application en gestion des risques financiers, modélisation du risque systémique, etc.

Scénarios d'application

Modélisation financière: Vérification des modèles de risque systémique et de jeux à champ moyen
Systèmes physiques: Validation de la modélisation des systèmes de grandes particules interactives
Sciences sociales: Test statistique des modèles de comportement collectif
Applications d'ingénierie: Validation de la modélisation dynamique des systèmes de réseaux complexes

Références bibliographiques

L'article cite 30 références pertinentes, incluant principalement:

Littérature fondamentale sur la théorie de McKean-Vlasov (Sznitman, 1991; Carmona & Delarue, 2018)
Méthodes d'estimation statistique (Amorino et al., 2024; Belomestny et al., 2022)
Méthodes de test classiques pour les EDS (Dette & Podolskij, 2008; Corradi & White, 1999)
Théorie de la statistique haute fréquence (Barndorff-Nielsen et al., 2006)

Cet article apporte une contribution théorique importante dans le domaine des tests statistiques pour les équations différentielles stochastiques de McKean-Vlasov, fournissant une base mathématique solide pour ce domaine interdisciplinaire émergent. Bien qu'il manque de vérification numérique, l'établissement de son cadre théorique pose les fondations pour les recherches d'application ultérieures.