Characterizing extremal dependence on a hyperplane
Wan
In this paper, we characterize the extremal dependence of $d$ asymptotically dependent variables by a class of random vectors on the $(d-1)$-dimensional hyperplane perpendicular to the diagonal vector $\mathbf1=(1,\ldots,1)$. This translates analyses of multivariate extremes to that on a linear vector space, opening up possibilities for applying existing statistical techniques that are based on linear operations. As an example, we demonstrate obtaining lower-dimensional approximations of the tail dependence through principal component analysis. Additionally, we show that the widely used Hüsler-Reiss family is characterized by a Gaussian family residing on the hyperplane.
academic
Caratterizzazione della dipendenza estremale su un iperpiano
Questo articolo caratterizza la dipendenza estremale di d variabili asintoticamente dipendenti attraverso una classe di vettori casuali su un iperpiano (d−1)-dimensionale ortogonale al vettore diagonale 1=(1,…,1). Ciò trasforma l'analisi multivariata dei valori estremi in uno spazio vettoriale lineare, aprendo la possibilità di applicare tecniche statistiche esistenti basate su operazioni lineari. Come esempio, l'articolo dimostra come ottenere approssimazioni a bassa dimensionalità della dipendenza di coda attraverso l'analisi delle componenti principali. Inoltre, si dimostra che la famiglia Hüsler-Reiss ampiamente utilizzata può essere caratterizzata da una famiglia gaussiana situata sull'iperpiano.
La teoria multivariata dei valori estremi è un ramo importante della statistica, principalmente dedicato allo studio del comportamento probabilistico quando più variabili raggiungono simultaneamente valori estremi. L'analisi tradizionale multivariata dei valori estremi impiega principalmente due metodi di caratterizzazione geometrica:
Metodo delle Componenti Angolari: trasforma le distribuzioni marginali in distribuzioni Pareto standard, ottenendo la componente angolare Θ attraverso il condizionamento della norma a valori grandi, che risiede sulla sfera unitaria positiva
Metodo del Vettore Casuale Spettrale: trasforma le distribuzioni marginali in distribuzioni esponenziali standard, ottenendo il vettore casuale spettrale S attraverso il condizionamento della componente massima a valori grandi, che risiede su uno spazio a forma di L
Questo articolo propone un nuovo metodo di caratterizzazione, trasferendo l'analisi della dipendenza estremale a uno spazio vettoriale lineare, con motivazioni specifiche che includono:
Superare i vincoli non lineari dei metodi tradizionali
Consentire l'applicazione diretta di tecniche statistiche lineari esistenti all'analisi dei valori estremi
Fornire una rappresentazione matematica più trattabile per il modello Hüsler-Reiss
Sviluppare tecniche di riduzione dimensionale per l'analisi della dipendenza di coda
Introduzione del Concetto di Vettore Casuale di Profilo: caratterizza la dipendenza estremale attraverso il condizionamento della media delle componenti piuttosto che della componente massima
Stabilimento di un Quadro di Spazio Vettoriale Lineare: trasferisce l'analisi dei valori estremi all'iperpiano 1⊥ ortogonale al vettore diagonale
Dimostrazione della Caratteristica Gaussiana della Famiglia Hüsler-Reiss: mostra come il modello Hüsler-Reiss ampiamente utilizzato può essere caratterizzato da una distribuzione gaussiana sull'iperpiano
Sviluppo dell'Applicazione dell'Analisi delle Componenti Principali: dimostra come ottenere approssimazioni a bassa dimensionalità della dipendenza di coda attraverso PCA
Stabilimento di un Quadro Teorico Completo: include le relazioni di corrispondenza tra il vettore casuale spettrale e il vettore casuale di profilo
Sia X un vettore casuale d-dimensionale con distribuzioni marginali di tipo esponenziale. Si studia il comportamento estremale quando la media delle componenti Xˉ=d−1∑k=1dXk è grande, con particolare attenzione al caso di dipendenza asintotica.
Proposizione 3.1: Per X∈X (classe di vettori casuali con distribuzioni marginali di scala simile), quando i componenti sono asintoticamente dipendenti:
X−r⋅1∣{Xˉ≥r}dZ∗,r→∞
dove Z∗:=Z∣{ZT1≥0} è denominata distribuzione Pareto generalizzata multivariata diagonale.
Proposizione 3.3: La distribuzione Pareto generalizzata multivariata diagonale Z∗ ha la rappresentazione casuale:
Z∗=dE′⋅1+U
dove:
U∈1⊥ (iperpiano ortogonale al vettore diagonale)
E′ è una variabile casuale esponenziale unitaria indipendente da U
U è denominato vettore casuale di profilo
La distribuzione del vettore casuale di profilo è data dalla seguente distribuzione condizionata:
U=dT∣{max(T)≤E}
dove T=S−Sˉ⋅1 è la proiezione del vettore casuale spettrale S sull'iperpiano.
L'articolo dimostra un'importante applicazione del vettore casuale di profilo — l'analisi delle componenti principali:
Fondamento Teorico: Poiché U∈1⊥, la matrice di covarianza E(UUT) esiste sempre
Caratteristica di Riduzione Dimensionale: L'ultimo autovettore vd è proporzionale a 1, con autovalore λd=0
Interpretazione Estremale: La componente principale scartata descrive la direzione in cui la dipendenza estremale è sufficientemente forte da poter essere approssimata con dipendenza completa
Il modello Hüsler-Reiss descrive il limite di coda non banale di array triangolari gaussiani, parametrizzato dalla funzione di variazione Γ:
log(n)⋅(11T−Σ(n))→Γ
Proposizione 5.1: Il vettore casuale di profilo del modello Hüsler-Reiss segue una distribuzione gaussiana:
U∼N(μ,Σ)
dove:
Σ:=−21(I−d11T)Γ(I−d11T)μ:=−21{diag(Σ)−diag(Σ)⋅1}
L'articolo cita la letteratura classica nel campo della teoria dei valori estremi, inclusi i lavori specializzati di Resnick (2007) sui fenomeni a coda pesante, i lavori della serie Rootzén sulla distribuzione Pareto generalizzata multivariata, e gli sviluppi recenti del modello Hüsler-Reiss, riflettendo una solida base accademica e carattere all'avanguardia.