Optimal Bounds for Tyler's M-Estimator for Elliptical Distributions
Lau, Ramachandran
A fundamental problem in statistics is estimating the shape matrix of an Elliptical distribution. This generalizes the familiar problem of Gaussian covariance estimation, for which the sample covariance achieves optimal estimation error. For Elliptical distributions, Tyler proposed a natural M-estimator and showed strong statistical properties in the asymptotic regime, independent of the underlying distribution. Numerical experiments show that this estimator performs very well, and that Tyler's iterative procedure converges quickly to the estimator. Franks and Moitra recently provided the first distribution-free error bounds in the finite sample setting, as well as the first rigorous convergence analysis of Tyler's iterative procedure. However, their results exceed the sample complexity of the Gaussian setting by a $\log^{2} d$ factor. We close this gap by proving optimal sample threshold and error bounds for Tyler's M-estimator for all Elliptical distributions, fully matching the Gaussian result. Moreover, we recover the algorithmic convergence even at this lower sample threshold. Our approach builds on the operator scaling connection of Franks and Moitra by introducing a novel pseudorandom condition, which we call $\infty$-expansion. We show that Elliptical distributions satisfy $\infty$-expansion at the optimal sample threshold, and then prove a novel scaling result for inputs satisfying this condition.
academic
Limiti Ottimali per lo Stimatore M di Tyler per Distribuzioni Ellittiche
La stima della matrice di forma per distribuzioni ellittiche è un problema fondamentale in statistica, che generalizza il problema della stima della covarianza gaussiana. Tyler ha proposto uno stimatore M naturale e ha provato proprietà statistiche forti nel caso asintotico. Franks e Moitra hanno recentemente fornito i primi limiti di errore indipendenti dalla distribuzione nel caso a campione finito, ma i loro risultati presentano un fattore log2d aggiuntivo nella complessità campionaria. Questo articolo dimostra la soglia campionaria ottimale e i limiti di errore dello stimatore M di Tyler introducendo una nuova condizione pseudocasuale di ∞-expansion, ottenendo una corrispondenza completa con i risultati gaussiani e recuperando la convergenza algoritmica a soglie campionarie inferiori.
Problema Centrale: Stimare la matrice di forma (shape matrix) di una distribuzione ellittica, che rappresenta un'importante generalizzazione della stima della covarianza in alta dimensione
Significato Pratico:
Le distribuzioni ellittiche includono casi importanti come la distribuzione gaussiana multivariata e la distribuzione t
Per distribuzioni con code pesanti, la matrice di covarianza potrebbe non esistere, ma la matrice di forma cattura comunque le proprietà geometriche
Applicazioni diffuse in finanza, elaborazione dei segnali e altri campi
Questo articolo mira a rispondere: Lo stimatore di Tyler può raggiungere le stesse garanzie ottimali della stima della covarianza gaussiana su distribuzioni ellittiche, oppure la stima della forma è intrinsecamente più difficile?
Input: n campioni x1,…,xn∈Rd da una distribuzione ellittica E(Σ,u)Output: Stima Σ^ della matrice di forma ΣObiettivo: Minimizzare l'errore relativo in norma operatoriale ∥Id−Σ1/2Σ^−1Σ1/2∥op
Definizione di Distribuzione Ellittica:
X:=Σ1/2V⋅u
dove V∼Sd−1 è un vettore unitario casuale uniformemente distribuito, u∈R è una variabile casuale scalare indipendente.
Stimatore M di Tyler: L'unica soluzione Σ^ dell'equazione:
nd∑j=1nxjTΣ^−1xjxjxjT=Σ^,Tr[Σ^]=d
Teorema 1.1 (Complessità Campionaria):
Quando n≳ε2d e ε è una costante piccola, lo stimatore M di Tyler soddisfa:
∥Id−Σ1/2Σ^−1Σ1/2∥op≤ε
con probabilità almeno 1−exp(−Ω(ε2n)).
Teorema 1.2 (Convergenza Algoritmica):
Quando n≳d, l'iterazione T-esima del processo iterativo di Tyler Σ(T) soddisfa:
∥Id−Σ^1/2Σ(T),−1Σ^1/2∥F≤δ
entro T≲∣logdetΣ∣+d+log(1/δ) iterazioni.
Questo articolo è principalmente un lavoro teorico, senza esperimenti numerici su larga scala. Gli autori menzionano che lo stimatore di Tyler e il processo iterativo mostrano buone prestazioni negli esperimenti numerici, ma l'enfasi è sulla rigorosità dell'analisi teorica.
Questo articolo si basa sulla connessione di operator scaling di Franks-Moitra, ma realizza miglioramenti chiave introducendo la condizione più forte di ∞-expansion.