Optimal Bounds for Tyler's M-Estimator for Elliptical Distributions
Lau, Ramachandran
A fundamental problem in statistics is estimating the shape matrix of an Elliptical distribution. This generalizes the familiar problem of Gaussian covariance estimation, for which the sample covariance achieves optimal estimation error. For Elliptical distributions, Tyler proposed a natural M-estimator and showed strong statistical properties in the asymptotic regime, independent of the underlying distribution. Numerical experiments show that this estimator performs very well, and that Tyler's iterative procedure converges quickly to the estimator. Franks and Moitra recently provided the first distribution-free error bounds in the finite sample setting, as well as the first rigorous convergence analysis of Tyler's iterative procedure. However, their results exceed the sample complexity of the Gaussian setting by a $\log^{2} d$ factor. We close this gap by proving optimal sample threshold and error bounds for Tyler's M-estimator for all Elliptical distributions, fully matching the Gaussian result. Moreover, we recover the algorithmic convergence even at this lower sample threshold. Our approach builds on the operator scaling connection of Franks and Moitra by introducing a novel pseudorandom condition, which we call $\infty$-expansion. We show that Elliptical distributions satisfy $\infty$-expansion at the optimal sample threshold, and then prove a novel scaling result for inputs satisfying this condition.
academic
Límites Óptimos para el M-Estimador de Tyler en Distribuciones Elípticas
La estimación de la matriz de forma para distribuciones elípticas es un problema fundamental en estadística que generaliza la estimación de covarianza gaussiana. Tyler propuso un M-estimador natural y demostró propiedades estadísticas sólidas en el caso asintótico. Recientemente, Franks y Moitra proporcionaron los primeros límites de error independientes de la distribución en el caso de muestra finita, pero sus resultados incluyen un factor adicional de log2d en la complejidad de la muestra. Este artículo demuestra los umbrales de muestra óptimos y límites de error para el M-estimador de Tyler mediante la introducción de una nueva condición pseudoaleatoria de ∞-expansion, que coincide completamente con los resultados gaussianos y recupera la convergencia algorítmica bajo umbrales de muestra más bajos.
Problema Central: Estimar la matriz de forma (shape matrix) de distribuciones elípticas, una generalización importante de la estimación de covarianza en alta dimensión
Significado Práctico:
Las distribuciones elípticas incluyen casos especiales importantes como la distribución gaussiana multivariada y la distribución t
Para distribuciones de colas pesadas, la matriz de covarianza puede no existir, pero la matriz de forma aún captura propiedades geométricas
Tiene aplicaciones amplias en finanzas, procesamiento de señales y otros campos
Este artículo busca responder: ¿Puede el estimador de Tyler lograr las mismas garantías óptimas en distribuciones elípticas que la estimación de covarianza gaussiana, o es la estimación de forma intrínsecamente más difícil?
Entrada: n muestras x1,…,xn∈Rd de una distribución elíptica E(Σ,u)Salida: Estimación Σ^ de la matriz de forma ΣObjetivo: Minimizar el error de norma de operador relativa ∥Id−Σ1/2Σ^−1Σ1/2∥op
Definición de Distribución Elíptica:
X:=Σ1/2V⋅u
donde V∼Sd−1 es un vector unitario aleatorio uniformemente distribuido, y u∈R es una variable aleatoria escalar independiente.
M-Estimador de Tyler: La solución única Σ^ que satisface:
nd∑j=1nxjTΣ^−1xjxjxjT=Σ^,Tr[Σ^]=d
Teorema 1.1 (Complejidad de Muestra):
Cuando n≳ε2d y ε es una constante pequeña, el M-estimador de Tyler satisface:
∥Id−Σ1/2Σ^−1Σ1/2∥op≤ε
con probabilidad al menos 1−exp(−Ω(ε2n)).
Teorema 1.2 (Convergencia Algorítmica):
Cuando n≳d, la iteración T-ésima del proceso iterativo de Tyler Σ(T) satisface:
∥Id−Σ^1/2Σ(T),−1Σ^1/2∥F≤δ
en T≲∣logdetΣ∣+d+log(1/δ) pasos.
Este es principalmente un trabajo teórico sin experimentos numéricos a gran escala. Los autores mencionan que el estimador de Tyler y el proceso iterativo funcionan bien en experimentos numéricos, pero el énfasis está en la rigidez del análisis teórico.
Este artículo se basa en la conexión de operator scaling de Franks-Moitra, pero logra mejoras clave mediante la introducción de la condición de ∞-expansion más fuerte.
Completitud Teórica: Primera demostración de que el M-estimador de Tyler logra límites óptimos en teoría de la información para distribuciones elípticas
Uniformidad de Métodos: La estimación de forma para distribuciones elípticas tiene la misma complejidad de muestra que la estimación de covarianza gaussiana
Practicidad Algorítmica: El proceso iterativo de Tyler converge rápidamente bajo el umbral de muestra óptimo