Optimal Bounds for Tyler's M-Estimator for Elliptical Distributions
Lau, Ramachandran
A fundamental problem in statistics is estimating the shape matrix of an Elliptical distribution. This generalizes the familiar problem of Gaussian covariance estimation, for which the sample covariance achieves optimal estimation error. For Elliptical distributions, Tyler proposed a natural M-estimator and showed strong statistical properties in the asymptotic regime, independent of the underlying distribution. Numerical experiments show that this estimator performs very well, and that Tyler's iterative procedure converges quickly to the estimator. Franks and Moitra recently provided the first distribution-free error bounds in the finite sample setting, as well as the first rigorous convergence analysis of Tyler's iterative procedure. However, their results exceed the sample complexity of the Gaussian setting by a $\log^{2} d$ factor. We close this gap by proving optimal sample threshold and error bounds for Tyler's M-estimator for all Elliptical distributions, fully matching the Gaussian result. Moreover, we recover the algorithmic convergence even at this lower sample threshold. Our approach builds on the operator scaling connection of Franks and Moitra by introducing a novel pseudorandom condition, which we call $\infty$-expansion. We show that Elliptical distributions satisfy $\infty$-expansion at the optimal sample threshold, and then prove a novel scaling result for inputs satisfying this condition.
academic
Bornes Optimales pour l'M-Estimateur de Tyler pour les Distributions Elliptiques
L'estimation de la matrice de forme pour les distributions elliptiques est un problème fondamental en statistique, généralisant le problème d'estimation de la covariance gaussienne. Tyler a proposé un M-estimateur naturel et a prouvé des propriétés statistiques fortes dans le cas asymptotique. Franks et Moitra ont récemment fourni les premières bornes d'erreur indépendantes de la distribution pour le cas d'échantillon fini, mais leurs résultats comportent un facteur supplémentaire log2d en complexité d'échantillonnage. Cet article démontre les seuils d'échantillonnage optimaux et les bornes d'erreur de l'M-estimateur de Tyler en introduisant une nouvelle condition pseudo-aléatoire ∞-expansion, correspondant exactement aux résultats gaussiens et récupérant la convergence algorithmique sous des seuils d'échantillonnage plus faibles.
Problème central : Estimer la matrice de forme (shape matrix) des distributions elliptiques, une généralisation importante de l'estimation de covariance en haute dimension
Signification pratique :
Les distributions elliptiques incluent des cas importants comme la distribution gaussienne multivariée et la distribution t
Pour les distributions à queues lourdes, la matrice de covariance peut ne pas exister, mais la matrice de forme capture toujours les propriétés géométriques
Applications largement répandues en finance, traitement du signal, etc.
Cet article vise à répondre à la question : l'estimateur de Tyler peut-il atteindre les mêmes garanties optimales que l'estimation de covariance gaussienne sur les distributions elliptiques, ou l'estimation de forme est-elle intrinsèquement plus difficile ?
Complexité d'échantillonnage optimale : Démonstration que l'M-estimateur de Tyler atteint une erreur relative en norme d'opérateur ε avec n≳ε2d échantillons
Bornes d'erreur optimales : Correspondance exacte avec les bornes inférieures du cas gaussien, prouvant la finesse des résultats
Convergence algorithmique : Récupération de la convergence linéaire du processus itératif de Tyler au seuil d'échantillonnage optimal n≳d
Nouvel outil théorique : Introduction de la condition ∞-expansion, fournissant un outil d'analyse plus puissant pour le frame scaling
Innovation technique : Amélioration de deux composants clés de la méthode Franks-Moitra, éliminant le facteur logd
Entrée : n échantillons x1,…,xn∈Rd provenant d'une distribution elliptique E(Σ,u)Sortie : Estimation Σ^ de la matrice de forme ΣObjectif : Minimiser l'erreur relative en norme d'opérateur ∥Id−Σ1/2Σ^−1Σ1/2∥op
Définition de la distribution elliptique :
X:=Σ1/2V⋅u
où V∼Sd−1 est un vecteur unitaire aléatoire uniformément distribué et u∈R est une variable aléatoire scalaire indépendante.
M-estimateur de Tyler : L'unique solution Σ^ de l'équation :
nd∑j=1nxjTΣ^−1xjxjxjT=Σ^,Tr[Σ^]=d
Théorème 1.1 (Complexité d'échantillonnage) :
Quand n≳ε2d et ε est une petite constante, l'M-estimateur de Tyler satisfait :
∥Id−Σ1/2Σ^−1Σ1/2∥op≤ε
avec probabilité au moins 1−exp(−Ω(ε2n)).
Théorème 1.2 (Convergence algorithmique) :
Quand n≳d, la T-ème itération Σ(T) du processus itératif de Tyler satisfait :
∥Id−Σ^1/2Σ(T),−1Σ^1/2∥F≤δ
en T≲∣logdetΣ∣+d+log(1/δ) itérations.
Cet article est principalement un travail théorique sans expériences numériques à grande échelle. Les auteurs mentionnent que l'estimateur de Tyler et le processus itératif fonctionnent bien dans les expériences numériques, mais l'accent est mis sur la rigueur de l'analyse théorique.
Cet article s'appuie sur la connexion operator scaling de Franks-Moitra, mais réalise des améliorations clés en introduisant la condition ∞-expansion plus forte.
Complétude théorique : Première démonstration que l'M-estimateur de Tyler atteint les bornes optimales en théorie de l'information sur les distributions elliptiques
Uniformité de la méthode : L'estimation de forme pour les distributions elliptiques possède la même complexité d'échantillonnage que l'estimation de covariance gaussienne
Praticité algorithmique : Le processus itératif de Tyler converge rapidement au seuil d'échantillonnage optimal