Optimal Bounds for Tyler's M-Estimator for Elliptical Distributions
Lau, Ramachandran
A fundamental problem in statistics is estimating the shape matrix of an Elliptical distribution. This generalizes the familiar problem of Gaussian covariance estimation, for which the sample covariance achieves optimal estimation error. For Elliptical distributions, Tyler proposed a natural M-estimator and showed strong statistical properties in the asymptotic regime, independent of the underlying distribution. Numerical experiments show that this estimator performs very well, and that Tyler's iterative procedure converges quickly to the estimator. Franks and Moitra recently provided the first distribution-free error bounds in the finite sample setting, as well as the first rigorous convergence analysis of Tyler's iterative procedure. However, their results exceed the sample complexity of the Gaussian setting by a $\log^{2} d$ factor. We close this gap by proving optimal sample threshold and error bounds for Tyler's M-estimator for all Elliptical distributions, fully matching the Gaussian result. Moreover, we recover the algorithmic convergence even at this lower sample threshold. Our approach builds on the operator scaling connection of Franks and Moitra by introducing a novel pseudorandom condition, which we call $\infty$-expansion. We show that Elliptical distributions satisfy $\infty$-expansion at the optimal sample threshold, and then prove a novel scaling result for inputs satisfying this condition.
academic
Оптимальные границы для M-оценки Тайлера для эллиптических распределений
Оценка матрицы формы эллиптических распределений является фундаментальной задачей в статистике, обобщающей проблему оценки ковариационной матрицы гауссовых распределений. Тайлер предложил естественный M-оценитель и доказал его сильные статистические свойства в асимптотическом случае. Франкс и Мойтра недавно предоставили первые распределительно-независимые границы ошибок для конечной выборки, однако их результаты содержат дополнительный множитель log2d в сложности выборки по сравнению с гауссовым случаем. В данной работе путём введения нового псевдослучайного условия ∞-расширения доказаны оптимальные пороги выборки и границы ошибок для M-оценки Тайлера, полностью совпадающие с гауссовыми результатами, и восстановлена сходимость алгоритма при более низких порогах выборки.
Основная задача: оценка матрицы формы (shape matrix) эллиптического распределения, что является важным обобщением оценки ковариационной матрицы высокомерного распределения
Практическое значение:
Эллиптические распределения включают важные частные случаи, такие как многомерное гауссово распределение и t-распределение
Для распределений с тяжёлыми хвостами ковариационная матрица может не существовать, но матрица формы всё ещё может захватить геометрические свойства
Широкое применение в финансах, обработке сигналов и других областях
Данная работа направлена на ответ на вопрос: может ли M-оценитель Тайлера достичь на эллиптических распределениях тех же оптимальных гарантий, что и оценка гауссовой ковариации, или оценка формы принципиально более сложна?
Теорема 1.1 (Сложность выборки):
Когда n≳ε2d и ε — малая константа, M-оценитель Тайлера удовлетворяет:
∥Id−Σ1/2Σ^−1Σ1/2∥op≤ε
с вероятностью не менее 1−exp(−Ω(ε2n)).
Теорема 1.2 (Сходимость алгоритма):
Когда n≳d, T-я итерация Σ(T) итеративного процесса Тайлера удовлетворяет:
∥Id−Σ^1/2Σ(T),−1Σ^1/2∥F≤δ
за T≲∣logdetΣ∣+d+log(1/δ) шагов.
Данная работа является в основном теоретической, без крупномасштабных численных экспериментов. Авторы упоминают, что оценитель Тайлера и итеративный процесс показывают хорошие результаты в численных экспериментах, но основной акцент делается на строгости теоретического анализа.
Данная работа строится на основе связи с масштабированием операторов Франкса-Мойтры, но достигает ключевых улучшений путём введения более сильного условия ∞-расширения.
Теоретическая полнота: впервые доказано, что M-оценитель Тайлера достигает информационно-теоретически оптимальных границ на эллиптических распределениях
Методологическое единство: оценка формы эллиптического распределения и оценка гауссовой ковариации имеют одинаковую сложность выборки
Практическая применимость алгоритма: итеративный процесс Тайлера быстро сходится при оптимальном пороге выборки