Strong consistency of pseudo-likelihood parameter estimator for univariate Gaussian mixture models
Lember, Kangro, Kuljus
We consider a new method for estimating the parameters of univariate Gaussian mixture models. The method relies on a nonparametric density estimator $\hat{f}_n$ (typically a kernel estimator). For every set of Gaussian mixture components, $\hat{f}_n$ is used to find the best set of mixture weights. That set is obtained by minimizing the $L_2$ distance between $\hat{f}_n$ and the Gaussian mixture density with the given component parameters. The densities together with the obtained weights are then plugged in to the likelihood function, resulting in the so-called pseudo-likelihood function. The final parameter estimators are the parameter values that maximize the pseudo-likelihood function together with the corresponding weights. The advantages of the pseudo-likelihood over the full likelihood are: 1) its arguments are the means and variances only, mixture weights are also functions of the means and variances; 2) unlike the likelihood function, it is always bounded above. Thus, the maximizer of the pseudo-likelihood function -- referred to as the pseudo-likelihood estimator -- always exists. In this article, we prove that the pseudo-likelihood estimator is strongly consistent.
academic
Сильная состоятельность оценки параметров псевдоправдоподобия для одномерных гауссовских смешанных моделей
В данной работе предложен новый метод оценки параметров одномерной гауссовской смешанной модели. Метод основан на непараметрическом оценивателе плотности f^n (обычно ядерном оценивателе). Для каждого набора параметров компонент гауссовской смеси оптимальные весовые коэффициенты находятся путём минимизации расстояния L2 между f^n и плотностью гауссовской смеси. Полученные весовые коэффициенты вместе с плотностью подставляются в функцию правдоподобия, образуя так называемую функцию псевдоправдоподобия. Итоговая оценка параметров — это значения параметров и соответствующие им весовые коэффициенты, максимизирующие функцию псевдоправдоподобия. По сравнению с полным правдоподобием, преимущества псевдоправдоподобия заключаются в следующем: 1) его параметры — только средние значения и дисперсии, причём весовые коэффициенты также являются функциями средних и дисперсий; 2) в отличие от функции правдоподобия, оно всегда ограничено. Таким образом, максимизатор функции псевдоправдоподобия — оценка псевдоправдоподобия — всегда существует. В работе доказана сильная состоятельность оценки псевдоправдоподобия.
Проблема неограниченности правдоподобия в гауссовских смешанных моделях: Функция правдоподобия гауссовской смешанной модели неограничена — это хорошо известная проблема. Когда дисперсии некоторых компонент стремятся к нулю, функция правдоподобия может стремиться к бесконечности.
Ограничения существующих решений:
Ограничение пространства параметров
Использование методов сита
Штрафная оценка максимального правдоподобия
Байесовские методы
Профильное правдоподобие и др.
Эти методы обычно требуют наложения ограничений или штрафных членов на дисперсии.
Исследовательская мотивация:
Предложить метод, не требующий наложения каких-либо ограничений на параметры
Сохранить сходство со стандартной оценкой максимального правдоподобия
Обеспечить существование и состоятельность оценивателя
Предложение метода псевдоправдоподобия: Новый метод оценки параметров, в котором весовые коэффициенты определяются путём минимизации расстояния L2, а затем строится функция псевдоправдоподобия.
Доказательство сильной состоятельности: При предположении о независимых и одинаково распределённых выборках доказана сильная состоятельность оценки псевдоправдоподобия: θ^na.s.θ∗ и vn(θ^n)a.s.w∗.
Отсутствие ограничений на параметры: Метод не требует наложения нижних границ на дисперсии или других ограничений.
Полная теоретическая база: Установлена полная теоретическая база для обработки случаев неограниченных средних значений, исчезающих или неограниченных дисперсий.
Первый этап: оценка весовых коэффициентов методом расстояния L2
Второй этап: оценка параметров компонент методом правдоподобия
Такая комбинация обеспечивает ограниченность целевой функции
Единственность весовых коэффициентов: Хотя весовые коэффициенты vn(θ) могут быть неединственными, плотность vn(θ)g(θ,⋅) единственна (лемма 2.1).
Обработка пространства параметров: Неидентифицируемость параметров (например, инвариантность относительно перестановок) обрабатывается с помощью концепции классов эквивалентности.
Предложение 3.1: Доказано, что существуют константы 0<u<U<∞ и N<∞ такие, что для достаточно больших n по крайней мере одна компонента i(n) удовлетворяет:
∣μi(n)n∣<N,u≤σi(n)n≤U
Это гарантирует, что θ^n в конце концов принадлежит ограниченному пространству параметров Θo(u,U,N).
Неограниченные параметры: Необходимо обработать случаи, когда среднее стремится к бесконечности, дисперсия стремится к нулю или бесконечности.
Случайность весовых коэффициентов: Весовые коэффициенты vn(θ) зависят от случайного f^n, стандартный усиленный закон больших чисел не может быть применён непосредственно.
Равномерная сходимость: Необходимо установить равномерную сходимость на всём пространстве параметров, а не только поточечную сходимость.