Strong consistency of pseudo-likelihood parameter estimator for univariate Gaussian mixture models
Lember, Kangro, Kuljus
We consider a new method for estimating the parameters of univariate Gaussian mixture models. The method relies on a nonparametric density estimator $\hat{f}_n$ (typically a kernel estimator). For every set of Gaussian mixture components, $\hat{f}_n$ is used to find the best set of mixture weights. That set is obtained by minimizing the $L_2$ distance between $\hat{f}_n$ and the Gaussian mixture density with the given component parameters. The densities together with the obtained weights are then plugged in to the likelihood function, resulting in the so-called pseudo-likelihood function. The final parameter estimators are the parameter values that maximize the pseudo-likelihood function together with the corresponding weights. The advantages of the pseudo-likelihood over the full likelihood are: 1) its arguments are the means and variances only, mixture weights are also functions of the means and variances; 2) unlike the likelihood function, it is always bounded above. Thus, the maximizer of the pseudo-likelihood function -- referred to as the pseudo-likelihood estimator -- always exists. In this article, we prove that the pseudo-likelihood estimator is strongly consistent.
تقدم هذه الورقة طريقة جديدة لتقدير معاملات نموذج خليط غاوسي أحادي المتغير. تعتمد الطريقة على مقدّر كثافة لامعاملي f^n (عادة ما يكون مقدّر النواة). لكل مجموعة معطاة من معاملات مكونات خليط غاوسي، يتم البحث عن الأوزان المثلى بتقليل مسافة L2 بين f^n وكثافة خليط غاوسي. ثم يتم إدراج الأوزان المحصول عليها مع الكثافة في دالة الاحتمالية، مما يشكل ما يسمى بدالة الاحتمالية الزائفة. مقدّر المعاملات النهائي هو قيم المعاملات والأوزان المقابلة التي تعظم دالة الاحتمالية الزائفة. مقارنة بالاحتمالية الكاملة، تتمتع الاحتمالية الزائفة بالمزايا التالية: 1) معاملاتها هي فقط المتوسطات والتباينات، والأوزان المختلطة هي أيضاً دوال للمتوسطات والتباينات؛ 2) بخلاف دالة الاحتمالية، فهي محدودة دائماً. لذلك، معظم دالة الاحتمالية الزائفة - مقدّر الاحتمالية الزائفة - موجود دائماً. تثبت هذه الورقة الاتساق القوي لمقدّر الاحتمالية الزائفة.
مشكلة عدم حدود الاحتمالية في نماذج خليط غاوسي: دالة الاحتمالية لنموذج خليط غاوسي غير محدودة، وهذه مشكلة معروفة جيداً. عندما تميل تباينات بعض المكونات إلى الصفر، قد تميل دالة الاحتمالية إلى اللانهاية.
قيود الحلول الموجودة:
تقييد فضاء المعاملات
استخدام طرق الغربال
تقدير الاحتمالية الأقصى المعاقب
الطرق البايزية
الاحتمالية الموضعية وغيرها
عادة ما تتطلب هذه الطرق فرض قيود أو حدود دنيا على التباينات.
الدافع البحثي:
توفير طريقة لا تتطلب فرض أي قيود على المعاملات
الحفاظ على التشابه مع تقدير الاحتمالية الأقصى المعياري