Strong consistency of pseudo-likelihood parameter estimator for univariate Gaussian mixture models
Lember, Kangro, Kuljus
We consider a new method for estimating the parameters of univariate Gaussian mixture models. The method relies on a nonparametric density estimator $\hat{f}_n$ (typically a kernel estimator). For every set of Gaussian mixture components, $\hat{f}_n$ is used to find the best set of mixture weights. That set is obtained by minimizing the $L_2$ distance between $\hat{f}_n$ and the Gaussian mixture density with the given component parameters. The densities together with the obtained weights are then plugged in to the likelihood function, resulting in the so-called pseudo-likelihood function. The final parameter estimators are the parameter values that maximize the pseudo-likelihood function together with the corresponding weights. The advantages of the pseudo-likelihood over the full likelihood are: 1) its arguments are the means and variances only, mixture weights are also functions of the means and variances; 2) unlike the likelihood function, it is always bounded above. Thus, the maximizer of the pseudo-likelihood function -- referred to as the pseudo-likelihood estimator -- always exists. In this article, we prove that the pseudo-likelihood estimator is strongly consistent.
academic
एकचर गॉसियन मिश्रण मॉडल के लिए छद्म-संभाव्यता पैरामीटर अनुमानक की प्रबल संगति
यह पेपर एकचर गॉसियन मिश्रण मॉडल के पैरामीटर अनुमान के लिए एक नई विधि प्रस्तावित करता है। यह विधि अपैरामीट्रिक घनत्व अनुमानक f^n (सामान्यतः कर्नेल अनुमानक) पर आधारित है। गॉसियन मिश्रण घटक पैरामीटर के प्रत्येक दिए गए समुच्चय के लिए, f^n और गॉसियन मिश्रण घनत्व के बीच L2 दूरी को न्यूनतम करके इष्टतम मिश्रण भार खोजे जाते हैं। फिर प्राप्त भार को घनत्व के साथ संभाव्यता फलन में प्रतिस्थापित किया जाता है, जिससे तथाकथित छद्म-संभाव्यता फलन बनता है। अंतिम पैरामीटर अनुमानक वह पैरामीटर मान और संबंधित भार हैं जो छद्म-संभाव्यता फलन को अधिकतम करते हैं। पूर्ण संभाव्यता की तुलना में छद्म-संभाव्यता के लाभ हैं: 1) इसके पैरामीटर केवल माध्य और विचरण हैं, मिश्रण भार भी माध्य और विचरण के फलन हैं; 2) संभाव्यता फलन के विपरीत, यह सदैव परिबद्ध है। इसलिए, छद्म-संभाव्यता फलन का अधिकतमकर्ता—छद्म-संभाव्यता अनुमानक—सदैव अस्तित्व में है। यह पेपर छद्म-संभाव्यता अनुमानक की प्रबल संगति को प्रमाणित करता है।
गॉसियन मिश्रण मॉडल की अपरिबद्ध संभाव्यता समस्या: गॉसियन मिश्रण मॉडल की संभाव्यता फलन अपरिबद्ध है, यह एक सुप्रसिद्ध समस्या है। जब कुछ घटकों का विचरण शून्य की ओर प्रवृत्त होता है, तो संभाव्यता फलन अनंत की ओर प्रवृत्त हो सकता है।
मौजूदा समाधानों की सीमाएं:
पैरामीटर स्थान को प्रतिबंधित करना
छलनी विधि का उपयोग करना
दंडित अधिकतम संभाव्यता अनुमान
बेयेसियन विधि
प्रोफाइल संभाव्यता आदि
ये विधियां सामान्यतः विचरण पर प्रतिबंध या दंड पद लागू करती हैं।
अनुसंधान प्रेरणा:
एक ऐसी विधि प्रदान करना जिसे पैरामीटर पर कोई प्रतिबंध न लगाना पड़े
मानक अधिकतम संभाव्यता अनुमान के साथ समानता बनाए रखना
छद्म-संभाव्यता विधि का प्रस्ताव: एक नई पैरामीटर अनुमान विधि, जो L2 दूरी न्यूनीकरण के माध्यम से मिश्रण भार निर्धारित करती है, फिर छद्म-संभाव्यता फलन का निर्माण करती है।
प्रबल संगति का प्रमाण: i.i.d. नमूने की धारणा के तहत, छद्म-संभाव्यता अनुमानक की प्रबल संगति को प्रमाणित किया गया है: θ^na.s.θ∗ और vn(θ^n)a.s.w∗।
कोई पैरामीटर प्रतिबंध नहीं: विधि को विचरण पर निचली सीमा प्रतिबंध या अन्य शर्तें लागू करने की आवश्यकता नहीं है।
सैद्धांतिक ढांचा: अपरिबद्ध माध्य, लुप्त या अपरिबद्ध विचरण के मामलों को संभालने के लिए एक संपूर्ण सैद्धांतिक ढांचा स्थापित किया गया है।
प्रस्ताव 3.1: यह प्रमाणित करता है कि स्थिरांक 0<u<U<∞ और N<∞ मौजूद हैं, ऐसे कि पर्याप्त बड़े n के लिए, कम से कम एक घटक i(n) संतुष्ट करता है:
∣μi(n)n∣<N,u≤σi(n)n≤U
यह सुनिश्चित करता है कि θ^n अंततः परिबद्ध पैरामीटर स्थान Θo(u,U,N) से संबंधित है।