Leveraging Nested MLMC for Sequential Neural Posterior Estimation with Intractable Likelihoods
Yang, Xiong, He
There is a growing interest in studying sequential neural posterior estimation (SNPE) techniques due to their advantages for simulation-based models with intractable likelihoods. The methods aim to learn the posterior from adaptively proposed simulations using neural network-based conditional density estimators. As an SNPE technique, the automatic posterior transformation (APT) method proposed by Greenberg et al. (2019) performs well and scales to high-dimensional data. However, the APT method requires computing the expectation of the logarithm of an intractable normalizing constant, i.e., a nested expectation. Although atomic proposals were used to render an analytical normalizing constant, it remains challenging to analyze the convergence of learning. In this paper, we reformulate APT as a nested estimation problem. Building on this, we construct several multilevel Monte Carlo (MLMC) estimators for the loss function and its gradients to accommodate different scenarios, including two unbiased estimators, and a biased estimator that trades a small bias for reduced variance and controlled runtime and memory usage. We also provide convergence results of stochastic gradient descent to quantify the interaction of the bias and variance of the gradient estimator. Numerical experiments for approximating complex posteriors with multimodality in moderate dimensions are provided to examine the effectiveness of the proposed methods.
academic
नेस्टेड MLMC का उपयोग करके अट्रैक्टेबल लाइकलीहुड के साथ सीक्वेंशियल न्यूरल पोस्टीरियर एस्टीमेशन
शीर्षक: नेस्टेड MLMC का उपयोग करके अट्रैक्टेबल लाइकलीहुड के साथ सीक्वेंशियल न्यूरल पोस्टीरियर एस्टीमेशन
लेखक: Xiliang Yang (दक्षिण चीन प्रौद्योगिकी विश्वविद्यालय), Yifei Xiong (पर्ड्यू विश्वविद्यालय), Zhijian He (दक्षिण चीन प्रौद्योगिकी विश्वविद्यालय, संपर्क लेखक)
यह पेपर सीक्वेंशियल न्यूरल पोस्टीरियर एस्टीमेशन (SNPE) तकनीक के अनुप्रयोग का अध्ययन करता है जो कठिन-से-गणना योग्य लाइकलीहुड फंक्शन वाले सिमुलेशन मॉडल के साथ काम करता है। ऑटोमेटिक पोस्टीरियर ट्रांसफॉर्मेशन (APT) विधि द्वारा सामना की जाने वाली नेस्टेड अपेक्षा समस्या को संबोधित करने के लिए, पेपर APT को नेस्टेड एस्टीमेशन समस्या के रूप में पुनः तैयार करता है और कई मल्टीलेवल मोंटे कार्लो (MLMC) एस्टीमेटर बनाता है, जिसमें दो निष्पक्ष एस्टीमेटर और एक पक्षपाती एस्टीमेटर शामिल हैं। पक्षपाती एस्टीमेटर छोटे पूर्वाग्रह को प्रस्तुत करके विचरण में कमी और रनटाइम और मेमोरी उपयोग को नियंत्रित करने के लिए विनिमय करता है। पेपर स्टोकेस्टिक ग्रेडिएंट डिसेंट के लिए अभिसरण परिणाम भी प्रदान करता है, जो ग्रेडिएंट एस्टीमेटर पूर्वाग्रह और विचरण के पारस्परिक प्रभाव को मापता है।
सिमुलेशन मॉडल की चुनौतियाँ: तंत्रिका विज्ञान, भौतिकी, जीव विज्ञान और अन्य क्षेत्रों में सिमुलेशन मॉडल का व्यापक उपयोग होता है, लेकिन पारंपरिक बेयेसियन अनुमान लाइकलीहुड फंक्शन की गणना में कठिनाई और महंगे सिमुलेटर के साथ सामना करता है।
SNPE विधि की आवश्यकता: सीक्वेंशियल न्यूरल पोस्टीरियर एस्टीमेशन विधि अनुकूली प्रस्तावों से सिमुलेशन से सीखने के लिए न्यूरल नेटवर्क सशर्त घनत्व एस्टीमेटर का उपयोग करके लाइकलीहुड फंक्शन की सीधी गणना से बचाता है।
APT विधि की सीमाएँ: Greenberg और अन्य द्वारा प्रस्तावित ऑटोमेटिक पोस्टीरियर ट्रांसफॉर्मेशन (APT) विधि अच्छा प्रदर्शन करती है और उच्च-आयामी डेटा तक विस्तारित हो सकती है, लेकिन इसे एक कठिन-से-गणना योग्य सामान्यीकरण स्थिरांक के लॉग अपेक्षा की गणना करनी होती है, जो नेस्टेड अपेक्षा समस्या बनाता है।
परमाणु प्रस्तावों की सीमाएँ: हालांकि परमाणु प्रस्तावों का उपयोग विश्लेषणात्मक सामान्यीकरण स्थिरांक प्राप्त कर सकता है, लेकिन यह अभिसरण विश्लेषण को कठिन बनाता है
सैद्धांतिक विश्लेषण की कमी: मौजूदा तकनीकें APT के कुछ कार्यों में कम प्रदर्शन को समझाने में कठिनाई रखती हैं
कम्प्यूटेशनल जटिलता समस्या: एकल-स्तरीय नेस्टेड एस्टीमेटर की कम्प्यूटेशनल जटिलता O(ε^-3) है, जो कम दक्ष है
पूर्व वितरण p(θ) और अवलोकन डेटा x_o दिए गए, लक्ष्य पोस्टीरियर वितरण p(θ|x_o) ∝ p(θ)p(x_o|θ) का अनुमान लगाना है, जहाँ लाइकलीहुड फंक्शन p(x|θ) सीधे गणना करना कठिन है, लेकिन सिमुलेटर के माध्यम से नमूना लिया जा सकता है।
प्रदर्शन तुलना: TGRR-MLMC जटिल कार्यों (जैसे Lotka-Volterra) पर सर्वश्रेष्ठ प्रदर्शन करता है, तीन कार्यों पर C2ST माध्य SNSE विधि से बेहतर है
कम्प्यूटेशनल दक्षता: हालांकि MLMC विधि को 1.2-1.5 गुना अधिक कम्प्यूटेशनल समय की आवश्यकता है, लेकिन GPU मेमोरी उपयोग SNSE का केवल 1/12 है (5GB बनाम 60GB)
8D Hodgkin-Huxley मॉडल पर, TGRR-MLMC परमाणु APT की तुलना में LMD और NLOG मेट्रिक्स दोनों में सुधार दिखाता है, विधि की स्केलेबिलिटी को सत्यापित करता है।
Greenberg et al. (2019): लाइकलीहुड-मुक्त अनुमान के लिए स्वचालित पोस्टीरियर ट्रांसफॉर्मेशन
Giles (2015): मल्टीलेवल मोंटे कार्लो विधि
Rhee & Glynn (2015): SDE मॉडल के लिए वर्गमूल अभिसरण के साथ निष्पक्ष अनुमान
Papamakarios & Murray (2016): सिमुलेशन मॉडल का तेज़ ε-मुक्त अनुमान
सारांश: यह लाइकलीहुड-मुक्त बेयेसियन अनुमान क्षेत्र में महत्वपूर्ण सैद्धांतिक और व्यावहारिक मूल्य वाला एक पेपर है। APT को नेस्टेड अनुमान समस्या के रूप में चतुराई से पुनः तैयार करके और MLMC तकनीक का परिचय देकर, यह मूल विधि की सैद्धांतिक विश्लेषण कठिनाई और कम्प्यूटेशनल दक्षता समस्या को हल करता है। हालांकि कम्प्यूटेशनल समय में सुधार की गुंजाइश है, लेकिन इसकी मेमोरी दक्षता और सैद्धांतिक गारंटी इसे इस क्षेत्र का एक महत्वपूर्ण योगदान बनाती है।