Leveraging Nested MLMC for Sequential Neural Posterior Estimation with Intractable Likelihoods
Yang, Xiong, He
There is a growing interest in studying sequential neural posterior estimation (SNPE) techniques due to their advantages for simulation-based models with intractable likelihoods. The methods aim to learn the posterior from adaptively proposed simulations using neural network-based conditional density estimators. As an SNPE technique, the automatic posterior transformation (APT) method proposed by Greenberg et al. (2019) performs well and scales to high-dimensional data. However, the APT method requires computing the expectation of the logarithm of an intractable normalizing constant, i.e., a nested expectation. Although atomic proposals were used to render an analytical normalizing constant, it remains challenging to analyze the convergence of learning. In this paper, we reformulate APT as a nested estimation problem. Building on this, we construct several multilevel Monte Carlo (MLMC) estimators for the loss function and its gradients to accommodate different scenarios, including two unbiased estimators, and a biased estimator that trades a small bias for reduced variance and controlled runtime and memory usage. We also provide convergence results of stochastic gradient descent to quantify the interaction of the bias and variance of the gradient estimator. Numerical experiments for approximating complex posteriors with multimodality in moderate dimensions are provided to examine the effectiveness of the proposed methods.
academic
الاستفادة من MLMC المتداخل لتقدير الخلفية العصبية المتسلسل مع احتمالات غير قابلة للحساب
تبحث هذه الورقة تطبيق تقنيات تقدير الخلفية العصبية المتسلسل (SNPE) في التعامل مع نماذج المحاكاة التي تحتوي على دوال احتمالية يصعب حسابها. بالنسبة لمشكلة التوقع المتداخل التي تنشأ من حاجة طريقة التحويل الخلفي الآلي (APT) إلى حساب اللوغاريتم المتوقع لثابت التطبيع الذي يصعب التعامل معه، تعيد الورقة صياغة APT كمشكلة تقدير متداخلة وتبني عدة مقدرات مونت كارلو متعددة المستويات (MLMC)، بما في ذلك مقدران غير متحيزان ومقدر متحيز واحد. يقلل المقدر المتحيز التباين من خلال إدخال انحياز صغير مقابل تقليل وقت التشغيل واستخدام الذاكرة. توفر الورقة أيضاً نتائج التقارب لنزول التدرج العشوائي، مما يحدد التفاعل بين انحياز ومتغير مقدر التدرج.
تحديات نماذج المحاكاة: تُستخدم نماذج المحاكاة على نطاق واسع في علم الأعصاب والفيزياء والبيولوجيا، لكن الاستدلال البايزي التقليدي يواجه تحديات في حساب دوال الاحتمالية وتكاليف المحاكاة المرتفعة.
الحاجة إلى طرق SNPE: تتجنب طرق تقدير الخلفية العصبية المتسلسل الحساب المباشر لدالة الاحتمالية من خلال استخدام مقدرات الكثافة الشرطية للشبكات العصبية للتعلم من المحاكاة المقترحة بشكل تكيفي.
قيود طريقة APT: على الرغم من أن طريقة التحويل الخلفي الآلي (APT) التي اقترحها Greenberg وآخرون تُظهر أداءً جيداً وقابلة للتوسع إلى بيانات عالية الأبعاد، إلا أنها تتطلب حساب اللوغاريتم المتوقع لثابت تطبيع يصعب التعامل معه، مما يشكل مشكلة توقع متداخلة.
بالنظر إلى التوزيع السابق p(θ) والبيانات المرصودة x_o، الهدف هو تقريب التوزيع الخلفي p(θ|x_o) ∝ p(θ)p(x_o|θ)، حيث يصعب حساب دالة الاحتمالية p(x|θ) مباشرة، لكن يمكن أخذ عينات منها عبر المحاكاة.
Greenberg et al. (2019): التحويل الخلفي الآلي للاستدلال الخالي من الاحتمالية
Giles (2015): طرق مونت كارلو متعددة المستويات
Rhee & Glynn (2015): التقدير غير المتحيز مع التقارب الجذري التربيعي لنماذج SDE
Papamakarios & Murray (2016): الاستدلال السريع الخالي من ε لنماذج المحاكاة
الملخص: هذه ورقة ذات قيمة نظرية وعملية مهمة في مجال الاستدلال البايزي الخالي من الاحتمالية. من خلال إعادة صياغة ذكية لـ APT كمشكلة تقدير متداخلة وإدخال تقنية MLMC، تحل مشاكل التحليل النظري الصعب والكفاءة الحسابية للطريقة الأصلية. على الرغم من أن هناك مجالاً للتحسين في وقت الحساب، فإن كفاءة الذاكرة والضمانات النظرية تجعلها مساهمة مهمة في هذا المجال.