An Asymptotically Optimal Coordinate Descent Algorithm for Learning Bayesian Networks from Gaussian Models
Xu, Küçükyavuz, Shojaie et al.
This paper studies the problem of learning Bayesian networks from continuous observational data, generated according to a linear Gaussian structural equation model. We consider an $\ell_0$-penalized maximum likelihood estimator for this problem which is known to have favorable statistical properties but is computationally challenging to solve, especially for medium-sized Bayesian networks. We propose a new coordinate descent algorithm to approximate this estimator and prove several remarkable properties of our procedure: the algorithm converges to a coordinate-wise minimum, and despite the non-convexity of the loss function, as the sample size tends to infinity, the objective value of the coordinate descent solution converges to the optimal objective value of the $\ell_0$-penalized maximum likelihood estimator. Finite-sample statistical consistency guarantees are also established. To the best of our knowledge, our proposal is the first coordinate descent procedure endowed with optimality and statistical guarantees in the context of learning Bayesian networks. Numerical experiments on synthetic and real data demonstrate that our coordinate descent method can obtain near-optimal solutions while being scalable.
academic
خوارزمية الانحدار الإحداثي المثلى بشكل متقارب لتعلم شبكات بايز من نماذج غاوسية
تدرس هذه الورقة مشكلة تعلم شبكات بايز من بيانات المراقبة المستمرة، حيث يتم توليد البيانات وفقاً لنموذج معادلات هيكلية غاوسية خطية. يأخذ المؤلفون في الاعتبار مقدّر الاحتمالية الأقصى المعاقب بـ ℓ₀ لهذه المشكلة، والذي يتمتع بخصائص إحصائية ممتازة لكن يشكل تحدياً حسابياً، خاصة بالنسبة لشبكات بايز متوسطة الحجم. تقترح الورقة خوارزمية انحدار إحداثي جديدة لتقريب هذا المقدّر وتثبت عدة خصائص ملحوظة للخوارزمية: تتقارب الخوارزمية إلى حد أدنى إحداثي، وعلى الرغم من أن دالة الخسارة غير محدبة، فإن قيمة الهدف لحل الانحدار الإحداثي تتقارب إلى القيمة المثلى لمقدّر الاحتمالية الأقصى المعاقب بـ ℓ₀ مع اتجاه حجم العينة إلى اللانهاية. حسب علم المؤلفين، هذه أول خوارزمية انحدار إحداثي بضمانات مثلية في سياق تعلم شبكات بايز.
توفر شبكات بايز إطار عمل قوياً لنمذجة العلاقات السببية بين مجموعات المتغيرات العشوائية. عادة ما يتم تمثيلها برسم بياني موجه بدون دورات (DAG)، حيث يتم ترميز المتغيرات العشوائية كرؤوس، والحافة الموجهة من العقدة i إلى العقدة j تمثل أن i يسبب j، وخاصية عدم الدورية في الرسم البياني تمنع ظهور التبعيات الدائرية.
في الأنظمة الكبيرة مثل شبكات تنظيم الجينات، عادة ما تكون بنية DAG غير معروفة وتحتاج إلى التعلم من البيانات. إذا كانت DAG معروفة، يمكن استخدامها للتنبؤ بسلوك النظام تحت التشغيل أو التدخل، وهذا ذو أهمية كبيرة في الاكتشاف العلمي واتخاذ القرارات.
الطرق القائمة على القيود: مثل خوارزمية PC، تتطلب ضمانات الاتساق الإحصائي تحت شروط الأمانة القوية، وهذا الشرط صارم جداً في الإعدادات عالية الأبعاد
الطرق القائمة على التقييم: على الرغم من عدم الحاجة إلى افتراض الأمانة القوية، تفتقر العديد من الطرق إلى ضمانات إحصائية، والتعقيد الحسابي لحل الحل الدقيق مرتفع جداً
طرق الانحدار الإحداثي الموجودة: على الرغم من إظهارها إمكانية كبيرة في تعلم شبكات بايز واسعة النطاق، تفتقر إلى ضمانات التقارب والمثلية
اقتراح أول خوارزمية انحدار إحداثي بضمانات مثلية: في سياق تعلم شبكات بايز، تتقارب الخوارزمية إلى حد أدنى إحداثي وتنتج DAG بتقييم أمثل في حد العينة الكبيرة
إنشاء نظرية المثلية المتقاربة: إثبات أنه على الرغم من عدم التحدب في المشكلة، تتقارب قيمة الهدف لحل الانحدار الإحداثي إلى القيمة المثلى لمقدّر الاحتمالية الأقصى المعاقب بـ ℓ₀ مع اتجاه حجم العينة إلى اللانهاية
توصيف المشهد التحسيني: في حالة العينة الكبيرة، جميع الحدود الدنيا المحلية تحقق قيم هدف قريبة من الحد الأدنى العام، وتتطابق تماماً في الحد الأقصى
توفير تحليل معدل التقارب: توصيف معدل التقارب كدالة لحجم العينة وعدد العقد
توسيع نظرية الترتيب الطوبولوجي: تحسين نتائج Chen وآخرين، مما يسمح باسترجاع ترتيب طوبولوجي فعال تحت شروط الضوضاء غير المتجانسة الخفيفة
تشير هذه الورقة بشكل أساسي إلى الأعمال المهمة التالية:
van de Geer & Bühlmann (2013): الخصائص الإحصائية لمقدّر الاحتمالية الأقصى المعاقب بـ ℓ₀
Hazimeh & Mazumder (2020): إطار تحليل تقارب الانحدار الإحداثي
Chen et al. (2019): خوارزمية استرجاع الترتيب الطوبولوجي
Xu et al. (2024): طريقة البرمجة الخطية الصحيحة المختلطة
التقييم الشامل: هذه ورقة عالية الجودة تجمع بين النظرية والتطبيق، وتقدم مساهمات مهمة في مجال تعلم شبكات بايز. التحليل النظري صارم والتحقق التجريبي شامل، مما يضع أساساً متيناً لمزيد من التطور في هذا المجال.