Unveiling low-dimensional patterns induced by convex non-differentiable regularizers
Hejný, Wallin, Bogdan et al.
Popular regularizers with non-differentiable penalties, such as Lasso, Elastic Net, Generalized Lasso, or SLOPE, reduce the dimension of the parameter space by inducing sparsity or clustering in the estimators' coordinates. In this paper, we focus on linear regression and explore the asymptotic distributions of the resulting low-dimensional patterns when the number of regressors $p$ is fixed, the number of observations $n$ goes to infinity, and the penalty function increases at the rate of $\sqrt{n}$. While the asymptotic distribution of the rescaled estimation error can be derived by relatively standard arguments, convergence of patterns requires a separate proof, which is yet missing from the literature, even for the simplest case of Lasso. To fill this gap, we use the Hausdorff distance as a suitable mode of convergence for subdifferentials, resulting in the desired pattern convergence. Furthermore, we derive the exact limiting probability of recovering the true model pattern. This probability goes to 1 if and only if the penalty scaling constant diverges to infinity and the regularizer-specific asymptotic irrepresentability condition is satisfied. We then propose simple two-step procedures that asymptotically recover the model patterns, irrespective of whether the irrepresentability condition holds or not.
Interestingly, our theory shows that Fused Lasso cannot reliably recover its own clustering pattern, even for independent regressors. It also demonstrates how this problem can be resolved by "concavifying" the Fused Lasso penalty coefficients. Additionally, sampling from the asymptotic error distribution facilitates comparisons between different regularizers. We provide short simulation studies showcasing an illustrative comparison between the asymptotic properties of Lasso, Fused Lasso, and SLOPE.
academic
كشف الأنماط منخفضة الأبعاد المستحثة بواسطة منظمات محدبة غير قابلة للتفاضل
تدرس هذه الورقة الخصائص التقاربية للمنظمات الشهيرة ذات حدود العقوبة غير القابلة للتفاضل (مثل Lasso و Elastic Net و Generalized Lasso و SLOPE) في الانحدار الخطي. تقلل هذه المنظمات من أبعاد فضاء المعاملات من خلال استحثاث الندرة أو التجميع في إحداثيات المقدّر. تركز الورقة على التوزيع التقاربي عندما يكون عدد متغيرات الانحدار p ثابتاً، وعدد الملاحظات n يميل إلى اللانهاية، وتنمو دالة العقوبة بمعدل √n. بينما يمكن اشتقاق التوزيع التقاربي لخطأ المقدّر المعاد تحجيمه من خلال حجج نسبياً معيارية، فإن تقارب النمط يتطلب إثبات منفصل، وهو ما لا يزال مفقوداً في الأدبيات. تستخدم الورقة مسافة Hausdorff كنمط مناسب لتقارب التفاضلات الجزئية، مما يحقق تقارب النمط المطلوب، ويستخرج احتمالية الحد الدقيقة لاستعادة نمط النموذج الحقيقي.
الفراغ النظري في تقارب النمط: بينما تكون نظرية التوزيع التقاربي لمقدّرات التنظيم نسبياً ناضجة، فإن الإثبات الرياضي الصارم لتقارب النمط (pattern) مفقود في الأدبيات، حتى في حالة Lasso الأبسط.
التوصيف الاحتمالي لاختيار النموذج: الحاجة إلى توصيف دقيق لاحتمالية استعادة طرق التنظيم للبنية الحقيقية للنموذج (الندرة أو أنماط التجميع)، خاصة تحت مقياس العقوبة الكلاسيكي √n.
قيود شروط عدم التمثيل: تعتمد نتائج اتساق اختيار النموذج الموجودة عادة على شروط صارمة لعدم التمثيل، مما يحد من قابلية تطبيق الطريقة.
إنشاء نظرية التقارب الضعيف للنمط: استخدام مسافة Hausdorff لتوفير نمط تقارب مناسب لتقارب التفاضلات الجزئية، وإثبات التقارب الضعيف للنمط للمنظمات بالشكل f(β) = max{v₁ᵀβ,...,vₖᵀβ} + g(β).
استخراج احتمالية دقيقة لاستعادة النمط: توفير صيغة صريحة لاحتمالية الحد لاستعادة النمط الحقيقي، وتوصيف شروط عدم التمثيل التقاربية.
اقتراح إجراء استعادة من خطوتين: تصميم عملية من خطوتين لا تعتمد على شروط عدم التمثيل، وقادرة على استعادة نمط النموذج بشكل تقاربي.
الكشف عن قيود Fused Lasso: إثبات أنه حتى تحت متغيرات انحدار مستقلة، لا يمكن لـ Fused Lasso استعادة نمط التجميع الخاص به بشكل موثوق، واقتراح حل "التقعير".
توفير إطار مقارنة موحد: تحقيق مقارنة كمية لمنظمات مختلفة من خلال أخذ عينات من توزيع الخطأ التقاربي.