Structured covariance estimation via tensor-train decomposition
Patarusau, Puchkin, Rakhuba et al.
We consider a problem of covariance estimation from a sample of i.i.d. high-dimensional random vectors. To avoid the curse of dimensionality we impose an additional assumption on the structure of the covariance matrix $Σ$. To be more precise we study the case when $Σ$ can be approximated by a sum of double Kronecker products of smaller matrices in a tensor train (TT) format. Our setup naturally extends widely known Kronecker sum and CANDECOMP/PARAFAC models but admits richer interaction across modes. We suggest an iterative polynomial time algorithm based on TT-SVD and higher-order orthogonal iteration (HOOI) adapted to Tucker-2 hybrid structure. We derive non-asymptotic dimension-free bounds on the accuracy of covariance estimation taking into account hidden Kronecker product and tensor train structures. The efficiency of our approach is illustrated with numerical experiments.
academic
تقدير التباين المشترك المنظم عبر تحليل موتر القطار
تدرس هذه الورقة مشكلة تقدير مصفوفة التباين المشترك من عينات من متجهات عشوائية عالية الأبعاد موزعة بشكل متطابق ومستقل. لتجنب لعنة الأبعاد، يفرض المؤلفون افتراضات هيكلية إضافية على مصفوفة التباين المشترك Σ، حيث يدرسون على وجه التحديد الحالة التي يمكن فيها تقريب Σ من خلال مجموع منتجات كرونيكر الثنائية للمصفوفات الأصغر بصيغة موتر القطار (TT). يوسع هذا الإعداد بشكل طبيعي نماذج مجموع كرونيكر والنماذج CANDECOMP/PARAFAC المعروفة جيداً، لكنه يسمح بتفاعلات أغنى بين الأنماط. يقترح المؤلفون خوارزميات متعددة الحدود القائمة على TT-SVD والتكرار الأرثوغوني من الرتبة الأعلى (HOOI) المناسب للهياكل المختلطة Tucker-2، ويشتقون حدود غير متقاربة خالية من الأبعاد لدقة تقدير التباين المشترك مع الأخذ في الاعتبار هياكل مجموع كرونيكر الخفية وموتر القطار.
مشكلة لعنة الأبعاد: في الحالات عالية الأبعاد، يواجه مقدر التباين المشترك الكلاسيكي Σ^=n1∑i=1nXiXiT لعنة الأبعاد، حيث ينخفض الأداء بشكل حاد عندما يكون d كبيراً جداً.
ضرورة الافتراضات المنظمة: للتغلب على هذه المشكلة، يفرض الإحصائيون عادة افتراضات هيكلية إضافية على Σ للاستفادة من بنية البيانات وتقليل العدد الإجمالي للمعاملات المجهولة.
قيود الطرق الموجودة:
نموذج منتج كرونيكر Σ=Φ⊗Ψ بسيط جداً
نموذج مجموع كرونيكر Σ=∑k=1KΦk⊗Ψk يفتقر إلى المرونة الكافية
نموذج CANDECOMP/PARAFAC يواجه مشاكل NP-صعبة حسابياً
نموذج تباين مشترك جديد: اقتراح هيكل التباين المشترك القائم على تحليل موتر القطار، الذي يوسع بشكل طبيعي نماذج مجموع كرونيكر و CANDECOMP/PARAFAC، مما يسمح بتفاعلات أغنى بين الأنماط.
خوارزميات فعالة: تصميم خوارزمية HardTTh (عتبة موتر القطار الصعبة)، بناءً على TT-SVD و HOOI المكيف لهياكل Tucker-2 المختلطة، بتعقيد حسابي O((J+K)Td1d2d3).
ضمانات نظرية: إنشاء حدود تقارب غير متقاربة وخالية من الأبعاد، وهي أول نتيجة نظرية خالية من الأبعاد لتقدير الموترات ذات البنية TT.
التحقق من الجدوى العملية: التحقق من فعالية الطريقة من خلال التجارب الرقمية، مما يوضح ضرورة التحسين التكراري.
الإدخال: عينات موزعة بشكل متطابق ومستقل X1,…,Xn∈Rpqrالإخراج: تقدير مصفوفة التباين المشترك Σ وهو Σ~القيود: Σ لها بنية TT، يمكن التعبير عنها كـ Σ=∑j=1J∑k=1KUj⊗Vjk⊗Wk
تؤكد التجارب ضرورة الشروط النظرية: عندما لا تكون شروط القيمة الذاتية مستوفاة (مثل n=500)، لا يمكن للخوارزمية استرجاع فضاء الأنماط بفعالية؛ عندما تكون الشروط مستوفاة (مثل n≥2000)، يحسن التكرار الأداء بشكل كبير.