2025-11-25T18:25:18.428479

Structured covariance estimation via tensor-train decomposition

Patarusau, Puchkin, Rakhuba et al.

We consider a problem of covariance estimation from a sample of i.i.d. high-dimensional random vectors. To avoid the curse of dimensionality we impose an additional assumption on the structure of the covariance matrix $Î£$. To be more precise we study the case when $Î£$ can be approximated by a sum of double Kronecker products of smaller matrices in a tensor train (TT) format. Our setup naturally extends widely known Kronecker sum and CANDECOMP/PARAFAC models but admits richer interaction across modes. We suggest an iterative polynomial time algorithm based on TT-SVD and higher-order orthogonal iteration (HOOI) adapted to Tucker-2 hybrid structure. We derive non-asymptotic dimension-free bounds on the accuracy of covariance estimation taking into account hidden Kronecker product and tensor train structures. The efficiency of our approach is illustrated with numerical experiments.

academic

टेंसर-ट्रेन विघटन के माध्यम से संरचित सहप्रसरण अनुमान

बुनियादी जानकारी

पेपर ID: 2510.08174
शीर्षक: Structured covariance estimation via tensor-train decomposition
लेखक: Artsiom Patarusau, Nikita Puchkin, Maxim Rakhuba, Fedor Noskov (HSE University)
वर्गीकरण: math.ST (सांख्यिकी सिद्धांत)
प्रकाशन समय: 15 अक्टूबर 2025
पेपर लिंक: https://arxiv.org/abs/2510.08174v2

सारांश

यह पेपर स्वतंत्र समान रूप से वितरित उच्च-आयामी यादृच्छिक सदिशों के नमूनों से सहप्रसरण मैट्रिक्स के अनुमान की समस्या का अध्ययन करता है। आयामीता के अभिशाप से बचने के लिए, लेखक सहप्रसरण मैट्रिक्स Σ की संरचना पर अतिरिक्त मान्यताएं लागू करते हैं, विशेष रूप से यह अध्ययन करते हैं कि Σ को टेंसर-ट्रेन (TT) प्रारूप में छोटे मैट्रिक्स के दोहरे क्रोनेकर उत्पाद के योग द्वारा अनुमानित किया जा सकता है। यह सेटिंग व्यापक रूप से ज्ञात क्रोनेकर योग और CANDECOMP/PARAFAC मॉडल को स्वाभाविक रूप से विस्तारित करता है, लेकिन तौर-तरीकों के बीच अधिक समृद्ध अंतःक्रिया की अनुमति देता है। लेखक TT-SVD और Tucker-2 मिश्रित संरचना के लिए उपयुक्त उच्च-क्रम ऑर्थोगोनल पुनरावृत्ति (HOOI) पर आधारित बहुपद समय पुनरावृत्ति एल्गोरिदम प्रस्तावित करते हैं, और छिपे हुए क्रोनेकर उत्पाद और टेंसर-ट्रेन संरचना को ध्यान में रखते हुए सहप्रसरण अनुमान सटीकता के गैर-स्पर्शोन्मुख आयाम-मुक्त सीमाएं प्राप्त करते हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

स्वतंत्र समान रूप से वितरित केंद्रीकृत यादृच्छिक सदिश $X, X_1, \ldots, X_n \in \mathbb{R}^d$ दिए गए हैं, उनके सहप्रसरण मैट्रिक्स $\Sigma = \mathbb{E}[XX^T] \in \mathbb{R}^{d \times d}$ का अनुमान लगाना आवश्यक है।

अनुसंधान प्रेरणा

आयामीता का अभिशाप समस्या: उच्च-आयामी स्थिति में, शास्त्रीय नमूना सहप्रसरण अनुमानक $\hat{\Sigma} = \frac{1}{n}\sum_{i=1}^n X_i X_i^T$ आयामीता के अभिशाप का सामना करता है, जब $d$ बहुत बड़ा हो तो प्रदर्शन तेजी से गिरता है।
संरचित मान्यताओं की आवश्यकता: इस समस्या को दूर करने के लिए, सांख्यिकीविद् आमतौर पर डेटा संरचना का लाभ उठाने और अज्ञात मापदंडों की कुल संख्या को कम करने के लिए $\Sigma$ पर अतिरिक्त संरचनात्मक मान्यताएं लागू करते हैं।
मौजूदा विधियों की सीमाएं:
- क्रोनेकर उत्पाद मॉडल $\Sigma = \Phi \otimes \Psi$ बहुत सरल है
- क्रोनेकर योग मॉडल $\Sigma = \sum_{k=1}^K \Phi_k \otimes \Psi_k$ पर्याप्त लचीलापन की कमी है
- CANDECOMP/PARAFAC मॉडल कम्प्यूटेशनल रूप से NP-कठिन समस्याओं का सामना करता है

इस पेपर का नवाचार

टेंसर-ट्रेन (TT) प्रारूप का सहप्रसरण मॉडल प्रस्तावित करता है: $\Sigma = \sum_{j=1}^J \sum_{k=1}^K U_j \otimes V_{jk} \otimes W_k$ जहां $U_j \in \mathbb{R}^{p \times p}$ , $V_{jk} \in \mathbb{R}^{q \times q}$ , $W_k \in \mathbb{R}^{r \times r}$ , और $pqr = d$ ।

मुख्य योगदान

नया सहप्रसरण मॉडल: टेंसर-ट्रेन विघटन पर आधारित सहप्रसरण संरचना प्रस्तावित करता है, जो क्रोनेकर योग और CANDECOMP/PARAFAC मॉडल को स्वाभाविक रूप से विस्तारित करता है, अधिक समृद्ध तौर-तरीके अंतःक्रिया की अनुमति देता है।
कुशल एल्गोरिदम: HardTTh एल्गोरिदम डिजाइन किया गया है (Hard Tensor Train Thresholding), TT-SVD और Tucker-2 मिश्रित संरचना के अनुकूल HOOI पर आधारित, कम्प्यूटेशनल जटिलता $O((J+K)Td_1d_2d_3)$ है।
सैद्धांतिक गारंटी: गैर-स्पर्शोन्मुख, आयाम-मुक्त अभिसरण सीमाएं स्थापित करता है, जो TT संरचित टेंसर अनुमान के लिए पहला आयाम-मुक्त सैद्धांतिक परिणाम है।
व्यावहारिक सत्यापन: संख्यात्मक प्रयोगों के माध्यम से विधि की प्रभावशीलता को सत्यापित करता है, पुनरावृत्ति सुधार की आवश्यकता को प्रदर्शित करता है।

विधि विस्तार

कार्य परिभाषा

इनपुट: स्वतंत्र समान रूप से वितरित नमूने $X_1, \ldots, X_n \in \mathbb{R}^{pqr}$ आउटपुट: सहप्रसरण मैट्रिक्स $\Sigma$ का अनुमान $\tilde{\Sigma}$ बाधा: $\Sigma$ में TT संरचना है, $\Sigma = \sum_{j=1}^J \sum_{k=1}^K U_j \otimes V_{jk} \otimes W_k$ के रूप में व्यक्त किया जा सकता है

मॉडल आर्किटेक्चर

टेंसर पुनर्व्यवस्था और विघटन

पुनर्व्यवस्था संचालन: सहप्रसरण मैट्रिक्स $\Sigma \in \mathbb{R}^{pqr \times pqr}$ को तीसरे क्रम के टेंसर $\mathcal{R}(\Sigma) \in \mathbb{R}^{p^2 \times q^2 \times r^2}$ में पुनर्व्यवस्थित करता है
TT विघटन प्रतिनिधित्व: $\mathcal{R}(\Sigma) = \sum_{j=1}^J \sum_{k=1}^K \text{vec}(U_j) \otimes \text{vec}(V_{jk}) \otimes \text{vec}(W_k)$
संक्षिप्त रूप: $\mathcal{R}(\Sigma) = U \times_1 V \times_3 W$ जहां $U \in O_{p^2,J}$ , $V \in O_{r^2,K}$ , $W \in \mathbb{R}^{J \times q^2 \times K}$

HardTTh एल्गोरिदम

एल्गोरिदम 1: HardTTh

इनपुट: टेंसर Y ∈ R^{d₁×d₂×d₃}, TT रैंक (J,K), पुनरावृत्ति चरण T
आउटपुट: TT सन्निकटन T̂ = Û ×₁ V̂ ×₃ Ŵ

1. m₁(Y) के छंटे SVD की गणना करें: Û₀, Σ₀,₁, Ũ₀ = SVD_J(m₁(Y))
2. m₃(Û₀ᵀ ×₁ Y) के छंटे SVD की गणना करें: V̂₀, Σ₀,₂, Ṽ₀ = SVD_K(m₃(Û₀ᵀ ×₁ Y))

t = 1, ..., T के लिए:
3. Ût, Σt,₁, Ũt = SVD_J(m₁(V̂ₜ₋₁ᵀ ×₃ Y))
4. V̂t, Σt,₂, Ṽt = SVD_K(m₃(Ûtᵀ ×₁ Y))

5. Û = ÛT, V̂ = V̂T, Ŵ = Ûᵀ ×₁ V̂ᵀ ×₃ Y सेट करें

तकनीकी नवाचार बिंदु

Tucker-2 मिश्रित संरचना: मानक Tucker विघटन के विपरीत जिसे तीन ऑर्थोगोनल कारकों की आवश्यकता होती है, TT संरचना को केवल दो ऑर्थोगोनल कारकों की आवश्यकता होती है, कम्प्यूटेशनल जटिलता को कम करता है।
पुनरावृत्ति सुधार रणनीति: तौर-तरीके उप-स्थान को वैकल्पिक रूप से अनुकूलित करके, अनुमान सटीकता को क्रमिक रूप से सुधारता है।
कठोर थ्रेसहोल्डिंग प्रक्रिया: नरम थ्रेसहोल्डिंग के बजाय कठोर थ्रेसहोल्डिंग का उपयोग करता है, टेंसर नाभिक मानदंड सन्निकटन की NP-कठिन समस्या से बचता है।

प्रयोग सेटअप

डेटा जनन मॉडल

TT रैंक: $J = 7, K = 9$
आयाम: $p = q = r = 10$ , कुल आयाम $d = 1000$
जनन प्रक्रिया:
- यादृच्छिक सममित मैट्रिक्स $A_j \in \mathbb{R}^{p \times p}$ , $B_{jk} \in \mathbb{R}^{q \times q}$ , $C_k \in \mathbb{R}^{r \times r}$ उत्पन्न करें
- यादृच्छिक सदिश को परिभाषित करें: $\sum_{j=1}^J \sum_{k=1}^K A_j \times_1 B_{jk} \times_2 C_k \times_3 E_{ijk}$
- जहां $E_{ijk}$ मानक गाऊसी टेंसर है

मूल्यांकन मेट्रिक्स

सापेक्ष त्रुटि: $\|\hat{S} - \Sigma\|_F / \|\Sigma\|_F$

तुलना विधियां

Sample Mean: नमूना सहप्रसरण अनुमानक
TT-HOSVD: HardTTh एल्गोरिदम का गैर-पुनरावृत्ति संस्करण ( $T=0$ )
Tucker: मानक Tucker विघटन
Tucker+HOOI: HOOI पुनरावृत्ति के साथ Tucker विघटन
PRLS: संशोधित नियमित न्यूनतम वर्ग विधि

कार्यान्वयन विवरण

पुनरावृत्ति संख्या: $T = 10$
PRLS पैरामीटर: लॉगरिदमिक स्केल ग्रिड पर $\lambda_1, \lambda_2$ को ट्यून करें
प्रयोग दोहराव: प्रत्येक सेटअप को 16-32 बार दोहराएं

प्रयोग परिणाम

मुख्य परिणाम

नमूना आकार	Sample Mean	TT-HOSVD	HardTTh	Tucker	Tucker+HOOI	PRLS
n=500	1.22±0.02	0.269±0.008	0.238±0.013	0.252±0.007	0.240±0.013	0.238±0.017
n=2000	0.611±0.009	0.154±0.006	0.082±0.005	0.150±0.005	0.082±0.005	0.216±0.012
n=4000	0.430±0.007	0.105±0.008	0.054±0.002	0.105±0.007	0.054±0.002	0.217±0.015

मुख्य निष्कर्ष

पुनरावृत्ति की आवश्यकता: HardTTh TT-HOSVD की तुलना में महत्वपूर्ण सुधार करता है, विशेष रूप से n=2000 पर, सापेक्ष त्रुटि 0.154 से 0.082 तक गिरती है।
अभिसरण व्यवहार:
- n=500 पर: $\sin\Theta(\text{Im}\hat{U}_0, \text{Im}U^*) \approx 1$ , $\sin\Theta(\text{Im}\hat{U}_T, \text{Im}U^*) \approx 1$
- n=2000 पर: $\sin\Theta(\text{Im}\hat{U}_0, \text{Im}U^*) \approx 1$ , $\sin\Theta(\text{Im}\hat{U}_T, \text{Im}U^*) = 0.33±0.08$
कम्प्यूटेशनल दक्षता: HardTTh की समय जटिलता मध्यम है, पूर्ण Tucker विघटन से तेज लेकिन TT-HOSVD से धीमा।

सैद्धांतिक सत्यापन

प्रयोग सैद्धांतिक शर्तों की आवश्यकता को सत्यापित करता है: जब एकवचन मान शर्तें संतुष्ट नहीं होती हैं (जैसे n=500), एल्गोरिदम उप-स्थान को प्रभावी ढंग से पुनः प्राप्त नहीं कर सकता; जब शर्तें संतुष्ट होती हैं (जैसे n≥2000), पुनरावृत्ति प्रदर्शन में महत्वपूर्ण सुधार करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

मॉडल लाभ: TT प्रारूप सहप्रसरण मॉडल कम्प्यूटेशनल व्यवहार्यता बनाए रखते हुए पारंपरिक क्रोनेकर मॉडल की तुलना में अधिक समृद्ध संरचना प्रदान करता है।
एल्गोरिदम प्रभावशीलता: HardTTh एल्गोरिदम बहुपद समय जटिलता को प्राप्त करता है, और पुनरावृत्ति के माध्यम से अनुमान गुणवत्ता में महत्वपूर्ण सुधार करता है।
सैद्धांतिक गारंटी: TT संरचना के लिए पहली आयाम-मुक्त अभिसरण सीमा स्थापित करता है, विचरण पद: $\tilde{v} = 96\omega\|\Sigma\|\sqrt{\frac{Jr_1^2(\Sigma) + JKr_2^2(\Sigma) + Kr_3^2(\Sigma) + \log(48/\delta)}{n}}$

सीमाएं

एकवचन मान शर्त: एल्गोरिदम को $\sigma_J(m_1(\mathcal{R}(\Sigma))) \gtrsim \|\Sigma\|\sqrt{r_2^2(\Sigma)r_3^2(\Sigma)/n}$ की आवश्यकता है, जो सैद्धांतिक इष्टतम शर्त से अधिक मजबूत है।
शोर संरचना: सैद्धांतिक विश्लेषण विशिष्ट शोर संरचना मानता है, समरूप शोर से भिन्न।
पैरामीटर चयन: TT रैंक $(J,K)$ का चयन पूर्व ज्ञान या डेटा-संचालित विधि की आवश्यकता है।

भविष्य की दिशाएं

विपथन विधियां: गैर-समरूप शोर को संभालने के लिए विपथन तकनीकें विकसित करें।
अनुकूली रैंक चयन: सैद्धांतिक गारंटी के साथ रैंक चयन विधि स्थापित करें।
विस्तारित अनुप्रयोग: विधि को अन्य संरचित मैट्रिक्स अनुमान समस्याओं तक विस्तारित करें।

गहन मूल्यांकन

शक्तियां

सैद्धांतिक नवाचार: TT संरचित सहप्रसरण अनुमान के लिए पहली बार आयाम-मुक्त सैद्धांतिक सीमाएं प्रदान करता है, महत्वपूर्ण सैद्धांतिक अंतराल को भरता है।
विधि व्यावहारिकता: HardTTh एल्गोरिदम में उचित कम्प्यूटेशनल जटिलता है, NP-कठिन समस्याओं से बचता है।
पर्याप्त प्रयोग: विभिन्न तुलना विधियों और विभिन्न नमूना आकारों के माध्यम से विधि प्रभावशीलता को सत्यापित करता है।
गहन विश्लेषण: विस्तृत सैद्धांतिक विश्लेषण और एल्गोरिदम अभिसरण अध्ययन प्रदान करता है।

कमियां

मजबूत शर्तें: सैद्धांतिक शर्तें ज्ञात निचली सीमा से अधिक कठोर हैं, सांख्यिकीय-कम्प्यूटेशनल अंतराल मौजूद है।
मॉडल सीमाएं: केवल सहप्रसरण मैट्रिक्स पर लागू होता है जिसे TT प्रारूप द्वारा अच्छी तरह से अनुमानित किया जा सकता है।
पैरामीटर संवेदनशीलता: प्रदर्शन TT रैंक पैरामीटर के सही चयन पर निर्भर करता है।

प्रभाव

सैद्धांतिक योगदान: उच्च-आयामी सांख्यिकी में टेंसर विधियों के लिए नए सैद्धांतिक उपकरण प्रदान करता है।
व्यावहारिक मूल्य: बहु-तौर-तरीके डेटा विश्लेषण, संकेत प्रसंस्करण आदि क्षेत्रों में संभावित अनुप्रयोग।
पद्धति महत्व: प्रदर्शित करता है कि सांख्यिकीय अनुमान समस्याओं में टेंसर विघटन तकनीकों को प्रभावी रूप से कैसे लागू किया जाए।

लागू परिदृश्य

बहु-तौर-तरीके डेटा: छवि, वीडियो आदि जिनमें प्राकृतिक टेंसर संरचना है
समय-स्थान डेटा: समय-स्थान संरचना वाले सहप्रसरण अनुमान
उच्च-आयामी वित्तीय डेटा: संपत्ति रिटर्न का संरचित सहप्रसरण मॉडलिंग
सेंसर नेटवर्क: बहु-सेंसर डेटा का सहप्रसरण अनुमान

संदर्भ

Werner, K., Jansson, M., & Stoica, P. (2008). On estimation of covariance matrices with Kronecker product structure.
Tsiligkaridis, T., & Hero, A. O. (2013). Covariance estimation in high dimensions via Kronecker product expansions.
Zhang, A., & Xia, D. (2018). Tensor SVD: Statistical and computational limits.
Puchkin, N., & Rakhuba, M. (2024). Dimension-free structured covariance estimation.
Oseledets, I. V. (2011). Tensor-train decomposition.

Structured covariance estimation via tensor-train decomposition

टेंसर-ट्रेन विघटन के माध्यम से संरचित सहप्रसरण अनुमान

बुनियादी जानकारी

सारांश

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

अनुसंधान प्रेरणा

इस पेपर का नवाचार

मुख्य योगदान

विधि विस्तार

कार्य परिभाषा

मॉडल आर्किटेक्चर

टेंसर पुनर्व्यवस्था और विघटन

HardTTh एल्गोरिदम

तकनीकी नवाचार बिंदु

प्रयोग सेटअप

डेटा जनन मॉडल

मूल्यांकन मेट्रिक्स

तुलना विधियां

कार्यान्वयन विवरण

प्रयोग परिणाम

मुख्य परिणाम

मुख्य निष्कर्ष

सैद्धांतिक सत्यापन

संबंधित कार्य

क्रोनेकर उत्पाद मॉडल

टेंसर विघटन विधियां

सैद्धांतिक प्रगति

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

सीमाएं

भविष्य की दिशाएं

गहन मूल्यांकन

शक्तियां

कमियां

प्रभाव

लागू परिदृश्य

संदर्भ