2025-11-25T18:25:18.428479

Structured covariance estimation via tensor-train decomposition

Patarusau, Puchkin, Rakhuba et al.
We consider a problem of covariance estimation from a sample of i.i.d. high-dimensional random vectors. To avoid the curse of dimensionality we impose an additional assumption on the structure of the covariance matrix $Σ$. To be more precise we study the case when $Σ$ can be approximated by a sum of double Kronecker products of smaller matrices in a tensor train (TT) format. Our setup naturally extends widely known Kronecker sum and CANDECOMP/PARAFAC models but admits richer interaction across modes. We suggest an iterative polynomial time algorithm based on TT-SVD and higher-order orthogonal iteration (HOOI) adapted to Tucker-2 hybrid structure. We derive non-asymptotic dimension-free bounds on the accuracy of covariance estimation taking into account hidden Kronecker product and tensor train structures. The efficiency of our approach is illustrated with numerical experiments.
academic

टेंसर-ट्रेन विघटन के माध्यम से संरचित सहप्रसरण अनुमान

बुनियादी जानकारी

  • पेपर ID: 2510.08174
  • शीर्षक: Structured covariance estimation via tensor-train decomposition
  • लेखक: Artsiom Patarusau, Nikita Puchkin, Maxim Rakhuba, Fedor Noskov (HSE University)
  • वर्गीकरण: math.ST (सांख्यिकी सिद्धांत)
  • प्रकाशन समय: 15 अक्टूबर 2025
  • पेपर लिंक: https://arxiv.org/abs/2510.08174v2

सारांश

यह पेपर स्वतंत्र समान रूप से वितरित उच्च-आयामी यादृच्छिक सदिशों के नमूनों से सहप्रसरण मैट्रिक्स के अनुमान की समस्या का अध्ययन करता है। आयामीता के अभिशाप से बचने के लिए, लेखक सहप्रसरण मैट्रिक्स Σ की संरचना पर अतिरिक्त मान्यताएं लागू करते हैं, विशेष रूप से यह अध्ययन करते हैं कि Σ को टेंसर-ट्रेन (TT) प्रारूप में छोटे मैट्रिक्स के दोहरे क्रोनेकर उत्पाद के योग द्वारा अनुमानित किया जा सकता है। यह सेटिंग व्यापक रूप से ज्ञात क्रोनेकर योग और CANDECOMP/PARAFAC मॉडल को स्वाभाविक रूप से विस्तारित करता है, लेकिन तौर-तरीकों के बीच अधिक समृद्ध अंतःक्रिया की अनुमति देता है। लेखक TT-SVD और Tucker-2 मिश्रित संरचना के लिए उपयुक्त उच्च-क्रम ऑर्थोगोनल पुनरावृत्ति (HOOI) पर आधारित बहुपद समय पुनरावृत्ति एल्गोरिदम प्रस्तावित करते हैं, और छिपे हुए क्रोनेकर उत्पाद और टेंसर-ट्रेन संरचना को ध्यान में रखते हुए सहप्रसरण अनुमान सटीकता के गैर-स्पर्शोन्मुख आयाम-मुक्त सीमाएं प्राप्त करते हैं।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

स्वतंत्र समान रूप से वितरित केंद्रीकृत यादृच्छिक सदिश X,X1,,XnRdX, X_1, \ldots, X_n \in \mathbb{R}^d दिए गए हैं, उनके सहप्रसरण मैट्रिक्स Σ=E[XXT]Rd×d\Sigma = \mathbb{E}[XX^T] \in \mathbb{R}^{d \times d} का अनुमान लगाना आवश्यक है।

अनुसंधान प्रेरणा

  1. आयामीता का अभिशाप समस्या: उच्च-आयामी स्थिति में, शास्त्रीय नमूना सहप्रसरण अनुमानक Σ^=1ni=1nXiXiT\hat{\Sigma} = \frac{1}{n}\sum_{i=1}^n X_i X_i^T आयामीता के अभिशाप का सामना करता है, जब dd बहुत बड़ा हो तो प्रदर्शन तेजी से गिरता है।
  2. संरचित मान्यताओं की आवश्यकता: इस समस्या को दूर करने के लिए, सांख्यिकीविद् आमतौर पर डेटा संरचना का लाभ उठाने और अज्ञात मापदंडों की कुल संख्या को कम करने के लिए Σ\Sigma पर अतिरिक्त संरचनात्मक मान्यताएं लागू करते हैं।
  3. मौजूदा विधियों की सीमाएं:
    • क्रोनेकर उत्पाद मॉडल Σ=ΦΨ\Sigma = \Phi \otimes \Psi बहुत सरल है
    • क्रोनेकर योग मॉडल Σ=k=1KΦkΨk\Sigma = \sum_{k=1}^K \Phi_k \otimes \Psi_k पर्याप्त लचीलापन की कमी है
    • CANDECOMP/PARAFAC मॉडल कम्प्यूटेशनल रूप से NP-कठिन समस्याओं का सामना करता है

इस पेपर का नवाचार

टेंसर-ट्रेन (TT) प्रारूप का सहप्रसरण मॉडल प्रस्तावित करता है: Σ=j=1Jk=1KUjVjkWk\Sigma = \sum_{j=1}^J \sum_{k=1}^K U_j \otimes V_{jk} \otimes W_k जहां UjRp×pU_j \in \mathbb{R}^{p \times p}, VjkRq×qV_{jk} \in \mathbb{R}^{q \times q}, WkRr×rW_k \in \mathbb{R}^{r \times r}, और pqr=dpqr = d

मुख्य योगदान

  1. नया सहप्रसरण मॉडल: टेंसर-ट्रेन विघटन पर आधारित सहप्रसरण संरचना प्रस्तावित करता है, जो क्रोनेकर योग और CANDECOMP/PARAFAC मॉडल को स्वाभाविक रूप से विस्तारित करता है, अधिक समृद्ध तौर-तरीके अंतःक्रिया की अनुमति देता है।
  2. कुशल एल्गोरिदम: HardTTh एल्गोरिदम डिजाइन किया गया है (Hard Tensor Train Thresholding), TT-SVD और Tucker-2 मिश्रित संरचना के अनुकूल HOOI पर आधारित, कम्प्यूटेशनल जटिलता O((J+K)Td1d2d3)O((J+K)Td_1d_2d_3) है।
  3. सैद्धांतिक गारंटी: गैर-स्पर्शोन्मुख, आयाम-मुक्त अभिसरण सीमाएं स्थापित करता है, जो TT संरचित टेंसर अनुमान के लिए पहला आयाम-मुक्त सैद्धांतिक परिणाम है।
  4. व्यावहारिक सत्यापन: संख्यात्मक प्रयोगों के माध्यम से विधि की प्रभावशीलता को सत्यापित करता है, पुनरावृत्ति सुधार की आवश्यकता को प्रदर्शित करता है।

विधि विस्तार

कार्य परिभाषा

इनपुट: स्वतंत्र समान रूप से वितरित नमूने X1,,XnRpqrX_1, \ldots, X_n \in \mathbb{R}^{pqr}आउटपुट: सहप्रसरण मैट्रिक्स Σ\Sigma का अनुमान Σ~\tilde{\Sigma}बाधा: Σ\Sigma में TT संरचना है, Σ=j=1Jk=1KUjVjkWk\Sigma = \sum_{j=1}^J \sum_{k=1}^K U_j \otimes V_{jk} \otimes W_k के रूप में व्यक्त किया जा सकता है

मॉडल आर्किटेक्चर

टेंसर पुनर्व्यवस्था और विघटन

  1. पुनर्व्यवस्था संचालन: सहप्रसरण मैट्रिक्स ΣRpqr×pqr\Sigma \in \mathbb{R}^{pqr \times pqr} को तीसरे क्रम के टेंसर R(Σ)Rp2×q2×r2\mathcal{R}(\Sigma) \in \mathbb{R}^{p^2 \times q^2 \times r^2} में पुनर्व्यवस्थित करता है
  2. TT विघटन प्रतिनिधित्व: R(Σ)=j=1Jk=1Kvec(Uj)vec(Vjk)vec(Wk)\mathcal{R}(\Sigma) = \sum_{j=1}^J \sum_{k=1}^K \text{vec}(U_j) \otimes \text{vec}(V_{jk}) \otimes \text{vec}(W_k)
  3. संक्षिप्त रूप: R(Σ)=U×1V×3W\mathcal{R}(\Sigma) = U \times_1 V \times_3 W जहां UOp2,JU \in O_{p^2,J}, VOr2,KV \in O_{r^2,K}, WRJ×q2×KW \in \mathbb{R}^{J \times q^2 \times K}

HardTTh एल्गोरिदम

एल्गोरिदम 1: HardTTh

इनपुट: टेंसर Y ∈ R^{d₁×d₂×d₃}, TT रैंक (J,K), पुनरावृत्ति चरण T
आउटपुट: TT सन्निकटन T̂ = Û ×₁ V̂ ×₃ Ŵ

1. m₁(Y) के छंटे SVD की गणना करें: Û₀, Σ₀,₁, Ũ₀ = SVD_J(m₁(Y))
2. m₃(Û₀ᵀ ×₁ Y) के छंटे SVD की गणना करें: V̂₀, Σ₀,₂, Ṽ₀ = SVD_K(m₃(Û₀ᵀ ×₁ Y))

t = 1, ..., T के लिए:
3. Ût, Σt,₁, Ũt = SVD_J(m₁(V̂ₜ₋₁ᵀ ×₃ Y))
4. V̂t, Σt,₂, Ṽt = SVD_K(m₃(Ûtᵀ ×₁ Y))

5. Û = ÛT, V̂ = V̂T, Ŵ = Ûᵀ ×₁ V̂ᵀ ×₃ Y सेट करें

तकनीकी नवाचार बिंदु

  1. Tucker-2 मिश्रित संरचना: मानक Tucker विघटन के विपरीत जिसे तीन ऑर्थोगोनल कारकों की आवश्यकता होती है, TT संरचना को केवल दो ऑर्थोगोनल कारकों की आवश्यकता होती है, कम्प्यूटेशनल जटिलता को कम करता है।
  2. पुनरावृत्ति सुधार रणनीति: तौर-तरीके उप-स्थान को वैकल्पिक रूप से अनुकूलित करके, अनुमान सटीकता को क्रमिक रूप से सुधारता है।
  3. कठोर थ्रेसहोल्डिंग प्रक्रिया: नरम थ्रेसहोल्डिंग के बजाय कठोर थ्रेसहोल्डिंग का उपयोग करता है, टेंसर नाभिक मानदंड सन्निकटन की NP-कठिन समस्या से बचता है।

प्रयोग सेटअप

डेटा जनन मॉडल

  • TT रैंक: J=7,K=9J = 7, K = 9
  • आयाम: p=q=r=10p = q = r = 10, कुल आयाम d=1000d = 1000
  • जनन प्रक्रिया:
    • यादृच्छिक सममित मैट्रिक्स AjRp×pA_j \in \mathbb{R}^{p \times p}, BjkRq×qB_{jk} \in \mathbb{R}^{q \times q}, CkRr×rC_k \in \mathbb{R}^{r \times r} उत्पन्न करें
    • यादृच्छिक सदिश को परिभाषित करें: j=1Jk=1KAj×1Bjk×2Ck×3Eijk\sum_{j=1}^J \sum_{k=1}^K A_j \times_1 B_{jk} \times_2 C_k \times_3 E_{ijk}
    • जहां EijkE_{ijk} मानक गाऊसी टेंसर है

मूल्यांकन मेट्रिक्स

सापेक्ष त्रुटि: S^ΣF/ΣF\|\hat{S} - \Sigma\|_F / \|\Sigma\|_F

तुलना विधियां

  1. Sample Mean: नमूना सहप्रसरण अनुमानक
  2. TT-HOSVD: HardTTh एल्गोरिदम का गैर-पुनरावृत्ति संस्करण (T=0T=0)
  3. Tucker: मानक Tucker विघटन
  4. Tucker+HOOI: HOOI पुनरावृत्ति के साथ Tucker विघटन
  5. PRLS: संशोधित नियमित न्यूनतम वर्ग विधि

कार्यान्वयन विवरण

  • पुनरावृत्ति संख्या: T=10T = 10
  • PRLS पैरामीटर: लॉगरिदमिक स्केल ग्रिड पर λ1,λ2\lambda_1, \lambda_2 को ट्यून करें
  • प्रयोग दोहराव: प्रत्येक सेटअप को 16-32 बार दोहराएं

प्रयोग परिणाम

मुख्य परिणाम

नमूना आकारSample MeanTT-HOSVDHardTThTuckerTucker+HOOIPRLS
n=5001.22±0.020.269±0.0080.238±0.0130.252±0.0070.240±0.0130.238±0.017
n=20000.611±0.0090.154±0.0060.082±0.0050.150±0.0050.082±0.0050.216±0.012
n=40000.430±0.0070.105±0.0080.054±0.0020.105±0.0070.054±0.0020.217±0.015

मुख्य निष्कर्ष

  1. पुनरावृत्ति की आवश्यकता: HardTTh TT-HOSVD की तुलना में महत्वपूर्ण सुधार करता है, विशेष रूप से n=2000 पर, सापेक्ष त्रुटि 0.154 से 0.082 तक गिरती है।
  2. अभिसरण व्यवहार:
    • n=500 पर: sinΘ(ImU^0,ImU)1\sin\Theta(\text{Im}\hat{U}_0, \text{Im}U^*) \approx 1, sinΘ(ImU^T,ImU)1\sin\Theta(\text{Im}\hat{U}_T, \text{Im}U^*) \approx 1
    • n=2000 पर: sinΘ(ImU^0,ImU)1\sin\Theta(\text{Im}\hat{U}_0, \text{Im}U^*) \approx 1, sinΘ(ImU^T,ImU)=0.33±0.08\sin\Theta(\text{Im}\hat{U}_T, \text{Im}U^*) = 0.33±0.08
  3. कम्प्यूटेशनल दक्षता: HardTTh की समय जटिलता मध्यम है, पूर्ण Tucker विघटन से तेज लेकिन TT-HOSVD से धीमा।

सैद्धांतिक सत्यापन

प्रयोग सैद्धांतिक शर्तों की आवश्यकता को सत्यापित करता है: जब एकवचन मान शर्तें संतुष्ट नहीं होती हैं (जैसे n=500), एल्गोरिदम उप-स्थान को प्रभावी ढंग से पुनः प्राप्त नहीं कर सकता; जब शर्तें संतुष्ट होती हैं (जैसे n≥2000), पुनरावृत्ति प्रदर्शन में महत्वपूर्ण सुधार करता है।

संबंधित कार्य

क्रोनेकर उत्पाद मॉडल

  • एकल क्रोनेकर उत्पाद: Werner et al. (2008) ने Σ=ΦΨ\Sigma = \Phi \otimes \Psi मॉडल प्रस्तावित किया
  • क्रोनेकर योग: Tsiligkaridis & Hero (2013), Puchkin & Rakhuba (2024) ने Σ=kΦkΨk\Sigma = \sum_k \Phi_k \otimes \Psi_k मॉडल का अध्ययन किया

टेंसर विघटन विधियां

  • CP विघटन: कम्प्यूटेशनल जटिलता समस्याओं का सामना करता है
  • Tucker विघटन: Zhang & Xia (2018) आदि ने आयाम-निर्भर सीमाएं स्थापित कीं
  • TT विघटन: Oseledets (2011) द्वारा प्रस्तावित, यह पेपर पहली बार सहप्रसरण अनुमान में लागू करता है

सैद्धांतिक प्रगति

  • आयाम-निर्भर सीमाएं: अधिकांश मौजूदा परिणाम पर्यावरणीय आयाम पर निर्भर करते हैं
  • आयाम-मुक्त सीमाएं: केवल सरल मामलों तक सीमित, यह पेपर TT संरचना तक विस्तारित करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. मॉडल लाभ: TT प्रारूप सहप्रसरण मॉडल कम्प्यूटेशनल व्यवहार्यता बनाए रखते हुए पारंपरिक क्रोनेकर मॉडल की तुलना में अधिक समृद्ध संरचना प्रदान करता है।
  2. एल्गोरिदम प्रभावशीलता: HardTTh एल्गोरिदम बहुपद समय जटिलता को प्राप्त करता है, और पुनरावृत्ति के माध्यम से अनुमान गुणवत्ता में महत्वपूर्ण सुधार करता है।
  3. सैद्धांतिक गारंटी: TT संरचना के लिए पहली आयाम-मुक्त अभिसरण सीमा स्थापित करता है, विचरण पद: v~=96ωΣJr12(Σ)+JKr22(Σ)+Kr32(Σ)+log(48/δ)n\tilde{v} = 96\omega\|\Sigma\|\sqrt{\frac{Jr_1^2(\Sigma) + JKr_2^2(\Sigma) + Kr_3^2(\Sigma) + \log(48/\delta)}{n}}

सीमाएं

  1. एकवचन मान शर्त: एल्गोरिदम को σJ(m1(R(Σ)))Σr22(Σ)r32(Σ)/n\sigma_J(m_1(\mathcal{R}(\Sigma))) \gtrsim \|\Sigma\|\sqrt{r_2^2(\Sigma)r_3^2(\Sigma)/n} की आवश्यकता है, जो सैद्धांतिक इष्टतम शर्त से अधिक मजबूत है।
  2. शोर संरचना: सैद्धांतिक विश्लेषण विशिष्ट शोर संरचना मानता है, समरूप शोर से भिन्न।
  3. पैरामीटर चयन: TT रैंक (J,K)(J,K) का चयन पूर्व ज्ञान या डेटा-संचालित विधि की आवश्यकता है।

भविष्य की दिशाएं

  1. विपथन विधियां: गैर-समरूप शोर को संभालने के लिए विपथन तकनीकें विकसित करें।
  2. अनुकूली रैंक चयन: सैद्धांतिक गारंटी के साथ रैंक चयन विधि स्थापित करें।
  3. विस्तारित अनुप्रयोग: विधि को अन्य संरचित मैट्रिक्स अनुमान समस्याओं तक विस्तारित करें।

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक नवाचार: TT संरचित सहप्रसरण अनुमान के लिए पहली बार आयाम-मुक्त सैद्धांतिक सीमाएं प्रदान करता है, महत्वपूर्ण सैद्धांतिक अंतराल को भरता है।
  2. विधि व्यावहारिकता: HardTTh एल्गोरिदम में उचित कम्प्यूटेशनल जटिलता है, NP-कठिन समस्याओं से बचता है।
  3. पर्याप्त प्रयोग: विभिन्न तुलना विधियों और विभिन्न नमूना आकारों के माध्यम से विधि प्रभावशीलता को सत्यापित करता है।
  4. गहन विश्लेषण: विस्तृत सैद्धांतिक विश्लेषण और एल्गोरिदम अभिसरण अध्ययन प्रदान करता है।

कमियां

  1. मजबूत शर्तें: सैद्धांतिक शर्तें ज्ञात निचली सीमा से अधिक कठोर हैं, सांख्यिकीय-कम्प्यूटेशनल अंतराल मौजूद है।
  2. मॉडल सीमाएं: केवल सहप्रसरण मैट्रिक्स पर लागू होता है जिसे TT प्रारूप द्वारा अच्छी तरह से अनुमानित किया जा सकता है।
  3. पैरामीटर संवेदनशीलता: प्रदर्शन TT रैंक पैरामीटर के सही चयन पर निर्भर करता है।

प्रभाव

  1. सैद्धांतिक योगदान: उच्च-आयामी सांख्यिकी में टेंसर विधियों के लिए नए सैद्धांतिक उपकरण प्रदान करता है।
  2. व्यावहारिक मूल्य: बहु-तौर-तरीके डेटा विश्लेषण, संकेत प्रसंस्करण आदि क्षेत्रों में संभावित अनुप्रयोग।
  3. पद्धति महत्व: प्रदर्शित करता है कि सांख्यिकीय अनुमान समस्याओं में टेंसर विघटन तकनीकों को प्रभावी रूप से कैसे लागू किया जाए।

लागू परिदृश्य

  1. बहु-तौर-तरीके डेटा: छवि, वीडियो आदि जिनमें प्राकृतिक टेंसर संरचना है
  2. समय-स्थान डेटा: समय-स्थान संरचना वाले सहप्रसरण अनुमान
  3. उच्च-आयामी वित्तीय डेटा: संपत्ति रिटर्न का संरचित सहप्रसरण मॉडलिंग
  4. सेंसर नेटवर्क: बहु-सेंसर डेटा का सहप्रसरण अनुमान

संदर्भ

  1. Werner, K., Jansson, M., & Stoica, P. (2008). On estimation of covariance matrices with Kronecker product structure.
  2. Tsiligkaridis, T., & Hero, A. O. (2013). Covariance estimation in high dimensions via Kronecker product expansions.
  3. Zhang, A., & Xia, D. (2018). Tensor SVD: Statistical and computational limits.
  4. Puchkin, N., & Rakhuba, M. (2024). Dimension-free structured covariance estimation.
  5. Oseledets, I. V. (2011). Tensor-train decomposition.