Given two measures $μ$, $ν$ on Rd that satisfy Carleman's condition, we provide a numerical scheme to approximate as closely as desired the total variation distance between $μ$ and $ν$. It consists of solving a sequence (hierarchy) of convex relaxations whose associated sequence of optimal values converges to the total variation distance, an additional illustration of the versatility of the Moment-SOS hierarchy. Indeed each relaxation in the hierarchy is a semidefinite program whose size increases with the number of involved moments. It has an optimal solution which is a couple of degree-2n pseudo-moments which converge, as n grows, to moments of the Hahn-Jordan decomposition of $μ$-$ν$.
- पेपर ID: 2401.01086
- शीर्षक: कुल भिन्नता दूरी के लिए उत्तल विश्लेषण का एक पदानुक्रम
- लेखक: Jean B. Lasserre
- वर्गीकरण: math.OC (अनुकूलन और नियंत्रण)
- प्रकाशन समय: जनवरी 2024 (arXiv v3: 16 अक्टूबर 2025)
- पेपर लिंक: https://arxiv.org/abs/2401.01086
यह पेपर Carleman शर्त को संतुष्ट करने वाले दो मापों μ और ν के बीच कुल भिन्नता दूरी को मनमाने ढंग से सटीकता के साथ अनुमानित करने के लिए एक संख्यात्मक योजना प्रस्तावित करता है। यह योजना (पदानुक्रमित) उत्तल विश्लेषण समस्याओं की एक श्रृंखला को हल करके कार्य करती है, जिसके इष्टतम मान अनुक्रम कुल भिन्नता दूरी में परिवर्तित होते हैं, जो Moment-SOS पदानुक्रम की बहुमुखी प्रकृति को प्रदर्शित करता है। पदानुक्रम में प्रत्येक विश्लेषण एक अर्धनिश्चित प्रोग्रामिंग समस्या है, जिसका आकार शामिल क्षणों की संख्या के साथ बढ़ता है, जिसमें डिग्री 2n के छद्म-क्षणों की एक इष्टतम जोड़ी होती है, जो n के बढ़ने पर μ-ν के Hahn-Jordan विघटन के क्षणों में परिवर्तित होती है।
कुल भिन्नता (Total Variation, TV) दूरी की संख्यात्मक गणना एक महत्वपूर्ण और चुनौतीपूर्ण समस्या है, जिसके निम्नलिखित क्षेत्रों में व्यापक अनुप्रयोग हैं:
- सांख्यिकीय परीक्षण: समरूपता परीक्षण और स्वतंत्रता परीक्षण के लिए
- वितरण-मजबूत अनुकूलन: अनिश्चितता समुच्चय को परिभाषित करने के लिए
- डेटा विज्ञान और मशीन लर्निंग: मापों के बीच दूरी माप के लिए
- अनुभवजन्य अनुमानक समस्या: यादृच्छिक नमूनों पर आधारित अनुभवजन्य अनुमानक अक्सर असंगत होते हैं, विशेषकर TV दूरी के लिए
- गणनात्मक चुनौतियां: TV दूरी "खराब" लागत फलन c(x,y) = 1_{x≠y} का उपयोग करके Wasserstein दूरी के बराबर है, जिसे प्रभावी ढंग से गणना करना कठिन है
- फलन स्थान बहुत बड़ा: मानक द्वैत सूत्र में परिबद्ध मापनीय फलनों का स्थान बहुत बड़ा है, जिसे प्रभावी ढंग से मूल्यांकन करना कठिन है
- समर्थन समुच्चय प्रतिबंध: मौजूदा विधियां आमतौर पर कॉम्पैक्ट समर्थन की मांग करती हैं
मौजूदा योगदान मुख्य रूप से विशिष्ट वितरण वर्गों के लिए विश्लेषणात्मक ऊपरी और निचली सीमाएं प्रदान करने पर केंद्रित हैं, जिसमें सामान्य संख्यात्मक गणना विधि का अभाव है। यह पेपर अपेक्षाकृत कमजोर मान्यताओं के तहत एक व्यावहारिक गणना योजना प्रदान करने का लक्ष्य रखता है।
- संख्यात्मक गणना योजना: Moment-SOS पदानुक्रम पर आधारित अर्धनिश्चित प्रोग्रामिंग विश्लेषण अनुक्रम प्रस्तावित करता है, जो TV दूरी को मनमाने ढंग से सटीकता के साथ अनुमानित कर सकता है
- सैद्धांतिक गारंटी: विश्लेषण अनुक्रम की एकरसता और अभिसरण को सिद्ध करता है, इष्टतम मान नीचे से वास्तविक TV दूरी में परिवर्तित होते हैं
- गैर-कॉम्पैक्ट समर्थन प्रबंधन: विधि गैर-कॉम्पैक्ट समर्थन वाले मापों पर लागू होती है, केवल Carleman शर्त को संतुष्ट करने की आवश्यकता है
- विशेष मामलों का सटीक समाधान: वास्तविक अक्ष पर परमाणु मापों के लिए, जब विश्लेषण डिग्री n ≥ maxm₁,m₂ हो तो सटीक समाधान प्राप्त किया जा सकता है
- द्वैत सिद्धांत: द्वैत अर्धनिश्चित प्रोग्रामिंग प्रदान करता है, जो यह प्रकट करता है कि बहुपद तक सीमित करके और दंड पद जोड़कर शास्त्रीय TV दूरी द्वैत सूत्र को कैसे मजबूत किया जाए
दो परिमित Borel माप μ, ν ∈ M(ℝᵈ)₊ दिए गए हैं, उनकी कुल भिन्नता दूरी की गणना करें:
∥μ−ν∥TV=supf{∫fdμ−∫fdν:∥f∥∞≤1}
मान्यता 2.5:
- μ और ν के सभी क्षण परिमित हैं
- μ और ν शर्त को संतुष्ट करते हैं: ∫exp(c∣xi∣)dμ<∞, किसी c > 0 और सभी i = 1,...,d के लिए
TV दूरी को अनंत-आयामी LP में पुनर्निर्मित करें:
τ=infϕ+,ϕ−∈M(Rd)+{ϕ+(1)+ϕ−(1):ϕ+−ϕ−=μ−ν}
प्रभुत्व बाधा जोड़कर समतुल्य समस्या प्राप्त करें:
ρ=infϕ+,ϕ−∈M(Rd)+{ϕ+(1)+ϕ−(1):ϕ+−ϕ−=μ−ν;ϕ+≤μ;ϕ−≤ν}
लेम्मा 2.2 का उपयोग करके, प्रभुत्व बाधा क्षण मैट्रिक्स स्थिति के बराबर है:
ϕ≤μ⇔Mn(ϕ)⪯Mn(μ),∀n∈N
n-वां स्तर विश्लेषण समस्या:
ρn=minϕ,ψ{ϕ(1)+ψ(1):ϕα−ψα=μα−να,∀α∈N2nd;0⪯Mn(ϕ)⪯Mn(μ);0⪯Mn(ψ)⪯Mn(ν)}
- प्रभुत्व बाधा की मुख्य भूमिका: हालांकि अनंत-आयामी सूत्र में अनावश्यक है, विश्लेषण योजना में यह कॉम्पैक्टिफिकेशन उपकरण के रूप में अत्यंत उपयोगी है
- Carleman शर्त का चतुर उपयोग: माप की विशिष्टता सुनिश्चित करता है, जिससे क्षण बाधा प्रभुत्व बाधा के बराबर हो जाती है
- Hahn-Jordan विघटन का प्राकृतिक उदय: इष्टतम समाधान μ-ν के Hahn-Jordan विघटन में परिवर्तित होता है
- द्वैत समस्या का बहुपद प्रतिबंध: बहुपद स्थान तक सीमित करके और दंड पद जोड़कर ‖f‖∞ ≤ 1 बाधा के उल्लंघन को संभालता है
- सॉफ्टवेयर: बहुपद अनुकूलन के लिए GloptiPoly 3
- समाधानकर्ता: अर्धनिश्चित प्रोग्रामिंग समाधानकर्ता SeDuMi 1.03
- मंच: HP Elitebook Ubuntu 24 नोटबुक
- परस्पर असंबद्ध समर्थन: X = {-1.0, 0.0, 1.0, 2.0}, Y = {-0.7, 0.3, 1.3, 2.3}
- एक सामान्य बिंदु: X ∩ Y = {-1.0}
- निकटवर्ती परमाणु: संख्यात्मक स्थिरता का परीक्षण
- विभिन्न माध्य और विचरण वाले गाऊसी वितरण N(m₁,σ₁) और N(m₂,σ₂)
- क्षण संख्या 2n = 4 से 2n = 8 तक
- विश्लेषण इष्टतम मान ρₙ और वास्तविक TV दूरी की निकटता
- अभिसरण गति और संख्यात्मक स्थिरता
- गणना समय (सभी परिणाम 0.35 सेकंड में पूर्ण)
वास्तविक अक्ष पर परमाणु मापों के लिए, जब n ≥ maxm₁,m₂ हो तो सटीक समाधान प्राप्त करें:
- उदाहरण 1: μ = δ₀, ν = δₑ, ρ₁ = 2 (सटीक)
- उदाहरण 2: चार परमाणु, एक सामान्य बिंदु, ρ₄ = 1.499 ≈ 1.5
- उदाहरण 3: परस्पर असंबद्ध परमाणु, ρ₄ = 1.9999 ≈ 2
| (m₁,σ₁) | (m₂,σ₂) | ρ₁ | ρ₂ | ρ₃ | ρ₄ |
|---|
| (0,0.1) | (1,0.1) | 1.9231 | 1.9936 | 1.9991 | 1.9997 |
| (0,0.2) | (1,0.2) | 1.7241 | 1.9049 | 1.9376 | 1.939 |
| (0,0.5) | (1,0.5) | 1.0000 | 1.0000 | 1.1653 | 1.1897 |
- ρ₁ साहित्य 1 में विश्लेषणात्मक निचली सीमा के साथ पूरी तरह मेल खाता है
- n=2 से शुरू करके महत्वपूर्ण सुधार, n=3,4 पर बेहतर प्रभाव
- छोटे विचरण पर परस्पर विलक्षण मापों के व्यवहार के निकट (TV दूरी 2 के निकट)
प्रमेय 3.1 गारंटी देता है:
- प्रत्येक विश्लेषण का एक इष्टतम समाधान है
- ρₙ ↑ ‖μ-ν‖_ एकरस अभिसरण
- इष्टतम समाधान Hahn-Jordan विघटन के क्षणों में परिवर्तित होते हैं
- अनुभवजन्य अनुमानक: नमूना-आधारित दूरी अनुमान, लेकिन TV दूरी के अनुमानक अक्सर असंगत होते हैं
- विश्लेषणात्मक सीमाएं: विशिष्ट वितरण वर्गों (जैसे उच्च-आयामी गाऊसी, गाऊसी मिश्रण) के लिए ऊपरी और निचली सीमाएं
- असमानता विधियां: Pinsker असमानता, Hellinger दूरी सीमाएं
- इष्टतम परिवहन: Kantorovich मेट्रिक के लिए विशेष एल्गोरिदम (जैसे Sinkhorn एल्गोरिदम)
- सामान्यता: Carleman शर्त को संतुष्ट करने वाले सामान्य मापों पर लागू
- गैर-कॉम्पैक्ट समर्थन: कॉम्पैक्ट समर्थन की मांग नहीं करता
- गारंटीकृत अभिसरण: सैद्धांतिक रूप से गारंटीकृत एकरस अभिसरण
- व्यावहारिकता: बंद-रूप क्षण और अनुभवजन्य क्षण दोनों को संभाल सकता है
- TV दूरी गणना के लिए एक सामान्य संख्यात्मक योजना प्रदान करता है
- अपेक्षाकृत कमजोर मान्यताओं के तहत मनमानी सटीकता अनुमान प्राप्त करता है
- प्रत्येक विश्लेषण गारंटीकृत निचली सीमा प्रदान करता है
- असतत मापों के लिए सटीक समाधान प्राप्त कर सकता है
- आयाम संवेदनशीलता: विधि आयाम के प्रति संवेदनशील है, वर्तमान में छोटे आयाम समस्याओं तक सीमित है
- अर्धनिश्चित प्रोग्रामिंग समाधानकर्ता सीमा: उच्च-डिग्री विश्लेषण समस्याओं को हल करने की अपेक्षा नहीं की जा सकती
- संख्यात्मक सटीकता: जब परमाणु बहुत निकट हों तो संख्यात्मक समस्याओं का सामना कर सकता है
- नमूना आकार आवश्यकता: अनुभवजन्य क्षणों का उपयोग करते समय पर्याप्त बड़े नमूने की आवश्यकता होती है
- गणनात्मक रूप से सस्ती वैकल्पिक निचली सीमाएं प्रदान करना
- उच्च-आयामी समस्याओं के प्रबंधन तक विस्तार
- संख्यात्मक स्थिरता में सुधार
- अन्य दूरी मापों के साथ तुलनात्मक अनुसंधान
- सैद्धांतिक कठोरता: पूर्ण अभिसरण प्रमाण और द्वैत सिद्धांत
- विधि नवीनता: पहली बार Moment-SOS पदानुक्रम को TV दूरी गणना पर लागू करता है
- व्यावहारिक मूल्य: बंद-रूप और नमूना दोनों डेटा रूपों को संभाल सकता है
- सटीकता गारंटी: विशिष्ट मामलों (परमाणु माप) के लिए सटीक समाधान प्राप्त कर सकता है
- गणनात्मक जटिलता: अर्धनिश्चित प्रोग्रामिंग की गणनात्मक जटिलता अनुप्रयोग पैमाने को सीमित करती है
- सीमित प्रयोग: मुख्य रूप से कम आयाम और सरल वितरणों पर परीक्षण
- मौजूदा विधियों के साथ तुलना अपर्याप्त: अन्य TV दूरी गणना विधियों के साथ व्यवस्थित तुलना का अभाव
- सैद्धांतिक योगदान: TV दूरी गणना के लिए नया सैद्धांतिक ढांचा प्रदान करता है
- पद्धति मूल्य: संभाव्य मेट्रिक्स गणना में Moment-SOS पदानुक्रम की क्षमता प्रदर्शित करता है
- व्यावहारिक अनुप्रयोग: वितरण-मजबूत अनुकूलन आदि क्षेत्रों के लिए नए उपकरण प्रदान करता है
- सटीक गणना आवश्यकता: सैद्धांतिक गारंटीकृत TV दूरी निचली सीमा की आवश्यकता
- कम आयाम समस्याएं: अपेक्षाकृत कम आयाम वाली व्यावहारिक अनुप्रयोग
- विशेष वितरण: गाऊसी, घातांकीय वितरण और उनके मिश्रण
- असतत वितरण: परिमित समर्थन वाले परमाणु माप
पेपर 28 संबंधित संदर्भों का हवाला देता है, जो इष्टतम परिवहन, क्षण समस्याएं, अर्धनिश्चित प्रोग्रामिंग और संभाव्य मेट्रिक्स आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को कवर करता है, विशेषकर लेखक के Moment-SOS पदानुक्रम पर अपने स्वयं के श्रृंखला कार्य 21,24,26 इस पेपर का सैद्धांतिक आधार बनाते हैं।