In this work, we investigate the universal representation capacity of the Matrix Product States (MPS) from the perspective of boolean functions and continuous functions. We show that MPS can accurately realize arbitrary boolean functions by providing a construction method of the corresponding MPS structure for an arbitrarily given boolean gate. Moreover, we prove that the function space of MPS with the scale-invariant sigmoidal activation is dense in the space of continuous functions defined on a compact subspace of the $n$-dimensional real coordinate space $\mathbb{R^{n}}$. We study the relation between MPS and neural networks and show that the MPS with a scale-invariant sigmoidal function is equivalent to a one-hidden-layer neural network equipped with a kernel function. We construct the equivalent neural networks for several specific MPS models and show that non-linear kernels such as the polynomial kernel which introduces the couplings between different components of the input into the model appear naturally in the equivalent neural networks. At last, we discuss the realization of the Gaussian Process (GP) with infinitely wide MPS by studying their equivalent neural networks.
- पेपर ID: 2103.08277
- शीर्षक: मैट्रिक्स प्रोडक्ट स्टेट्स के लिए प्रतिनिधित्व प्रमेय
- लेखक: Erdong Guo, David Draper (कैलिफोर्निया विश्वविद्यालय, सांता क्रूज़)
- वर्गीकरण: stat.ML cs.LG cs.NE quant-ph
- प्रकाशन समय: 15 मार्च 2021 (arXiv प्रीप्रिंट)
- पेपर लिंक: https://arxiv.org/abs/2103.08277
यह पेपर बूलियन फलन और सतत फलन के दृष्टिकोण से मैट्रिक्स प्रोडक्ट स्टेट्स (MPS) की सार्वभौमिक प्रतिनिधित्व क्षमता का अध्ययन करता है। लेखकों ने सिद्ध किया है कि MPS किसी भी बूलियन फलन को सटीक रूप से कार्यान्वित कर सकता है, और किसी भी दिए गए बूलियन गेट के लिए संबंधित MPS संरचना के निर्माण की विधि प्रदान की है। इसके अतिरिक्त, यह सिद्ध किया गया है कि स्केल-अपरिवर्तनीय सिग्मॉइड सक्रियण फलन वाले MPS फलन स्पेस n-आयामी वास्तविक निर्देशांक स्पेस के कॉम्पैक्ट उपसमुच्चय पर परिभाषित सतत फलन स्पेस में सघन है। MPS और तंत्रिका नेटवर्क के संबंध का अध्ययन किया गया, जो दर्शाता है कि स्केल-अपरिवर्तनीय सिग्मॉइड फलन वाले MPS कर्नल फलन से सुसज्जित एकल छिपी परत वाले तंत्रिका नेटवर्क के समतुल्य हैं। अंत में, अनंत चौड़ाई वाले MPS द्वारा गाऊसी प्रक्रिया (GP) को कार्यान्वित करने की समस्या पर समतुल्य तंत्रिका नेटवर्क के अध्ययन के माध्यम से चर्चा की गई है।
- टेंसर नेटवर्क का उदय: टेंसर नेटवर्क बहु-निकाय क्वांटम प्रणालियों का प्रतिनिधित्व करने के लिए एक शक्तिशाली ग्राफिकल भाषा है, जिसे क्वांटम सूचना, संघनित पदार्थ भौतिकी, अनुप्रयुक्त गणित और कंप्यूटर विज्ञान सहित कई क्षेत्रों में व्यापक रूप से लागू किया गया है।
- MPS की प्रतिनिधित्व क्षमता का प्रश्न: हालांकि MPS में क्वांटम भौतिकी में महत्वपूर्ण भौतिक महत्व है, लेकिन जब इसे मशीन लर्निंग में एक बीजगणितीय उपकरण के रूप में उपयोग किया जाता है, तो एक स्वाभाविक प्रश्न यह है: एक बीजगणितीय मशीन के रूप में MPS की प्रतिनिधित्व क्षमता कितनी मजबूत है?
- सार्वभौमिक सन्निकटन सिद्धांत की आवश्यकता: तंत्रिका नेटवर्क के सार्वभौमिक सन्निकटन प्रमेय के समान, MPS की प्रतिनिधित्व क्षमता की सीमा को सैद्धांतिक रूप से सिद्ध करने की आवश्यकता है।
- सैद्धांतिक अंतराल को भरना: मौजूदा अनुसंधान मुख्य रूप से MPS के भौतिक गुणों पर केंद्रित है, लेकिन फलन सन्निकटक के रूप में इसके सैद्धांतिक विश्लेषण में कमी है।
- MPS और तंत्रिका नेटवर्क के बीच संबंध स्थापित करना: MPS और शास्त्रीय मशीन लर्निंग मॉडल (विशेष रूप से तंत्रिका नेटवर्क) के बीच समतुल्यता संबंध की खोज करना।
- व्यावहारिक विचार: वास्तविक अनुप्रयोगों में, पूर्ण आधार आमतौर पर अनंत-आयामी होता है, इसलिए यह अध्ययन करने की आवश्यकता है कि हल्के-फुल्के अनुमानों के तहत MPS कितने बड़े फलन स्पेस को "विस्तृत" कर सकता है।
- बूलियन फलन का सटीक प्रतिनिधित्व: सिद्ध किया गया है कि MPS किसी भी बूलियन फलन को सटीक रूप से कार्यान्वित कर सकता है, और रचनात्मक प्रमाण विधि प्रदान की गई है।
- सतत फलन का सार्वभौमिक सन्निकटन: सिद्ध किया गया है कि स्केल-अपरिवर्तनीय सिग्मॉइड सक्रियण वाले MPS फलन स्पेस सतत फलन स्पेस में सघन है (सर्वोच्च मानदंड के संबंध में)।
- MPS और तंत्रिका नेटवर्क की समतुल्यता: MPS और एकल छिपी परत वाले तंत्रिका नेटवर्क के बीच समतुल्यता संबंध स्थापित किया गया, जो MPS में कर्नल फलन के प्राकृतिक उदय को प्रकट करता है।
- गाऊसी प्रक्रिया का कार्यान्वयन: अनंत चौड़ाई वाले MPS के माध्यम से गाऊसी प्रक्रिया के कार्यान्वयन की समस्या पर चर्चा की गई है।
मूल MPS मॉडल को इस प्रकार परिभाषित किया गया है:
Ψl(x∣w,B)=∑{α,s}Aα1α2s1⋯Alαiαi+1si⋯Aαnα1snΦs1⋯sn(x)
जहां कर्नल फलन को इस प्रकार परिभाषित किया गया है:
Φs1⋯sn(x)=ϕs1(x1)⊗⋯⊗ϕsi(xi)⋯⊗ϕsn(xn)
सार्वभौमिक सन्निकटन को कार्यान्वित करने के लिए, लेखकों ने संशोधित MPS संरचना प्रस्तावित की है:
Ψ(x∣w,B)=∑lσ(∑{α,s}Aα1α2s1⋯Alαiαi+1si⋯Aαnα1snΦs1⋯sn(x))
जहां σ(⋅) स्केल-अपरिवर्तनीय सिग्मॉइड फलन है:
σ(x)→{0Cx→−∞x→+∞
AND गेट कार्यान्वयन (प्रमेय 2.1):
- कर्नल फलन: ϕi(Xi)=[Xi,1−Xi]
- टेंसर नोड: Asi=[1,0], बॉन्ड आयाम ∣α∣=1
OR गेट कार्यान्वयन (प्रमेय 2.2):
- कर्नल फलन: ϕi(Xi)=[Xi,1−Xi]
- टेंसर नोड बॉन्ड आयाम: ∣α∣=3
- विशिष्ट टेंसर संरचना:
Aα1α2s1=[[1,0,1],[0,1,0]]Aα2α1s2=[[0,1,1],[1,0,0]]
NOT गेट कार्यान्वयन (प्रमेय 2.3):
- कर्नल फलन: ϕ1(X1)=1−X1
- टेंसर नोड: As1=1
सार्वभौमिक AND गेट (प्रमेय 2.4):
n इनपुट चर के लिए, निम्नलिखित को कार्यान्वित किया जा सकता है:
Ψ(X1,⋯,Xn)=(⋀i=1lXi)⋀(⋀j=l+1nXj)
मनमाना बूलियन फलन (प्रमेय 2.5):
किसी भी बूलियन फलन को सार्वभौमिक AND गेट के विच्छेदन सामान्य रूप में प्रतिनिधित्व करके, संबंधित MPS को निर्मित किया जा सकता है। निर्माण नियम:
- बूलियन फलन को सत्य तालिका के अनुरूप विच्छेदन सामान्य रूप में लिखें
- बॉन्ड आयाम को विच्छेदन पदों की संख्या m के रूप में सेट करें
- विशिष्ट नियमों के अनुसार टेंसर तत्वों को भरें
MPS फलन स्पेस C0(In) (इकाई घन पर सतत फलन स्पेस) में सघन है, अर्थात किसी भी f(x)∈C0(In) और किसी भी ε>0 के लिए, एक MPS फलन Ψ(x) मौजूद है जैसे कि:
supx∣Ψ(x)−f(x)∣<ε
रैखिकता प्रमाण (लेम्मा 3.2):
सिद्ध किया गया है कि MPS फलन परिवार M C0(In) का एक रैखिक उप-स्पेस है:
- अदिश गुणन के लिए बंद: स्केल-अपरिवर्तनीयता का उपयोग करके
- जोड़ के लिए बंद: दो MPS के योग का प्रतिनिधित्व करने के लिए नया MPS निर्मित करें
विभेदक गुण (लेम्मा 3.4):
सिद्ध किया गया है कि स्केल-अपरिवर्तनीय सिग्मॉइड फलन में विभेदक गुण हैं: यदि एक परिमित हस्ताक्षरित माप μ सभी MPS फलनों के समाकलन को 0 बनाता है, तो μ=0।
मुख्य प्रमेय प्रमाण:
Hahn-Banach प्रमेय और Riesz प्रतिनिधित्व प्रमेय के विरोधाभास तर्क का उपयोग करें:
- मान लें कि M C0(In) का एक वास्तविक उप-समुच्चय है
- Hahn-Banach प्रमेय द्वारा, एक गैर-तुच्छ रैखिक फलनात्मक M को नष्ट करता है
- Riesz प्रतिनिधित्व प्रमेय द्वारा, एक गैर-तुच्छ माप के अनुरूप
- विभेदक गुण द्वारा, वह माप 0 होना चाहिए, जो विरोधाभास उत्पन्न करता है
स्केल-अपरिवर्तनीय सिग्मॉइड सक्रियण वाले MPS कर्नल फलन से सुसज्जित एकल छिपी परत वाले तंत्रिका नेटवर्क के समतुल्य हैं।
आंतरिक सूचकांकों {αi} को संकुचित करके, MPS को इस प्रकार लिखा जा सकता है:
Ψ(x)=∑lσ(∑sWslΦs(x))
यह एकल छिपी परत वाले तंत्रिका नेटवर्क का सटीक रूप है, जहां:
- Wsl भार पैरामीटर हैं
- Φs(x) कर्नल फलन है, जो इनपुट घटकों के बीच युग्मन को स्वाभाविक रूप से प्रस्तुत करता है
विशिष्ट उदाहरणों के माध्यम से दर्शाया गया है कि बहुपद कर्नल जैसे गैर-रैखिक कर्नल समतुल्य तंत्रिका नेटवर्क में कैसे स्वाभाविक रूप से उदय होते हैं, उदाहरण के लिए:
(Φs)T=[x1x2x3,x2x3,x1x3,x1x2,x1,x2,x3,1]
3-इनपुट OR गेट:
बूलियन अभिव्यक्ति: f(X1,X2,X3)=X1∨X2∨X3
संबंधित MPS टेंसर संरचना विधि अनुभाग में विस्तार से दी गई है।
3-इनपुट समता जांच गेट:
बूलियन अभिव्यक्ति: f(X1,X2,X3)=X1⊕X2⊕X3
समतुल्य तंत्रिका नेटवर्क भार: Ws=[1,0,0,1,0,1,1,0]
थ्रेशोल्ड गेट Th₃²:
जब कम से कम 2 इनपुट 1 हों तो 1 आउटपुट करने वाला थ्रेशोल्ड फलन।
n-इनपुट बूलियन गेट के लिए, चरम मामलों में बॉन्ड आयाम को O(2n) की आवश्यकता होती है, लेकिन कार्नॉ मानचित्र सरलीकरण के माध्यम से इसे O(2n−1) तक कम किया जा सकता है, कुल पैरामीटर संख्या O(n2n−1) है, जो एकल छिपी परत वाले तंत्रिका नेटवर्क की दक्षता के बराबर है।
- Penrose (1971) की टेंसर गणना ग्राफिकल प्रतीक प्रणाली
- Vidal (2003, 2007) का Schmidt विघटन और DMRG विधि
- Perez-Garcia आदि (2006) द्वारा MPS गुणों का व्यवस्थित अनुसंधान
- Stoudenmire & Schwab (2016) का पर्यवेक्षित लर्निंग अनुप्रयोग
- प्रतिगमन, वर्गीकरण और घनत्व अनुमान में विभिन्न टेंसर नेटवर्क अनुप्रयोग
- Cybenko (1989), Hornik (1991) द्वारा तंत्रिका नेटवर्क सार्वभौमिक सन्निकटन पर शास्त्रीय कार्य
- यह पेपर समान कार्यात्मक विश्लेषण तकनीकों का उपयोग करता है
- सैद्धांतिक पूर्णता: MPS में किसी भी बूलियन फलन का प्रतिनिधित्व करने और किसी भी सतत फलन को सन्निकट करने की क्षमता है
- समतुल्यता का प्रकटीकरण: MPS अनिवार्य रूप से कर्नल फलन से सुसज्जित एकल छिपी परत वाले तंत्रिका नेटवर्क के समतुल्य है
- कर्नल फलन की महत्ता: कर्नल फलन Φs1⋯sn MPS प्रतिनिधित्व क्षमता की कुंजी है, न कि बॉन्ड सूचकांक {αi}
- व्यावहारिक समस्या: बूलियन फलन के MPS कार्यान्वयन को घातीय स्तर के बॉन्ड आयाम की आवश्यकता होती है
- भौतिक अर्थ का नुकसान: शुद्ध बीजगणितीय उपकरण के रूप में, MPS क्वांटम भौतिकी में उलझाव जैसे महत्वपूर्ण गुणों को खो देता है
- कर्नल फलन डिज़ाइन: पर्याप्त प्रतिनिधित्व क्षमता प्राप्त करने के लिए कर्नल फलन को सावधानीपूर्वक डिज़ाइन करने की आवश्यकता है
- कुशल निर्माण विधियां: अधिक कुशल MPS निर्माण विधियां खोजें, जटिलता को कम करें
- गहरी संरचना: बहु-परत MPS संरचना की खोज करें, गहरे तंत्रिका नेटवर्क के समान
- क्वांटम लाभ: क्वांटम कंप्यूटिंग वातावरण में MPS के अद्वितीय लाभों की खोज करें
- महत्वपूर्ण सैद्धांतिक योगदान: पहली बार फलन सन्निकटन के दृष्टिकोण से MPS की प्रतिनिधित्व क्षमता का व्यवस्थित विश्लेषण
- कठोर प्रमाण: कार्यात्मक विश्लेषण के शास्त्रीय उपकरणों का उपयोग, प्रमाण प्रक्रिया सुदृढ़
- संयोजन अंतर्दृष्टि: MPS और तंत्रिका नेटवर्क के बीच गहरे संबंध को प्रकट करता है, क्षेत्रों के बीच समझ के लिए एक पुल प्रदान करता है
- रचनात्मक प्रमाण: न केवल अस्तित्व सिद्ध करता है, बल्कि विशिष्ट निर्माण विधि भी प्रदान करता है
- सीमित व्यावहारिकता: सैद्धांतिक परिणाम वास्तविक अनुप्रयोगों में आयाम के अभिशाप का सामना कर सकते हैं
- अपर्याप्त प्रायोगिक सत्यापन: सैद्धांतिक परिणामों को सत्यापित करने के लिए बड़े पैमाने पर संख्यात्मक प्रयोगों की कमी
- अनुकूलन एल्गोरिदम की कमी: ऐसे MPS मॉडल को कुशलतापूर्वक प्रशिक्षित करने के बारे में चर्चा नहीं की गई है
- अपर्याप्त तुलनात्मक विश्लेषण: अन्य सार्वभौमिक सन्निकटकों के साथ विस्तृत तुलनात्मक विश्लेषण की कमी है
- उच्च सैद्धांतिक मूल्य: मशीन लर्निंग में टेंसर नेटवर्क के अनुप्रयोग के लिए ठोस सैद्धांतिक आधार प्रदान करता है
- अंतर-क्षेत्रीय महत्व: क्वांटम भौतिकी और मशीन लर्निंग दोनों क्षेत्रों को जोड़ता है
- अत्यधिक प्रेरणादायक: टेंसर नेटवर्क की प्रतिनिधित्व क्षमता और अनुकूलन विधियों के अनुसंधान के लिए महत्वपूर्ण संदर्भ प्रदान करता है
- सैद्धांतिक अनुसंधान: टेंसर नेटवर्क प्रतिनिधित्व सिद्धांत की नींव के रूप में उपयुक्त
- शिक्षण उद्देश्य: MPS और तंत्रिका नेटवर्क के संबंध को समझाने के लिए उपयोग किया जा सकता है
- एल्गोरिदम डिज़ाइन: MPS-आधारित मशीन लर्निंग एल्गोरिदम डिज़ाइन करने के लिए सैद्धांतिक मार्गदर्शन प्रदान करता है
- क्वांटम मशीन लर्निंग: क्वांटम मशीन लर्निंग एल्गोरिदम के डिज़ाइन के लिए सैद्धांतिक समर्थन प्रदान करता है
यह पेपर टेंसर नेटवर्क, क्वांटम सूचना, मशीन लर्निंग और कार्यात्मक विश्लेषण सहित कई क्षेत्रों के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:
- टेंसर नेटवर्क मूल सिद्धांत (Penrose, 1971; Vidal, 2007; Perez-Garcia et al., 2006)
- तंत्रिका नेटवर्क सार्वभौमिक सन्निकटन सिद्धांत (Cybenko, 1989; Hornik, 1991)
- मशीन लर्निंग में टेंसर नेटवर्क के अनुप्रयोग (Stoudenmire & Schwab, 2016; आदि)
- कार्यात्मक विश्लेषण सैद्धांतिक नींव (Folland, 2013)