A Spatio-temporal CP decomposition analysis of New England region in the US
Sanogo
Spatio temporal data consist of measurement for one or more raster fields such as weather, traffic volume, crime rate, or disease incidents. Advances in modern technology have increased the number of available information for this type of data hence the rise of multidimensional data. In this paper we take advantage of the multidimensional structure of the data but also its temporal and spatial structure. In fact, we will be using the NCAR Climate Data Gateway website which provides data discovery and access services for global and regional climate model data. The daily values of total precipitation (prec), maximum (tmax), and minimum (tmin) temperature are combined to create a multidimensional data called tensor (a multidimensional array). In this paper, we propose a spatio temporal principal component analysis to initialize CP decomposition component. We take full advantage of the spatial and temporal structure of the data in the initialization step for cp component analysis. The performance of our method is tested via comparison with most popular initialization method. We also run a clustering analysis to further show the performance of our analysis.
academic
अमेरिका के न्यू इंग्लैंड क्षेत्र का स्पेसियो-टेम्पोरल CP विघटन विश्लेषण
स्पेसियो-टेम्पोरल डेटा में एक या अधिक ग्रिड फील्ड के मापन होते हैं, जैसे मौसम, यातायात प्रवाह, अपराध दर या रोग घटनाएं। आधुनिक तकनीकी प्रगति ने ऐसे डेटा की उपलब्ध जानकारी की मात्रा को बढ़ाया है, जिससे बहुआयामी डेटा उत्पन्न हुआ है। यह पेपर डेटा की बहुआयामी संरचना के साथ-साथ समय और स्थान संरचना का उपयोग करता है। लेखक NCAR जलवायु डेटा गेटवे वेबसाइट द्वारा प्रदान किए गए वैश्विक और क्षेत्रीय जलवायु मॉडल डेटा का उपयोग करते हुए, कुल वर्षा (prec), अधिकतम तापमान (tmax) और न्यूनतम तापमान (tmin) के दैनिक मानों को संयोजित करके बहुआयामी डेटा टेंसर बनाते हैं। पेपर स्पेसियो-टेम्पोरल प्रमुख घटक विश्लेषण प्रस्तावित करता है जो CP विघटन घटकों को आरंभीकृत करने के लिए, डेटा की स्थानिक और समय संरचना को CP घटक विश्लेषण के आरंभीकरण चरण में पूरी तरह से उपयोग करता है।
समाधान की जाने वाली समस्या: पारंपरिक टेंसर विघटन विधियां (जैसे CP विघटन) जलवायु स्पेसियो-टेम्पोरल डेटा को संभालते समय, स्पेसियो-टेम्पोरल सहसंबंध के लिए विशेष आरंभीकरण रणनीति की कमी होती है, जिससे कारक पहचान क्षमता खराब और पुनर्निर्माण सटीकता कम होती है।
समस्या की महत्ता:
वैश्विक जलवायु परिवर्तन से चरम मौसम की घटनाएं बार-बार होती हैं, जिन्हें अधिक विश्वसनीय पूर्वानुमान और निदान उपकरणों की आवश्यकता है
संख्यात्मक पृथ्वी प्रणाली मॉडल लंबे कम्प्यूटेशनल समय और डेटा आयाम के घातीय वृद्धि की चुनौती का सामना करते हैं
भौतिकी-आधारित मॉडल को अनुकरण करने के लिए सांख्यिकीय और मशीन लर्निंग विधियों की आवश्यकता है
मौजूदा विधियों की सीमाएं:
PCA मुख्य विचरण पैटर्न निकाल सकता है, लेकिन चर को स्वतंत्र रूप से संभालता है और ऑर्थोगोनलिटी बाधा लागू करता है, भौतिक व्याख्या की कमी है
यादृच्छिक आरंभीकरण और HOSVD आरंभीकरण स्पेसियो-टेम्पोरल डेटा की अंतर्निहित संरचना पर विचार नहीं करते हैं
मौजूदा टेंसर विघटन विधियों का जलवायु अनुसंधान में सीमित अनुप्रयोग है
अनुसंधान प्रेरणा: जलवायु डेटा के स्पेसियो-टेम्पोरल सहसंबंध का विशेष रूप से उपयोग करने वाली CP विघटन आरंभीकरण रणनीति विकसित करना, कारक पहचान क्षमता और पुनर्निर्माण सटीकता में सुधार करना।
त्रि-आयामी टेंसर X∈RI×J×K दिया गया है, जहां I समय आयाम है, J स्थान आयाम है, K चर आयाम है, लक्ष्य इष्टतम CP विघटन खोजना है:
X=∑r=1Rar∘br∘cr=[[A,B,C]]
डेटा रूपांतरण: डेटा मैट्रिक्स को बहुचर कार्यात्मक डेटा सेट में रूपांतरित करना, फूरियर आधार के माध्यम से रूपांतरण:
ϕ0(t)=T1,ϕ2j−1(t)=T2sin(T2πjt),ϕ2j(t)=T2cos(T2πjt)
स्थानिक भार मैट्रिक्स: Moran सूचकांक को स्थानिक भार मैट्रिक्स W के साथ संयोजित करके स्थानिक सहसंबंध मैट्रिक्स प्राप्त करना
विशेषता निष्कर्षण: विशेषताएं निकालना जो सकारात्मक और नकारात्मक दोनों हो सकती हैं और संबंधित स्पेसियो-टेम्पोरल प्रमुख घटक
टेंसर विघटन विधियां: CP विघटन को पहली बार Hitchcock (1927) द्वारा प्रस्तावित किया गया था, बाद में Carroll और Chang (1970) और Harshman (1970) द्वारा विकसित किया गया
स्थानिक PCA: स्थानिक स्वत:सहसंबंध पर विचार करने वाली प्रमुख घटक विश्लेषण विधि
जलवायु डेटा विश्लेषण: जलवायु विज्ञान में अनुभवजन्य ऑर्थोगोनल फलन (EOF) विश्लेषण का अनुप्रयोग
गहन शिक्षा विधियां: जलवायु मॉडलिंग में कनवोल्यूशनल न्यूरल नेटवर्क और ग्राफ न्यूरल नेटवर्क का अनुप्रयोग