A Spatio-temporal CP decomposition analysis of New England region in the US
Sanogo
Spatio temporal data consist of measurement for one or more raster fields such as weather, traffic volume, crime rate, or disease incidents. Advances in modern technology have increased the number of available information for this type of data hence the rise of multidimensional data. In this paper we take advantage of the multidimensional structure of the data but also its temporal and spatial structure. In fact, we will be using the NCAR Climate Data Gateway website which provides data discovery and access services for global and regional climate model data. The daily values of total precipitation (prec), maximum (tmax), and minimum (tmin) temperature are combined to create a multidimensional data called tensor (a multidimensional array). In this paper, we propose a spatio temporal principal component analysis to initialize CP decomposition component. We take full advantage of the spatial and temporal structure of the data in the initialization step for cp component analysis. The performance of our method is tested via comparison with most popular initialization method. We also run a clustering analysis to further show the performance of our analysis.
academic
تحليل تحلل CP الزمكاني لمنطقة نيو إنجلاند في الولايات المتحدة
تحتوي البيانات الزمكانية على قياسات لحقل شبكي واحد أو أكثر، مثل الطقس وتدفق المرور ومعدلات الجريمة أو أحداث الأمراض. أدى التقدم التكنولوجي الحديث إلى زيادة كمية المعلومات المتاحة من هذه البيانات، مما أسفر عن بيانات متعددة الأبعاد. تستفيد هذه الورقة من البنية متعددة الأبعاد للبيانات وكذلك البنية الزمنية والمكانية. يستخدم المؤلفون بيانات النماذج المناخية العالمية والإقليمية المقدمة من موقع بوابة بيانات المناخ بمركز NCAR، لإنشاء موتر بيانات متعدد الأبعاد من خلال دمج القيم اليومية لإجمالي الهطول (prec) وأقصى درجة حرارة (tmax) وأدنى درجة حرارة (tmin). تقترح الورقة تحليل المكونات الرئيسية الزمكانية لتهيئة مكونات تحلل CP، مما يستفيد بشكل كامل من البنية المكانية والزمنية للبيانات في خطوة تهيئة تحليل مكونات CP.
المشكلة المراد حلها: تفتقر طرق تحلل الموتر التقليدية (مثل تحلل CP) عند التعامل مع بيانات المناخ الزمكانية إلى استراتيجيات تهيئة متخصصة موجهة نحو الارتباط الزمكاني، مما يؤدي إلى قابلية تحديد العوامل الضعيفة ودقة إعادة البناء المنخفضة.
أهمية المشكلة:
يؤدي تغير المناخ العالمي إلى تكرار الأحداث الجوية القاسية، مما يتطلب أدوات تنبؤ وتشخيص أكثر موثوقية
تواجه نماذج الأنظمة الأرضية الرقمية تحديات في أوقات الحساب الطويلة والنمو الأسي لأبعاد البيانات
هناك حاجة إلى طرق إحصائية وتعلم آلي لمحاكاة النماذج القائمة على الفيزياء
قيود الطرق الموجودة:
بينما يمكن لتحليل المكونات الرئيسية (PCA) استخراج أنماط التباين الرئيسية، إلا أنه يعالج المتغيرات بشكل مستقل ويفرض قيود التعامد، مما يفتقر إلى التفسير الفيزيائي
لا تأخذ التهيئة العشوائية وتهيئة HOSVD في الاعتبار البنية الكامنة لبيانات الزمكان
تطبيق طرق تحلل الموتر الموجودة محدود في أبحاث المناخ
الدافع البحثي: تطوير استراتيجية تهيئة تحلل CP متخصصة تستفيد من الارتباط الزمكاني لبيانات المناخ، لتحسين قابلية تحديد العوامل ودقة إعادة البناء.
بالنظر إلى موتر ثلاثي الأبعاد X∈RI×J×K، حيث I هو البعد الزمني، وJ هو البعد المكاني، وK هو بعد المتغير، الهدف هو إيجاد تحلل CP الأمثل:
X=∑r=1Rar∘br∘cr=[[A,B,C]]
تحويل البيانات: تحويل مصفوفة البيانات إلى مجموعة بيانات دالية متعددة المتغيرات، من خلال التحويل باستخدام الأساس فورييه:
ϕ0(t)=T1,ϕ2j−1(t)=T2sin(T2πjt),ϕ2j(t)=T2cos(T2πjt)
مصفوفة الأوزان المكانية: استخدام مؤشر موران مع مصفوفة الأوزان المكانية W للحصول على مصفوفة الارتباط المكاني
استخراج الميزات: استخراج القيم الذاتية التي يمكن أن تكون موجبة أو سالبة والمكونات الرئيسية الزمكانية المقابلة