2025-11-12T07:28:09.582420

Enhancing Non-Intrusive Load Monitoring with Features Extracted by Independent Component Analysis

Hoosh, Kamyshev, Ouerdane

In this paper, a novel neural network architecture is proposed to address the challenges in energy disaggregation algorithms. These challenges include the limited availability of data and the complexity of disaggregating a large number of appliances operating simultaneously. The proposed model utilizes independent component analysis as the backbone of the neural network and is evaluated using the F1-score for varying numbers of appliances working concurrently. Our results demonstrate that the model is less prone to overfitting, exhibits low complexity, and effectively decomposes signals with many individual components. Furthermore, we show that the proposed model outperforms existing algorithms when applied to real-world data.

academic

स्वतंत्र घटक विश्लेषण द्वारा निकाली गई विशेषताओं के साथ गैर-आक्रामक लोड निगरानी को बढ़ाना

मूल जानकारी

पेपर ID: 2501.16817
शीर्षक: स्वतंत्र घटक विश्लेषण द्वारा निकाली गई विशेषताओं के साथ गैर-आक्रामक लोड निगरानी को बढ़ाना
लेखक: साहर मोघिमियन हूश, इलिया कामीशेव, हेनी ओवर्डेन (स्कोल्कोवो विज्ञान और प्रौद्योगिकी संस्थान)
वर्गीकरण: eess.SY cs.LG cs.SY
प्रकाशन तिथि: 28 जनवरी 2025
पेपर लिंक: https://arxiv.org/abs/2501.16817

सारांश

यह पेपर ऊर्जा विघटन एल्गोरिदम में चुनौतियों को हल करने के लिए एक नवीन तंत्रिका नेटवर्क आर्किटेक्चर प्रस्तावित करता है। इन चुनौतियों में सीमित डेटा उपलब्धता और एक साथ कई चलने वाले उपकरणों के विघटन की जटिलता शामिल है। प्रस्तावित मॉडल तंत्रिका नेटवर्क की रीढ़ के रूप में स्वतंत्र घटक विश्लेषण (ICA) का उपयोग करता है और विभिन्न संख्या में उपकरणों के समवर्ती कार्य का मूल्यांकन करने के लिए F1 स्कोर का उपयोग करता है। परिणाम दर्शाते हैं कि यह मॉडल अधिक फिटिंग के लिए प्रतिरोधी है, कम जटिलता वाला है, और कई स्वतंत्र घटकों वाले संकेतों को प्रभावी ढंग से विघटित कर सकता है। इसके अलावा, हमने प्रदर्शित किया है कि प्रस्तावित मॉडल वास्तविक डेटा पर लागू होने पर मौजूदा एल्गोरिदम से बेहतर है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

गैर-आक्रामक लोड निगरानी (NILM), जिसे ऊर्जा विघटन भी कहा जाता है, उन्नत विश्लेषण के माध्यम से घरेलू कुल ऊर्जा खपत को व्यक्तिगत उपकरण-स्तरीय घटकों में विघटित करने की एक तकनीक है। यह अवधारणा मूल रूप से 1980 के दशक में G. Hart द्वारा प्रस्तावित की गई थी और ऊर्जा दक्षता, मांग प्रतिक्रिया और लोड पूर्वानुमान में इसकी क्षमता के कारण हाल ही में व्यापक ध्यान आकर्षित किया है।

मुख्य चुनौतियाँ

डेटा सीमाएं: लेबल किए गए डेटा की सीमित उपलब्धता गहन तंत्रिका नेटवर्क प्रशिक्षण को कठिन बनाती है
जटिलता समस्या: एक साथ चलने वाले कई उपकरणों के विघटन की जटिलता
एल्गोरिदम सीमाएं: मौजूदा एल्गोरिदम उच्च मेमोरी खपत करते हैं, अधिक फिटिंग के प्रति संवेदनशील हैं, और सेंसर में स्थानांतरित करना कठिन है
डेटासेट पूर्वाग्रह: उपलब्ध डेटासेट में उपकरण संयोजन सीमित हैं, जो सबसे अधिक उपयोग किए जाने वाले उपकरणों की ओर पक्षपाती हैं
व्यावहारिक अनुप्रयोग कठिनाई: शोर वाले डेटा के वास्तविक परिदृश्यों में बहु-उपकरण समवर्ती स्विच का पता लगाना और सही अनुमान लगाना

अनुसंधान प्रेरणा

मौजूदा गहन शिक्षण मॉडल NILM में प्रशिक्षण डेटा की सीमा के कारण विघटन सटीकता में कमी, सामान्यीकरण त्रुटि में वृद्धि और अधिक फिटिंग की समस्याओं का सामना करते हैं। यह अनुसंधान भौतिक सिद्धांतों और ICA तकनीक को जोड़कर एक अधिक मजबूत और कुशल ऊर्जा विघटन एल्गोरिदम विकसित करने का लक्ष्य रखता है।

मुख्य योगदान

ICA को विशेषता निष्कर्षण तकनीक के रूप में पहली बार उपयोग: NILM के बहु-लेबल वर्गीकरण मॉडल में, विशेष रूप से उच्च-आवृत्ति नमूना डेटा (>1kHz) परिदृश्य में, पहली बार ICA का उपयोग विशेषता निष्कर्षण के लिए किया गया है
ICA+ResNetFFN आर्किटेक्चर प्रस्तावित: भौतिक सिद्धांतों के साथ डिज़ाइन किया गया एक नया तंत्रिका नेटवर्क आर्किटेक्चर, जो ऊर्जा विघटन समस्या की भौतिक विशेषताओं पर विचार करता है
व्यापक प्रदर्शन मूल्यांकन: विभिन्न संख्या में उपकरणों के एक साथ चलने की स्थितियों में एल्गोरिदम प्रदर्शन का व्यवस्थित मूल्यांकन
सिंथेटिक डेटा जनरेशन विधि: किरचॉफ के नियम के आधार पर रैखिक रूप से अलग करने योग्य सिंथेटिक उपकरण श्रेणियां उत्पन्न करने की विधि
प्रायोगिक सत्यापन: वास्तविक और सिंथेटिक डेटा पर प्रस्तावित विधि की श्रेष्ठता को प्रदर्शित किया गया है

विधि विवरण

कार्य परिभाषा

इनपुट: एकत्रित विद्युत संकेत X (वोल्टेज और करंट संकेत) आउटपुट: बाइनरी वेक्टर, जो इंगित करता है कि संबंधित उपकरण श्रेणी मिश्रित संकेत में शामिल है या नहीं बाधाएं: 1 से nclasses तक उपकरणों के एक साथ चलने की स्थितियों को संभालना, उपकरण दोहराव पर विचार करना (जैसे कई चार्जर, बल्ब आदि)

मॉडल आर्किटेक्चर

ICA+ResNetFFN आर्किटेक्चर

एकत्रित संकेत X → ICA विघटन → रैखिक प्रक्षेपण → ResNet ब्लॉक अनुक्रम → बहु-लेबल वर्गीकरण

मुख्य चरण:

ICA विघटन: FastICA कार्यान्वयन का उपयोग करके विमिश्रण मैट्रिक्स U प्राप्त करना, एकत्रित संकेत X को nclasses+1 घटकों में विघटित करना:
```
X' = XU^T
```
जहां "+1" गॉसियन घटक पर विचार करता है
रैखिक प्रक्षेपण: X' को dmodel आयाम के स्थान में प्रक्षेपित करना:
```
Xd = X'W^T + b = XUW^T + b
```
ResNet प्रसंस्करण: Xd nblocks युग्मित रैखिक परतों के अनुक्रम के माध्यम से जाता है, जिसमें ReLU सक्रियण और अवशिष्ट कनेक्शन शामिल हैं

पैरामीटर सेटिंग: dmodel = 64, nblocks = 15, कुल पैरामीटर = 65,000

भौतिक सिद्धांत समर्थन

ICA का चयन निम्नलिखित भौतिक सिद्धांतों पर आधारित है:

किरचॉफ का नियम: एकत्रित संकेत iagg(t) = Σk ik(t) का पालन करता है
रैखिक मिश्रण धारणा: ICA मानता है कि स्रोत संकेत रैखिक रूप से मिश्रित हैं, जो विद्युत ग्रिड की भौतिक विशेषताओं के अनुरूप है
स्रोत पृथक्करण: एकत्रित संकेत विभिन्न स्रोत योगदान का रैखिक मिश्रण है

तुलनात्मक आधार विधियां

1. अस्थायी पूलिंग NILM (TP-NILM)

एनकोडर-अस्थायी पूलिंग-डिकोडर संरचना
256-आयामी विशेषताएं निकालने के लिए कनवोल्यूशनल और अधिकतम पूलिंग परतें
चार विभिन्न फ़िल्टर सेटिंग्स की औसत पूलिंग परतें

2. FIT-PS+LSTM

आवृत्ति अपरिवर्तनीय रूपांतरण आवधिक संकेत (FIT-PS) विशेषता निष्कर्षण
मूल आवृत्ति के आधार पर संकेत को विभाजित करना, शून्य-क्रॉसिंग बिंदुओं का उपयोग करना
समय-श्रृंखला विशेषताओं को संसाधित करने के लिए LSTM नेटवर्क

3. Fryze+CNN

Fryze शक्ति सिद्धांत के आधार पर विशेषता निष्कर्षण
सक्रिय करंट को ऑर्थोगोनल घटकों में विघटित करना: i(t) = ia(t) + if(t)
चार CNN ब्लॉक संरचना, चैनल संख्या 16, 32, 64, 128

प्रायोगिक सेटअप

डेटासेट

PLAID डेटासेट

आकार: 1800 नमूने, 30kHz नमूना दर, 16 उपकरण श्रेणियां
पूर्व-प्रसंस्करण: 3kHz तक पुनः नमूना, 19,000 रुचि के क्षेत्र निकालना
विभाजन अनुपात: प्रशिक्षण सेट 70%, सत्यापन सेट 10%, परीक्षण सेट 20%

सिंथेटिक डेटासेट

जनरेशन विधि: किरचॉफ के नियम के आधार पर व्यक्तिगत उपकरण माप संकेतों का कृत्रिम संयोजन
विशेषताएं: रैखिक रूप से अलग करने योग्य श्रेणियां, श्रेणी असंतुलन को कम करना
उपकरण दोहराव: 1-10 बार उपकरण दोहराव पर विचार (जैसे कई चार्जर, बल्ब)
यादृच्छिक जनरेशन: प्रत्येक श्रेणी समान संभावना के साथ मिश्रित संकेत में दिखाई देती है

मूल्यांकन मेट्रिक्स

मुख्य मेट्रिक: F1 स्कोर (नमूना औसत)
विस्तृत विश्लेषण: 1 से nclasses तक एक साथ चलने वाले उपकरणों के लिए F1 स्कोर वितरण
आदर्श लक्ष्य: विभिन्न उपकरण संख्याओं के तहत F1 स्कोर वितरण समान होना चाहिए

कार्यान्वयन विवरण

हार्डवेयर वातावरण: 2× RTX 2080 Ti GPUs, 128GB RAM
प्रशिक्षण समय: प्रत्येक प्रयोग 45 मिनट
तुलना मॉडल: 6 मॉडल (4 गहन शिक्षण + 2 शास्त्रीय मशीन लर्निंग)

प्रायोगिक परिणाम

मुख्य परिणाम

सिंथेटिक डेटा प्रयोग

मॉडल	F1 स्कोर
ICA+ResNetFFN	0.95
Random Forest	0.93
k-NN	0.88
FIT-PS+LSTM	0.72
Fryze+CNN	0.68
Temporal Pooling NILM	0.67

वास्तविक डेटा प्रयोग

मॉडल	F1 स्कोर
ICA+ResNetFFN	0.77
Random Forest	0.76
k-NN	0.75
Fryze+CNN	0.64
FIT-PS+LSTM	0.62
Temporal Pooling NILM	0.60

मुख्य निष्कर्ष

1. अभिसरण प्रदर्शन

ICA+ResNetFFN: सबसे कम सत्यापन हानि और सर्वोच्च F1 स्कोर प्रदर्शित करता है, अधिक सुचारु अभिसरण
अन्य मॉडल: 2-10 उपकरणों के समवर्ती समय में स्पष्ट प्रदर्शन गिरावट

2. मजबूतता विश्लेषण

सिंथेटिक डेटा: प्रस्तावित विधि विभिन्न उपकरण संख्याओं में सुसंगत F1 स्कोर बनाए रखती है
वास्तविक डेटा: हालांकि अब पूरी तरह से समान नहीं है, लेकिन अन्य एल्गोरिदम के प्रदर्शन में गिरावट के क्षेत्रों में बेहतर प्रदर्शन करता है

3. t-SNE दृश्य विश्लेषण

वास्तविक डेटा: उपकरण श्रेणी संरचना जटिल है, कई डेटा बिंदु क्लस्टरिंग या ओवरलैप मौजूद हैं
सिंथेटिक डेटा: रैखिक रूप से अलग करने योग्य श्रेणियां, स्पष्ट संरचना
ओवरलैप कारण: उपकरणों में सामान्य विद्युत घटक होते हैं (जैसे वाशिंग मशीन और केतली दोनों में हीटिंग तत्व होते हैं)

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

ICA प्रभावशीलता: विशेषता निष्कर्षण विधि के रूप में ICA का उपयोग NILM प्रदर्शन में महत्वपूर्ण सुधार करता है
भौतिक सिद्धांत महत्व: डेटा की भौतिक विशेषताओं पर विचार करने वाले मॉडल डिजाइन महत्वपूर्ण है
सिंथेटिक डेटा मूल्य: रैखिक रूप से अलग करने योग्य सिंथेटिक डेटा इष्टतम आर्किटेक्चर विकास के लिए सहायक है
प्रदर्शन श्रेष्ठता: वास्तविक और सिंथेटिक डेटा दोनों पर मौजूदा आधार विधियों से बेहतर

सीमाएं

उपकरण संख्या सीमा: वर्तमान कार्य केवल तीन उपकरणों के वर्गीकरण पर केंद्रित है
डेटा निर्भरता: सभी संभावित उपकरण संयोजनों से निपटने के लिए समृद्ध प्रशिक्षण नमूनों की आवश्यकता है
वास्तविक डेटा चुनौतियां: वास्तविक उपकरण श्रेणियों की जटिल संरचना और ओवरलैप समस्याएं अभी भी समाधान की आवश्यकता है
सामान्यीकरण क्षमता: अधिक संख्या में उपकरणों पर प्रदर्शन को आगे सत्यापन की आवश्यकता है

भविष्य की दिशाएं

उपकरण संख्या विस्तार: अधिक उपकरण श्रेणियों पर विधि के प्रदर्शन को सत्यापित करना
विशेषता निष्कर्षण में सुधार: वास्तविक डेटा में उपकरण ओवरलैप समस्या को संभालना
वास्तविक समय अनुप्रयोग: वास्तविक समय निगरानी आवश्यकताओं के अनुकूल एल्गोरिदम को अनुकूलित करना
क्रॉस-डोमेन सामान्यीकरण: विभिन्न विद्युत ग्रिड वातावरणों में मॉडल अनुकूलन में सुधार

गहन मूल्यांकन

शक्तियां

मजबूत नवीनता: पहली बार ICA को गहन शिक्षण के साथ NILM के लिए जोड़ा गया है, स्पष्ट भौतिक सिद्धांत समर्थन के साथ
व्यापक प्रयोग: सिंथेटिक और वास्तविक डेटा पर व्यापक मूल्यांकन, कई आधार तुलनाएं शामिल
गहन विश्लेषण: t-SNE दृश्य के माध्यम से प्रदर्शन अंतर के कारणों की व्याख्या
व्यावहारिक मूल्य: कम जटिलता डिजाइन व्यावहारिक तैनाती के लिए सुविधाजनक है
परिणाम विश्वसनीयता: कई मेट्रिक्स पर मौजूदा विधियों से महत्वपूर्ण रूप से बेहतर

कमियां

उपकरण पैमाना सीमा: केवल 16 उपकरण श्रेणियों पर सत्यापित, बड़े पैमाने पर सत्यापन की कमी
सिद्धांत विश्लेषण अपर्याप्त: ICA+ResNet संयोजन की प्रभावशीलता के लिए सैद्धांतिक व्याख्या की कमी
कम्प्यूटेशनल जटिलता विश्लेषण: विस्तृत समय जटिलता और स्थान जटिलता विश्लेषण प्रदान नहीं किया गया
मजबूतता परीक्षण: शोर, उपकरण उम्र बढ़ना आदि जैसे व्यावहारिक कारकों के लिए मजबूतता मूल्यांकन की कमी

प्रभाव

शैक्षणिक योगदान: NILM क्षेत्र के लिए नए अनुसंधान विचार और विधियां प्रदान करता है
व्यावहारिक मूल्य: सरल और प्रभावी आर्किटेक्चर डिजाइन में व्यावहारिक अनुप्रयोग क्षमता है
पुनरुत्पादनीयता: Python कार्यान्वयन कोड प्रदान करता है, पुनरुत्पादन और विस्तार को सुविधाजनक बनाता है
प्रेरणा महत्व: मॉडल डिजाइन में भौतिक सिद्धांतों के मार्गदर्शन के महत्व को प्रदर्शित करता है

लागू परिदृश्य

स्मार्ट होम: घरेलू ऊर्जा प्रबंधन और निगरानी प्रणाली
औद्योगिक निगरानी: कारखाने के उपकरण ऊर्जा खपत विश्लेषण
विद्युत ग्रिड प्रबंधन: वितरण नेटवर्क लोड विघटन और पूर्वानुमान
ऊर्जा बचत अनुप्रयोग: उपकरण-स्तरीय निगरानी के आधार पर ऊर्जा बचत अनुकूलन

संदर्भ

यह पेपर 16 संबंधित संदर्भों का हवाला देता है, जिसमें NILM के शास्त्रीय कार्य (Hart, 1992), गहन शिक्षण विधियां, विशेषता निष्कर्षण तकनीकें और संबंधित डेटासेट शामिल हैं, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार और तुलना बेंचमार्क प्रदान करते हैं।

समग्र मूल्यांकन: यह NILM क्षेत्र में एक नवीन कार्य है, जो भौतिक सिद्धांतों को गहन शिक्षण के साथ जोड़कर एक प्रभावी समाधान प्रस्तावित करता है। हालांकि उपकरण पैमाने और सैद्धांतिक विश्लेषण के पहलुओं में कुछ सीमाएं हैं, लेकिन इसके मुख्य विचार और प्रायोगिक परिणाम इस क्षेत्र के विकास के लिए मूल्यवान योगदान प्रदान करते हैं।