2025-11-14T09:34:10.285532

Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data

Gerasimov, Kamyshev, Hoosh et al.

Non-Intrusive Load Monitoring (NILM) is an advanced, and cost-effective technique for monitoring appliance-level energy consumption. However, its adaptability is hindered by the lack of transparency and explainability. To address this challenge, this paper presents an explainable, real-time, event-based NILM framework specifically designed for high-frequency datasets. The proposed framework ensures transparency at every stage by integrating a z-score-based event detector, appliance signature estimation, Fourier-based feature extraction, an XG-Boost classifier, and post hoc SHAP analysis. The SHAP analysis further quantifies the contribution of individual features, such as cosine of specific harmonic phases, to appliance classification. The framework is trained and evaluated on the PLAID dataset, and achieved a classification accuracy of 90% while maintaining low computational requirements and a latency of less than one second.

academic

نحو نظام NILM قابل للتفسير: إطار عمل NILM قائم على الأحداث في الوقت الفعلي لبيانات عالية التردد

المعلومات الأساسية

معرّف الورقة: 2501.16841
العنوان: نحو نظام NILM قابل للتفسير: إطار عمل NILM قائم على الأحداث في الوقت الفعلي لبيانات عالية التردد
المؤلفون: جريجوري جيراسيموف، إيليا كاميشيف، سحر مغيميان هوش، إيلينا جريازينا، هيني أويردان
المؤسسات: معهد سكولكوفو للعلوم والتكنولوجيا، موسكو، روسيا؛ شركة مونيسينسا للتطوير، موسكو، روسيا
التصنيف: eess.SY (الأنظمة والتحكم)، cs.SY (الأنظمة والتحكم)
تاريخ النشر: 28 يناير 2025
رابط الورقة: https://arxiv.org/abs/2501.16841

الملخص

المراقبة غير الاقتحامية للأحمال (NILM) هي تقنية متقدمة واقتصادية فعالة لمراقبة استهلاك الطاقة على مستوى الأجهزة المنزلية. ومع ذلك، فإن قابليتها للتكيف محدودة بسبب نقص الشفافية والقابلية للتفسير. لمعالجة هذا التحدي، تقترح هذه الورقة إطار عمل NILM قابل للتفسير وفي الوقت الفعلي وقائم على الأحداث مصمم خصيصاً لمجموعات البيانات عالية التردد. يضمن الإطار الشفافية في كل مرحلة من خلال دمج كاشف الأحداث المستند إلى z-score، وتقدير توقيع الجهاز، واستخراج الميزات المستند إلى فورييه، ومصنف XGBoost، وتحليل SHAP اللاحق. يحدد تحليل SHAP بشكل إضافي مساهمة الميزات الفردية (مثل قيمة جيب التمام لمرحلة التوافقية المحددة) في تصنيف الجهاز. تم تدريب الإطار وتقييمه على مجموعة بيانات PLAID، حيث حقق دقة تصنيف بنسبة 90%، مع الحفاظ على متطلبات حسابية منخفضة وتأخير أقل من ثانية واحدة.

خلفية البحث والدافع

تعريف المشكلة

مع استمرار نمو استهلاك الطاقة، أصبحت مراقبة الأحمال حاسمة. في الاتحاد الأوروبي، تمثل المباني حوالي 41% من استهلاك الكهرباء. تتطلب المراقبة الاقتحامية التقليدية للأحمال (ILM) تثبيت أجهزة استشعار على كل جهاز، وبينما توفر دقة عالية، إلا أنها مكلفة وصعبة التثبيت وغير مناسبة للتطبيقات واسعة النطاق. يعمل نظام NILM كبديل، حيث يراقب إجمالي استهلاك الطاقة في نقطة واحدة (عادة العداد الرئيسي)، ويستخدم خوارزميات التحليل لتقدير استهلاك الطاقة لكل جهاز على حدة.

قيود الطرق الموجودة

نقص القابلية للتفسير: تتمتع طرق NILM الموجودة، خاصة نماذج التعلم العميق، بطبيعة "الصندوق الأسود" وتفتقر إلى الشفافية في عملية اتخاذ القرار
التعقيد الحسابي العالي: تتطلب الطرق غير المدفوعة بالأحداث موارد حسابية أكثر ومجموعات بيانات معنونة كبيرة
عدم كفاية الأداء في الوقت الفعلي: يصعب على الطرق الموجودة تلبية متطلبات التطبيقات في الوقت الفعلي على أجهزة الحافة
قدرة محدودة على معالجة البيانات عالية التردد: يركز بحث NILM القابل للتفسير الموجود بشكل أساسي على البيانات منخفضة التردد (1 هرتز)

دافع البحث

تهدف هذه الورقة إلى بناء إطار عمل NILM قابل للتفسير من طرف إلى طرف، خاصة للبيانات عالية التردد (نطاق كيلوهرتز)، لتحقيق التحليل في الوقت الفعلي بأدنى تأخير قدره 320/380 ميلي ثانية (لأنظمة الطاقة 60/50 هرتز)، لبناء الثقة في أنظمة NILM وتعزيز اعتمادها في التطبيقات العملية.

المساهمات الأساسية

أول إطار عمل NILM قابل للتفسير في الوقت الفعلي من طرف إلى طرف لبيانات عالية التردد: يقترح إطار عمل كامل قابل للتفسير مصمم خصيصاً لمجموعات البيانات عالية التردد
قابلية التطبيق على أجهزة الحافة في الوقت الفعلي: الطريقة قابلة للتطبيق على التطبيقات في الوقت الفعلي على أجهزة الحافة، بتأخير قدره 19/f₀ + τ ثانية (حيث f₀ هي التردد الأساسي و τ هو وقت التنفيذ)
اختيار ميزات محسّن: تم اختيار مجموعة صغيرة من ميزات توقيع الجهاز الأقل ارتباطاً والقابلة للتفسير، مما حقق دقة تصنيف بنسبة 90% على مجموعة بيانات حقيقية
تنفيذ مفتوح المصدر: تم نشر كود الإطار على GitHub، مما يعزز إعادة الإنتاج والتطبيق

شرح الطريقة

تعريف المهمة

الإدخال: إشارات الجهد والتيار عالية التردد (معدل أخذ العينات 30 كيلوهرتز) الإخراج: كشف وتصنيف أحداث تشغيل/إيقاف الجهاز، وشرح القرار القيود: متطلبات المعالجة في الوقت الفعلي، التعقيد الحسابي المنخفض، القابلية العالية للتفسير

معمارية النموذج

1. معالجة الجهد والتيار في الوقت الفعلي

استخدام تحويل الإشارة الدورية الثابتة بالتردد (FIT-PS) لمعالجة إشارات الجهد v والتيار i:

ṽ, ĩ = FITPS(v, i)

تكتشف هذه الخوارزمية نقاط العبور الصفري لإشارة الجهد، وتعيد أخذ عينات من متجهات الجهد والتيار إلى طول مشترك T=500.

2. كاشف الأحداث المستند إلى z-score

حساب القوة النشطة:

p(k) = (1/T) × Σ(ṽₜ(k) × ĩₜ(k))

كشف الأحداث عندما يتجاوز z-score عتبة محددة مسبقاً Z=30:

z(k) = |p(k) - μw| / σw, z(k) > Z

حيث μw و σw هما المتوسط والانحراف المعياري على التوالي داخل نافذة متحركة (w=10).

3. تقدير توقيع الجهاز

حساب التيار المُفعّل/المُلغى:

Δi(k) = iₐ(k) - iᵦ

حيث iₐ(k) هو متجه التيار بعد الحدث، و iᵦ هو التيار في الدورة السابقة للحدث. يتم اختيار دورة واحدة قبل الحدث و 18 دورة بعد الحدث للحساب، ثم استخراج الدورة الوسيطة للحصول على تقدير توقيع الجهاز:

iₑₛₜ = median{Δi(k)}

4. استخراج ميزات فورييه

استخدام تحويل فورييه السريع المنفصل (DFFT) لمعالجة توقيع التيار المقدّر، واستخراج 8 ميزات:

{a₁, cosφ₁, cosφ₂, cosφ₃, cosφ₄, cosφ₅, cosφ₇, cosφ₉}

حيث a₁ هو سعة التوافقية الأساسية، و cosφᵢ هو جيب التمام لمرحلة التوافقية i.

5. مصنف XGBoost

استخدام نموذج التعزيز المتدرج لتصنيف الجهاز، مع إعدادات المعاملات الفائقة:

150 مقدّر
أقصى عمق 8
معدل التعلم 0.046
معاملات التنظيم α=10

6. تحليل SHAP اللاحق

استخدام شرح إضافات Shapley (SHapley Additive exPlanations) لقياس مساهمة كل ميزة في تنبؤ النموذج، مما يوفر شرح القرار.

نقاط الابتكار التقني

التحويل الثابت بالتردد: حل مشكلة تقلبات تردد الشبكة الكهربائية، وتبسيط العمليات الحسابية اللاحقة
تقدير التوقيع المحسّن: اختيار تكوين دورة واحدة قبل و 18 دورة بعد، مع موازنة الدقة والكفاءة الحسابية
تصميم ميزات قابلة للتفسير: استخدام تحويل جيب التمام لمعالجة ميزات المرحلة، مما يعزز القابلية للتفسير
مجموعة ميزات منخفضة الارتباط: 8 ميزات مختارة بعناية ذات ارتباط ضعيف، مما يحسن القابلية للتفسير

إعداد التجربة

مجموعة البيانات

مجموعة بيانات PLAID: تحتوي على 575 قياس جهد وتيار عالي التردد، معدل أخذ العينات 30 كيلوهرتز، تغطي 13 نوع جهاز و 11 علامة تجارية مختلفة على الأقل.

مجموعة التدريب: 164,510 توقيع تيار لدورة واحدة
مجموعة الاختبار: 2,347 توقيع تيار مُفعّل/مُلغى

مقاييس التقييم

الدقة (Accuracy)
الدقة الكلية (Macro Precision)
الاستدعاء الكلي (Macro Recall)
درجة F1 الكلية (Macro F1)

الطرق المقارنة

شجرة القرار (Decision Tree)
الانحدار اللوجستي (Logistic Regression)

تفاصيل التنفيذ

استخدام البحث العشوائي لتحسين معاملات XGBoost الفائقة
عتبة كشف الأحداث Z=30
حجم النافذة المتحركة w=10
عدد العينات لكل دورة T=500

نتائج التجربة

النتائج الرئيسية

النموذج	الدقة	الدقة	الاستدعاء	درجة F1
XGBoost	90%	92%	92%	91%
شجرة القرار	84%	85%	86%	84%
الانحدار اللوجستي	80%	80%	80%	80%

يتفوق نموذج XGBoost بشكل كبير على الطرق الأخرى في جميع المقاييس، محققاً دقة تصنيف بنسبة 90%.

تجارب الاستبعاد

تأثير عدد الدورات بعد الحدث: تُظهر التجارب أن الدقة تصل إلى أقصى قيمة بعد اختيار 18 دورة، والمزيد من الدورات لا يحسن الأداء بشكل كبير.

تحليل الحالات

تحليل مصفوفة الالتباس: يؤدي النموذج بشكل جيد لمعظم الأجهزة، لكن المكاوي والمصابيح تميل إلى الالتباس، لأن كلاهما أحمال مقاومة واستهلاك التيار بنفس الحجم تقريباً. قد يتم الخلط بين أجهزة تكييف الهواء والثلاجات أو المراوح، اعتماداً على وضع التشغيل.

مثال شرح SHAP: لتصنيف مكيف الهواء، تشير قيم جيب التمام المنخفضة للتوافقيات 1 و 3 و 5 و 9 إلى أن التوقيع من غير المحتمل أن يتوافق مع مكيف الهواء، بينما تشير قيمة cosφ₇ المنخفضة إلى التوافق مع مكيف الهواء.

نتائج التجربة

ارتباط الميزات: تتمتع الميزات الثماني المختارة بارتباط ضعيف، مما يعزز القابلية للتفسير
الكفاءة الحسابية: التعقيد الكلي هو O(TNₐ log TNₐ)، مناسب للتطبيقات في الوقت الفعلي
أداء التأخير: التأخير هو 19/f₀ + τ، حوالي 380 ميلي ثانية لأنظمة 50 هرتز، و 320 ميلي ثانية لأنظمة 60 هرتز

الأعمال ذات الصلة

تطور NILM

تم اقتراح مفهوم NILM المدفوع بالأحداث لأول مرة من قبل Hart، من خلال كشف التغييرات الكبيرة في القوة النشطة والقوة التفاعلية لتحديد الأجهزة.

الحالة الحالية لبحث NILM القابل للتفسير

Murray وآخرون: اقترحوا طريقة إخفاء تفعيل الجهاز، لكنها مقتصرة على جهاز واحد
تفسير الشبكات العصبية الالتفافية: استخدام حساسية الإخفاء وخرائط التفعيل المشابهة للتدرج، لكن تصور الخريطة الحرارية يشكل تحدياً للمستخدمين غير المتخصصين
التعلم العميق من نوع الانحدار: تطبيق تقنيات تفسير متقدمة لكن يتطلب معايير موحدة وحلول قابلة للتوسع

مزايا هذه الورقة

بالمقارنة مع الأعمال الموجودة، توفر هذه الورقة لأول مرة إطار عمل كامل قابل للتفسير لبيانات عالية التردد، مع كفاءة حسابية أعلى وأداء في الوقت الفعلي.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

اقتراح أول إطار عمل NILM قابل للتفسير في الوقت الفعلي لبيانات عالية التردد
تحقيق دقة تصنيف جهاز بنسبة 90%، مع الحفاظ على متطلبات حسابية منخفضة
توفير شرح واضح للقرار من خلال تحليل SHAP
التحقق من إمكانية تطبيق الإطار في الوقت الفعلي على أجهزة الحافة

القيود

قيود مجموعة البيانات: تم التحقق فقط على مجموعة بيانات PLAID، وتحتاج قابلية التعميم إلى مزيد من التحقق
قيود نوع الجهاز: القدرة على التمييز بين الأجهزة ذات الخصائص المتشابهة (مثل الأحمال المقاومة) محدودة
التكيف البيئي: تحتاج الثوابت في بيئات الضوضاء المعقدة أو عندما تتغير حالات أجهزة متعددة في نفس الوقت إلى مزيد من التحقق

الاتجاهات المستقبلية

التعميم عبر مجموعات البيانات: التحقق من قابلية تعميم الإطار على مجموعات بيانات أخرى
اختبار النشر الفعلي: الاختبار في بيئات شقق حقيقية باستخدام أجهزة استشعار طاقة عالية الدقة في الوقت الفعلي
تحسين الخوارزمية: تحسين الخوارزمية بشكل إضافي للتعامل مع سيناريوهات تغيير الأحمال الأكثر تعقيداً

التقييم المتعمق

المزايا

ابتكار قوي: أول إطار عمل شامل قابل للتفسير لـ NILM عالي التردد
قيمة عملية عالية: تأخير منخفض وتعقيد حسابي منخفض، مناسب لنشر أجهزة الحافة
أساس نظري متين: كل مرحلة لها أساس رياضي واضح، مما يعزز الشفافية
مساهمة مفتوحة المصدر: توفير كود مفتوح المصدر، مما يعزز إعادة الإنتاج والتطوير
هندسة ميزات ممتازة: 8 ميزات مصممة بعناية توازن بين الأداء والقابلية للتفسير

أوجه القصور

قيود التقييم: التقييم على مجموعة بيانات واحدة فقط، يفتقد التحقق عبر المجالات
مقارنة غير كافية: نقص المقارنات التفصيلية مع طرق NILM المتقدمة الأخرى
تحليل نظري غير كافٍ: نقص تحليل حدود الأداء النظرية للطريقة
اختبار الثوابت غير كافٍ: اختبار الثوابت في بيئات الضوضاء والحالات الشاذة غير كافٍ

التأثير

القيمة الأكاديمية: فتح اتجاه جديد لبحث NILM القابل للتفسير، خاصة معالجة البيانات عالية التردد
القيمة العملية: الخصائص الفعلية والتعقيد المنخفض للإطار توفر آفاق تطبيق صناعي جيدة
القابلية للاستنساخ: الكود مفتوح المصدر والتفاصيل التنفيذية الشاملة تضمن قابلية استنساخ جيدة

السيناريوهات المطبقة

أنظمة المنازل الذكية: مراقبة استهلاك الطاقة في الوقت الفعلي والاستشعار بحالة الجهاز
إنترنت الأشياء الصناعي: مراقبة حالة تشغيل الجهاز وتحسين كفاءة الطاقة
تطبيقات الحوسبة الطرفية: مراقبة تحليل الأحمال في الوقت الفعلي في بيئات الموارد المحدودة
أنظمة إدارة الطاقة: إدارة استهلاك الطاقة الدقيقة على مستوى المباني أو المجمعات

المراجع

تستشهد الورقة بـ 20 مرجعاً مهماً، تغطي النظرية الأساسية لـ NILM وطرق التعلم الآلي وتقنيات الذكاء الاصطناعي القابل للتفسير ومجموعات البيانات ذات الصلة، مما يوفر أساساً نظرياً متيناً للبحث.

التقييم الشامل: هذه ورقة عالية الجودة تقدم مساهمات مهمة في مجال NILM القابل للتفسير. تصميم الإطار معقول، والتحقق التجريبي شامل، وله قيمة عملية وأهمية أكاديمية جيدة. يُنصح بتعزيز التحقق عبر مجموعات البيانات والمقارنة مع الطرق المتقدمة في الأعمال المستقبلية.