Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data
Gerasimov, Kamyshev, Hoosh et al.
Non-Intrusive Load Monitoring (NILM) is an advanced, and cost-effective technique for monitoring appliance-level energy consumption. However, its adaptability is hindered by the lack of transparency and explainability. To address this challenge, this paper presents an explainable, real-time, event-based NILM framework specifically designed for high-frequency datasets. The proposed framework ensures transparency at every stage by integrating a z-score-based event detector, appliance signature estimation, Fourier-based feature extraction, an XG-Boost classifier, and post hoc SHAP analysis. The SHAP analysis further quantifies the contribution of individual features, such as cosine of specific harmonic phases, to appliance classification. The framework is trained and evaluated on the PLAID dataset, and achieved a classification accuracy of 90% while maintaining low computational requirements and a latency of less than one second.
academic
Vers un NILM Explicable : Cadre NILM Basé sur les Événements en Temps Réel pour les Données Haute Fréquence
La surveillance non-intrusive des charges (NILM) est une technologie avancée et économique pour la surveillance de la consommation énergétique au niveau des appareils électroménagers. Cependant, son adaptabilité est limitée par le manque de transparence et d'explicabilité. Pour relever ce défi, cet article propose un cadre NILM explicable, en temps réel et basé sur les événements, spécialement conçu pour les ensembles de données haute fréquence. Le cadre assure la transparence à chaque étape en intégrant un détecteur d'événements basé sur le z-score, l'estimation de signatures d'appareils, l'extraction de caractéristiques basée sur Fourier, un classificateur XGBoost et une analyse SHAP post-hoc. L'analyse SHAP quantifie en outre la contribution de caractéristiques individuelles (telles que les valeurs cosinus de la phase harmonique spécifique) à la classification des appareils. Le cadre a été entraîné et évalué sur l'ensemble de données PLAID, réalisant une précision de classification de 90% tout en maintenant des exigences de calcul faibles et une latence inférieure à 1 seconde.
Avec la croissance continue de la consommation énergétique, la surveillance des charges devient cruciale. Dans l'Union européenne, les bâtiments représentent environ 41% de la consommation d'électricité. La surveillance intrusive traditionnelle des charges (ILM) nécessite l'installation de capteurs sur chaque appareil, offrant une précision élevée mais à un coût élevé, avec une installation difficile et inadaptée aux applications à grande échelle. Le NILM, en tant qu'alternative, surveille la consommation énergétique totale en un seul point (généralement le compteur principal) et utilise des algorithmes de décomposition pour estimer la consommation énergétique de chaque appareil.
Manque d'explicabilité: Les méthodes NILM existantes, en particulier les modèles d'apprentissage profond, présentent une nature de « boîte noire » avec un manque de transparence dans le processus décisionnel
Complexité de calcul élevée: Les méthodes non basées sur les événements nécessitent plus de ressources de calcul et de grands ensembles de données annotées
Insuffisance du temps réel: Les méthodes existantes ont du mal à répondre aux exigences d'applications en temps réel sur les appareils périphériques
Capacité limitée de traitement des données haute fréquence: La recherche NILM explicable existante se concentre principalement sur les données basse fréquence (1 Hz)
Cet article vise à construire un cadre NILM explicable de bout en bout, particulièrement pour les données haute fréquence (plage kHz), réalisant une décomposition en temps réel avec une latence minimale de 320/380 millisecondes (pour les systèmes électriques 60/50 Hz), afin d'établir la confiance dans les systèmes NILM et de promouvoir leur adoption dans les applications pratiques.
Premier cadre NILM explicable en temps réel de bout en bout pour données haute fréquence: Propose un cadre complet explicable spécialement conçu pour les ensembles de données haute fréquence
Applicabilité aux appareils périphériques en temps réel: La méthode est applicable aux applications en temps réel sur les appareils périphériques, avec une latence de 19/f₀ + τ secondes (f₀ étant la fréquence fondamentale, τ le temps d'exécution)
Sélection de caractéristiques optimisée: Sélectionne un petit ensemble de caractéristiques de signatures d'appareils minimalement corrélées et explicables, réalisant une précision de classification de 90% sur l'ensemble de données réel
Implémentation open-source: Publie le code source du cadre sur GitHub, promouvant la reproduction de la recherche et les applications
Entrée: Signaux de tension et courant haute fréquence (fréquence d'échantillonnage 30 kHz)
Sortie: Détection et classification des événements d'activation/désactivation des appareils, ainsi que l'explication des décisions
Contraintes: Exigences de traitement en temps réel, faible complexité de calcul, haute explicabilité
où iₐ(k) est le vecteur de courant après l'événement, iᵦ est le courant d'une période avant l'événement. Sélectionne 1 période avant l'événement et 18 périodes après pour le calcul, puis extrait la période médiane pour obtenir l'estimation de signature d'appareil:
Utilise SHapley Additive exPlanations pour quantifier la contribution de chaque caractéristique à la prédiction du modèle, fournissant une explication des décisions.
Transformation invariante en fréquence: Résout le problème des fluctuations de fréquence du réseau électrique, simplifiant les opérations mathématiques ultérieures
Estimation de signature optimisée: La configuration d'1 période antérieure et 18 périodes postérieures équilibre la précision et l'efficacité de calcul
Conception de caractéristiques explicables: Utilise la transformation cosinus pour traiter les caractéristiques de phase, améliorant l'explicabilité
Ensemble de caractéristiques faiblement corrélées: Les 8 caractéristiques soigneusement sélectionnées présentent une faible corrélation, améliorant l'explicabilité
Ensemble de données PLAID: Contient 575 mesures de tension-courant haute fréquence, fréquence d'échantillonnage 30 kHz, couvrant 13 types d'appareils et au moins 11 marques différentes.
Ensemble d'entraînement: 164 510 signatures de courant d'une seule période
Ensemble de test: 2 347 signatures de courant d'activation/désactivation
Impact du nombre de périodes post-événement: Les expériences montrent que la précision atteint sa valeur maximale avec 18 périodes post-événement, et davantage de périodes n'améliorent pas significativement les performances.
Analyse de la matrice de confusion: Le modèle fonctionne bien pour la plupart des appareils, mais les fers à repasser et les ampoules sont facilement confondus, car les deux sont des charges résistives avec des consommations de courant d'ordre similaire. Les climatiseurs peuvent être confondus avec les réfrigérateurs ou les ventilateurs, selon leur mode de fonctionnement.
Exemple d'explication SHAP: Pour la classification des climatiseurs, les faibles valeurs cosinus de phase des harmoniques 1, 3, 5, 9 indiquent que la signature est peu susceptible de correspondre à un climatiseur, tandis qu'une faible valeur cosφ₇ indique qu'elle correspond à un climatiseur.
Le concept de NILM basé sur les événements a été proposé pour la première fois par Hart, identifiant les appareils en détectant les changements significatifs de puissance active et réactive.
Murray et al.: Propose une méthode d'activation d'appareil masqué, mais limitée à un seul appareil
Interprétation des réseaux de neurones convolutifs: Utilise la sensibilité d'occlusion et les cartes d'activation pondérées par gradient, mais la visualisation thermique pose des défis pour les utilisateurs non experts
Apprentissage profond de type régression: Applique des techniques d'interprétation avancées mais nécessite des références normalisées et des solutions évolutives
Par rapport aux travaux existants, cet article fournit pour la première fois un cadre explicable complet pour les données haute fréquence, avec une efficacité de calcul supérieure et des performances en temps réel.
Limitations de l'ensemble de données: Validé uniquement sur l'ensemble de données PLAID, la capacité de généralisation nécessite une vérification supplémentaire
Restriction des types d'appareils: Capacité limitée à distinguer les appareils aux caractéristiques similaires (comme les charges résistives)
Adaptabilité environnementale: La robustesse dans les environnements bruyants complexes ou lors de changements d'état simultanés de plusieurs appareils nécessite une vérification supplémentaire
Innovation forte: Premier cadre complet explicable pour le NILM haute fréquence
Valeur pratique élevée: Faible latence, faible complexité de calcul, adapté au déploiement sur appareils périphériques
Fondations théoriques solides: Chaque étape dispose d'une base mathématique claire, renforçant la transparence
Contribution open-source: Fournit du code open-source, promouvant la reproduction et le développement de la recherche
Ingénierie des caractéristiques excellente: Les 8 caractéristiques soigneusement conçues garantissent la performance tout en améliorant l'explicabilité
L'article cite 20 références importantes, couvrant la théorie fondamentale du NILM, les méthodes d'apprentissage automatique, les techniques d'IA explicable et les ensembles de données connexes, fournissant une base théorique solide pour la recherche.
Évaluation Globale: Cet article est un document technique de haute qualité qui apporte une contribution importante au domaine du NILM explicable. La conception du cadre est raisonnable, la vérification expérimentale est suffisante, et il possède une bonne valeur pratique et une signification académique. Il est recommandé de renforcer la validation inter-ensembles de données et l'analyse comparative avec les méthodes avancées dans les travaux futurs.