2025-11-14T09:34:10.285532

Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data

Gerasimov, Kamyshev, Hoosh et al.
Non-Intrusive Load Monitoring (NILM) is an advanced, and cost-effective technique for monitoring appliance-level energy consumption. However, its adaptability is hindered by the lack of transparency and explainability. To address this challenge, this paper presents an explainable, real-time, event-based NILM framework specifically designed for high-frequency datasets. The proposed framework ensures transparency at every stage by integrating a z-score-based event detector, appliance signature estimation, Fourier-based feature extraction, an XG-Boost classifier, and post hoc SHAP analysis. The SHAP analysis further quantifies the contribution of individual features, such as cosine of specific harmonic phases, to appliance classification. The framework is trained and evaluated on the PLAID dataset, and achieved a classification accuracy of 90% while maintaining low computational requirements and a latency of less than one second.
academic

Vers un NILM Explicable : Cadre NILM Basé sur les Événements en Temps Réel pour les Données Haute Fréquence

Informations Fondamentales

  • ID de l'article: 2501.16841
  • Titre: Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data
  • Auteurs: Grigorii Gerasimov, Ilia Kamyshev, Sahar Moghimian Hoosh, Elena Gryazina, Henni Ouerdane
  • Institutions: Institut Skolkovo de Science et Technologie, Moscou, Russie; Monisensa Development LLC., Moscou, Russie
  • Classification: eess.SY (Systèmes et Contrôle), cs.SY (Systèmes et Contrôle)
  • Date de publication: 28 janvier 2025
  • Lien de l'article: https://arxiv.org/abs/2501.16841

Résumé

La surveillance non-intrusive des charges (NILM) est une technologie avancée et économique pour la surveillance de la consommation énergétique au niveau des appareils électroménagers. Cependant, son adaptabilité est limitée par le manque de transparence et d'explicabilité. Pour relever ce défi, cet article propose un cadre NILM explicable, en temps réel et basé sur les événements, spécialement conçu pour les ensembles de données haute fréquence. Le cadre assure la transparence à chaque étape en intégrant un détecteur d'événements basé sur le z-score, l'estimation de signatures d'appareils, l'extraction de caractéristiques basée sur Fourier, un classificateur XGBoost et une analyse SHAP post-hoc. L'analyse SHAP quantifie en outre la contribution de caractéristiques individuelles (telles que les valeurs cosinus de la phase harmonique spécifique) à la classification des appareils. Le cadre a été entraîné et évalué sur l'ensemble de données PLAID, réalisant une précision de classification de 90% tout en maintenant des exigences de calcul faibles et une latence inférieure à 1 seconde.

Contexte de Recherche et Motivation

Définition du Problème

Avec la croissance continue de la consommation énergétique, la surveillance des charges devient cruciale. Dans l'Union européenne, les bâtiments représentent environ 41% de la consommation d'électricité. La surveillance intrusive traditionnelle des charges (ILM) nécessite l'installation de capteurs sur chaque appareil, offrant une précision élevée mais à un coût élevé, avec une installation difficile et inadaptée aux applications à grande échelle. Le NILM, en tant qu'alternative, surveille la consommation énergétique totale en un seul point (généralement le compteur principal) et utilise des algorithmes de décomposition pour estimer la consommation énergétique de chaque appareil.

Limitations des Méthodes Existantes

  1. Manque d'explicabilité: Les méthodes NILM existantes, en particulier les modèles d'apprentissage profond, présentent une nature de « boîte noire » avec un manque de transparence dans le processus décisionnel
  2. Complexité de calcul élevée: Les méthodes non basées sur les événements nécessitent plus de ressources de calcul et de grands ensembles de données annotées
  3. Insuffisance du temps réel: Les méthodes existantes ont du mal à répondre aux exigences d'applications en temps réel sur les appareils périphériques
  4. Capacité limitée de traitement des données haute fréquence: La recherche NILM explicable existante se concentre principalement sur les données basse fréquence (1 Hz)

Motivation de la Recherche

Cet article vise à construire un cadre NILM explicable de bout en bout, particulièrement pour les données haute fréquence (plage kHz), réalisant une décomposition en temps réel avec une latence minimale de 320/380 millisecondes (pour les systèmes électriques 60/50 Hz), afin d'établir la confiance dans les systèmes NILM et de promouvoir leur adoption dans les applications pratiques.

Contributions Principales

  1. Premier cadre NILM explicable en temps réel de bout en bout pour données haute fréquence: Propose un cadre complet explicable spécialement conçu pour les ensembles de données haute fréquence
  2. Applicabilité aux appareils périphériques en temps réel: La méthode est applicable aux applications en temps réel sur les appareils périphériques, avec une latence de 19/f₀ + τ secondes (f₀ étant la fréquence fondamentale, τ le temps d'exécution)
  3. Sélection de caractéristiques optimisée: Sélectionne un petit ensemble de caractéristiques de signatures d'appareils minimalement corrélées et explicables, réalisant une précision de classification de 90% sur l'ensemble de données réel
  4. Implémentation open-source: Publie le code source du cadre sur GitHub, promouvant la reproduction de la recherche et les applications

Détails de la Méthode

Définition de la Tâche

Entrée: Signaux de tension et courant haute fréquence (fréquence d'échantillonnage 30 kHz) Sortie: Détection et classification des événements d'activation/désactivation des appareils, ainsi que l'explication des décisions Contraintes: Exigences de traitement en temps réel, faible complexité de calcul, haute explicabilité

Architecture du Modèle

1. Traitement Tension-Courant en Temps Réel

Utilise la transformation de signaux périodiques invariante en fréquence (FIT-PS) pour traiter les signaux de tension v et courant i:

ṽ, ĩ = FITPS(v, i)

Cet algorithme détecte les passages par zéro du signal de tension et rééchantillonne les vecteurs de tension et courant à une longueur commune T=500.

2. Détecteur d'Événements z-score

Calcule la puissance active:

p(k) = (1/T) × Σ(ṽₜ(k) × ĩₜ(k))

Détecte les événements lorsque le z-score dépasse un seuil prédéfini Z=30:

z(k) = |p(k) - μw| / σw, z(k) > Z

où μw et σw sont respectivement la moyenne et l'écart-type dans une fenêtre glissante (w=10).

3. Estimation de Signature d'Appareil

Calcule le courant d'activation/désactivation:

Δi(k) = iₐ(k) - iᵦ

où iₐ(k) est le vecteur de courant après l'événement, iᵦ est le courant d'une période avant l'événement. Sélectionne 1 période avant l'événement et 18 périodes après pour le calcul, puis extrait la période médiane pour obtenir l'estimation de signature d'appareil:

iₑₛₜ = median{Δi(k)}

4. Extraction de Caractéristiques Fourier

Utilise la transformation de Fourier rapide discrète (DFFT) pour traiter la signature de courant estimée, extrayant 8 caractéristiques:

{a₁, cosφ₁, cosφ₂, cosφ₃, cosφ₄, cosφ₅, cosφ₇, cosφ₉}

où a₁ est l'amplitude fondamentale, cosφᵢ est la valeur cosinus de la phase de la i-ème harmonique.

5. Classificateur XGBoost

Utilise un modèle de gradient boosting pour la classification des appareils, avec les hyperparamètres:

  • 150 estimateurs
  • Profondeur maximale 8
  • Taux d'apprentissage 0.046
  • Coefficients de régularisation α=10

6. Analyse SHAP Post-hoc

Utilise SHapley Additive exPlanations pour quantifier la contribution de chaque caractéristique à la prédiction du modèle, fournissant une explication des décisions.

Points d'Innovation Technique

  1. Transformation invariante en fréquence: Résout le problème des fluctuations de fréquence du réseau électrique, simplifiant les opérations mathématiques ultérieures
  2. Estimation de signature optimisée: La configuration d'1 période antérieure et 18 périodes postérieures équilibre la précision et l'efficacité de calcul
  3. Conception de caractéristiques explicables: Utilise la transformation cosinus pour traiter les caractéristiques de phase, améliorant l'explicabilité
  4. Ensemble de caractéristiques faiblement corrélées: Les 8 caractéristiques soigneusement sélectionnées présentent une faible corrélation, améliorant l'explicabilité

Configuration Expérimentale

Ensemble de Données

Ensemble de données PLAID: Contient 575 mesures de tension-courant haute fréquence, fréquence d'échantillonnage 30 kHz, couvrant 13 types d'appareils et au moins 11 marques différentes.

  • Ensemble d'entraînement: 164 510 signatures de courant d'une seule période
  • Ensemble de test: 2 347 signatures de courant d'activation/désactivation

Métriques d'Évaluation

  • Précision (Accuracy)
  • Précision Macro-moyenne (Macro Precision)
  • Rappel Macro-moyen (Macro Recall)
  • Score F1 Macro-moyen (Macro F1)

Méthodes de Comparaison

  • Arbre de Décision (Decision Tree)
  • Régression Logistique (Logistic Regression)

Détails d'Implémentation

  • Utilise la recherche aléatoire pour optimiser les hyperparamètres XGBoost
  • Seuil de détection d'événement Z=30
  • Taille de fenêtre glissante w=10
  • Nombre d'échantillons par période T=500

Résultats Expérimentaux

Résultats Principaux

ModèlePrécisionPrécisionRappelScore F1
XGBoost90%92%92%91%
Arbre de Décision84%85%86%84%
Régression Logistique80%80%80%80%

Le modèle XGBoost surpasse significativement les autres méthodes sur tous les indicateurs, réalisant une précision de classification de 90%.

Études d'Ablation

Impact du nombre de périodes post-événement: Les expériences montrent que la précision atteint sa valeur maximale avec 18 périodes post-événement, et davantage de périodes n'améliorent pas significativement les performances.

Analyse de Cas

Analyse de la matrice de confusion: Le modèle fonctionne bien pour la plupart des appareils, mais les fers à repasser et les ampoules sont facilement confondus, car les deux sont des charges résistives avec des consommations de courant d'ordre similaire. Les climatiseurs peuvent être confondus avec les réfrigérateurs ou les ventilateurs, selon leur mode de fonctionnement.

Exemple d'explication SHAP: Pour la classification des climatiseurs, les faibles valeurs cosinus de phase des harmoniques 1, 3, 5, 9 indiquent que la signature est peu susceptible de correspondre à un climatiseur, tandis qu'une faible valeur cosφ₇ indique qu'elle correspond à un climatiseur.

Découvertes Expérimentales

  1. Corrélation des caractéristiques: Les 8 caractéristiques sélectionnées présentent une faible corrélation, améliorant l'explicabilité
  2. Efficacité de calcul: La complexité globale est O(TNₐ log TNₐ), adaptée aux applications en temps réel
  3. Performance de latence: La latence est 19/f₀ + τ, environ 380 ms pour les systèmes 50 Hz, 320 ms pour les systèmes 60 Hz

Travaux Connexes

Évolution du NILM

Le concept de NILM basé sur les événements a été proposé pour la première fois par Hart, identifiant les appareils en détectant les changements significatifs de puissance active et réactive.

État Actuel de la Recherche NILM Explicable

  1. Murray et al.: Propose une méthode d'activation d'appareil masqué, mais limitée à un seul appareil
  2. Interprétation des réseaux de neurones convolutifs: Utilise la sensibilité d'occlusion et les cartes d'activation pondérées par gradient, mais la visualisation thermique pose des défis pour les utilisateurs non experts
  3. Apprentissage profond de type régression: Applique des techniques d'interprétation avancées mais nécessite des références normalisées et des solutions évolutives

Avantages de cet Article

Par rapport aux travaux existants, cet article fournit pour la première fois un cadre explicable complet pour les données haute fréquence, avec une efficacité de calcul supérieure et des performances en temps réel.

Conclusion et Discussion

Conclusions Principales

  1. Propose le premier cadre NILM explicable en temps réel pour données haute fréquence
  2. Réalise une précision de classification d'appareils de 90% tout en maintenant des exigences de calcul faibles
  3. Fournit une explication claire des décisions par analyse SHAP
  4. Valide le potentiel d'application en temps réel du cadre sur les appareils périphériques

Limitations

  1. Limitations de l'ensemble de données: Validé uniquement sur l'ensemble de données PLAID, la capacité de généralisation nécessite une vérification supplémentaire
  2. Restriction des types d'appareils: Capacité limitée à distinguer les appareils aux caractéristiques similaires (comme les charges résistives)
  3. Adaptabilité environnementale: La robustesse dans les environnements bruyants complexes ou lors de changements d'état simultanés de plusieurs appareils nécessite une vérification supplémentaire

Directions Futures

  1. Généralisation inter-ensembles de données: Valider la capacité de généralisation du cadre sur d'autres ensembles de données
  2. Tests de déploiement réel: Tester dans des environnements d'appartements réels avec des capteurs d'énergie en temps réel haute précision
  3. Optimisation d'algorithme: Optimiser davantage l'algorithme pour gérer des scénarios de changement de charge plus complexes

Évaluation Approfondie

Points Forts

  1. Innovation forte: Premier cadre complet explicable pour le NILM haute fréquence
  2. Valeur pratique élevée: Faible latence, faible complexité de calcul, adapté au déploiement sur appareils périphériques
  3. Fondations théoriques solides: Chaque étape dispose d'une base mathématique claire, renforçant la transparence
  4. Contribution open-source: Fournit du code open-source, promouvant la reproduction et le développement de la recherche
  5. Ingénierie des caractéristiques excellente: Les 8 caractéristiques soigneusement conçues garantissent la performance tout en améliorant l'explicabilité

Insuffisances

  1. Limitations d'évaluation: Évalué uniquement sur un seul ensemble de données, manque de validation inter-domaines
  2. Comparaison insuffisante: Manque de comparaison détaillée avec d'autres méthodes NILM avancées
  3. Analyse théorique insuffisante: Manque d'analyse des limites théoriques de performance de la méthode
  4. Vérification de robustesse: Tests insuffisants de robustesse dans les environnements bruyants et les cas anormaux

Impact

  1. Valeur académique: Ouvre une nouvelle direction pour la recherche NILM explicable, particulièrement le traitement des données haute fréquence
  2. Valeur pratique: La nature en temps réel et la faible complexité du cadre offrent de bonnes perspectives d'application industrielle
  3. Reproductibilité: Le code open-source et les détails d'implémentation détaillés assurent une bonne reproductibilité

Scénarios Applicables

  1. Systèmes de maison intelligente: Surveillance énergétique en temps réel et perception de l'état des appareils
  2. Internet des Objets Industriel: Surveillance de l'état de fonctionnement des appareils et optimisation de l'efficacité énergétique
  3. Applications d'informatique périphérique: Décomposition de charge en temps réel dans les environnements aux ressources limitées
  4. Systèmes de gestion énergétique: Gestion énergétique affinée au niveau des bâtiments ou des zones

Références

L'article cite 20 références importantes, couvrant la théorie fondamentale du NILM, les méthodes d'apprentissage automatique, les techniques d'IA explicable et les ensembles de données connexes, fournissant une base théorique solide pour la recherche.


Évaluation Globale: Cet article est un document technique de haute qualité qui apporte une contribution importante au domaine du NILM explicable. La conception du cadre est raisonnable, la vérification expérimentale est suffisante, et il possède une bonne valeur pratique et une signification académique. Il est recommandé de renforcer la validation inter-ensembles de données et l'analyse comparative avec les méthodes avancées dans les travaux futurs.