2025-11-14T09:34:10.285532

Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data

Gerasimov, Kamyshev, Hoosh et al.
Non-Intrusive Load Monitoring (NILM) is an advanced, and cost-effective technique for monitoring appliance-level energy consumption. However, its adaptability is hindered by the lack of transparency and explainability. To address this challenge, this paper presents an explainable, real-time, event-based NILM framework specifically designed for high-frequency datasets. The proposed framework ensures transparency at every stage by integrating a z-score-based event detector, appliance signature estimation, Fourier-based feature extraction, an XG-Boost classifier, and post hoc SHAP analysis. The SHAP analysis further quantifies the contribution of individual features, such as cosine of specific harmonic phases, to appliance classification. The framework is trained and evaluated on the PLAID dataset, and achieved a classification accuracy of 90% while maintaining low computational requirements and a latency of less than one second.
academic

Verso NILM Esplicabile: Framework NILM Basato su Eventi in Tempo Reale per Dati ad Alta Frequenza

Informazioni Fondamentali

  • ID Articolo: 2501.16841
  • Titolo: Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data
  • Autori: Grigorii Gerasimov, Ilia Kamyshev, Sahar Moghimian Hoosh, Elena Gryazina, Henni Ouerdane
  • Istituzioni: Skolkovo Institute of Science and Technology, Mosca, Russia; Monisensa Development LLC., Mosca, Russia
  • Classificazione: eess.SY (Sistemi e Controllo), cs.SY (Sistemi e Controllo)
  • Data di Pubblicazione: 28 gennaio 2025
  • Link Articolo: https://arxiv.org/abs/2501.16841

Riassunto

Il monitoraggio non invasivo dei carichi (NILM) è una tecnologia avanzata ed economicamente efficiente per il monitoraggio dei consumi energetici a livello di apparecchiature domestiche. Tuttavia, la sua adattabilità è limitata dalla mancanza di trasparenza e esplicabilità. Per affrontare questa sfida, il presente articolo propone un framework NILM esplicabile, in tempo reale e basato su eventi, specificamente progettato per dataset ad alta frequenza. Il framework garantisce trasparenza in ogni fase attraverso l'integrazione di un rilevatore di eventi basato su z-score, stima della firma del dispositivo, estrazione di caratteristiche basata su Fourier, classificatore XGBoost e analisi SHAP post-hoc. L'analisi SHAP quantifica ulteriormente il contributo di singole caratteristiche (come i valori del coseno della fase di armoniche specifiche) alla classificazione dei dispositivi. Il framework è stato addestrato e valutato sul dataset PLAID, raggiungendo un'accuratezza di classificazione del 90% mantenendo bassi requisiti computazionali e una latenza inferiore a 1 secondo.

Contesto di Ricerca e Motivazione

Definizione del Problema

Con la continua crescita dei consumi energetici, il monitoraggio dei carichi diventa cruciale. Nell'Unione Europea, gli edifici rappresentano circa il 41% del consumo di energia elettrica. Il tradizionale monitoraggio invasivo dei carichi (ILM) richiede l'installazione di sensori su ogni dispositivo, offrendo elevata accuratezza ma risultando costoso, difficile da installare e inadatto per applicazioni su larga scala. Il NILM rappresenta un'alternativa, monitorando il consumo energetico totale in un singolo punto (tipicamente il contatore principale) e utilizzando algoritmi di decomposizione per stimare i consumi dei singoli dispositivi.

Limitazioni dei Metodi Esistenti

  1. Mancanza di Esplicabilità: I metodi NILM esistenti, in particolare i modelli di deep learning, presentano una natura "black-box" con scarsa trasparenza nel processo decisionale
  2. Elevata Complessità Computazionale: I metodi non guidati da eventi richiedono maggiori risorse computazionali e dataset annotati di grandi dimensioni
  3. Insufficiente Capacità in Tempo Reale: I metodi esistenti faticano a soddisfare i requisiti di applicazioni in tempo reale su dispositivi edge
  4. Capacità Limitata di Elaborazione Dati ad Alta Frequenza: La ricerca NILM esplicabile esistente si concentra principalmente su dati a bassa frequenza (1Hz)

Motivazione della Ricerca

Il presente lavoro mira a costruire un framework NILM esplicabile end-to-end, specificamente per dati ad alta frequenza (intervallo kHz), realizzando decomposizione in tempo reale con latenza minima di 320/380 millisecondi (per sistemi di potenza a 60/50Hz), al fine di stabilire fiducia nei sistemi NILM e promuoverne l'adozione nelle applicazioni pratiche.

Contributi Principali

  1. Primo Framework NILM Esplicabile End-to-End in Tempo Reale per Dati ad Alta Frequenza: Propone un framework completo e esplicabile specificamente progettato per dataset ad alta frequenza
  2. Applicabilità su Dispositivi Edge in Tempo Reale: Il metodo è applicabile per applicazioni in tempo reale su dispositivi edge, con latenza di 19/f₀ + τ secondi (f₀ è la frequenza fondamentale, τ è il tempo di esecuzione)
  3. Selezione Ottimizzata delle Caratteristiche: Seleziona un piccolo insieme di caratteristiche di firma del dispositivo minimamente correlate ed esplicabili, raggiungendo un'accuratezza di classificazione del 90% su dataset reali
  4. Implementazione Open Source: Rende pubblico il codice sorgente del framework su GitHub, promuovendo la riproducibilità della ricerca e l'applicazione pratica

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Segnali di tensione e corrente ad alta frequenza (frequenza di campionamento 30kHz) Output: Rilevamento e classificazione degli eventi di accensione/spegnimento dei dispositivi, con spiegazione delle decisioni Vincoli: Requisiti di elaborazione in tempo reale, bassa complessità computazionale, elevata esplicabilità

Architettura del Modello

1. Elaborazione Tensione-Corrente in Tempo Reale

Utilizza la trasformata di segnale periodico invariante in frequenza (FIT-PS) per elaborare i segnali di tensione v e corrente i:

ṽ, ĩ = FITPS(v, i)

L'algoritmo rileva i punti di attraversamento dello zero del segnale di tensione, ricampionando i vettori di tensione e corrente a una lunghezza comune T=500.

2. Rilevatore di Eventi z-score

Calcola la potenza attiva:

p(k) = (1/T) × Σ(ṽₜ(k) × ĩₜ(k))

Rileva gli eventi quando lo z-score supera una soglia predeterminata Z=30:

z(k) = |p(k) - μw| / σw, z(k) > Z

dove μw e σw sono rispettivamente la media e la deviazione standard all'interno di una finestra mobile (w=10).

3. Stima della Firma del Dispositivo

Calcola la corrente di attivazione/disattivazione:

Δi(k) = iₐ(k) - iᵦ

dove iₐ(k) è il vettore di corrente dopo l'evento, iᵦ è la corrente del periodo precedente l'evento. Seleziona 1 periodo prima dell'evento e 18 periodi dopo l'evento per il calcolo, quindi estrae il periodo mediano per ottenere la stima della firma del dispositivo:

iₑₛₜ = median{Δi(k)}

4. Estrazione di Caratteristiche Fourier

Utilizza la trasformata veloce di Fourier discreta (DFFT) per elaborare la firma di corrente stimata, estraendo 8 caratteristiche:

{a₁, cosφ₁, cosφ₂, cosφ₃, cosφ₄, cosφ₅, cosφ₇, cosφ₉}

dove a₁ è l'ampiezza della fondamentale, cosφᵢ è il valore del coseno della fase della i-esima armonica.

5. Classificatore XGBoost

Utilizza un modello di gradient boosting per la classificazione dei dispositivi, con impostazioni degli iperparametri:

  • 150 stimatori
  • Profondità massima 8
  • Tasso di apprendimento 0.046
  • Coefficienti di regolarizzazione α=10

6. Analisi SHAP Post-Hoc

Utilizza SHapley Additive exPlanations per quantificare il contributo di ogni caratteristica alla previsione del modello, fornendo spiegazioni delle decisioni.

Punti di Innovazione Tecnica

  1. Trasformata Invariante in Frequenza: Risolve il problema delle fluttuazioni della frequenza di rete, semplificando le operazioni matematiche successive
  2. Stima della Firma Ottimizzata: La configurazione di 1 periodo precedente e 18 periodi successivi bilancia accuratezza ed efficienza computazionale
  3. Progettazione di Caratteristiche Esplicabili: Utilizza la trasformazione del coseno per elaborare le caratteristiche di fase, migliorando l'esplicabilità
  4. Set di Caratteristiche a Bassa Correlazione: Le 8 caratteristiche attentamente selezionate presentano debole correlazione, migliorando l'esplicabilità

Configurazione Sperimentale

Dataset

Dataset PLAID: Contiene 575 misurazioni di tensione e corrente ad alta frequenza, frequenza di campionamento 30kHz, coprendo 13 tipi di dispositivi e almeno 11 marchi diversi.

  • Set di Addestramento: 164.510 firme di corrente a singolo ciclo
  • Set di Test: 2.347 firme di corrente di attivazione/disattivazione

Metriche di Valutazione

  • Accuratezza (Accuracy)
  • Precisione Macro-Media (Macro Precision)
  • Recall Macro-Media (Macro Recall)
  • Punteggio F1 Macro-Media (Macro F1)

Metodi di Confronto

  • Albero Decisionale (Decision Tree)
  • Regressione Logistica (Logistic Regression)

Dettagli di Implementazione

  • Utilizzo di ricerca casuale per l'ottimizzazione degli iperparametri di XGBoost
  • Soglia di rilevamento degli eventi Z=30
  • Dimensione della finestra mobile w=10
  • Numero di campioni per ciclo T=500

Risultati Sperimentali

Risultati Principali

ModelloAccuratezzaPrecisioneRecallPunteggio F1
XGBoost90%92%92%91%
Albero Decisionale84%85%86%84%
Regressione Logistica80%80%80%80%

Il modello XGBoost supera significativamente gli altri metodi in tutti gli indicatori, raggiungendo un'accuratezza di classificazione del 90%.

Esperimenti di Ablazione

Impatto del Numero di Periodi Post-Evento: Gli esperimenti dimostrano che l'accuratezza raggiunge il valore massimo con 18 periodi successivi, e periodi aggiuntivi non migliorano significativamente le prestazioni.

Analisi di Casi Studio

Analisi della Matrice di Confusione: Il modello presenta buone prestazioni per la maggior parte dei dispositivi, ma il ferro da stiro e le lampadine sono facilmente confusi, poiché entrambi sono carichi resistivi con consumi di corrente di ordine di grandezza simile. L'aria condizionata potrebbe essere confusa con il frigorifero o il ventilatore, a seconda della modalità di funzionamento.

Esempio di Spiegazione SHAP: Per la classificazione dell'aria condizionata, bassi valori del coseno della fase delle armoniche 1, 3, 5, 9 indicano che la firma è meno probabile che corrisponda all'aria condizionata, mentre un basso valore di cosφ₇ indica che corrisponde all'aria condizionata.

Risultati Sperimentali

  1. Correlazione delle Caratteristiche: Le 8 caratteristiche selezionate presentano debole correlazione, migliorando l'esplicabilità
  2. Efficienza Computazionale: La complessità complessiva è O(TNₐ log TNₐ), adatta per applicazioni in tempo reale
  3. Prestazioni di Latenza: La latenza è 19/f₀ + τ, circa 380ms per sistemi a 50Hz e circa 320ms per sistemi a 60Hz

Lavori Correlati

Evoluzione del NILM

Il concetto di NILM guidato da eventi è stato proposto per la prima volta da Hart, identificando i dispositivi attraverso il rilevamento di variazioni significative nella potenza attiva e reattiva.

Stato Attuale della Ricerca su NILM Esplicabile

  1. Murray et al.: Propone il metodo di mascheramento dell'attivazione dei dispositivi, ma limitato a singoli dispositivi
  2. Interpretazione di Reti Neurali Convoluzionali: Utilizza sensibilità all'occlusione e mappe di attivazione simili ai gradienti, ma la visualizzazione termica presenta sfide per gli utenti non esperti
  3. Deep Learning di Tipo Regressivo: Applica tecniche di interpretazione avanzate ma richiede benchmark standardizzati e soluzioni scalabili

Vantaggi del Presente Lavoro

Rispetto ai lavori esistenti, il presente articolo fornisce per la prima volta un framework esplicabile completo per dati ad alta frequenza, con maggiore efficienza computazionale e prestazioni in tempo reale.

Conclusioni e Discussione

Conclusioni Principali

  1. Propone il primo framework NILM esplicabile in tempo reale per dati ad alta frequenza
  2. Raggiunge un'accuratezza di classificazione dei dispositivi del 90% mantenendo bassi requisiti computazionali
  3. Fornisce chiare spiegazioni delle decisioni attraverso l'analisi SHAP
  4. Verifica il potenziale di applicazione in tempo reale del framework su dispositivi edge

Limitazioni

  1. Limitazioni del Dataset: Validato solo sul dataset PLAID, la capacità di generalizzazione richiede ulteriore verifica
  2. Restrizioni sui Tipi di Dispositivi: Capacità limitata di distinguere tra dispositivi con caratteristiche simili (come carichi resistivi)
  3. Adattabilità Ambientale: La robustezza in ambienti con rumore complesso o cambiamenti di stato simultanei di più dispositivi richiede ulteriore verifica

Direzioni Future

  1. Generalizzazione Tra Dataset: Verificare la capacità di generalizzazione del framework su altri dataset
  2. Test di Distribuzione Pratica: Testare con sensori energetici in tempo reale ad alta precisione in ambienti di appartamenti reali
  3. Ottimizzazione dell'Algoritmo: Ottimizzare ulteriormente l'algoritmo per gestire scenari di variazione di carico più complessi

Valutazione Approfondita

Punti di Forza

  1. Forte Innovatività: Primo framework completo e esplicabile per NILM ad alta frequenza
  2. Elevato Valore Pratico: Bassa latenza e bassa complessità computazionale, adatto per la distribuzione su dispositivi edge
  3. Solide Basi Teoriche: Ogni fase presenta basi matematiche chiare, migliorando la trasparenza
  4. Contributo Open Source: Fornisce codice open source, promuovendo la riproducibilità della ricerca e lo sviluppo
  5. Eccellente Ingegneria delle Caratteristiche: Le 8 caratteristiche attentamente progettate garantiscono sia le prestazioni che l'esplicabilità

Insufficienze

  1. Limitazioni nella Valutazione: Valutazione solo su un singolo dataset, mancanza di validazione cross-domain
  2. Confronto Insufficiente: Mancanza di confronti dettagliati con altri metodi NILM avanzati
  3. Analisi Teorica Insufficiente: Mancanza di analisi dei limiti di prestazione teorici del metodo
  4. Verifica della Robustezza: Test insufficienti della robustezza in ambienti rumorosi e situazioni anomale

Impatto

  1. Valore Accademico: Apre nuove direzioni nella ricerca NILM esplicabile, in particolare nell'elaborazione di dati ad alta frequenza
  2. Valore Pratico: La natura in tempo reale e la bassa complessità del framework lo rendono promettente per applicazioni industriali
  3. Riproducibilità: Il codice open source e i dettagli di implementazione dettagliati garantiscono buona riproducibilità

Scenari di Applicazione

  1. Sistemi di Casa Intelligente: Monitoraggio energetico in tempo reale e percezione dello stato dei dispositivi
  2. Internet Industriale delle Cose: Monitoraggio dello stato operativo dei dispositivi e ottimizzazione dell'efficienza energetica
  3. Applicazioni di Edge Computing: Decomposizione di carichi in tempo reale in ambienti con risorse limitate
  4. Sistemi di Gestione Energetica: Gestione energetica granulare a livello di edificio o campus

Bibliografia

L'articolo cita 20 importanti riferimenti bibliografici, coprendo la teoria fondamentale del NILM, metodi di machine learning, tecniche di IA esplicabile e dataset correlati, fornendo una solida base teorica per la ricerca.


Valutazione Complessiva: Si tratta di un articolo tecnico di alta qualità che fornisce importanti contributi nel campo del NILM esplicabile. Il design del framework è razionale, la verifica sperimentale è completa e presenta buon valore pratico e significato accademico. Si consiglia di rafforzare la validazione cross-dataset e l'analisi comparativa con metodi avanzati nei lavori futuri.