Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data
Gerasimov, Kamyshev, Hoosh et al.
Non-Intrusive Load Monitoring (NILM) is an advanced, and cost-effective technique for monitoring appliance-level energy consumption. However, its adaptability is hindered by the lack of transparency and explainability. To address this challenge, this paper presents an explainable, real-time, event-based NILM framework specifically designed for high-frequency datasets. The proposed framework ensures transparency at every stage by integrating a z-score-based event detector, appliance signature estimation, Fourier-based feature extraction, an XG-Boost classifier, and post hoc SHAP analysis. The SHAP analysis further quantifies the contribution of individual features, such as cosine of specific harmonic phases, to appliance classification. The framework is trained and evaluated on the PLAID dataset, and achieved a classification accuracy of 90% while maintaining low computational requirements and a latency of less than one second.
academic
Verso NILM Esplicabile: Framework NILM Basato su Eventi in Tempo Reale per Dati ad Alta Frequenza
Il monitoraggio non invasivo dei carichi (NILM) è una tecnologia avanzata ed economicamente efficiente per il monitoraggio dei consumi energetici a livello di apparecchiature domestiche. Tuttavia, la sua adattabilità è limitata dalla mancanza di trasparenza e esplicabilità. Per affrontare questa sfida, il presente articolo propone un framework NILM esplicabile, in tempo reale e basato su eventi, specificamente progettato per dataset ad alta frequenza. Il framework garantisce trasparenza in ogni fase attraverso l'integrazione di un rilevatore di eventi basato su z-score, stima della firma del dispositivo, estrazione di caratteristiche basata su Fourier, classificatore XGBoost e analisi SHAP post-hoc. L'analisi SHAP quantifica ulteriormente il contributo di singole caratteristiche (come i valori del coseno della fase di armoniche specifiche) alla classificazione dei dispositivi. Il framework è stato addestrato e valutato sul dataset PLAID, raggiungendo un'accuratezza di classificazione del 90% mantenendo bassi requisiti computazionali e una latenza inferiore a 1 secondo.
Con la continua crescita dei consumi energetici, il monitoraggio dei carichi diventa cruciale. Nell'Unione Europea, gli edifici rappresentano circa il 41% del consumo di energia elettrica. Il tradizionale monitoraggio invasivo dei carichi (ILM) richiede l'installazione di sensori su ogni dispositivo, offrendo elevata accuratezza ma risultando costoso, difficile da installare e inadatto per applicazioni su larga scala. Il NILM rappresenta un'alternativa, monitorando il consumo energetico totale in un singolo punto (tipicamente il contatore principale) e utilizzando algoritmi di decomposizione per stimare i consumi dei singoli dispositivi.
Mancanza di Esplicabilità: I metodi NILM esistenti, in particolare i modelli di deep learning, presentano una natura "black-box" con scarsa trasparenza nel processo decisionale
Elevata Complessità Computazionale: I metodi non guidati da eventi richiedono maggiori risorse computazionali e dataset annotati di grandi dimensioni
Insufficiente Capacità in Tempo Reale: I metodi esistenti faticano a soddisfare i requisiti di applicazioni in tempo reale su dispositivi edge
Capacità Limitata di Elaborazione Dati ad Alta Frequenza: La ricerca NILM esplicabile esistente si concentra principalmente su dati a bassa frequenza (1Hz)
Il presente lavoro mira a costruire un framework NILM esplicabile end-to-end, specificamente per dati ad alta frequenza (intervallo kHz), realizzando decomposizione in tempo reale con latenza minima di 320/380 millisecondi (per sistemi di potenza a 60/50Hz), al fine di stabilire fiducia nei sistemi NILM e promuoverne l'adozione nelle applicazioni pratiche.
Primo Framework NILM Esplicabile End-to-End in Tempo Reale per Dati ad Alta Frequenza: Propone un framework completo e esplicabile specificamente progettato per dataset ad alta frequenza
Applicabilità su Dispositivi Edge in Tempo Reale: Il metodo è applicabile per applicazioni in tempo reale su dispositivi edge, con latenza di 19/f₀ + τ secondi (f₀ è la frequenza fondamentale, τ è il tempo di esecuzione)
Selezione Ottimizzata delle Caratteristiche: Seleziona un piccolo insieme di caratteristiche di firma del dispositivo minimamente correlate ed esplicabili, raggiungendo un'accuratezza di classificazione del 90% su dataset reali
Implementazione Open Source: Rende pubblico il codice sorgente del framework su GitHub, promuovendo la riproducibilità della ricerca e l'applicazione pratica
Input: Segnali di tensione e corrente ad alta frequenza (frequenza di campionamento 30kHz)
Output: Rilevamento e classificazione degli eventi di accensione/spegnimento dei dispositivi, con spiegazione delle decisioni
Vincoli: Requisiti di elaborazione in tempo reale, bassa complessità computazionale, elevata esplicabilità
Utilizza la trasformata di segnale periodico invariante in frequenza (FIT-PS) per elaborare i segnali di tensione v e corrente i:
ṽ, ĩ = FITPS(v, i)
L'algoritmo rileva i punti di attraversamento dello zero del segnale di tensione, ricampionando i vettori di tensione e corrente a una lunghezza comune T=500.
Calcola la corrente di attivazione/disattivazione:
Δi(k) = iₐ(k) - iᵦ
dove iₐ(k) è il vettore di corrente dopo l'evento, iᵦ è la corrente del periodo precedente l'evento. Seleziona 1 periodo prima dell'evento e 18 periodi dopo l'evento per il calcolo, quindi estrae il periodo mediano per ottenere la stima della firma del dispositivo:
Utilizza SHapley Additive exPlanations per quantificare il contributo di ogni caratteristica alla previsione del modello, fornendo spiegazioni delle decisioni.
Trasformata Invariante in Frequenza: Risolve il problema delle fluttuazioni della frequenza di rete, semplificando le operazioni matematiche successive
Stima della Firma Ottimizzata: La configurazione di 1 periodo precedente e 18 periodi successivi bilancia accuratezza ed efficienza computazionale
Progettazione di Caratteristiche Esplicabili: Utilizza la trasformazione del coseno per elaborare le caratteristiche di fase, migliorando l'esplicabilità
Set di Caratteristiche a Bassa Correlazione: Le 8 caratteristiche attentamente selezionate presentano debole correlazione, migliorando l'esplicabilità
Dataset PLAID: Contiene 575 misurazioni di tensione e corrente ad alta frequenza, frequenza di campionamento 30kHz, coprendo 13 tipi di dispositivi e almeno 11 marchi diversi.
Set di Addestramento: 164.510 firme di corrente a singolo ciclo
Set di Test: 2.347 firme di corrente di attivazione/disattivazione
Impatto del Numero di Periodi Post-Evento: Gli esperimenti dimostrano che l'accuratezza raggiunge il valore massimo con 18 periodi successivi, e periodi aggiuntivi non migliorano significativamente le prestazioni.
Analisi della Matrice di Confusione: Il modello presenta buone prestazioni per la maggior parte dei dispositivi, ma il ferro da stiro e le lampadine sono facilmente confusi, poiché entrambi sono carichi resistivi con consumi di corrente di ordine di grandezza simile. L'aria condizionata potrebbe essere confusa con il frigorifero o il ventilatore, a seconda della modalità di funzionamento.
Esempio di Spiegazione SHAP: Per la classificazione dell'aria condizionata, bassi valori del coseno della fase delle armoniche 1, 3, 5, 9 indicano che la firma è meno probabile che corrisponda all'aria condizionata, mentre un basso valore di cosφ₇ indica che corrisponde all'aria condizionata.
Il concetto di NILM guidato da eventi è stato proposto per la prima volta da Hart, identificando i dispositivi attraverso il rilevamento di variazioni significative nella potenza attiva e reattiva.
Murray et al.: Propone il metodo di mascheramento dell'attivazione dei dispositivi, ma limitato a singoli dispositivi
Interpretazione di Reti Neurali Convoluzionali: Utilizza sensibilità all'occlusione e mappe di attivazione simili ai gradienti, ma la visualizzazione termica presenta sfide per gli utenti non esperti
Deep Learning di Tipo Regressivo: Applica tecniche di interpretazione avanzate ma richiede benchmark standardizzati e soluzioni scalabili
Rispetto ai lavori esistenti, il presente articolo fornisce per la prima volta un framework esplicabile completo per dati ad alta frequenza, con maggiore efficienza computazionale e prestazioni in tempo reale.
Limitazioni del Dataset: Validato solo sul dataset PLAID, la capacità di generalizzazione richiede ulteriore verifica
Restrizioni sui Tipi di Dispositivi: Capacità limitata di distinguere tra dispositivi con caratteristiche simili (come carichi resistivi)
Adattabilità Ambientale: La robustezza in ambienti con rumore complesso o cambiamenti di stato simultanei di più dispositivi richiede ulteriore verifica
L'articolo cita 20 importanti riferimenti bibliografici, coprendo la teoria fondamentale del NILM, metodi di machine learning, tecniche di IA esplicabile e dataset correlati, fornendo una solida base teorica per la ricerca.
Valutazione Complessiva: Si tratta di un articolo tecnico di alta qualità che fornisce importanti contributi nel campo del NILM esplicabile. Il design del framework è razionale, la verifica sperimentale è completa e presenta buon valore pratico e significato accademico. Si consiglia di rafforzare la validazione cross-dataset e l'analisi comparativa con metodi avanzati nei lavori futuri.