2025-11-14T09:34:10.285532

Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data

Gerasimov, Kamyshev, Hoosh et al.
Non-Intrusive Load Monitoring (NILM) is an advanced, and cost-effective technique for monitoring appliance-level energy consumption. However, its adaptability is hindered by the lack of transparency and explainability. To address this challenge, this paper presents an explainable, real-time, event-based NILM framework specifically designed for high-frequency datasets. The proposed framework ensures transparency at every stage by integrating a z-score-based event detector, appliance signature estimation, Fourier-based feature extraction, an XG-Boost classifier, and post hoc SHAP analysis. The SHAP analysis further quantifies the contribution of individual features, such as cosine of specific harmonic phases, to appliance classification. The framework is trained and evaluated on the PLAID dataset, and achieved a classification accuracy of 90% while maintaining low computational requirements and a latency of less than one second.
academic

Hacia NILM Explicable: Marco NILM Basado en Eventos en Tiempo Real para Datos de Alta Frecuencia

Información Básica

  • ID del Artículo: 2501.16841
  • Título: Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data
  • Autores: Grigorii Gerasimov, Ilia Kamyshev, Sahar Moghimian Hoosh, Elena Gryazina, Henni Ouerdane
  • Instituciones: Instituto Skolkovo de Ciencia y Tecnología, Moscú, Rusia; Monisensa Development LLC., Moscú, Rusia
  • Clasificación: eess.SY (Sistemas y Control), cs.SY (Sistemas y Control)
  • Fecha de Publicación: 28 de enero de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2501.16841

Resumen

La Monitorización de Carga No Intrusiva (NILM, por sus siglas en inglés) es una tecnología avanzada y económica para monitorizar el consumo energético a nivel de electrodomésticos. Sin embargo, su adaptabilidad se ve limitada por la falta de transparencia e interpretabilidad. Para abordar este desafío, este artículo propone un marco NILM explicable, en tiempo real y basado en eventos, diseñado específicamente para conjuntos de datos de alta frecuencia. El marco garantiza transparencia en cada etapa mediante la integración de un detector de eventos basado en puntuación z, estimación de firmas de dispositivos, extracción de características basada en Fourier, clasificador XGBoost y análisis SHAP posterior. El análisis SHAP cuantifica además la contribución de características individuales (como valores de coseno de fase armónica específica) a la clasificación de dispositivos. El marco se entrena y evalúa en el conjunto de datos PLAID, logrando una precisión de clasificación del 90% mientras mantiene requisitos computacionales bajos y una latencia inferior a 1 segundo.

Contexto de Investigación y Motivación

Definición del Problema

Con el crecimiento continuo del consumo energético, la monitorización de carga se ha vuelto crítica. En la Unión Europea, los edificios representan aproximadamente el 41% del consumo eléctrico. La Monitorización de Carga Intrusiva (ILM, por sus siglas en inglés) tradicional requiere instalar sensores en cada dispositivo, lo que, aunque proporciona alta precisión, es costoso, difícil de instalar y no es adecuado para aplicaciones a gran escala. NILM surge como alternativa, monitorizando el consumo energético total en un único punto (típicamente el medidor principal) y utilizando algoritmos de descomposición para estimar el consumo de cada dispositivo individual.

Limitaciones de Métodos Existentes

  1. Falta de Interpretabilidad: Los métodos NILM existentes, particularmente los modelos de aprendizaje profundo, poseen naturaleza de "caja negra" con falta de transparencia en el proceso de decisión
  2. Alta Complejidad Computacional: Los métodos no impulsados por eventos requieren más recursos computacionales y conjuntos de datos anotados de gran tamaño
  3. Insuficiencia en Tiempo Real: Los métodos existentes tienen dificultades para satisfacer requisitos de aplicaciones en tiempo real en dispositivos periféricos
  4. Capacidad Limitada de Procesamiento de Datos de Alta Frecuencia: La investigación NILM interpretable existente se concentra principalmente en datos de baja frecuencia (1 Hz)

Motivación de la Investigación

Este artículo tiene como objetivo construir un marco NILM explicable de extremo a extremo, particularmente para datos de alta frecuencia (rango de kHz), logrando descomposición en tiempo real con latencia mínima de 320/380 milisegundos (para sistemas eléctricos de 60/50 Hz), para establecer confianza en sistemas NILM y promover su adopción en aplicaciones prácticas.

Contribuciones Principales

  1. Primer Marco NILM Explicable en Tiempo Real de Extremo a Extremo para Datos de Alta Frecuencia: Propone un marco completo y explicable diseñado específicamente para conjuntos de datos de alta frecuencia
  2. Aplicabilidad en Dispositivos Periféricos en Tiempo Real: El método es aplicable a dispositivos periféricos en tiempo real, con latencia de 19/f₀ + τ segundos (donde f₀ es la frecuencia fundamental y τ es el tiempo de ejecución)
  3. Selección de Características Optimizada: Selecciona un pequeño conjunto de características de firma de dispositivo mínimamente correlacionadas e interpretables, logrando precisión de clasificación del 90% en conjuntos de datos reales
  4. Implementación de Código Abierto: Publica el código fuente del marco en GitHub, promoviendo la reproducibilidad de la investigación y aplicación

Explicación Detallada del Método

Definición de la Tarea

Entrada: Señales de voltaje y corriente de alta frecuencia (frecuencia de muestreo de 30 kHz) Salida: Detección y clasificación de eventos de encendido/apagado de dispositivos, así como explicación de decisiones Restricciones: Requisitos de procesamiento en tiempo real, baja complejidad computacional, alta interpretabilidad

Arquitectura del Modelo

1. Procesamiento de Voltaje y Corriente en Tiempo Real

Utiliza la Transformada de Señal Periódica Invariante en Frecuencia (FIT-PS) para procesar señales de voltaje v y corriente i:

ṽ, ĩ = FITPS(v, i)

Este algoritmo detecta puntos de cruce por cero de la señal de voltaje, remuestreando los vectores de voltaje y corriente a una longitud común T=500.

2. Detector de Eventos Basado en Puntuación z

Calcula la potencia activa:

p(k) = (1/T) × Σ(ṽₜ(k) × ĩₜ(k))

Detecta eventos cuando la puntuación z excede un umbral predeterminado Z=30:

z(k) = |p(k) - μw| / σw, z(k) > Z

Donde μw y σw son la media y desviación estándar dentro de una ventana deslizante (w=10), respectivamente.

3. Estimación de Firma de Dispositivo

Calcula la corriente de activación/desactivación:

Δi(k) = iₐ(k) - iᵦ

Donde iₐ(k) es el vector de corriente después del evento e iᵦ es la corriente del período anterior al evento. Se selecciona 1 período antes del evento y 18 períodos después del evento para el cálculo, luego se extrae el período mediano para obtener la estimación de firma del dispositivo:

iₑₛₜ = median{Δi(k)}

4. Extracción de Características Basada en Fourier

Utiliza la Transformada Rápida de Fourier Discreta (DFFT) para procesar la firma de corriente estimada, extrayendo 8 características:

{a₁, cosφ₁, cosφ₂, cosφ₃, cosφ₄, cosφ₅, cosφ₇, cosφ₉}

Donde a₁ es la amplitud fundamental y cosφᵢ es el valor de coseno de la fase de la i-ésima armónica.

5. Clasificador XGBoost

Utiliza un modelo de potenciación de gradiente para la clasificación de dispositivos, con configuración de hiperparámetros:

  • 150 estimadores
  • Profundidad máxima 8
  • Tasa de aprendizaje 0.046
  • Coeficientes de regularización α=10

6. Análisis SHAP Posterior

Utiliza Explicaciones Aditivas de Shapley (SHAP) para cuantificar la contribución de cada característica a la predicción del modelo, proporcionando explicación de decisiones.

Puntos de Innovación Técnica

  1. Transformada Invariante en Frecuencia: Resuelve el problema de fluctuaciones de frecuencia de la red eléctrica, simplificando operaciones matemáticas posteriores
  2. Estimación de Firma Optimizada: La configuración de 1 período anterior y 18 períodos posteriores equilibra precisión y eficiencia computacional
  3. Diseño de Características Interpretables: Utiliza transformación de coseno para procesar características de fase, mejorando la interpretabilidad
  4. Conjunto de Características de Baja Correlación: Las 8 características cuidadosamente seleccionadas poseen débil correlación, mejorando la interpretabilidad

Configuración Experimental

Conjunto de Datos

Conjunto de Datos PLAID: Contiene 575 mediciones de voltaje y corriente de alta frecuencia, con frecuencia de muestreo de 30 kHz, cubriendo 13 tipos de dispositivos y al menos 11 marcas diferentes.

  • Conjunto de Entrenamiento: 164,510 firmas de corriente de un solo ciclo
  • Conjunto de Prueba: 2,347 firmas de corriente de activación/desactivación

Métricas de Evaluación

  • Precisión (Accuracy)
  • Precisión Macro Promediada (Macro Precision)
  • Recuperación Macro Promediada (Macro Recall)
  • Puntuación F1 Macro Promediada (Macro F1)

Métodos de Comparación

  • Árbol de Decisión (Decision Tree)
  • Regresión Logística (Logistic Regression)

Detalles de Implementación

  • Utiliza búsqueda aleatoria para optimizar hiperparámetros de XGBoost
  • Umbral de detección de eventos Z=30
  • Tamaño de ventana deslizante w=10
  • Muestras por ciclo T=500

Resultados Experimentales

Resultados Principales

ModeloPrecisiónPrecisiónRecuperaciónPuntuación F1
XGBoost90%92%92%91%
Árbol de Decisión84%85%86%84%
Regresión Logística80%80%80%80%

El modelo XGBoost supera significativamente otros métodos en todas las métricas, logrando una precisión de clasificación del 90%.

Experimentos de Ablación

Impacto del Número de Períodos Posteriores: Los experimentos demuestran que la precisión alcanza su valor máximo después de 18 períodos, con períodos adicionales sin mejora significativa del rendimiento.

Análisis de Casos

Análisis de Matriz de Confusión: El modelo funciona bien para la mayoría de dispositivos, pero la plancha y la bombilla tienden a confundirse, ya que ambas son cargas resistivas con magnitudes de consumo de corriente similares. El aire acondicionado puede confundirse con refrigeradores o ventiladores, dependiendo de su modo de operación.

Ejemplo de Explicación SHAP: Para la clasificación de aire acondicionado, valores bajos de coseno de fase armónica de 1, 3, 5, 9 indican que la firma es poco probable que corresponda a aire acondicionado, mientras que un valor bajo de cosφ₇ indica que corresponde a aire acondicionado.

Hallazgos Experimentales

  1. Correlación de Características: Las 8 características seleccionadas poseen débil correlación, mejorando la interpretabilidad
  2. Eficiencia Computacional: La complejidad general es O(TNₐ log TNₐ), adecuada para aplicaciones en tiempo real
  3. Rendimiento de Latencia: La latencia es 19/f₀ + τ, aproximadamente 380 ms para sistemas de 50 Hz y 320 ms para sistemas de 60 Hz

Trabajo Relacionado

Evolución de NILM

El concepto de NILM impulsado por eventos fue propuesto por Hart, identificando dispositivos detectando cambios significativos en potencia activa y reactiva.

Estado Actual de la Investigación NILM Explicable

  1. Murray et al.: Proponen método de activación de dispositivo enmascarado, pero limitado a dispositivos individuales
  2. Interpretación de Redes Neuronales Convolucionales: Utiliza sensibilidad de oclusión y mapeos de activación similares a gradientes, pero la visualización térmica presenta desafíos para usuarios no expertos
  3. Aprendizaje Profundo Regresivo: Aplica técnicas de interpretación avanzadas pero requiere puntos de referencia estandarizados y soluciones escalables

Ventajas de Este Artículo

En comparación con trabajos existentes, este artículo proporciona por primera vez un marco explicable completo para datos de alta frecuencia, con mayor eficiencia computacional y rendimiento en tiempo real.

Conclusiones y Discusión

Conclusiones Principales

  1. Propone el primer marco NILM explicable en tiempo real para datos de alta frecuencia
  2. Logra precisión de clasificación de dispositivos del 90% mientras mantiene requisitos computacionales bajos
  3. Proporciona explicación clara de decisiones mediante análisis SHAP
  4. Verifica el potencial de aplicación en tiempo real del marco en dispositivos periféricos

Limitaciones

  1. Limitaciones del Conjunto de Datos: Validado solo en el conjunto de datos PLAID, la capacidad de generalización requiere verificación adicional
  2. Restricción de Tipos de Dispositivos: Capacidad limitada de distinguir dispositivos con características similares (como cargas resistivas)
  3. Adaptabilidad Ambiental: La robustez en entornos con ruido complejo o cambios de estado simultáneo de múltiples dispositivos requiere verificación adicional

Direcciones Futuras

  1. Generalización Entre Conjuntos de Datos: Verificar la capacidad de generalización del marco en otros conjuntos de datos
  2. Pruebas de Despliegue Práctico: Pruebas en entornos reales de apartamentos utilizando sensores de energía en tiempo real de alta precisión
  3. Optimización de Algoritmos: Optimizar aún más el algoritmo para manejar escenarios de cambio de carga más complejos

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Primer marco completo y explicable para NILM de alta frecuencia
  2. Alto Valor Práctico: Baja latencia, baja complejidad computacional, adecuado para despliegue en dispositivos periféricos
  3. Base Teórica Sólida: Cada etapa posee base matemática clara, mejorando la transparencia
  4. Contribución de Código Abierto: Proporciona código abierto, promoviendo reproducibilidad de investigación y desarrollo
  5. Ingeniería de Características Excelente: Las 8 características cuidadosamente diseñadas garantizan rendimiento e interpretabilidad

Insuficiencias

  1. Limitaciones de Evaluación: Evaluación solo en un único conjunto de datos, falta validación entre dominios
  2. Comparación Insuficiente: Falta comparación detallada con otros métodos NILM avanzados
  3. Análisis Teórico Insuficiente: Falta análisis de límites de rendimiento teórico del método
  4. Verificación de Robustez: Pruebas insuficientes de robustez en entornos ruidosos y casos anómalos

Impacto

  1. Valor Académico: Abre nuevas direcciones en investigación NILM explicable, particularmente en procesamiento de datos de alta frecuencia
  2. Valor Práctico: La naturaleza en tiempo real y baja complejidad del marco le confieren buenas perspectivas de aplicación industrial
  3. Reproducibilidad: El código abierto y detalles de implementación detallados aseguran buena reproducibilidad

Escenarios de Aplicación

  1. Sistemas de Hogar Inteligente: Monitorización de consumo energético en tiempo real y percepción de estado de dispositivos
  2. Internet Industrial de las Cosas: Monitorización de estado operativo de dispositivos y optimización de eficiencia energética
  3. Aplicaciones de Computación Periférica: Descomposición de carga en tiempo real en entornos con recursos limitados
  4. Sistemas de Gestión Energética: Gestión de consumo energético refinada a nivel de edificios o parques

Referencias

El artículo cita 20 referencias importantes, cubriendo teoría fundamental de NILM, métodos de aprendizaje automático, tecnología de IA explicable y conjuntos de datos relacionados, proporcionando base teórica sólida para la investigación.


Evaluación General: Este es un artículo técnico de alta calidad que realiza contribuciones importantes en el campo de NILM explicable. El diseño del marco es razonable, la verificación experimental es suficiente, y posee buen valor práctico y significado académico. Se recomienda en trabajos futuros fortalecer la validación entre conjuntos de datos y análisis comparativos con métodos avanzados.