Toward Explainable NILM: Real-Time Event-Based NILM Framework for High-Frequency Data
Gerasimov, Kamyshev, Hoosh et al.
Non-Intrusive Load Monitoring (NILM) is an advanced, and cost-effective technique for monitoring appliance-level energy consumption. However, its adaptability is hindered by the lack of transparency and explainability. To address this challenge, this paper presents an explainable, real-time, event-based NILM framework specifically designed for high-frequency datasets. The proposed framework ensures transparency at every stage by integrating a z-score-based event detector, appliance signature estimation, Fourier-based feature extraction, an XG-Boost classifier, and post hoc SHAP analysis. The SHAP analysis further quantifies the contribution of individual features, such as cosine of specific harmonic phases, to appliance classification. The framework is trained and evaluated on the PLAID dataset, and achieved a classification accuracy of 90% while maintaining low computational requirements and a latency of less than one second.
academic
Hacia NILM Explicable: Marco NILM Basado en Eventos en Tiempo Real para Datos de Alta Frecuencia
La Monitorización de Carga No Intrusiva (NILM, por sus siglas en inglés) es una tecnología avanzada y económica para monitorizar el consumo energético a nivel de electrodomésticos. Sin embargo, su adaptabilidad se ve limitada por la falta de transparencia e interpretabilidad. Para abordar este desafío, este artículo propone un marco NILM explicable, en tiempo real y basado en eventos, diseñado específicamente para conjuntos de datos de alta frecuencia. El marco garantiza transparencia en cada etapa mediante la integración de un detector de eventos basado en puntuación z, estimación de firmas de dispositivos, extracción de características basada en Fourier, clasificador XGBoost y análisis SHAP posterior. El análisis SHAP cuantifica además la contribución de características individuales (como valores de coseno de fase armónica específica) a la clasificación de dispositivos. El marco se entrena y evalúa en el conjunto de datos PLAID, logrando una precisión de clasificación del 90% mientras mantiene requisitos computacionales bajos y una latencia inferior a 1 segundo.
Con el crecimiento continuo del consumo energético, la monitorización de carga se ha vuelto crítica. En la Unión Europea, los edificios representan aproximadamente el 41% del consumo eléctrico. La Monitorización de Carga Intrusiva (ILM, por sus siglas en inglés) tradicional requiere instalar sensores en cada dispositivo, lo que, aunque proporciona alta precisión, es costoso, difícil de instalar y no es adecuado para aplicaciones a gran escala. NILM surge como alternativa, monitorizando el consumo energético total en un único punto (típicamente el medidor principal) y utilizando algoritmos de descomposición para estimar el consumo de cada dispositivo individual.
Falta de Interpretabilidad: Los métodos NILM existentes, particularmente los modelos de aprendizaje profundo, poseen naturaleza de "caja negra" con falta de transparencia en el proceso de decisión
Alta Complejidad Computacional: Los métodos no impulsados por eventos requieren más recursos computacionales y conjuntos de datos anotados de gran tamaño
Insuficiencia en Tiempo Real: Los métodos existentes tienen dificultades para satisfacer requisitos de aplicaciones en tiempo real en dispositivos periféricos
Capacidad Limitada de Procesamiento de Datos de Alta Frecuencia: La investigación NILM interpretable existente se concentra principalmente en datos de baja frecuencia (1 Hz)
Este artículo tiene como objetivo construir un marco NILM explicable de extremo a extremo, particularmente para datos de alta frecuencia (rango de kHz), logrando descomposición en tiempo real con latencia mínima de 320/380 milisegundos (para sistemas eléctricos de 60/50 Hz), para establecer confianza en sistemas NILM y promover su adopción en aplicaciones prácticas.
Primer Marco NILM Explicable en Tiempo Real de Extremo a Extremo para Datos de Alta Frecuencia: Propone un marco completo y explicable diseñado específicamente para conjuntos de datos de alta frecuencia
Aplicabilidad en Dispositivos Periféricos en Tiempo Real: El método es aplicable a dispositivos periféricos en tiempo real, con latencia de 19/f₀ + τ segundos (donde f₀ es la frecuencia fundamental y τ es el tiempo de ejecución)
Selección de Características Optimizada: Selecciona un pequeño conjunto de características de firma de dispositivo mínimamente correlacionadas e interpretables, logrando precisión de clasificación del 90% en conjuntos de datos reales
Implementación de Código Abierto: Publica el código fuente del marco en GitHub, promoviendo la reproducibilidad de la investigación y aplicación
Entrada: Señales de voltaje y corriente de alta frecuencia (frecuencia de muestreo de 30 kHz)
Salida: Detección y clasificación de eventos de encendido/apagado de dispositivos, así como explicación de decisiones
Restricciones: Requisitos de procesamiento en tiempo real, baja complejidad computacional, alta interpretabilidad
Donde iₐ(k) es el vector de corriente después del evento e iᵦ es la corriente del período anterior al evento. Se selecciona 1 período antes del evento y 18 períodos después del evento para el cálculo, luego se extrae el período mediano para obtener la estimación de firma del dispositivo:
Utiliza Explicaciones Aditivas de Shapley (SHAP) para cuantificar la contribución de cada característica a la predicción del modelo, proporcionando explicación de decisiones.
Transformada Invariante en Frecuencia: Resuelve el problema de fluctuaciones de frecuencia de la red eléctrica, simplificando operaciones matemáticas posteriores
Estimación de Firma Optimizada: La configuración de 1 período anterior y 18 períodos posteriores equilibra precisión y eficiencia computacional
Diseño de Características Interpretables: Utiliza transformación de coseno para procesar características de fase, mejorando la interpretabilidad
Conjunto de Características de Baja Correlación: Las 8 características cuidadosamente seleccionadas poseen débil correlación, mejorando la interpretabilidad
Conjunto de Datos PLAID: Contiene 575 mediciones de voltaje y corriente de alta frecuencia, con frecuencia de muestreo de 30 kHz, cubriendo 13 tipos de dispositivos y al menos 11 marcas diferentes.
Conjunto de Entrenamiento: 164,510 firmas de corriente de un solo ciclo
Conjunto de Prueba: 2,347 firmas de corriente de activación/desactivación
Impacto del Número de Períodos Posteriores: Los experimentos demuestran que la precisión alcanza su valor máximo después de 18 períodos, con períodos adicionales sin mejora significativa del rendimiento.
Análisis de Matriz de Confusión: El modelo funciona bien para la mayoría de dispositivos, pero la plancha y la bombilla tienden a confundirse, ya que ambas son cargas resistivas con magnitudes de consumo de corriente similares. El aire acondicionado puede confundirse con refrigeradores o ventiladores, dependiendo de su modo de operación.
Ejemplo de Explicación SHAP: Para la clasificación de aire acondicionado, valores bajos de coseno de fase armónica de 1, 3, 5, 9 indican que la firma es poco probable que corresponda a aire acondicionado, mientras que un valor bajo de cosφ₇ indica que corresponde a aire acondicionado.
El concepto de NILM impulsado por eventos fue propuesto por Hart, identificando dispositivos detectando cambios significativos en potencia activa y reactiva.
Murray et al.: Proponen método de activación de dispositivo enmascarado, pero limitado a dispositivos individuales
Interpretación de Redes Neuronales Convolucionales: Utiliza sensibilidad de oclusión y mapeos de activación similares a gradientes, pero la visualización térmica presenta desafíos para usuarios no expertos
Aprendizaje Profundo Regresivo: Aplica técnicas de interpretación avanzadas pero requiere puntos de referencia estandarizados y soluciones escalables
En comparación con trabajos existentes, este artículo proporciona por primera vez un marco explicable completo para datos de alta frecuencia, con mayor eficiencia computacional y rendimiento en tiempo real.
Limitaciones del Conjunto de Datos: Validado solo en el conjunto de datos PLAID, la capacidad de generalización requiere verificación adicional
Restricción de Tipos de Dispositivos: Capacidad limitada de distinguir dispositivos con características similares (como cargas resistivas)
Adaptabilidad Ambiental: La robustez en entornos con ruido complejo o cambios de estado simultáneo de múltiples dispositivos requiere verificación adicional
El artículo cita 20 referencias importantes, cubriendo teoría fundamental de NILM, métodos de aprendizaje automático, tecnología de IA explicable y conjuntos de datos relacionados, proporcionando base teórica sólida para la investigación.
Evaluación General: Este es un artículo técnico de alta calidad que realiza contribuciones importantes en el campo de NILM explicable. El diseño del marco es razonable, la verificación experimental es suficiente, y posee buen valor práctico y significado académico. Se recomienda en trabajos futuros fortalecer la validación entre conjuntos de datos y análisis comparativos con métodos avanzados.