2025-11-12T07:28:09.582420

Enhancing Non-Intrusive Load Monitoring with Features Extracted by Independent Component Analysis

Hoosh, Kamyshev, Ouerdane

In this paper, a novel neural network architecture is proposed to address the challenges in energy disaggregation algorithms. These challenges include the limited availability of data and the complexity of disaggregating a large number of appliances operating simultaneously. The proposed model utilizes independent component analysis as the backbone of the neural network and is evaluated using the F1-score for varying numbers of appliances working concurrently. Our results demonstrate that the model is less prone to overfitting, exhibits low complexity, and effectively decomposes signals with many individual components. Furthermore, we show that the proposed model outperforms existing algorithms when applied to real-world data.

academic

Mejora de la Monitorización de Carga No Intrusiva con Características Extraídas por Análisis de Componentes Independientes

Información Básica

ID del Artículo: 2501.16817
Título: Enhancing Non-Intrusive Load Monitoring with Features Extracted by Independent Component Analysis
Autores: Sahar Moghimian Hoosh, Ilia Kamyshev, Henni Ouerdane (Instituto Skolkovo de Ciencia y Tecnología)
Clasificación: eess.SY cs.LG cs.SY
Fecha de Publicación: 28 de enero de 2025
Enlace del Artículo: https://arxiv.org/abs/2501.16817

Resumen

Este artículo propone una arquitectura novedosa de red neuronal para abordar los desafíos en algoritmos de descomposición de energía. Estos desafíos incluyen la disponibilidad limitada de datos y la complejidad de descomponer simultáneamente una gran cantidad de dispositivos en funcionamiento. El modelo propuesto utiliza Análisis de Componentes Independientes (ICA) como columna vertebral de la red neuronal y utiliza la puntuación F1 para evaluar situaciones con diferentes cantidades de dispositivos funcionando concurrentemente. Los resultados demuestran que el modelo es resistente al sobreajuste, tiene baja complejidad y puede descomponer efectivamente señales con múltiples componentes independientes. Además, demostramos que el modelo propuesto supera a los algoritmos existentes cuando se aplica a datos reales.

Antecedentes de Investigación y Motivación

Contexto del Problema

La Monitorización de Carga No Intrusiva (NILM), también conocida como descomposición de energía, es una técnica que descompone el consumo total de energía del hogar en componentes a nivel de dispositivo individual mediante análisis avanzado. Este concepto fue propuesto originalmente por G. Hart en la década de 1980 y ha recibido amplia atención en años recientes debido a su potencial en mejorar la eficiencia energética, respuesta a la demanda y predicción de carga.

Desafíos Centrales

Limitaciones de Datos: La disponibilidad limitada de datos etiquetados dificulta el entrenamiento de redes neuronales profundas
Problemas de Complejidad: La complejidad de descomponer múltiples dispositivos funcionando simultáneamente
Limitaciones de Algoritmos: Los algoritmos existentes tienen alto consumo de memoria, son sensibles al sobreajuste y difíciles de portar a sensores
Sesgo en Conjuntos de Datos: Los conjuntos de datos disponibles tienen combinaciones limitadas de dispositivos, sesgados hacia los dispositivos más utilizados
Dificultades en Aplicaciones Prácticas: Detección de conmutación sincrónica de múltiples dispositivos y estimación correcta en escenarios reales con datos ruidosos

Motivación de la Investigación

Los modelos de aprendizaje profundo existentes enfrentan en NILM problemas de precisión de descomposición reducida, aumento del error de generalización y sobreajuste causados por datos de entrenamiento limitados. Esta investigación tiene como objetivo desarrollar un algoritmo de descomposición de energía más robusto y eficiente combinando principios físicos y técnicas de ICA.

Contribuciones Principales

Primer Uso de ICA como Técnica de Extracción de Características: Primer uso de ICA para extracción de características en modelos de clasificación multiétiqueta de NILM, particularmente en escenarios de datos de muestreo de alta frecuencia (>1kHz)
Arquitectura Propuesta ICA+ResNetFFN: Nueva arquitectura de red neuronal que combina principios físicos, considerando las características físicas del problema de descomposición de energía
Evaluación Integral del Desempeño: Evaluación sistemática del desempeño del algoritmo bajo diferentes cantidades de dispositivos funcionando simultáneamente
Método de Generación de Datos Sintéticos: Generación de categorías de dispositivos sintéticos linealmente separables basada en la Ley de Kirchhoff
Validación Experimental: Demostración de la superioridad del método propuesto en datos reales y sintéticos

Explicación Detallada del Método

Definición de la Tarea

Entrada: Señal de potencia agregada X (señales de voltaje y corriente) Salida: Vector binario que indica si la categoría de dispositivo correspondiente está contenida en la señal mixta Restricciones: Manejo de escenarios con 1 a nclasses dispositivos funcionando simultáneamente, considerando repetición de dispositivos (como múltiples cargadores, bombillas, etc.)

Arquitectura del Modelo

Arquitectura ICA+ResNetFFN

Señal Agregada X → Descomposición ICA → Proyección Lineal → Secuencia de Bloques ResNet → Clasificación Multiétiqueta

Pasos Principales:

Descomposición ICA: Implementación de FastICA para obtener la matriz de desmezclado U, descomponiendo la señal agregada X en nclasses+1 componentes:
```
X' = XU^T
```
donde "+1" considera la componente gaussiana
Proyección Lineal: Proyección de X' al espacio de dimensión dmodel:
```
Xd = X'W^T + b = XUW^T + b
```
Procesamiento ResNet: Xd pasa a través de nblocks secuencias de capas lineales emparejadas, incluyendo activación ReLU y conexiones residuales

Configuración de Parámetros: dmodel = 64, nblocks = 15, cantidad total de parámetros = 65,000

Apoyo de Principios Físicos

La selección de ICA se basa en los siguientes principios físicos:

Ley de Kirchhoff: La señal agregada obedece iagg(t) = Σk ik(t)
Hipótesis de Mezcla Lineal: ICA asume que las señales fuente se mezclan linealmente, consistente con las características físicas de la red eléctrica
Separación de Fuentes: La señal agregada es una mezcla lineal de contribuciones de cada fuente

Métodos de Línea Base Comparativos

1. Temporal Pooling NILM (TP-NILM)

Estructura codificador-agrupamiento temporal-decodificador
Capas convolucionales y de agrupamiento máximo que extraen características de 256 dimensiones
Capas de agrupamiento promedio con cuatro configuraciones de filtros diferentes

2. FIT-PS+LSTM

Extracción de características de Transformada Invariante en Frecuencia de Señal Periódica (FIT-PS)
Segmentación de señal basada en frecuencia fundamental, utilizando puntos de cruce por cero
Red LSTM para procesar características temporales

3. Fryze+CNN

Extracción de características basada en teoría de potencia de Fryze
Descomposición de corriente activa en componentes ortogonales: i(t) = ia(t) + if(t)
Estructura de cuatro bloques CNN con números de canal 16, 32, 64, 128

Configuración Experimental

Conjuntos de Datos

Conjunto de Datos PLAID

Escala: 1800 muestras, frecuencia de muestreo de 30kHz, 16 categorías de dispositivos
Preprocesamiento: Remuestreo a 3kHz, extracción de 19,000 regiones de interés
Proporción de División: Conjunto de entrenamiento 70%, validación 10%, prueba 20%

Conjunto de Datos Sintético

Método de Generación: Combinación artificial de señales de medición de dispositivos individuales basada en la Ley de Kirchhoff
Características: Categorías linealmente separables, reducción del desequilibrio de clases
Repetición de Dispositivos: Consideración de 1-10 repeticiones de dispositivos (como múltiples cargadores, bombillas)
Generación Aleatoria: Cada categoría aparece en la señal mixta con igual probabilidad

Métricas de Evaluación

Métrica Principal: Puntuación F1 (promedio de muestras)
Análisis Detallado: Distribución de puntuación F1 para 1 a nclasses dispositivos funcionando simultáneamente
Objetivo Ideal: La distribución de puntuación F1 debe ser uniforme para diferentes cantidades de dispositivos

Detalles de Implementación

Entorno de Hardware: 2× GPUs RTX 2080 Ti, RAM de 128GB
Tiempo de Entrenamiento: 45 minutos por experimento
Modelos Comparativos: 6 modelos (4 aprendizaje profundo + 2 aprendizaje automático clásico)

Resultados Experimentales

Resultados Principales

Experimentos con Datos Sintéticos

Modelo	Puntuación F1
ICA+ResNetFFN	0.95
Random Forest	0.93
k-NN	0.88
FIT-PS+LSTM	0.72
Fryze+CNN	0.68
Temporal Pooling NILM	0.67

Experimentos con Datos Reales

Modelo	Puntuación F1
ICA+ResNetFFN	0.77
Random Forest	0.76
k-NN	0.75
Fryze+CNN	0.64
FIT-PS+LSTM	0.62
Temporal Pooling NILM	0.60

Hallazgos Clave

1. Desempeño de Convergencia

ICA+ResNetFFN: Exhibe la pérdida de validación más baja y la puntuación F1 más alta, convergencia más suave
Otros Modelos: Degradación significativa del desempeño con 2-10 dispositivos concurrentes

2. Análisis de Robustez

Datos Sintéticos: El método propuesto mantiene puntuación F1 consistente en diferentes cantidades de dispositivos
Datos Reales: Aunque ya no es completamente uniforme, aún muestra mejor desempeño en regiones donde otros algoritmos se degradan

3. Análisis de Visualización t-SNE

Datos Reales: Estructura de categoría de dispositivo compleja, con múltiples agrupamientos o superposición de puntos de datos
Datos Sintéticos: Categorías linealmente separables, estructura clara
Razón de Superposición: Los dispositivos contienen elementos eléctricos comunes (por ejemplo, lavadoras y teteras tienen elementos calefactores)

Trabajo Relacionado

Métodos Tradicionales

Algoritmo k-NN: Utiliza características de estado estacionario para identificar dispositivos, pero tiene bajo desempeño en detección de dispositivos desconocidos
Aprendizaje Automático Clásico: Buen desempeño en características de ICA, pero carece de capacidad de extracción de características profundas

Métodos de Aprendizaje Profundo

Redes LSTM: Mejora la precisión de clasificación combinada con representación FIT-PS, pero requiere conjunto de validación para determinar inicialización óptima
Métodos CNN: Redes convolucionales profundas basadas en técnicas de segmentación de imágenes, pero la expansión del espacio de características se produce a costa de la reducción de resolución temporal
Agrupamiento Temporal: Expansión de dimensión de características para clasificación multiétiqueta, pero mayor complejidad computacional

Ventajas de Este Trabajo

Guía de Principios Físicos: Selección de ICA basada en la Ley de Kirchhoff
Baja Complejidad: Diseño de arquitectura relativamente simple
Resistencia al Sobreajuste: Mejor capacidad de generalización
Procesamiento Multidevice: Manejo efectivo de gran cantidad de dispositivos concurrentes

Conclusiones y Discusión

Conclusiones Principales

Efectividad de ICA: El uso de ICA como método de extracción de características mejora significativamente el desempeño de NILM
Importancia de Principios Físicos: El diseño de modelos que considera características físicas de datos es crucial
Valor de Datos Sintéticos: Los datos sintéticos linealmente separables ayudan a guiar el desarrollo de arquitectura óptima
Superioridad de Desempeño: Supera a métodos de línea base existentes en datos reales y sintéticos

Limitaciones

Limitación de Cantidad de Dispositivos: El trabajo actual se enfoca solo en clasificación de tres dispositivos
Dependencia de Datos: Requiere muestras de entrenamiento abundantes para abordar todas las combinaciones posibles de dispositivos
Desafíos de Datos Reales: La estructura compleja de categorías de dispositivos reales y problemas de superposición aún requieren solución adicional
Capacidad de Generalización: El desempeño en mayor cantidad de dispositivos requiere verificación adicional

Direcciones Futuras

Expansión de Cantidad de Dispositivos: Verificación del desempeño del método en más categorías de dispositivos
Mejora de Extracción de Características: Manejo de problemas de superposición de dispositivos en datos reales
Aplicaciones en Tiempo Real: Optimización del algoritmo para adaptarse a requisitos de monitorización en tiempo real
Generalización Transdominios: Mejora de la adaptabilidad del modelo en diferentes entornos de red eléctrica

Evaluación Profunda

Fortalezas

Innovación Fuerte: Primer combinación de ICA con aprendizaje profundo para NILM, con apoyo teórico físico claro
Experimentación Completa: Evaluación integral en datos sintéticos y reales, incluyendo múltiples comparaciones de línea base
Análisis Profundo: Explicación de diferencias de desempeño mediante visualización t-SNE
Valor Práctico: Diseño de baja complejidad facilita implementación práctica
Convincencia de Resultados: Superioridad significativa sobre métodos existentes en múltiples métricas

Insuficiencias

Limitación de Escala de Dispositivos: Validación solo en 16 categorías de dispositivos, carencia de validación a gran escala
Análisis Teórico Insuficiente: Falta de explicación teórica de la efectividad de la combinación ICA+ResNet
Análisis de Complejidad Computacional: Falta de análisis detallado de complejidad temporal y espacial
Pruebas de Robustez: Carencia de evaluación de robustez ante ruido, envejecimiento de dispositivos y otros factores prácticos

Impacto

Contribución Académica: Proporciona nuevas ideas y métodos de investigación para el campo de NILM
Valor Práctico: Arquitectura simple y efectiva con potencial de aplicación práctica
Reproducibilidad: Proporciona código de implementación en Python, facilitando reproducción y extensión
Significado Inspirador: Demuestra la importancia de la guía de principios físicos en diseño de modelos

Escenarios Aplicables

Hogares Inteligentes: Sistemas de gestión y monitorización de energía del hogar
Monitorización Industrial: Análisis de consumo de energía de equipos de fábrica
Gestión de Red Eléctrica: Descomposición de carga y predicción en redes de distribución
Aplicaciones de Ahorro de Energía: Optimización de ahorro de energía basada en monitorización a nivel de dispositivo

Referencias

Este artículo cita 16 referencias relacionadas, abarcando trabajos clásicos en NILM (Hart, 1992), métodos de aprendizaje profundo, técnicas de extracción de características y conjuntos de datos relacionados, proporcionando una base teórica sólida y puntos de referencia comparativos.

Evaluación General: Este es un trabajo innovador en el campo de NILM que, al combinar principios físicos con aprendizaje profundo, propone una solución efectiva. Aunque presenta ciertas limitaciones en escala de dispositivos y análisis teórico, su idea central y resultados experimentales proporcionan contribuciones valiosas para el desarrollo del campo.