2025-11-20T07:19:14.926764

STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging

Bhowmick, Ramanathan, Aakur

Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.

academic

STaTS: Resumen de Secuencias Temporales Consciente de la Estructura mediante Fusión de Ventanas Estadísticas

Información Básica

ID del Artículo: 2510.09593
Título: STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
Autores: Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
Clasificación: cs.LG (Aprendizaje Automático), cs.CV (Visión por Computadora)
Fecha de Publicación: Octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2510.09593

Resumen

Los datos de series temporales generalmente contienen estructuras temporales latentes, como transiciones entre estados localmente estacionarios, patrones repetitivos y ráfagas de variabilidad, pero estas estructuras rara vez se aprovechan en los flujos de trabajo estándar de aprendizaje de representaciones. Los modelos existentes típicamente procesan secuencias crudas o de ventana fija, tratando todos los pasos temporales como igualmente importantes, lo que resulta en ineficiencia, robustez deficiente y escalabilidad limitada en secuencias largas o ruidosas. Este artículo propone STaTS, un marco ligero no supervisado para resumen de series temporales consciente de la estructura, capaz de comprimir de manera adaptativa series temporales univariadas y multivariadas en secuencias de tokens compactas que preservan información.

Antecedentes de Investigación y Motivación

Definición del Problema

Los datos de series temporales están ampliamente presentes en finanzas, Internet de las Cosas, medicina y otros campos. Con el avance de la tecnología de sensores, la longitud y complejidad de las series temporales registradas crecen rápidamente, imponiendo demandas computacionales enormes en marcos de comprensión de secuencias basados en aprendizaje automático.

Limitaciones de Métodos Existentes

Métodos Tradicionales: Como PAA (Aproximación de Agregación Segmentada), SAX (Aproximación de Agregación Simbólica), DTW (Deformación Dinámica del Tiempo), etc., logran resúmenes efectivos pero dependen de ventanas uniformes o codificación simbólica rígida, ignorando cambios dinámicos en la complejidad de la señal
Métodos de Aprendizaje Profundo: Como TS2Vec y TS-TCC procesan secuencias completas o aplican ventanas deslizantes sin considerar cambios semánticos, resultando en redundancia, sobrecarga computacional y desalineación entre la tokenización del modelo y transiciones reales de la señal

Motivación de la Investigación

Los métodos existentes presentan los siguientes problemas:

Las estrategias de ventana fija pueden sobre-particionar regiones estables mientras sub-particionar regiones complejas
En condiciones ruidosas, el procesamiento uniforme de entradas tiende a amplificar patrones espurios y reducir la capacidad de generalización
La falta de conciencia estructural conduce a ineficiencia y propagación de errores

Contribuciones Principales

Propuesta del Marco STaTS: Marco de tokenización consciente de la estructura basado en criterios de detección de cambios BIC que identifica segmentos estadísticamente coherentes en múltiples escalas temporales
Tubería de Resumen Modular y Ligera: Comprime series temporales más de 30 veces mientras mantiene patrones significativos, permitiendo modelado eficiente en tareas posteriores
Método No Supervisado Agnóstico del Modelo: Sin necesidad de cambios de arquitectura o ajuste basado en gradientes, compatible directamente con codificadores de series temporales existentes como TS2Vec
Interfaz Unificada: Aplicable a tareas de clasificación, predicción y robustez, funcionando como herramienta de preprocesamiento universal para resumen de series temporales

Explicación Detallada del Método

Definición de la Tarea

Dada una serie temporal multivariada $X \in \mathbb{R}^{T \times d}$ (donde $T$ es el número de pasos temporales y $d$ es la dimensionalidad), el objetivo es transformar $X$ en una secuencia más corta $\tilde{X} \in \mathbb{R}^{T' \times d}$ , donde $T' \ll T$ , mientras se preserva la estructura subyacente requerida para tareas posteriores.

Arquitectura del Modelo

1. Fase de Segmentación (Tokenización)

Detección de Coherencia Multiescala:

Utiliza BIC (Criterio de Información Bayesiano) para evaluar similitud estadística entre ventanas temporales adyacentes
Para ventanas adyacentes $x_1, x_2 \in \mathbb{R}^{\delta \times d}$ , calcula:

$\Delta BIC = -2(\ell_{joint} - \ell_{sep}) + k \log(2\delta)$

Donde:

$\ell_{sep} = -\frac{\delta}{2}(\log|\Sigma_1| + \log|\Sigma_2|)$
$\ell_{joint} = -\delta \log|\Sigma_{12}|$
$k = d + \frac{d(d+1)}{2}$ (número de parámetros libres del modelo de covarianza completa)

Función Objetivo Global: $L_{BIC}(\{S_i\}) = \sum_{i=1}^{T'} \left(-\frac{|S_i|}{2}\log|\Sigma_i| + \frac{k}{2}\log|S_i|\right)$

Evaluación Multiescala:

Evalúa coherencia estadística en cada valor de $\delta$ dentro de un rango predefinido
Utiliza umbral adaptativo $\mu_\delta + \alpha \cdot \sigma_\delta$ para identificar puntos de segmentación candidatos
Elimina detecciones redundantes mediante supresión de no máximos

2. Fase de Resumen (Summarization)

Función de Resumen: $\phi(S_i) = \frac{1}{|S_i|} \sum_{t=\tau_{i-1}}^{\tau_i-1} x_t$

Utiliza agrupamiento por media como operación de resumen predeterminada, capturando características estadísticas de primer orden del segmento.

Puntos de Innovación Técnica

Segmentación Adaptativa: A diferencia de métodos de ventana fija, STaTS ajusta dinámicamente los límites de segmentos según cambios estadísticos locales
Extensión Multivariada: Se extiende naturalmente a series temporales multivariadas mediante matriz de covarianza completa
Detección Multiescala: Detecta cambios en diferentes resoluciones temporales, capturando tanto cambios abruptos a corto plazo como cambios graduales a largo plazo
Validez Estadística: Bajo suposiciones gaussianas multivariadas, la media del segmento es una estadística suficiente

Configuración Experimental

Conjuntos de Datos

Clasificación Univariada: UCR-128 (128 conjuntos de datos) y UCR-85 (85 conjuntos de datos)
Clasificación Multivariada: UEA-30 (30 conjuntos de datos)
Predicción Multivariada: ETTh1, ETTh2, ETTm1, Electricity

Métricas de Evaluación

Tareas de Clasificación: Precisión promedio y clasificación promedio
Tareas de Predicción: Error cuadrático medio normalizado (nMSE)

Métodos de Comparación

Líneas Base de Clasificación: T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
Variantes de Compresión: TS2Vec (uniforme), TS2Vec (GMM)
Líneas Base de Predicción: Informer, TCN

Detalles de Implementación

Rango de tamaño de ventana: $\delta \in \{5, 10, ..., 500\}$
Parámetro de umbral: $\alpha = 2$
Distancia de separación mínima: $s_{min} = 20$
Estabilidad numérica: Regularización de covarianza $\epsilon = 10^{-6}$

Resultados Experimentales

Resultados Principales

Rendimiento de Clasificación Univariada

Modelo	Precisión UCR-85	Clasificación UCR-85	Precisión UCR-128	Clasificación UCR-128	Longitud Promedio
TS2Vec (ori)	0.829	1.99	0.829	2.02	424.4/534.5
TS2Vec (media)	0.739	4.82	0.741	4.39	12.1/12.9
TS2Vec (uniforme)	0.621	8.21	0.616	8.10	12.1/12.9
TS2Vec (GMM)	0.655	7.35	0.664	6.92	60.7/73.2

Hallazgos Clave:

STaTS logra compresión de 33 veces manteniendo aproximadamente el 90% del rendimiento original
Significativamente superior a líneas base de segmentación uniforme y GMM

Robustez al Ruido

Modelo	UCR-85 (Ruido)	UCR-128 (Ruido)
TS2Vec (ori)	0.336	0.412
TS2Vec (media)	0.581	0.603
TS2Vec (uniforme)	0.475	0.485
TS2Vec (GMM)	0.505	0.522

Hallazgo Importante: En condiciones ruidosas, STaTS no solo mantiene ventaja competitiva sino que supera significativamente modelos de resolución completa.

Clasificación Multivariada

TS2Vec (media): Precisión 0.622, clasificación 4.70, compresión 20 veces
Superior a todas las variantes de compresión, manteniendo rendimiento competitivo con el modelo original

Predicción de Series Temporales

En predicción a largo plazo (H=720), STaTS coincide o supera TS2Vec original en múltiples conjuntos de datos, mientras logra compresión de 15 veces.

Experimentos de Ablación

Comparación de Estrategias de Segmentación: Segmentación estadística > Segmentación GMM > Segmentación uniforme
Evaluación Multiescala: Detección multiescala superior a escala única
Función de Resumen: Agrupamiento por media muestra mejor rendimiento en la mayoría de tareas

Análisis de Casos

El análisis cualitativo muestra que STaTS rastrea mejor las tendencias de señal real en predicción a largo plazo, reduciendo artefactos de oscilación, particularmente destacado en rangos de predicción ultra-largos (H=720).

Trabajo Relacionado

Clasificación de Series Temporales

Métodos Clásicos: shapelets, métodos basados en símbolos como BOSS
Aprendizaje Profundo: FCN, ResNet, InceptionTime
Métodos de Conjunto: HIVE-COTE

Predicción de Series Temporales

Avances Tempranos: LSTM secuencia a secuencia
Métodos Modernos: DeepAR, N-BEATS, Temporal Fusion Transformer
Mecanismos de Atención: Métodos de atención dispersa como Informer

Resumen de Series Temporales

Métodos Tradicionales: PAA, SAX (limitados a univariados, longitud fija)
Métodos Modernos: TICC (computacionalmente costoso, requiere resolución de optimización)
Ventajas de STaTS: Ligero, agnóstico del modelo, soporte multivariado

Conclusiones y Discusión

Conclusiones Principales

STaTS logra compresión de series temporales eficiente y consciente de la estructura, alcanzando compresión de 30 veces mientras mantiene 85-90% del rendimiento
Muestra excelente rendimiento en condiciones ruidosas, proporcionando efecto de desruido implícito
Como preprocesador agnóstico del modelo, se integra sin problemas en marcos existentes

Limitaciones

Suposiciones Estadísticas: Asume coherencia estadística local dentro de segmentos, puede funcionar mal en cambios dinámicos o sistemas caóticos
No Extremo a Extremo: No utiliza retroalimentación basada en gradientes para adaptar la estrategia de compresión
Sensibilidad de Parámetros: Requiere ajuste del rango de tamaño de ventana y parámetros de umbral

Direcciones Futuras

Configuración En Línea/Transmisión: Extensión a resumen en tiempo real e implementación en dispositivos periféricos
Datos Multimodales: Integración en redes de sensores o datos jerárquicos como video
Aprendizaje Adaptativo: Sistemas de aprendizaje adaptativo extremo a extremo bajo cambio de distribución o desviación conceptual

Evaluación Profunda

Fortalezas

Innovación Metodológica: Primera aplicación de criterios BIC multiescala a segmentación adaptativa de series temporales multivariadas
Suficiencia Experimental: Evaluación extensa en 150+ conjuntos de datos, cubriendo tareas de clasificación y predicción
Valor Práctico: Mejora significativa en eficiencia computacional (compresión 30 veces) con pérdida mínima de rendimiento
Robustez: Excelente rendimiento en condiciones ruidosas demuestra practicidad del método

Deficiencias

Análisis Teórico Insuficiente: Falta de garantías teóricas sobre cuándo y por qué STaTS supera otros métodos
Selección de Parámetros: Falta de orientación sistemática para elegir múltiples hiperparámetros
Limitaciones de Escenarios Aplicables: Aplicabilidad insuficientemente verificada para series temporales altamente irregulares o no estacionarias
Análisis de Complejidad Computacional: Falta análisis detallado de complejidad temporal

Impacto

Contribución Académica: Proporciona nueva perspectiva estadística para compresión de series temporales
Valor Práctico: Aplicable directamente a entornos con recursos limitados y procesamiento de series temporales a gran escala
Reproducibilidad: Descripción clara del método con detalles de implementación suficientes

Escenarios Aplicables

Procesamiento de Secuencias Largas: Particularmente adecuado para series temporales de longitud irregular
Entornos Ruidosos: Rendimiento superior en escenarios de alto ruido
Recursos Limitados: Adecuado para dispositivos periféricos o sistemas en tiempo real con recursos computacionales limitados
Herramienta de Preprocesamiento: Preprocesador universal para modelos de series temporales existentes

Referencias

El artículo cita trabajos importantes en análisis de series temporales, aprendizaje de representaciones y procesamiento de señales estadísticas, incluyendo:

Métodos Clásicos de Series Temporales: PAA, SAX, DTW
Métodos de Aprendizaje Profundo: TS2Vec, TS-TCC, InceptionTime
Métodos de Segmentación Estadística: BIC, TICC
Modelos de Predicción: Informer, N-BEATS, Temporal Fusion Transformer

Evaluación General: Este es un artículo de alta calidad en procesamiento de series temporales que propone el método STaTS con excelente desempeño en fundamentos teóricos, verificación experimental y valor práctico. El método llena un vacío importante en compresión de series temporales consciente de la estructura, realizando contribuciones significativas al campo del análisis de series temporales.