Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.
- ID del Artículo: 2510.09593
- Título: STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
- Autores: Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
- Clasificación: cs.LG (Aprendizaje Automático), cs.CV (Visión por Computadora)
- Fecha de Publicación: Octubre de 2025
- Enlace del Artículo: https://arxiv.org/abs/2510.09593
Los datos de series temporales generalmente contienen estructuras temporales latentes, como transiciones entre estados localmente estacionarios, patrones repetitivos y ráfagas de variabilidad, pero estas estructuras rara vez se aprovechan en los flujos de trabajo estándar de aprendizaje de representaciones. Los modelos existentes típicamente procesan secuencias crudas o de ventana fija, tratando todos los pasos temporales como igualmente importantes, lo que resulta en ineficiencia, robustez deficiente y escalabilidad limitada en secuencias largas o ruidosas. Este artículo propone STaTS, un marco ligero no supervisado para resumen de series temporales consciente de la estructura, capaz de comprimir de manera adaptativa series temporales univariadas y multivariadas en secuencias de tokens compactas que preservan información.
Los datos de series temporales están ampliamente presentes en finanzas, Internet de las Cosas, medicina y otros campos. Con el avance de la tecnología de sensores, la longitud y complejidad de las series temporales registradas crecen rápidamente, imponiendo demandas computacionales enormes en marcos de comprensión de secuencias basados en aprendizaje automático.
- Métodos Tradicionales: Como PAA (Aproximación de Agregación Segmentada), SAX (Aproximación de Agregación Simbólica), DTW (Deformación Dinámica del Tiempo), etc., logran resúmenes efectivos pero dependen de ventanas uniformes o codificación simbólica rígida, ignorando cambios dinámicos en la complejidad de la señal
- Métodos de Aprendizaje Profundo: Como TS2Vec y TS-TCC procesan secuencias completas o aplican ventanas deslizantes sin considerar cambios semánticos, resultando en redundancia, sobrecarga computacional y desalineación entre la tokenización del modelo y transiciones reales de la señal
Los métodos existentes presentan los siguientes problemas:
- Las estrategias de ventana fija pueden sobre-particionar regiones estables mientras sub-particionar regiones complejas
- En condiciones ruidosas, el procesamiento uniforme de entradas tiende a amplificar patrones espurios y reducir la capacidad de generalización
- La falta de conciencia estructural conduce a ineficiencia y propagación de errores
- Propuesta del Marco STaTS: Marco de tokenización consciente de la estructura basado en criterios de detección de cambios BIC que identifica segmentos estadísticamente coherentes en múltiples escalas temporales
- Tubería de Resumen Modular y Ligera: Comprime series temporales más de 30 veces mientras mantiene patrones significativos, permitiendo modelado eficiente en tareas posteriores
- Método No Supervisado Agnóstico del Modelo: Sin necesidad de cambios de arquitectura o ajuste basado en gradientes, compatible directamente con codificadores de series temporales existentes como TS2Vec
- Interfaz Unificada: Aplicable a tareas de clasificación, predicción y robustez, funcionando como herramienta de preprocesamiento universal para resumen de series temporales
Dada una serie temporal multivariada X∈RT×d (donde T es el número de pasos temporales y d es la dimensionalidad), el objetivo es transformar X en una secuencia más corta X~∈RT′×d, donde T′≪T, mientras se preserva la estructura subyacente requerida para tareas posteriores.
Detección de Coherencia Multiescala:
- Utiliza BIC (Criterio de Información Bayesiano) para evaluar similitud estadística entre ventanas temporales adyacentes
- Para ventanas adyacentes x1,x2∈Rδ×d, calcula:
ΔBIC=−2(ℓjoint−ℓsep)+klog(2δ)
Donde:
- ℓsep=−2δ(log∣Σ1∣+log∣Σ2∣)
- ℓjoint=−δlog∣Σ12∣
- k=d+2d(d+1) (número de parámetros libres del modelo de covarianza completa)
Función Objetivo Global:
LBIC({Si})=∑i=1T′(−2∣Si∣log∣Σi∣+2klog∣Si∣)
Evaluación Multiescala:
- Evalúa coherencia estadística en cada valor de δ dentro de un rango predefinido
- Utiliza umbral adaptativo μδ+α⋅σδ para identificar puntos de segmentación candidatos
- Elimina detecciones redundantes mediante supresión de no máximos
Función de Resumen:
ϕ(Si)=∣Si∣1∑t=τi−1τi−1xt
Utiliza agrupamiento por media como operación de resumen predeterminada, capturando características estadísticas de primer orden del segmento.
- Segmentación Adaptativa: A diferencia de métodos de ventana fija, STaTS ajusta dinámicamente los límites de segmentos según cambios estadísticos locales
- Extensión Multivariada: Se extiende naturalmente a series temporales multivariadas mediante matriz de covarianza completa
- Detección Multiescala: Detecta cambios en diferentes resoluciones temporales, capturando tanto cambios abruptos a corto plazo como cambios graduales a largo plazo
- Validez Estadística: Bajo suposiciones gaussianas multivariadas, la media del segmento es una estadística suficiente
- Clasificación Univariada: UCR-128 (128 conjuntos de datos) y UCR-85 (85 conjuntos de datos)
- Clasificación Multivariada: UEA-30 (30 conjuntos de datos)
- Predicción Multivariada: ETTh1, ETTh2, ETTm1, Electricity
- Tareas de Clasificación: Precisión promedio y clasificación promedio
- Tareas de Predicción: Error cuadrático medio normalizado (nMSE)
- Líneas Base de Clasificación: T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
- Variantes de Compresión: TS2Vec (uniforme), TS2Vec (GMM)
- Líneas Base de Predicción: Informer, TCN
- Rango de tamaño de ventana: δ∈{5,10,...,500}
- Parámetro de umbral: α=2
- Distancia de separación mínima: smin=20
- Estabilidad numérica: Regularización de covarianza ϵ=10−6
| Modelo | Precisión UCR-85 | Clasificación UCR-85 | Precisión UCR-128 | Clasificación UCR-128 | Longitud Promedio |
|---|
| TS2Vec (ori) | 0.829 | 1.99 | 0.829 | 2.02 | 424.4/534.5 |
| TS2Vec (media) | 0.739 | 4.82 | 0.741 | 4.39 | 12.1/12.9 |
| TS2Vec (uniforme) | 0.621 | 8.21 | 0.616 | 8.10 | 12.1/12.9 |
| TS2Vec (GMM) | 0.655 | 7.35 | 0.664 | 6.92 | 60.7/73.2 |
Hallazgos Clave:
- STaTS logra compresión de 33 veces manteniendo aproximadamente el 90% del rendimiento original
- Significativamente superior a líneas base de segmentación uniforme y GMM
| Modelo | UCR-85 (Ruido) | UCR-128 (Ruido) |
|---|
| TS2Vec (ori) | 0.336 | 0.412 |
| TS2Vec (media) | 0.581 | 0.603 |
| TS2Vec (uniforme) | 0.475 | 0.485 |
| TS2Vec (GMM) | 0.505 | 0.522 |
Hallazgo Importante: En condiciones ruidosas, STaTS no solo mantiene ventaja competitiva sino que supera significativamente modelos de resolución completa.
- TS2Vec (media): Precisión 0.622, clasificación 4.70, compresión 20 veces
- Superior a todas las variantes de compresión, manteniendo rendimiento competitivo con el modelo original
En predicción a largo plazo (H=720), STaTS coincide o supera TS2Vec original en múltiples conjuntos de datos, mientras logra compresión de 15 veces.
- Comparación de Estrategias de Segmentación: Segmentación estadística > Segmentación GMM > Segmentación uniforme
- Evaluación Multiescala: Detección multiescala superior a escala única
- Función de Resumen: Agrupamiento por media muestra mejor rendimiento en la mayoría de tareas
El análisis cualitativo muestra que STaTS rastrea mejor las tendencias de señal real en predicción a largo plazo, reduciendo artefactos de oscilación, particularmente destacado en rangos de predicción ultra-largos (H=720).
- Métodos Clásicos: shapelets, métodos basados en símbolos como BOSS
- Aprendizaje Profundo: FCN, ResNet, InceptionTime
- Métodos de Conjunto: HIVE-COTE
- Avances Tempranos: LSTM secuencia a secuencia
- Métodos Modernos: DeepAR, N-BEATS, Temporal Fusion Transformer
- Mecanismos de Atención: Métodos de atención dispersa como Informer
- Métodos Tradicionales: PAA, SAX (limitados a univariados, longitud fija)
- Métodos Modernos: TICC (computacionalmente costoso, requiere resolución de optimización)
- Ventajas de STaTS: Ligero, agnóstico del modelo, soporte multivariado
- STaTS logra compresión de series temporales eficiente y consciente de la estructura, alcanzando compresión de 30 veces mientras mantiene 85-90% del rendimiento
- Muestra excelente rendimiento en condiciones ruidosas, proporcionando efecto de desruido implícito
- Como preprocesador agnóstico del modelo, se integra sin problemas en marcos existentes
- Suposiciones Estadísticas: Asume coherencia estadística local dentro de segmentos, puede funcionar mal en cambios dinámicos o sistemas caóticos
- No Extremo a Extremo: No utiliza retroalimentación basada en gradientes para adaptar la estrategia de compresión
- Sensibilidad de Parámetros: Requiere ajuste del rango de tamaño de ventana y parámetros de umbral
- Configuración En Línea/Transmisión: Extensión a resumen en tiempo real e implementación en dispositivos periféricos
- Datos Multimodales: Integración en redes de sensores o datos jerárquicos como video
- Aprendizaje Adaptativo: Sistemas de aprendizaje adaptativo extremo a extremo bajo cambio de distribución o desviación conceptual
- Innovación Metodológica: Primera aplicación de criterios BIC multiescala a segmentación adaptativa de series temporales multivariadas
- Suficiencia Experimental: Evaluación extensa en 150+ conjuntos de datos, cubriendo tareas de clasificación y predicción
- Valor Práctico: Mejora significativa en eficiencia computacional (compresión 30 veces) con pérdida mínima de rendimiento
- Robustez: Excelente rendimiento en condiciones ruidosas demuestra practicidad del método
- Análisis Teórico Insuficiente: Falta de garantías teóricas sobre cuándo y por qué STaTS supera otros métodos
- Selección de Parámetros: Falta de orientación sistemática para elegir múltiples hiperparámetros
- Limitaciones de Escenarios Aplicables: Aplicabilidad insuficientemente verificada para series temporales altamente irregulares o no estacionarias
- Análisis de Complejidad Computacional: Falta análisis detallado de complejidad temporal
- Contribución Académica: Proporciona nueva perspectiva estadística para compresión de series temporales
- Valor Práctico: Aplicable directamente a entornos con recursos limitados y procesamiento de series temporales a gran escala
- Reproducibilidad: Descripción clara del método con detalles de implementación suficientes
- Procesamiento de Secuencias Largas: Particularmente adecuado para series temporales de longitud irregular
- Entornos Ruidosos: Rendimiento superior en escenarios de alto ruido
- Recursos Limitados: Adecuado para dispositivos periféricos o sistemas en tiempo real con recursos computacionales limitados
- Herramienta de Preprocesamiento: Preprocesador universal para modelos de series temporales existentes
El artículo cita trabajos importantes en análisis de series temporales, aprendizaje de representaciones y procesamiento de señales estadísticas, incluyendo:
- Métodos Clásicos de Series Temporales: PAA, SAX, DTW
- Métodos de Aprendizaje Profundo: TS2Vec, TS-TCC, InceptionTime
- Métodos de Segmentación Estadística: BIC, TICC
- Modelos de Predicción: Informer, N-BEATS, Temporal Fusion Transformer
Evaluación General: Este es un artículo de alta calidad en procesamiento de series temporales que propone el método STaTS con excelente desempeño en fundamentos teóricos, verificación experimental y valor práctico. El método llena un vacío importante en compresión de series temporales consciente de la estructura, realizando contribuciones significativas al campo del análisis de series temporales.