2025-11-20T07:19:14.926764

STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging

Bhowmick, Ramanathan, Aakur

Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.

academic

STaTS: Riassunto di Sequenze Temporali Consapevole della Struttura tramite Fusione di Finestre Statistiche

Informazioni Fondamentali

ID Articolo: 2510.09593
Titolo: STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
Autori: Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
Classificazione: cs.LG (Machine Learning), cs.CV (Computer Vision)
Data di Pubblicazione: Ottobre 2025
Link Articolo: https://arxiv.org/abs/2510.09593

Riassunto

I dati di serie temporali contengono tipicamente strutture temporali latenti, come transizioni tra stati localmente stazionari, modelli ricorrenti e esplosioni di variabilità, ma queste strutture sono raramente sfruttate nei flussi di lavoro standard di apprendimento delle rappresentazioni. I modelli esistenti elaborano tipicamente sequenze grezze o a finestre fisse, trattando tutti i passi temporali come ugualmente importanti, il che comporta inefficienza, scarsa robustezza e scalabilità limitata in sequenze lunghe o rumorose. Questo articolo propone STaTS, un framework leggero non supervisionato per il riassunto di serie temporali consapevole della struttura, in grado di comprimere adattivamente serie temporali univariate e multivariate in sequenze di token compatte e che preservano l'informazione.

Contesto di Ricerca e Motivazione

Definizione del Problema

I dati di serie temporali sono ampiamente diffusi in settori quali finanza, Internet delle Cose, medicina e altri campi. Con il progresso della tecnologia dei sensori, la lunghezza e la complessità delle serie temporali registrate crescono rapidamente, ponendo enormi richieste computazionali ai framework di comprensione delle sequenze basati su apprendimento automatico.

Limitazioni dei Metodi Esistenti

Metodi Tradizionali: Approcci come PAA (Piecewise Aggregate Approximation), SAX (Symbolic Aggregate approXimation), DTW (Dynamic Time Warping) realizzano riassunti efficaci, ma si basano su finestre uniformi o codifiche simboliche rigide, ignorando i cambiamenti dinamici nella complessità del segnale
Metodi di Apprendimento Profondo: Approcci come TS2Vec e TS-TCC elaborano sequenze complete o applicano finestre scorrevoli, senza considerare i cambiamenti semantici, causando ridondanza, sovraccarico computazionale e disallineamento tra la tokenizzazione del modello e le vere transizioni del segnale

Motivazione della Ricerca

I metodi esistenti presentano i seguenti problemi:

Le strategie a finestra fissa possono sovra-segmentare regioni stabili mentre sotto-segmentano regioni complesse
In condizioni rumorose, l'elaborazione uniforme degli input tende ad amplificare modelli falsi e ridurre la capacità di generalizzazione
La mancanza di consapevolezza della struttura comporta inefficienza e propagazione di errori

Contributi Principali

Propone il Framework STaTS: Framework di tokenizzazione consapevole della struttura basato su criteri di rilevamento dei cambiamenti BIC, che identifica segmenti statisticamente coerenti su più scale temporali
Pipeline di Riassunto Modulare e Leggera: Comprime serie temporali oltre 30 volte mantenendo modelli significativi, realizzando modellazione a valle efficiente
Metodo Non Supervisionato Agnostico al Modello: Senza necessità di modifiche architettoniche o ottimizzazione basata su gradienti, direttamente compatibile con encoder di serie temporali esistenti (come TS2Vec)
Interfaccia Unificata: Applicabile a compiti di classificazione, previsione e robustezza, come strumento di preelaborazione universale per il riassunto di serie temporali

Spiegazione Dettagliata del Metodo

Definizione del Compito

Data una serie temporale multivariata $X \in \mathbb{R}^{T \times d}$ (dove $T$ è il numero di passi temporali e $d$ è la dimensionalità), l'obiettivo è trasformare $X$ in una sequenza più breve $\tilde{X} \in \mathbb{R}^{T' \times d}$ , dove $T' \ll T$ , preservando al contempo la struttura sottostante necessaria per i compiti a valle.

Architettura del Modello

1. Fase di Segmentazione (Tokenization)

Rilevamento di Coerenza Multi-Scala:

Utilizza BIC (Bayesian Information Criterion) per valutare la similarità statistica di finestre temporali adiacenti
Per finestre adiacenti $x_1, x_2 \in \mathbb{R}^{\delta \times d}$ , calcola:

$\Delta BIC = -2(\ell_{joint} - \ell_{sep}) + k \log(2\delta)$

dove:

$\ell_{sep} = -\frac{\delta}{2}(\log|\Sigma_1| + \log|\Sigma_2|)$
$\ell_{joint} = -\delta \log|\Sigma_{12}|$
$k = d + \frac{d(d+1)}{2}$ (numero di parametri liberi del modello di covarianza completa)

Funzione Obiettivo Globale: $L_{BIC}(\{S_i\}) = \sum_{i=1}^{T'} \left(-\frac{|S_i|}{2}\log|\Sigma_i| + \frac{k}{2}\log|S_i|\right)$

Valutazione Multi-Scala:

Valuta la coerenza statistica su ogni valore di $\delta$ all'interno di un intervallo predefinito
Utilizza una soglia adattiva $\mu_\delta + \alpha \cdot \sigma_\delta$ per identificare candidati punti di segmentazione
Elimina rilevamenti ridondanti mediante soppressione non massimale

2. Fase di Riassunto (Summarization)

Funzione di Riassunto: $\phi(S_i) = \frac{1}{|S_i|} \sum_{t=\tau_{i-1}}^{\tau_i-1} x_t$

Utilizza il pooling della media come operazione di riassunto predefinita, catturando le caratteristiche statistiche del primo ordine del segmento.

Punti di Innovazione Tecnica

Segmentazione Adattiva: A differenza dei metodi a finestra fissa, STaTS regola dinamicamente i confini dei segmenti in base ai cambiamenti statistici locali
Estensione Multivariata: Si estende naturalmente a serie temporali multivariate attraverso la matrice di covarianza completa
Rilevamento Multi-Scala: Rileva cambiamenti a diverse risoluzioni temporali, catturando sia mutamenti a breve termine che variazioni graduali a lungo termine
Validità Statistica: Sotto l'assunzione gaussiana multivariata, la media del segmento è una statistica sufficiente

Configurazione Sperimentale

Dataset

Classificazione Univariata: UCR-128 (128 dataset) e UCR-85 (85 dataset)
Classificazione Multivariata: UEA-30 (30 dataset)
Previsione Multivariata: ETTh1, ETTh2, ETTm1, Electricity

Metriche di Valutazione

Compiti di Classificazione: Accuratezza media e ranking medio
Compiti di Previsione: Errore quadratico medio normalizzato (nMSE)

Metodi di Confronto

Baseline di Classificazione: T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
Varianti Compresse: TS2Vec (uniform), TS2Vec (GMM)
Baseline di Previsione: Informer, TCN

Dettagli di Implementazione

Intervallo di dimensione della finestra: $\delta \in \{5, 10, ..., 500\}$
Parametro di soglia: $\alpha = 2$
Distanza di separazione minima: $s_{min} = 20$
Stabilità numerica: Regolarizzazione della covarianza $\epsilon = 10^{-6}$

Risultati Sperimentali

Risultati Principali

Prestazioni di Classificazione Univariata

Modello	Accuratezza UCR-85	Ranking UCR-85	Accuratezza UCR-128	Ranking UCR-128	Lunghezza Media
TS2Vec (ori)	0.829	1.99	0.829	2.02	424.4/534.5
TS2Vec (mean)	0.739	4.82	0.741	4.39	12.1/12.9
TS2Vec (uniform)	0.621	8.21	0.616	8.10	12.1/12.9
TS2Vec (GMM)	0.655	7.35	0.664	6.92	60.7/73.2

Scoperte Chiave:

STaTS realizza una compressione di 33 volte, mantenendo circa il 90% delle prestazioni originali
Significativamente superiore ai baseline di segmentazione uniforme e GMM

Robustezza al Rumore

Modello	UCR-85 (Rumore)	UCR-128 (Rumore)
TS2Vec (ori)	0.336	0.412
TS2Vec (mean)	0.581	0.603
TS2Vec (uniform)	0.475	0.485
TS2Vec (GMM)	0.505	0.522

Scoperta Importante: In condizioni rumorose, STaTS non solo mantiene un vantaggio competitivo, ma supera significativamente il modello a risoluzione completa.

Classificazione Multivariata

TS2Vec (mean): Accuratezza 0.622, ranking 4.70, compressione 20 volte
Superiore a tutte le varianti compresse, mantenendo prestazioni competitive con il modello originale

Previsione di Serie Temporali

Nella previsione a lungo termine (H=720), STaTS corrisponde o supera il TS2Vec originale su più dataset, realizzando al contempo una compressione di 15 volte.

Esperimenti di Ablazione

Confronto Strategie di Segmentazione: Segmentazione statistica > Segmentazione GMM > Segmentazione uniforme
Valutazione Multi-Scala: Il rilevamento multi-scala supera il singolo scala
Funzione di Riassunto: Il pooling della media mostra le migliori prestazioni nella maggior parte dei compiti

Analisi di Casi

L'analisi qualitativa mostra che STaTS traccia meglio i trend del segnale reale nella previsione a lungo termine, riducendo gli artefatti di oscillazione, in particolare in intervalli di previsione ultra-lunghi (H=720).

Lavori Correlati

Classificazione di Serie Temporali

Metodi Classici: shapelets, BOSS e altri metodi basati su simboli
Apprendimento Profondo: FCN, ResNet, InceptionTime
Metodi di Ensemble: HIVE-COTE

Previsione di Serie Temporali

Progressi Iniziali: LSTM sequenza-a-sequenza
Metodi Moderni: DeepAR, N-BEATS, Temporal Fusion Transformer
Meccanismi di Attenzione: Informer e altri metodi di attenzione sparsa

Riassunto di Serie Temporali

Metodi Tradizionali: PAA, SAX (limitati a univariato, lunghezza fissa)
Metodi Moderni: TICC (computazionalmente costoso, richiede risoluzione di ottimizzazione)
Vantaggi di STaTS: Leggero, agnostico al modello, supporto multivariato

Conclusioni e Discussione

Conclusioni Principali

STaTS realizza una compressione di serie temporali efficiente e consapevole della struttura, raggiungendo una compressione di 30 volte mantenendo l'85-90% delle prestazioni
Mostra eccellenti prestazioni in condizioni rumorose, fornendo un effetto di denoising implicito
Come preprocessore agnostico al modello, si integra perfettamente nei framework esistenti

Limitazioni

Assunzioni Statistiche: Presuppone coerenza statistica locale all'interno dei segmenti, potrebbe avere prestazioni scadenti in sistemi dinamici a mutamento brusco o caotici
Non End-to-End: Non utilizza retroazione basata su gradienti per adattare la strategia di compressione
Sensibilità ai Parametri: Richiede l'ottimizzazione dell'intervallo di dimensione della finestra e dei parametri di soglia

Direzioni Future

Impostazioni Online/Streaming: Estensione al riassunto in tempo reale e distribuzione edge
Dati Multimodali: Integrazione in reti di sensori o dati gerarchici come video
Apprendimento Adattivo: Sistemi di apprendimento adattivo end-to-end sotto spostamento di distribuzione o deriva concettuale

Valutazione Approfondita

Punti di Forza

Innovazione Metodologica: Prima applicazione di criteri BIC multi-scala a segmentazione adattiva di serie temporali multivariate
Completezza Sperimentale: Valutazione estesa su 150+ dataset, coprendo compiti di classificazione e previsione
Valore Pratico: Significativo miglioramento dell'efficienza computazionale (compressione 30 volte) con perdita di prestazioni minima
Robustezza: Eccellenti prestazioni in condizioni rumorose dimostrano l'applicabilità pratica del metodo

Insufficienze

Analisi Teorica Insufficiente: Mancanza di garanzie teoriche su quando e perché STaTS supera altri metodi
Scelta dei Parametri: Mancanza di guida sistematica nella selezione di più iperparametri
Limitazioni di Applicabilità: L'applicabilità a serie temporali altamente irregolari o non stazionarie non è sufficientemente verificata
Analisi della Complessità Computazionale: Mancanza di analisi dettagliata della complessità temporale

Impatto

Contributo Accademico: Fornisce una nuova prospettiva statistica per la compressione di serie temporali
Valore Pratico: Applicabile direttamente in ambienti con risorse limitate e elaborazione di serie temporali su larga scala
Riproducibilità: Descrizione del metodo chiara, dettagli di implementazione sufficienti

Scenari Applicabili

Elaborazione di Sequenze Lunghe: Particolarmente adatto a serie temporali di lunghezza irregolare
Ambienti Rumorosi: Prestazioni eccellenti in scenari ad alto rumore
Risorse Limitate: Adatto a dispositivi edge o sistemi in tempo reale con risorse computazionali limitate
Strumento di Preelaborazione: Come preprocessore universale per modelli di serie temporali esistenti

Bibliografia

L'articolo cita importanti lavori nei campi dell'analisi di serie temporali, dell'apprendimento delle rappresentazioni e dell'elaborazione dei segnali statistici, inclusi:

Metodi Classici di Serie Temporali: PAA, SAX, DTW
Metodi di Apprendimento Profondo: TS2Vec, TS-TCC, InceptionTime
Metodi di Segmentazione Statistica: BIC, TICC
Modelli di Previsione: Informer, N-BEATS, Temporal Fusion Transformer

Valutazione Complessiva: Questo è un articolo di alta qualità nel campo dell'elaborazione di serie temporali, con il metodo STaTS proposto che dimostra eccellenti prestazioni in base fondamentale, verifica sperimentale e valore pratico. Il metodo colma un'importante lacuna nella compressione di serie temporali consapevole della struttura e fornisce un contributo significativo al campo dell'analisi di serie temporali.