Time series data often contain latent temporal structure, transitions between locally stationary regimes, repeated motifs, and bursts of variability, that are rarely leveraged in standard representation learning pipelines. Existing models typically operate on raw or fixed-window sequences, treating all time steps as equally informative, which leads to inefficiencies, poor robustness, and limited scalability in long or noisy sequences. We propose STaTS, a lightweight, unsupervised framework for Structure-Aware Temporal Summarization that adaptively compresses both univariate and multivariate time series into compact, information-preserving token sequences. STaTS detects change points across multiple temporal resolutions using a BIC-based statistical divergence criterion, then summarizes each segment using simple functions like the mean or generative models such as GMMs. This process achieves up to 30x sequence compression while retaining core temporal dynamics. STaTS operates as a model-agnostic preprocessor and can be integrated with existing unsupervised time series encoders without retraining. Extensive experiments on 150+ datasets, including classification tasks on the UCR-85, UCR-128, and UEA-30 archives, and forecasting on ETTh1 and ETTh2, ETTm1, and Electricity, demonstrate that STaTS enables 85-90\% of the full-model performance while offering dramatic reductions in computational cost. Moreover, STaTS improves robustness under noise and preserves discriminative structure, outperforming uniform and clustering-based compression baselines. These results position STaTS as a principled, general-purpose solution for efficient, structure-aware time series modeling.
- ID Articolo: 2510.09593
- Titolo: STaTS: Structure-Aware Temporal Sequence Summarization via Statistical Window Merging
- Autori: Disharee Bhowmick, Ranjith Ramanathan, Sathyanarayanan N. Aakur
- Classificazione: cs.LG (Machine Learning), cs.CV (Computer Vision)
- Data di Pubblicazione: Ottobre 2025
- Link Articolo: https://arxiv.org/abs/2510.09593
I dati di serie temporali contengono tipicamente strutture temporali latenti, come transizioni tra stati localmente stazionari, modelli ricorrenti e esplosioni di variabilità, ma queste strutture sono raramente sfruttate nei flussi di lavoro standard di apprendimento delle rappresentazioni. I modelli esistenti elaborano tipicamente sequenze grezze o a finestre fisse, trattando tutti i passi temporali come ugualmente importanti, il che comporta inefficienza, scarsa robustezza e scalabilità limitata in sequenze lunghe o rumorose. Questo articolo propone STaTS, un framework leggero non supervisionato per il riassunto di serie temporali consapevole della struttura, in grado di comprimere adattivamente serie temporali univariate e multivariate in sequenze di token compatte e che preservano l'informazione.
I dati di serie temporali sono ampiamente diffusi in settori quali finanza, Internet delle Cose, medicina e altri campi. Con il progresso della tecnologia dei sensori, la lunghezza e la complessità delle serie temporali registrate crescono rapidamente, ponendo enormi richieste computazionali ai framework di comprensione delle sequenze basati su apprendimento automatico.
- Metodi Tradizionali: Approcci come PAA (Piecewise Aggregate Approximation), SAX (Symbolic Aggregate approXimation), DTW (Dynamic Time Warping) realizzano riassunti efficaci, ma si basano su finestre uniformi o codifiche simboliche rigide, ignorando i cambiamenti dinamici nella complessità del segnale
- Metodi di Apprendimento Profondo: Approcci come TS2Vec e TS-TCC elaborano sequenze complete o applicano finestre scorrevoli, senza considerare i cambiamenti semantici, causando ridondanza, sovraccarico computazionale e disallineamento tra la tokenizzazione del modello e le vere transizioni del segnale
I metodi esistenti presentano i seguenti problemi:
- Le strategie a finestra fissa possono sovra-segmentare regioni stabili mentre sotto-segmentano regioni complesse
- In condizioni rumorose, l'elaborazione uniforme degli input tende ad amplificare modelli falsi e ridurre la capacità di generalizzazione
- La mancanza di consapevolezza della struttura comporta inefficienza e propagazione di errori
- Propone il Framework STaTS: Framework di tokenizzazione consapevole della struttura basato su criteri di rilevamento dei cambiamenti BIC, che identifica segmenti statisticamente coerenti su più scale temporali
- Pipeline di Riassunto Modulare e Leggera: Comprime serie temporali oltre 30 volte mantenendo modelli significativi, realizzando modellazione a valle efficiente
- Metodo Non Supervisionato Agnostico al Modello: Senza necessità di modifiche architettoniche o ottimizzazione basata su gradienti, direttamente compatibile con encoder di serie temporali esistenti (come TS2Vec)
- Interfaccia Unificata: Applicabile a compiti di classificazione, previsione e robustezza, come strumento di preelaborazione universale per il riassunto di serie temporali
Data una serie temporale multivariata X∈RT×d (dove T è il numero di passi temporali e d è la dimensionalità), l'obiettivo è trasformare X in una sequenza più breve X~∈RT′×d, dove T′≪T, preservando al contempo la struttura sottostante necessaria per i compiti a valle.
Rilevamento di Coerenza Multi-Scala:
- Utilizza BIC (Bayesian Information Criterion) per valutare la similarità statistica di finestre temporali adiacenti
- Per finestre adiacenti x1,x2∈Rδ×d, calcola:
ΔBIC=−2(ℓjoint−ℓsep)+klog(2δ)
dove:
- ℓsep=−2δ(log∣Σ1∣+log∣Σ2∣)
- ℓjoint=−δlog∣Σ12∣
- k=d+2d(d+1) (numero di parametri liberi del modello di covarianza completa)
Funzione Obiettivo Globale:
LBIC({Si})=∑i=1T′(−2∣Si∣log∣Σi∣+2klog∣Si∣)
Valutazione Multi-Scala:
- Valuta la coerenza statistica su ogni valore di δ all'interno di un intervallo predefinito
- Utilizza una soglia adattiva μδ+α⋅σδ per identificare candidati punti di segmentazione
- Elimina rilevamenti ridondanti mediante soppressione non massimale
Funzione di Riassunto:
ϕ(Si)=∣Si∣1∑t=τi−1τi−1xt
Utilizza il pooling della media come operazione di riassunto predefinita, catturando le caratteristiche statistiche del primo ordine del segmento.
- Segmentazione Adattiva: A differenza dei metodi a finestra fissa, STaTS regola dinamicamente i confini dei segmenti in base ai cambiamenti statistici locali
- Estensione Multivariata: Si estende naturalmente a serie temporali multivariate attraverso la matrice di covarianza completa
- Rilevamento Multi-Scala: Rileva cambiamenti a diverse risoluzioni temporali, catturando sia mutamenti a breve termine che variazioni graduali a lungo termine
- Validità Statistica: Sotto l'assunzione gaussiana multivariata, la media del segmento è una statistica sufficiente
- Classificazione Univariata: UCR-128 (128 dataset) e UCR-85 (85 dataset)
- Classificazione Multivariata: UEA-30 (30 dataset)
- Previsione Multivariata: ETTh1, ETTh2, ETTm1, Electricity
- Compiti di Classificazione: Accuratezza media e ranking medio
- Compiti di Previsione: Errore quadratico medio normalizzato (nMSE)
- Baseline di Classificazione: T-Loss, TNC, TS-TCC, TST, DTW, TS2Vec
- Varianti Compresse: TS2Vec (uniform), TS2Vec (GMM)
- Baseline di Previsione: Informer, TCN
- Intervallo di dimensione della finestra: δ∈{5,10,...,500}
- Parametro di soglia: α=2
- Distanza di separazione minima: smin=20
- Stabilità numerica: Regolarizzazione della covarianza ϵ=10−6
| Modello | Accuratezza UCR-85 | Ranking UCR-85 | Accuratezza UCR-128 | Ranking UCR-128 | Lunghezza Media |
|---|
| TS2Vec (ori) | 0.829 | 1.99 | 0.829 | 2.02 | 424.4/534.5 |
| TS2Vec (mean) | 0.739 | 4.82 | 0.741 | 4.39 | 12.1/12.9 |
| TS2Vec (uniform) | 0.621 | 8.21 | 0.616 | 8.10 | 12.1/12.9 |
| TS2Vec (GMM) | 0.655 | 7.35 | 0.664 | 6.92 | 60.7/73.2 |
Scoperte Chiave:
- STaTS realizza una compressione di 33 volte, mantenendo circa il 90% delle prestazioni originali
- Significativamente superiore ai baseline di segmentazione uniforme e GMM
| Modello | UCR-85 (Rumore) | UCR-128 (Rumore) |
|---|
| TS2Vec (ori) | 0.336 | 0.412 |
| TS2Vec (mean) | 0.581 | 0.603 |
| TS2Vec (uniform) | 0.475 | 0.485 |
| TS2Vec (GMM) | 0.505 | 0.522 |
Scoperta Importante: In condizioni rumorose, STaTS non solo mantiene un vantaggio competitivo, ma supera significativamente il modello a risoluzione completa.
- TS2Vec (mean): Accuratezza 0.622, ranking 4.70, compressione 20 volte
- Superiore a tutte le varianti compresse, mantenendo prestazioni competitive con il modello originale
Nella previsione a lungo termine (H=720), STaTS corrisponde o supera il TS2Vec originale su più dataset, realizzando al contempo una compressione di 15 volte.
- Confronto Strategie di Segmentazione: Segmentazione statistica > Segmentazione GMM > Segmentazione uniforme
- Valutazione Multi-Scala: Il rilevamento multi-scala supera il singolo scala
- Funzione di Riassunto: Il pooling della media mostra le migliori prestazioni nella maggior parte dei compiti
L'analisi qualitativa mostra che STaTS traccia meglio i trend del segnale reale nella previsione a lungo termine, riducendo gli artefatti di oscillazione, in particolare in intervalli di previsione ultra-lunghi (H=720).
- Metodi Classici: shapelets, BOSS e altri metodi basati su simboli
- Apprendimento Profondo: FCN, ResNet, InceptionTime
- Metodi di Ensemble: HIVE-COTE
- Progressi Iniziali: LSTM sequenza-a-sequenza
- Metodi Moderni: DeepAR, N-BEATS, Temporal Fusion Transformer
- Meccanismi di Attenzione: Informer e altri metodi di attenzione sparsa
- Metodi Tradizionali: PAA, SAX (limitati a univariato, lunghezza fissa)
- Metodi Moderni: TICC (computazionalmente costoso, richiede risoluzione di ottimizzazione)
- Vantaggi di STaTS: Leggero, agnostico al modello, supporto multivariato
- STaTS realizza una compressione di serie temporali efficiente e consapevole della struttura, raggiungendo una compressione di 30 volte mantenendo l'85-90% delle prestazioni
- Mostra eccellenti prestazioni in condizioni rumorose, fornendo un effetto di denoising implicito
- Come preprocessore agnostico al modello, si integra perfettamente nei framework esistenti
- Assunzioni Statistiche: Presuppone coerenza statistica locale all'interno dei segmenti, potrebbe avere prestazioni scadenti in sistemi dinamici a mutamento brusco o caotici
- Non End-to-End: Non utilizza retroazione basata su gradienti per adattare la strategia di compressione
- Sensibilità ai Parametri: Richiede l'ottimizzazione dell'intervallo di dimensione della finestra e dei parametri di soglia
- Impostazioni Online/Streaming: Estensione al riassunto in tempo reale e distribuzione edge
- Dati Multimodali: Integrazione in reti di sensori o dati gerarchici come video
- Apprendimento Adattivo: Sistemi di apprendimento adattivo end-to-end sotto spostamento di distribuzione o deriva concettuale
- Innovazione Metodologica: Prima applicazione di criteri BIC multi-scala a segmentazione adattiva di serie temporali multivariate
- Completezza Sperimentale: Valutazione estesa su 150+ dataset, coprendo compiti di classificazione e previsione
- Valore Pratico: Significativo miglioramento dell'efficienza computazionale (compressione 30 volte) con perdita di prestazioni minima
- Robustezza: Eccellenti prestazioni in condizioni rumorose dimostrano l'applicabilità pratica del metodo
- Analisi Teorica Insufficiente: Mancanza di garanzie teoriche su quando e perché STaTS supera altri metodi
- Scelta dei Parametri: Mancanza di guida sistematica nella selezione di più iperparametri
- Limitazioni di Applicabilità: L'applicabilità a serie temporali altamente irregolari o non stazionarie non è sufficientemente verificata
- Analisi della Complessità Computazionale: Mancanza di analisi dettagliata della complessità temporale
- Contributo Accademico: Fornisce una nuova prospettiva statistica per la compressione di serie temporali
- Valore Pratico: Applicabile direttamente in ambienti con risorse limitate e elaborazione di serie temporali su larga scala
- Riproducibilità: Descrizione del metodo chiara, dettagli di implementazione sufficienti
- Elaborazione di Sequenze Lunghe: Particolarmente adatto a serie temporali di lunghezza irregolare
- Ambienti Rumorosi: Prestazioni eccellenti in scenari ad alto rumore
- Risorse Limitate: Adatto a dispositivi edge o sistemi in tempo reale con risorse computazionali limitate
- Strumento di Preelaborazione: Come preprocessore universale per modelli di serie temporali esistenti
L'articolo cita importanti lavori nei campi dell'analisi di serie temporali, dell'apprendimento delle rappresentazioni e dell'elaborazione dei segnali statistici, inclusi:
- Metodi Classici di Serie Temporali: PAA, SAX, DTW
- Metodi di Apprendimento Profondo: TS2Vec, TS-TCC, InceptionTime
- Metodi di Segmentazione Statistica: BIC, TICC
- Modelli di Previsione: Informer, N-BEATS, Temporal Fusion Transformer
Valutazione Complessiva: Questo è un articolo di alta qualità nel campo dell'elaborazione di serie temporali, con il metodo STaTS proposto che dimostra eccellenti prestazioni in base fondamentale, verifica sperimentale e valore pratico. Il metodo colma un'importante lacuna nella compressione di serie temporali consapevole della struttura e fornisce un contributo significativo al campo dell'analisi di serie temporali.