2025-11-22T19:13:16.751799

A protocol to reduce worst-case latency in deflection-based on-chip networks

Indrusiak
We present a novel protocol that reduces worst-case packet latency in deflection-based on-chip interconnect networks. It enforces the deflection of the header of a packet but not its payload, resulting in a reduction in overall network traffic and, more importantly, worst-case packet latency due to decreased pre-injection latency.
academic

Un protocollo per ridurre la latenza nel caso peggiore nelle reti on-chip basate su deflazione

Informazioni Fondamentali

  • ID Articolo: 2510.11361
  • Titolo: A protocol to reduce worst-case latency in deflection-based on-chip networks
  • Autore: Leandro Soares Indrusiak (University of Leeds)
  • Classificazione: cs.NI (Architettura di Rete e Internet), cs.PF (Prestazioni)
  • Data di Pubblicazione: 13 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.11361

Riassunto

Questo articolo propone un nuovo protocollo per ridurre la latenza dei pacchetti nel caso peggiore nelle reti di interconnessione on-chip (NoC) basate su routing per deflazione. Il protocollo forza la deflazione solo dell'intestazione del pacchetto anziché del carico utile, riducendo così il traffico di rete complessivo e, più importantemente, diminuendo la latenza di iniezione pre-deflazione per ridurre la latenza dei pacchetti nel caso peggiore.

Contesto di Ricerca e Motivazione

Definizione del Problema

  1. Problema Centrale: Nelle reti on-chip basate su routing per deflazione, i meccanismi tradizionali di deflazione dell'intero pacchetto causano gravi problemi di latenza, in particolare nei sistemi embedded real-time dove sono richieste garanzie di prestazioni.
  2. Importanza del Problema:
    • Le reti di routing per deflazione, sebbene offrano vantaggi di efficienza delle risorse (riduzione dell'85% dell'area del chip, riduzione della potenza di 10 volte), producono impatti significativi sulla latenza di rete
    • Le piattaforme multiprocessore embedded richiedono garanzie di prestazioni; l'aumento della latenza influisce direttamente sulle prestazioni end-to-end
    • I modelli di analisi esistenti mostrano che la deflazione aumenta significativamente la latenza nel caso peggiore
  3. Limitazioni degli Approcci Esistenti:
    • Il routing per deflazione tradizionale invia l'intero pacchetto (intestazione e carico utile) lungo un percorso alternativo durante la congestione
    • Questa pratica aumenta il traffico di rete non necessario, specialmente quando il pacchetto deve tornare al punto di iniezione per un nuovo tentativo
    • I metodi di ottimizzazione esistenti si concentrano principalmente sulla modifica del routing o sulla riduzione del numero di deflazioni, senza considerare l'ottimizzazione del traffico durante il processo di deflazione
  4. Motivazione della Ricerca:
    • Osservazione che i pacchetti deflessi passano sempre attraverso il loro switch di iniezione prima di raggiungere nuovamente la destinazione
    • Proposta di deflare solo l'intestazione scartando il carico utile, reinettando il carico utile nel punto di iniezione
    • Obiettivo di ridurre l'interferenza di rete, migliorando così la latenza complessiva nel caso peggiore

Contributi Principali

  1. Proposta di un Nuovo Protocollo di Deflazione: Separazione innovativa dell'intestazione e del carico utile del pacchetto, deflando solo l'intestazione mentre si scarta il carico utile
  2. Sviluppo di un Modello di Analisi Teorica: Modifica del framework di analisi della latenza nel caso peggiore esistente, quantificando i miglioramenti di prestazioni del nuovo protocollo
  3. Fornitura di Garanzie di Prestazioni: Dimostrazione teorica che il nuovo protocollo supera i metodi tradizionali in termini di latenza nel caso peggiore
  4. Verifica Sperimentale Estesa: Valutazione attraverso benchmark specifici per applicazioni e valutazioni sintetiche su larga scala, dimostrando l'efficacia del protocollo in diversi scenari

Descrizione Dettagliata del Metodo

Definizione del Compito

Input: Rete on-chip senza router basata su topologia ad anello, che impiega meccanismo di routing per deflazione dell'intero pacchetto Output: Protocollo di deflazione migliorato che riduce la latenza dei pacchetti nel caso peggiore Vincoli: Mantenimento della funzionalità di rete originale, nessun aumento del sovraccarico di buffer, soddisfacimento dei requisiti di prestazioni dei sistemi real-time

Architettura del Protocollo

Meccanismo di Deflazione Tradizionale

Nel protocollo tradizionale, quando un pacchetto non può essere estratto nello switch di destinazione (ad esempio, il collegamento di estrazione è occupato), l'intero pacchetto viene deflesso e trasmesso lungo l'anello finché non raggiunge nuovamente la destinazione.

Progettazione del Nuovo Protocollo

  1. Deflazione dell'Intestazione: Quando si verifica una deflazione, solo l'intestazione del pacchetto continua a circolare nell'anello
  2. Scarto del Carico Utile: Il carico utile del pacchetto viene completamente scartato nel punto di deflazione
  3. Reiniezione del Carico Utile: Quando l'intestazione modificata ritorna allo switch di iniezione, viene attivata la reiniezione del carico utile
  4. Modifica dell'Intestazione: Lo switch di destinazione modifica i campi dell'intestazione durante la deflazione, identificando la necessità di reiniezione

Dettagli Tecnici Chiave

Gestione dei Buffer:

  • Il carico utile del pacchetto non può essere immediatamente rimosso dal buffer di iniezione dopo l'iniezione
  • Utilizzo di tecniche di buffer SAFC o SAMQ per gestire i requisiti di reiniezione
  • Sotto vincoli di deadline (Di ≤ Ti), non è richiesta memoria buffer aggiuntiva

Meccanismo di Identificazione dell'Intestazione:

  • Lo switch di iniezione deve essere in grado di identificare l'intestazione deflessa
  • L'intestazione contiene lo switch di destinazione e un identificatore univoco del flusso di pacchetti
  • Implementazione del meccanismo di attivazione della reiniezione attraverso modifica dei campi

Ottimizzazione del Traffico:

Metodo tradizionale: deflazione pacchetto completo = intestazione(H) + carico utile(L-H)
Nuovo protocollo: deflazione solo intestazione = intestazione(H)
Riduzione traffico = (L-H) × numero di deflazioni × lunghezza percorso di ritorno

Punti di Innovazione Tecnica

  1. Strategia di Deflazione Separata:
    • Superamento del pensiero tradizionale di deflazione dell'intero pacchetto
    • Sfruttamento delle caratteristiche della topologia ad anello (i pacchetti deflessi devono passare attraverso il punto di iniezione)
    • Realizzazione del riutilizzo del carico utile in loco
  2. Meccanismo di Riduzione dell'Interferenza:
    • Non riduzione diretta del numero di deflazioni per singolo pacchetto
    • Riduzione dell'interferenza su altri pacchetti attraverso la diminuzione del traffico di rete
    • Ottimizzazione focalizzata sulla latenza di pre-iniezione (Ipre)
  3. Progettazione Retrocompatibile:
    • Combinazione possibile con tecniche di riduzione della deflazione esistenti
    • Mantenimento della coerenza del comportamento di rete originale
    • Supporto per estensioni di meccanismi di conferma end-to-end

Configurazione Sperimentale

Set di Dati

  1. Valutazione Specifica per Applicazione:
    • Utilizzo di benchmark per veicoli autonomi (AV) con 39 flussi
    • Configurazione: fotocamera a risoluzione VGA, colore a 8 bit, 25 fps
    • Generazione di 100 mappature casuali per evitare distorsioni
  2. Valutazione Sintetica su Larga Scala:
    • Ogni benchmark contiene 100 set di flussi generati casualmente
    • Numero di flussi da 20 a 280
    • Intervallo di parametri: periodo 1-100 microsecondi, jitter 0-50% del periodo, dimensione pacchetto 16-48 o 32-96 flit

Configurazione di Rete

  • Topologia di Rete: Reti di core 4×4, 5×5, 6×6, 7×7, 8×8, 9×9
  • Parametri Tecnici: flit a 32 bit, intestazione a 1 flit, frequenza di clock 1 GHz
  • Impostazioni di Deflazione: Massimo 0-3 deflazioni, utilizzo di meccanismo di prevenzione del livelock oldest-first

Metriche di Valutazione

  1. Percentuale di Riduzione della Latenza nel Caso Peggiore: Miglioramento della latenza del nuovo protocollo rispetto alla baseline
  2. Rapporto di Schedulabilità: Percentuale di casi completamente schedulabili nel set di benchmark
  3. Miglioramento Medio Aggregato: Miglioramento medio su tutti i flussi e le mappature

Metodi di Confronto

  • Metodo Baseline: Protocollo di rete senza router tradizionale proposto da Alazemi et al.
  • Metodo di Analisi: Utilizzo del modello di analisi della latenza nel caso peggiore di Indrusiak e Burns

Risultati Sperimentali

Risultati Principali

Risultati della Valutazione Specifica per Applicazione

Dimensione Rete4×45×56×67×78×89×9
Miglioramento Massimo(%)93.0789.4589.2689.3383.3680.66
Media Aggregata(%)6.603.333.202.642.160.92

Scoperte Chiave:

  • Tutte le topologie di rete traggono beneficio dal nuovo protocollo
  • Il miglioramento massimo può raggiungere il 93%, principalmente nei flussi con grave interferenza di pre-iniezione
  • Con l'aumento della dimensione della rete, il miglioramento medio diminuisce gradualmente (distribuzione del traffico più uniforme)

Risultati della Valutazione Sintetica su Larga Scala

Il nuovo protocollo supera significativamente la baseline in termini di rapporto di schedulabilità:

  • Scenario di Deflazione Singola: Miglioramento della schedulabilità superiore al 20%
  • Scenario di Deflazioni Multiple: Prestazioni migliori con carico medio
  • Impatto della Dimensione di Rete: Miglioramenti più evidenti nelle reti più piccole (4×4)
  • Impatto della Dimensione del Pacchetto: Pacchetti più grandi (32-96 flit) spingono la rete verso la saturazione

Esperimenti di Ablazione

Analisi comparativa attraverso diversi numeri di deflazioni (0-3):

  • 0 Deflazioni: Il nuovo protocollo è identico alla baseline (verifica della correttezza)
  • 1 Deflazione: Il vantaggio del nuovo protocollo è più evidente
  • Deflazioni Multiple: Il grado di miglioramento diminuisce con l'aumento del numero di deflazioni

Verifica dell'Analisi Teorica

Formula di analisi del tempo di inattività di pre-iniezione modificata:

La formula originale coinvolge la lunghezza completa del pacchetto Lj di tutti i flussi
La formula del nuovo protocollo sostituisce la lunghezza del carico utile dei flussi deflessi con la lunghezza dell'intestazione H
Poiché Lj > H, il nuovo protocollo è teoricamente superiore al metodo originale

Scoperte Sperimentali

  1. Condizioni di Miglioramento Ottimale: Scenari con grave interferenza di pre-iniezione e rete non completamente satura
  2. Effetti di Scala: L'algoritmo RLrec genera più anelli piccoli nelle reti grandi, limitando lo spazio di miglioramento
  3. Sensibilità al Carico: L'effetto di miglioramento è correlato positivamente alla dimensione del pacchetto e alla frequenza di deflazione

Lavori Correlati

Direzioni di Ricerca sul Routing per Deflazione

  1. Deflazione a Livello di Flit: Ogni flit prende decisioni di deflazione indipendenti, richiedendo meccanismi di riordinamento
  2. Deflazione a Livello di Pacchetto: L'intero pacchetto viene deflesso in modo unificato, mantenendo l'ordine dei flit
  3. Metodi Ibridi: Strategie che combinano buffer e deflazione

Posizionamento di questo Articolo

  • Percorso Tecnico: Scelta della deflazione a livello di pacchetto per ottenere vantaggi di efficienza delle risorse
  • Angolo di Innovazione: Prima proposta di meccanismo di deflazione separato intestazione-carico utile
  • Contributo di Analisi: Estensione del framework di analisi della latenza nel caso peggiore esistente

Lavori di Ottimizzazione Correlati

  • Ottimizzazione del Routing: Metodi come DARES che modificano i percorsi di routing
  • Ottimizzazione Hardware: Miglioramenti nella progettazione dei buffer e nelle strategie di arbitraggio
  • Ottimizzazione della Topologia: Ottimizzazione della configurazione ad anello e della progettazione dello switch

Conclusioni e Discussione

Conclusioni Principali

  1. Vantaggio Teorico: Il nuovo protocollo è teoricamente superiore a tutti i metodi esistenti in termini di latenza nel caso peggiore
  2. Effetto Pratico: Realizza riduzioni significative della latenza e miglioramenti della schedulabilità in diversi scenari
  3. Fattibilità di Implementazione: Nessun sovraccarico hardware aggiuntivo richiesto, implementabile utilizzando tecniche di buffer esistenti
  4. Valore Applicativo: Particolarmente adatto per i requisiti di garanzia di prestazioni nei sistemi hard real-time

Limitazioni

  1. Limitazioni Topologiche: Principalmente applicabile a topologie di rete ad anello
  2. Decadimento del Miglioramento: L'effetto di miglioramento è limitato nelle reti di grandi dimensioni o ad alto carico
  3. Complessità di Implementazione: Richiede modifiche alla gestione del buffer di iniezione e ai meccanismi di identificazione dell'intestazione
  4. Ambito di Valutazione: Mancanza di quantificazione dei miglioramenti della latenza media e del consumo energetico

Direzioni Future

  1. Estensione Topologica: Esplorazione della possibilità di applicazione in altre topologie di rete
  2. Quantificazione delle Prestazioni: Valutazione degli effetti di miglioramento della latenza media e del consumo energetico
  3. Implementazione Hardware: Sviluppo di schemi di implementazione hardware concreti e verifica di prototipi
  4. Ottimizzazione del Protocollo: Ottimizzazione combinata con altre tecniche di riduzione della deflazione

Valutazione Approfondita

Punti di Forza

  1. Forte Innovatività: L'idea di deflazione separata intestazione-carico utile possiede originalità e valore ispirativo
  2. Rigore Teorico: Fornisce un framework di analisi matematica completo e dimostrazioni teoriche
  3. Valutazione Sperimentale Completa: Copre sia valutazioni specifiche per applicazioni che valutazioni sintetiche su larga scala
  4. Alto Valore Pratico: Risolve problemi critici di prestazioni nei sistemi real-time
  5. Scrittura Chiara: Descrizione tecnica accurata e struttura logica ragionevole

Carenze

  1. Ambito di Applicazione Limitato: Principalmente rivolto a reti ad anello, l'applicabilità ad altre topologie non è chiara
  2. Dettagli di Implementazione Insufficienti: Mancanza di dettagli specifici sui metodi di codifica della modifica dell'intestazione e sui dettagli di implementazione hardware
  3. Baseline di Confronto Limitata: Principalmente confronto con un metodo baseline, mancanza di confronto con altre tecniche di ottimizzazione
  4. Metriche di Valutazione Singolari: Focalizzazione sulla latenza nel caso peggiore, analisi insufficiente degli effetti sulle prestazioni medie e sul consumo energetico

Impatto

  1. Contributo Accademico: Fornisce una nuova direzione di ricerca per l'ottimizzazione del routing per deflazione
  2. Valore Pratico: Applicabile direttamente alla progettazione di NoC nei sistemi embedded real-time
  3. Riproducibilità: Fornisce modelli di analisi dettagliati e configurazioni sperimentali, facilitando la riproduzione e l'estensione
  4. Significato Ispirativo: L'approccio di elaborazione separata potrebbe ispirare altre ricerche di ottimizzazione di rete

Scenari Applicabili

  1. Sistemi Hard Real-Time: Applicazioni embedded che richiedono garanzie di latenza rigorose
  2. Ambienti con Risorse Limitate: Progettazione di NoC sensibile all'area e alla potenza
  3. Architetture di Rete ad Anello: Sistemi NoC che adottano topologie ad anello
  4. Reti di Dimensioni Medie: Le reti di dimensioni 4×4 a 6×6 ottengono i migliori effetti di miglioramento

Riferimenti Bibliografici

Questo articolo cita 15 lavori correlati, principalmente includenti:

  • 1 Architettura di rete senza router di Alazemi et al.
  • 6 Analisi della latenza nel caso peggiore di Indrusiak e Burns
  • 8 Progettazione di rete ad anello IMR di Liu et al.
  • Altri lavori correlati su routing per deflazione, analisi real-time e ottimizzazione di NoC

Valutazione Complessiva: Questo è un articolo di alta qualità nell'architettura dei sistemi che propone un protocollo di ottimizzazione del routing per deflazione innovativo, con solide basi teoriche e verifica sperimentale completa. Sebbene presenti alcune limitazioni nell'ambito di applicazione e nei dettagli di implementazione, l'idea centrale possiede importante valore accademico e pratico, fornendo una nuova direzione per la ricerca sull'ottimizzazione delle reti on-chip.