The demand for computer in our daily lives has led to the proliferation of Datacenters that power indispensable many services. On the other hand, computing has become essential for some research for various scientific fields, that require Supercomputers with vast computing capabilities to produce results in reasonable time. The scale and complexity of these systems, compared to our day-to-day devices, are like comparing a cell to a living organism. To make them work properly, we need state-of-the-art technology and engineering, not just raw resources. Interconnecting the different computer nodes that make up a whole is a delicate task, as it can become the bottleneck for the whole infrastructure. In this work, we explore two aspects of the network: how to prevent degradation under heavy use with congestion control, and how to save energy when idle with power management; and how the two may interact.
- ID Articolo: 2511.10159
- Titolo: Combined power management and congestion control in High-Speed Ethernet-based Networks for Supercomputers and Data Centers
- Autori: Miguel Sánchez de la Rosa, Francisco J. Andújar, Jesus Escudero-Sahuquillo, José L. Sánchez, Francisco J. Alfaro-Cortés
- Istituzioni: Universidad de Castilla-La Mancha (Spagna), Universidad de Valladolid (Spagna)
- Classificazione: cs.AR (Architettura dei Calcolatori)
- Data di Pubblicazione: 13 novembre 2025 (preprint arXiv)
- Link Articolo: https://arxiv.org/abs/2511.10159
Con l'espansione continua dei data center e dei supercomputer, le reti di interconnessione sono diventate un potenziale collo di bottiglia dell'intero sistema. Questo articolo studia l'ottimizzazione congiunta di due aspetti critici nelle reti Ethernet ad alta velocità: (1) prevenzione del degrado delle prestazioni sotto carico pesante attraverso il controllo della congestione; (2) risparmio energetico durante i periodi di inattività attraverso la gestione dell'energia; (3) esplorazione delle interazioni tra i due. La ricerca dimostra che uno schema di coda statica appropriato (SQS) combinato con tecniche di gestione dinamica dell'energia (come PerfBound) può minimizzare la perdita di prestazioni riducendo contemporaneamente il consumo energetico.
Questo articolo affronta il seguente problema per le reti di interconnessione Ethernet ad alta velocità in supercomputer e data center:
- Ottimizzazione dell'efficienza energetica: riduzione della potenza durante i periodi di inattività della rete
- Controllo della congestione: mantenimento delle prestazioni di rete sotto carico elevato
- Cooperazione tra i due: comprensione degli effetti di interazione tra gestione dell'energia e controllo della congestione
- Aumento della proporzione di consumo energetico: con i processori che diventano sempre più efficienti dal punto di vista energetico, la proporzione di potenza consumata dalla rete di interconnessione rispetto al consumo totale del sistema aumenta continuamente
- Collo di bottiglia delle prestazioni: la congestione della rete causa il blocco Head-of-Line (HoL), riducendo gravemente le prestazioni complessive
- Caratteristiche delle applicazioni: le applicazioni HPC tipicamente alternano fasi di calcolo e comunicazione, fornendo finestre di opportunità per il risparmio energetico
- Esigenza pratica: il consumo energetico dei collegamenti è indipendente dall'attività di rete, consumando la stessa energia anche quando inattivi
Nel campo della gestione dell'energia:
- PDT fisso (Power-down Threshold): tutti i collegamenti utilizzano la stessa soglia, incapace di adattarsi ai diversi modelli di utilizzo dei collegamenti
- Richiede pre-ottimizzazione: necessita di esecuzione preliminare del carico di lavoro per la regolazione dei parametri, consumando energia aggiuntiva
- Degrado delle prestazioni: esiste una latenza di overhead nell'ingresso e nell'uscita dallo stato a bassa potenza (LPI)
Nel campo del controllo della congestione:
- Blocco HoL: i flussi caldi (hot flows) monopolizzano le risorse condivise, causando un grave degrado delle prestazioni dei flussi freddi (cold flows)
- Propagazione retroattiva della congestione: la congestione si propaga verso le sorgenti attraverso meccanismi di stop-start o basati su crediti
- Mancanza di progettazione cooperativa: la gestione dell'energia e il controllo della congestione sono tipicamente studiati indipendentemente
- Opportunità di ottimizzazione congiunta: la gestione dell'energia e il controllo della congestione potrebbero influenzarsi reciprocamente, richiedendo una progettazione congiunta
- Esigenza di praticità: sia InfiniBand che Ethernet dispongono di meccanismi di risparmio energetico standard (IBTA ed EEE), ma sono spesso disabilitati per perseguire le massime prestazioni
- Colmare il vuoto di ricerca: manca uno studio sistematico degli effetti dell'utilizzo combinato di queste due tecnologie
- Primo studio sistematico degli effetti sinergici tra schemi di coda statica (SQS) e tecniche di gestione dell'energia, rivelando l'influenza duale del controllo della congestione su consumo energetico e prestazioni
- Valutazione sperimentale di 4 schemi SQS (1Q, BBQ, DBBM, Flow2SL) combinati con molteplici strategie di gestione dell'energia (PDT fisso e PerfBound dinamico)
- Scoperta dei vantaggi di DBBM: Destination-Based Buffer Management dimostra vantaggi significativi quando combinato con la gestione dell'energia, minimizzando il sovraccarico di latenza e tempo di esecuzione riducendo contemporaneamente il consumo energetico
- Fornire orientamenti pratici: fornisce evidenze sperimentali e raccomandazioni di configurazione per l'ottimizzazione congiunta della gestione dell'energia e del controllo della congestione nella progettazione di reti di supercomputer e data center
Input:
- Topologia di rete e modelli di traffico
- Configurazione dello schema di coda statica (SQS)
- Parametri di gestione dell'energia (valori PDT o configurazione PerfBound)
Output:
- Consumo energetico della rete
- Latenza della rete
- Tempo di esecuzione dell'applicazione
Vincoli:
- Il degrado delle prestazioni deve essere mantenuto entro un intervallo accettabile
- Mantenimento della caratteristica di rete senza perdita (lossless)
Utilizzati per mitigare il blocco HoL, distribuendo la congestione tra diversi canali virtuali (Virtual Channels, VCs):
- 1Q (Coda Singola): schema di base, tutti i flussi condividono una singola coda
- BBQ (Bubble-Based Queuing): meccanismo di accodamento basato su bolle, riduce il blocco HoL nella topologia Dragonfly
- DBBM (Destination-Based Buffer Management): alloca buffer in base alla destinazione, isolando la congestione di diversi flussi
- Flow2SL (Flow to Service Level): mappa i flussi a diversi livelli di servizio, realizzando una gestione delle code a granularità più fine
Metodo PDT Fisso
- Principio: dopo l'assenza di trasmissione di pacchetti, il collegamento rimane attivo per un tempo fisso (PDT)
- Parametri: testati PDT = 1e-0s a 1e-9s e PDT=0s (sospensione immediata)
- Vantaggi: implementazione semplice
- Svantaggi: incapace di adattarsi ai diversi modelli di utilizzo dei collegamenti
Metodo Dinamico PerfBound
- Principio: calcola dinamicamente il valore PDT per ogni porta per soddisfare i limiti di degrado delle prestazioni preimpostati
- Meccanismo: basato su strutture dati di gestione degli istogrammi
- Tre strategie:
- Regular Histogram: istogramma regolare
- Circular Histogram: istogramma circolare
- Self-clearing Histogram: istogramma auto-cancellante
- Vantaggi: regolazione adattiva, nessuna pre-ottimizzazione richiesta
- Framework di valutazione congiunta: primo approccio a valutare SQS e gestione dell'energia come sistema accoppiato, piuttosto che ottimizzazione indipendente
- Analisi multidimensionale: esame simultaneo di tre indicatori chiave: consumo energetico, latenza di rete e tempo di esecuzione
- Scoperta dell'effetto sinergico di DBBM: rivela i vantaggi speciali di DBBM nello scenario di gestione dell'energia:
- Una migliore gestione del buffer riduce i riavvii di collegamento non necessari
- L'isolamento del traffico per destinazione consente a più collegamenti di entrare più facilmente nello stato di sospensione
- Orientamento verso la praticità: basato su tecnologie standardizzate (EEE), i risultati della ricerca possono essere direttamente applicati ai sistemi reali
- Piattaforma di test: simulatore di rete Ethernet ad alta velocità basato su BXIv3
- Tipo di rete: rete senza perdita (lossless network)
- Meccanismo di controllo di flusso: supporta canali virtuali (VCs) e controllo di flusso basato su priorità (PFC)
- Consumo Energetico (Energy Consumption):
- Percentuale di consumo energetico relativo alla linea di base senza risparmio energetico
- Più basso è meglio
- Latenza di Rete (Network Latency):
- Aumento percentuale medio della latenza di rete a livello di applicazione
- Misurato rispetto alla linea di base senza risparmio energetico
- Aumento del Tempo di Esecuzione (Execution Time Increase):
- Aumento percentuale del tempo di esecuzione totale dell'applicazione
- Riflette l'impatto complessivo sulle prestazioni
Schemi SQS:
- 1Q (linea di base)
- BBQ
- DBBM
- Flow2SL
Schemi di Gestione dell'Energia:
- Nessun risparmio energetico (No powersaving)
- PDT fisso (8 valori diversi: 1e-0s a 1e-9s, e 0s)
- PerfBound (3 strategie di gestione degli istogrammi)
- Intervallo PDT: da 1 secondo a 1 nanosecondo, coprendo più ordini di grandezza
- Configurazione PerfBound: impostazione dei limiti di degrado delle prestazioni, regolazione dinamica di PDT
- Scenari di test: simulazione di carichi di lavoro HPC tipici, incluse fasi alternate di calcolo e comunicazione
Effetto del PDT Fisso (Figura 1a):
- Fattore dominante: il valore PDT è il principale determinante del consumo energetico
- Impatto SQS minimo: la differenza di consumo energetico tra diversi SQS non è significativa (con PDT fisso)
- Intervallo di consumo energetico: ridotto dal 100% senza risparmio energetico a circa il 16% (con PDT=1e-9s)
- Tendenza: più piccolo è il PDT, più basso è il consumo energetico, ma aumenta il rischio di degrado delle prestazioni
Effetto di PerfBound (Figura 1b):
- Ulteriore riduzione del consumo energetico: rispetto al PDT fisso, il consumo energetico si riduce all'intervallo 76%-100%
- Vantaggio di DBBM evidente: DBBM combinato con PerfBound mostra il consumo energetico più basso
- Impatto della strategia dell'istogramma: le tre strategie di gestione degli istogrammi mostrano differenze minime (circa 80%-96%)
- Effetto sinergico: le caratteristiche di gestione del buffer di DBBM producono un effetto sinergico con l'adeguamento dinamico di PDT
Impatto del PDT Fisso (Figura 2a):
- Intervallo di aumento della latenza: da 1,1% a 102,1%
- Valore critico di PDT: esiste un punto di flesso evidente nelle prestazioni
- PDT troppo piccolo (ad es. 1e-9s): aumento significativo della latenza (>80%)
- PDT moderato (ad es. 1e-5s a 1e-6s): aumento della latenza controllabile (<20%)
- Differenziazione SQS:
- DBBM mostra le migliori prestazioni: aumento minimo della latenza con vari valori di PDT
- 1Q mostra le peggiori prestazioni: aumento massimo della latenza
- BBQ e Flow2SL in posizione intermedia
Impatto di PerfBound (Figura 2b):
- Differenza SQS più evidente: dopo l'utilizzo di PerfBound, le differenze di prestazioni tra diversi SQS sono amplificate
- Vantaggio di DBBM pronunciato: aumento della latenza circa 5-10%
- Svantaggio di 1Q evidente: aumento della latenza può raggiungere il 40-45%
- Impatto della strategia dell'istogramma minimo: differenza tra le tre strategie entro il 5%
Impatto del PDT Fisso (Figura 3a):
- Tendenza complessiva: con la riduzione di PDT, il sovraccarico del tempo di esecuzione aumenta
- Vantaggio significativo di DBBM:
- Aumento del tempo di esecuzione solo 1-3%
- Notevolmente inferiore ad altri SQS (3-8%)
- Peggiore è 1Q: il sovraccarico con PDT rigoroso può raggiungere l'8%
Impatto di PerfBound (Figura 3b):
- Effetto SQS più pronunciato:
- DBBM: aumento 1-3%
- BBQ e Flow2SL: aumento 3-5%
- 1Q: aumento 5-8%
- Strategia dell'istogramma: impatto minimo sul tempo di esecuzione
- Compromesso prestazioni-energia: DBBM realizza il miglior equilibrio prestazioni-energia
- Prestazioni eccellenti di DBBM:
- DBBM mostra sempre le migliori prestazioni in tutte le configurazioni di gestione dell'energia
- Capace di controllare il degrado delle prestazioni al livello più basso riducendo contemporaneamente il consumo energetico
- Sovraccarico del tempo di esecuzione solo 1-3%, mentre il consumo energetico può essere ridotto del 20-24% (utilizzando PerfBound)
- Conferma dell'effetto sinergico:
- La gestione dell'energia e il controllo della congestione non sono indipendenti
- Un buon SQS può migliorare l'effetto della gestione dell'energia
- La gestione del buffer per destinazione di DBBM offre a più collegamenti l'opportunità di entrare nello stato di sospensione
- Efficacia di PerfBound:
- Rispetto al PDT fisso, PerfBound può regolarsi adattivamente
- Massimizza il risparmio energetico mantenendo i vincoli di prestazione
- L'effetto migliore quando combinato con DBBM
- Impatto limitato della strategia dell'istogramma:
- Differenza minima tra le tre strategie di gestione degli istogrammi
- Indica che il meccanismo principale di PerfBound è la chiave, con dettagli di implementazione che hanno un impatto minore
- Standard EEE e Miglioramenti:
- IEEE 802.3az (EEE): standard di efficienza energetica per Ethernet, definisce lo stato di inattività a bassa potenza (LPI)
- PDT Fisso 12: Saravanan et al. propongono di mantenere il collegamento attivo per un tempo fisso dopo la trasmissione
- PerfBound 13: calcola dinamicamente il valore PDT per soddisfare i limiti di degrado delle prestazioni preimpostati
- Miglioramento dell'articolo 4: versione migliorata di PerfBound proposta dagli autori precedentemente
- Reti Proporzionali all'Energia:
- Abts et al. 1: propone il concetto di rete proporzionale all'energia per data center
- Risparmio energetico InfiniBand 5: tecniche di riduzione della potenza gestite da software nello standard IBTA
- Schemi di Coda Statica (SQS):
- BBQ 14: schema di accodamento diretto per la topologia Dragonfly
- DBBM 9: gestione del buffer basata sulla destinazione, riduce il blocco HoL
- Flow2SL 15: schema di coda efficiente per il routing a percorso minimo
- Canale Virtuale Dinamico (DVL):
- DVL 6, 10: allocazione dinamica di VCs ai flussi congestioni, isola l'impatto della congestione
- Controllo di Flusso End-to-End:
- PFC 16: controllo di flusso basato su priorità, agisce su singolo VC
- SFC 7, 8: controllo di flusso sorgente, arresta completamente l'iniezione
- DCQCN 16: notifica di congestione quantizzata del data center, limita i flussi congestioni
- DCTCP 2: TCP del data center, controllo della congestione basato su ECN
Differenze:
- Primo studio sistematico dell'effetto sinergico tra SQS e gestione dell'energia
- Fornisce valutazione completa multidimensionale (consumo energetico, latenza, tempo di esecuzione)
- Rivela i vantaggi speciali di DBBM nello scenario di risparmio energetico
Vantaggi:
- Progettazione sperimentale più completa (4 SQS × molteplici strategie di gestione dell'energia)
- Forte praticità, basata su tecnologie standardizzate
- Fornisce orientamenti di configurazione chiari per i sistemi reali
- Necessità dell'ottimizzazione congiunta: la gestione dell'energia e il controllo della congestione devono essere considerati congiuntamente, con significative interazioni tra i due
- Raccomandazione di utilizzo di DBBM: negli scenari che richiedono considerazione simultanea del risparmio energetico e delle prestazioni, DBBM è la scelta migliore:
- Riduzione del consumo energetico del 20-24% (rispetto a nessun risparmio energetico)
- Degrado delle prestazioni solo 1-3%
- Aumento minimo della latenza di rete
- Applicabilità di PerfBound: l'adeguamento dinamico di PDT è superiore al PDT fisso, capace di ottimizzazione adattiva con diversi carichi di lavoro
- Valore pratico: i risultati della ricerca possono essere direttamente applicati ai sistemi Ethernet ad alta velocità basati su EEE
- Intervallo sperimentale limitato:
- Solo 4 schemi SQS testati
- Non copre tutte le possibili topologie di rete
- Caratteristiche del carico di lavoro non dettagliate
- Mancanza di analisi teorica:
- Principalmente basato su osservazioni sperimentali
- Manca spiegazione teorica dei vantaggi di DBBM
- Nessun modello matematico prestazioni-energia stabilito
- Dettagli di implementazione insufficienti:
- Configurazione dei parametri specifici di PerfBound non dettagliata
- Dettagli di implementazione della strategia di gestione degli istogrammi non chiari
- Manca verifica su hardware reale
- Considerazione insufficiente di scenari dinamici:
- Non studia l'adattabilità con variazioni del carico di lavoro
- Manca analisi del traffico a raffica
- Non considera situazioni anomale come guasti di rete
Sebbene l'articolo non le proponga esplicitamente, si possono dedurre le seguenti direzioni di ricerca:
- Esperimenti Estesi:
- Test di più schemi SQS e topologie di rete
- Valutazione con applicazioni HPC reali
- Verifica dei risultati su hardware reale
- Modellazione Teorica:
- Stabilimento di modelli analitici prestazioni-energia
- Spiegazione teorica dei vantaggi di DBBM
- Orientamento teorico per configurazione ottimale
- Ottimizzazione Dinamica:
- Sviluppo di algoritmi adattivi online
- Considerazione della previsione del carico di lavoro
- Ottimizzazione dei parametri combinata con apprendimento automatico
- Progettazione Cooperativa Hardware:
- Esplorazione di opportunità di ottimizzazione a livello hardware
- Progettazione di circuiti di gestione dell'energia dedicati
- Ottimizzazione della latenza di transizione di stato
- Problema di ricerca importante e pratico:
- Affronta le esigenze reali di supercomputer e data center
- Il problema del consumo energetico è sempre più urgente, con significato pratico
- Basato su tecnologie standardizzate, facile da distribuire
- Metodo di ricerca sistematico e completo:
- Valutazione combinata di molteplici SQS e strategie di gestione dell'energia
- Analisi completa di tre indicatori chiave
- Progettazione sperimentale ragionevole, confronto sufficiente
- Scoperte di valore pratico:
- Vantaggi di DBBM chiari e significativi
- Fornisce orientamenti di configurazione chiari per i sistemi
- Quantifica il compromesso prestazioni-energia
- Scrittura chiara e concisa:
- Struttura ragionevole, logica chiara
- Grafici intuitivi, risultati facili da comprendere
- Introduzione di background sufficiente
- Profondità sperimentale insufficiente:
- Manca descrizione dettagliata del carico di lavoro
- Non spiega la scala di rete e i dettagli della topologia
- Manca analisi della significatività statistica
- Solo valori medi, mancano varianza o intervalli di confidenza
- Contributo teorico limitato:
- Principalmente lavoro sperimentale
- Manca spiegazione teorica dei fenomeni
- Non fornisce principi di progettazione o metodologia di orientamento
- Analisi non sufficientemente approfondita:
- Non analizza la causa fondamentale dei vantaggi di DBBM
- Manca discussione su diversi modelli di traffico
- Non esplora l'universalità dei risultati
- Discussione dei lavori correlati sommaria:
- Solo semplice enumerazione nella Sezione 2
- Non confronta profondamente con i lavori esistenti
- Manca chiara articolazione del posizionamento dell'articolo
- Manca verifica pratica:
- Solo basato su esperimenti di simulazione
- Non verificato su sistemi reali
- Costi di implementazione e difficoltà di distribuzione non discussi
Contributo al Campo:
- Da medio a superiore: colma il vuoto della ricerca sull'ottimizzazione congiunta
- Fornisce orientamenti pratici per la progettazione di reti HPC e data center
- Promuove l'applicazione di tecnologie di risparmio energetico nelle reti ad alte prestazioni
Valore Pratico:
- Relativamente alto: basato su tecnologie standardizzate, facile da implementare
- La combinazione DBBM + PerfBound può essere direttamente applicata
- Il risparmio energetico del 20%+ ha valore economico
Riproducibilità:
- Media:
- Descrizione del metodo chiara, ma dettagli insufficienti
- Manca divulgazione di codice e dataset
- Richiede simulatore specializzato o piattaforma hardware
Potenziale di Citazione:
- Previsto di essere citato nel campo delle reti HPC e del calcolo verde
- Fornisce linea di base per ricerca successiva su ottimizzazione congiunta
- Ma il contributo teorico limitato potrebbe influenzare l'impatto a lungo termine
Scenari più adatti:
- Reti di interconnessione di supercomputer:
- Fasi di calcolo e comunicazione chiaramente separate
- Sensibili al consumo energetico ma con elevati requisiti di prestazioni
- Utilizzo di Ethernet ad alta velocità o InfiniBand
- Reti di Data Center:
- Carico variabile, spazio per il risparmio energetico
- Necessità di garantire bassa latenza
- Adozione di Ethernet senza perdita
- Infrastruttura di Cloud Computing:
- Ambiente multi-tenant, necessità di isolamento della congestione
- Costo dell'energia è considerazione importante
- Carichi di lavoro diversi
Scenari meno adatti:
- Sistemi in Tempo Reale: estremamente sensibili alle oscillazioni di latenza
- Reti di Piccole Dimensioni: benefici di risparmio energetico non evidenti
- Sistemi con Carico Continuamente Elevato: mancanza di finestre di opportunità di risparmio energetico
1 Abts et al., 2010 - Lavoro pioneristico sulle reti di data center proporzionali all'energia
3 Christensen et al., 2010 - Standard IEEE 802.3az EEE
9 Nachiondo et al., 2010 - Schema di gestione del buffer DBBM
13 Saravanan & Carpenter, 2018 - Metodo PDT dinamico PerfBound
15 Yébenes et al., 2015 - Schema di coda Flow2SL
16 Zhu et al., 2015 - Controllo della congestione DCQCN
Questo è un articolo di ricerca sperimentale orientato alla praticità, che affronta il problema dell'ottimizzazione energetica nelle reti di supercomputer e data center, valutando sistematicamente gli effetti sinergici tra controllo della congestione e gestione dell'energia. Il valore principale dell'articolo risiede in:
- Colmare il vuoto di ricerca: primo studio sistematico dell'interazione tra le due tecnologie
- Valore pratico elevato: la combinazione DBBM + PerfBound può essere direttamente applicata, con risparmio energetico >20% e degrado delle prestazioni <3%
- Esperimenti sufficienti: confronto completo di molteplici combinazioni di schemi
Le principali insufficienze risiedono nella profondità teorica limitata, nella mancanza di spiegazione profonda dei fenomeni e nella verifica su sistemi reali. Tuttavia, come articolo orientato all'applicazione, i suoi risultati sperimentali e gli orientamenti pratici hanno valore relativamente elevato, e si prevede che avranno un impatto positivo sulla trasformazione verde delle reti di supercomputer e data center.
Indice di Raccomandazione: ⭐⭐⭐⭐ (4/5) - Ha importante valore di riferimento per ricercatori e ingegneri impegnati nella ricerca su reti HPC e calcolo verde.