The demand for computer in our daily lives has led to the proliferation of Datacenters that power indispensable many services. On the other hand, computing has become essential for some research for various scientific fields, that require Supercomputers with vast computing capabilities to produce results in reasonable time. The scale and complexity of these systems, compared to our day-to-day devices, are like comparing a cell to a living organism. To make them work properly, we need state-of-the-art technology and engineering, not just raw resources. Interconnecting the different computer nodes that make up a whole is a delicate task, as it can become the bottleneck for the whole infrastructure. In this work, we explore two aspects of the network: how to prevent degradation under heavy use with congestion control, and how to save energy when idle with power management; and how the two may interact.
- ID de l'article : 2511.10159
- Titre : Combined power management and congestion control in High-Speed Ethernet-based Networks for Supercomputers and Data Centers
- Auteurs : Miguel Sánchez de la Rosa, Francisco J. Andújar, Jesus Escudero-Sahuquillo, José L. Sánchez, Francisco J. Alfaro-Cortés
- Institutions : Universidad de Castilla-La Mancha (Espagne), Universidad de Valladolid (Espagne)
- Classification : cs.AR (Architecture informatique)
- Date de publication : 13 novembre 2025 (prépublication arXiv)
- Lien de l'article : https://arxiv.org/abs/2511.10159
Avec l'expansion continue des centres de données et des supercalculateurs, les réseaux d'interconnexion sont devenus un goulot d'étranglement potentiel pour l'ensemble du système. Cet article étudie l'optimisation conjointe de deux aspects critiques des réseaux Ethernet haute vitesse : (1) la prévention de la dégradation des performances sous charge élevée par le contrôle de la congestion ; (2) l'économie d'énergie pendant les périodes d'inactivité par la gestion de l'énergie ; (3) l'exploration des interactions entre ces deux aspects. L'étude démontre qu'une combinaison appropriée de schémas de files d'attente statiques (SQS) avec des techniques de gestion dynamique de l'énergie (telles que PerfBound) peut minimiser les pertes de performance tout en réduisant la consommation d'énergie.
Cet article aborde la question de la réalisation simultanée des objectifs suivants pour les réseaux d'interconnexion Ethernet haute vitesse des supercalculateurs et des centres de données :
- Optimisation de l'efficacité énergétique : réduction de la consommation d'énergie pendant les périodes d'inactivité du réseau
- Contrôle de la congestion : maintien des performances réseau sous charge élevée
- Synergie entre les deux : compréhension des effets d'interaction entre la gestion de l'énergie et le contrôle de la congestion
- Augmentation de la proportion énergétique : à mesure que les processeurs deviennent plus efficaces énergétiquement, la proportion de la consommation d'énergie du réseau d'interconnexion dans la consommation totale du système augmente continuellement
- Goulot d'étranglement des performances : la congestion réseau entraîne un blocage Head-of-Line (HoL), réduisant considérablement les performances globales
- Caractéristiques des applications : les applications HPC alternent généralement entre phases de calcul et de communication, offrant des fenêtres d'opportunité pour les économies d'énergie
- Besoins pratiques : la consommation d'énergie des liaisons est indépendante de l'activité réseau, consommant la même énergie même en période d'inactivité
Aspect gestion de l'énergie :
- Seuil de réduction de puissance fixe (PDT) : tous les liens utilisent le même seuil, incapable de s'adapter aux différents modèles d'utilisation des liens
- Nécessité de pré-optimisation : exige l'exécution préalable de charges de travail pour l'ajustement des paramètres, consommant une énergie supplémentaire
- Dégradation des performances : les délais d'entrée et de sortie de l'état de faible consommation (LPI) entraînent des surcharges
Aspect contrôle de la congestion :
- Blocage HoL : les flux chauds (hot flows) monopolisent les ressources partagées, entraînant une dégradation sévère des performances des flux froids (cold flows)
- Rétropropagation de la congestion : la congestion se propage à la source via des mécanismes d'arrêt-démarrage ou basés sur le crédit
- Absence de conception conjointe : la gestion de l'énergie et le contrôle de la congestion sont généralement étudiés indépendamment
- Opportunités d'optimisation conjointe : la gestion de l'énergie et le contrôle de la congestion peuvent s'influencer mutuellement, nécessitant une conception intégrée
- Besoins pratiques : InfiniBand et Ethernet disposent tous deux de mécanismes d'économie d'énergie standardisés (IBTA et EEE), mais sont souvent désactivés pour maximiser les performances
- Combler une lacune de recherche : absence d'étude systématique des effets de l'utilisation conjointe de ces deux technologies
- Première étude systématique des effets synergiques entre les schémas de files d'attente statiques (SQS) et les techniques de gestion de l'énergie, révélant l'influence double du contrôle de la congestion sur la consommation d'énergie et les performances
- Évaluation expérimentale de quatre schémas SQS (1Q, BBQ, DBBM, Flow2SL) combinés avec plusieurs stratégies de gestion de l'énergie (PDT fixe et PerfBound dynamique)
- Découverte des avantages de DBBM : la gestion des tampons basée sur la destination (Destination-Based Buffer Management) présente des avantages significatifs lorsqu'elle est combinée avec la gestion de l'énergie, minimisant les surcharges de latence et de temps d'exécution tout en réduisant la consommation d'énergie
- Fourniture de conseils pratiques : fourniture de preuves expérimentales et de recommandations de configuration pour l'optimisation conjointe de la gestion de l'énergie et du contrôle de la congestion dans la conception des réseaux de supercalculateurs et de centres de données
Entrées :
- Topologie du réseau et modèles de trafic
- Configuration du schéma de files d'attente statiques (SQS)
- Paramètres de gestion de l'énergie (valeurs PDT ou configuration PerfBound)
Sorties :
- Consommation d'énergie du réseau
- Latence du réseau
- Temps d'exécution de l'application
Contraintes :
- La dégradation des performances doit rester dans une plage acceptable
- Maintien de la caractéristique sans perte du réseau (lossless)
Utilisés pour atténuer le blocage HoL, en dispersant la congestion sur différents canaux virtuels (Virtual Channels, VCs) :
- 1Q (file d'attente unique) : schéma de base, tous les flux partagent une seule file d'attente
- BBQ (Bubble-Based Queuing) : mécanisme de mise en file d'attente basé sur les bulles, réduisant le blocage HoL dans la topologie Dragonfly
- DBBM (Destination-Based Buffer Management) : allocation de tampons basée sur la destination, isolant la congestion des différents flux
- Flow2SL (Flow to Service Level) : mappage des flux vers différents niveaux de service, réalisant une gestion des files d'attente plus granulaire
Approche PDT fixe
- Principe : après l'absence de transmission de paquets, le lien reste actif pendant une durée fixe (PDT)
- Paramètres : PDT testé de 1e-0s à 1e-9s ainsi que PDT=0s (mise en veille immédiate)
- Avantages : implémentation simple
- Inconvénients : incapable de s'adapter aux différents modèles d'utilisation des liens
Approche dynamique PerfBound
- Principe : calcul dynamique de la valeur PDT pour chaque port afin de satisfaire une limite de dégradation des performances prédéfinie
- Mécanisme : basé sur une structure de données de gestion d'histogramme
- Trois stratégies :
- Histogramme régulier : histogramme conventionnel
- Histogramme circulaire : histogramme circulaire
- Histogramme auto-nettoyant : histogramme auto-nettoyant
- Avantages : ajustement adaptatif, sans nécessité de pré-optimisation
- Cadre d'évaluation conjointe : première évaluation des SQS et de la gestion de l'énergie en tant que système couplé, plutôt que comme optimisations indépendantes
- Analyse multidimensionnelle : examen simultané de trois indicateurs clés : consommation d'énergie, latence réseau et temps d'exécution
- Découverte des effets synergiques de DBBM : révélation des avantages particuliers de DBBM dans les scénarios de gestion de l'énergie :
- Une meilleure gestion des tampons réduit les réveils de liens inutiles
- L'isolation du trafic par destination permet à plus de liens d'accéder à l'état de veille
- Orientation pratique : basée sur des technologies standardisées (EEE), les résultats de la recherche peuvent être directement appliqués aux systèmes réels
- Plateforme de test : simulateur de réseau Ethernet haute vitesse basé sur BXIv3
- Type de réseau : réseau sans perte (lossless network)
- Mécanisme de contrôle de flux : support des canaux virtuels (VCs) et du contrôle de flux basé sur la priorité (PFC)
- Consommation d'énergie (Energy Consumption) :
- Pourcentage de consommation d'énergie par rapport à la ligne de base sans économie d'énergie
- Plus bas est mieux
- Latence réseau (Network Latency) :
- Augmentation moyenne en pourcentage de la latence réseau au niveau de l'application
- Mesurée par rapport à la ligne de base sans économie d'énergie
- Augmentation du temps d'exécution (Execution Time Increase) :
- Augmentation en pourcentage du temps d'exécution total de l'application
- Reflète l'impact global sur les performances
Schémas SQS :
- 1Q (ligne de base)
- BBQ
- DBBM
- Flow2SL
Schémas de gestion de l'énergie :
- Pas d'économie d'énergie (No powersaving)
- PDT fixe (8 valeurs différentes : 1e-0s à 1e-9s, ainsi que 0s)
- PerfBound (3 stratégies de gestion d'histogramme)
- Plage PDT : de 1 seconde à 1 nanoseconde, couvrant plusieurs ordres de grandeur
- Configuration PerfBound : définition d'une limite de dégradation des performances, ajustement dynamique du PDT
- Scénarios de test : simulation de charges de travail HPC typiques, incluant des phases d'alternance entre calcul et communication
Effet du PDT fixe (Figure 1a) :
- Facteur dominant : la valeur PDT est le principal déterminant de la consommation d'énergie
- Impact mineur du SQS : les différences de consommation d'énergie entre les différents SQS ne sont pas significatives (sous PDT fixe)
- Plage de consommation d'énergie : réduction de 100% (sans économie d'énergie) à environ 16% (avec PDT=1e-9s)
- Tendance : plus petit est le PDT, plus basse est la consommation d'énergie, mais le risque de dégradation des performances augmente
Effet de PerfBound (Figure 1b) :
- Réduction supplémentaire de la consommation d'énergie : par rapport au PDT fixe, la consommation d'énergie est réduite à la plage 76%-100%
- Avantage de DBBM apparent : DBBM combiné avec PerfBound présente la consommation d'énergie la plus basse
- Impact de la stratégie d'histogramme : les trois stratégies de gestion d'histogramme présentent des différences mineures (environ 80%-96%)
- Effet synergique : les caractéristiques de gestion des tampons de DBBM produisent un effet synergique avec l'ajustement dynamique du PDT
Impact du PDT fixe (Figure 2a) :
- Plage d'augmentation de latence : de 1,1% à 102,1%
- Valeur critique du PDT : existence d'un point d'inflexion de performance apparent
- PDT trop petit (par exemple 1e-9s) : augmentation significative de la latence (>80%)
- PDT modéré (par exemple 1e-5s à 1e-6s) : augmentation de latence contrôlable (<20%)
- Différenciation du SQS :
- DBBM : meilleures performances : augmentation minimale de la latence pour toutes les valeurs de PDT
- 1Q : pires performances : augmentation la plus significative de la latence
- BBQ et Flow2SL : performances intermédiaires
Impact de PerfBound (Figure 2b) :
- Différences du SQS plus prononcées : après l'utilisation de PerfBound, les différences de performance entre les différents SQS sont amplifiées
- Avantage de DBBM marqué : augmentation de latence d'environ 5-10%
- Désavantage de 1Q manifeste : augmentation de latence pouvant atteindre 40-45%
- Impact mineur de la stratégie d'histogramme : les trois stratégies présentent des différences inférieures à 5%
Impact du PDT fixe (Figure 3a) :
- Tendance générale : avec la réduction du PDT, la surcharge du temps d'exécution augmente
- Avantage significatif de DBBM :
- Augmentation du temps d'exécution de seulement 1-3%
- Nettement inférieure aux autres SQS (3-8%)
- Pires performances de 1Q : la surcharge peut atteindre 8% sous PDT strict
Impact de PerfBound (Figure 3b) :
- Effet du SQS plus prononcé :
- DBBM : augmentation de 1-3%
- BBQ et Flow2SL : augmentation de 3-5%
- 1Q : augmentation de 5-8%
- Stratégie d'histogramme : impact mineur sur le temps d'exécution
- Compromis performance-énergie : DBBM réalise le meilleur équilibre performance-énergie
- Performances exceptionnelles de DBBM :
- DBBM présente toujours les meilleures performances sous toutes les configurations de gestion de l'énergie
- Capable de réduire la consommation d'énergie tout en maintenant la dégradation des performances au niveau minimum
- Surcharge du temps d'exécution de seulement 1-3%, tandis que la consommation d'énergie peut être réduite de 20-24% (avec PerfBound)
- Confirmation des effets synergiques :
- La gestion de l'énergie et le contrôle de la congestion ne sont pas indépendants
- Un bon SQS peut améliorer l'efficacité de la gestion de l'énergie
- La gestion des tampons par destination de DBBM offre à plus de liens la possibilité d'entrer en veille
- Efficacité de PerfBound :
- Par rapport au PDT fixe, PerfBound peut s'adapter dynamiquement
- Maximise les économies d'énergie tout en garantissant les contraintes de performance
- Les meilleurs résultats sont obtenus en combinaison avec DBBM
- Impact limité de la stratégie d'histogramme :
- Les trois stratégies de gestion d'histogramme présentent peu de différences
- Indique que le mécanisme central de PerfBound est clé, les détails d'implémentation spécifiques ayant un impact mineur
- Normes EEE et améliorations :
- IEEE 802.3az (EEE) : norme d'efficacité énergétique Ethernet, définissant l'état d'inactivité à faible consommation (LPI)
- PDT fixe 12 : Saravanan et al. proposent de maintenir les liens actifs pendant une durée fixe après la transmission
- PerfBound 13 : calcul dynamique de la valeur PDT pour satisfaire une limite de dégradation des performances prédéfinie
- Amélioration de cet article 4 : version améliorée de PerfBound proposée par les auteurs précédemment
- Réseaux proportionnels en énergie :
- Abts et al. 1 : proposition du concept de réseaux de centres de données proportionnels en énergie
- Économie d'énergie InfiniBand 5 : techniques de réduction de puissance gérées par logiciel dans la norme IBTA
- Schémas de files d'attente statiques (SQS) :
- BBQ 14 : schéma de mise en file d'attente directe pour la topologie Dragonfly
- DBBM 9 : gestion des tampons basée sur la destination, réduisant le blocage HoL
- Flow2SL 15 : schéma de file d'attente efficace pour le routage à chemin minimal
- Canaux virtuels dynamiques (DVL) :
- DVL 6, 10 : allocation dynamique des VCs aux flux congestionnés, isolant les effets de congestion
- Contrôle de flux de bout en bout :
- PFC 16 : contrôle de flux basé sur la priorité, agissant sur un VC individuel
- SFC 7, 8 : contrôle de flux source, arrêt complet de l'injection
- DCQCN 16 : notification de congestion quantifiée pour centre de données, limitation des flux congestionnés
- DCTCP 2 : TCP pour centre de données, contrôle de congestion basé sur ECN
Différences :
- Première étude systématique des effets synergiques entre SQS et gestion de l'énergie
- Fourniture d'une évaluation complète multidimensionnelle (consommation d'énergie, latence, temps d'exécution)
- Révélation des avantages particuliers de DBBM dans les scénarios d'économie d'énergie
Avantages :
- Conception expérimentale plus complète (4 SQS × plusieurs stratégies de gestion de l'énergie)
- Forte applicabilité pratique, basée sur des technologies standardisées
- Fourniture de conseils de configuration clairs pour les systèmes réels
- Nécessité de l'optimisation conjointe : la gestion de l'énergie et le contrôle de la congestion doivent être considérés conjointement, avec des interactions significatives entre les deux
- Recommandation d'utilisation de DBBM : dans les scénarios nécessitant de considérer simultanément l'économie d'énergie et les performances, DBBM est le meilleur choix :
- Réduction de la consommation d'énergie de 20-24% (par rapport à l'absence d'économie d'énergie)
- Dégradation des performances de seulement 1-3%
- Augmentation minimale de la latence réseau
- Applicabilité de PerfBound : l'ajustement dynamique du PDT est supérieur au PDT fixe, capable d'optimiser de manière adaptative sous différentes charges de travail
- Valeur pratique : les résultats de la recherche peuvent être directement appliqués aux systèmes Ethernet haute vitesse basés sur EEE
- Portée expérimentale limitée :
- Seulement 4 schémas SQS testés
- Pas de couverture de toutes les topologies réseau possibles
- Caractéristiques des charges de travail non détaillées
- Absence d'analyse théorique :
- Principalement basée sur des observations expérimentales
- Absence d'explication théorique des avantages de DBBM
- Pas de modèle mathématique établi pour la relation performance-énergie
- Détails d'implémentation insuffisants :
- Configuration des paramètres spécifiques de PerfBound non détaillée
- Détails d'implémentation des stratégies de gestion d'histogramme peu clairs
- Absence de vérification expérimentale sur matériel réel
- Considération insuffisante des scénarios dynamiques :
- Pas d'étude de l'adaptabilité lors de changements de charge de travail
- Absence d'analyse du trafic en rafales
- Pas de considération des situations anormales telles que les défaillances réseau
Bien que l'article ne les propose pas explicitement, les directions de recherche suivantes peuvent être déduites :
- Expansion expérimentale :
- Test de plus de schémas SQS et topologies réseau
- Évaluation utilisant des applications HPC réelles
- Vérification des résultats sur matériel réel
- Modélisation théorique :
- Établissement d'un modèle analytique pour la relation performance-énergie
- Explication théorique des avantages de DBBM
- Fourniture de conseils théoriques pour la configuration optimale
- Optimisation dynamique :
- Développement d'algorithmes d'adaptation en ligne
- Considération de la prédiction de charge de travail
- Optimisation des paramètres utilisant l'apprentissage automatique
- Conception conjointe matériel-logiciel :
- Exploration des opportunités d'optimisation au niveau matériel
- Conception de circuits de gestion de l'énergie dédiés
- Optimisation des délais de transition d'état
- Problème de recherche important et pratique :
- Aborde les besoins réels des supercalculateurs et des centres de données
- Les problèmes de consommation d'énergie deviennent de plus en plus importants, avec une pertinence pratique
- Basé sur des technologies standardisées, facile à déployer
- Méthode de recherche systématique et complète :
- Évaluation combinée de plusieurs SQS et stratégies de gestion de l'énergie
- Analyse complète de trois indicateurs clés
- Conception expérimentale raisonnable, comparaisons suffisantes
- Découvertes ayant une valeur pratique :
- Avantages de DBBM clairs et significatifs
- Fourniture de conseils clairs pour la configuration du système
- Quantification du compromis performance-énergie
- Rédaction claire et concise :
- Structure raisonnable, logique claire
- Graphiques intuitifs, résultats faciles à comprendre
- Introduction de contexte suffisante
- Profondeur expérimentale insuffisante :
- Absence de description détaillée des charges de travail
- Manque de précision sur l'échelle et les détails de topologie du réseau
- Absence d'analyse de signification statistique
- Seulement des valeurs moyennes, absence de variance ou d'intervalles de confiance
- Contribution théorique limitée :
- Principalement un travail expérimental
- Absence d'explication théorique des phénomènes
- Absence de principes de conception ou de méthodologie d'orientation
- Analyse insuffisamment approfondie :
- Pas d'analyse de la cause fondamentale des avantages de DBBM
- Absence de discussion sur différents modèles de trafic
- Pas d'exploration de l'universalité des résultats
- Discussion des travaux connexes sommaire :
- Simple énumération dans la section 2
- Pas de comparaison approfondie avec les travaux existants
- Absence de clarification du positionnement de cet article
- Absence de vérification pratique :
- Basé uniquement sur des expériences de simulation
- Pas de vérification sur des systèmes réels
- Coûts d'implémentation et difficultés de déploiement non discutés
Contribution au domaine :
- Moyen à supérieur : comble une lacune dans la recherche sur l'optimisation conjointe
- Fournit des conseils pratiques pour la conception des réseaux HPC et des centres de données
- Promeut l'application des technologies d'économie d'énergie dans les réseaux haute performance
Valeur pratique :
- Élevée : basée sur des technologies standardisées, facile à mettre en œuvre
- La combinaison DBBM + PerfBound peut être directement appliquée
- Les économies d'énergie de 20%+ ont une valeur économique
Reproductibilité :
- Moyen :
- Description claire de la méthode, mais détails insuffisants
- Absence de publication de code et d'ensemble de données
- Nécessite un simulateur spécialisé ou une plateforme matérielle
Potentiel de citation :
- Devrait être cité dans les domaines des réseaux HPC et de l'informatique verte
- Fournit une ligne de base pour les recherches ultérieures sur l'optimisation conjointe
- Cependant, la contribution théorique limitée peut affecter l'impact à long terme
Scénarios les plus appropriés :
- Réseaux d'interconnexion de supercalculateurs :
- Séparation claire entre phases de calcul et de communication
- Sensibilité à la consommation d'énergie mais exigences de performance élevées
- Utilisation d'Ethernet haute vitesse ou InfiniBand
- Réseaux de centres de données :
- Fluctuations importantes de charge, opportunités d'économie d'énergie
- Nécessité de garantir une faible latence
- Adoption d'Ethernet sans perte
- Infrastructure informatique en nuage :
- Environnement multi-locataire, nécessité d'isoler la congestion
- Coût énergétique considération importante
- Charges de travail diversifiées
Scénarios moins appropriés :
- Systèmes temps réel : extrêmement sensibles aux variations de latence
- Réseaux petite échelle : bénéfices d'économie d'énergie non évidents
- Systèmes à charge élevée continue : manque de fenêtres d'opportunité d'économie d'énergie
1 Abts et al., 2010 - Travail fondateur sur les réseaux de centres de données proportionnels en énergie
3 Christensen et al., 2010 - Norme IEEE 802.3az EEE
9 Nachiondo et al., 2010 - Schéma de gestion des tampons DBBM
13 Saravanan & Carpenter, 2018 - Méthode PerfBound PDT dynamique
15 Yébenes et al., 2015 - Schéma de file d'attente Flow2SL
16 Zhu et al., 2015 - Contrôle de congestion DCQCN
Ceci est un article de recherche expérimentale orientée vers l'application pratique, abordant le problème de l'optimisation de la consommation d'énergie dans les réseaux de supercalculateurs et de centres de données, évaluant systématiquement les effets synergiques du contrôle de la congestion et de la gestion de l'énergie. La valeur principale de l'article réside dans :
- Combler une lacune de recherche : première étude systématique des interactions entre les deux technologies
- Valeur pratique élevée : la combinaison DBBM + PerfBound peut être directement appliquée, réalisant 20%+ d'économies d'énergie avec <3% de dégradation des performances
- Expériences suffisantes : comparaison complète de plusieurs combinaisons de schémas
Les principales insuffisances résident dans la profondeur théorique limitée, l'absence d'explication approfondie des phénomènes et le manque de vérification sur des systèmes réels. Cependant, en tant qu'article orienté vers l'application, ses résultats expérimentaux et ses conseils pratiques ont une valeur considérable, devant exercer un impact positif sur la verdissement des réseaux HPC et des centres de données.
Indice de recommandation : ⭐⭐⭐⭐ (4/5) - Valeur de référence importante pour les chercheurs et ingénieurs travaillant sur les réseaux HPC et l'informatique verte.