We establish new depth upper bounds for sorting networks on 27 and 28 channels, improving the previous best bound of 14 to 13. Our 28-channel network is constructed with reflectional symmetry by combining high-quality prefixes of 16- and 12-channel networks, extending them greedily one comparator at a time, and using a SAT solver to complete the remaining layers.
- ID de l'article : 2511.04107
- Titre : Depth-13 Sorting Networks for 28 Channels
- Auteur : Chengu Wang (wangchengu@gmail.com)
- Classification : cs.DS (Structures de Données et Algorithmes), cs.DM (Mathématiques Discrètes)
- Date de publication : 6 novembre 2025 (prépublication arXiv)
- Lien de l'article : https://arxiv.org/abs/2511.04107
Cet article établit de nouvelles bornes supérieures de profondeur pour les réseaux de tri à 27 et 28 canaux, améliorant les meilleures bornes précédentes de 14 couches à 13 couches. Le réseau à 28 canaux est construit par symétrie réflexive, combinant des préfixes de haute qualité des réseaux à 16 et 12 canaux, avec une expansion gloutonne comparateur par comparateur, et utilisant un solveur SAT pour compléter les couches restantes.
Le problème fondamental abordé par cette recherche consiste à trouver les réseaux de tri de profondeur optimale pour un nombre spécifique de canaux (27 et 28). Les réseaux de tri sont des réseaux de comparateurs qui ordonnent une séquence d'entrée en ordre non décroissant, où la profondeur est définie comme le nombre maximal de comparateurs sur le chemin de l'entrée à la sortie.
- Valeur pratique : Les réseaux de tri ont des applications importantes dans le tri sur GPU, les systèmes FPGA et l'implémentation matérielle des protocoles cryptographiques
- Signification théorique : Les réseaux de tri logiciels constituent des éléments de base pour les algorithmes de tri non pertinent dans les systèmes de calcul sécurisé et les systèmes de confidentialité différentielle
- Optimisation algorithmique : Bien que le réseau AKS atteigne une profondeur O(log n) asymptotiquement, les grandes constantes implicites le rendent impratique pour les applications réelles
- Les algorithmes de tri par fusion paire-impaire et de tri bitonique de Batcher ont une profondeur O((log n)²), ce qui n'est pas suffisamment optimisé
- Bien que le réseau AKS soit asymptotiquement optimal, le facteur constant est trop important, limitant son utilité pratique
- Pour les valeurs moyennes de n (comme 27, 28), la meilleure borne supérieure précédente était de 14 couches, laissant place à des améliorations
- Amélioration révolutionnaire : Amélioration de la borne supérieure de profondeur des réseaux de tri à 27 et 28 canaux de 14 couches à 13 couches
- Innovation méthodologique : Proposition d'une stratégie de construction diviser-pour-régner basée sur la symétrie réflexive, combinée avec une décomposition 16+12 canaux
- Optimisation de l'espace de recherche : Développement de deux nouvelles techniques pour réduire l'espace de recherche : contraintes de symétrie réflexive et expansion gloutonne de comparateurs uniques
- Implémentation efficace : L'ensemble du processus de calcul s'effectue en moins de 20 minutes sur un Mac mini M2, avec code open source fourni
Entrée : Une séquence arbitraire de valeurs comparables sur n canaux
Sortie : La séquence ordonnée en ordre non décroissant
Contrainte : Minimiser la profondeur du réseau (nombre maximal de comparateurs du chemin entrée-sortie)
Si un réseau de comparateurs ordonne correctement les 2^n séquences booléennes, alors il ordonne correctement toutes les séquences de valeurs arbitrairement comparables. Cela simplifie considérablement le processus de vérification.
Élagage de l'espace de recherche basé sur les lemmes suivants :
- Lemme 2 : Si output(P') ⊆ output(P) et P#S est un réseau de tri, alors P'#S est également un réseau de tri
- Lemme 3 : Extension du lemme 2 par symétrie de permutation
- Corollaire 1 : Conditions complètes d'élimination des redondances combinant opérations de permutation et de négation
- Phase de combinaison de préfixes : Combinaison d'un préfixe de 5 couches de haute qualité à 16 canaux avec un préfixe de 5 couches à 12 canaux
- Phase d'expansion gloutonne : Extension couche par couche jusqu'à la couche 6, en maintenant l'ensemble optimal de candidats
- Phase de résolution SAT : Utilisation d'un solveur SAT pour compléter les couches 7-13
- Limitation de l'espace de recherche aux réseaux symétriques réflexifs
- Élagage de symétrie utilisant la structure du groupe centralisé C(ρn)
- Les permutations symétriques réflexives forment un produit couronne C₂ ≀ S_{n/2}
Raisons du choix de la décomposition 16+12 plutôt que 14+14 :
- Les nombres de canaux puissances de 2 sont généralement plus efficaces
- La fusion est plus efficace lorsque les deux parties sont de taille similaire
- Le réseau à 16 canaux dispose d'excellents préfixes Van Voorhis disponibles
Les méthodes traditionnelles énumèrent toutes les couches symétriques possibles, ce qui entraîne une charge de calcul énorme. Cet article innove en :
- Ajoutant progressivement des comparateurs et leurs paires réflexives
- Conservant les 64 meilleurs candidats à chaque étape (triés par taille d'ensemble de sortie)
- Réduisant significativement la complexité de calcul
Développement de deux méthodes heuristiques :
- Détection positive : Permutation aléatoire de lignes, vérification des relations de couverture de colonnes
- Filtrage négatif : Comparaison des séquences de sommes de lignes et de colonnes
- Matériel : Mac mini M2, 16 Go de RAM
- Solveur SAT : MiniSat
- Langage de programmation : Non explicitement spécifié
- Temps de calcul total : Moins de 20 minutes
- Génération itérative couche par couche de tous les préfixes symétriques réflexifs non redondants à 5 couches
- Nombre de préfixes par couche : 1 → 4 → 41 → 1502 → 11753 → 2164
- Sélection des 4 préfixes avec les plus petits ensembles de sortie (tailles 34, 34, 35, 35)
- Utilisation des 5 premières couches du réseau de tri Van Voorhis
- Construction d'une structure d'hypercube 4-dimensionnel
- Couche 5 avec comparaisons symétriques par poids de Hamming pour les clés correspondantes
- Adoption des techniques d'optimisation de CCFE+19
- Techniques d'encodage oneUp et oneDown
- Contraintes des deux dernières couches
- Permutation de canaux pour minimiser la taille de la fenêtre
- Résolution parallèle de 8 instances SAT
Construction réussie d'un réseau de tri symétrique réflexif à 28 canaux de profondeur 13, avec la configuration complète des comparateurs pour les 13 couches détaillée dans l'article.
- Décomposition du temps de calcul :
- Recherche de préfixe à 12 canaux 5 couches : 12 minutes
- Recherche de préfixe à 16 canaux 5 couches : 1 minute
- Résolution SAT (8 instances parallèles) : 0,5-5 minutes
- Autres étapes : Temps quasi instantané
- Tous les 8 meilleurs préfixes trouvent une solution réalisable
- Suppression des comparateurs inutilisés pour obtenir le réseau final
- Optimisation supplémentaire de la représentation par permutation de canaux d'entrée
Corollaire 3 : Un réseau de tri à 27 canaux de profondeur 13 existe également (obtenu simplement à partir du réseau à 28 canaux)
- Algorithmes classiques : Tri par fusion paire-impaire et tri bitonique de Batcher (profondeur O((log n)²))
- Percée théorique : Réseau AKS réalisant profondeur O(log n) et taille O(n log n)
- Optimisation à petite échelle : Recherche de constructions exactes pour des valeurs spécifiques de n
- SorterHunter : Outil de recherche exploitant la symétrie réflexive
- Méthodes de résolution SAT : Techniques d'encodage de Codish et al.
- Recherche de préfixes : Stratégies d'élagage de Bundala et Závodnỳ
Ehlers Ehl17 a amélioré le réseau à 24 canaux à 12 couches, utilisant une stratégie similaire de combinaison de préfixes et de résolution SAT. Cet article étend cette approche à une plus grande échelle.
- Amélioration réussie de la borne supérieure de profondeur des réseaux de tri à 27 et 28 canaux de 14 à 13
- Démonstration de l'efficacité des contraintes de symétrie réflexive et de l'expansion gloutonne
- Fourniture d'une implémentation efficace avec un temps de calcul raisonnable
- Limitations méthodologiques : Impossibilité d'améliorer le réseau à 18 canaux
- Stratégie de recherche : L'expansion gloutonne peut manquer la solution globalement optimale
- Limitation d'échelle : L'applicabilité de la méthode aux réseaux de plus grande taille reste inconnue
- Intégration d'apprentissage automatique : Utilisation de l'apprentissage par renforcement pour prédire les préfixes les plus prometteurs
- Optimisation de la fonction objectif : Exploration de meilleures fonctions objectifs pour l'expansion gloutonne que la minimisation de l'ensemble de sortie
- Échelle plus grande : Extension de la méthode aux réseaux à 29-32 canaux
- Contribution pratique significative : Progrès révolutionnaire sur un problème pratique important
- Forte innovativité méthodologique : L'extension gloutonne de comparateurs uniques est une technique nouvelle et efficace
- Implémentation efficace : Recherche complexe complétée en 20 minutes, forte praticité
- Fondements théoriques solides : Basé sur la théorie de symétrie mature et les techniques de résolution SAT
- Bonne reproductibilité : Implémentation open source complète fournie
- Analyse théorique insuffisante : Manque d'analyse théorique de la complexité et de la convergence de la méthode
- Portée expérimentale limitée : Limitation aux canaux 27 et 28, capacité de généralisation insuffisamment vérifiée
- Comparaison insuffisante : Comparaison limitée avec d'autres méthodes heuristiques
- Sensibilité aux paramètres : Absence d'analyse de l'impact des paramètres critiques (comme la taille de candidat 64)
- Valeur académique : Fourniture d'une nouvelle voie technique pour l'optimisation des réseaux de tri
- Valeur pratique : Signification directe pour la conception matérielle et les applications cryptographiques
- Contribution méthodologique : La stratégie d'expansion gloutonne peut s'appliquer à d'autres problèmes d'optimisation combinatoire
- Conception matérielle : Optimisation des circuits de tri dans FPGA et ASIC
- Algorithmes parallèles : Implémentation de tri sur GPU et processeurs multicœurs
- Cryptographie : Protocoles de tri non pertinent en calcul multipartite sécurisé
- Recherche théorique : Base pour la construction de réseaux de plus grande taille
L'article cite les publications fondamentales du domaine, notamment :
- Le manuel classique de Knuth « The Art of Computer Programming », volume 3
- L'article original sur le réseau AKS
- Les techniques d'optimisation SAT récentes CCFE+19
- La méthode d'élagage de préfixes de Bundala et Závodnỳ BZ14
Évaluation Globale : Cet article représente une avancée substantielle dans le domaine de l'optimisation des réseaux de tri. Bien que l'amélioration semble modeste (de 14 à 13 couches), dans ce domaine mature, toute amélioration est extrêmement précieuse. L'article démontre une forte innovativité technique et une grande praticité, fournissant des méthodes et des outils précieux pour le développement futur du domaine.