A linked bar chart is the augmentation of a traditional bar chart where each bar is partitioned into blocks and pairs of blocks are linked using orthogonal lines that pass over intermediate bars. The order of the blocks readily influences the legibility of the links. We study the algorithmic problem of minimizing the vertical length of these links, for a fixed bar order. The main challenge lies with ``dependent'' links, whose vertical link length cannot be optimized independently per bar. We show that, if the dependent links form a forest, the problem can be solved in $O(nm)$ time, for n bars and m links. If the dependent links between non-adjacent bars form a forest, the problem admits an $O(n^4m)$-time algorithm. Finally, we show that the general case is fixed-parameter tractable in the maximum number of links that are connected to one bar.
academic
Minimisation de la Longueur Verticale dans les Diagrammes en Barres Liés
Les diagrammes en barres liés (Linked Bar Chart) constituent une version améliorée des diagrammes en barres traditionnels, où chaque barre est divisée en plusieurs blocs (blocks) reliés entre eux par des lignes orthogonales qui doivent traverser les barres intermédiaires. L'ordre d'arrangement des blocs affecte directement la lisibilité des lignes de connexion. Cet article étudie le problème algorithmique de minimisation de la longueur verticale des lignes de connexion pour un ordre de barres fixe. Le défi principal réside dans les « liens dépendants » (dependent links), dont la longueur verticale ne peut être optimisée indépendamment. L'étude montre que : si les liens dépendants forment une structure de forêt, le problème peut être résolu en temps O(nm) (n barres, m liens) ; si les liens dépendants entre barres non adjacentes forment une forêt, il peut être résolu en temps O(n⁴m) ; dans le cas général, le problème est traitable à paramètre fixe (FPT) en fonction du degré maximal des barres.
Les diagrammes en barres traditionnels ne peuvent représenter que des données d'une seule catégorie, mais dans de nombreux scénarios pratiques, certaines valeurs ne sont pas exclusivement attribuées à une catégorie unique, mais sont plutôt associées à plusieurs catégories. Par exemple :
Quantités partagées : le volume de communication entre comptes apparaît simultanément dans les statistiques de deux comptes
Incertitude appariée : électeurs hésitant entre deux partis dans les sondages électoraux ; contribution des usines frontalières à la pollution des deux pays
La visualisation de données inter-catégories constitue un besoin important en analyse de données. Les diagrammes en barres liés représentent ces relations en ajoutant des lignes de connexion entre les barres, mais l'ordre d'empilement des blocs affecte directement la longueur verticale des lignes de connexion, influençant ainsi la lisibilité et l'esthétique du graphique.
Les diagrammes en barres standard ne peuvent pas visualiser directement les valeurs inter-catégories
Bien que les diagrammes en barres liés aient été récemment proposés 17, le problème d'optimisation de l'ordre d'empilement des blocs n'a pas encore été étudié
Les problèmes traditionnels de dessin de graphes (comme l'intégration de livres à une page) ne considèrent que l'ordre des sommets, pas cette nouvelle dimension d'empilement des blocs
Cet article étudie pour la première fois de manière systématique le problème algorithmique de minimisation de la longueur verticale des liens dans les diagrammes en barres liés, fournissant une base théorique et des algorithmes efficaces pour cette nouvelle méthode de visualisation.
Formalisation du problème : Première définition du problème d'optimisation de minimisation de la longueur verticale des liens dans les diagrammes en barres liés, introduction d'une taxonomie classifiant les « liens indépendants » et les « liens dépendants »
Algorithme de structure forestière : Preuve que lorsque le sous-graphe de liens dépendants forme une forêt, le problème peut être résolu en temps O(nm) par programmation dynamique (Théorème 3)
Algorithme forestier non-adjacent : Preuve que lorsque les liens dépendants non-adjacents forment une forêt, le problème peut être résolu en temps O(n⁴m) (Théorème 6)
Algorithme FPT : Preuve que dans le cas général, le problème est traitable à paramètre fixe, le paramètre étant le degré maximal Δ des barres, avec une complexité temporelle O(Δ^(3δ)·δ·n) (Théorème 8)
Bornes de complexité inférieure : Preuve que lorsque les sommets peuvent avoir plusieurs blocs non-liés arbitrairement ordonnables, le problème est fortement NP-difficile (Théorème 12)
L'article classe les liens en deux grandes catégories :
Liens indépendants (IL) : La longueur verticale peut être optimisée indépendamment en plaçant le bloc à une cible fixe t, avec un coût de |t - y| + |t - y'|. Trois cas :
Une barre intermédiaire est plus haute que la position la plus élevée possible d'une extrémité → cible = hauteur de la barre intermédiaire la plus élevée H
Les intervalles de positions possibles des deux extrémités ne se chevauchent pas → cible = position la plus basse de l'intervalle le plus élevé
La position d'une extrémité est fixe (séquence correspondante vide) → cible = cette position fixe
Liens dépendants (DL) : La longueur verticale dépend de la position relative des deux blocs, ne pouvant pas être assignée à une cible statique. Subdivisés en :
Liens dépendants adjacents (ADL) : reliant des barres adjacentes
Liens dépendants non-adjacents (NADL) : reliant des barres non-adjacentes
Lemme clé 1 : Le sous-graphe de liens dépendants est un graphe planaire externe (outerplanar), donc sa largeur d'arbre ≤ 2.
Taxonomie de classification des liens : La classification indépendant/dépendant permet de décomposer le problème d'optimisation, les liens indépendants pouvant être optimisés localement, les liens dépendants nécessitant une considération globale
Programmation dynamique hiérarchisée :
Algorithme 1 : exploite la structure d'arbre pour la décomposition
Algorithme 2 : introduit des états paramétrés pour gérer les ADL
Algorithme 3 : utilise la décomposition d'arbre pour le cas général
Exploitation de la propriété de graphe planaire externe : La nature planaire externe du sous-graphe de liens dépendants garantit une largeur d'arbre ≤ 2, fournissant une base théorique pour l'algorithme FPT
Stratégie de précomputation : Précomputation du coût des sous-ensembles de blocs indépendants au nœud d'oubli, évitant les recalculs
Note : Cet article est un article d'algorithmes théoriques et ne contient pas de section de vérification expérimentale. L'article se concentre sur la conception d'algorithmes et l'analyse de complexité.
L'article prouve la difficulté du problème par réduction :
Théorème 12 (Difficulté NP-forte) : Lorsque les sommets peuvent avoir plusieurs blocs non-liés arbitrairement ordonnables, la minimisation de la longueur verticale des liens est fortement NP-difficile.
Méthode de preuve : Réduction du problème 3-Partition
Construction : 2k-1 barres, B₀ contient n blocs non-liés (correspondant à l'instance 3-Partition)
Propriété clé : seul l'ordre des blocs non-liés de B₀ peut être ajusté
Équivalence : existence d'un schéma de longueur verticale zéro ⟺ existence d'une solution 3-Partition
Complexité hiérarchisée : La complexité du problème varie de O(nm) (structure forestière) à FPT (cas général) à fortement NP-difficile (version étendue)
Algorithmes pratiques : Pour les structures de données courantes (comme les distributions de hauteur unimodales/univalley), il existe des algorithmes polynomiaux efficaces
Solubilité paramétrée : Dans le cas général, lorsque le degré des barres est borné, le problème peut être résolu efficacement
1 Bernhart & Kainen (1979): The book thickness of a graph - Théorie fondamentale de l'intégration de livres à une page
6 Cygan et al. (2015): Parameterized algorithms - Manuel standard des algorithmes FPT
11 Frederickson & Hambrusch (1988): Planar linear arrangements of outerplanar graphs - Algorithmes polynomiaux pour optimisation de graphes planaires externes
17 van Beusekom et al. (2024): Visualizing set sizes with dependent and independent uncertainties - Proposition originale des diagrammes en barres liés
Évaluation globale : Ceci est un article de haute qualité en géométrie computationnelle théorique, étudiant systématiquement le problème algorithmique d'optimisation des diagrammes en barres liés. L'article est théoriquement rigoureux, la conception algorithmique est ingénieuse, et l'analyse de complexité est complète. La valeur principale réside dans l'établissement d'une base théorique solide pour cette nouvelle méthode de visualisation. Les insuffisances sont l'absence de vérification expérimentale et la caractérisation incomplète de la complexité du cas général. Si l'on peut à l'avenir combiner l'évaluation sur données réelles et la conception d'algorithmes heuristiques, cela augmentera considérablement sa valeur pratique.