We prove a conjecture of Bourn and Willenbring (2020) regarding the palindromicity and unimodality of a certain family of polynomials $N_n(t)$. These recursively defined polynomials arise as the numerators of generating functions in the context of the discrete one-dimensional earth mover's distance (EMD). The key to our proof is showing that the defining recursion can be viewed as describing sums of symmetric differences of pairs of Young diagrams; in this setting, palindromicity is equivalent to the preservation of the symmetric difference under the transposition of diagrams. We also observe a connection to recent work by Defant et al. (2024) on the Wiener index of minuscule lattices, which we reinterpret combinatorially to obtain explicit formulas for the coefficients of $N_n(t)$ and for the expected value of the discrete EMD.
- ID de l'article: 2307.02652
- Titre: Palindromicité du numérateur d'une fonction génératrice statistique
- Auteurs: Rebecca Bourn (Université du Wisconsin–Milwaukee), William Q. Erickson (Université Baylor)
- Classification: math.CO (Combinatoire)
- Date de publication: Juillet 2023, dernière révision le 14 octobre 2025
- Lien de l'article: https://arxiv.org/abs/2307.02652
Cet article démontre une conjecture de Bourn et Willenbring (2020) concernant la palindromicité et l'unimodalité d'une famille de polynômes Nn(t). Ces polynômes définis récursivement apparaissent comme numérateurs de fonctions génératrices dans le contexte de la distance Earth Mover (EMD) discrète unidimensionnelle. La clé de la preuve consiste à montrer que la récurrence définissante peut être considérée comme une somme de différences symétriques de paires de diagrammes de Young ; dans ce cadre, la palindromicité équivaut à la préservation de la différence symétrique sous la transposition du diagramme. Les auteurs observent également un lien avec les travaux de Defant et al. (2024) sur l'indice de Wiener des treillis minuscules, obtenant par réinterprétation combinatoire des formules explicites pour les coefficients de Nn(t) et les valeurs attendues de l'EMD discret.
- Distance Earth Mover (EMD): Également appelée distance de Wasserstein d'ordre un, elle mesure la distance entre deux histogrammes (ou distributions de probabilité) en calculant le « travail » minimal nécessaire pour transformer une distribution en une autre.
- Fonctions génératrices statistiques: En probabilités et statistiques, les fonctions génératrices sont des outils essentiels pour coder l'information d'une séquence ; les propriétés des polynômes numérateurs possèdent souvent une signification combinatoire profonde.
- Théorie des diagrammes de Young: Les diagrammes de Young sont des objets fondamentaux en mathématiques combinatoires, étroitement liés à la théorie des partitions, à la théorie des représentations, etc.
- Bourn et Willenbring ont dérivé en 2020 une formule récursive pour la valeur attendue de l'EMD et ont observé que le numérateur de la fonction génératrice Nn(t) semble posséder la palindromicité et l'unimodalité
- Cette observation a formé une conjecture nécessitant une preuve mathématique rigoureuse
- Comprendre la structure de ces polynômes est important pour les propriétés statistiques de l'EMD
- La définition récursive originale manquait d'interprétation combinatoire intuitive
- Aucune formule explicite n'existait pour calculer les coefficients polynomiaux
- Absence de connexions avec d'autres domaines mathématiques
- Preuve de la conjecture principale: Démonstration complète de la palindromicité et de l'unimodalité du polynôme Nn(t)
- Établissement d'une interprétation combinatoire: Réinterprétation de la relation de récurrence comme somme de différences symétriques de diagrammes de Young
- Découverte d'une connexion avec les treillis minuscules: Lien établi avec les travaux de Defant et al. sur l'indice de Wiener des treillis minuscules de type A
- Obtention de formules explicites: Expressions en forme fermée pour les coefficients de Nn(t) et les valeurs attendues de l'EMD discret
- Résolution du problème récursif: Résolution complète du calcul récursif original de la valeur attendue de l'EMD
Prouver que pour tous les entiers positifs n, le polynôme Nn(t) possède simultanément:
- Palindromicité: f(t)=tdf(1/t), où d est le degré total du polynôme
- Unimodalité: La séquence des coefficients est d'abord strictement croissante puis strictement décroissante
Définition de la différence symétrique de diagrammes de Young:
λ△μ:=(λ∪μ)∖(λ∩μ)
Introduction de la notation:
S△(a,b∣c,d):=∑λ∈Par(a×b),μ∈Par(c×d)∣λ△μ∣
Théorème 3.1: Le polynôme Npq(t) défini récursivement possède l'expression explicite:
Npq(t)=∑k=1min{p,q}S△(k,p−k∣k,q−k)⋅tk
Lemme 2.2: S△(a,b∣c,d)=S△(b,a∣d,c)
Cette symétrie conduit directement à la palindromicité: lorsque p=q=n, le coefficient de tk égale celui de tn−k.
Utilisation des résultats de Defant et al.:
d(Pa,b)=4a+4b+2ab(2a+12a+2b+2)
où d(Pa,b) est l'indice de Wiener de l'ensemble partiellement ordonné des diagrammes de Young dans un rectangle a×b.
- Transformation de la récurrence en combinatoire: Conversion des relations récursives abstraites en calculs concrets de différences symétriques de diagrammes de Young
- Connexion interdisciplinaire: Établissement d'un pont entre la théorie statistique de l'EMD et la combinatoire algébrique (treillis minuscules)
- Explicitation: Passage de la définition récursive à une formule en forme fermée, évitant les calculs récursifs complexes
Pour tous les entiers positifs n, le polynôme Nn(t) est à la fois palindromique et unimodal.
Nn(t)=4n+21∑k=1n−1k(n−k)(2k+12n+2)tk
Si (α,β)∈C(s,n)×C(s,n) sont choisis uniformément au hasard, alors:
E[EMD(α,β)]=4s+4n−2s(n−1)⋅(ss+n−1)2(2s+12s+2n)
Pour n=4:
N4(t)=20t+56t2+20t3
La correction de la formule a été vérifiée par calcul direct des différences symétriques de diagrammes de Young.
Idée centrale: La transposition de diagrammes de Young préserve la taille de la différence symétrique
- Utilisation de la propriété d'involution λ↦λ′
- ∣λ△μ∣=∣λ′△μ′∣
- La symétrie S△(a,b∣c,d)=S△(b,a∣d,c) donne directement la palindromicité
Idée centrale: Utilisation de l'unimodalité des coefficients binomiaux et des fonctions quadratiques
- k(n−k) est strictement croissant pour k<n/2
- (2k+12n+2) est strictement croissant pour k<n/2
- Le produit de deux fonctions unimodales reste unimodal
Vérification par le principe d'inclusion-exclusion de la relation de récurrence:
S△(k,ℓ∣k,m)=S△(k,ℓ−1∣k,m)+S△(k,ℓ∣k,m−1)−S△(k,ℓ−1∣k,m−1)+S△(k−1,ℓ∣k−1,m)+∣ℓ−m∣⋅∣Par((k−1)×ℓ)∣⋅∣Par((k−1)×m)∣
- Problème de transport classique: Travaux de Hitchcock, Monge, Kantorovich, Koopmans
- Distances entre distributions de probabilité: Théorie de la distance de Wasserstein
- Domaines d'application: Vision par ordinateur, apprentissage automatique pour la comparaison de distributions
- Théorie des partitions: Combinatoire énumérative de Stanley
- Théorie des représentations: Connexion entre diagrammes de Young et représentations du groupe symétrique
- Fonctions génératrices: Théorie des séries de Hilbert
- Algèbres de Lie: Poids minuscules des algèbres de Lie semi-simples complexes
- Paires symétriques hermitiennes: Réalisations géométriques de (g,k)
- Ordre de Bruhat: Structure d'ordre partiel sur le groupe de Weyl
- Résolution complète de la conjecture de Bourn-Willenbring
- Fourniture d'une base mathématique complète pour la théorie statistique de l'EMD
- Établissement d'une nouvelle connexion entre la statistique et la combinatoire algébrique
- Combinatoire: Fourniture de nouveaux exemples pour la théorie des polynômes palindromiques unimodaux
- Théorie des probabilités: Obtention de formules exactes pour les valeurs attendues d'une mesure de distance importante
- Géométrie algébrique: Connexions potentielles avec la théorie des séries de Hilbert des anneaux de Gorenstein
- L'étude se concentre principalement sur le cas unidimensionnel ; la généralisation en dimension supérieure reste difficile
- Bien que la formule explicite soit élégante, la complexité computationnelle reste élevée
- Les connexions avec d'autres types de treillis minuscules restent à explorer
- Généralisation en dimension supérieure: Étude des propriétés analogues pour l'EMD multidimensionnel
- Propriétés de racines réelles: Des travaux ultérieurs ont prouvé que Nn(t) ne possède que des racines réelles
- Connexions de géométrie algébrique: Recherche de réalisations de Hn′(t) comme séries de Hilbert de certains anneaux de Gorenstein
- Complétude de la résolution du problème: Non seulement la conjecture originale est prouvée, mais des formules explicites sont également fournies
- Innovativité de la méthode: L'interprétation par différences symétriques de diagrammes de Young est riche d'intuition
- Connexions interdisciplinaires: Liaison ingénieuse de domaines de recherche apparemment sans rapport
- Vérifiabilité computationnelle: Fourniture d'exemples numériques concrets et de vérifications
- Les techniques de preuve synthétisent plusieurs méthodes de la combinatoire, de l'algèbre et de la théorie des probabilités
- L'application du principe d'inclusion-exclusion démontre un raisonnement combinatoire raffiné
- Les manipulations de fonctions génératrices reflètent une technique analytique approfondie
- Contribution théorique: Fourniture d'outils théoriques importants pour la combinatoire probabiliste
- Valeur applicative: L'EMD possède des applications largement répandues en apprentissage automatique et en science des données
- Caractère inspirant: Peut stimuler davantage de recherches sur les interprétations combinatoires de quantités statistiques
- Certains détails techniques (comme la connexion avec les anneaux de Gorenstein) nécessitent un développement ultérieur
- La complexité du cas multidimensionnel peut limiter la généralisation directe de la méthode
- L'analyse de la complexité computationnelle n'est pas suffisamment développée
Les références clés incluent:
- 2 Bourn & Willenbring (2020): Formule récursive originale de l'EMD
- 4 Defant et al. (2024): Indice de Wiener des treillis minuscules
- 8 Erickson (2024): Connexion entre EMD et diagrammes de Young
- 15 Stanley (1978): Théorie des fonctions de Hilbert et palindromicité
Cet article résout un problème important de probabilités et statistiques par des méthodes combinatoires ingénieuses, démontrant les connexions profondes entre différentes branches des mathématiques et posant une base solide pour les recherches ultérieures dans les domaines connexes.