2025-11-10T02:30:54.908722

Tight universal bounds on the height times the width of random trees

Donderwinkel, Khanfir
We obtain assumption-free, non-asymptotic, uniform bounds on the product of the height and the width of uniformly random trees with a given degree sequence, conditioned Bienaymé trees and simply generated trees. We show that for a tree of size $n$, this product is $O(n \log n)$ in probability, answering a question by Addario-Berry (2019). The order of this bound is tight in this generality.
academic

Bornes universelles strictes sur le produit de la hauteur et de la largeur des arbres aléatoires

Informations de base

  • ID de l'article: 2501.00458
  • Titre: Tight universal bounds on the height times the width of random trees
  • Auteurs: Serte Donderwinkel, Robin Khanfir
  • Classification: math.PR (Théorie des probabilités), math.CO (Mathématiques combinatoires)
  • Date de publication: 31 décembre 2024
  • Lien de l'article: https://arxiv.org/abs/2501.00458

Résumé

Cet article établit des bornes sans hypothèse, non-asymptotiques et uniformes sur le produit de la hauteur et de la largeur pour les arbres aléatoires uniformes avec une séquence de degrés donnée, les arbres de Bienaymé conditionnels et les arbres de génération simples. Nous démontrons que pour un arbre de taille nn, ce produit est O(nlogn)O(n \log n) au sens probabiliste, répondant ainsi à une question posée par Addario-Berry (2019). L'ordre de cette borne est optimal.

Contexte et motivation de la recherche

Contexte du problème

  1. Problème central: Étudier les bornes supérieures du produit de la hauteur (height) et de la largeur (width) des arbres aléatoires. Pour un arbre enraciné tt, la hauteur Ht(t)Ht(t) est la distance maximale de la racine à tout nœud, et la largeur Wd(t)Wd(t) est le nombre maximal de nœuds à n'importe quel niveau.
  2. Importance: La hauteur et la largeur fournissent une description grossière de la forme globale de l'arbre et constituent une première étape dans l'étude des propriétés géométriques des arbres. L'estimation de l'ordre de ces statistiques est cruciale pour comprendre la structure géométrique de divers modèles d'arbres aléatoires.
  3. Limitations existantes:
    • Les recherches antérieures ont principalement étudié la hauteur et la largeur séparément, manquant d'une analyse unifiée de leur produit
    • Les résultats existants nécessitent généralement des hypothèses spécifiques sur la distribution des descendants (comme la variance finie)
    • Absence de bornes uniformes non-asymptotiques
  4. Motivation de la recherche: Addario-Berry a posé en 2019 une question ouverte: existe-t-il une distribution des descendants telle que Wd(Tμ,n)Ht(Tμ,n)/nWd(T_{\mu,n})Ht(T_{\mu,n})/n soit beaucoup plus grand que logn\log n avec une probabilité non nulle? Cet article fournit une réponse négative.

Contributions principales

  1. Bornes uniformes sans hypothèse: Pour toute distribution des descendants μ\mu et tout nn, nous prouvons que P(Wd(Tμ,n)Ht(Tμ,n)>snlogn)230s2/13P(Wd(T_{\mu,n})Ht(T_{\mu,n}) > sn \log n) \leq 230s^{-2/13}
  2. Applicabilité générale: Les résultats s'appliquent à plusieurs modèles d'arbres aléatoires:
    • Arbres de Bienaymé conditionnels
    • Arbres de génération simples
    • Arbres aléatoires uniformes avec séquence de degrés donnée
  3. Preuve de l'optimalité: L'borne O(nlogn)O(n \log n) est optimale, comme le démontrent les exemples connus
  4. Méthode de preuve élémentaire: Utilisation de techniques probabilistes relativement simples, évitant les outils analytiques complexes

Explication détaillée de la méthode

Définition de la tâche

Étant donnée une séquence de types n=(ni)i0n = (n_i)_{i \geq 0}, où nin_i représente le nombre de sommets ayant ii enfants, nous étudions les bornes probabilistes du produit de la hauteur Ht(T)Ht(T) et de la largeur Wd(T)Wd(T) d'un arbre planaire aléatoire uniforme TT.

Cadre technique principal

1. Décomposition spinale (Spinal Decomposition)

Pour un sommet uu dans l'arbre tt, nous définissons le poids spinal:

  • Su(t)=#{vt{}:v=uv et vu}S_u(t) = \#\{v \in t \setminus \{\emptyset\} : \overleftarrow{v} = u \wedge v \text{ et } \overleftarrow{v} \neq u\}
  • Sud(t)S^d_u(t): poids spinal droit (younger siblings)
  • Sug(t)S^g_u(t): poids spinal gauche (older siblings)

2. Hauteur de second ordre

Nous définissons la hauteur de second ordre: Ht(2)(t)=maxu,vtmin(uuv,vuv)Ht^{(2)}(t) = \max_{u,v \in t} \min(|u| - |u \wedge v|, |v| - |u \wedge v|)

Propriété clé: Ht(2)(t)=maxvtvuvHt^{(2)}(t) = \max_{v \in t} |v| - |u \wedge v|, où u=Ht(t)|u| = Ht(t)

3. Codage de l'arbre

Nous codons l'arbre comme une marche aléatoire en utilisant le parcours en profondeur d'abord et le parcours en largeur d'abord:

  • Marche en profondeur d'abord: Xidf(t)=Suidf(t)d(t)X^{df}_i(t) = S^d_{u^{df}_i(t)}(t)
  • Marche en largeur d'abord: liée à la largeur

Stratégie de preuve principale

Étape 1: Comparaison de hauteur (Proposition 2.3)

Nous prouvons que pour ϵ>0\epsilon > 0, si ϵ1/3n02\epsilon^{1/3}n_0 \geq 2: P(ϵHt(T)1;ϵHt(T)>Ht(2)(T))64ϵ1/3P(\epsilon Ht(T) \geq 1; \epsilon Ht(T) > Ht^{(2)}(T)) \leq 64\epsilon^{1/3}

Points techniques:

  • Construction d'une application préservant le type, convertissant les arbres linéaires en arbres ramifiés
  • Utilisation de techniques de décalage cyclique pour analyser les généalogies

Étape 2: Comparaison de largeur (Proposition 2.4)

Nous prouvons que si ϵ4/3n0126\epsilon^{4/3}\sqrt{n_0} - 1 \geq 26: P(ϵWd(T)maxuSud(T))3222ϵ2/3P(\epsilon Wd(T) \geq \max_u S^d_u(T)) \leq 3\sqrt{222}\epsilon^{2/3}

Points techniques:

  • Utilisation de la transformation de Vervaat pour connecter les deux codages
  • Analyse des propriétés d'étendue des ponts échangeables

Étape 3: Contrôle de la hauteur spinale (Proposition 2.5)

P(maxu,vT,uv(vuv)Sud(T)snlogn)3n2s/2P\left(\max_{u,v \in T, u \leq v} (|v| - |u \wedge v|)S^d_u(T) \geq sn \log n\right) \leq 3n^{2-s/2}

Points techniques:

  • Arguments de domination stochastique
  • Réduction du problème à l'analyse de la hauteur maximale des forêts de chemins

Étape 4: Symétrisation (Propositions 2.6, 2.7)

Nous éliminons l'asymétrie gauche-droite par des opérations de mélange:

  • Le mélange miroir préserve la distribution de l'arbre
  • Utilisation de l'aléatoire de l'ordre planaire

Configuration expérimentale

Vérification théorique

Cet article est un travail purement théorique, validé principalement par des preuves mathématiques:

  1. Exemples d'optimalité: Nous citons les résultats de Kortchemski (2014) et Addario-Berry (2019), prouvant l'existence de distributions des descendants telles que Wd(Tμ,n)Ht(Tμ,n)Wd(T_{\mu,n})Ht(T_{\mu,n}) atteigne Θ(nlogn)\Theta(n \log n)
  2. Analyse de cas particuliers:
    • Cas de variance finie: Ht(Tμ,n)nHt(T_{\mu,n}) \sim \sqrt{n}, Wd(Tμ,n)nWd(T_{\mu,n}) \sim \sqrt{n}
    • Cas de distribution à queue lourde: phénomène de condensation, conduisant au comportement O(nlogn)O(n \log n)

Résultats expérimentaux

Résultats principaux

Théorème 1.1 (Arbres de Bienaymé)

Pour toute distribution des descendants μ\mu et n3n \geq 3: P(Wd(Tμ,n)Ht(Tμ,n)>snlogn)230s2/13P(Wd(T_{\mu,n})Ht(T_{\mu,n}) > sn \log n) \leq 230s^{-2/13}

Théorème 1.2 (Arbres de génération simples)

Pour toute séquence de poids ww et n3n \geq 3: P(Wd(Tw,n)Ht(Tw,n)>snlogn)230s2/13P(Wd(T_{w,n})Ht(T_{w,n}) > sn \log n) \leq 230s^{-2/13}

Théorème 1.3 (Arbres avec séquence de degrés donnée)

Pour toute séquence de degrés dd satisfaisant i=1ndi=n1\sum_{i=1}^n d_i = n-1: P(Wd(Td)Ht(Td)>snlogn)230s2/13P(Wd(T_d)Ht(T_d) > sn \log n) \leq 230s^{-2/13}

Résultats techniques

Bornes d'étendue pour les ponts échangeables (Théorème 4.5)

Pour une séquence de sauts bnb^n, la séquence (σn1R(Yn))n1(\sigma_n^{-1}R(Y^n))_{n \geq 1} est tendue, où σn=σ2(bn)\sigma_n = \sqrt{\sigma^2(b^n)}.

Spécifiquement:

  • Borne supérieure (Proposition 4.6): P(σ1R(Y)ϵ1)12ϵP(\sigma^{-1}R(Y) \geq \epsilon^{-1}) \leq 12\epsilon
  • Borne inférieure (Proposition 4.8): P(2σ1R(Y)p1/2)400p1P(2\sigma^{-1}R(Y) \leq p^{-1/2}) \leq 400p^{-1}

Travaux connexes

Développement historique

  1. Résultats classiques: Kolchin (1986) a prouvé le comportement asymptotique dans le cas de variance finie
  2. Limites d'échelle: Aldous (1993), Duquesne (2003) et autres ont établi les limites continues
  3. Bornes non-asymptotiques: Devroye-Janson-Addario-Berry (2013), Kortchemski (2015)

Innovations de cet article

  1. Sans hypothèse: Aucune hypothèse sur la distribution des descendants n'est requise
  2. Traitement unifié: Traitement simultané de la hauteur et de la largeur
  3. Méthode élémentaire: Évite les outils analytiques complexes

Conclusions et discussion

Conclusions principales

  1. Pour les arbres aléatoires de taille nn, le produit de la hauteur et de la largeur ne dépasse presque sûrement pas O(nlogn)O(n \log n)
  2. Cette borne s'applique à tous les modèles d'arbres aléatoires considérés, sans aucune hypothèse
  3. La borne est optimale, avec des exemples atteignant cet ordre

Limitations

  1. Exposant de la queue: L'exposant 2/132/13 est loin d'être optimal et pourrait être amélioré par une analyse plus fine
  2. Constante: La constante 230 n'est probablement pas optimale
  3. Limitation de la méthode: L'utilisation de la méthode des moments d'ordre deux pourrait être améliorée par des moments d'ordre supérieur

Directions futures

L'article propose trois problèmes ouverts:

  1. Calculer la valeur de \sup E[1_{\{#T_\mu < \infty\}}Ht(T_\mu)Wd(T_\mu)(#T_\mu)^{-1}]
  2. Caractériser les conditions sous lesquelles Ht(Tμ,n)Wd(Tμ,n)=Θ(n)Ht(T_{\mu,n})Wd(T_{\mu,n}) = \Theta(n) et =Θ(nlogn)= \Theta(n \log n)
  3. Pour une fonction à variation lente f(n)f(n), existe-t-il une distribution des descendants telle que le produit soit Θ(nf(n))\Theta(nf(n))?

Évaluation approfondie

Avantages

  1. Problème important: Résout une question ouverte importante posée par Addario-Berry
  2. Innovation technique:
    • Technique de décomposition spinale ingénieuse
    • Application de la théorie des ponts échangeables
    • Technique de symétrisation par mélange
  3. Applicabilité générale: Les résultats s'appliquent à plusieurs modèles d'arbres aléatoires
  4. Méthode élémentaire: La preuve est relativement concise et évite les outils complexes

Insuffisances

  1. Borne de queue: La décroissance s2/13s^{-2/13} est relativement lente et peut être insuffisante pour les applications pratiques
  2. Constante: La constante 230 est assez grande, limitant la signification pratique
  3. Technicité: Certaines étapes de preuve sont très techniques et manquent d'explication intuitive

Impact

  1. Contribution théorique: Fournit un résultat important pour la théorie géométrique des arbres aléatoires
  2. Valeur méthodologique: Les techniques de décomposition spinale et de mélange pourraient avoir des applications plus larges
  3. Problèmes ouverts: Les problèmes proposés indiquent les directions de recherche futures

Domaines d'application

  1. Recherche théorique: Théorie des arbres aléatoires et des graphes aléatoires
  2. Analyse d'algorithmes: Analyse de la complexité des algorithmes sur arbres
  3. Physique statistique: Processus de branchement, théorie de la percolation

Références bibliographiques

Les références clés incluent:

  • Addario-Berry (2019): Pose le problème original
  • Kortchemski (2014, 2015): Fournit des exemples d'optimalité et des bases techniques
  • Aldous (1993): Théorie des arbres aléatoires continus
  • Devroye-Janson-Addario-Berry (2013): Travaux pionniers sur les bornes non-asymptotiques

Cet article est un travail théorique important à l'intersection de la théorie des probabilités et des mathématiques combinatoires. Par des techniques probabilistes ingénieuses, il résout un problème fondamental et difficile, apportant une contribution substantielle à la théorie des arbres aléatoires.