Dyck Words, Pattern Avoidance, and Automatic Sequences
Mol, Rampersad, Shallit
We study various aspects of Dyck words appearing in binary sequences, where $0$ is treated as a left parenthesis and $1$ as a right parenthesis. We show that binary words that are $7/3$-power-free have bounded nesting level, but this no longer holds for larger repetition exponents. We give an explicit characterization of the factors of the Thue-Morse word that are Dyck, and show how to count them. We also prove tight upper and lower bounds on $f(n)$, the number of Dyck factors of Thue-Morse of length $2n$.
academic
Mots de Dyck, Évitement de Motifs et Séquences Automatiques
Cet article étudie diverses propriétés des mots de Dyck dans les séquences binaires, où 0 est considéré comme une parenthèse ouvrante et 1 comme une parenthèse fermante. L'étude montre que les mots binaires sans puissance 7/3 possèdent une profondeur d'imbrication bornée, mais cette propriété ne subsiste pas pour des exposants de répétition plus grands. L'article fournit une caractérisation explicite des facteurs de Dyck dans le mot de Thue-Morse et démontre comment calculer leur nombre. De plus, il établit des bornes supérieures et inférieures strictes pour le nombre f(n) de facteurs de Dyck de Thue-Morse de longueur 2n.
La question centrale de cette recherche consiste à comprendre la structure et les propriétés des facteurs de mots de Dyck dans les mots binaires infinis. Les mots de Dyck constituent un concept fondamental de la théorie des langages formels, représentant des chaînes de parenthèses équilibrées, avec des applications importantes en informatique et en mathématiques.
Signification théorique: Le langage de Dyck est un exemple paradigmatique de langage hors-contexte. L'étude de sa distribution dans les séquences automatiques contribue à la compréhension des liens profonds entre la théorie des langages formels et la théorie des automates.
Valeur en combinatoire: L'évitement de motifs et l'évitement de puissances constituent des directions de recherche centrales en combinatoire des mots. Cet article combine ces concepts avec les mots de Dyck.
Applications informatiques: Les séquences automatiques ont des applications étendues en algorithmique et en théorie de la complexité computationnelle. La compréhension des propriétés des facteurs de Dyck possède une signification pratique.
Relation entre évitement de puissances et profondeur d'imbrication: Démonstration que les mots de Dyck sans puissance 7/3 ont une profondeur d'imbrication au plus 3, mais qu'il existe des mots de Dyck sans puissance 7/3⁺ avec une profondeur d'imbrication arbitrairement grande.
Caractérisation des facteurs de Dyck du mot de Thue-Morse: Fourniture d'une caractérisation complète de tous les facteurs de Dyck dans la séquence de Thue-Morse : forme h(x), où x est un facteur d'une certaine séquence ternaire s.
Théorie générale des séquences automatiques: Établissement d'un cadre théorique de décidabilité pour les facteurs de Dyck des séquences automatiques synchrones et à exécution.
Résultats de comptage exacts: Démonstration des bornes strictes supérieures et inférieures pour le nombre d(n) de facteurs de Dyck de longueur 2n dans la séquence de Thue-Morse : d(n) ≤ n et d(n) ≥ n/2.
Soit un mot binaire w = w1..n. Si, en considérant 0 comme une parenthèse ouvrante et 1 comme une parenthèse fermante, w représente une chaîne de parenthèses équilibrée, alors w est appelé mot de Dyck. Formellement, w est un mot de Dyck si et seulement si :
B(w) = |w|₀ - |w|₁ = 0 (condition d'équilibre)
Pour tous les préfixes w', B(w') ≥ 0 (condition de non-négativité)
La profondeur d'imbrication N(w) est définie comme la valeur maximale de B(w') parmi tous les préfixes.
Utilisation de la preuve par induction et construction :
Théorème 2.1: Par analyse de la structure des mots de Dyck sans puissance 7/3, démonstration que leur profondeur d'imbrication ≤ 3.
Théorème 2.9: Construction de morphismes spéciaux f et g tels que f(gᵗ(2)) produit des mots de Dyck sans puissance 7/3⁺ avec une profondeur d'imbrication arbitrairement grande.
Utilisation du vérificateur de théorèmes Walnut pour la vérification computationnelle :
morphism f "0->00100110100110010110010011001011001101
1->00101100110100110110011010010110011011
2->00101101001101001011001101001011010011"
morphism g "0->022012 1->022112 2->202101"
Technique de Construction de Morphismes: Conception de morphismes 6-uniformes spéciaux g et morphismes 38-uniformes f, réalisant un contrôle précis de la profondeur d'imbrication.
Théorie des Séquences Synchrones: Extension des concepts de synchronie et d'exécution à l'analyse du langage de Dyck, établissant un cadre de décidabilité.
Minimisation de la Représentation Linéaire: Utilisation de l'algorithme de Schützenberger pour réduire la représentation linéaire du comptage des facteurs de Dyck de Thue-Morse de rang 29 à rang 7.
Vérification à petite échelle: Calcul direct et vérification pour n < 29.
Preuve par induction: Utilisation de l'induction mathématique pour prouver les résultats généraux.
Assistance informatique: Utilisation de Walnut pour la vérification computationnelle à grande échelle (par exemple, 130 Go de mémoire, 20321 secondes de temps CPU).
Cette recherche s'appuie sur la théorie des langages hors-contexte de Chomsky et Schützenberger, en particulier la théorie algébrique du langage de Dyck.
Phénomène d'indice critique: 7/3 est l'indice critique pour la bornitude de la profondeur d'imbrication des mots de Dyck, reflétant le lien profond entre l'évitement de puissances et la complexité structurelle.
Universalité des séquences automatiques: Les propriétés de synchronie et d'exécution fournissent un cadre unifié pour l'étude des facteurs de Dyck dans les séquences automatiques.
Théorie de comptage exact: Le comptage des facteurs de Dyck de Thue-Morse révèle la structure riche des séquences k-régulières.
Profondeur théorique: Combinaison organique de l'évitement de puissances, des séquences automatiques et de la théorie des langages formels, démontrant une profonde maîtrise théorique.
Innovation méthodologique: Application ingénieuse des techniques de construction de morphismes et de théorie de la représentation linéaire, en particulier le contrôle précis de la profondeur d'imbrication.
Rigueur computationnelle: Utilisation extensive de la vérification assistée par ordinateur, renforçant la fiabilité des résultats.
Complétude des résultats: Fourniture d'un tableau théorique complet allant de l'existence au comptage.
Interdisciplinarité: Promotion du développement interdisciplinaire de la combinatoire, de la théorie des langages formels et de la théorie des automates.
Contribution méthodologique: Fourniture d'un nouveau cadre analytique pour l'étude des motifs structurels dans les séquences automatiques.
Outils informatiques: Démonstration du potentiel puissant des outils de preuve de théorèmes modernes dans les problèmes combinatoires.
Cet article cite des références importantes de la théorie des langages formels, de la combinatoire et de la théorie des automates, notamment :
Théorie des langages hors-contexte de Chomsky et Schützenberger
Travail fondateur de Thue sur les mots sans chevauchement
Théorie des séquences k-régulières d'Allouche et Shallit
Séries rationnelles non-commutatives de Berstel et Reutenauer
Littérature connexe sur l'outil informatique Walnut
Évaluation Générale: Cet article est un travail d'excellence tant en profondeur théorique qu'en innovation technique, combinant avec succès les concepts et méthodes de plusieurs branches des mathématiques, fournissant une contribution importante à la compréhension des motifs structurels dans les séquences automatiques. Bien qu'il présente certaines limitations en termes de complexité computationnelle et de généralisation, sa valeur théorique et sa signification méthodologique sont considérables.