Dyck Words, Pattern Avoidance, and Automatic Sequences
Mol, Rampersad, Shallit
We study various aspects of Dyck words appearing in binary sequences, where $0$ is treated as a left parenthesis and $1$ as a right parenthesis. We show that binary words that are $7/3$-power-free have bounded nesting level, but this no longer holds for larger repetition exponents. We give an explicit characterization of the factors of the Thue-Morse word that are Dyck, and show how to count them. We also prove tight upper and lower bounds on $f(n)$, the number of Dyck factors of Thue-Morse of length $2n$.
academic
Palabras de Dyck, Evitación de Patrones, y Secuencias Automáticas
Este artículo investiga diversas propiedades de palabras de Dyck en secuencias binarias, donde 0 se interpreta como paréntesis izquierdo y 1 como paréntesis derecho. El estudio demuestra que las palabras binarias 7/3-libres de potencias poseen niveles de anidamiento acotados, aunque esta propiedad no se mantiene para exponentes de repetición mayores. El artículo proporciona una caracterización explícita de los factores de Dyck en la palabra de Thue-Morse y demuestra cómo calcular su cantidad. Además, se establecen cotas superiores e inferiores ajustadas para el número de factores de Dyck de Thue-Morse de longitud 2n, denotado como f(n).
La investigación central explora la estructura y propiedades de los factores de palabras de Dyck en palabras binarias infinitas. Las palabras de Dyck constituyen un concepto fundamental en la teoría de lenguajes formales, representando cadenas de paréntesis balanceados, con aplicaciones importantes en informática y matemáticas.
Significado Teórico: El lenguaje de Dyck es un ejemplo paradigmático de lenguajes libres de contexto. Investigar su distribución en secuencias automáticas contribuye a comprender las conexiones profundas entre la teoría de lenguajes formales y la teoría de autómatas.
Valor en Combinatoria: La evitación de patrones y la evitación de potencias son direcciones de investigación central en la combinatoria de palabras. Este trabajo combina estos conceptos con palabras de Dyck.
Aplicaciones Computacionales: Las secuencias automáticas tienen aplicaciones generalizadas en algoritmos y teoría de complejidad computacional. Comprender las propiedades de sus factores de Dyck tiene significado práctico.
Relación entre Evitación de Potencias y Niveles de Anidamiento: Se demuestra que las palabras de Dyck 7/3-libres de potencias tienen nivel de anidamiento como máximo 3, aunque existen palabras de Dyck 7/3⁺-libres de potencias con niveles de anidamiento arbitrariamente grandes.
Caracterización de Factores de Dyck en la Palabra de Thue-Morse: Se proporciona una caracterización completa de todos los factores de Dyck en la secuencia de Thue-Morse: de la forma h(x), donde x es un factor de cierta secuencia ternaria s.
Teoría General de Secuencias Automáticas: Se establece un marco teórico de decidibilidad para factores de Dyck en secuencias automáticas síncronas y de suma de ejecución.
Resultados de Conteo Exacto: Se demuestran cotas superiores e inferiores ajustadas para el número d(n) de factores de Dyck de longitud 2n en la secuencia de Thue-Morse: d(n) ≤ n y d(n) ≥ n/2.
Dada una palabra binaria w = w1..n, se denomina palabra de Dyck si, interpretando 0 como paréntesis izquierdo y 1 como paréntesis derecho, w representa una cadena de paréntesis balanceados. Formalmente, w es una palabra de Dyck si y solo si:
B(w) = |w|₀ - |w|₁ = 0 (condición de balance)
Para todos los prefijos w', B(w') ≥ 0 (condición de no negatividad)
El nivel de anidamiento N(w) se define como el valor máximo de B(w') entre todos los prefijos.
Teorema 2.1: Mediante análisis de la estructura de palabras de Dyck 7/3-libres de potencias, se demuestra que su nivel de anidamiento ≤ 3.
Teorema 2.9: Se construyen morfismos especiales f y g tales que f(gᵗ(2)) genera palabras de Dyck 7/3⁺-libres de potencias con niveles de anidamiento arbitrariamente grandes.
Utilización del demostrador de teoremas Walnut para verificación computacional:
morphism f "0->00100110100110010110010011001011001101
1->00101100110100110110011010010110011011
2->00101101001101001011001101001011010011"
morphism g "0->022012 1->022112 2->202101"
Técnica de Construcción de Morfismos: Se diseñan morfismos especiales 6-uniformes g y 38-uniformes f, realizando control preciso de niveles de anidamiento.
Teoría de Secuencias Síncronas: Se extienden los conceptos de suma de ejecución y sincronía al análisis del lenguaje de Dyck, estableciendo un marco de decidibilidad.
Minimización de Representación Lineal: Se utiliza el algoritmo de Schützenberger para reducir la representación lineal del conteo de factores de Dyck de Thue-Morse de rango 29 a rango 7.
Verificación a Pequeña Escala: Cálculo directo para casos n < 29.
Prueba por Inducción: Utilización de inducción matemática para demostrar resultados generales.
Asistencia Computacional: Utilización de Walnut para verificación computacional a gran escala (como 130 GB de memoria, 20321 segundos de tiempo de CPU).
Esta investigación se construye sobre la teoría de lenguajes libres de contexto de Chomsky y Schützenberger, particularmente la teoría algebraica del lenguaje de Dyck.
Fenómeno de Exponente Crítico: 7/3 es el exponente crítico para la acotación del nivel de anidamiento de palabras de Dyck, reflejando la conexión profunda entre evitación de potencias y complejidad estructural.
Universalidad de Secuencias Automáticas: Las propiedades de sincronía y suma de ejecución proporcionan un marco unificado para investigar factores de Dyck en secuencias automáticas.
Teoría de Conteo Exacto: El conteo de factores de Dyck en la secuencia de Thue-Morse revela la estructura rica de secuencias k-regulares.
Profundidad Teórica: Combina orgánicamente la evitación de potencias, secuencias automáticas y teoría de lenguajes formales, demostrando profundos fundamentos teóricos.
Innovación Metodológica: Aplicación ingeniosa de técnicas de construcción de morfismos y teoría de representación lineal, particularmente en el control preciso de niveles de anidamiento.
Rigor Computacional: Uso extensivo de verificación asistida por computadora, aumentando la confiabilidad de los resultados.
Completitud de Resultados: Proporciona un panorama teórico completo desde existencia hasta conteo.
Este artículo cita literatura importante en teoría de lenguajes formales, matemática combinatoria y teoría de autómatas, incluyendo:
Teoría de lenguajes libres de contexto de Chomsky y Schützenberger
Trabajo pionero de Thue sobre palabras sin superposición
Teoría de secuencias k-regulares de Allouche y Shallit
Series racionales no conmutativas de Berstel y Reutenauer
Literatura relacionada con la herramienta computacional moderna Walnut
Evaluación General: Este es un artículo que demuestra excelencia tanto en profundidad teórica como en innovación técnica, combinando exitosamente conceptos y métodos de múltiples ramas matemáticas para proporcionar contribuciones importantes a la comprensión de patrones estructurales en secuencias automáticas. Aunque presenta ciertas limitaciones en complejidad computacional y generalización, su valor teórico y significado metodológico son notables.