2025-11-15T04:52:11.684179

Dyck Words, Pattern Avoidance, and Automatic Sequences

Mol, Rampersad, Shallit
We study various aspects of Dyck words appearing in binary sequences, where $0$ is treated as a left parenthesis and $1$ as a right parenthesis. We show that binary words that are $7/3$-power-free have bounded nesting level, but this no longer holds for larger repetition exponents. We give an explicit characterization of the factors of the Thue-Morse word that are Dyck, and show how to count them. We also prove tight upper and lower bounds on $f(n)$, the number of Dyck factors of Thue-Morse of length $2n$.
academic

Palabras de Dyck, Evitación de Patrones, y Secuencias Automáticas

Información Básica

  • ID del Artículo: 2301.06145
  • Título: Dyck Words, Pattern Avoidance, and Automatic Sequences
  • Autores: Lucas Mol (Thompson Rivers University), Narad Rampersad (University of Winnipeg), Jeffrey Shallit (University of Waterloo)
  • Clasificación: cs.DM (Matemática Discreta), cs.FL (Lenguajes Formales), math.CO (Combinatoria)
  • Revista de Publicación: Communications in Mathematics 33 (2025), no. 2, Paper no. 5
  • Enlace del Artículo: https://arxiv.org/abs/2301.06145

Resumen

Este artículo investiga diversas propiedades de palabras de Dyck en secuencias binarias, donde 0 se interpreta como paréntesis izquierdo y 1 como paréntesis derecho. El estudio demuestra que las palabras binarias 7/3-libres de potencias poseen niveles de anidamiento acotados, aunque esta propiedad no se mantiene para exponentes de repetición mayores. El artículo proporciona una caracterización explícita de los factores de Dyck en la palabra de Thue-Morse y demuestra cómo calcular su cantidad. Además, se establecen cotas superiores e inferiores ajustadas para el número de factores de Dyck de Thue-Morse de longitud 2n, denotado como f(n).

Contexto de Investigación y Motivación

Definición del Problema

La investigación central explora la estructura y propiedades de los factores de palabras de Dyck en palabras binarias infinitas. Las palabras de Dyck constituyen un concepto fundamental en la teoría de lenguajes formales, representando cadenas de paréntesis balanceados, con aplicaciones importantes en informática y matemáticas.

Importancia de la Investigación

  1. Significado Teórico: El lenguaje de Dyck es un ejemplo paradigmático de lenguajes libres de contexto. Investigar su distribución en secuencias automáticas contribuye a comprender las conexiones profundas entre la teoría de lenguajes formales y la teoría de autómatas.
  2. Valor en Combinatoria: La evitación de patrones y la evitación de potencias son direcciones de investigación central en la combinatoria de palabras. Este trabajo combina estos conceptos con palabras de Dyck.
  3. Aplicaciones Computacionales: Las secuencias automáticas tienen aplicaciones generalizadas en algoritmos y teoría de complejidad computacional. Comprender las propiedades de sus factores de Dyck tiene significado práctico.

Limitaciones de la Investigación Existente

  • Falta de caracterización sistemática de factores de Dyck en secuencias automáticas específicas
  • Análisis cuantitativo insuficiente de la relación entre evitación de potencias y niveles de anidamiento
  • Ausencia de algoritmos efectivos para contar factores de Dyck en secuencias automáticas

Contribuciones Principales

  1. Relación entre Evitación de Potencias y Niveles de Anidamiento: Se demuestra que las palabras de Dyck 7/3-libres de potencias tienen nivel de anidamiento como máximo 3, aunque existen palabras de Dyck 7/3⁺-libres de potencias con niveles de anidamiento arbitrariamente grandes.
  2. Caracterización de Factores de Dyck en la Palabra de Thue-Morse: Se proporciona una caracterización completa de todos los factores de Dyck en la secuencia de Thue-Morse: de la forma h(x), donde x es un factor de cierta secuencia ternaria s.
  3. Teoría General de Secuencias Automáticas: Se establece un marco teórico de decidibilidad para factores de Dyck en secuencias automáticas síncronas y de suma de ejecución.
  4. Resultados de Conteo Exacto: Se demuestran cotas superiores e inferiores ajustadas para el número d(n) de factores de Dyck de longitud 2n en la secuencia de Thue-Morse: d(n) ≤ n y d(n) ≥ n/2.

Explicación Detallada de Métodos

Definición de Tareas

Dada una palabra binaria w = w1..n, se denomina palabra de Dyck si, interpretando 0 como paréntesis izquierdo y 1 como paréntesis derecho, w representa una cadena de paréntesis balanceados. Formalmente, w es una palabra de Dyck si y solo si:

  • B(w) = |w|₀ - |w|₁ = 0 (condición de balance)
  • Para todos los prefijos w', B(w') ≥ 0 (condición de no negatividad)

El nivel de anidamiento N(w) se define como el valor máximo de B(w') entre todos los prefijos.

Métodos Principales

1. Método de Análisis de Evitación de Potencias

Utilización de inducción y prueba constructiva:

  • Teorema 2.1: Mediante análisis de la estructura de palabras de Dyck 7/3-libres de potencias, se demuestra que su nivel de anidamiento ≤ 3.
  • Teorema 2.9: Se construyen morfismos especiales f y g tales que f(gᵗ(2)) genera palabras de Dyck 7/3⁺-libres de potencias con niveles de anidamiento arbitrariamente grandes.

2. Método de Teoría de Autómatas

Utilización del demostrador de teoremas Walnut para verificación computacional:

morphism f "0->00100110100110010110010011001011001101
           1->00101100110100110110011010010110011011
           2->00101101001101001011001101001011010011"
morphism g "0->022012 1->022112 2->202101"

3. Teoría de Representación Lineal

Para secuencias k-automáticas síncronas y de suma de ejecución, se construyen fórmulas de lógica de primer orden:

  • Función de balance: Bal(i,n,x) ≡ ∃y,z N₀(i,n,y) ∧ N₁(i,n,z) ∧ ((y<z ∧ x=0) | (y≥z ∧ y=x+z))
  • Determinación de Dyck: Dyck(i,n) ≡ condiciones de balance ∧ no negatividad

Puntos de Innovación Técnica

  1. Técnica de Construcción de Morfismos: Se diseñan morfismos especiales 6-uniformes g y 38-uniformes f, realizando control preciso de niveles de anidamiento.
  2. Teoría de Secuencias Síncronas: Se extienden los conceptos de suma de ejecución y sincronía al análisis del lenguaje de Dyck, estableciendo un marco de decidibilidad.
  3. Minimización de Representación Lineal: Se utiliza el algoritmo de Schützenberger para reducir la representación lineal del conteo de factores de Dyck de Thue-Morse de rango 29 a rango 7.

Configuración Experimental

Herramientas Computacionales

  • Demostrador de Teoremas Walnut: Para verificación de lógica de primer orden en secuencias automáticas.
  • Sistema de Álgebra Lineal: Para operaciones matriciales y cálculos de representación lineal.
  • Computación Simbólica: Para verificación de relaciones de recurrencia y comportamiento asintótico.

Métodos de Verificación

  1. Verificación a Pequeña Escala: Cálculo directo para casos n < 29.
  2. Prueba por Inducción: Utilización de inducción matemática para demostrar resultados generales.
  3. Asistencia Computacional: Utilización de Walnut para verificación computacional a gran escala (como 130 GB de memoria, 20321 segundos de tiempo de CPU).

Resultados Experimentales

Resultados Cuantitativos Principales

1. Límites de Niveles de Anidamiento

  • Cota Superior: El nivel de anidamiento de palabras de Dyck 7/3-libres de potencias ≤ 3.
  • Cota Inferior: Existen palabras de Dyck 7/3⁺-libres de potencias con niveles de anidamiento arbitrariamente grandes.

2. Conteo de Factores de Dyck de Thue-Morse

Relaciones de recurrencia exactas:

  • d(2n) = 2d(n)
  • d(4n+3) = 2d(n) + d(2n+1) + q(n)
  • d(8n+1) = 2d(2n+1) + d(4n+1) - q(n)
  • d(8n+5) = 2d(n) + d(2n+1) + 2d(2n+2)

donde q(n) es una secuencia 2-automática con 1 ≤ q(n) ≤ 2.

3. Teorema de Cotas Ajustadas

  • Cota Superior: d(n) ≤ n, con igualdad cuando n = 3·2ⁱ.
  • Cota Inferior: d(n) ≥ n/2, con igualdad cuando n = 2ⁱ.
  • Caso de Números Impares: Cuando n es impar, d(n) ≥ (n+3)/2.

4. Promedio Asintótico

∑₀≤ᵢ<₂ₙ d(i) = 19·4ⁿ/48 - 2ⁿ/4 + 5/3, con promedio (19/24)n.

Resultados Numéricos Específicos

Valores de d(n) para los primeros 21 términos:

n01234567891011121314151617181920
d(n)1123246648881291213814161416

Resultados en Otras Secuencias

  • Secuencia de Fibonacci: Posee únicamente factores de Dyck 01 y 0101.
  • Secuencia de Duplicación de Período: Posee únicamente factores de Dyck 01, 0101, 010101.
  • Secuencia de Rudin-Shapiro: Contiene factores de Dyck con niveles de anidamiento arbitrariamente grandes.

Trabajo Relacionado

Teoría de Lenguajes Formales

Esta investigación se construye sobre la teoría de lenguajes libres de contexto de Chomsky y Schützenberger, particularmente la teoría algebraica del lenguaje de Dyck.

Combinatoria de Palabras

  • Teoría de Evitación de Potencias: Hereda el trabajo pionero de Thue sobre palabras sin superposición.
  • Secuencias Automáticas: Se basa en la teoría de secuencias k-automáticas de Cobham y conceptos recientes de secuencias síncronas.

Métodos Computacionales

  • Sistema Walnut: Utiliza la herramienta de demostración automática de teoremas desarrollada por Mousavi y Shallit.
  • Representación Lineal: Aplica la teoría de series racionales no conmutativas de Berstel y Reutenauer.

Conclusiones y Discusión

Conclusiones Principales

  1. Fenómeno de Exponente Crítico: 7/3 es el exponente crítico para la acotación del nivel de anidamiento de palabras de Dyck, reflejando la conexión profunda entre evitación de potencias y complejidad estructural.
  2. Universalidad de Secuencias Automáticas: Las propiedades de sincronía y suma de ejecución proporcionan un marco unificado para investigar factores de Dyck en secuencias automáticas.
  3. Teoría de Conteo Exacto: El conteo de factores de Dyck en la secuencia de Thue-Morse revela la estructura rica de secuencias k-regulares.

Limitaciones

  1. Complejidad Computacional: Los cálculos a gran escala con Walnut requieren recursos enormes (130 GB de memoria).
  2. Dependencia de Secuencias Especiales: Algunos resultados (como sincronía y suma de ejecución) dependen de propiedades especiales de la secuencia.
  3. Grado de Generalización: Algunos resultados se aplican únicamente a categorías específicas de secuencias automáticas.

Direcciones Futuras

  1. Generalización a Dimensiones Superiores: Investigar la distribución de lenguajes de Dyck de dimensiones superiores en secuencias automáticas.
  2. Otros Patrones: Extender a problemas de evitación de otros patrones libres de contexto.
  3. Optimización de Algoritmos: Desarrollar algoritmos más eficientes para contar factores de Dyck.

Evaluación Profunda

Fortalezas

  1. Profundidad Teórica: Combina orgánicamente la evitación de potencias, secuencias automáticas y teoría de lenguajes formales, demostrando profundos fundamentos teóricos.
  2. Innovación Metodológica: Aplicación ingeniosa de técnicas de construcción de morfismos y teoría de representación lineal, particularmente en el control preciso de niveles de anidamiento.
  3. Rigor Computacional: Uso extensivo de verificación asistida por computadora, aumentando la confiabilidad de los resultados.
  4. Completitud de Resultados: Proporciona un panorama teórico completo desde existencia hasta conteo.

Deficiencias

  1. Recursos Computacionales: Algunas pruebas dependen de cálculos a gran escala, lo que puede limitar la verificabilidad de los resultados.
  2. Generalización: Ciertos métodos técnicos pueden ser difíciles de generalizar a categorías de secuencias más amplias.
  3. Orientación Aplicada: El valor práctico de los resultados teóricos requiere exploración adicional.

Impacto

  1. Interdisciplinariedad: Promueve el desarrollo interdisciplinario de matemática combinatoria, teoría de lenguajes formales y teoría de autómatas.
  2. Contribución Metodológica: Proporciona un nuevo marco analítico para investigar patrones estructurales en secuencias automáticas.
  3. Herramientas Computacionales: Demuestra el potencial poderoso de herramientas modernas de demostración de teoremas en problemas combinatorios.

Escenarios Aplicables

  1. Investigación Teórica: Aplicable a investigación profunda en combinatoria de palabras y teoría de lenguajes formales.
  2. Diseño de Algoritmos: Proporciona fundamentos teóricos para diseñar algoritmos que procesen secuencias estructuradas.
  3. Aplicaciones Educativas: Sirve como caso de excelencia para demostrar métodos computacionales matemáticos modernos.

Referencias Bibliográficas

Este artículo cita literatura importante en teoría de lenguajes formales, matemática combinatoria y teoría de autómatas, incluyendo:

  • Teoría de lenguajes libres de contexto de Chomsky y Schützenberger
  • Trabajo pionero de Thue sobre palabras sin superposición
  • Teoría de secuencias k-regulares de Allouche y Shallit
  • Series racionales no conmutativas de Berstel y Reutenauer
  • Literatura relacionada con la herramienta computacional moderna Walnut

Evaluación General: Este es un artículo que demuestra excelencia tanto en profundidad teórica como en innovación técnica, combinando exitosamente conceptos y métodos de múltiples ramas matemáticas para proporcionar contribuciones importantes a la comprensión de patrones estructurales en secuencias automáticas. Aunque presenta ciertas limitaciones en complejidad computacional y generalización, su valor teórico y significado metodológico son notables.