We study various aspects of Dyck words appearing in binary sequences, where $0$ is treated as a left parenthesis and $1$ as a right parenthesis. We show that binary words that are $7/3$-power-free have bounded nesting level, but this no longer holds for larger repetition exponents. We give an explicit characterization of the factors of the Thue-Morse word that are Dyck, and show how to count them. We also prove tight upper and lower bounds on $f(n)$, the number of Dyck factors of Thue-Morse of length $2n$.
Dyck Words, Pattern Avoidance, and Automatic Sequences 论文ID : 2301.06145标题 : Dyck Words, Pattern Avoidance, and Automatic Sequences作者 : Lucas Mol (Thompson Rivers University), Narad Rampersad (University of Winnipeg), Jeffrey Shallit (University of Waterloo)分类 : cs.DM (Discrete Mathematics), cs.FL (Formal Languages), math.CO (Combinatorics)发表期刊 : Communications in Mathematics 33 (2025), no. 2, Paper no. 5论文链接 : https://arxiv.org/abs/2301.06145 本文研究二进制序列中Dyck词的各种性质,其中0被视为左括号,1被视为右括号。研究表明,7/3-无幂二进制词具有有界的嵌套层次,但对于更大的重复指数,这一性质不再成立。论文给出了Thue-Morse词中Dyck因子的显式刻画,并展示了如何计算它们的数量。此外,还证明了长度为2n的Thue-Morse Dyck因子数量f(n)的紧上界和下界。
本研究探讨的核心问题是理解无限二进制词中Dyck词因子的结构和性质。Dyck词是形式语言理论中的基本概念,代表平衡括号串,在计算机科学和数学中具有重要应用。
理论意义 : Dyck语言是上下文无关语言的典型例子,研究其在自动序列中的分布有助于理解形式语言与自动机理论的深层联系组合数学价值 : 模式避免和幂避免是组合词汇学的核心研究方向,本研究将这些概念与Dyck词结合计算应用 : 自动序列在算法和计算复杂性理论中有广泛应用,理解其Dyck因子的性质具有实际意义缺乏对特定自动序列中Dyck因子的系统性刻画 幂避免与嵌套层次关系的定量分析不足 自动序列Dyck因子计数的有效算法缺失 幂避免与嵌套层次的关系 : 证明了7/3-无幂Dyck词的嵌套层次至多为3,但存在任意大嵌套层次的7/3+-无幂Dyck词Thue-Morse词的Dyck因子刻画 : 给出了Thue-Morse序列中所有Dyck因子的完整刻画:h(x)形式,其中x是某个三元序列s的因子自动序列的一般理论 : 建立了运行和同步自动序列Dyck因子的可判定性理论框架精确的计数结果 : 证明了Thue-Morse序列中长度2n的Dyck因子数量d(n)的紧上下界:d(n) ≤ n且d(n) ≥ n/2给定二进制词w = w1..n ,若将0视为左括号、1视为右括号时w表示平衡括号串,则称w为Dyck词。形式化地,w是Dyck词当且仅当:
B(w) = |w|₀ - |w|₁ = 0(平衡条件) 对所有前缀w',B(w') ≥ 0(非负性条件) 嵌套层次N(w)定义为所有前缀中B(w')的最大值。
使用归纳法和构造性证明:
定理2.1 : 通过分析7/3-无幂Dyck词的结构,证明其嵌套层次≤3定理2.9 : 构造特殊态射f和g,使得f(gᵗ(2))产生任意大嵌套层次的7/3⁺-无幂Dyck词利用Walnut定理证明器进行计算验证:
morphism f "0->00100110100110010110010011001011001101
1->00101100110100110110011010010110011011
2->00101101001101001011001101001011010011"
morphism g "0->022012 1->022112 2->202101"
对于运行和同步的k-自动序列,构造一阶逻辑公式:
平衡函数:Bal(i,n,x) ≡ ∃y,z N₀(i,n,y) ∧ N₁(i,n,z) ∧ ((y<z ∧ x=0) | (y≥z ∧ y=x+z)) Dyck判定:Dyck(i,n) ≡ 平衡性 ∧ 非负性条件 态射构造技术 : 设计了特殊的6-一致态射g和38-一致态射f,实现了嵌套层次的精确控制同步序列理论 : 将运行和同步概念扩展到Dyck语言分析,建立了可判定性框架线性表示最小化 : 使用Schützenberger算法将Thue-Morse Dyck因子计数的线性表示从秩29降至秩7Walnut定理证明器 : 用于自动序列的一阶逻辑验证线性代数系统 : 进行矩阵运算和线性表示计算符号计算 : 验证递推关系和渐近行为小规模验证 : 对n < 29的情况进行直接计算验证归纳证明 : 使用数学归纳法证明一般性结果计算机辅助 : 利用Walnut进行大规模计算验证(如130GB内存,20321秒CPU时间)上界 : 7/3-无幂Dyck词嵌套层次≤3下界 : 存在任意大嵌套层次的7/3⁺-无幂Dyck词精确的递推关系:
d(2n) = 2d(n) d(4n+3) = 2d(n) + d(2n+1) + q(n) d(8n+1) = 2d(2n+1) + d(4n+1) - q(n) d(8n+5) = 2d(n) + d(2n+1) + 2d(2n+2) 其中q(n)是2-自动序列,1 ≤ q(n) ≤ 2。
上界 : d(n) ≤ n,当n = 3·2ⁱ时等号成立下界 : d(n) ≥ n/2,当n = 2ⁱ时等号成立奇数情况 : n为奇数时,d(n) ≥ (n+3)/2∑₀≤ᵢ<₂ₙ d(i) = 19·4ⁿ/48 - 2ⁿ/4 + 5/3,平均值为(19/24)n
前21项的d(n)值:
n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 d(n) 1 1 2 3 2 4 6 6 4 8 8 8 12 9 12 13 8 14 16 14 16
Fibonacci序列 : 仅有Dyck因子01和0101周期倍增序列 : 仅有Dyck因子01, 0101, 010101Rudin-Shapiro序列 : 存在任意大嵌套层次的Dyck因子本研究建立在Chomsky和Schützenberger的上下文无关语言理论基础上,特别是Dyck语言的代数理论。
幂避免理论 : 继承了Thue关于无重叠词的开创性工作自动序列 : 基于Cobham的k-自动序列理论和最近的同步序列概念Walnut系统 : 利用Mousavi和Shallit开发的自动定理证明工具线性表示 : 应用Berstel和Reutenauer的非交换有理级数理论临界指数现象 : 7/3是Dyck词嵌套层次有界性的临界指数,体现了幂避免与结构复杂性的深刻联系自动序列的普遍性 : 运行和同步性质为研究自动序列中的Dyck因子提供了统一框架精确计数理论 : Thue-Morse序列的Dyck因子计数展现了k-正则序列的丰富结构计算复杂性 : 大规模Walnut计算需要巨大资源(130GB内存)特殊序列依赖 : 某些结果(如运行和同步性)依赖于序列的特殊性质一般化程度 : 部分结果仅适用于特定的自动序列类别更高维推广 : 研究高维Dyck语言在自动序列中的分布其他模式 : 扩展到其他上下文无关模式的避免问题算法优化 : 开发更高效的Dyck因子计数算法理论深度 : 将幂避免、自动序列和形式语言理论有机结合,展现了深厚的理论功底方法创新 : 态射构造和线性表示技术的巧妙应用,特别是嵌套层次的精确控制计算严谨 : 大量使用计算机辅助验证,增强了结果的可靠性结果完整 : 提供了从存在性到计数的完整理论图景计算资源 : 某些证明依赖于大规模计算,可能限制了结果的可验证性推广性 : 部分技术方法可能难以推广到更一般的序列类别应用导向 : 理论结果的实际应用价值需要进一步探索学科交叉 : 促进了组合数学、形式语言理论和自动机理论的交叉发展方法论贡献 : 为研究自动序列中的结构模式提供了新的分析框架计算工具 : 展示了现代定理证明工具在组合问题中的强大应用潜力理论研究 : 适用于组合词汇学和形式语言理论的深入研究算法设计 : 为设计处理结构化序列的算法提供理论基础教学应用 : 可作为展示现代数学计算方法的优秀案例本文引用了形式语言理论、组合数学和自动机理论的重要文献,包括:
Chomsky & Schützenberger的上下文无关语言理论 Thue的无重叠词开创性工作 Allouche & Shallit的k-正则序列理论 Berstel & Reutenauer的非交换有理级数 现代计算工具Walnut的相关文献 总评 : 这是一篇在理论深度和技术创新方面都表现优秀的论文,成功地将多个数学分支的概念和方法有机结合,为理解自动序列中的结构模式提供了重要贡献。虽然在计算复杂性和推广性方面存在一定局限,但其理论价值和方法论意义显著。