2025-11-15T04:52:11.684179

Dyck Words, Pattern Avoidance, and Automatic Sequences

Mol, Rampersad, Shallit
We study various aspects of Dyck words appearing in binary sequences, where $0$ is treated as a left parenthesis and $1$ as a right parenthesis. We show that binary words that are $7/3$-power-free have bounded nesting level, but this no longer holds for larger repetition exponents. We give an explicit characterization of the factors of the Thue-Morse word that are Dyck, and show how to count them. We also prove tight upper and lower bounds on $f(n)$, the number of Dyck factors of Thue-Morse of length $2n$.
academic

Dyck Words, Pattern Avoidance, and Automatic Sequences

基本情報

  • 論文ID: 2301.06145
  • タイトル: Dyck Words, Pattern Avoidance, and Automatic Sequences
  • 著者: Lucas Mol (Thompson Rivers University), Narad Rampersad (University of Winnipeg), Jeffrey Shallit (University of Waterloo)
  • 分類: cs.DM (離散数学), cs.FL (形式言語), math.CO (組合論)
  • 掲載誌: Communications in Mathematics 33 (2025), no. 2, Paper no. 5
  • 論文リンク: https://arxiv.org/abs/2301.06145

要旨

本論文は、0を左括弧、1を右括弧と見なす二進列におけるDyck語の様々な性質を研究する。研究により、7/3-無冪二進語は有界なネスト深度を持つが、より大きな繰り返し指数に対してはこの性質が成立しないことが示される。論文はThue-Morse列におけるDyck因子の明示的な特性化を与え、それらの個数を計算する方法を示す。さらに、長さ2nのThue-Morse Dyck因子の個数f(n)に対する厳密な上界と下界が証明される。

研究背景と動機

問題定義

本研究が探究する中心的な問題は、無限二進列におけるDyck語因子の構造と性質の理解である。Dyck語は形式言語理論における基本的な概念であり、平衡括弧列を表現し、計算機科学と数学において重要な応用を有する。

研究の重要性

  1. 理論的意義: Dyck言語は文脈自由言語の典型例であり、自動列における分布を研究することは形式言語理論と自動機理論の深い関連性の理解に寄与する
  2. 組合数学的価値: パターン回避と無冪性は組合語学の中核的研究方向であり、本研究はこれらの概念をDyck語と結合させる
  3. 計算応用: 自動列はアルゴリズムと計算複雑性理論に広く応用され、そのDyck因子の性質の理解は実用的意義を有する

既存研究の限界

  • 特定の自動列におけるDyck因子の体系的な特性化の欠如
  • 無冪性とネスト深度の関係に関する定量的分析の不足
  • 自動列のDyck因子計数に対する有効なアルゴリズムの欠落

核心的貢献

  1. 無冪性とネスト深度の関係: 7/3-無冪Dyck語のネスト深度は最大3であるが、任意に大きなネスト深度を持つ7/3⁺-無冪Dyck語が存在することを証明
  2. Thue-Morse列のDyck因子の特性化: Thue-Morse列におけるすべてのDyck因子の完全な特性化を与える:h(x)の形式、ここでxは特定の三進列sの因子
  3. 自動列の一般理論: 実行和同期自動列のDyck因子に関する判定可能性理論の枠組みを確立
  4. 精密な計数結果: Thue-Morse列における長さ2nのDyck因子の個数d(n)に対する厳密な上下界を証明:d(n) ≤ nおよびd(n) ≥ n/2

方法の詳細

タスク定義

二進語w = w1..nが与えられたとき、0を左括弧、1を右括弧と見なすときwが平衡括弧列を表現する場合、wをDyck語と呼ぶ。形式的には、wがDyck語であることと以下は同値である:

  • B(w) = |w|₀ - |w|₁ = 0(平衡条件)
  • すべての前置詞w'に対してB(w') ≥ 0(非負性条件)

ネスト深度N(w)は、すべての前置詞におけるB(w')の最大値として定義される。

中核的方法

1. 無冪性分析方法

帰納法と構成的証明を使用:

  • 定理2.1: 7/3-無冪Dyck語の構造を分析することにより、そのネスト深度≤3を証明
  • 定理2.9: 特殊な準同型f、gを構成し、f(gᵗ(2))が任意に大きなネスト深度を持つ7/3⁺-無冪Dyck語を生成

2. 自動機理論的方法

Walnut定理証明器を利用した計算検証:

morphism f "0->00100110100110010110010011001011001101
           1->00101100110100110110011010010110011011
           2->00101101001101001011001101001011010011"
morphism g "0->022012 1->022112 2->202101"

3. 線形表現理論

実行和同期k-自動列に対して、一階述語論理式を構成:

  • 平衡関数:Bal(i,n,x) ≡ ∃y,z N₀(i,n,y) ∧ N₁(i,n,z) ∧ ((y<z ∧ x=0) | (y≥z ∧ y=x+z))
  • Dyck判定:Dyck(i,n) ≡ 平衡性 ∧ 非負性条件

技術的革新点

  1. 準同型構成技術: 特殊な6-一様準同型gと38-一様準同型fを設計し、ネスト深度の精密な制御を実現
  2. 同期列理論: 実行和同期概念をDyck言語分析に拡張し、判定可能性の枠組みを確立
  3. 線形表現の最小化: Schützenbergerアルゴリズムを使用してThue-Morse Dyck因子計数の線形表現のランクを29から7に削減

実験設定

計算ツール

  • Walnut定理証明器: 自動列の一階述語論理検証に使用
  • 線形代数システム: 行列演算と線形表現計算を実行
  • 記号計算: 漸化式と漸近挙動の検証

検証方法

  1. 小規模検証: n < 29の場合について直接計算検証を実施
  2. 帰納的証明: 数学的帰納法を用いて一般的結果を証明
  3. 計算機支援: Walnutを利用した大規模計算検証(例:130GBメモリ、20321秒CPU時間)

実験結果

主要な定量的結果

1. ネスト深度の界限

  • 上界: 7/3-無冪Dyck語のネスト深度≤3
  • 下界: 任意に大きなネスト深度を持つ7/3⁺-無冪Dyck語が存在

2. Thue-Morse Dyck因子計数

精密な漸化式:

  • d(2n) = 2d(n)
  • d(4n+3) = 2d(n) + d(2n+1) + q(n)
  • d(8n+1) = 2d(2n+1) + d(4n+1) - q(n)
  • d(8n+5) = 2d(n) + d(2n+1) + 2d(2n+2)

ここでq(n)は2-自動列であり、1 ≤ q(n) ≤ 2。

3. 厳密な界限定理

  • 上界: d(n) ≤ n、n = 3·2ⁱのとき等号成立
  • 下界: d(n) ≥ n/2、n = 2ⁱのとき等号成立
  • 奇数の場合: nが奇数のとき、d(n) ≥ (n+3)/2

4. 漸近平均値

∑₀≤ᵢ<₂ₙ d(i) = 19·4ⁿ/48 - 2ⁿ/4 + 5/3、平均値は(19/24)n

具体的な数値結果

最初の21項のd(n)値:

n01234567891011121314151617181920
d(n)1123246648881291213814161416

その他の列に関する結果

  • Fibonacci列: Dyck因子は01と0101のみ
  • 周期倍増列: Dyck因子は01、0101、010101のみ
  • Rudin-Shapiro列: 任意に大きなネスト深度を持つDyck因子が存在

関連研究

形式言語理論

本研究はChomskyとSchützenbergerの文脈自由言語理論、特にDyck言語の代数理論に基づいている。

組合語学

  • 無冪理論: Thueの重複のない語に関する先駆的研究を継承
  • 自動列: Cobhamのk-自動列理論と最近の同期列概念に基づく

計算方法

  • Walnutシステム: MouseaviとShallit開発の自動定理証明ツールを利用
  • 線形表現: Bertstelとreutenauer非可換有理級数理論を応用

結論と考察

主要な結論

  1. 臨界指数現象: 7/3はDyck語のネスト深度有界性の臨界指数であり、無冪性と構造複雑性の深い関連性を体現している
  2. 自動列の普遍性: 実行和同期性は自動列におけるDyck因子研究の統一的枠組みを提供する
  3. 精密計数理論: Thue-Morse列のDyck因子計数はk-正則列の豊かな構造を示す

限界

  1. 計算複雑性: 大規模Walnut計算は巨大なリソース(130GBメモリ)を必要とする
  2. 特殊列への依存: 一部の結果(実行和同期性など)は列の特殊性に依存する
  3. 一般化の程度: 部分的な結果は特定の自動列クラスにのみ適用可能

今後の方向

  1. 高次元への推広: 高次元Dyck言語の自動列における分布研究
  2. その他のパターン: 他の文脈自由パターンの回避問題への拡張
  3. アルゴリズム最適化: より効率的なDyck因子計数アルゴリズムの開発

深い評価

利点

  1. 理論的深さ: 無冪性、自動列、形式言語理論を有機的に結合し、深い理論的基礎を示す
  2. 方法の革新性: 準同型構成と線形表現技術の巧妙な応用、特にネスト深度の精密な制御
  3. 計算の厳密性: 計算機支援検証の大量使用により結果の信頼性を強化
  4. 結果の完全性: 存在性から計数まで完全な理論的図景を提供

不足点

  1. 計算リソース: 一部の証明は大規模計算に依存し、結果の検証可能性を制限する可能性
  2. 推広性: 部分的な技術方法はより一般的な列クラスへの推広が困難な可能性
  3. 応用指向性: 理論結果の実用的応用価値はさらなる探究が必要

影響力

  1. 学際的交差: 組合数学、形式言語理論、自動機理論の交差的発展を促進
  2. 方法論的貢献: 自動列における構造パターン研究の新しい分析枠組みを提供
  3. 計算ツール: 現代的定理証明ツールの組合問題への強力な応用可能性を示す

適用場面

  1. 理論研究: 組合語学と形式言語理論の深い研究に適用可能
  2. アルゴリズム設計: 構造化列を処理するアルゴリズム設計の理論的基礎を提供
  3. 教育応用: 現代的数学計算方法を示す優秀な事例として活用可能

参考文献

本論文は形式言語理論、組合数学、自動機理論の重要な文献を引用しており、以下を含む:

  • Chomsky & Schützenbergerの文脈自由言語理論
  • Thueの重複のない語に関する先駆的研究
  • Allouche & Shallit のk-正則列理論
  • Berstel & Reutenauer の非可換有理級数
  • 現代計算ツールWalnutの関連文献

総合評価: これは理論的深さと技術的革新の両面で優れた論文であり、複数の数学分野の概念と方法を有機的に結合し、自動列における構造パターンの理解に重要な貢献をしている。計算複雑性と推広性の面で一定の限界があるものの、その理論的価値と方法論的意義は顕著である。