2025-11-15T04:52:11.684179

Dyck Words, Pattern Avoidance, and Automatic Sequences

Mol, Rampersad, Shallit
We study various aspects of Dyck words appearing in binary sequences, where $0$ is treated as a left parenthesis and $1$ as a right parenthesis. We show that binary words that are $7/3$-power-free have bounded nesting level, but this no longer holds for larger repetition exponents. We give an explicit characterization of the factors of the Thue-Morse word that are Dyck, and show how to count them. We also prove tight upper and lower bounds on $f(n)$, the number of Dyck factors of Thue-Morse of length $2n$.
academic

Dyck 단어, 패턴 회피, 그리고 자동 수열

기본 정보

  • 논문 ID: 2301.06145
  • 제목: Dyck Words, Pattern Avoidance, and Automatic Sequences
  • 저자: Lucas Mol (Thompson Rivers University), Narad Rampersad (University of Winnipeg), Jeffrey Shallit (University of Waterloo)
  • 분류: cs.DM (이산수학), cs.FL (형식언어), math.CO (조합론)
  • 발표 저널: Communications in Mathematics 33 (2025), no. 2, Paper no. 5
  • 논문 링크: https://arxiv.org/abs/2301.06145

초록

본 논문은 이진 수열에서 Dyck 단어의 다양한 성질을 연구하며, 여기서 0은 왼쪽 괄호, 1은 오른쪽 괄호로 간주됩니다. 연구 결과에 따르면 7/3-무거듭제곱 이진 단어는 유계된 중첩 깊이를 가지지만, 더 큰 반복 지수에 대해서는 이 성질이 성립하지 않습니다. 본 논문은 Thue-Morse 단어에서 Dyck 인수의 명시적 특성화를 제시하고, 이들의 개수를 계산하는 방법을 보여줍니다. 또한 길이 2n인 Thue-Morse Dyck 인수의 개수 f(n)에 대한 타이트한 상한과 하한을 증명합니다.

연구 배경 및 동기

문제 정의

본 연구의 핵심 문제는 무한 이진 단어에서 Dyck 단어 인수의 구조와 성질을 이해하는 것입니다. Dyck 단어는 형식언어 이론의 기본 개념으로, 균형 잡힌 괄호 문자열을 나타내며 컴퓨터 과학과 수학에서 중요한 응용을 가집니다.

연구의 중요성

  1. 이론적 의의: Dyck 언어는 문맥 자유 언어의 전형적인 예이며, 자동 수열에서의 분포를 연구하는 것은 형식언어와 자동기계 이론의 심층적 연결을 이해하는 데 도움이 됩니다.
  2. 조합수학적 가치: 패턴 회피와 거듭제곱 회피는 조합 단어론의 핵심 연구 방향이며, 본 연구는 이러한 개념을 Dyck 단어와 결합합니다.
  3. 계산 응용: 자동 수열은 알고리즘과 계산 복잡성 이론에서 광범위한 응용을 가지며, 이들의 Dyck 인수의 성질을 이해하는 것은 실질적 의미를 갖습니다.

기존 연구의 한계

  • 특정 자동 수열에서 Dyck 인수의 체계적 특성화 부족
  • 거듭제곱 회피와 중첩 깊이 관계의 정량적 분석 부족
  • 자동 수열 Dyck 인수 계산의 효율적 알고리즘 부재

핵심 기여

  1. 거듭제곱 회피와 중첩 깊이의 관계: 7/3-무거듭제곱 Dyck 단어의 중첩 깊이가 최대 3임을 증명했으나, 임의로 큰 중첩 깊이를 가진 7/3⁺-무거듭제곱 Dyck 단어가 존재함을 보였습니다.
  2. Thue-Morse 단어의 Dyck 인수 특성화: Thue-Morse 수열의 모든 Dyck 인수의 완전한 특성화를 제시했으며, 이는 h(x) 형태입니다. 여기서 x는 특정 삼진 수열 s의 인수입니다.
  3. 자동 수열의 일반 이론: 실행 및 동기화 자동 수열의 Dyck 인수에 대한 판정 가능성 이론 프레임워크를 수립했습니다.
  4. 정확한 계수 결과: Thue-Morse 수열에서 길이 2n인 Dyck 인수의 개수 d(n)에 대한 타이트한 상한과 하한을 증명했습니다: d(n) ≤ n이고 d(n) ≥ n/2입니다.

방법론 상세 설명

작업 정의

이진 단어 w = w1..n이 주어졌을 때, 0을 왼쪽 괄호, 1을 오른쪽 괄호로 간주할 때 w가 균형 잡힌 괄호 문자열을 나타내면 w를 Dyck 단어라고 합니다. 형식적으로, w는 Dyck 단어일 필요충분조건은:

  • B(w) = |w|₀ - |w|₁ = 0 (균형 조건)
  • 모든 접두사 w'에 대해 B(w') ≥ 0 (비음성 조건)

중첩 깊이 N(w)는 모든 접두사에서 B(w')의 최댓값으로 정의됩니다.

핵심 방법

1. 거듭제곱 회피 분석 방법

귀납법과 구성적 증명을 사용합니다:

  • 정리 2.1: 7/3-무거듭제곱 Dyck 단어의 구조를 분석하여 중첩 깊이 ≤ 3임을 증명
  • 정리 2.9: 특수 태사 f와 g를 구성하여 f(gᵗ(2))가 임의로 큰 중첩 깊이를 가진 7/3⁺-무거듭제곱 Dyck 단어를 생성하도록 함

2. 자동기계 이론 방법

Walnut 정리 증명기를 이용한 계산 검증:

morphism f "0->00100110100110010110010011001011001101
           1->00101100110100110110011010010110011011
           2->00101101001101001011001101001011010011"
morphism g "0->022012 1->022112 2->202101"

3. 선형 표현 이론

실행 및 동기화 k-자동 수열에 대해 1차 논리 공식을 구성합니다:

  • 균형 함수: Bal(i,n,x) ≡ ∃y,z N₀(i,n,y) ∧ N₁(i,n,z) ∧ ((y<z ∧ x=0) | (y≥z ∧ y=x+z))
  • Dyck 판정: Dyck(i,n) ≡ 균형성 ∧ 비음성 조건

기술적 혁신점

  1. 태사 구성 기법: 특수한 6-균일 태사 g와 38-균일 태사 f를 설계하여 중첩 깊이의 정확한 제어를 실현
  2. 동기화 수열 이론: 실행 및 동기화 개념을 Dyck 언어 분석으로 확장하여 판정 가능성 프레임워크 수립
  3. 선형 표현 최소화: Schützenberger 알고리즘을 사용하여 Thue-Morse Dyck 인수 계수의 선형 표현을 계수 29에서 계수 7로 감소

실험 설정

계산 도구

  • Walnut 정리 증명기: 자동 수열의 1차 논리 검증에 사용
  • 선형대수 시스템: 행렬 연산 및 선형 표현 계산 수행
  • 기호 계산: 점화식 및 점근 거동 검증

검증 방법

  1. 소규모 검증: n < 29인 경우에 대한 직접 계산 검증
  2. 귀납 증명: 수학적 귀납법을 사용한 일반적 결과 증명
  3. 컴퓨터 보조: Walnut을 이용한 대규모 계산 검증 (예: 130GB 메모리, 20321초 CPU 시간)

실험 결과

주요 정량적 결과

1. 중첩 깊이 경계

  • 상한: 7/3-무거듭제곱 Dyck 단어의 중첩 깊이 ≤ 3
  • 하한: 임의로 큰 중첩 깊이를 가진 7/3⁺-무거듭제곱 Dyck 단어 존재

2. Thue-Morse Dyck 인수 계수

정확한 점화식:

  • d(2n) = 2d(n)
  • d(4n+3) = 2d(n) + d(2n+1) + q(n)
  • d(8n+1) = 2d(2n+1) + d(4n+1) - q(n)
  • d(8n+5) = 2d(n) + d(2n+1) + 2d(2n+2)

여기서 q(n)은 2-자동 수열이고 1 ≤ q(n) ≤ 2입니다.

3. 타이트한 경계 정리

  • 상한: d(n) ≤ n, n = 3·2ⁱ일 때 등호 성립
  • 하한: d(n) ≥ n/2, n = 2ⁱ일 때 등호 성립
  • 홀수 경우: n이 홀수일 때, d(n) ≥ (n+3)/2

4. 점근 평균값

∑₀≤ᵢ<₂ₙ d(i) = 19·4ⁿ/48 - 2ⁿ/4 + 5/3, 평균값은 (19/24)n

구체적 수치 결과

처음 21항의 d(n) 값:

n01234567891011121314151617181920
d(n)1123246648881291213814161416

기타 수열의 결과

  • Fibonacci 수열: Dyck 인수는 01과 0101만 존재
  • 주기 배가 수열: Dyck 인수는 01, 0101, 010101만 존재
  • Rudin-Shapiro 수열: 임의로 큰 중첩 깊이를 가진 Dyck 인수 존재

관련 연구

형식언어 이론

본 연구는 Chomsky와 Schützenberger의 문맥 자유 언어 이론, 특히 Dyck 언어의 대수 이론을 기반으로 합니다.

조합 단어론

  • 거듭제곱 회피 이론: Thue의 중복 없는 단어에 관한 개척적 업적을 계승
  • 자동 수열: Cobham의 k-자동 수열 이론과 최근의 동기화 수열 개념을 기반

계산 방법

  • Walnut 시스템: Mousavi와 Shallit이 개발한 자동 정리 증명 도구 활용
  • 선형 표현: Berstel과 Reutenauer의 비교환 유리 급수 이론 적용

결론 및 논의

주요 결론

  1. 임계 지수 현상: 7/3은 Dyck 단어의 중첩 깊이 유계성의 임계 지수이며, 거듭제곱 회피와 구조적 복잡성의 심층적 연결을 보여줍니다.
  2. 자동 수열의 보편성: 실행 및 동기화 성질은 자동 수열에서 Dyck 인수를 연구하기 위한 통일된 프레임워크를 제공합니다.
  3. 정확한 계수 이론: Thue-Morse 수열의 Dyck 인수 계수는 k-정규 수열의 풍부한 구조를 보여줍니다.

한계

  1. 계산 복잡성: 대규모 Walnut 계산은 막대한 자원을 필요로 합니다 (130GB 메모리).
  2. 특수 수열 의존성: 일부 결과 (예: 실행 및 동기화 성질)는 수열의 특수성에 의존합니다.
  3. 일반화 정도: 일부 결과는 특정 자동 수열 범주에만 적용됩니다.

향후 방향

  1. 고차원 확장: 고차원 Dyck 언어의 자동 수열에서의 분포 연구
  2. 기타 패턴: 다른 문맥 자유 패턴의 회피 문제로 확장
  3. 알고리즘 최적화: 더 효율적인 Dyck 인수 계수 알고리즘 개발

심층 평가

장점

  1. 이론적 깊이: 거듭제곱 회피, 자동 수열, 형식언어 이론을 유기적으로 결합하여 깊은 이론적 기초를 보여줍니다.
  2. 방법론 혁신: 태사 구성 및 선형 표현 기법의 교묘한 응용, 특히 중첩 깊이의 정확한 제어
  3. 계산 엄밀성: 광범위한 컴퓨터 보조 검증으로 결과의 신뢰성을 강화
  4. 결과의 완전성: 존재성에서 계수까지의 완전한 이론적 그림 제시

부족한 점

  1. 계산 자원: 일부 증명이 대규모 계산에 의존하여 결과의 검증 가능성을 제한할 수 있습니다.
  2. 추론 가능성: 일부 기술 방법이 더 일반적인 수열 범주로 확장하기 어려울 수 있습니다.
  3. 응용 지향성: 이론적 결과의 실질적 응용 가치는 추가 탐구가 필요합니다.

영향력

  1. 학제 간 교차: 조합수학, 형식언어 이론, 자동기계 이론의 교차 발전을 촉진합니다.
  2. 방법론 기여: 자동 수열에서 구조적 패턴을 연구하기 위한 새로운 분석 프레임워크 제공
  3. 계산 도구: 현대 정리 증명 도구의 조합 문제에서의 강력한 응용 가능성 시연

적용 시나리오

  1. 이론 연구: 조합 단어론 및 형식언어 이론의 심화 연구에 적합
  2. 알고리즘 설계: 구조화된 수열을 처리하는 알고리즘 설계의 이론적 기초 제공
  3. 교육 응용: 현대 수학 계산 방법을 보여주는 우수한 사례로 활용 가능

참고문헌

본 논문은 형식언어 이론, 조합수학, 자동기계 이론의 중요 문헌을 인용하며, 다음을 포함합니다:

  • Chomsky & Schützenberger의 문맥 자유 언어 이론
  • Thue의 중복 없는 단어에 관한 개척적 업적
  • Allouche & Shallit의 k-정규 수열 이론
  • Berstel & Reutenauer의 비교환 유리 급수
  • 현대 계산 도구 Walnut 관련 문헌

종합 평가: 이는 이론적 깊이와 기술적 혁신 모두에서 우수한 성과를 보이는 논문으로, 여러 수학 분야의 개념과 방법을 유기적으로 결합하여 자동 수열에서의 구조적 패턴 이해에 중요한 기여를 합니다. 계산 복잡성과 추론 가능성 측면에서 일정한 한계가 있지만, 이론적 가치와 방법론적 의미는 상당합니다.