We introduce a parametrization of the conjugates of Christoffel words based on the integer Ostrowski numeration system. We use it to give a precise description of the borders (prefixes which are also suffixes) of the conjugates of Christoffel words and to revisit the notion of Sturmian graph introduced by Epifanio et al.
论文ID : 2202.05486标题 : On the conjugates of Christoffel words作者 : Yann Bugeaud (Université de Strasbourg et CNRS, Institut universitaire de France), Christophe Reutenauer (Université du Québec à Montréal)分类 : math.CO (Combinatorics)发表会议/期刊 : Discrete Mathematics and Theoretical Computer Science, vol. 27:3 #20 (2025)接收时间 : 2025年10月23日论文链接 : https://arxiv.org/abs/2202.05486 本文基于整数Ostrowski数制系统引入了Christoffel词共轭类的参数化方法。利用这一参数化,作者给出了Christoffel词共轭元的边界(既是前缀又是后缀的子词)的精确刻画,并重新审视了Epifanio等人引入的Sturmian图概念。
本文研究Christoffel词的共轭类(conjugation class)的结构和性质。Christoffel词是由Christoffel在1875年引入的二元字母表上的特殊词类,其共轭是通过循环置换得到的词。
Christoffel词及其共轭在多个数学领域具有重要意义:
自由群理论 :它们对应于二生成元自由群中正的、循环约化的且构成基的元素数据压缩 :它们是二字母表上的"完美聚类词"(perfectly clustering words),在Burrows-Wheeler变换理论中出现Sturmian词理论 :它们是Sturmian无限词的有限版本,与平面直线的离散化相关二次型理论 :它们编码Markoff二次型及其最小值虽然Christoffel词本身由非负有理数参数化是众所周知的结果,但其共轭类的系统性参数化方法此前并不完善。特别是:
缺乏统一的参数化框架来描述所有共轭元 Christoffel词共轭元的边界(borders)和周期的精确刻画不够完整 Sturmian图与Ostrowski表示的关系需要更深入的理解 本文旨在建立一个基于Ostrowski数制的系统性框架,完整刻画Christoffel词的共轭类,并应用这一框架解决边界问题和Sturmian图的结构问题。
参数化构造 :基于整数Ostrowski数制系统,引入了Christoffel词共轭类的完整参数化方法(定理7.3),这是Rauzy规则和标准词构造的推广非交换提升 :证明了Frid关于标准词前缀的结果作为推论(推论7.6),这可视为Ostrowski数制系统的非交换提升边界刻画 :给出了Christoffel词共轭元的最长边界的精确描述(定理8.1),并证明任何边界都是某个Christoffel词共轭元的幂(推论8.2)Sturmian图嵌入 :证明了紧致图和Sturmian图自然嵌入到中心词树和Stern-Brocot树中(推论9.5),利用了de Luca的迭代回文化理论统一框架 :建立了Ostrowski表示、共轭类、边界和图论结构之间的深刻联系给定正整数序列 a 1 , … , a m a_1, \ldots, a_m a 1 , … , a m ,定义:
连带多项式:q i = K ( a 1 , … , a i ) q_i = K(a_1, \ldots, a_i) q i = K ( a 1 , … , a i ) ,其中 K K K 是continuant多项式 参数:b i = a i − 1 b_i = a_i - 1 b i = a i − 1 (若 i = 1 i=1 i = 1 ),b i = a i b_i = a_i b i = a i (若 i ≥ 2 i \geq 2 i ≥ 2 ) 目标 :对每个整数 N = ∑ i = 1 m d i q i − 1 N = \sum_{i=1}^m d_i q_{i-1} N = ∑ i = 1 m d i q i − 1 (Ostrowski表示),构造对应的Christoffel词共轭元。
定义词序列 V i = V i ( d 1 , … , d m ) ∈ F ( A ) V_i = V_i(d_1, \ldots, d_m) \in F(A) V i = V i ( d 1 , … , d m ) ∈ F ( A ) (自由群):
V − 1 = b , V 0 = a V_{-1} = b, \quad V_0 = a V − 1 = b , V 0 = a
V i = V i − 1 b i − d i V i − 2 V i − 1 d i , i = 1 , … , m V_i = V_{i-1}^{b_i - d_i} V_{i-2} V_{i-1}^{d_i}, \quad i = 1, \ldots, m V i = V i − 1 b i − d i V i − 2 V i − 1 d i , i = 1 , … , m
这里 A = { a , b } A = \{a, b\} A = { a , b } 是二元字母表。
关键性质 :
当 0 ≤ d i ≤ b i 0 \leq d_i \leq b_i 0 ≤ d i ≤ b i 时,V i ∈ A ∗ V_i \in A^* V i ∈ A ∗ (正词) V i V_i V i 的长度为 q i = K ( a 1 , … , a i ) q_i = K(a_1, \ldots, a_i) q i = K ( a 1 , … , a i ) V i V_i V i 的Slope(斜率)为 [ 0 , a 1 , … , a i ] [0, a_1, \ldots, a_i] [ 0 , a 1 , … , a i ] (连分数)词 V i V_i V i 可通过态射复合表示:
( V i , V i − 1 ) = π ( b 1 − d 1 , d 1 ) ∘ ⋯ ∘ π ( b i − d i , d i ) (V_i, V_{i-1}) = \pi(b_1 - d_1, d_1) \circ \cdots \circ \pi(b_i - d_i, d_i) ( V i , V i − 1 ) = π ( b 1 − d 1 , d 1 ) ∘ ⋯ ∘ π ( b i − d i , d i )
其中 π ( i , j ) = ( a i b a j , a ) \pi(i, j) = (a^i b a^j, a) π ( i , j ) = ( a i b a j , a ) 是特定的字母表自同态。
主要结果 :
所有 V m ( d 1 , … , d m ) V_m(d_1, \ldots, d_m) V m ( d 1 , … , d m ) (其中 0 ≤ d i ≤ b i 0 \leq d_i \leq b_i 0 ≤ d i ≤ b i )在自由群中共轭于 M m = V m ( 0 , … , 0 ) M_m = V_m(0, \ldots, 0) M m = V m ( 0 , … , 0 ) 在词意义下的共轭类恰好是所有满足legal条件的Ostrowski表示对应的词 精确公式:V m = C N ( M m ) V_m = C^N(M_m) V m = C N ( M m ) ,其中 C C C 是共轭算子,N = ∑ d i q i − 1 N = \sum d_i q_{i-1} N = ∑ d i q i − 1 证明思路 :
利用引理5.1(关于自同构的共轭关系) 构造共轭元 h h h 使得 V m = h − 1 M m h V_m = h^{-1} M_m h V m = h − 1 M m h 计算 h h h 的代数长度恰为 N N N 利用Ostrowski表示的唯一性证明覆盖整个共轭类 统一框架 :将Rauzy规则、标准词构造、Ostrowski数制统一在递归定义(11)中代数方法 :利用自由群的共轭理论和态射的abelianization矩阵计算长度双重表示 :Greedy表示:∀ i ≥ 2 , d i = b i ⇒ d i − 1 = 0 \forall i \geq 2, d_i = b_i \Rightarrow d_{i-1} = 0 ∀ i ≥ 2 , d i = b i ⇒ d i − 1 = 0 Lazy表示:∀ i , 2 ≤ i ≤ k , d i = 0 ⇒ d i − 1 = b i − 1 \forall i, 2 \leq i \leq k, d_i = 0 \Rightarrow d_{i-1} = b_{i-1} ∀ i , 2 ≤ i ≤ k , d i = 0 ⇒ d i − 1 = b i − 1 镜像对称 (命题7.8):
V m ( d 1 , … , d m ) ~ = V m ( b 1 − d 1 , … , b m − d m ) \widetilde{V_m(d_1, \ldots, d_m)} = V_m(b_1 - d_1, \ldots, b_m - d_m) V m ( d 1 , … , d m ) = V m ( b 1 − d 1 , … , b m − d m ) 这建立了greedy和lazy表示之间的对偶关系。对于不是Christoffel词的 V m ( d 1 , … , d m ) V_m(d_1, \ldots, d_m) V m ( d 1 , … , d m ) (greedy表示),其最长边界 B B B 由以下情况决定:
情况分类 :
(i) 若 d m = b m d_m = b_m d m = b m :B = V m − 1 B = V_{m-1} B = V m − 1 (ii) 若 1 ≤ d m ≤ b m − 1 1 \leq d_m \leq b_m - 1 1 ≤ d m ≤ b m − 1 且 1 ≤ d m − 1 ≤ b m − 1 − 1 1 \leq d_{m-1} \leq b_{m-1} - 1 1 ≤ d m − 1 ≤ b m − 1 − 1 :B = V m − 1 ℓ B = V_{m-1}^\ell B = V m − 1 ℓ ,其中 ℓ = min { b m − d m , d m } \ell = \min\{b_m - d_m, d_m\} ℓ = min { b m − d m , d m } (iii)-(vii) 其他情况有类似但更复杂的描述关键引理 (引理8.14):
在 V m = V m − 1 b m − d m V m − 2 V m − 1 d m V_m = V_{m-1}^{b_m - d_m} V_{m-2} V_{m-1}^{d_m} V m = V m − 1 b m − d m V m − 2 V m − 1 d m 中,V m − 1 V_{m-1} V m − 1 的出现次数最多为 b m + 2 b_m + 2 b m + 2 次,额外的出现只能在 V m − 2 V_{m-2} V m − 2 附近。
任何Christoffel词共轭元的边界都是某个Christoffel词共轭元的幂。
证明思路 :
若 u u u 是Christoffel词 w w w 的边界,则 u u uu uu 是 w w ww ww 的因子 w w ww ww 是Sturmian词,故 u u u 的所有共轭也是Sturmian词其中存在Lyndon词的幂,该Lyndon词必是Christoffel词 定义 :
顶点集 V V V :中心回文 p = L 0 c 1 L 1 c 2 ⋯ L m − 1 c m p = L_0^{c_1} L_1^{c_2} \cdots L_{m-1}^{c_m} p = L 0 c 1 L 1 c 2 ⋯ L m − 1 c m 的所有前缀(作为 L i L_i L i 上的词) 边:两类边
水平边:U → L i U L i U \xrightarrow{L_i} UL_i U L i U L i 跳跃边:U → L i + 1 U L i k L i + 1 U \xrightarrow{L_{i+1}} UL_i^k L_{i+1} U L i + 1 U L i k L i + 1 (k ≥ 1 k \geq 1 k ≥ 1 ) 定理 :对于中心回文 p p p 的每个后缀 s s s ,存在唯一从原点出发、标签为 s s s 的路径。
证明要点 :
图的确定性:每个顶点最多两条出边,标签首字母不同 路径标签恰对应lazy Ostrowski表示 利用推论9.1:s = L 0 d 1 L 1 d 2 ⋯ L m − 1 d m s = L_0^{d_1} L_1^{d_2} \cdots L_{m-1}^{d_m} s = L 0 d 1 L 1 d 2 ⋯ L m − 1 d m 命题9.4 :中心词 p p p 的指导词(directive word)为 v = a c 1 b c 2 a c 3 ⋯ v = a^{c_1} b^{c_2} a^{c_3} \cdots v = a c 1 b c 2 a c 3 ⋯
嵌入结果 :
紧致图和Sturmian图自然嵌入到中心词树中 通过Stern-Brocot树的对应关系,也嵌入到该树中 利用了de Luca的迭代回文化算子 Pal \text{Pal} Pal 参数 :m = 3 , a 1 = 2 , a 2 = 1 , a 3 = 3 m = 3, a_1 = 2, a_2 = 1, a_3 = 3 m = 3 , a 1 = 2 , a 2 = 1 , a 3 = 3
计算结果 :
M 0 = a , M 1 = a b , M 2 = a b a , M 3 = a b a a b a a b a a b M_0 = a, M_1 = ab, M_2 = aba, M_3 = abaabaabaab M 0 = a , M 1 = ab , M 2 = aba , M 3 = abaabaabaab M 3 = p a b M_3 = pab M 3 = p ab ,中心词 p = a b a 2 b a 2 b a p = aba^2ba^2ba p = ab a 2 b a 2 ba 回文前缀:1 , a , a b a , a b a a b a , p 1, a, aba, abaaba, p 1 , a , aba , abaaba , p 指导词:v = a b a a v = abaa v = abaa L 0 = a , L 1 = b a , L 2 = a b a L_0 = a, L_1 = ba, L_2 = aba L 0 = a , L 1 = ba , L 2 = aba 验证 :
p = L 0 L 1 2 L 2 = a ⋅ ( b a ) 2 ⋅ a b a = a b a 2 b a 2 b a p = L_0 L_1^2 L_2 = a \cdot (ba)^2 \cdot aba = aba^2ba^2ba p = L 0 L 1 2 L 2 = a ⋅ ( ba ) 2 ⋅ aba = ab a 2 b a 2 ba ✓紧致图路径与lazy表示一致 ✓ 论文在附录(第10节)给出了Ostrowski表示存在唯一性的完整证明:
引理10.1 :交替序列对应 q k − 1 q_k - 1 q k − 1
引理10.2 :
Greedy表示:N ≤ q k − 1 N \leq q_k - 1 N ≤ q k − 1 Lazy表示:N ≤ q k + q k − 1 − 2 N \leq q_k + q_{k-1} - 2 N ≤ q k + q k − 1 − 2 这些结果保证了参数化的完备性。
Christoffel (1875) 和 Smith (1876) :独立引入Christoffel词Markoff (1879, 1880) :用于构造二次型,虽然未意识到与Christoffel的联系Frobenius (1913) :明确建立了联系,提出著名的Markoff数猜想Rauzy (1985) :"Rauzy规则",标准词构造的基础de Luca & Mignosi (1994, 1997) :标准词理论和迭代回文化Ostrowski (1922) :Ostrowski数制系统Epifanio et al. (2007, 2012) :Sturmian图和lazy表示vs Rauzy/de Luca :本文的递归构造(11)是更一般的框架,包含标准词作为特例vs Frid (2018) :本文的推论7.6推广了Frid的结果到整个共轭类vs Lapointe (2017) :本文用完全不同的方法(Ostrowski参数化)重新证明了周期结果vs Epifanio et al. :本文给出了Sturmian图嵌入到树结构的新视角完整参数化 :建立了Christoffel词共轭类与Ostrowski表示的双射关系边界完全刻画 :所有边界都是Christoffel词共轭元的幂,给出了最长边界的显式公式图论统一 :Sturmian图和紧致图自然嵌入到经典的树结构中理论深化 :将组合词论、数论(连分数)、自由群理论、图论统一在一个框架下计算复杂性 :论文未讨论参数化构造的计算复杂度推广性 :方法局限于二元字母表,更大字母表的推广不明显应用 :虽然理论优美,但实际应用场景的讨论较少算法实现 :缺少具体的算法伪代码和实现细节算法化 :开发高效算法计算共轭元和边界推广 :研究更大字母表或无限词的类似理论应用 :探索在数据压缩、模式匹配中的应用连接 :进一步研究与Markoff理论、二次型的深层联系理论深度 :建立了多个数学领域的深刻联系(组合、数论、代数) 证明严谨完整,逻辑清晰 方法创新 :Ostrowski参数化是全新视角 递归构造(11)优雅且统一 镜像对称性(命题7.8)揭示了深层结构 结果完整性 :不仅给出存在性,还有唯一性和显式构造 边界定理涵盖所有情况 推广和统一了多个已知结果 写作质量 :结构清晰,从基础定义到高级结果层层递进 引理和定理组织良好 提供了具体示例(第9节) 可读性挑战 :需要较强的组合词论和自由群背景 符号系统复杂(V i , M i , L i , q i , b i V_i, M_i, L_i, q_i, b_i V i , M i , L i , q i , b i 等) 定理8.1的七种情况过于繁琐 实验验证 :仅有一个小规模示例 缺少大规模数值验证 未提供代码或计算工具 应用导向 :理论性强但应用讨论不足 未明确说明如何用于实际问题 计算效率未分析 技术细节 :某些证明(如定理8.1)冗长且技术性强 附录的Ostrowski表示证明虽完整但可读性较差 学术贡献 :为Christoffel词理论提供了新的统一框架 解决了边界刻画这一重要问题 连接了Ostrowski数制与词组合学 潜在应用 :数据压缩算法(Burrows-Wheeler变换) 符号动力系统 数论中的丢番图逼近 可复现性 :理论结果可复现性强 但缺少软件实现限制了实际应用 示例计算可手工验证 后续研究 :为算法研究提供了理论基础 可能启发更大字母表的研究 与Markoff理论的联系值得深入探索 理论研究 :组合词论的进一步研究 Sturmian词和Christoffel词的性质探索 自由群和自由幺半群理论 算法开发 :教学 :组合数学和词组合学的高级课程 连分数理论的应用示例 自由群理论的具体实例 跨学科应用 :数论中的连分数展开 离散几何中的直线离散化 二次型理论 Continuant多项式 :
K ( n 1 , … , n k ) = K k − 1 ( n 1 , … , n k − 1 ) n k + K k − 2 ( n 1 , … , n k − 2 ) K(n_1, \ldots, n_k) = K_{k-1}(n_1, \ldots, n_{k-1})n_k + K_{k-2}(n_1, \ldots, n_{k-2}) K ( n 1 , … , n k ) = K k − 1 ( n 1 , … , n k − 1 ) n k + K k − 2 ( n 1 , … , n k − 2 )
连接了递归定义和连分数态射复合 :
M ( π ( i , j ) ) = P ( i + j ) = ( i + j 1 1 0 ) M(\pi(i,j)) = P(i+j) = \begin{pmatrix} i+j & 1 \\ 1 & 0 \end{pmatrix} M ( π ( i , j )) = P ( i + j ) = ( i + j 1 1 0 )
通过abelianization计算长度共轭算子 :
C ( a u ) = u a , C n ( w ) = 循环移位 C(au) = ua, \quad C^n(w) = \text{循环移位} C ( a u ) = u a , C n ( w ) = 循环移位
建立了代数长度与词共轭的联系Greedy表示 (引理10.2(i)):
q k − 1 − 1 < N ≤ q k − 1 q_{k-1} - 1 < N \leq q_k - 1 q k − 1 − 1 < N ≤ q k − 1
Lazy表示 (引理10.2(ii)):
q k − 1 + q k − 2 − 2 < N ≤ q k + q k − 1 − 2 q_{k-1} + q_{k-2} - 2 < N \leq q_k + q_{k-1} - 2 q k − 1 + q k − 2 − 2 < N ≤ q k + q k − 1 − 2
这些不等式保证了表示的唯一性和参数化的完备性。
Christoffel, E. B. (1875) : Observatio arithmetica - 原始定义Rauzy, G. (1985) : Mots infinis en arithmétique - Rauzy规则de Luca, A. (1997) : Sturmian words: structure, combinatorics - 标准词理论Epifanio et al. (2007, 2012) : On Sturmian graphs - Sturmian图Frid, A. E. (2018) : Sturmian numeration systems - 本文推广的结果Lapointe, M. (2017) : Study of Christoffel classes - 周期和normal formBugeaud & Laurent (2023) : Combinatorial structure of Sturmian words - 无限词版本总体评价 :这是一篇理论深度极高的纯数学论文,在Christoffel词理论中做出了重要贡献。通过引入Ostrowski参数化,作者建立了一个优雅的统一框架,解决了共轭类刻画和边界问题。论文的主要价值在于理论创新和多领域连接,但在算法实现和实际应用方面还有拓展空间。对于组合词论和相关领域的研究者,这是一篇必读的重要文献。