2025-11-13T06:07:10.808838

Sums of products of binomial coefficients mod 2 and run length transforms of sequences

Wu
We study properties of functions of binomial coefficients mod 2 and derive a set of recurrence relations for sums of products of binomial coefficients mod 2. We show that they result in sequences that are the run length transforms of well known basic sequences. In particular, we obtain formulas for the run length transform of the positive integers, Fibonacci numbers, extended Lucas numbers and Narayana's cows sequence.
academic

Sums of products of binomial coefficients mod 2 and run length transforms of sequences

基本信息

  • 论文ID: 1610.06166
  • 标题: Sums of products of binomial coefficients mod 2 and run length transforms of sequences
  • 作者: Chai Wah Wu (IBM Research AI, IBM T. J. Watson Research Center)
  • 分类: math.CO (组合数学)
  • 发表时间: 初稿 2016年10月19日,最新修订 2022年8月12日
  • 论文链接: https://arxiv.org/abs/1610.06166v10

摘要

本文研究二项式系数模2的函数性质,推导了二项式系数乘积和模2的递推关系集合。研究表明这些递推关系产生的序列是一些著名基础序列的游程长度变换(run length transform)。特别地,论文获得了正整数、Fibonacci数、扩展Lucas数和Narayana奶牛序列的游程长度变换公式。

研究背景与动机

问题背景

  1. 核心问题:确定二项式系数(nk)\binom{n}{k}何时为偶数或奇数,即计算(nk)mod2\binom{n}{k} \mod 2
  2. 经典结果:Pascal三角形模2后呈现分形结构,对应于Sierpiński三角形(Sierpiński gasket)
  3. 理论基础:Lucas定理提供了计算二项式系数模素数的简单方法。对于p=2的情况,(nk)\binom{n}{k}为偶数当且仅当n和k的二进制表示中存在某位i使得ni<kin_i < k_i

研究重要性

  1. 理论意义:连接组合数学、数论和计算机科学中的位运算
  2. 应用价值:游程长度变换在分析元胞自动机(cellular automata)迭代n次后ON细胞数量方面很有用
  3. 统一框架:建立二项式系数模2与著名整数序列之间的深层联系

现有方法局限

  • 虽然Lucas定理提供了判定方法,但对于二项式系数乘积和的递推关系缺乏系统研究
  • 游程长度变换与二项式系数模2之间的联系尚未被充分探索
  • 缺乏统一的框架来刻画不同整数序列的游程长度变换

研究动机

通过位运算符号系统地研究二项式系数模2的性质,建立与游程长度变换的联系,为理解元胞自动机和整数序列提供新视角。

核心贡献

  1. 理论框架:引入函数F(n,k)=(a1n+a2ka3n+a4k)(nk)mod2F(n,k) = \binom{a_1n+a_2k}{a_3n+a_4k}\binom{n}{k} \mod 2和对应的位运算函数g(n,k)g(n,k),系统研究其性质
  2. 递推关系:推导了F(n,k)F(n,k)满足的多种递推关系(定理5、定理13、定理16),涵盖二阶、三阶和四阶情况
  3. 游程长度变换公式:获得以下著名序列的游程长度变换的显式表达:
    • Fibonacci数列(定理6)
    • 正整数序列(定理10)
    • 扩展Lucas数(定理17)
    • Narayana奶牛序列(定理14)
    • 其他序列(截断Fibonacci、1加2的幂次等)
  4. 统一表征:证明这些游程长度变换可表示为a(n)=k=0nF(n,k)a(n) = \sum_{k=0}^n F(n,k)的形式
  5. 完整分类:在表1中总结了10个序列及其游程长度变换的系数(a1,a2,a3,a4)(a_1, a_2, a_3, a_4)

方法详解

任务定义

输入:整数序列{Sn}n0\{S_n\}_{n\geq 0}满足特定递推关系 输出:其游程长度变换{Tn}n0\{T_n\}_{n\geq 0}的显式表达式 约束:通过二项式系数乘积和模2来表征

核心概念

1. 游程长度变换(Definition 1)

对于序列{Sn}n0\{S_n\}_{n\geq 0},其游程长度变换{Tn}n0\{T_n\}_{n\geq 0}定义为:

  • T0=S0=1T_0 = S_0 = 1
  • 对于n>0n > 0Tn=iRSiT_n = \prod_{i\in R} S_i,其中RRnn的二进制表示中连续1的游程长度

例子n=463=1110011112n = 463 = 111001111_2有长度为3和4的两个游程,故T463=S3S4T_{463} = S_3 \cdot S_4

2. 位运算表示(Theorem 1-3)

利用位运算\wedge(AND)、\vee(OR)、¬\neg(NOT):

定理1(nk)0mod2k(¬n)0\binom{n}{k} \equiv 0 \mod 2 \Leftrightarrow k \wedge (\neg n) \neq 0

定理2(nk)(mr)0mod2(k(¬n))(r(¬m))0\binom{n}{k}\binom{m}{r} \equiv 0 \mod 2 \Leftrightarrow (k \wedge (\neg n)) \vee (r \wedge (\neg m)) \neq 0

定理3:推广到多个二项式系数乘积

模型架构

Definition 2:核心函数定义

对于整数a1,a2,a3,a4a_1, a_2, a_3, a_4满足0a1+a20 \leq a_1 + a_20a3+a40 \leq a_3 + a_4,定义:

F(n,k)=(a1n+a2ka3n+a4k)(nk)mod2F(n,k) = \binom{a_1n+a_2k}{a_3n+a_4k}\binom{n}{k} \mod 2

g(n,k)=((a3n+a4k)¬(a1n+a2k))(k¬n)g(n,k) = ((a_3n+a_4k)\wedge\neg(a_1n+a_2k)) \vee (k\wedge\neg n)

关键性质F(n,k)=1g(n,k)=0F(n,k) = 1 \Leftrightarrow g(n,k) = 0

Theorem 5:二阶递推关系

F(n,k)F(n,k)满足以下性质:

  • F(n,k)=0F(n,k) = 0k>nk > n
  • F(2rn,2rk)=F(n,k)F(2^rn, 2^rk) = F(n,k)(缩放不变性)
  • F(2n,2k+1)=0F(2n, 2k+1) = 0等多个消失性质
  • 在特定条件下:F(4n+1,4k)=F(n,k)F(4n+1, 4k) = F(n,k)
  • 条件判定基于a3¬a1mod4a_3 \wedge \neg a_1 \mod 4

Lemma 2:序列递推

序列a(n)=k=0nF(n,k)a(n) = \sum_{k=0}^n F(n,k)满足:

  • a(0)=1a(0) = 1
  • a(2rn)=a(n)a(2^rn) = a(n)
  • 在适当条件下:a(4n+1)=a(n)+k=0nF(4n+1,4k+1)a(4n+1) = a(n) + \sum_{k=0}^n F(4n+1, 4k+1)

技术创新点

  1. 位运算视角:将Lucas定理转化为位运算表达,使得递推关系的推导更加直观和系统化
  2. 统一框架:通过参数(a1,a2,a3,a4)(a_1, a_2, a_3, a_4)的不同取值,统一刻画多个著名序列的游程长度变换
  3. 模运算技巧:利用ia3¬ia1mod2mia_3 \wedge \neg ia_1 \mod 2^m判定FF函数的消失性,这是推导递推关系的关键
  4. 递推层次:从二阶(定理4)推广到三阶(定理12)和四阶(定理12),展示方法的可扩展性
  5. 显式构造:不仅证明存在性,还给出具体的系数选择,使得结果可计算、可验证

实验设置

验证方法

本文是纯数学理论论文,采用定理证明而非实验验证:

  1. 证明策略
    • 通过位运算的代数性质严格推导
    • 利用二进制表示的最低有效位分析
    • 归纳法验证递推关系
  2. 具体例子验证
    • 对每个定理提供具体数值例子
    • 例如:n=463=1110011112n=463=111001111_2的游程分解
  3. OEIS数据库对照
    • 所有结果序列都在OEIS(在线整数序列百科全书)中有对应条目
    • 提供序列编号进行交叉验证

数据集

使用OEIS数据库中的标准整数序列:

  • A000045 (Fibonacci)
  • A000027 (正整数)
  • A000930 (Narayana奶牛序列)
  • A000032 (Lucas数)
  • 等10个序列(见表1)

实验结果

主要结果

1. Fibonacci数列的游程长度变换(Theorem 6)

系数(a1,a2,a3,a4)=(1,1,0,2)(a_1, a_2, a_3, a_4) = (1, -1, 0, 2)

a(n)=k=0n(nk2k)(nk)mod2a(n) = \sum_{k=0}^n \binom{n-k}{2k}\binom{n}{k} \mod 2

递推关系

  • a(0)=1a(0) = 1
  • a(2n)=a(n)a(2n) = a(n)
  • a(4n+1)=a(n)a(4n+1) = a(n)
  • a(4n+3)=a(2n+1)+a(n)a(4n+3) = a(2n+1) + a(n)

这正是Fibonacci数列{1,1,2,3,5,8,13,}\{1,1,2,3,5,8,13,\ldots\}的游程长度变换(OEIS A246028)

2. 正整数的游程长度变换(Theorem 10)

系数(a1,a2,a3,a4)=(1,1,1,1)(a_1, a_2, a_3, a_4) = (1, 1, 1, -1)

a(n)=k=0n(n+knk)(nk)mod2a(n) = \sum_{k=0}^n \binom{n+k}{n-k}\binom{n}{k} \mod 2

递推关系

  • a(2n)=a(n)a(2n) = a(n)
  • a(4n+1)=2a(n)a(4n+1) = 2a(n)
  • a(4n+3)=2a(2n+1)a(n)a(4n+3) = 2a(2n+1) - a(n)

对应正整数序列{1,2,3,4,5,}\{1,2,3,4,5,\ldots\}的游程长度变换(OEIS A106737)

3. Narayana奶牛序列的游程长度变换(Theorem 14)

系数(a1,a2,a3,a4)=(1,1,0,6)(a_1, a_2, a_3, a_4) = (1, -1, 0, 6)

a(n)=k=0n(nk6k)(nk)mod2a(n) = \sum_{k=0}^n \binom{n-k}{6k}\binom{n}{k} \mod 2

递推关系(三阶):

  • a(8n+1)=a(8n+3)=a(n)a(8n+1) = a(8n+3) = a(n)
  • a(8n+5)=a(2n+1)a(8n+5) = a(2n+1)
  • a(8n+7)=a(n)+a(4n+3)a(8n+7) = a(n) + a(4n+3)

对应序列{1,1,1,2,3,4,6,9,13,19,}\{1,1,1,2,3,4,6,9,13,19,\ldots\}(OEIS A000930)

4. 扩展Lucas数的游程长度变换(Theorem 17)

系数(a1,a2,a3,a4)=(1,2,2,1)(a_1, a_2, a_3, a_4) = (1, 2, 2, -1)

a(n)=k=0n(n+2k2nk)(nk)mod2a(n) = \sum_{k=0}^n \binom{n+2k}{2n-k}\binom{n}{k} \mod 2

递推关系(四阶):

  • a(16n+1)=a(16n+3)=a(16n+5)=a(16n+7)=a(n)a(16n+1) = a(16n+3) = a(16n+5) = a(16n+7) = a(n)
  • a(16n+9)=a(16n+11)=2a(2n+1)a(16n+9) = a(16n+11) = 2a(2n+1)
  • a(16n+13)=a(4n+3)a(16n+13) = a(4n+3)
  • a(16n+15)=a(8n+7)+a(4n+3)a(16n+15) = a(8n+7) + a(4n+3)

对应序列{1,1,2,1,3,4,7,11,18,}\{1,1,2,1,3,4,7,11,18,\ldots\}(OEIS A329723)

完整结果汇总(Table 1)

序列描述OEIS序列项系数(a1,a2,a3,a4)(a_1,a_2,a_3,a_4)游程变换OEIS
2的幂次A0000791,2,4,8,...(1,0,0,1)A001316
FibonacciA0000451,1,2,3,5,8,...(1,-1,0,2)A246028
截断Fibonacci-1,2,3,5,8,13,...(0,3,0,1)A245564
1+2的幂次A0117821,1,2,4,8,16,...(1,0,0,2)A245195
1后跟2A0400001,2,2,2,2,2,...(1,2,0,2)A277561
正整数A0000271,2,3,4,5,6,...(1,1,1,-1)A106737
全1序列A0000121,1,1,1,1,1,...(1,-1,0,1)A000012
Narayana奶牛A0009301,1,1,2,3,4,6,9,...(1,-1,0,6)A329720
重复正整数A0086191,1,2,2,3,3,4,4,...(1,3,0,6)A278161
扩展LucasA3297231,1,2,1,3,4,7,11,...(1,2,2,-1)A329722

特殊结果

Theorem 11:全1序列的不动点性质 k=0n(nkk)(nk)mod2=1,n0\sum_{k=0}^n \binom{n-k}{k}\binom{n}{k} \mod 2 = 1, \quad \forall n \geq 0

(nk,k)(nk)(n-k,k)\binom{n}{k}为奇数当且仅当k=0k=0。这可以通过Sierpiński三角形的几何解释:从左边缘向右移动kk步到达三角形上的点,继续对角移动kk步必然到达空白处。

相关工作

理论基础

  1. Lucas定理(1878):计算二项式系数模素数的经典结果
  2. Fine (1947), Granville (1997):二项式系数模素数幂的算术性质
  3. Stewart (1995), Weisstein:Pascal三角形模2与Sierpiński三角形的联系

游程长度变换

  1. Sloane (2018):在元胞自动机分析中引入游程长度变换概念
    • Theorem 4:二阶递推序列的游程长度变换满足的递推关系
    • 本文将其推广到三阶(Corollary 1)和四阶(Corollary 2)

相关序列研究

  1. Gould's sequence/Dress' sequencek=0n(nk)mod2\sum_{k=0}^n \binom{n}{k} \mod 2是2的幂次的游程长度变换(OEIS A001316)
  2. Leroy, Rigo, Stipulanti (2016):词的二项式系数的广义Pascal三角形
  3. Mathonet等 (2022):与Pascal三角形相关的数字序列

本文优势

  • 系统性:提供统一框架而非个案研究
  • 显式性:给出具体的二项式系数和表达式
  • 可扩展性:方法可推广到更高阶递推
  • 完整性:覆盖多个著名序列族

结论与讨论

主要结论

  1. 理论贡献:建立了二项式系数模2与游程长度变换之间的深刻联系,通过参数(a1,a2,a3,a4)(a_1,a_2,a_3,a_4)的选择可以刻画不同的整数序列
  2. 方法论创新:位运算视角提供了系统推导递推关系的有效工具,避免了逐案分析
  3. 具体成果:获得了10个著名序列(包括Fibonacci、Lucas、Narayana奶牛序列等)的游程长度变换的显式公式
  4. 统一框架:证明这些游程长度变换都可表示为k=0n(a1n+a2ka3n+a4k)(nk)mod2\sum_{k=0}^n \binom{a_1n+a_2k}{a_3n+a_4k}\binom{n}{k} \mod 2的形式

局限性

  1. 参数选择:虽然给出了10个例子,但缺乏系统的方法来确定给定序列对应的系数(a1,a2,a3,a4)(a_1,a_2,a_3,a_4)
  2. 覆盖范围:仅考虑了二阶、三阶、四阶递推,更高阶的情况虽然有一般性定理(Theorem 12)但缺少具体例子
  3. 充要条件:未完全刻画哪些序列的游程长度变换可以表示为这种形式
  4. 计算复杂度:对于大的nn,计算a(n)a(n)需要求和O(n)O(n)项,可能存在更高效的算法
  5. 推广方向
    • 是否可推广到模其他素数的情况?
    • 多个二项式系数乘积(超过2个)的情况如何?

未来方向

  1. 逆问题:给定序列{Sn}\{S_n\},如何系统地找到对应的系数(a1,a2,a3,a4)(a_1,a_2,a_3,a_4)使其游程长度变换可表示为二项式系数和?
  2. 算法优化:开发更高效的算法直接计算a(n)a(n)而不需要显式求和
  3. 推广到模pkp^k:研究二项式系数模素数幂的类似性质
  4. 元胞自动机应用:利用这些结果分析更多元胞自动机规则
  5. 组合解释:寻找这些恒等式的组合学解释(bijective proofs)

深度评价

优点

  1. 理论深度
    • 巧妙地将Lucas定理转化为位运算语言,使得推导更加透明
    • 递推关系的推导严谨完整,每个定理都有详细证明
    • 统一框架具有很强的理论美感
  2. 方法创新
    • 位运算视角是处理模2问题的自然工具,但在组合数学中应用不够广泛,本文展示了其威力
    • 通过g(n,k)g(n,k)函数将二项式系数模2问题转化为纯位运算问题
  3. 结果丰富
    • 覆盖10个著名序列,每个都有OEIS验证
    • 从二阶到四阶递推的完整处理
    • 特殊结果如Theorem 11(全1序列不动点)很有洞察力
  4. 写作清晰
    • 定义明确,符号一致
    • 例子恰当(如n=463n=463的游程分解)
    • 表1提供了清晰的结果汇总
  5. 可验证性
    • 所有序列都有OEIS编号,可独立验证
    • 递推关系可通过计算机程序验证

不足

  1. 缺少算法分析
    • 未讨论计算复杂度
    • 未提供高效实现的伪代码
    • 对于大规模计算的实用性不明确
  2. 逆向问题未解决
    • 给定序列如何找系数(a1,a2,a3,a4)(a_1,a_2,a_3,a_4)
    • 是否所有游程长度变换都能表示为这种形式?
    • 缺少必要条件的刻画
  3. 组合解释缺失
    • 虽然代数推导严谨,但缺少组合学直观
    • 为什么这些特定的系数对应这些序列?是否有深层原因?
  4. 应用场景有限
    • 主要是理论结果,实际应用场景(如元胞自动机)讨论不足
    • 与其他数学领域(如数论、代数)的联系未充分探索
  5. 高阶情况不完整
    • Theorem 12给出了一般性框架,但五阶及以上缺少具体例子
    • 未讨论递推阶数与系数选择的关系

影响力

  1. 学术价值
    • 为组合数学和数论交叉领域提供新工具
    • 可能启发其他模素数问题的研究
    • 在OEIS中贡献了多个新序列(A329720, A329722, A329723)
  2. 理论意义
    • 深化了对Pascal三角形模2结构的理解
    • 建立了离散序列与位运算的桥梁
    • 为游程长度变换理论提供了丰富的例子
  3. 实用价值
    • 可用于元胞自动机分析
    • 可能在编码理论、密码学中有应用(模2运算的普遍性)
    • 为序列生成提供新方法
  4. 可复现性
    • 所有结果都可通过OEIS验证
    • 证明过程详细,可独立验证
    • 适合作为教学材料

适用场景

  1. 理论研究
    • 组合数学中的恒等式证明
    • 整数序列性质研究
    • 模运算理论
  2. 计算机科学
    • 元胞自动机分析
    • 位运算优化
    • 序列生成算法
  3. 数学教育
    • 展示位运算在纯数学中的应用
    • Lucas定理的深入应用
    • 递推关系的系统研究
  4. 相关领域
    • 编码理论(二进制码)
    • 密码学(模2运算)
    • 算法设计(分治策略与二进制表示)

参考文献

论文引用的关键文献包括:

  1. Lucas定理基础
    • Fine (1947): "Binomial coefficients modulo a prime"
    • Granville (1997): "Arithmetic properties of binomial coefficients"
  2. Sierpiński三角形
    • Stewart (1995): "Four encounters with Sierpiński's gasket"
    • Weisstein: MathWorld关于Sierpiński筛的资源
  3. 游程长度变换
    • Sloane (2018): "On the number of ON cells in cellular automata"(剑桥大学出版社)
  4. 计算机算术
    • Brent & Zimmermann (2010): "Modern Computer Arithmetic"
  5. OEIS数据库
    • The On-Line Encyclopedia of Integer Sequences (1996-present)

总体评价:这是一篇高质量的组合数学理论论文,通过位运算的巧妙应用,系统地研究了二项式系数模2与游程长度变换的关系。论文理论严谨、结果丰富、写作清晰,为相关领域提供了有价值的工具和洞察。主要不足在于缺少逆向问题的解决和更广泛的应用探索,但作为纯理论贡献已经相当完整和深入。