We prove that the sum of the base-$b$ digits of $a^{n}$ grows at least logarithmically in $n$ if $\log(d)/\log(b)$ is irrational, where $d$ is the smallest factor of $a$ such that $\gcd(a/d, b) = 1$. Our approach uses only elementary number theory and applies to a wide class of sequences, including factorials and $Î(n) = lcm(1, 2, \ldots, n)$. We conclude with an expository proof of the previously known result that the sum of the base-$b$ digits of $a^{n}$ tends to infinity with $n$ if and only if $\log(a)/\log(b)$ is irrational.
Elementary Bounds on Digital Sums of Powers, Factorials, and LCMs
- 论文ID: 2511.15850
- 标题: Elementary Bounds on Digital Sums of Powers, Factorials, and LCMs
- 作者: David G. Radcliffe
- 分类: math.NT (数论)
- 发表时间: 2025年11月19日
- 论文链接: https://arxiv.org/abs/2511.15850
本文证明了当 log(d)/log(b) 为无理数时,an 的 b 进制数字和至少以对数速度增长,其中 d 是 a 的最小因子且满足 gcd(a/d,b)=1。研究方法仅使用初等数论,并可应用于广泛的序列类别,包括阶乘和 Λ(n)=lcm(1,2,…,n)。文章最后给出了已知结果的说明性证明:an 的 b 进制数字和趋于无穷当且仅当 log(a)/log(b) 为无理数。
本文研究的核心问题源自波兰数学家 Sierpiński 在1970年提出的一个问题:证明 2n 的十进制数字和随 n 增长趋于无穷。这个问题看似简单,但实际上具有深刻的数论意义。
- 非单调性挑战:虽然 2n 快速增长,但其数字和序列并非单调递增(如 24=16 的数字和为7,25=32 的数字和为5),因此仅证明无界性不足以说明趋于无穷。
- 普遍性:该问题不仅适用于 2n,还涉及一般形式 an 在任意进制 b 下的数字和行为,具有广泛的理论意义。
- 数字分布理论:虽然猜测 2n 的十进制数字和约为 4.5nlog102(基于数字均匀分布假设),但这一更强的猜想尚未证明。
- Senge-Straus (1973):证明了 cb(an)→∞ 当且仅当 log(a)/log(b) 为无理数,但未给出增长速率的下界。
- Stewart (1980):证明了 cb(an)>loglogn+Clogn−1 的下界,但条件较为一般。
- Sanna (2015):对阶乘和LCM给出了更强的界 sb(n!)>Clognlogloglogn。
本文使用纯粹的初等数论方法(不依赖超越数论等高深工具),在特定条件下获得了 cb(an)>Clogn 的对数下界,且方法可推广到阶乘、LCM等多种序列。
- 建立了对数下界:在 log(d)/log(b) 为无理数的条件下,证明了 cb(an)>Clogn(定理4)。
- 初等方法的系统化:发展了基于整除性质的初等证明技术,避免了Baker定理等超越数论工具(在前4节中)。
- 广泛的适用性:将方法推广到:
- 阶乘序列:cb(n!)>Clogn(定理5)
- LCM序列:cb(Λn)>Cloglogn(定理6)
- 完整的理论图景:第5节使用Baker定理给出了一般情况的说明性证明,复现了Senge-Straus和Stewart的结果。
- 教学价值:论文以Sierpiński问题为引入,逐步推广,提供了清晰的直觉和多个练习题,具有很好的教学示范作用。
符号约定:
- sb(n):n 的 b 进制数字和
- cb(n):n 的 b 进制表示中非零数字的个数
- νp(n):n 的素因子分解中素数 p 的指数
- 由于 cb(n)≤sb(n)≤(b−1)cb(n),两者渐近等价,故主要研究 cb(n)
核心任务:对给定的正整数序列 (an),确定 cb(an) 的增长速率下界。
关键观察:正整数的正倍数不能小于该整数本身。
构造方法:
- 将 2n 的十进制表示写为 2n=∑i=0∞di10i
- 考察 2nmod10e(k)(最后 e(k) 位数字)
- 如果 2n 能被 2e(k) 整除,则这 e(k) 位数字形成的数也能被 2e(k) 整除
- 通过归纳法,将数字分成不重叠的块,每块至少包含一个非零数字
定理1(形式化):设序列 (e(k))k≥1 满足 e(1)≥1 且 2e(k)>10e(k−1)。若 n 能被 2e(k) 整除但不能被10整除,则 c10(n)≥k。
推论1:对于能被2整除但不能被10整除的正整数 a,有 c10(an)≥log4(n)。
证明技巧:选择 e(k)=4k−1,则 2e(k)=24k−1>104k−2=10e(k−1)(当 k≥2 时)。
定理2(一般进制版本):设 b≥2 不是素数幂,p 是 b 的素因子。若 νp(n)≥e(k) 且 b∤n,则 cb(n)≥k。
关键创新——修正函数 ξ:
为了处理末尾零(即 b∣n 的情况),引入函数:
ξ(n)=νp(n)−νq(n)⋅νq(b)νp(b)
其中 p,q 是 b 的不同素因子。该函数满足 ξ(bru)=ξ(u),即对末尾零不敏感。
定理3(改进版本):若 ξ(n)≥e(k),则 cb(n)≥k。特别地,若 ξ(an)→∞,则 cb(an)→∞。
定理4:设 a≥2,b≥2。令 d 是 a 的最小因子使得 gcd(a/d,b)=1。若 log(d)/log(b) 为无理数,则:
cb(an)>Clogn
其中 C>0 仅依赖于 a 和 b。
证明思路:
- 将 b 和 d 分解为素因子:b=p1e1⋯ptet,d=p1f1⋯ptft
- 若 log(d)/log(b) 无理,则比值 fi/ei 不全相等
- 存在素数 p=pi,q=pj 使得 fi/ei>fj/ej,从而 ξ(a)>0
- 选择 r=⌈logpb⌉,e(k)=rk−1
- 对给定的 n,取 k=⌈logrξ(an)⌉=⌈logr(nξ(a))⌉
- 由定理3,cb(an)≥k=Θ(logn)
定理5:若 b 有素因子 p,q 满足 (p−1)νp(b)=(q−1)νq(b),则:
cb(n!)>Clogn
证明关键:
- 使用Legendre公式:νp(n!)=p−1n−sp(n)
- 计算 ξ(n!)=n(p−11−(q−1)νq(b)νp(b)+o(1))=Θ(n)
- 应用定理3
定理6:若 b≥2 不是素数幂,则:
cb(Λn)>Cloglogn
证明关键:
- 利用 νp(Λn)=⌊logp(n)⌋
- 计算 ξ(Λn)=Θ(logn)
- 应用定理3得 cb(Λn)=Θ(loglogn)
使用Baker定理(超越数论工具)证明了最一般的结果:
定理8:若 log(a)/log(b) 为无理数,则对充分大的 n:
cb(an)>loglogn+Clogn
证明策略:
- 将 an 的 b 进制表示写为块的形式
- 估计相邻非零数字位置的比值 m(i+1)/m(i)
- 构造线性形式 Λ=−nloga+(m−m(i))logb+logq
- 应用Baker定理得到 ∣Λ∣ 的下界
- 通过不等式链推导出 m(i+1)/m(i)<Clogn
- 对所有比值求和得到最终结果
注:本文是纯理论数学论文,不涉及实验验证,因此本节描述论文中的数值例证和理论验证。
论文通过具体例子说明概念:
- 2n 序列(OEIS A000079):
- 前11项:1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, ...
- 数字和序列(OEIS A001370):
- 对应数字和:1, 2, 4, 8, 7, 5, 10, 11, 13, 8, 7, ...
- 展示了非单调性
- 图示说明(图1):
- 2103=10141204801825835211973625643008
- 将数字分块:10141204801825835 | 2119736256 | 43008
- 每块至少包含一个非零数字
- 归纳法:定理1-3的证明使用数学归纳法
- 构造性证明:通过显式构造序列 e(k) 证明存在性
- 渐近分析:使用大O记号和Θ记号分析增长率
论文提供了两个练习题供读者验证理解:
练习1:证明3的每个幂都有一个倍数 m(不能被10整除)使得 c10(m)=2。
练习2:证明第 n 个Fibonacci数的十进制非零数字个数趋于无穷。
| 序列类型 | 条件 | 下界 | 定理编号 |
|---|
| an | log(d)/log(b) 无理 | cb(an)>Clogn | 定理4 |
| an | log(a)/log(b) 无理 | cb(an)>loglogn+Clogn | 定理8 |
| n! | (p−1)νp(b)=(q−1)νq(b) | cb(n!)>Clogn | 定理5 |
| Λn | b 非素数幂 | cb(Λn)>Cloglogn | 定理6 |
- Senge-Straus (1973):
- 结果:cb(an)→∞⇔log(a)/log(b) 无理
- 本文改进:给出了显式的对数下界
- Stewart (1980):
- 结果:cb(an)>loglogn+Clogn−1(一般条件)
- 本文关系:定理8复现了该结果,定理4在更强条件下给出了更强的界
- Sanna (2015):
- 结果:sb(n!)>Clognlogloglogn
- 本文关系:定理5给出了较弱但更初等的界 cb(n!)>Clogn
| 方面 | 本文方法(前4节) | 传统方法 |
|---|
| 工具 | 初等数论(整除性、归纳法) | Baker定理、超越数论 |
| 可理解性 | 高(本科生可理解) | 低(需要高深背景) |
| 适用范围 | 幂、阶乘、LCM等 | 主要针对幂 |
| 界的强度 | Clogn(特殊条件) | loglognlogn(一般条件) |
- ξ 函数的威力:修正函数 ξ 巧妙地处理了末尾零的问题,是方法推广的关键。
- 无理性条件的本质:
- log(d)/log(b) 无理等价于 fi/ei 不全相等
- 这保证了 ξ(a)>0,从而 ξ(an) 线性增长
- 序列特异性:
- 阶乘:ξ(n!)=Θ(n) → cb(n!)=Θ(logn)
- LCM:ξ(Λn)=Θ(logn) → cb(Λn)=Θ(loglogn)
- 体现了不同序列的内在结构差异
- 必要性:若 log(a)/log(b)=r/s∈Q,则 ans=bnr 仅有一个非零数字,说明无理性条件是必要的。
- Sierpiński (1970):
- 提出了 2n 十进制数字和趋于无穷的问题
- 开启了数字和研究的经典问题
- Senge & Straus (1973):
- 首次给出充要条件:cb(an)→∞⇔log(a)/log(b) 无理
- 使用了PV-数(Pisot-Vijayaraghavan数)理论
- 未给出增长速率的定量界
- Baker (1975):
- 发展了线性形式对数的超越数论
- 提供了有效下界,成为后续研究的重要工具
- Stewart (1980):
- 首次给出定量界:cb(an)>loglogn+Clogn−1
- 使用Baker定理证明
- 方法较为技术性,不易理解
- Sanna (2015):
- 将研究扩展到阶乘和LCM
- 证明了 sb(n!)>Clognlogloglogn
- 使用了素数定理和精细的数论估计
- 数字和的正规性:
- 研究数字在各进制下的分布
- 猜想:2n 的十进制数字和 ∼4.5nlog102(尚未证明)
- 其他序列的数字和:
- 高维推广:
- 计算复杂性:
本文的独特贡献在于:
- 方法论创新:系统发展了基于整除性的初等方法,填补了初等方法与高深工具之间的空白。
- 统一框架:通过 ξ 函数建立了统一的处理框架,适用于多种序列。
- 教学价值:提供了从具体问题到一般理论的清晰路径,适合教学和学习。
- 结果改进:在特定条件下获得了比Stewart更强的界(logn vs. loglognlogn)。
- 核心定理:在 log(d)/log(b) 无理的条件下,an 的 b 进制非零数字个数至少以 Clogn 的速度增长。
- 广泛适用性:该方法不仅适用于幂序列,还适用于阶乘(logn 增长)和LCM(loglogn 增长)。
- 初等性:前4节的所有结果仅使用初等数论,无需超越数论工具。
- 完整性:第5节使用Baker定理给出了最一般情况的完整证明,复现了已知的最优结果。
- 条件限制:
- 定理4要求 log(d)/log(b) 无理,比定理8的条件(log(a)/log(b) 无理)更强
- 例如:a=6,b=10 时,d=2,log(2)/log(10) 无理,定理4适用
- 但若 a=15,b=10,d=3,log(3)/log(10) 无理,但可能不是最优条件
- 界的强度:
- 对于阶乘,本文的界 cb(n!)>Clogn 弱于Sanna的 sb(n!)>Clognlogloglogn
- 初等方法的代价是获得较弱的界
- 常数不显式:
- 虽然证明了存在常数 C>0,但未给出 C 的显式表达式
- 对实际应用可能需要进一步计算
- 上界缺失:
- 论文主要关注下界,未讨论上界
- 例如,cb(an) 是否满足 cb(an)=O(n)?
- 数字和vs非零数字数:
- 主要结果针对 cb(n)(非零数字个数)
- 虽然与 sb(n)(数字和)渐近等价,但常数因子可能重要
- 改进界:
- 能否用初等方法获得 cb(an)=Ω(lognloglogn) 的界?
- 能否缩小与Sanna结果的差距?
- 显式常数:
- 计算常数 C 的显式表达式
- 对小的 a,b 给出精确估计
- 推广到其他序列:
- Fibonacci数(练习2提示)
- Catalan数
- 素数序列
- 数字分布:
- 计算应用:
- 多维推广:
- 研究 ambn 形式的数字和
- 混合进制表示
- 初等性与深刻性的结合:成功地用纯初等方法解决了看似需要高深工具的问题,展示了初等数论的威力。
- 统一框架:ξ 函数的引入是巧妙的创新,它优雅地处理了末尾零问题,使方法具有广泛适用性。
- 构造性:证明是完全构造性的,原则上可以给出任意 n 的显式界。
- 定量改进:在特定条件下,从 loglognlogn 改进到 logn,虽然条件更强,但界更优。
- 推广性:首次用统一的初等方法处理幂、阶乘、LCM三类序列。
- 完整性:既给出初等证明,又在第5节用Baker定理给出最一般结果,理论图景完整。
- 清晰的结构:从特殊到一般,从具体到抽象,逻辑清晰。
- 直觉引导:通过图1等直观例子帮助理解。
- 教学导向:包含练习题,适合教学使用。
- 历史背景:充分介绍了问题的历史和相关工作。
- 严谨性:所有定理都有完整证明,没有跳步。
- 边界条件处理:仔细处理了各种边界情况(如 k=1,末尾零等)。
- 符号系统:引入的符号(cb,sb,νp,ξ)清晰且一致。
- 条件强度:定理4的条件比定理8强,限制了适用范围。
- 例子:a=15,b=10 时,log(15)/log(10) 无理,但 d=3,需验证 log(3)/log(10) 无理。
- 界的次优性:对阶乘的界弱于已知最佳结果。
- 本文:cb(n!)>Clogn
- Sanna:sb(n!)>Clognlogloglogn
- 缺少上界:没有讨论 cb(an) 的上界,理论图景不完整。
- 常数隐藏:常数 C 依赖于 a,b 但未给出显式表达式,对实际应用不便。
- 渐近记号使用:频繁使用 Θ,O,o 记号,虽然简洁但有时掩盖了精确关系。
- ξ 函数的选择:ξ 的定义依赖于选择素数 p,q,不同选择可能导致不同的界,论文未充分讨论这一点。
- 归纳法的非构造性:虽然证明是构造性的,但归纳过程使得实际计算 C 变得困难。
- Baker定理的使用:第5节使用了Baker定理这一"黑箱",与前面的初等性形成对比,虽然作者明确说明了这一点。
- 计算效率:论文未讨论实际计算 cb(an) 的算法效率。
- 数值验证:缺少具体数值例子验证理论界的紧性。
- 应用场景:未讨论这些结果的实际应用(如密码学、编码理论)。
- 方法论贡献:为数字和问题提供了新的初等工具箱,可能启发其他问题的研究。
- 教学资源:可作为优秀的教学材料,展示如何从简单问题发展到深刻理论。
- 桥梁作用:连接了初等方法和高深工具(Baker定理),为不同背景的研究者提供了切入点。
- 理论价值高于实用价值:主要是纯数学理论贡献,直接实用性有限。
- 潜在应用:
- 伪随机数生成器的分析
- 密码学中的数字性质研究
- 计算复杂性理论
- 完全可复现:所有证明都是完整的,读者可以逐步验证。
- 易于实现:基于整除性的方法易于编程实现。
- 练习题:提供的练习题有助于读者巩固理解。
- 数论研究者:提供了新的技术工具,可应用于相关问题。
- 组合数学:数字和问题与组合结构有深刻联系。
- 计算数论:为算法设计提供理论基础。
- 本科高年级/研究生课程:优秀的数论教学案例。
- 数学竞赛:Sierpiński问题适合作为竞赛题目。
- 科普写作:从简单问题到深刻理论的范例。
- 推广方向:为研究其他序列的数字和提供了模板。
- 改进方向:为寻求更强的界提供了基础。
- 交叉领域:可能与动力系统、遍历论产生联系。
这是一篇优秀的纯数学论文,具有以下突出特点:
- 理论深度:虽然使用初等方法,但获得了有意义的新结果。
- 方法创新:ξ 函数的引入和统一框架的建立是真正的创新。
- 写作质量:清晰、严谨、富有教学性,是数学写作的典范。
- 完整性:既有初等证明,又有高深工具的应用,理论图景完整。
主要价值:
- 对数论研究者:提供了新工具
- 对教育者:提供了优秀教材
- 对学生:提供了学习路径
主要不足:
- 界的强度在某些情况下不是最优的
- 缺少显式常数和数值验证
- 实用性相对有限
推荐指数:⭐⭐⭐⭐☆ (4.5/5)
论文引用的关键文献:
- Andrica et al. (2020): 群论中的指数性质,提供了LCM的理论基础。
- Baker (1975): Transcendental Number Theory,超越数论的经典教材,Baker定理的来源。
- Dickson (1919): History of the Theory of Numbers,数论史经典,包含Legendre公式。
- Sanna (2015): "On the sum of digits of the factorial",阶乘数字和的最强已知结果。
- Senge & Straus (1973): "PV-numbers and sets of multiplicity",首次给出充要条件。
- Sierpiński (1970): 250 Problems in Elementary Number Theory,问题的原始来源。
- Stewart (1980): "On the representation of an integer in two different bases",首次给出定量界。
总结:本文通过巧妙的初等方法,在数字和这一经典问题上取得了有意义的进展,既有理论深度又有教学价值,是数论领域的一篇优秀工作。