2025-11-21T11:13:15.784368

Elementary Bounds on Digital Sums of Powers, Factorials, and LCMs

Radcliffe

We prove that the sum of the base-$b$ digits of $a^{n}$ grows at least logarithmically in $n$ if $\log(d)/\log(b)$ is irrational, where $d$ is the smallest factor of $a$ such that $\gcd(a/d, b) = 1$. Our approach uses only elementary number theory and applies to a wide class of sequences, including factorials and $Î(n) = lcm(1, 2, \ldots, n)$. We conclude with an expository proof of the previously known result that the sum of the base-$b$ digits of $a^{n}$ tends to infinity with $n$ if and only if $\log(a)/\log(b)$ is irrational.

academic

Elementary Bounds on Digital Sums of Powers, Factorials, and LCMs

基本信息

论文ID: 2511.15850
标题: Elementary Bounds on Digital Sums of Powers, Factorials, and LCMs
作者: David G. Radcliffe
分类: math.NT (数论)
发表时间: 2025年11月19日
论文链接: https://arxiv.org/abs/2511.15850

摘要

本文证明了当 $\log(d)/\log(b)$ 为无理数时， $a^n$ 的 $b$ 进制数字和至少以对数速度增长，其中 $d$ 是 $a$ 的最小因子且满足 $\gcd(a/d, b) = 1$ 。研究方法仅使用初等数论，并可应用于广泛的序列类别，包括阶乘和 $\Lambda(n) = \text{lcm}(1, 2, \ldots, n)$ 。文章最后给出了已知结果的说明性证明： $a^n$ 的 $b$ 进制数字和趋于无穷当且仅当 $\log(a)/\log(b)$ 为无理数。

研究背景与动机

核心问题

本文研究的核心问题源自波兰数学家 Sierpiński 在1970年提出的一个问题：证明 $2^n$ 的十进制数字和随 $n$ 增长趋于无穷。这个问题看似简单，但实际上具有深刻的数论意义。

问题的重要性

非单调性挑战：虽然 $2^n$ 快速增长，但其数字和序列并非单调递增（如 $2^4=16$ 的数字和为7， $2^5=32$ 的数字和为5），因此仅证明无界性不足以说明趋于无穷。
普遍性：该问题不仅适用于 $2^n$ ，还涉及一般形式 $a^n$ 在任意进制 $b$ 下的数字和行为，具有广泛的理论意义。
数字分布理论：虽然猜测 $2^n$ 的十进制数字和约为 $4.5n\log_{10}2$ （基于数字均匀分布假设），但这一更强的猜想尚未证明。

现有研究的局限性

Senge-Straus (1973)：证明了 $c_b(a^n) \to \infty$ 当且仅当 $\log(a)/\log(b)$ 为无理数，但未给出增长速率的下界。
Stewart (1980)：证明了 $c_b(a^n) > \frac{\log n}{\log\log n + C} - 1$ 的下界，但条件较为一般。
Sanna (2015)：对阶乘和LCM给出了更强的界 $s_b(n!) > C\log n\log\log\log n$ 。

本文的创新点

本文使用纯粹的初等数论方法（不依赖超越数论等高深工具），在特定条件下获得了 $c_b(a^n) > C\log n$ 的对数下界，且方法可推广到阶乘、LCM等多种序列。

核心贡献

建立了对数下界：在 $\log(d)/\log(b)$ 为无理数的条件下，证明了 $c_b(a^n) > C\log n$ （定理4）。
初等方法的系统化：发展了基于整除性质的初等证明技术，避免了Baker定理等超越数论工具（在前4节中）。
广泛的适用性：将方法推广到：
- 阶乘序列： $c_b(n!) > C\log n$ （定理5）
- LCM序列： $c_b(\Lambda_n) > C\log\log n$ （定理6）
完整的理论图景：第5节使用Baker定理给出了一般情况的说明性证明，复现了Senge-Straus和Stewart的结果。
教学价值：论文以Sierpiński问题为引入，逐步推广，提供了清晰的直觉和多个练习题，具有很好的教学示范作用。

方法详解

任务定义

符号约定：

$s_b(n)$ ： $n$ 的 $b$ 进制数字和
$c_b(n)$ ： $n$ 的 $b$ 进制表示中非零数字的个数
$\nu_p(n)$ ： $n$ 的素因子分解中素数 $p$ 的指数
由于 $c_b(n) \leq s_b(n) \leq (b-1)c_b(n)$ ，两者渐近等价，故主要研究 $c_b(n)$

核心任务：对给定的正整数序列 $(a_n)$ ，确定 $c_b(a_n)$ 的增长速率下界。

核心技术框架

1. 基本思想（第2节： $2^n$ 的十进制情况）

关键观察：正整数的正倍数不能小于该整数本身。

构造方法：

将 $2^n$ 的十进制表示写为 $2^n = \sum_{i=0}^{\infty} d_i 10^i$
考察 $2^n \bmod 10^{e(k)}$ （最后 $e(k)$ 位数字）
如果 $2^n$ 能被 $2^{e(k)}$ 整除，则这 $e(k)$ 位数字形成的数也能被 $2^{e(k)}$ 整除
通过归纳法，将数字分成不重叠的块，每块至少包含一个非零数字

定理1（形式化）：设序列 $(e(k))_{k\geq 1}$ 满足 $e(1) \geq 1$ 且 $2^{e(k)} > 10^{e(k-1)}$ 。若 $n$ 能被 $2^{e(k)}$ 整除但不能被10整除，则 $c_{10}(n) \geq k$ 。

推论1：对于能被2整除但不能被10整除的正整数 $a$ ，有 $c_{10}(a^n) \geq \log_4(n)$ 。

证明技巧：选择 $e(k) = 4^{k-1}$ ，则 $2^{e(k)} = 2^{4^{k-1}} > 10^{4^{k-2}} = 10^{e(k-1)}$ （当 $k \geq 2$ 时）。

2. 推广到一般进制（第3节）

定理2（一般进制版本）：设 $b \geq 2$ 不是素数幂， $p$ 是 $b$ 的素因子。若 $\nu_p(n) \geq e(k)$ 且 $b \nmid n$ ，则 $c_b(n) \geq k$ 。

关键创新——修正函数 $\xi$ ：为了处理末尾零（即 $b | n$ 的情况），引入函数： $\xi(n) = \nu_p(n) - \nu_q(n) \cdot \frac{\nu_p(b)}{\nu_q(b)}$

其中 $p, q$ 是 $b$ 的不同素因子。该函数满足 $\xi(b^r u) = \xi(u)$ ，即对末尾零不敏感。

定理3（改进版本）：若 $\xi(n) \geq e(k)$ ，则 $c_b(n) \geq k$ 。特别地，若 $\xi(a_n) \to \infty$ ，则 $c_b(a_n) \to \infty$ 。

3. 主要结果（定理4）

定理4：设 $a \geq 2, b \geq 2$ 。令 $d$ 是 $a$ 的最小因子使得 $\gcd(a/d, b) = 1$ 。若 $\log(d)/\log(b)$ 为无理数，则： $c_b(a^n) > C\log n$ 其中 $C > 0$ 仅依赖于 $a$ 和 $b$ 。

证明思路：

将 $b$ 和 $d$ 分解为素因子： $b = p_1^{e_1} \cdots p_t^{e_t}$ ， $d = p_1^{f_1} \cdots p_t^{f_t}$
若 $\log(d)/\log(b)$ 无理，则比值 $f_i/e_i$ 不全相等
存在素数 $p = p_i, q = p_j$ 使得 $f_i/e_i > f_j/e_j$ ，从而 $\xi(a) > 0$
选择 $r = \lceil \log_p b \rceil$ ， $e(k) = r^{k-1}$
对给定的 $n$ ，取 $k = \lceil \log_r \xi(a^n) \rceil = \lceil \log_r(n\xi(a)) \rceil$
由定理3， $c_b(a^n) \geq k = \Theta(\log n)$

推广应用

阶乘序列（定理5）

定理5：若 $b$ 有素因子 $p, q$ 满足 $(p-1)\nu_p(b) \neq (q-1)\nu_q(b)$ ，则： $c_b(n!) > C\log n$

证明关键：

使用Legendre公式： $\nu_p(n!) = \frac{n - s_p(n)}{p-1}$
计算 $\xi(n!) = n\left(\frac{1}{p-1} - \frac{\nu_p(b)}{(q-1)\nu_q(b)} + o(1)\right) = \Theta(n)$
应用定理3

LCM序列（定理6）

定理6：若 $b \geq 2$ 不是素数幂，则： $c_b(\Lambda_n) > C\log\log n$

证明关键：

利用 $\nu_p(\Lambda_n) = \lfloor \log_p(n) \rfloor$
计算 $\xi(\Lambda_n) = \Theta(\log n)$
应用定理3得 $c_b(\Lambda_n) = \Theta(\log\log n)$

一般情况的完整证明（第5节）

使用Baker定理（超越数论工具）证明了最一般的结果：

定理8：若 $\log(a)/\log(b)$ 为无理数，则对充分大的 $n$ ： $c_b(a^n) > \frac{\log n}{\log\log n + C}$

证明策略：

将 $a^n$ 的 $b$ 进制表示写为块的形式
估计相邻非零数字位置的比值 $m(i+1)/m(i)$
构造线性形式 $\Lambda = -n\log a + (m-m(i))\log b + \log q$
应用Baker定理得到 $|\Lambda|$ 的下界
通过不等式链推导出 $m(i+1)/m(i) < C\log n$
对所有比值求和得到最终结果

实验设置

注：本文是纯理论数学论文，不涉及实验验证，因此本节描述论文中的数值例证和理论验证。

数值例证

论文通过具体例子说明概念：

$2^n$ 序列（OEIS A000079）：
- 前11项：1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, ...
数字和序列（OEIS A001370）：
- 对应数字和：1, 2, 4, 8, 7, 5, 10, 11, 13, 8, 7, ...
- 展示了非单调性
图示说明（图1）：
- $2^{103} = 10141204801825835211973625643008$
- 将数字分块：10141204801825835 | 2119736256 | 43008
- 每块至少包含一个非零数字

理论验证方法

归纳法：定理1-3的证明使用数学归纳法
构造性证明：通过显式构造序列 $e(k)$ 证明存在性
渐近分析：使用大O记号和Θ记号分析增长率

练习题

论文提供了两个练习题供读者验证理解：

练习1：证明3的每个幂都有一个倍数 $m$ （不能被10整除）使得 $c_{10}(m) = 2$ 。

练习2：证明第 $n$ 个Fibonacci数的十进制非零数字个数趋于无穷。

实验结果

主要理论结果总结

序列类型	条件	下界	定理编号
$a^n$	$\log(d)/\log(b)$ 无理	$c_b(a^n) > C\log n$	定理4
$a^n$	$\log(a)/\log(b)$ 无理	$c_b(a^n) > \frac{\log n}{\log\log n + C}$	定理8
$n!$	$(p-1)\nu_p(b) \neq (q-1)\nu_q(b)$	$c_b(n!) > C\log n$	定理5
$\Lambda_n$	$b$ 非素数幂	$c_b(\Lambda_n) > C\log\log n$	定理6

与已有结果的比较

Senge-Straus (1973)：
- 结果： $c_b(a^n) \to \infty \Leftrightarrow \log(a)/\log(b)$ 无理
- 本文改进：给出了显式的对数下界
Stewart (1980)：
- 结果： $c_b(a^n) > \frac{\log n}{\log\log n + C} - 1$ （一般条件）
- 本文关系：定理8复现了该结果，定理4在更强条件下给出了更强的界
Sanna (2015)：
- 结果： $s_b(n!) > C\log n\log\log\log n$
- 本文关系：定理5给出了较弱但更初等的界 $c_b(n!) > C\log n$

方法论优势

方面	本文方法（前4节）	传统方法
工具	初等数论（整除性、归纳法）	Baker定理、超越数论
可理解性	高（本科生可理解）	低（需要高深背景）
适用范围	幂、阶乘、LCM等	主要针对幂
界的强度	$C\log n$ （特殊条件）	$\frac{\log n}{\log\log n}$ （一般条件）

关键发现

$\xi$ 函数的威力：修正函数 $\xi$ 巧妙地处理了末尾零的问题，是方法推广的关键。
无理性条件的本质：
- $\log(d)/\log(b)$ 无理等价于 $f_i/e_i$ 不全相等
- 这保证了 $\xi(a) > 0$ ，从而 $\xi(a^n)$ 线性增长
序列特异性：
- 阶乘： $\xi(n!) = \Theta(n)$ → $c_b(n!) = \Theta(\log n)$
- LCM： $\xi(\Lambda_n) = \Theta(\log n)$ → $c_b(\Lambda_n) = \Theta(\log\log n)$
- 体现了不同序列的内在结构差异
必要性：若 $\log(a)/\log(b) = r/s \in \mathbb{Q}$ ，则 $a^{ns} = b^{nr}$ 仅有一个非零数字，说明无理性条件是必要的。

核心定理：在 $\log(d)/\log(b)$ 无理的条件下， $a^n$ 的 $b$ 进制非零数字个数至少以 $C\log n$ 的速度增长。
广泛适用性：该方法不仅适用于幂序列，还适用于阶乘（ $\log n$ 增长）和LCM（ $\log\log n$ 增长）。
初等性：前4节的所有结果仅使用初等数论，无需超越数论工具。
完整性：第5节使用Baker定理给出了最一般情况的完整证明，复现了已知的最优结果。

局限性

条件限制：
- 定理4要求 $\log(d)/\log(b)$ 无理，比定理8的条件（ $\log(a)/\log(b)$ 无理）更强
- 例如： $a=6, b=10$ 时， $d=2$ ， $\log(2)/\log(10)$ 无理，定理4适用
- 但若 $a=15, b=10$ ， $d=3$ ， $\log(3)/\log(10)$ 无理，但可能不是最优条件
界的强度：
- 对于阶乘，本文的界 $c_b(n!) > C\log n$ 弱于Sanna的 $s_b(n!) > C\log n\log\log\log n$
- 初等方法的代价是获得较弱的界
常数不显式：
- 虽然证明了存在常数 $C > 0$ ，但未给出 $C$ 的显式表达式
- 对实际应用可能需要进一步计算
上界缺失：
- 论文主要关注下界，未讨论上界
- 例如， $c_b(a^n)$ 是否满足 $c_b(a^n) = O(n)$ ？
数字和vs非零数字数：
- 主要结果针对 $c_b(n)$ （非零数字个数）
- 虽然与 $s_b(n)$ （数字和）渐近等价，但常数因子可能重要

未来方向

改进界：
- 能否用初等方法获得 $c_b(a^n) = \Omega(\log n \log\log n)$ 的界？
- 能否缩小与Sanna结果的差距？
显式常数：
- 计算常数 $C$ 的显式表达式
- 对小的 $a, b$ 给出精确估计
推广到其他序列：
- Fibonacci数（练习2提示）
- Catalan数
- 素数序列
数字分布：
- 证明或反驳数字均匀分布猜想
- 研究数字和的渐近公式
计算应用：
- 开发高效算法计算数字和
- 应用于密码学和编码理论
多维推广：
- 研究 $a^m b^n$ 形式的数字和
- 混合进制表示

初等性与深刻性的结合：成功地用纯初等方法解决了看似需要高深工具的问题，展示了初等数论的威力。
统一框架： $\xi$ 函数的引入是巧妙的创新，它优雅地处理了末尾零问题，使方法具有广泛适用性。
构造性：证明是完全构造性的，原则上可以给出任意 $n$ 的显式界。

2. 理论贡献

定量改进：在特定条件下，从 $\frac{\log n}{\log\log n}$ 改进到 $\log n$ ，虽然条件更强，但界更优。
推广性：首次用统一的初等方法处理幂、阶乘、LCM三类序列。
完整性：既给出初等证明，又在第5节用Baker定理给出最一般结果，理论图景完整。

3. 写作质量

清晰的结构：从特殊到一般，从具体到抽象，逻辑清晰。
直觉引导：通过图1等直观例子帮助理解。
教学导向：包含练习题，适合教学使用。
历史背景：充分介绍了问题的历史和相关工作。

4. 技术细节

严谨性：所有定理都有完整证明，没有跳步。
边界条件处理：仔细处理了各种边界情况（如 $k=1$ ，末尾零等）。
符号系统：引入的符号（ $c_b, s_b, \nu_p, \xi$ ）清晰且一致。

不足

1. 理论局限

条件强度：定理4的条件比定理8强，限制了适用范围。
- 例子： $a=15, b=10$ 时， $\log(15)/\log(10)$ 无理，但 $d=3$ ，需验证 $\log(3)/\log(10)$ 无理。
界的次优性：对阶乘的界弱于已知最佳结果。
- 本文： $c_b(n!) > C\log n$
- Sanna： $s_b(n!) > C\log n\log\log\log n$
缺少上界：没有讨论 $c_b(a^n)$ 的上界，理论图景不完整。

2. 技术细节

常数隐藏：常数 $C$ 依赖于 $a, b$ 但未给出显式表达式，对实际应用不便。
渐近记号使用：频繁使用 $\Theta, O, o$ 记号，虽然简洁但有时掩盖了精确关系。
$\xi$ 函数的选择： $\xi$ 的定义依赖于选择素数 $p, q$ ，不同选择可能导致不同的界，论文未充分讨论这一点。

3. 证明技巧

归纳法的非构造性：虽然证明是构造性的，但归纳过程使得实际计算 $C$ 变得困难。
Baker定理的使用：第5节使用了Baker定理这一"黑箱"，与前面的初等性形成对比，虽然作者明确说明了这一点。

4. 实用性

计算效率：论文未讨论实际计算 $c_b(a^n)$ 的算法效率。
数值验证：缺少具体数值例子验证理论界的紧性。
应用场景：未讨论这些结果的实际应用（如密码学、编码理论）。

影响力评估

对领域的贡献

方法论贡献：为数字和问题提供了新的初等工具箱，可能启发其他问题的研究。
教学资源：可作为优秀的教学材料，展示如何从简单问题发展到深刻理论。
桥梁作用：连接了初等方法和高深工具（Baker定理），为不同背景的研究者提供了切入点。

实用价值

理论价值高于实用价值：主要是纯数学理论贡献，直接实用性有限。
潜在应用：
- 伪随机数生成器的分析
- 密码学中的数字性质研究
- 计算复杂性理论

可复现性

完全可复现：所有证明都是完整的，读者可以逐步验证。
易于实现：基于整除性的方法易于编程实现。
练习题：提供的练习题有助于读者巩固理解。

适用场景

1. 学术研究

数论研究者：提供了新的技术工具，可应用于相关问题。
组合数学：数字和问题与组合结构有深刻联系。
计算数论：为算法设计提供理论基础。

2. 教学场景

本科高年级/研究生课程：优秀的数论教学案例。
数学竞赛：Sierpiński问题适合作为竞赛题目。
科普写作：从简单问题到深刻理论的范例。

3. 后续研究

推广方向：为研究其他序列的数字和提供了模板。
改进方向：为寻求更强的界提供了基础。
交叉领域：可能与动力系统、遍历论产生联系。

总体评价

这是一篇优秀的纯数学论文，具有以下突出特点：

理论深度：虽然使用初等方法，但获得了有意义的新结果。
方法创新： $\xi$ 函数的引入和统一框架的建立是真正的创新。
写作质量：清晰、严谨、富有教学性，是数学写作的典范。
完整性：既有初等证明，又有高深工具的应用，理论图景完整。

主要价值：

对数论研究者：提供了新工具
对教育者：提供了优秀教材
对学生：提供了学习路径

主要不足：

界的强度在某些情况下不是最优的
缺少显式常数和数值验证
实用性相对有限

推荐指数：⭐⭐⭐⭐☆ (4.5/5)

对数论研究者和学生强烈推荐
对应用研究者价值有限

参考文献

论文引用的关键文献：

Andrica et al. (2020): 群论中的指数性质，提供了LCM的理论基础。
Baker (1975): Transcendental Number Theory，超越数论的经典教材，Baker定理的来源。
Dickson (1919): History of the Theory of Numbers，数论史经典，包含Legendre公式。
Sanna (2015): "On the sum of digits of the factorial"，阶乘数字和的最强已知结果。
Senge & Straus (1973): "PV-numbers and sets of multiplicity"，首次给出充要条件。
Sierpiński (1970): 250 Problems in Elementary Number Theory，问题的原始来源。
Stewart (1980): "On the representation of an integer in two different bases"，首次给出定量界。

总结：本文通过巧妙的初等方法，在数字和这一经典问题上取得了有意义的进展，既有理论深度又有教学价值，是数论领域的一篇优秀工作。