For a family $\mathcal{F}$ of words of length $n$ drawn from an alphabet $A=[r]=\{1,\dots,r\}$, Danh and Daykin defined the deletion shadow $Î\mathcal{F}$ as the family containing all words that can be made by deleting one letter of a word of $\mathcal{F}$. They asked, given the size of such a family, how small its deletion shadow can be, and answered this with a Kruskal-Katona type result when the alphabet has size $2$. However, Leck showed that no ordering can give such a result for larger alphabets. The minimal shadow has been known for families of size $s^n$, where the optimal family has form $[s]^n$. We give the minimal shadow for many intermediate sizes between these levels, showing that families of the form 'all words in $[s]^n$ in which the symbol $s$ appears at most $k$ times' are optimal. Our proof uses some fractional techniques that may be of independent interest.
New optima for the deletion shadow
- 论文ID: 2505.01131
- 标题: New optima for the deletion shadow
- 作者: Benedict Randall Shaw
- 分类: math.CO (组合数学)
- 发表时间: May 2025
- 论文链接: https://arxiv.org/abs/2505.01131
对于由长度为n、来自字母表A=[r]={1,…,r}的单词组成的族F,Danh和Daykin定义了删除影子ΔF为包含所有通过删除F中单词的一个字母而得到的单词的族。他们提出了一个问题:给定这样一个族的大小,其删除影子能有多小?当字母表大小为2时,他们用类似Kruskal-Katona的结果回答了这个问题。然而,Leck证明了对于更大的字母表,不存在能给出这种结果的排序。对于大小为sn的族,已知最小影子由形式为[s]n的最优族达到。本文给出了这些层级之间许多中间大小的最小影子,证明了形式为"[s]n中符号s最多出现k次的所有单词"的族是最优的。证明使用了一些可能具有独立价值的分数技术。
本研究关注删除影子问题,这是组合数学中的一个基本问题:
- 删除影子:对于单词族F⊂An,其删除影子ΔF是通过删除F中任意单词的任意一个位置的字符而得到的所有单词的集合
- 核心问题:给定族的大小∣F∣,如何使其删除影子∣ΔF∣最小?
- Danh-Daykin开创性工作:当字母表大小为2时,证明了类似Kruskal-Katona定理的结果,即按简单序排列的初始段能最小化删除影子
- Leck的否定结果:证明了当r≥3时,不存在任何排序使得所有初始段都能最小化其删除影子
- 已知结果局限性:此前仅知道大小为sn的族的最小删除影子,由[s]n型族达到
- 理论价值:扩展了极值组合学中的影子问题理论
- 技术创新:引入分数族技术绕过Leck的不可能性结果
- 应用前景:为编码理论、信息论中的相关问题提供新工具
- 主要定理:证明了形式为"[s]n中符号s最多出现k次的所有单词"的族具有给定大小下的最小删除影子
- 技术创新:开发了分数族理论来处理删除影子问题,包括新的压缩概念
- 证明了Bollobás-Leader猜想:解决了该领域的一个重要开放问题
- 密度提升:在每对连续的sn和(s+1)n之间提供了n−1个新的已知最优大小
- 输入:字母表A=[r],单词长度n,族大小约束
- 输出:具有最小删除影子的单词族
- 约束:族中所有单词长度相同,来自有限字母表
传统的离散族F⊂An可以用指示函数表示,取值为{0,1}。分数族将此推广为:
- 定义:分数族是从An到[0,1]的函数f
- 权重:∣f∣=∑w∈Anf(w)
- 删除影子:(Δf)(x1,…,xn−1)=maxy∈A,i∈[n]f(x1,…,xi−1,y,xi,…,xn−1)
扩展离散Hamming球B(n,s)(k)([s]n中符号s最多出现k次的单词)到分数版本:
- 符号s最多出现k次:权重为1
- 符号s恰好出现k+1次:权重为α∈[0,1]
- 其他情况:权重为0
记为bk,α(n,s),具有良好性质:Δbk,α(n,s)=bk,α(n−1,s)
由于均匀分数族会最小化删除影子但不对应离散族,需要限制优化范围:
s-压缩:分数族f满足,对于y<xi且s≤xi:
f(x1,…,xn)>0⇒f(x1,…,xi−1,y,xi+1,…,xn)=1
定理4.1:设f是An上的s-压缩分数族,满足∣f∣≤sn,h是与f同权重的分数Hamming球,则∣Δf∣≥∣Δh∣。
证明策略:
- 归纳基础:n=1时直接验证
- 层分解:将f分解为fx(x1,…,xn−1)=f(x1,…,xn−1,x)
- 构造对比族:构造分数族g,各层都是分数Hamming球
- 分情况讨论:
- 情况1:gs权重较小,利用最后坐标删除的下界
- 情况2:gs权重适中,利用非最后坐标删除的下界和归纳假设
- 情况3:处理边界情况
- 优化分析:将问题转化为关于权重分布的优化问题
本文为纯理论数学论文,不包含数值实验。所有结果均通过严格的数学证明获得。
定理1.2(主要结果):对于任意s≤r,k≤n,族F包含[s]n中符号s最多出现k次的所有单词,则在[r]n的所有同大小族中,F具有最小删除影子。
- 通过离散Loomis-Whitney不等式验证了[s]n型族的最优性
- 证明了分数Hamming球在约束条件下的最优性
- 建立了离散结果与分数结果之间的联系
- 密度提升:每对(sn,(s+1)n)之间提供n−1个新的已知最优大小
- 方法普适性:分数技术可能适用于其他极值组合问题
- 猜想解决:完全解决了Bollobás-Leader猜想
- Kruskal-Katona定理:子集系统影子问题的经典结果
- Danh-Daykin工作:将影子问题推广到单词删除,建立了二元字母表的完整理论
- Leck的不可能性结果:证明了大字母表情况下不存在完全的排序解
- Bollobás-Leader分数技术:在等周不等式和分数集合系统中的应用
- 突破:绕过Leck的不可能性结果,在受限设置下给出精确解
- 创新:首次将分数技术系统性应用于删除影子问题
- 完善:显著扩展了已知最优族的密度
- 证明了特定形式的族(分数Hamming球对应的离散族)在给定大小下具有最小删除影子
- 建立了处理删除影子问题的分数技术框架
- 解决了Bollobás-Leader关于最优族结构的猜想
- 覆盖范围:仍有许多中间大小的最优族结构未知
- 计算复杂度:未讨论寻找最优族的算法复杂度
- 推广性:分数技术在其他影子问题中的适用性需要进一步验证
论文提出了两个重要的后续问题:
- 扩展猜想:是否可以考虑更复杂的多层结构族
- 签名排序猜想:基于字典序签名的更一般最优性猜想
- 理论深度:巧妙地通过分数技术绕过了已知的不可能性结果
- 技术创新:s-压缩概念和分数Hamming球的引入具有独创性
- 证明完整性:归纳证明结构清晰,各种情况处理细致
- 问题解决:完全解决了一个重要的开放猜想
- 实用性:纯理论结果,直接应用场景有限
- 计算方面:未涉及算法实现和复杂度分析
- 推广性:技术的普适性仍需验证
- 理论贡献:为极值组合学提供了新的技术工具
- 方法价值:分数技术可能启发其他相关问题的解决
- 完整性:显著推进了删除影子问题理论的完善
- 编码理论:错误纠正码的设计和分析
- 信息论:信道容量和编码效率问题
- 理论计算机科学:复杂度理论中的组合结构分析
论文引用了该领域的关键文献,包括:
- Danh和Daykin的开创性工作3,4,5
- Leck的不可能性结果6
- Bollobás和Leader的分数技术1,2
- 离散Loomis-Whitney不等式7
- 相关影子问题研究8
总体评价:这是一篇高质量的理论数学论文,通过创新的分数技术解决了删除影子问题中的一个重要开放问题。技术方法新颖,证明严谨,对组合数学理论有重要贡献。虽然直接应用有限,但所开发的技术框架具有较高的理论价值和潜在的推广意义。