In this paper, we introduce a class of functions that assume only a limited number $λ$ of values within a given Hamming $Ï$-ball and call them locally $(Ï, λ)$-bounded functions. We develop function-correcting codes (FCCs) for a subclass of these functions and propose an upper bound on the redundancy of FCCs. The bound is based on the minimum length of an error-correcting code with a given number of codewords and a minimum distance. Furthermore, we provide a sufficient optimality condition for FCCs when $λ= 4$. We also demonstrate that any function can be represented as a locally $(Ï, λ)$-bounded function, illustrating this with a representation of Hamming weight distribution functions. Furthermore, we present another construction of function-correcting codes for Hamming weight distribution functions.
論文ID : 2504.07804タイトル : Function-Correcting Codes for Locally Bounded Functions著者 : Charul Rajput, B. Sundar Rajan, Ragnar Freij-Hollanti, Camilla Hollanti所属機関 : Aalto University (Finland), Indian Institute of Science (India)分類 : cs.IT, math.IT (情報理論)発表日時 : 2025年11月12日 (arXiv v3)論文リンク : https://arxiv.org/abs/2504.07804 本論文は、与えられたハミング ρ-球内で有限個のλ個の値のみを取る関数の新しいクラス——局所(ρ, λ)-有界関数を導入する。著者らは、このクラスの部分集合に対して関数訂正符号(FCC)を開発し、最小符号長に基づく冗長度の上界を提案する。特にλ=4の場合、十分な最適性条件を与える。論文はまた、任意の関数が局所(ρ, λ)-有界関数として表現可能であることを証明し、ハミング重み分布関数を例として示し、その関数に対する別のFCC構成方法を提供する。
データ伝送と保存の過程において、従来の誤り訂正符号(ECC)は、メッセージベクトル全体を誤りから保護することに注力している。しかし、多くの実際のシナリオでは、受信者は完全なメッセージではなく、メッセージの特定の属性または関数値(機械学習出力、ハミング重みなど)のみに関心がある。関数訂正符号(FCC)は、この問題を解決するために設計されたものである。
効率向上 :メッセージが大きいが関数出力が小さい場合、関数値の保護はメッセージ全体の保護より効率的である実際の応用 :アーカイブデータ保存、機械学習アルゴリズム出力保護、文脈認識耐性などのシナリオで重要な価値を持つ理論的意義 :FCCは情報理論に新しい研究視点を提供し、符号理論と関数保護を結びつけるLenzら1 が最初にFCC理論を提案し、局所二値関数、ハミング重み関数などの特定の関数族に対して符号を設計した 既存の研究は主に特定の関数クラスに集中しており、統一的な理論的枠組みが不足している 一般的な関数の冗長度界限に関する研究が十分ではない 最適性条件の特性化が不完全である 本論文は局所二値関数を局所(ρ, λ)-有界関数というより一般的な枠組みに推広し、より広範な関数クラスに対して系統的なFCC構成方法と理論的分析を提供する。
理論的枠組みの拡張 :局所二値関数を局所(ρ, λ)-有界関数に推広し、より一般的な関数分類体系を提供する冗長度上界 :局所(2t, 4)-有界関数に対して、rf(k,t) ≤ 3tを証明 一般的な局所(2t, λ)-有界関数に対して、rf(k,t) ≤ N(λ, 2t)を証明 最適性条件 :λ=4のときFCCが最適に達する十分条件を与える(定理5)関数表現定理 :任意の関数が局所(ρ, λ)-有界関数として表現可能であることを証明し、ハミング重み分布関数を具体的に分析する構成方法 :着色写像と誤り訂正符号に基づく系統的なFCC構成方法を提供する応用例 :ハミング重み分布関数に対して簡潔な最適構成を与える関数訂正符号(f, t)-FCC :関数f: F₂ᵏ → Sが与えられたとき、系統符号C: F₂ᵏ → F₂ᵏ⁺ʳは、任意のu₁, u₂ ∈ F₂ᵏに対してf(u₁) ≠ f(u₂)のとき、以下を満たす場合(f, t)-FCCと呼ばれる:
d ( C ( u 1 ) , C ( u 2 ) ) ≥ 2 t + 1 d(C(u_1), C(u_2)) \geq 2t+1 d ( C ( u 1 ) , C ( u 2 )) ≥ 2 t + 1
ここでdはハミング距離を表す。これにより、t個のビット誤り後も関数値f(u)を正しく復元できることが保証される。
最適冗長度 :rf(k,t)は、(f, t)-FCCが存在するときの符号C: F₂ᵏ → F₂ᵏ⁺ʳの最小冗長度rとして定義される。
定義(関数球) :関数f: F₂ᵏ → Sのu ∈ F₂ᵏにおける半径ρの関数球は以下のように定義される:
B f ( u , ρ ) = { f ( u ′ ) ∣ u ′ ∈ F 2 k and d ( u , u ′ ) ≤ ρ } B_f(u, \rho) = \{f(u') | u' \in \mathbb{F}_2^k \text{ and } d(u, u') \leq \rho\} B f ( u , ρ ) = { f ( u ′ ) ∣ u ′ ∈ F 2 k and d ( u , u ′ ) ≤ ρ }
定義(局所(ρ, λ)-有界関数) :すべてのu ∈ F₂ᵏに対して|Bf(u, ρ)| ≤ λを満たす場合、fを局所(ρ, λ)-有界関数と呼ぶ。
連続性条件 :Im(f)上に全順序≺が存在し、各Bf(u, ρ)が連続ブロック(contiguous block)を形成すると仮定する。
補題1 の核心的思想:連続性条件を満たす局所(ρ, λ)-有界関数に対して、写像Colf: F₂ᵏ → λ が存在し、d(u,v) ≤ ρかつf(u) ≠ f(v)のすべてのu,vに対してColf(u) ≠ Colf(v)を満たす。
構成方法 :
Im(f) = {y₀ ≺ y₁ ≺ ... ≺ yₑ₋₁}とする γ: Im(f) → λ を定義し、γ(yⱼ) = 1 + (j mod λ)(循環着色) Colf(u) = γ(f(u))を定義 各関数球は大きさ≤λの連続ブロックであるため、循環着色はその上で単射であり、分離性質を保証する。
符号化関数 :Enc(u) = (u, uₚ)、ここでuₚ = (u'ₚ)ᵗ、かつ
u p ′ = { 000 if C o l f ( u ) = 1 110 if C o l f ( u ) = 2 101 if C o l f ( u ) = 3 011 if C o l f ( u ) = 4 u'_p = \begin{cases}
000 & \text{if } Col_f(u) = 1\\
110 & \text{if } Col_f(u) = 2\\
101 & \text{if } Col_f(u) = 3\\
011 & \text{if } Col_f(u) = 4
\end{cases} u p ′ = ⎩ ⎨ ⎧ 000 110 101 011 if C o l f ( u ) = 1 if C o l f ( u ) = 2 if C o l f ( u ) = 3 if C o l f ( u ) = 4
正確性の証明 :
ケース1 :d(u,v) ≥ 2t+1のとき、直接的にd(Enc(u), Enc(v)) ≥ 2t+1を満たすケース2 :d(u,v) ≤ 2tのとき、Colf性質によりColf(u) ≠ Colf(v)であり、したがってd(u'ₚ, v'ₚ) = 2、つまりd(uₚ, vₚ) = 2t。d(u,v) ≥ 1と合わせて、総距離≥2t+1冗長度 :rf(k,t) ≤ 3t
符号化関数 :λ個の符号語、最小距離2t、長さN(λ, 2t)を持つ二元誤り訂正符号Cを使用する。符号語をC₁, C₂, ..., Cλとして定義:
E n c ( u ) = ( u , u p ) , u p = C C o l f ( u ) Enc(u) = (u, u_p), \quad u_p = C_{Col_f(u)} E n c ( u ) = ( u , u p ) , u p = C C o l f ( u )
冗長度上界 :rf(k,t) ≤ N(λ, 2t)
主要な技術的ポイント :
着色写像を使用して関数値を有限集合λ にマッピング ECCを通じて異なる色に対応する冗長ビットが十分な距離を持つことを保証 情報ビット距離と冗長ビット距離を巧妙に結合 ∆ₜ(u) = ⌊wt(u)/T⌋に対して、(4t)/(m-1) ≥ T > (4t)/mのとき:
符号化関数 :a = ⌈m/2⌉ + 1とし、a個の符号語、最小距離2tのECC Cを使用して定義:
E n c ( u ) = ( u , u p ) , u p = C Δ T ( u ) m o d a Enc(u) = (u, u_p), \quad u_p = C_{\Delta_T(u) \mod a} E n c ( u ) = ( u , u p ) , u p = C Δ T ( u ) mod a
冗長度上界 :r∆ₜ(k,t) ≤ N(⌈m/2⌉ + 1, 2t)
特に、t ≥ T > 2t/3のとき、r∆ₜ(k,t) ≤ 3t。
統一的枠組み :局所有界性と連続性条件を通じて、複数の関数クラスを一つの枠組みに統一着色技術 :循環着色方法を創新的に使用し、関数値マッピング問題を組合せ着色問題に変換モジュール化設計 :FCC構成を着色写像とECCの2つの独立したモジュールに分解し、柔軟性を向上理論と構成の結合 :上界を与えるだけでなく、上界に達する明示的な構成を提供パラメータ最適化 :異なるパラメータ範囲に対して精細な界限分析を提供本論文は純粋な理論的研究であり、従来の意味での実験は含まない。主に数学的証明と理論的分析を通じて方法の有効性を検証する。
構成的証明 :条件を満たす符号化関数を明示的に構成することにより、冗長度上界の達成可能性を証明下界分析 :Plotkin界と距離要求行列理論を使用して冗長度下界を確立最適性検証 :上界と下界を一致させることにより、特定のパラメータ下での構成の最適性を証明具体的な関数f: F₂² → {0,1}を通じてDRMとFDMの計算プロセスを示し、理論的枠組みの操作可能性を検証。
連続性条件を満たす具体的な関数を示す:
f ( u ) = 0 k − w t ( u ) 1 w t ( u ) f(u) = 0^{k-wt(u)}1^{wt(u)} f ( u ) = 0 k − wt ( u ) 1 wt ( u )
その関数球Bf(u, ρ) = {0ᵏ⁻ʲ1ʲ : j ∈ Wu,ρ}が連続ブロックを形成することを証明。
定理6 :局所(2t, λ)-有界関数に対して、
r f ( k , t ) ≤ N ( λ , 2 t ) r_f(k,t) \leq N(\lambda, 2t) r f ( k , t ) ≤ N ( λ , 2 t )
補題3 :N(4, 2t) = 3t(精確な値)
推論 :局所(2t, 4)-有界関数に対して、rf(k,t) ≤ 3t
定理5 :局所(2t, 4)-有界関数に対して、|Im(f)| ≥ 3であり、u₁, u₂, u₃が以下を満たす場合:
f(ui) ≠ f(uj) (i ≠ j) d(u₁, u₂) = 1, d(u₃, u₁) = 1, d(u₃, u₂) = 2 ならばrf(k,t) = 3tは最適である。
証明の思路 :Plotkin界から下界rf(k,t) ≥ 3tを得、上界と結合して緊密性を得る。
定理7 :∆ₜは局所(2t, ⌊4t/T⌋ + 2)-有界関数
推論 :
T > 4t:∆ₜは2t-局所二値関数 4t ≥ T > 2t:∆ₜは局所(2t, 3)-有界関数 t ≥ T > 2t/3:r∆ₜ(k,t) ≤ 3t 系2 :ハミング重み関数は局所(2t, 4t+2)-有界関数
関数タイプ λ値 冗長度上界 最適性 2t-局所二値 2 2t 最適1 局所(2t,3) 3 N(3,2t) - 局所(2t,4) 4 3t 条件付き最適 一般的な局所(2t,λ) λ N(λ,2t) -
普遍性 :任意の関数f: F₂ᵏ → Sは局所(ρ, λ)-有界関数として表現可能であり、λ = max_{u∈F₂ᵏ} |Bf(u, ρ)|パラメータ関係 :ハミング重み分布関数に対して、λと閾値Tは反比例関係:Tが大きいほど、λが小さく、符号化効率が高い符号長関係 :N(4, 2t) = 3tの精確な結果がλ=4の場合に理論的保証を提供連続性の重要性 :連続性条件は構成方法の鍵となる仮定であり、着色写像の有効性を保証Lenzら1 (2023) :FCC理論的枠組みを最初に系統的に提案
距離要求行列(DRM)と関数距離行列(FDM)を定義 局所二値関数、ハミング重み関数に対する構成を提供 基本的な上下界理論を確立 Xiaら12 (2024) :シンボル対読み取りチャネルに拡張
関数訂正シンボル対符号(FCSPCs)を提案 特定のチャネルモデルに対して最適化 Premlal & Rajan 13 (2025) :冗長度下界研究
FCC冗長度の一般的な下界を提供 線形関数の場合の緊密性を証明 Geら14 (2025) :ハミング重み関数最適化
ハミング重み関数の冗長度界を改善 下界に達する最適構成を提供 Singhら15 (2025) :b-シンボル読み取りチャネル
有限体上のb-シンボル読み取りチャネルに拡張 不規則b-シンボル距離符号を導入 理論的普遍性 :統一的な局所有界関数枠組みを提供し、より広範な関数クラスをカバー構成の系統性 :着色写像に基づく構成方法はモジュール化と拡張可能性を持つパラメータの精細化 :異なるλ値に対して精確な冗長度界限を提供応用の柔軟性 :任意の関数がこの枠組みに含まれることを証明し、理論の適用可能性を強化理論的枠組み :局所(ρ, λ)-有界関数の理論体系を成功裏に確立し、局所二値関数の概念を推広冗長度界 :連続性条件を満たす局所(2t, λ)-有界関数に対して、rf(k,t) ≤ N(λ, 2t)を証明。特にλ=4のときrf(k,t) ≤ 3t最適性 :λ=4の場合に最適に達する十分条件を与え、N(4, 2t) = 3tを証明普遍性 :任意の関数が局所(ρ, λ)-有界関数として表現可能であることを証明し、FCCの適用範囲を拡大応用例 :ハミング重み分布関数に対して簡潔な最適構成を提供連続性仮定 :すべての構成は関数球が連続ブロックを形成するという仮定に依存し、適用範囲を制限すべての局所有界関数がこの条件を満たすわけではない 連続性を満たさない関数に対しては方法が適用不可 二元体の制限 :現在の理論はF₂ᵏのみを対象とし、一般的な有限体Fqᵏへの拡張はまだ完了していない最適性条件 :λ=4の場合のみ十分条件を与え、他のλ値の最適性特性化は不完全ECC依存性 :冗長度上界はN(λ, 2t)の存在性に依存し、最適ECCの構成自体が困難な問題実用性検証 :実際の応用シナリオにおけるパフォーマンス評価と複雑度分析が不足有限体拡張 :理論を一般的な有限体Fqᵏに推広(著者が進行中と言及)連続性の緩和 :連続性条件を満たさない局所有界関数のFCC構成を研究最適性の完全特性化 :一般的なλ値の場合の必要十分最適性条件を与える計算複雑度 :符号化と復号化アルゴリズムの計算複雑度を分析実際の応用 :機械学習、データ保存などの実際のシナリオで方法の有効性を検証非系統符号 :非系統FCCがさらに冗長度を低減できるかを研究概念推広 :局所二値関数から局所(ρ, λ)-有界関数への推広は自然で意味がある統一的枠組み :複数の関数クラスを処理するための統一的視点を提供技術的新規性 :着色写像方法は関数保護問題を組合せ問題に巧妙に変換すべての定理に完全で厳密な証明がある 論理的連鎖が明確で、基本概念から主要結果へと段階的に進行 組合せ論、符号理論の複数のツールを使用 上界と最適性条件を提供 明示的な構成方法を与える 具体的な関数クラスを通じて理論を検証 下界の系統的研究が不足(主に既存結果に依存) 構造が明確で、予備知識から主要結果へと合理的に組織 具体的な例を通じて抽象的な概念を理解するのに役立つ 記号体系が一貫し、定義が明確 連続性仮定 :補題1および後続のすべての構成は関数球が連続ブロックを形成するという仮定に依存。例4は条件を満たす関数を示しているが:
どの関数がこの条件を満たすかが系統的に特性化されていない 条件を満たさない関数に対する代替案がない 連続性検証の複雑度が議論されていない 最適性条件 :定理5はλ=4の十分条件のみを与え、λ>4の場合に類似の結果がない下界研究 :主に既存のPlotkin界を使用し、局所有界関数に特化した下界が不足パラメータ最適化 :N(λ, 2t)の精確な値はλ=4の場合のみ与えられ、他の場合はECC理論に依存計算複雑度 :符号化と復号化の時間複雑度が分析されていない実際の応用 :具体的な応用シナリオ(データ保存、機械学習など)でのパフォーマンス評価が不足ECCとの比較 :注釈1はFCCがECCより優れていることを指摘しているが、定量的比較が不足着色写像 :循環着色が最適か?他の着色スキームが存在するか?ECC選択 :N(λ, 2t)を最小化するための適切なECC選択方法は?パラメータ依存性 :冗長度のk(情報長)への依存関係が明確でない理論的拡張 :FCC理論に重要な推広を提供し、局所二値関数と一般関数の間のギャップを埋める方法論 :着色写像方法は後続研究に新しいツールを提供応用の可能性 :任意の関数が局所有界関数として表現可能であることを証明し、FCCの適用範囲を拡大理論指向 :現在は主に理論的貢献であり、実際の応用にはさらなる研究が必要構成の実現可能性 :提供された構成方法は直接実装可能で、実用的基礎を持つパラメータの柔軟性 :異なるλ値は異なる応用シナリオに対応し、設計の柔軟性を提供すべての構成に明示的なアルゴリズムがある 証明は完全で独立して検証可能 例は具体的で理解と実装が容易 関数特性 :関数球が連続ブロックを形成(ハミング重み分布関数など)パラメータ範囲 :λが小さい(λ≤4など)場合、緊密な界が得られる応用要件 :完全なメッセージではなく関数値のみを保護する必要があるデータ保存 :アーカイブデータのメタデータ保護(ファイルサイズ、チェックサムなど)機械学習 :分類結果、信頼度などの出力保護分散計算 :中間計算結果の関数値保護IoT :センサデータの統計量保護関数球が連続ブロックを形成しない 完全なメッセージの保護が必要(この場合ECCがより適切) λが非常に大きい(|Im(f)|に近い)場合、FCC優位性が明白でない 1 A. Lenz, R. Bitar, A. Wachter-Zeh, and E. Yaakobi, "Function-correcting codes," IEEE Trans. Inf. Theory, 2023.
13 R. Premlal and B. S. Rajan, "On function-correcting codes," IEEE Trans. Inf. Theory, 2025.
14 G. Ge, Z. Xu, X. Zhang, and Y. Zhang, "Optimal redundancy of function-correcting codes," arXiv preprint, 2025.
17 M. Plotkin, "Binary codes with specified minimum distance," IRE Trans. Inf. Theory, 1960.
理論的革新性 : ★★★★★技術的深さ : ★★★★☆実用的価値 : ★★★☆☆執筆品質 : ★★★★★総合評価 : ★★★★☆これは符号理論分野における高品質な理論的論文である。局所有界関数枠組みの提案と着色写像方法の応用は両方とも革新的である。実用性検証と理論的完全性の面でさらに改善の余地があるが、基礎理論研究として、本論文は後続研究のための堅実な基礎を築いている。特に符号理論と情報理論に関心のある研究者に適している。