In this paper, we introduce a class of functions that assume only a limited number $λ$ of values within a given Hamming $Ï$-ball and call them locally $(Ï, λ)$-bounded functions. We develop function-correcting codes (FCCs) for a subclass of these functions and propose an upper bound on the redundancy of FCCs. The bound is based on the minimum length of an error-correcting code with a given number of codewords and a minimum distance. Furthermore, we provide a sufficient optimality condition for FCCs when $λ= 4$. We also demonstrate that any function can be represented as a locally $(Ï, λ)$-bounded function, illustrating this with a representation of Hamming weight distribution functions. Furthermore, we present another construction of function-correcting codes for Hamming weight distribution functions.
논문 ID : 2504.07804제목 : Function-Correcting Codes for Locally Bounded Functions저자 : Charul Rajput, B. Sundar Rajan, Ragnar Freij-Hollanti, Camilla Hollanti기관 : Aalto University (Finland), Indian Institute of Science (India)분류 : cs.IT, math.IT (정보 이론)발표 시간 : 2025년 11월 12일 (arXiv v3)논문 링크 : https://arxiv.org/abs/2504.07804 본 논문은 국소(ρ, λ)-유계 함수라는 새로운 함수 클래스를 소개한다. 이 함수들은 주어진 Hamming ρ-구 내에서 최대 λ개의 값만을 취한다. 저자들은 이 함수 클래스의 부분집합에 대해 함수-정정 부호(FCCs)를 개발하고, 최소 부호 길이에 기반한 중복도의 상한을 제시한다. 특히 λ=4일 때 충분한 최적성 조건을 제공한다. 논문은 임의의 함수가 국소(ρ, λ)-유계 함수로 표현될 수 있음을 증명하고, Hamming 무게 분포 함수를 예시로 들어 설명하며, 해당 함수에 대한 다른 FCC 구성 방법을 제공한다.
데이터 전송 및 저장 과정에서 전통적인 오류 정정 부호(ECCs)는 전체 메시지 벡터를 오류로부터 보호하는 데 중점을 둔다. 그러나 많은 실제 상황에서 수신자는 메시지의 특정 속성이나 함수값(예: 기계학습 출력, Hamming 무게 등)에만 관심이 있으며, 완전한 메시지에는 관심이 없다. 함수-정정 부호(FCCs)는 이러한 문제를 해결하기 위해 설계되었다.
효율성 향상 : 메시지는 크지만 함수 출력이 작을 때, 함수값 보호가 전체 메시지 보호보다 더 효율적이다실제 응용 : 아카이브 데이터 저장, 기계학습 알고리즘 출력 보호, 상황 인식 복원력 등의 분야에서 중요한 가치를 가진다이론적 의의 : FCCs는 정보 이론에 새로운 연구 관점을 제공하며, 부호 이론과 함수 보호를 연결한다Lenz 등1 이 처음 FCC 이론을 제시했으며, 국소 이진 함수, Hamming 무게 함수 등 특정 함수족에 대한 부호를 설계했다 기존 연구는 주로 특정 함수 범주에 집중되어 있으며, 통일된 이론 체계가 부족하다 일반 함수의 중복도 한계에 대한 연구가 충분하지 않다 최적성 조건의 특성화가 불완전하다 본 논문은 국소 이진 함수를 국소(ρ, λ)-유계 함수라는 더 일반적인 프레임워크로 확장하여, 더 광범위한 함수 클래스에 대해 체계적인 FCC 구성 방법과 이론적 분석을 제공한다.
이론 프레임워크 확장 : 국소 이진 함수를 국소(ρ, λ)-유계 함수로 일반화하여 더 광범위한 함수 분류 체계를 제공한다중복도 상한 :국소(2t, 4)-유계 함수에 대해 rf(k,t) ≤ 3t를 증명한다 일반 국소(2t, λ)-유계 함수에 대해 rf(k,t) ≤ N(λ, 2t)를 증명한다 최적성 조건 : λ=4일 때 FCC가 최적에 도달하기 위한 충분 조건을 제시한다(정리 5)함수 표현 정리 : 임의의 함수가 국소(ρ, λ)-유계 함수로 표현될 수 있음을 증명하고, Hamming 무게 분포 함수를 구체적으로 분석한다구성 방법 : 색칠 매핑과 오류 정정 부호에 기반한 체계적인 FCC 구성 방법을 제공한다응용 사례 : Hamming 무게 분포 함수에 대해 간결한 최적 구성을 제시한다함수-정정 부호(f, t)-FCC : 함수 f: F₂ᵏ → S가 주어졌을 때, 시스템 부호 C: F₂ᵏ → F₂ᵏ⁺ʳ는 임의의 u₁, u₂ ∈ F₂ᵏ에 대해 f(u₁) ≠ f(u₂)일 때 다음을 만족하면 (f, t)-FCC라 한다:
d ( C ( u 1 ) , C ( u 2 ) ) ≥ 2 t + 1 d(C(u_1), C(u_2)) \geq 2t+1 d ( C ( u 1 ) , C ( u 2 )) ≥ 2 t + 1
여기서 d는 Hamming 거리를 나타낸다. 이는 t개의 비트 오류 후에도 함수값 f(u)를 올바르게 복구할 수 있음을 보장한다.
최적 중복도 : rf(k,t)는 (f, t)-FCC가 존재할 때 부호 C: F₂ᵏ → F₂ᵏ⁺ʳ의 최소 중복도 r로 정의된다.
정의(함수 구) : 함수 f: F₂ᵏ → S의 u ∈ F₂ᵏ에서 반지름 ρ인 함수 구는 다음과 같이 정의된다:
B f ( u , ρ ) = { f ( u ′ ) ∣ u ′ ∈ F 2 k and d ( u , u ′ ) ≤ ρ } B_f(u, \rho) = \{f(u') | u' \in \mathbb{F}_2^k \text{ and } d(u, u') \leq \rho\} B f ( u , ρ ) = { f ( u ′ ) ∣ u ′ ∈ F 2 k and d ( u , u ′ ) ≤ ρ }
정의(국소(ρ, λ)-유계 함수) : 모든 u ∈ F₂ᵏ에 대해 |Bf(u, ρ)| ≤ λ를 만족하면, f를 국소(ρ, λ)-유계 함수라 한다.
연속성 조건 : Im(f) 위의 전순서 ≺가 존재하여 각 Bf(u, ρ)가 연속 블록(contiguous block)을 형성한다고 가정한다.
보조정리 1 의 핵심 아이디어: 연속성 조건을 만족하는 국소(ρ, λ)-유계 함수에 대해, 매핑 Colf: F₂ᵏ → λ 가 존재하여 d(u,v) ≤ ρ이고 f(u) ≠ f(v)인 모든 u,v에 대해 Colf(u) ≠ Colf(v)를 만족한다.
구성 방법 :
Im(f) = {y₀ ≺ y₁ ≺ ... ≺ yₑ₋₁}로 설정 매핑 γ: Im(f) → λ , γ(yⱼ) = 1 + (j mod λ) 정의(순환 색칠) Colf(u) = γ(f(u)) 정의 각 함수 구가 크기 ≤λ인 연속 블록이므로, 순환 색칠은 그 위에서 단사 함수이며, 따라서 분리 성질을 보장한다.
부호 함수 : Enc(u) = (u, uₚ), 여기서 uₚ = (u'ₚ)ᵗ이고,
u p ′ = { 000 if C o l f ( u ) = 1 110 if C o l f ( u ) = 2 101 if C o l f ( u ) = 3 011 if C o l f ( u ) = 4 u'_p = \begin{cases}
000 & \text{if } Col_f(u) = 1\\
110 & \text{if } Col_f(u) = 2\\
101 & \text{if } Col_f(u) = 3\\
011 & \text{if } Col_f(u) = 4
\end{cases} u p ′ = ⎩ ⎨ ⎧ 000 110 101 011 if C o l f ( u ) = 1 if C o l f ( u ) = 2 if C o l f ( u ) = 3 if C o l f ( u ) = 4
정확성 증명 :
경우 1 : d(u,v) ≥ 2t+1일 때, 직접적으로 d(Enc(u), Enc(v)) ≥ 2t+1을 만족한다경우 2 : d(u,v) ≤ 2t일 때, Colf 성질에 의해 Colf(u) ≠ Colf(v)이므로 d(u'ₚ, v'ₚ) = 2이고, 따라서 d(uₚ, vₚ) = 2t이다. d(u,v) ≥ 1과 함께 총 거리는 ≥2t+1이다중복도 : rf(k,t) ≤ 3t
부호 함수 : λ개의 부호어, 최소 거리 2t, 길이 N(λ, 2t)를 가진 이진 오류 정정 부호 C를 사용한다. 부호어를 C₁, C₂, ..., Cλ라 하면:
E n c ( u ) = ( u , u p ) , u p = C C o l f ( u ) Enc(u) = (u, u_p), \quad u_p = C_{Col_f(u)} E n c ( u ) = ( u , u p ) , u p = C C o l f ( u )
중복도 상한 : rf(k,t) ≤ N(λ, 2t)
핵심 기술 포인트 :
색칠 매핑을 사용하여 함수값을 유한 집합 λ 로 매핑한다 ECC를 통해 서로 다른 색에 해당하는 중복 비트가 충분한 거리를 가지도록 보장한다 정보 비트 거리와 중복 비트 거리를 교묘하게 결합한다 ∆ₜ(u) = ⌊wt(u)/T⌋에 대해, (4t)/(m-1) ≥ T > (4t)/m일 때:
부호 함수 : a = ⌈m/2⌉ + 1개의 부호어, 최소 거리 2t를 가진 ECC C를 사용하여:
E n c ( u ) = ( u , u p ) , u p = C Δ T ( u ) m o d a Enc(u) = (u, u_p), \quad u_p = C_{\Delta_T(u) \mod a} E n c ( u ) = ( u , u p ) , u p = C Δ T ( u ) mod a
중복도 상한 : r∆ₜ(k,t) ≤ N(⌈m/2⌉ + 1, 2t)
특히 t ≥ T > 2t/3일 때, r∆ₜ(k,t) ≤ 3t이다.
통일된 프레임워크 : 국소 유계성과 연속성 조건을 통해 여러 함수 범주를 하나의 프레임워크로 통합한다색칠 기술 : 순환 색칠 방법을 창의적으로 사용하여 함수값 매핑 문제를 조합론적 색칠 문제로 변환한다모듈식 설계 : FCC 구성을 색칠 매핑과 ECC 두 개의 독립적인 모듈로 분해하여 유연성을 높인다이론과 구성의 결합 : 상한을 제시할 뿐만 아니라 상한에 도달하는 명시적 구성을 제공한다매개변수 최적화 : 서로 다른 매개변수 범위에 대해 정밀한 한계 분석을 제공한다본 논문은 순수 이론 연구로, 전통적 의미의 실험을 포함하지 않는다. 주로 수학적 증명과 이론적 분석을 통해 방법의 유효성을 검증한다.
구성적 증명 : 조건을 만족하는 부호 함수를 명시적으로 구성하여 중복도 상한의 달성 가능성을 증명한다하한 분석 : Plotkin 한계와 거리 요구 행렬 이론을 사용하여 중복도 하한을 설정한다최적성 검증 : 상한과 하한을 일치시켜 특정 매개변수에서 구성의 최적성을 증명한다구체적인 함수 f: F₂² → {0,1}을 통해 DRM과 FDM의 계산 과정을 보여주며, 이론 프레임워크의 실행 가능성을 검증한다.
연속성 조건을 만족하는 구체적인 함수를 보여준다:
f ( u ) = 0 k − w t ( u ) 1 w t ( u ) f(u) = 0^{k-wt(u)}1^{wt(u)} f ( u ) = 0 k − wt ( u ) 1 wt ( u )
함수 구 Bf(u, ρ) = {0ᵏ⁻ʲ1ʲ : j ∈ Wu,ρ}이 연속 블록을 형성함을 증명한다.
정리 6 : 국소(2t, λ)-유계 함수에 대해,
r f ( k , t ) ≤ N ( λ , 2 t ) r_f(k,t) \leq N(\lambda, 2t) r f ( k , t ) ≤ N ( λ , 2 t )
보조정리 3 : N(4, 2t) = 3t (정확한 값)
추론 : 국소(2t, 4)-유계 함수에 대해, rf(k,t) ≤ 3t
정리 5 : 국소(2t, 4)-유계 함수에 대해, |Im(f)| ≥ 3이고 다음을 만족하는 u₁, u₂, u₃가 존재하면:
f(ui) ≠ f(uj) (i ≠ j) d(u₁, u₂) = 1, d(u₃, u₁) = 1, d(u₃, u₂) = 2 rf(k,t) = 3t가 최적이다.
증명 전략 : Plotkin 한계로부터 하한 rf(k,t) ≥ 3t를 얻고, 상한과 결합하여 타이트성을 얻는다.
정리 7 : ∆ₜ는 국소(2t, ⌊4t/T⌋ + 2)-유계 함수이다
추론 :
T > 4t: ∆ₜ는 2t-국소 이진 함수이다 4t ≥ T > 2t: ∆ₜ는 국소(2t, 3)-유계 함수이다 t ≥ T > 2t/3: r∆ₜ(k,t) ≤ 3t 따름정리 2 : Hamming 무게 함수는 국소(2t, 4t+2)-유계 함수이다
함수 유형 λ값 중복도 상한 최적성 2t-국소 이진 2 2t 최적1 국소(2t,3) 3 N(3,2t) - 국소(2t,4) 4 3t 조건부 최적 일반 국소(2t,λ) λ N(λ,2t) -
보편성 : 임의의 함수 f: F₂ᵏ → S는 국소(ρ, λ)-유계 함수로 표현될 수 있으며, 여기서 λ = max_{u∈F₂ᵏ} |Bf(u, ρ)|이다매개변수 관계 : Hamming 무게 분포 함수의 경우, λ는 임계값 T와 반비례 관계를 가진다. T가 클수록 λ는 작아지고 부호 효율이 높아진다부호 길이 관계 : N(4, 2t) = 3t의 정확한 결과는 λ=4 경우에 대한 이론적 보장을 제공한다연속성의 중요성 : 연속성 조건은 구성 방법의 핵심 가정이며, 색칠 매핑의 유효성을 보장한다Lenz et al. 1 (2023) : FCC 이론 프레임워크를 처음 체계적으로 제시
거리 요구 행렬(DRM)과 함수 거리 행렬(FDM) 정의 국소 이진 함수, Hamming 무게 함수에 대한 구성 제시 기본 상한 및 하한 이론 수립 Xia et al. 12 (2024) : 기호 쌍 읽기 채널로 확장
함수 정정 기호 쌍 부호(FCSPCs) 제시 특정 채널 모델에 대한 최적화 Premlal & Rajan 13 (2025) : 중복도 하한 연구
FCC 중복도의 일반 하한 제공 선형 함수 경우의 타이트성 증명 Ge et al. 14 (2025) : Hamming 무게 함수 최적화
Hamming 무게 함수의 중복도 한계 개선 하한에 도달하는 최적 구성 제공 Singh et al. 15 (2025) : b-기호 읽기 채널
유한체 위의 b-기호 읽기 채널로 확장 불규칙 b-기호 거리 부호 도입 이론적 보편성 : 통일된 국소 유계 함수 프레임워크를 제공하여 더 광범위한 함수 범주를 포함한다구성의 체계성 : 색칠 매핑 기반 구성 방법은 모듈식이고 확장 가능하다매개변수 정밀화 : 서로 다른 λ값에 대해 정확한 중복도 한계를 제공한다응용 유연성 : 임의의 함수가 해당 프레임워크에 포함될 수 있음을 증명하여 이론의 적용성을 강화한다이론 프레임워크 : 국소(ρ, λ)-유계 함수의 이론 체계를 성공적으로 수립하여 국소 이진 함수의 개념을 일반화했다중복도 한계 : 연속성 조건을 만족하는 국소(2t, λ)-유계 함수에 대해 rf(k,t) ≤ N(λ, 2t)를 증명했으며, 특히 λ=4일 때 rf(k,t) ≤ 3t이다최적성 : λ=4 경우에 최적에 도달하기 위한 충분 조건을 제시했으며, N(4, 2t) = 3t임을 증명했다보편성 : 임의의 함수가 국소(ρ, λ)-유계 함수로 표현될 수 있음을 증명하여 FCC의 적용 범위를 확대했다응용 사례 : Hamming 무게 분포 함수에 대해 간결한 최적 구성을 제공했다연속성 가정 : 모든 구성이 함수 구가 연속 블록을 형성한다는 가정에 의존하며, 이는 적용 범위를 제한한다모든 국소 유계 함수가 이 조건을 만족하지는 않는다 연속성을 만족하지 않는 함수에 대해서는 방법이 적용되지 않는다 이진체 제한 : 현재 이론은 F₂ᵏ에만 적용되며, 일반 유한체 Fqᵏ로의 확장은 아직 완료되지 않았다최적성 조건 : λ=4일 때만 충분 조건을 제시했으며, 다른 λ값에 대한 최적성 특성화는 불완전하다ECC 의존성 : 중복도 상한이 N(λ, 2t)의 존재성에 의존하며, 최적 ECC의 구성 자체가 어려운 문제이다실용성 검증 : 실제 응용 시나리오에서의 성능 평가 및 복잡도 분석이 부족하다유한체 확장 : 이론을 일반 유한체 Fqᵏ로 확장한다(저자들이 진행 중이라고 언급)연속성 완화 : 연속성 조건을 만족하지 않는 국소 유계 함수의 FCC 구성을 연구한다최적성 완전 특성화 : 일반 λ값에 대한 필요충분 최적성 조건을 제시한다계산 복잡도 : 부호화 및 복호화 알고리즘의 계산 복잡도를 분석한다실제 응용 : 기계학습, 데이터 저장 등 실제 시나리오에서 방법의 유효성을 검증한다비체계 부호 : 비체계 FCC가 중복도를 더욱 감소시킬 수 있는지 연구한다개념 일반화 : 국소 이진 함수에서 국소(ρ, λ)-유계 함수로의 일반화가 자연스럽고 의미 있다통일된 프레임워크 : 여러 함수 범주를 처리하기 위한 통일된 관점을 제공한다기술 참신성 : 색칠 매핑 방법이 함수 보호 문제를 조합론적 문제로 교묘하게 변환한다모든 정리가 완전하고 엄격한 증명을 가지고 있다 논리 연쇄가 명확하며 기본 개념에서 주요 결과까지 단계적으로 진행된다 조합론, 부호 이론의 다양한 도구를 사용한다 상한과 최적성 조건을 제공한다 명시적 구성 방법을 제시한다 구체적인 함수 범주를 통해 이론을 검증한다 하한의 체계적 연구가 부족하다(주로 기존 결과에 의존) 구조가 명확하며 예비 지식에서 주요 결과까지 조직이 합리적이다 구체적인 예제를 통해 추상적 개념을 이해하도록 돕는다 기호 체계가 일관되고 정의가 명확하다 연속성 가정 : 보조정리 1 및 이후의 모든 구성이 함수 구가 연속 블록을 형성한다는 가정에 의존한다. 예제 4가 이 조건을 만족하는 함수를 보여주지만:
어떤 함수가 이 조건을 만족하는지 체계적으로 특성화하지 않는다 조건을 만족하지 않는 함수에 대한 대체 방안이 없다 연속성 검증의 복잡도가 논의되지 않는다 최적성 조건 : 정리 5가 λ=4의 충분 조건만 제시하며, λ>4인 경우 유사한 결과가 없다하한 연구 : 주로 기존 Plotkin 한계를 사용하며, 국소 유계 함수에 특화된 하한이 부족하다매개변수 최적화 : N(λ, 2t)의 정확한 값은 λ=4일 때만 제시되며, 다른 경우는 ECC 이론에 의존한다계산 복잡도 : 부호화 및 복호화의 시간 복잡도가 분석되지 않는다실제 응용 : 데이터 저장, 기계학습 등 구체적 응용 시나리오에서의 성능 평가가 부족하다ECC 비교 : 주석 1이 FCC가 ECC보다 우수함을 언급하지만, 정량적 비교가 부족하다색칠 매핑 : 순환 색칠이 최적인가? 다른 색칠 방식이 존재하는가?ECC 선택 : N(λ, 2t)를 최소화하기 위해 적절한 ECC를 어떻게 선택하는가?매개변수 의존성 : 중복도가 k(정보 길이)에 어떻게 의존하는지 명확하지 않다이론적 확장 : FCC 이론에 중요한 일반화를 제공하여 국소 이진 함수와 일반 함수 사이의 공백을 채운다방법론 : 색칠 매핑 방법이 후속 연구에 새로운 도구를 제공한다응용 잠재력 : 임의의 함수가 국소 유계 함수로 표현될 수 있음을 증명하여 FCC의 적용 범위를 확대한다이론 지향 : 현재는 주로 이론적 기여이며, 실제 응용에는 추가 작업이 필요하다구성 실행 가능 : 제시된 구성 방법은 직접 구현 가능하며 실용적 기초를 가진다매개변수 유연성 : 서로 다른 λ값이 다양한 응용 시나리오에 대응하며 설계 유연성을 제공한다모든 구성이 명시적 알고리즘을 가지고 있다 증명이 완전하여 독립적으로 검증 가능하다 예제가 구체적이어서 이해와 구현이 용이하다 함수 특성 : 함수 구가 연속 블록을 형성한다(예: Hamming 무게 분포 함수)매개변수 범위 : λ가 작다(예: λ≤4), 타이트한 한계를 얻을 수 있다응용 요구 : 완전한 메시지가 아닌 함수값만 보호하면 된다데이터 저장 : 아카이브 데이터의 메타데이터 보호(예: 파일 크기, 체크섬)기계학습 : 분류 결과, 신뢰도 등 출력 보호분산 컴퓨팅 : 중간 계산 결과의 함수값 보호IoT : 센서 데이터의 통계량 보호함수 구가 연속 블록을 형성하지 않는 경우 완전한 메시지 보호가 필요한 경우(이 경우 ECC가 더 적합) λ가 매우 큰 경우(|Im(f)|에 가까움), FCC의 장점이 명확하지 않다 1 A. Lenz, R. Bitar, A. Wachter-Zeh, and E. Yaakobi, "Function-correcting codes," IEEE Trans. Inf. Theory, 2023.
FCC 개척 연구 , 기본 이론 프레임워크 수립13 R. Premlal and B. S. Rajan, "On function-correcting codes," IEEE Trans. Inf. Theory, 2025.
중복도 하한 연구 , 본 논문에 이론적 기초 제공14 G. Ge, Z. Xu, X. Zhang, and Y. Zhang, "Optimal redundancy of function-correcting codes," arXiv preprint, 2025.
Hamming 무게 함수 최적 구성 , 본 논문 구성과 비교 가능17 M. Plotkin, "Binary codes with specified minimum distance," IRE Trans. Inf. Theory, 1960.
이론적 혁신성 : ★★★★★기술적 깊이 : ★★★★☆실용적 가치 : ★★★☆☆작성 품질 : ★★★★★종합 평가 : ★★★★☆이것은 FCC 분야에서 중요한 이론적 기여를 한 고품질의 이론 논문이다. 국소 유계 함수 프레임워크의 제시와 색칠 매핑 방법의 응용 모두 혁신적이다. 실용성 검증과 이론적 완전성 측면에서 개선의 여지가 있지만, 기초 이론 연구로서 본 논문은 후속 연구를 위한 견고한 기초를 마련했다. 특히 부호 이론과 정보 이론에 관심 있는 연구자들에게 적극 권장한다.