We study a class of two-player zero-sum stochastic games known as \textit{blind stochastic games}, where players neither observe the state nor receive any information about it during the game. A central concept for analyzing long-duration stochastic games is the \textit{uniform value}. A game has a uniform value $v$ if for every $\varepsilon>0$, Player 1 (resp., Player 2) has a strategy such that, for all sufficiently large $n$, his average payoff over $n$ stages is at least $v-\varepsilon$ (resp., at most $v+\varepsilon$). Prior work has shown that the uniform value may not exist in general blind stochastic games. To address this, we introduce a subclass called \textit{ergodic blind stochastic games}, defined by imposing an ergodicity condition on the state transitions. For this subclass, we prove the existence of the uniform value and provide an algorithm to approximate it, establishing the \textit{decidability} of the approximation problem. Notably, this decidability result is novel even in the single-player setting of Partially Observable Markov Decision Processes (POMDPs). Furthermore, we show that no algorithm can compute the uniform value exactly, emphasizing the tightness of our result. Finally, we establish that the uniform value is independent of the initial belief.
논문 ID : 2405.12583제목 : Uniform Value and Decidability in Ergodic Blind Stochastic Games저자 : Krishnendu Chatterjee (IST Austria), David Lurie (NyxAir & Paris Dauphine University), Raimundo Saona (IST Austria), Bruno Ziliotto (Toulouse School of Economics)분류 : math.OC (최적화 및 제어), cs.CC (계산 복잡성)발표 시간 : arXiv v2, 2025년 11월 21일논문 링크 : https://arxiv.org/abs/2405.12583v2 본 논문은 블라인드 확률 게임(blind stochastic games)을 연구합니다. 이는 참가자들이 상태를 관측하지 않고 상태에 대한 어떤 정보도 받지 않는 이인 영합 확률 게임입니다. 논문은 상태 전이에 에르고딕 조건을 부과하여 정의되는 에르고딕 블라인드 확률 게임(ergodic blind stochastic games)이라는 부분류를 도입합니다. 이 부분류에 대해 논문은 균등 가치(uniform value)의 존재성을 증명하고 근사 알고리즘을 제공하며 근사 문제의 판정가능성을 확립합니다. 이 판정가능성 결과는 단일 에이전트 설정의 부분 관측 마르코프 결정 과정(POMDPs)에서도 새로운 것입니다. 더욱이, 논문은 어떤 알고리즘도 균등 가치를 정확히 계산할 수 없음을 증명하여 결과의 타이트함을 강조합니다. 마지막으로 논문은 균등 가치가 초기 신념과 무관함을 확립합니다.
본 논문이 해결하고자 하는 핵심 문제는 다음과 같습니다:
균등 가치의 존재성 문제 : Ziliotto Zil16 는 일반 블라인드 확률 게임에서 균등 가치가 존재하지 않을 수 있음을 증명했습니다. 그렇다면 어떤 조건 하에서 균등 가치가 존재합니까?계산가능성 문제 : 균등 가치가 존재하더라도 알고리즘으로 계산하거나 근사할 수 있습니까? Madani 등 MHC03 은 일반 블라인드 MDP에서 균등 가치의 계산과 근사가 모두 판정불가능함을 증명했습니다.이론적 의의 : 블라인드 확률 게임은 불완전 정보 게임의 가장 단순한 모델이며, 더 복잡한 모델 연구의 이론적 기준입니다. 이는 확률 유한 자동기계(probabilistic finite automata)와 동치이며 컴퓨터 과학에서 광범위한 응용이 있습니다.실제 응용 : 무한 문자열의 간결한 명세 언어 BGB12, CT12 , 계산 생물학의 수열 분석 DEKM98 , 음성 처리 Moh97 등을 포함합니다.방법론적 기여 : 데이터 상의 조건을 식별하여 신념 동역학이 에르고딕 행동을 나타내도록 보장하는 것은 핵심적인 방법론적 기여입니다.일반 블라인드 확률 게임 : 균등 가치의 존재를 보장하지 않음 Zil16 교환가능 블라인드 확률 게임 : Venel Ven15 은 균등 가치의 존재를 증명했으나 계산 알고리즘을 제공하지 않음블라인드 MDP : Rosenberg 등 RSV02 은 균등 가치의 존재를 증명했으나, Madani 등 MHC03 은 계산과 근사가 모두 판정불가능함을 증명기존 에르고딕성 연구 : 주로 표준 확률 게임이나 MDP에 집중되어 있으며, 블라인드 확률 게임을 체계적으로 연구하지 않음논문의 출발점은 에르고딕 조건을 도입하여 판정가능한 블라인드 확률 게임의 부분류를 식별하는 것입니다. 이 조건은:
게임 이론 문헌에서 자연스럽고 일반적임 균등 가치의 존재를 보장 근사 문제를 판정가능하게 함 정확한 계산은 여전히 판정불가능하여 결과의 타이트함을 보여줌 논문의 주요 기여는 다음과 같습니다:
에르고딕 블라인드 확률 게임의 정의 : 전이 행렬 곱의 에르고딕 성질을 기반으로 이 새로운 게임 부분류를 형식적으로 정의 (정의 3.3)균등 가치의 존재성과 근사 판정가능성 (정리 3.5):모든 에르고딕 블라인드 확률 게임이 균등 가치를 가짐을 증명 근사 알고리즘을 제공하고 근사 문제의 판정가능성을 확립 복잡도 상한: 2-EXPSPACE 정확한 계산의 판정불가능성 (정리 3.6):마르코프 블라인드 MDP(에르고딕 블라인드 확률 게임의 부분류)에서도 균등 가치의 정확한 계산이 판정불가능함을 증명 근사 판정가능성 결과의 타이트함을 보여줌 초기 신념 독립성 (정리 3.7):에르고딕 블라인드 확률 게임에서 균등 가치가 초기 신념에 의존하지 않음을 증명 충분 조건 : 에르고딕성을 보장하는 여러 전이 행렬 클래스 식별 (C1-C5), 마르코프 행렬, scrambling 행렬, Sarymsakov 행렬 등 포함검증 알고리즘 (명제 3.9): 블라인드 확률 게임이 에르고딕 성질을 만족하는지 검증하는 지수 공간 알고리즘 제공블라인드 확률 게임 은 5-튜플 Γ = (K, I, J, p, g)로 정의됩니다:
K: 유한 상태 집합 I, J: 플레이어 1과 플레이어 2의 유한 행동 집합 p: K × I × J → Δ(K): 확률 전이 함수 g: K × I × J → 0,1 : 단계 보상 함수 핵심 특징 : 플레이어들은 상태를 관측하지 않으며, 초기 신념 b₁ ∈ Δ(K)과 과거 행동 이력만 알고 있습니다.
균등 가치 정의: 게임 Γ가 균등 가치 v: Δ(K) → 0,1 을 가진다는 것은, 모든 b₁ ∈ Δ(K)과 ε > 0에 대해, 전략 (σ*, π*)과 n ∈ ℕ*이 존재하여 모든 N ≥ n에 대해:
플레이어 1은 다음을 보장할 수 있음: γ^(b₁)_N(σ*, π) ≥ v(b₁) - ε 플레이어 2는 다음을 보장할 수 있음: γ^(b₁)_N(σ, π*) ≤ v(b₁) + ε 여기서 γ^(b₁)N(σ, π) = 𝔼^(b₁) (σ,π)1/N ∑^N_(m=1) G_m 은 N 단계 평균 보상입니다.
핵심 개념 : 에르고딕성 계수 τ₁. 확률 행렬 P에 대해 다음과 같이 정의됩니다:
τ₁(P) := 1/2 max_(k,k̄) ∑^|K|(k'=1) |p (k,k') - p_(k̄,k')|
에르고딕 블라인드 확률 게임 (정의 3.3): 게임 Γ가 에르고딕이라는 것은, 모든 ε > 0에 대해, 정수 n₀이 존재하여 길이 n ≥ n₀인 모든 행동 쌍 수열 aⁿ에 대해:
τ₁(Tⁿ(aⁿ)) ≤ ε
여기서 Tⁿ(aⁿ) = P(a₁)P(a₂)···P(aₙ)은 전향 전이 행렬 곱입니다.
핵심 성질 (명제 3.8): 게임 Γ가 에르고딕이라는 것은 n₀ ≤ (3^|K| - 2^(|K|+1) + 1)/2이 존재하여 길이 n₀인 모든 행동 쌍 수열에 대해:
τ₁(Tⁿ⁰(aⁿ⁰)) < 1
과 동치입니다.
논문의 핵심 방법은 원래 블라인드 확률 게임을 오차 ε로 근사할 수 있는 유한 상태 추상 확률 게임 (abstract stochastic game) G*(b₁, ε)을 구성하는 것입니다.
구성 단계 :
단계 1: 시간 척도 결정 (명제 4.1)
주어진 ε > 0에 대해, nε = n₀⌈ln(ε)/ln(sup_(aⁿ⁰) τ₁(Tⁿ⁰(aⁿ⁰)))⌉를 계산 길이 n ≥ nε인 모든 수열 aⁿ에 대해, τ₁(Tⁿ(aⁿ)) ≤ ε 단계 2: 안정 행렬 집합 구성
T(ε): τ₁ 조건을 만족하는 길이 n의 모든 전향 곱 행렬 집합 T̃(ε): 추상 안정 행렬 집합. 각 Tⁿ ∈ T(ε)에 대해, T̃ⁿ을 다음과 같이 정의: t̃ⁿ_(k,k')(aⁿ) := 1/|K| ∑^|K|(k=1) tⁿ (k,k')(aⁿ) 즉, 모든 행이 모든 행의 평균과 같아서 행렬이 안정화됨 (모든 행이 동일) 단계 3: 추상 상태 공간 정의
추상 신념 집합: B* := {b* ∈ Δ(K) | ∃T̃ⁿ ∈ T̃(ε) s.t. b* = b₁^⊤T̃ⁿ} ∪ {b₁}
상태 공간: X := ⋃^(n-1)_(m=0) (B* × (I × J)^m)
이는 크기가 O(|I × J|^(2n))인 유한 집합이며, 여기서 n은 이중 지수입니다.
단계 4: 전이 및 보상 정의
사영 함수 proj: X → Δ(K)는 추상 상태를 신념으로 매핑 추상 업데이트 함수 ψ*:
m ∈ 0, n-2 이면: ψ*(x, a) = (b*, a₁, ···, a_m, a) m = n-1이면: ψ*(x, a) = (proj(x)^⊤T̃ⁿ(aⁿ)) (새로운 추상 신념으로 재설정) 전이 함수: p*(x'|x, a) = 1 (x' = ψ*(x, a)인 경우), 그 외 0 (결정적) 보상 함수: g*(x, i, j) = ∑_(k∈K) proj(x)(k)·g(k, i, j) 1. 집계 방식의 설계
핵심 통찰 : 에르고딕성은 길이 n 후 모든 전이 행렬의 행이 유사해짐을 보장 (차이 ≤ ε)안정화 기법 : 평균화를 통해 안정 행렬을 구성하여 신념 업데이트가 초기 신념과 무관하게 함블록 구조 : 매 n 단계마다 재설정하여 에르고딕성의 "기억 소실" 성질 활용2. 오차 제어의 정밀한 분석
보조정리 4.2 : 원래 게임과 추상 게임의 신념 거리가 유계임을 증명: ||b^(b₁,h_m)(m,σ,π) - proj(x^(b₁,h_m) (m,σ,π))||₁ ≤ 4ε보조정리 4.3 : 평균 보상 차이가 유계임을 증명: |𝔼^(b₁)(σ,π)1/N ∑^N_(m=1) G_m - 𝔼^(b₁) (σ,π)1/N ∑^N_(m=1) G*_m | ≤ 4ε3. 기준선과의 차이
vs. Venel Ven15 의 교환가능 게임 : 존재성만이 아니라 판정가능 알고리즘 제공vs. 표준 확률 게임 에르고딕성 : 조건이 원래 데이터에 적용되며, 신념 게임이 아님vs. 블라인드 MDP 문헌 : 이인 게임에서 근사 판정가능성을 처음으로 확립4. 판정불가능성 증명의 영리함
확률 유한 자동기계(PFA)의 보편성 문제로부터 귀약 Restart 행동을 통해 블라인드 MDP가 PFA를 시뮬레이션하도록 구성 상태 k̂를 추가하여 모든 전이 행렬이 마르코프가 되도록 함 (에르고딕성 보장) 수용 확률 > 1/2이 장기 평균값 > 1/2과 동치임을 증명 문제 설명 :
상태: K = {Good, Fair, Poor} (기계 상태) 행동: I = {Wait, Basic Maintenance, Critical Repair} 플레이어들은 접근 불가능한 기계를 모니터링하고 과거 행동에 따라 결정 전이 행렬 (부분 표시):
Wait 행동 하에서:
G F P
G 0.9 0.1 0.0
F 0.0 0.7 0.3
P 0.0 0.1 0.9
에르고딕성 검증 :
각 행동의 전이 행렬 P(i)는 모두 마르코프 행렬 (최소 한 열이 모두 양수) 따라서 모든 i ∈ I에 대해 τ₁(P(i)) < 1 에르고딕 성질을 만족 입력: 초기 신념 b₁, 블라인드 확률 게임 Γ, 정확도 ε
1. Γ의 에르고딕 성질 검증
2. 행렬 집합 T(ε) 구성
3. T(ε)로부터 추상 행렬 집합 T̃(ε) 도출
4. 추상 확률 게임 G*(b₁, ε) 구성
5. G*(b₁, ε)의 균등 가치 v*(b₁, ε) 계산
출력: v*(b₁, ε) (Γ가 에르고딕인 경우)
복잡도 분석 :
상태 수: O(|I × J|^(2n)), 여기서 n ≤ (3^|K| - 2^(|K|+1) + 1)/2 실폐체 이론을 통해 표준 확률 게임을 PSPACE 내에서 풀 수 있음 CMH08 전체 복잡도: 2-EXPSPACE 논문은 주로 이론 작업이며, 핵심 결과는 표 2에 요약됩니다:
클래스 균등 가치 존재 정확 판정가능 근사 판정가능 값이 상수 충분 조건 에르고딕 블라인드 MDP 예 판정불가능 판정가능 예 예 에르고딕 블라인드 확률 게임 예 판정불가능 판정가능 예 예 Scrambling 숨겨진 확률 게임 ? 판정불가능 ? ? 예
(굵은 글씨는 본 논문의 새로운 결과)
정리 3.5 (존재성과 판정가능성) :
증명 전략 : 4단계 구성을 통해
추상 게임 G*(b₁, ε) 구성 신념 유지 근접성 증명 (보조정리 4.2) 보상 유지 근접성 증명 (보조정리 4.3) 표준 확률 게임의 균등 가치 존재성 활용 오차 한계 : |v*(b₁, ε) - v(b₁)| ≤ 4ε판정가능성 : 유한 상태 확률 게임으로의 귀약을 통해정리 3.6 (판정불가능성) :
증명 전략 : PFA 보편성 문제로부터 귀약핵심 구성 :
흡수 상태 k̂ 추가 Restart 행동으로 초기 상태로 재설정 보상 설계로 수용 확률 > 1/2 ⟺ 장기 평균 > 1/2 분리 결과 : 표준 확률 게임 (정확 판정가능 OB21 )과 대조정리 3.7 (초기 신념 독립성) :
증명 요점 : 추상 게임에서 다른 초기 신념은 처음 nε 단계에서만 차이오차 한계 : 임의의 b₁, b'₁에 대해 |v(b₁) - v(b'₁)| ≤ 8ε논문은 행렬 클래스의 엄격한 포함 관계를 식별합니다:
C₅ ⊊ C₄ ⊊ C₃ ⊊ C₂ ⊊ C₁
여기서:
C₅ (마르코프) : 최소 한 열이 모두 양수C₄ (Scrambling) : 임의의 두 행이 공통 후속자를 가짐C₃ (Sarymsakov) : 임의의 두 분리된 부분집합이 공통 도달 가능 상태를 가지거나 도달 가능 집합이 확대됨C₂ (C₂-행렬) : SIA이고 모든 SIA 행렬과의 곱이 여전히 SIAC₁ (SIA) : Pⁿ이 안정 행렬로 수렴이 모든 클래스의 전이 행렬은 블라인드 확률 게임이 에르고딕임을 보장합니다.
표준 확률 게임 Sha53 : 완전 상태 관측Mertens-Neyman MN81 : 균등 가치는 항상 존재 알고리즘: OB21 등이 계산 방법 제공 블라인드 확률 게임 :N 단계 값 존재 vN28 Ziliotto Zil16 : 균등 가치가 존재하지 않을 수 있는 반례 Venel Ven15 : 교환가능 조건 하에서 균등 가치 존재 (알고리즘 없음) 존재성 : Rosenberg 등 RSV02 이 블라인드 MDP의 균등 가치 존재 증명판정불가능성 : Madani 등 MHC03 이 계산과 근사 모두 판정불가능함을 증명유한 기억 : Chatterjee 등 CSZ22 이 유한 기억 전략이 충분하나 기억 크기는 계산 불가능함을 증명표준 확률 게임 :유한 상태 HK66, Sob71, Vri03 가산 상태 Now99 응용: 암호화폐 공격 분석 CKGIV18 MDP의 에르고딕성 :유한 상태 AS92, HBS87, WSS11 가산 상태 BSL90, PBS93 종합 설명 ABFG+93, Put14 자동기계 이론 :단일 에이전트 경우 CSV13 는 고립 절단점을 가진 확률 자동기계 연구 본 논문은 이인 게임으로 확장 긍정적 결과 :강한 가정 하에서 CH10 다른 목표 CCT16, CDH13, GO14 부정적 결과 :ω-정규 목표 Cha07 부분 관측 게임 CCGK16 vs. Venel Ven15 : 존재성뿐만 아니라 알고리즘도 제공vs. 블라인드 MDP 문헌 : 이인 게임에서 근사 판정가능성을 처음 확립vs. 표준 에르고딕성 : 조건이 원래 데이터에 적용되며, 신념 동역학의 에르고딕 행동을 식별새로움 : 단일 POMDP에서도 근사 판정가능성이 새로움존재성 : 에르고딕 블라인드 확률 게임은 항상 균등 가치를 가짐판정가능성 이분법 :
근사: 판정가능 (2-EXPSPACE) 정확: 판정불가능 (마르코프 블라인드 MDP에서도) 초기 신념 무관성 : 균등 가치는 상수 함수충분 조건 : 에르고딕성을 보장하는 5가지 행렬 클래스 식별검증 알고리즘 : 에르고딕 성질 검증을 위한 지수 공간 알고리즘1. 복잡도
2-EXPSPACE 상한이 높음 실제 계산이 불가능할 수 있음 하한이 주어지지 않음 2. 적용 범위
에르고딕 경우만 제한됨 에르고딕 조건 (식 1)이 모든 행동 수열에 대해 일관되게 성립해야 함 많은 실제 게임이 이를 만족하지 않을 수 있음 3. 정확한 계산
정리 3.6은 정확한 계산이 판정불가능함을 보여줌 임의 정확도로만 근사 가능 근사값의 품질을 판단할 방법 없음 4. 확장성 문제
숨겨진 확률 게임 (신호 포함)으로의 확장은 주요 도전 확률적 전이로 인한 오차 전파 존재성과 판정가능성은 여전히 미해결 1. 숨겨진 확률 게임 (제5절 논의)
Scrambling 숨겨진 게임 : 정의 5.2에서 일반화 제공미해결 문제 :
주요 장애물 :
신념 전이가 확률적 (vs. 블라인드 게임의 결정적) 원래와 추상 게임의 완벽한 결합 불가능 오차가 전파될 수 있음 RSV02 2. 복잡도 개선
2-EXPSPACE 상한 감소 일치하는 하한 확립 다항 시간에 풀 수 있는 부분류 식별 3. 알고리즘 최적화
실제 구현 가능한 알고리즘 문제 구조 활용 근사 품질의 온라인 추정 4. 응용 탐색
로봇 네비게이션 (부분 관측) 네트워크 보안 (공격-방어 게임) 자원 관리 (불완전 정보) 5. 이론 심화
에르고딕성의 다른 특성화 다른 게임 클래스와의 관계 다인 게임으로의 일반화 1. 이론적 기여가 현저함
개척적 : 블라인드 확률 게임에서 근사 판정가능성을 처음 확립타이트함 : 판정불가능성 결과는 근사가 최선의 가능성임을 보여줌통일성 : 존재성, 판정가능성, 초기 신념 독립성을 동시에 다룸2. 방법론적 혁신
추상 게임 구성 : 에르고딕성을 우아하게 활용하여 유한 근사 구성안정화 기법 : 평균화를 통해 신념 업데이트를 독립화오차 분석 : ε-제어가 전체 증명을 관통3. 기술적 깊이
행렬 이론 : 에르고딕 계수와 행렬 곱 이론의 깊은 활용복잡성 이론 : 판정불가능성 증명의 영리한 귀약게임 이론 : 자동기계, MDP, 확률 게임을 연결4. 결과의 완전성
충분 조건 제공 (5가지 행렬 클래스) 검증 알고리즘 제공 (명제 3.9) 구체적 예제 포함 (예제 3.1) 확장 방향 논의 (제5절) 5. 작성의 명확성
구조가 합리적이고 논리가 명확 정의가 엄격하고 기호가 규범적 증명이 상세하고 검증 용이 관련 연구가 포괄적으로 정리됨 1. 계산 복잡도
2-EXPSPACE가 너무 높음 : 실제로 불가능하한 없음 : 개선 가능 여부 불명실험 없음 : 실제 성능 미평가2. 적용성 제한
에르고딕 조건이 강함 : 식 (1)이 모든 수열에 대해 일관되게 성립 필요유한 상태만 : 무한 상태 공간 미고려영합 가정 : 일반 합 게임 미논의3. 알고리즘 세부사항
알고리즘 1이 너무 추상적 : 구현 세부사항 부족수치 안정성 : 부동소수점 계산 문제 미논의매개변수 선택 : ε 선택 지침 없음4. 실험 검증
예제 하나뿐 : 예제 3.1이 너무 단순성능 평가 없음 : 실행 시간, 메모리 사용 미알려짐비교 없음 : 다른 방법 (예: 샘플링)과 비교 없음5. 확장성 문제
숨겨진 게임 : 주요 장애물 미해결다인 게임 : 미논의다른 목표 : 할인 보상, 도달성 등 충분히 탐색 안 됨1. 이론적 영향
공백 채우기 : 블라인드 확률 게임과 POMDP에서 첫 근사 판정가능성 결과방법론 : 추상 게임 구성이 다른 불완전 정보 게임 연구에 영감 제공 가능복잡성 이론 : 정확 vs. 근사의 이분법은 중요한 통찰2. 실용적 가치
제한적 : 2-EXPSPACE 복잡도가 실제 응용 제한이론적 지침 : 처리 가능한 부분류 식별이 가치 있음기준선 : 다른 휴리스틱 방법의 이론적 기준이 될 수 있음3. 재현성
이론 결과 : 증명이 상세하고 검증 가능알고리즘 : 설명이 명확하고 구현 가능예제 : 단순하고 재현 가능코드 : 구현 제공 안 됨4. 후속 연구
직접 확장 : 숨겨진 게임, 다인 게임알고리즘 개선 : 복잡도 감소, 실제 구현응용 : 구체적 영역의 모델링과 해결이론적으로 적용 가능 :
소규모 문제 : 상태와 행동 공간이 작은 경우강한 에르고딕성 : 전이 행렬이 빠르게 혼합근사 충분 : 정확한 값 불필요오프라인 계산 : 높은 계산 비용 허용구체적 응용 :
기계 유지보수 : 예제 3.1처럼 상태 관측 불가능한 유지보수 결정네트워크 모니터링 : 과거 데이터 기반 침입 탐지로봇 네비게이션 : 부분 관측 환경의 경로 계획자원 할당 : 불완전 정보 하의 경쟁적 자원 분배부적용 시나리오 :
대규모 시스템 : 상태 공간 지수 폭발비에르고딕 시스템 : 장기 이력 의존성실시간 결정 : 계산 시간 제약정확성 요구 : 정확한 최적 전략 필요MN81 Mertens & Neyman (1981): 표준 확률 게임 균등 가치 존재성의 기초 작업Zil16 Ziliotto (2016): 블라인드 확률 게임 균등 가치 미존재 반례MHC03 Madani, Hanks & Condon (2003): 블라인드 MDP 판정불가능성의 고전 결과Sen06 Seneta (2006): 비음 행렬과 에르고딕성 이론의 권위 있는 종합Ven15 Venel (2015): 교환가능 확률 게임의 균등 가치 존재성RSV02 Rosenberg, Solan & Vieille (2002): 블라인드 MDP 균등 가치 존재성CSZ22 Chatterjee, Saona & Ziliotto (2022): POMDP의 유한 기억 전략OB21 Oliu-Barton (2021): 표준 확률 게임의 새 알고리즘종합 평가 : 이는 이론이 깊고 기술이 견고한 우수한 논문입니다. 블라인드 확률 게임이라는 기초적이지만 어려운 문제에서 중요한 돌파구를 이루었습니다. 에르고딕 조건을 도입하여 균등 가치의 존재성과 계산가능성을 영리하게 균형 있게 다루었습니다. 알고리즘 복잡도가 높아 실제 응용이 제한되지만, 이론적 기여와 방법론적 혁신은 게임 이론, 자동기계 이론, 계산 복잡성 이론 모두에 중요한 의미가 있습니다. 특히 근사 판정가능하지만 정확 계산은 판정불가능하다는 타이트한 결과는 문제의 계산 경계를 명확히 보여주는 인상적인 성과입니다.