The Principle of Maximum Entropy is a rigorous technique for estimating an unknown distribution given partial information while simultaneously minimizing bias. However, an important requirement for applying the principle is that the available information be provided error-free (Jaynes 1982). We relax this requirement using a memoryless communication channel as a framework to derive a new, more general principle. We show our new principle provides an upper bound on the entropy of the unknown distribution and the amount of information lost due to the use of a given communications channel is unknown unless the unknown distribution's entropy is also known. Using our new principle we provide a new interpretation of the classic principle and experimentally show its performance relative to the classic principle and other generally applicable solutions. Finally, we present a simple algorithm for solving our new principle and an approximation useful when samples are limited.
최대 엔트로피 원리는 부분 정보가 주어진 상황에서 미지의 분포를 추정하면서 편향을 최소화하는 엄격한 기법이다. 그러나 이 원리를 적용하기 위한 중요한 요구사항은 이용 가능한 정보가 오류 없어야 한다는 것이다(Jaynes 1982). 본 논문은 무기억 통신 채널을 프레임워크로 사용하여 이 요구사항을 완화하고 새로운, 보다 일반적인 원리를 도출한다. 연구 결과, 새로운 원리는 미지의 분포 엔트로피의 상한을 제공하며, 주어진 통신 채널 사용으로 인한 정보 손실량은 미지의 분포 엔트로피가 알려진 경우에만 결정될 수 있음을 보여준다. 새로운 원리를 사용하여 저자들은 고전적 원리에 대한 새로운 해석을 제공하고, 고전적 원리 및 다른 일반적 해결책에 비한 성능을 실험을 통해 입증한다.
Jaynes, E. T. (1957). Information theory and statistical mechanics. Physical Review.
Shannon, C. E. (1948). A mathematical theory of communication. Bell System Technical Journal.
Wang, S., Schuurmans, D., & Zhao, Y. (2012). The latent maximum entropy principle. ACM TKDD.
Shore, J. & Johnson, R. (1980). Axiomatic derivation of the principle of maximum entropy. IEEE TIT.
요약: 이것은 이론과 실제를 모두 중시하는 고품질 논문으로, 고전적 최대 엔트로피 원리를 성공적으로 확장하여 잡음 환경을 처리한다. 계산 복잡성과 실제 응용 검증 측면에서 개선의 여지가 있지만, 그 이론적 기여와 방법론적 혁신은 관련 분야에 가치 있는 도구와 통찰력을 제공한다.