The Principle of Maximum Entropy is a rigorous technique for estimating an unknown distribution given partial information while simultaneously minimizing bias. However, an important requirement for applying the principle is that the available information be provided error-free (Jaynes 1982). We relax this requirement using a memoryless communication channel as a framework to derive a new, more general principle. We show our new principle provides an upper bound on the entropy of the unknown distribution and the amount of information lost due to the use of a given communications channel is unknown unless the unknown distribution's entropy is also known. Using our new principle we provide a new interpretation of the classic principle and experimentally show its performance relative to the classic principle and other generally applicable solutions. Finally, we present a simple algorithm for solving our new principle and an approximation useful when samples are limited.
अधिकतम एन्ट्रॉपी सिद्धांत आंशिक जानकारी दिए जाने पर अज्ञात वितरण का अनुमान लगाने की एक कठोर तकनीक है, जबकि पूर्वाग्रह को कम करता है। हालांकि, इस सिद्धांत को लागू करने की एक महत्वपूर्ण आवश्यकता यह है कि उपलब्ध जानकारी त्रुटिमुक्त होनी चाहिए (Jaynes 1982)। यह पेपर इस आवश्यकता को शिथिल करने के लिए स्मृतिहीन संचार चैनल को एक ढांचे के रूप में उपयोग करता है और एक नया, अधिक सामान्य सिद्धांत प्राप्त करता है। अनुसंधान से पता चलता है कि नया सिद्धांत अज्ञात वितरण की एन्ट्रॉपी की ऊपरी सीमा प्रदान करता है, और दिए गए संचार चैनल के उपयोग से खोई गई जानकारी की मात्रा केवल तभी निर्धारित की जा सकती है जब अज्ञात वितरण की एन्ट्रॉपी भी ज्ञात हो। नए सिद्धांत का उपयोग करते हुए, लेखकों ने शास्त्रीय सिद्धांत की नई व्याख्या प्रदान की है और प्रयोगों के माध्यम से शास्त्रीय सिद्धांत और अन्य सामान्य समाधानों के सापेक्ष इसके प्रदर्शन को प्रदर्शित किया है।
परंपरागत अधिकतम एन्ट्रॉपी सिद्धांत के लिए आवश्यक है कि अनुभवजन्य विशेषता अपेक्षाएं ज्ञात और त्रुटिमुक्त हों। हालांकि, वास्तविक दुनिया के कई परिदृश्यों में, शोर या अन्य अनिश्चितता तंत्र के कारण, यह आवश्यकता अक्सर पूरी नहीं की जा सकती।
स्मृतिहीन संचार चैनल मॉडल को एक ढांचे के रूप में उपयोग करते हुए, शोर और अनिश्चितता को औपचारिक रूप से मॉडल करते हैं, जिससे शास्त्रीय अधिकतम एन्ट्रॉपी सिद्धांत के उत्कृष्ट गुणों को बनाए रखने वाला एक नया सिद्धांत प्राप्त होता है।
शोर संचार चैनल के माध्यम से प्राप्त नमूनों को देखते हुए, अज्ञात संभाव्यता वितरण P₀(W) के पैरामीटर का अनुमान लगाना, जबकि वितरण संरचना के बारे में अतिरिक्त जानकारी (विशेषता कार्य) का उपयोग करना।
1. प्रारंभ करें Pr(w) = 1/|W| ∀w
2. उत्तल प्रोग्रामिंग को हल करके नया P̃(W) प्राप्त करें:
min ∑_w P̃r(w) log(P̃r(w)/Pr(w))
बाधा शर्तें: संचार चैनल बाधाएं
3. शास्त्रीय अधिकतम एन्ट्रॉपी सिद्धांत लागू करके नया P(W) प्राप्त करें
4. अभिसरण तक दोहराएं
प्रमेय 3: शास्त्रीय अधिकतम एन्ट्रॉपी सिद्धांत अनिश्चित अधिकतम एन्ट्रॉपी सिद्धांत का विशेष मामला है जब केवल एक P̃(W) बाधाओं को संतुष्ट करता है
प्रमेय 4: संभावित अधिकतम एन्ट्रॉपी सिद्धांत अनिश्चित अधिकतम एन्ट्रॉपी सिद्धांत का विशेष मामला है
Jaynes, E. T. (1957). सूचना सिद्धांत और सांख्यिकीय यांत्रिकी। Physical Review.
Shannon, C. E. (1948). संचार का एक गणितीय सिद्धांत। Bell System Technical Journal.
Wang, S., Schuurmans, D., & Zhao, Y. (2012). अव्यक्त अधिकतम एन्ट्रॉपी सिद्धांत। ACM TKDD.
Shore, J. & Johnson, R. (1980). अधिकतम एन्ट्रॉपी सिद्धांत की स्वयंसिद्ध व्युत्पत्ति। IEEE TIT.
सारांश: यह एक सैद्धांतिक और व्यावहारिक दोनों दृष्टि से उच्च गुणवत्ता वाला पेपर है, जो शास्त्रीय अधिकतम एन्ट्रॉपी सिद्धांत को शोर वातावरण को संभालने के लिए सफलतापूर्वक विस्तारित करता है। हालांकि कम्प्यूटेशनल जटिलता और व्यावहारिक अनुप्रयोग सत्यापन के पहलुओं में सुधार की गुंजाइश है, लेकिन इसके सैद्धांतिक योगदान और विधि नवाचार संबंधित क्षेत्रों के लिए मूल्यवान उपकरण और अंतर्दृष्टि प्रदान करते हैं।