The Principle of Maximum Entropy is a rigorous technique for estimating an unknown distribution given partial information while simultaneously minimizing bias. However, an important requirement for applying the principle is that the available information be provided error-free (Jaynes 1982). We relax this requirement using a memoryless communication channel as a framework to derive a new, more general principle. We show our new principle provides an upper bound on the entropy of the unknown distribution and the amount of information lost due to the use of a given communications channel is unknown unless the unknown distribution's entropy is also known. Using our new principle we provide a new interpretation of the classic principle and experimentally show its performance relative to the classic principle and other generally applicable solutions. Finally, we present a simple algorithm for solving our new principle and an approximation useful when samples are limited.
يعتبر مبدأ الإنتروبيا العظمى تقنية صارمة لتقدير التوزيعات غير المعروفة في ضوء معلومات جزئية معينة، مع تقليل الانحياز. ومع ذلك، فإن أحد المتطلبات الحاسمة لتطبيق هذا المبدأ هو أن تكون المعلومات المتاحة خالية من الأخطاء (Jaynes 1982). تستخدم هذه الورقة قنوات الاتصال عديمة الذاكرة كإطار عمل لتخفيف هذا المتطلب، وتشتق مبدأً جديداً وأكثر عمومية. تُظهر الدراسة أن المبدأ الجديد يوفر حداً أعلى لإنتروبيا التوزيع غير المعروف، وأن كمية المعلومات المفقودة بسبب استخدام قناة اتصال معينة يمكن تحديدها فقط عندما تكون إنتروبيا التوزيع غير المعروف معروفة أيضاً. باستخدام المبدأ الجديد، يقدم المؤلفون تفسيراً جديداً للمبدأ الكلاسيكي، ويعرضون من خلال التجارب أدائه مقابل المبدأ الكلاسيكي والحلول العامة الأخرى.
يتطلب مبدأ الإنتروبيا العظمى التقليدي أن تكون التوقعات المميزة التجريبية المستخدمة في القيود معروفة وخالية من الأخطاء. ومع ذلك، في العديد من السيناريوهات الواقعية، غالباً ما يكون من المستحيل تلبية هذا المتطلب بسبب الضوضاء أو آليات عدم التأكد الأخرى.
استخدام نموذج قناة اتصال عديمة الذاكرة كإطار عمل لنمذجة الضوضاء وعدم التأكد بشكل رسمي، مما يؤدي إلى اشتقاق مبدأ جديد يحافظ على الخصائص الممتازة لمبدأ الإنتروبيا العظمى الكلاسيكي.
بناءً على العينات المستقبلة من خلال قناة اتصال ضوضائية، تقدير معاملات التوزيع الاحتمالي غير المعروف P₀(W)، مع الاستفادة من معلومات إضافية حول بنية التوزيع (دوال مميزة).
1. تهيئة Pr(w) = 1/|W| ∀w
2. حل البرمجة المحدبة للحصول على P̃(W) الجديدة:
min ∑_w P̃r(w) log(P̃r(w)/Pr(w))
القيود: قيود قناة الاتصال
3. تطبيق مبدأ الإنتروبيا العظمى الكلاسيكي للحصول على P(W) الجديدة
4. التكرار حتى التقارب
النظرية 3: مبدأ الإنتروبيا العظمى الكلاسيكي هو حالة خاصة من مبدأ الإنتروبيا العظمى غير المؤكدة عندما يكون هناك P̃(W) واحد فقط يحقق القيود
النظرية 4: مبدأ الإنتروبيا العظمى الكامنة هو حالة خاصة من مبدأ الإنتروبيا العظمى غير المؤكدة
Jaynes, E. T. (1957). نظرية المعلومات والميكانيكا الإحصائية. Physical Review.
Shannon, C. E. (1948). نظرية رياضية للاتصال. Bell System Technical Journal.
Wang, S., Schuurmans, D., & Zhao, Y. (2012). مبدأ الإنتروبيا العظمى الكامنة. ACM TKDD.
Shore, J. & Johnson, R. (1980). الاشتقاق البديهي لمبدأ الإنتروبيا العظمى. IEEE TIT.
الملخص: هذه ورقة عالية الجودة توازن بين النظرية والممارسة، وتوسع بنجاح مبدأ الإنتروبيا العظمى الكلاسيكي للتعامل مع البيئات الضوضائية. على الرغم من وجود مجال للتحسين في التعقيد الحسابي والتحقق من التطبيقات العملية، فإن مساهماتها النظرية وابتكاراتها المنهجية توفر أدوات ورؤى قيمة للمجالات ذات الصلة.