Breaking through the classical Shannon entropy limit: A new frontier through logical semantics
Lastras, Trager, Lenchner et al.
Information theory has provided foundations for the theories of several application areas critical for modern society, including communications, computer storage, and AI. A key aspect of Shannon's 1948 theory is a sharp lower bound on the number of bits needed to encode and communicate a string of symbols. When he introduced the theory, Shannon famously excluded any notion of semantics behind the symbols being communicated. This semantics-free notion went on to have massive impact on communication and computing technologies, even as multiple proposals for reintroducing semantics in a theory of information were being made, notably one where Carnap and Bar-Hillel used logic and reasoning to capture semantics. In this paper we present, for the first time, a Shannon-style analysis of a communication system equipped with a deductive reasoning capability, implemented using logical inference. We use some of the most important techniques developed in information theory to demonstrate significant and sometimes surprising gains in communication efficiency availed to us through such capability, demonstrated also through practical codes. We thus argue that proposals for a semantic information theory should include the power of deductive reasoning to magnify the value of transmitted bits as we strive to fully unlock the inherent potential of semantics.
academic
كسر حد إنتروبيا شانون الكلاسيكي: حدود جديدة من خلال الدلالات المنطقية
العنوان: كسر حد إنتروبيا شانون الكلاسيكي: حدود جديدة من خلال الدلالات المنطقية
المؤلفون: Luis A. Lastras, Barry M. Trager, Jonathan Lenchner (IBM Research AI), Wojciech Szpankowski (جامعة بوردو), Chai Wah Wu, Mark S. Squillante (IBM Research AI), Alexander Gray (معهد Centaur AI & جامعة بوردو)
التصنيف: cs.IT (علوم الحاسوب - نظرية المعلومات), math.IT (الرياضيات - نظرية المعلومات)
تاريخ النشر: 31 ديسمبر 2024 (نسخة أولية على arXiv)
تقدم هذه الورقة للمرة الأولى إطار عمل نظري لنظرية المعلومات الدلالية يتجاوز حد إنتروبيا شانون الكلاسيكي. من خلال إدراج القدرة على الاستدلال المنطقي في أنظمة الاتصال، يثبت المؤلفون أنه يمكن تحقيق تحسينات كبيرة في كفاءة الاتصال في الأنظمة المزودة بقدرات الاستدلال الاستنتاجي. يستند هذا البحث على الأعمال المبكرة لـ Carnap و Bar-Hillel، ويستخدم التقنيات الأساسية لنظرية المعلومات لتقديم تحليل رياضي صارم لنظرية المعلومات الدلالية، مع التحقق من النتائج النظرية من خلال مخططات ترميز عملية.
قيود نظرية شانون: تستبعد نظرية المعلومات الكلاسيكية لشانون بشكل متعمد المعلومات الدلالية الكامنة خلف الرموز، وتركز فقط على الأنماط الإحصائية للرموز، مما يحد من تحسين كفاءة الاتصال في سيناريوهات معينة.
قيمة المعلومات الدلالية: كما قال فاينمان، "جميع المواد تتكون من ذرات" - هذه الجملة تحتوي على كمية ضخمة من المعلومات، ويمكن من خلال الاستدلال الاستنتاجي إعادة بناء كمية كبيرة من المعرفة العلمية، لكن نظرية المعلومات التقليدية لا تستطيع التقاط هذه القيمة الدلالية.
تُعرّف مهمة الاتصال كالتالي: تمتلك المرسلة Alice البيان المنطقي Sm، ويمتلك المستقبل Bob البيان Rm، وتحتاج Alice إلى مساعدة Bob على إثبات الاستعلام Qm. شروط النظام هي:
Sm ⊢ Qm (يمكن لـ Alice إثبات الاستعلام)
Qm ⊢ Rm (الاستعلام يستلزم معرفة Bob، عندما تعرف Alice Rm)
بالنسبة للبيان المنطقي s ∈ Lm، تُعرّف نواته κ(s) بأنها مجموعة جميع تعيينات متغيرات القضايا التي تجعل البيان صحيحاً. يُعرّف الحجم المعياري للنواة كالتالي:
النظرية 1: بالنسبة لأي توزيع (Sm, Qm, Rm) يفي بشروط الاستلزام، عندما تعرف Alice البيان Rm، توجد خوارزمية بحيث يكون الحد الأعلى لمتوسط تكلفة الاتصال المعياري هو Λ(ps, pr - pq) + O(m/2^m). تحت القيود الإضافية المستقلة والموزعة بشكل متطابق، يكون الحد الأدنى لمتوسط تكلفة أي خوارزمية هو Λ(ps, pr - pq).
تحسينات كفاءة ملموسة: يحقق الاتصال الدلالي المنطقي تخفيضات متعددة الأضعاف في تكلفة الاتصال مقارنة بالطرق الكلاسيكية، بينما التحسينات في مجال الضغط التقليدي عادة ما تُقاس بالنقاط المئوية
الاقتراب من الحد الأدنى النظري: تقترب أداء مخططات الترميز العملية من الحد الأدنى لنظرية المعلومات، مما يثبت فعالية التحليل النظري
في حالة pr = 1، الاستراتيجية المثلى لمساعدة Bob على إثبات الاستعلام Qm تجعل Bob يحصل فعلياً على قدرة إثبات أقوى من Qm، أي يمكن لـ Bob إثبات محتوى أكثر.
تستشهد هذه الورقة بـ 42 مرجعاً مهماً، تغطي الأساسيات والأعمال الكلاسيكية والمتقدمة في نظرية المعلومات، ونظرية المعلومات الدلالية، والمنطق، ونظرية الترميز وغيرها من المجالات، مما يعكس عمق واتساع البحث.
التقييم الشامل: هذه ورقة ذات أهمية تأسيسية، نجحت في إدراج قدرات الاستدلال المنطقي في إطار نظرية المعلومات، وتوفير أساس نظري مهم وإرشادات عملية لتطور نظرية المعلومات الدلالية. على الرغم من مواجهة بعض التحديات في التطبيق العملي، فإن مساهماتها النظرية وآفاقها التطبيقية تجعلها علامة فارقة مهمة في هذا المجال.