2025-11-13T11:19:11.075710

Knowing Unknowns in an Age of Information Overload

Khanna
The technological revolution of the Internet has digitized the social, economic, political, and cultural activities of billions of humans. While researchers have been paying due attention to concerns of misinformation and bias, these obscure a much less researched and equally insidious problem - that of uncritically consuming incomplete information. The problem of incomplete information consumption stems from the very nature of explicitly ranked information on digital platforms, where our limited mental capacities leave us with little choice but to consume the tip of a pre-ranked information iceberg. This study makes two chief contributions. First, we leverage the context of internet search to propose an innovative metric that quantifies information completeness. For a given search query, this refers to the extent of the information spectrum that is observed during web browsing. We then validate this metric using 6.5 trillion search results extracted from daily search trends across 48 nations for one year. Second, we find causal evidence that awareness of information completeness while browsing the Internet reduces resistance to factual information, hence paving the way towards an open-minded and tolerant mindset.
academic

معرفة المجاهيل في عصر الإفراط في المعلومات

المعلومات الأساسية

  • معرّف الورقة البحثية: 2510.10413
  • العنوان: معرفة المجاهيل في عصر الإفراط في المعلومات
  • المؤلف: Saurabh Khanna (مدرسة أمستردام للبحوث الاتصالية، جامعة أمستردام وكلية بيمبروك، جامعة أكسفورد)
  • التصنيف: cs.CY (الحاسوبيات والمجتمع)
  • تاريخ النشر: 12 أكتوبر 2025 (نسخة arXiv التمهيدية)
  • رابط الورقة: https://arxiv.org/abs/2510.10413

الملخص

لقد قامت ثورة تكنولوجيا الإنترنت برقمنة مليارات الأنشطة الاجتماعية والاقتصادية والسياسية والثقافية البشرية. بينما ركز الباحثون على مشاكل المعلومات المضللة والانحياز، فإن هذه المشاكل تخفي قضية أقل بحثاً لكنها مؤثرة بنفس القدر - الاستهلاك غير النقدي للمعلومات غير المكتملة. تنشأ مشكلة استهلاك المعلومات غير المكتملة من طبيعة ترتيب المعلومات بشكل صريح على المنصات الرقمية، وقدراتنا العقلية المحدودة تجبرنا على استهلاك جزء صغير فقط من جبل المعلومات المرتب مسبقاً. تقدم هذه الدراسة مساهمتين رئيسيتين: أولاً، اقتراح مؤشر مبتكر لقياس "اكتمال المعلومات" باستخدام سياق البحث على الإنترنت؛ وثانياً، اكتشاف أدلة سببية على أن الوعي باكتمال المعلومات يقلل من مقاومة المعلومات الواقعية عند تصفح الإنترنت.

السياق البحثي والدافع

المشكلة الأساسية

تتمثل المشكلة الأساسية التي تعالجها هذه الدراسة في: كيف يمكن للأشخاص في عصر الإفراط في المعلومات أن يعرفوا ما لا يعرفونه (معرفة المجاهيل)؟ بشكل محدد، عندما نتصفح الإنترنت، كم من الطيف المعلوماتي الفعلي نراه؟

أهمية المشكلة

  1. انفجار المعلومات: يُتوقع أن تنمو الكرة البيانات العالمية من 33 زيتابايت في 2018 إلى 175 زيتابايت في 2025، بمعدل نمو سنوي مركب حوالي 61%
  2. القيود المعرفية: القدرات العقلية البشرية محدودة ولا يمكنها التعامل مع تدفق معلومات ينمو بشكل أسي
  3. الترتيب الخوارزمي: المعلومات على الإنترنت طبيعياً مرتبة، والمستخدمون يميلون إلى عرض النتائج الأعلى ترتيباً فقط
  4. التأثير الاجتماعي: قد يؤدي استهلاك المعلومات غير المكتملة إلى تعزيز الانحياز والانقسام الاجتماعي

القيود في البحث الحالي

يركز البحث الحالي بشكل أساسي على جانبين:

  1. انتشار المعلومات المضللة: دراسة الفرق بين المعلومات والحقيقة الموضوعية
  2. العدالة الخوارزمية: الاهتمام بانحياز الخوارزميات على الفئات المهمشة

لكن كل هذه الدراسات تعتمد على وجود حقيقة موضوعية قابلة للتحقق، في حين أن الذاتية وتنوع الآراء على الإنترنت تجعل الحقيقة الموضوعية استثناءً وليس القاعدة.

دافع البحث

يرى المؤلف أننا تجاهلنا مشكلة مهمة بنفس القدر: كيفية قياس وزيادة الوعي باكتمال المعلومات في سياق الإفراط في المعلومات والاستهلاك غير النقدي للمعلومات غير المكتملة.

المساهمات الأساسية

  1. مؤشر مبتكر: اقتراح مؤشر قياس ديناميكي لـ "اكتمال المعلومات" بناءً على تضمين النصوص وتقنيات استرجاع المعلومات
  2. التحقق على نطاق واسع: استخدام بيانات 6.5 تريليون نتيجة بحث (تغطي 48 دولة، لمدة سنة واحدة) للتحقق من المؤشر
  3. أدلة سببية: إثبات من خلال تجارب عشوائية محكومة أن الوعي باكتمال المعلومات يقلل من مقاومة المعلومات الواقعية
  4. منصة مفتوحة المصدر: تطوير منصة بحث ويب تجريبية مفتوحة المصدر تسمى Sonder، يمكنها الإبلاغ ديناميكياً عن درجات اكتمال المعلومات

شرح المنهجية

تعريف المهمة

بالنسبة لاستعلام بحث معين q، من إجمالي N نتيجة بحث، ما مدى تمثيل أول n نتيجة (n < N)؟ هذا يختلف عن تقييم ما إذا كانت هذه النتائج n تحتوي على معلومات مضللة أو انحياز، بل يتعلق بتقييم اكتمال المعلومات.

تصميم مؤشر اكتمال المعلومات

الفكرة الأساسية

تركز الطرق التقليدية على الصلة بين الاستعلام ونتيجة بحث واحدة:

الصلة = cos(q⃗, r⃗ᵢ) = (q⃗ · r⃗ᵢ)/(‖q⃗‖‖r⃗ᵢ‖)

يركز مؤشر اكتمال المعلومات المقترح في هذه الورقة على التشابه الدلالي بين نتائج البحث والمجموعة الكاملة من النتائج:

Iاكتمال،i = cos(C⃗, r⃗ᵢ) = (C⃗ · r⃗ᵢ)/(‖C⃗‖‖r⃗ᵢ‖)

حيث: C⃗ = Σᵢ₌₁ᴺ wᵢr⃗ᵢ (wᵢ وزن، يمكن أن يكون مبنياً على مؤشرات الموثوقية مثل ترتيب الصفحات)

اكتمال المعلومات التراكمي

مع الأخذ في الاعتبار الطبيعة التراكمية لاستهلاك المعلومات، يتم تعريف اكتمال المعلومات التراكمي:

Iاكتمال،n = cos(C⃗, Σᵢ₌₁ⁿ r⃗ᵢ) = (C⃗ · Σᵢ₌₁ⁿ r⃗ᵢ)/(‖C⃗‖‖Σᵢ₌₁ⁿ r⃗ᵢ‖)

موازنة الصلة والاكتمال

توفير آلية توازن يمكن للمستخدم التحكم بها:

Sᵢ = λIᵢ،اكتمال + (1-λ)Iᵢ،صلة

حيث λ ∈ 0,1 يتحكم في وزن الاكتمال والصلة.

التنفيذ التقني

  1. تضمين النصوص: استخدام تضمين على مستوى الجملة بناءً على Transformer (مثل Sentence-BERT)
  2. التشابه الدلالي: حساب المسافة الدلالية بين المتجهات من خلال تشابه جيب التمام
  3. منحنى اكتمال المعلومات: رسم كيفية تغير الاكتمال التراكمي مع نسبة النتائج المعروضة

إعداد التجربة

التحقق على نطاق واسع

حجم مجموعة البيانات

  • الفترة الزمنية: من 16 نوفمبر 2021 إلى 15 نوفمبر 2022 (سنة واحدة)
  • التغطية الجغرافية: 48 دولة، تمتد عبر 6 قارات
  • حجم البيانات: 6.5 تريليون نتيجة بحث أولية
  • البيانات اليومية: 57.6 مليون بحث، 180 مليار نقطة بيانات
  • عمق النتائج: الوسيط 320 نتيجة بحث لكل استعلام

طريقة التحقق

من خلال مقارنة اكتمال المعلومات في دول مختلفة مع حرية الإعلام (باستخدام بيانات منظمة مراسلون بلا حدود) للتحقق من صحة المؤشر.

التجربة العشوائية المحكومة

تصميم التجربة

  • المنصة: منصة بحث Sonder المطورة ذاتياً
  • المشاركون: 876 بالغاً أمريكياً (تم تجنيدهم عبر Prolific)
  • مدة التجربة: 40 دقيقة (5 دقائق اختبار قبلي + 30 دقيقة تفاعل + 5 دقائق اختبار بعدي)
  • التقسيم: 434 شخصاً في مجموعة العلاج (عرض درجات اكتمال المعلومات)، 442 شخصاً في مجموعة المراقبة (بحث عادي)

موضوعات البحث

5 موضوعات واسعة لتقييم العقلية المنفتحة:

  1. الوطنية في بلدنا اليوم
  2. الانفتاح على الهجرة
  3. الإجهاض وحالته القانونية
  4. القيم التقليدية في المجتمع اليوم
  5. القوانين المتعلقة بملكية الأسلحة

نتائج التجربة

التحقق من مؤشر اكتمال المعلومات

تحليل الفروقات الجغرافية

  • أقل اكتمال: منطقة الشرق الأوسط وشمال أفريقيا (حوالي 25% اكتمال في الصفحة الأولى)
  • أعلى اكتمال: منطقة أمريكا الشمالية (حوالي 62% اكتمال في الصفحة الأولى)
  • العلاقة الإحصائية: كل وحدة زيادة في درجة قيود الإعلام تقلل اكتمال المعلومات بمقدار 0.28 نقطة مئوية (p < 0.001)

التأثيرات الثابتة الإقليمية

بعد إضافة التأثيرات الثابتة الإقليمية، انخفضت حجم التأثير إلى 0.17 نقطة مئوية (p < 0.001)، مما يشير إلى وجود فروقات كبيرة على مستوى الدول ضمن المناطق.

نتائج التجربة السلوكية

تحسن العقلية المنفتحة (النتيجة O1)

  • التأثير الإجمالي: تحسن العقلية المنفتحة لمجموعة العلاج بمقدار 0.076 وحدة انحراف معياري (p = 0.207، غير معنوي)
  • مقاومة الحقائق: انخفاض معنوي بمقدار 0.212 وحدة انحراف معياري (p = 0.003، معنوي إحصائياً)
  • التعصب: انخفاض بمقدار 0.048 وحدة انحراف معياري (p = 0.432، غير معنوي)
  • تشخيص المعتقدات: انخفاض بمقدار 0.012 وحدة انحراف معياري (p = 0.777، غير معنوي)
  • التفكير الليبرالي: انخفاض بمقدار 0.032 وحدة انحراف معياري (p = 1.302، غير معنوي)

التغييرات في السلوك البحثي (النتيجة O2)

  • عمق البحث: امتدت النتائج ذات الترتيب الأدنى التي تعرضت لها مجموعة العلاج بمتوسط 6.14 موضع إضافي (p < 0.001)
  • عدد النقرات: نقرت مجموعة العلاج على 2.182 نتيجة إضافية بمتوسط (p = 0.312، غير معنوي)
  • تحسن الاكتمال: كانت درجات اكتمال المعلومات للنتائج التي نقرت عليها مجموعة العلاج أعلى بـ 7.6 نقاط مئوية (p = 0.001)

الأعمال ذات الصلة

تطور البحث على الإنترنت

  1. الحلول المبكرة (التسعينيات): Archie و Gopher و WAIS وأنظمة أخرى قائمة على الكلمات الرئيسية
  2. صعود Google (1998): ثورة خوارزمية PageRank في تقييم جودة الروابط
  3. الحلول الحديثة: البحث المخصص الذي تحركه الذكاء الاصطناعي والتعلم الآلي

بحوث جودة المعلومات

  • كشف المعلومات المضللة: التركيز على الفرق بين المعلومات والحقيقة الموضوعية
  • العدالة الخوارزمية: دراسة تأثير انحياز الخوارزميات على الفئات المهمشة
  • فقاعات التصفية: تأثير التوصيات المخصصة على تشكيل غرف الصدى المعلوماتية

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. صحة المؤشر: يمكن لمؤشر اكتمال المعلومات أن يعكس بفعالية درجة حرية الإعلام في دول ومناطق مختلفة
  2. التأثير المعرفي: يحسن الوعي باكتمال المعلومات بشكل أساسي الأبعاد المتعلقة بالمعرفة (تقليل مقاومة الحقائق)، مع تأثير محدود على الأبعاد البين شخصية
  3. تغيير السلوك: يستكشف المستخدمون بنشاط نتائج بحث أعمق وأكثر اكتمالاً

القيود

  1. الاعتماد التكنولوجي: تعتمد جودة المؤشر على جودة تضمين النصوص، وقد تتأثر بانحياز بيانات التدريب
  2. القيود الثقافية: ينبع مفهوم العقلية المنفتحة (AOT) من علم النفس الغربي، وقابليته للتطبيق عبر الثقافات محدودة
  3. عتبة الفهم: يؤثر مستوى فهم المشاركين لمفهوم اكتمال المعلومات على فعالية العلاج

الاتجاهات المستقبلية

  1. تأثيرات الحجم: دراسة تأثير التغييرات في حجم درجات اكتمال المعلومات على العقلية المنفتحة
  2. التوسع إلى وسائل التواصل الاجتماعي: توسيع البحث إلى منصات وسائل التواصل الاجتماعي ذات مصادر المعلومات الشخصية
  3. التدخلات التعليمية: تطوير برامج تعليمية لزيادة الوعي العام باكتمال المعلومات

التقييم المتعمق

المزايا

  1. ابتكار المشكلة: تحديد وقياس مشكلة عدم اكتمال المعلومات التي تم تجاهلها لكنها مهمة
  2. صرامة المنهجية: الجمع بين البيانات الملاحظة على نطاق واسع والتجارب العشوائية المحكومة، مما يوفر أدلة تجريبية كافية
  3. القيمة العملية: تطوير منصة بحث مفتوحة المصدر ذات إمكانيات تطبيق عملي
  4. التكامل متعدد التخصصات: دمج النظريات والأساليب من استرجاع المعلومات وعلم النفس والعلوم السياسية والاتصالات وغيرها

أوجه القصور

  1. قيود الاستدلال السببي: يعتمد التحليل على مستوى الدول بشكل أساسي على الارتباط، وينقصه التحديد السببي القوي
  2. تمثيل العينة: تقتصر التجربة على البالغين الأمريكيين، وعمومية النتائج تحتاج إلى التحقق
  3. التأثيرات طويلة الأجل غير معروفة: تراقب التجربة فقط التأثيرات قصيرة الأجل، والتأثيرات طويلة الأجل لا تزال غير واضحة
  4. شفافية الخوارزمية: قد تؤثر الطبيعة "الصندوق الأسود" لخوارزميات تضمين النصوص على قابلية تفسير المؤشر

التأثير

  1. المساهمة الأكاديمية: توفير إطار نظري جديد وأداة قياس لتقييم جودة المعلومات
  2. الأهمية السياسية: توفير مؤشر موضوعي لتقييم جودة البيئة المعلوماتية للحكومات والمنظمات
  3. التطبيق التكنولوجي: توفير اتجاهات لتحسين محركات البحث ومنصات المعلومات
  4. القيمة الاجتماعية: المساعدة في تحسين محو الأمية المعلوماتية للجمهور والتفكير النقدي

السيناريوهات القابلة للتطبيق

  1. تحسين محركات البحث: مساعدة المستخدمين على تقييم اكتمال نتائج البحث بشكل أفضل
  2. المراقبة الإعلامية: توفير أداة للحكومات والمنظمات لتقييم جودة البيئة المعلوماتية
  3. التدريب التعليمي: استخدام في تدريب الطلاب والجمهور على محو الأمية المعلوماتية
  4. البحث الأكاديمي: توفير أداة قياس جديدة وإطار نظري للبحث في المجالات ذات الصلة

المراجع

تستشهد هذه الورقة بمراجع غنية متعددة التخصصات، تغطي:

  • استرجاع المعلومات ومعالجة اللغة الطبيعية (Vaswani et al., 2017; Devlin et al., 2018)
  • علم النفس والعلوم المعرفية (Baron, 2000; Stanovich & West, 2007)
  • العلوم السياسية والاتصالات (Dahlberg, 2001; Lazer et al., 2020)
  • العلوم الاجتماعية الحسابية (Hofman et al., 2021; Vosoughi et al., 2018)

تقدم هذه الدراسة منظوراً مهماً ومبتكراً في عصر الإفراط في المعلومات، وتساهم بشكل كبير في فهم وتحسين طريقة تفاعلنا مع المعلومات الرقمية من خلال منهجية صارمة وبحث تجريبي على نطاق واسع. على الرغم من وجود بعض القيود، فإن قيمتها النظرية والعملية تستحق الاهتمام والتطوير الإضافي.