Knowing Unknowns in an Age of Information Overload
Khanna
The technological revolution of the Internet has digitized the social, economic, political, and cultural activities of billions of humans. While researchers have been paying due attention to concerns of misinformation and bias, these obscure a much less researched and equally insidious problem - that of uncritically consuming incomplete information. The problem of incomplete information consumption stems from the very nature of explicitly ranked information on digital platforms, where our limited mental capacities leave us with little choice but to consume the tip of a pre-ranked information iceberg. This study makes two chief contributions. First, we leverage the context of internet search to propose an innovative metric that quantifies information completeness. For a given search query, this refers to the extent of the information spectrum that is observed during web browsing. We then validate this metric using 6.5 trillion search results extracted from daily search trends across 48 nations for one year. Second, we find causal evidence that awareness of information completeness while browsing the Internet reduces resistance to factual information, hence paving the way towards an open-minded and tolerant mindset.
academic
Unbekanntes Wissen in einem Zeitalter der Informationsüberflutung
Die Internetrevolution hat Milliarden von menschlichen sozialen, wirtschaftlichen, politischen und kulturellen Aktivitäten digitalisiert. Während Forscher sich auf Fehlinformationen und Vorurteile konzentriert haben, verdecken diese Probleme eine weniger erforschte, aber gleichermaßen heimtückische Frage – die unkritische Konsumption unvollständiger Informationen. Das Problem der unvollständigen Informationskonsumption ergibt sich aus der Natur der explizit geordneten Informationen auf digitalen Plattformen; unsere begrenzten kognitiven Fähigkeiten zwingen uns, nur einen kleinen Teil des vorsortierten Informationseisbergs zu konsumieren. Diese Studie leistet zwei Hauptbeiträge: Erstens wird unter Verwendung des Kontexts der Internetsuche eine innovative Metrik zur Quantifizierung der „Informationsvollständigkeit" vorgeschlagen; zweitens werden kausale Belege dafür gefunden, dass das Bewusstsein für Informationsvollständigkeit beim Durchsuchen des Internets die Resistenz gegen faktische Informationen verringert.
Das Kernproblem dieser Studie ist: Wie können Menschen in einem Zeitalter der Informationsüberflutung wissen, was sie nicht wissen (knowing unknowns)? Konkret: Wie viel des Informationsspektrums sehen wir tatsächlich, wenn wir im Internet surfen?
Informationsexplosion: Die globale Datensphäre wird voraussichtlich von 33 Zettabyte im Jahr 2018 auf 175 Zettabyte im Jahr 2025 anwachsen, mit einer durchschnittlichen jährlichen Wachstumsrate von etwa 61%
Kognitive Grenzen: Die menschliche Gehirnkapazität ist begrenzt und kann mit exponentiell wachsenden Informationsströmen nicht Schritt halten
Algorithmische Sortierung: Internetinformationen sind von Natur aus sortiert; Benutzer neigen dazu, nur die am höchsten bewerteten Ergebnisse anzusehen
Gesellschaftliche Auswirkungen: Die Konsumption unvollständiger Informationen kann zu Vorurteilsverstärkung und gesellschaftlicher Polarisierung führen
Bestehende Forschung konzentriert sich hauptsächlich auf zwei Aspekte:
Verbreitung von Fehlinformationen: Untersuchung der Unterschiede zwischen Informationen und objektiver Wahrheit
Algorithmische Fairness: Fokus auf algorithmische Vorurteile und deren Auswirkungen auf marginalisierte Gruppen
Diese Forschungen setzen jedoch alle die Existenz überprüfbarer objektiver Wahrheit voraus, während Subjektivität und Meinungsvielfalt im Internet objektive Wahrheit eher zur Ausnahme als zur Regel machen.
Der Autor argumentiert, dass wir ein gleichermaßen wichtiges Problem übersehen haben: Wie man Informationsvollständigkeit im Kontext von Informationsüberflutung und unkritischer Konsumption unvollständiger Informationen quantifiziert und das Bewusstsein dafür erhöht.
Innovative Metrik: Vorschlag einer dynamischen Messgröße für „Informationsvollständigkeit" basierend auf Texteinbettungen und Informationsbeschaffungstechniken
Großflächige Validierung: Validierung der Metrik mit 6,5 Billionen Suchergebnissen (48 Länder, ein Jahr Dauer)
Kausale Evidenz: Randomisierte kontrollierte Experimente zeigen, dass das Bewusstsein für Informationsvollständigkeit die Resistenz gegen faktische Informationen verringert
Open-Source-Plattform: Entwicklung der experimentellen Open-Source-Websuchplattform Sonder, die Informationsvollständigkeitswerte dynamisch meldet
Für eine gegebene Suchanfrage q: Wie repräsentativ sind die ersten n Suchergebnisse (n < N) aus insgesamt N Suchergebnissen? Dies unterscheidet sich von der Bewertung, ob diese n Suchergebnisse Fehlinformationen oder Vorurteile enthalten, sondern bewertet die Vollständigkeit der Informationen.
Traditionelle Methoden konzentrieren sich auf die Relevanz zwischen Abfrage und einzelnem Suchergebnis:
Relevanz = cos(q⃗, r⃗ᵢ) = (q⃗ · r⃗ᵢ)/(‖q⃗‖‖r⃗ᵢ‖)
Die in diesem Papier vorgeschlagene Informationsvollständigkeitsmetrik konzentriert sich auf die semantische Ähnlichkeit zwischen Suchergebnissen und dem gesamten Ergebniskorpus:
Validierung der Metrik durch Vergleich der Informationsvollständigkeit verschiedener Länder mit der Medienfreiheit (unter Verwendung von Daten der Organisation Reporter ohne Grenzen).
Niedrigste Vollständigkeit: Nahost- und Nordafrikaregion (etwa 25% Vollständigkeit auf der ersten Seite)
Höchste Vollständigkeit: Nordamerika (etwa 62% Vollständigkeit auf der ersten Seite)
Statistische Beziehung: Für jede Erhöhung der Medienbeschränkungsbewertung um 1 Einheit sinkt die Informationsvollständigkeit um 0,28 Prozentpunkte (p < 0,001)
Nach Hinzufügen von regionalen Fixeffekten sinkt der Effekt auf 0,17 Prozentpunkte (p < 0,001), was darauf hindeutet, dass innerhalb von Regionen immer noch signifikante Unterschiede auf Länderebene bestehen.
Anzahl der Klicks: Behandlungsgruppe klickt durchschnittlich 2,182 weitere Ergebnisse an (p = 0,312, nicht signifikant)
Verbesserung der Vollständigkeit: Informationsvollständigkeitswerte der angeklickten Ergebnisse in der Behandlungsgruppe sind 7,6 Prozentpunkte höher (p = 0,001)
Metrik-Validität: Die Informationsvollständigkeitsmetrik kann effektiv die Medienfreiheit verschiedener Länder und Regionen widerspiegeln
Kognitive Auswirkungen: Das Bewusstsein für Informationsvollständigkeit verbessert hauptsächlich wissensbezogene Dimensionen (verringert faktische Resistenz), hat aber begrenzte Auswirkungen auf zwischenmenschliche Dimensionen
Verhaltensänderung: Benutzer werden aktiv tiefere und vollständigere Suchergebnisse erkunden
Technologische Abhängigkeit: Die Metrik-Qualität hängt von der Qualität der Texteinbettung ab und kann durch Verzerrungen in Trainingsdaten beeinflusst werden
Kulturelle Grenzen: Das Konzept der Offenheit des Denkens (AOT) stammt aus der westlichen Psychologie und hat begrenzte kulturübergreifende Anwendbarkeit
Verständnisschwelle: Der Grad des Verständnisses der Teilnehmer für das Konzept der Informationsvollständigkeit beeinflusst die Behandlungseffektivität
Problemnovität: Identifizierung und Quantifizierung des übersehenen, aber wichtigen Problems der Informationsunvollständigkeit
Methodische Strenge: Kombination großflächiger Beobachtungsdaten und randomisierter kontrollierter Experimente mit ausreichenden empirischen Belegen
Praktischer Wert: Entwicklung einer Open-Source-Suchplattform mit realem Anwendungspotenzial
Interdisziplinäre Integration: Synthese von Theorien und Methoden aus Informationsbeschaffung, Psychologie, Politikwissenschaft und anderen Disziplinen
Dieses Papier zitiert umfangreiche interdisziplinäre Literatur, einschließlich:
Informationsbeschaffung und natürliche Sprachverarbeitung (Vaswani et al., 2017; Devlin et al., 2018)
Psychologie und Kognitionswissenschaft (Baron, 2000; Stanovich & West, 2007)
Politikwissenschaft und Kommunikationswissenschaft (Dahlberg, 2001; Lazer et al., 2020)
Rechnergestützte Sozialwissenschaften (Hofman et al., 2021; Vosoughi et al., 2018)
Diese Forschung bietet eine wichtige und innovative Perspektive im Zeitalter der Informationsüberflutung und trägt durch strenge Methodik und großflächige empirische Forschung wesentlich zum Verständnis und zur Verbesserung unserer Interaktion mit digitalen Informationen bei. Trotz einiger Einschränkungen sind ihr theoretischer Wert und ihre praktische Bedeutung beachtenswert und verdienen weitere Entwicklung und Aufmerksamkeit.