Knowing Unknowns in an Age of Information Overload
Khanna
The technological revolution of the Internet has digitized the social, economic, political, and cultural activities of billions of humans. While researchers have been paying due attention to concerns of misinformation and bias, these obscure a much less researched and equally insidious problem - that of uncritically consuming incomplete information. The problem of incomplete information consumption stems from the very nature of explicitly ranked information on digital platforms, where our limited mental capacities leave us with little choice but to consume the tip of a pre-ranked information iceberg. This study makes two chief contributions. First, we leverage the context of internet search to propose an innovative metric that quantifies information completeness. For a given search query, this refers to the extent of the information spectrum that is observed during web browsing. We then validate this metric using 6.5 trillion search results extracted from daily search trends across 48 nations for one year. Second, we find causal evidence that awareness of information completeness while browsing the Internet reduces resistance to factual information, hence paving the way towards an open-minded and tolerant mindset.
academic
Conoscere le Incognite in un'Era di Sovraccarico Informativo
La rivoluzione tecnologica di Internet ha digitalizzato miliardi di attività sociali, economiche, politiche e culturali umane. Sebbene i ricercatori si siano concentrati su problemi di disinformazione e pregiudizio, questi mascherano una questione meno studiata ma altrettanto insidiosa: il consumo acritico di informazioni incomplete. Il problema del consumo di informazioni incomplete deriva dalla natura intrinsecamente ordinata delle informazioni sulle piattaforme digitali; le nostre capacità cognitive limitate ci costringono a consumare solo una frazione della punta dell'iceberg informativo preordinato. Questo studio fornisce due contributi principali: in primo luogo, propone una metrica innovativa per quantificare la "completezza informativa" utilizzando il contesto della ricerca su Internet; in secondo luogo, fornisce prove causali che la consapevolezza della completezza informativa riduce la resistenza ai fatti durante la navigazione di Internet.
Il problema centrale affrontato da questa ricerca è: in un'era di sovraccarico informativo, come possiamo sapere ciò che non sappiamo (knowing unknowns)? Più specificamente, quando navighiamo su Internet, quanto dello spettro informativo effettivamente vediamo?
Esplosione Informativa: La sfera dati globale dovrebbe crescere da 33 zettabyte nel 2018 a 175 zettabyte nel 2025, con un tasso di crescita annuale composto di circa il 61%
Limitazioni Cognitive: Le capacità cognitive umane sono limitate e non possono elaborare flussi informativi in crescita esponenziale
Ordinamento Algoritmico: Le informazioni su Internet sono intrinsecamente ordinate; gli utenti tendono a visualizzare solo i risultati di alto rango
Impatto Sociale: Il consumo di informazioni incomplete può portare al rafforzamento dei pregiudizi e alla frammentazione sociale
La ricerca esistente si concentra principalmente su due aspetti:
Diffusione della Disinformazione: Studio della divergenza tra informazioni e verità oggettiva
Equità Algoritmica: Attenzione al pregiudizio algoritmico che danneggia i gruppi emarginati
Tuttavia, queste ricerche si basano tutte sull'esistenza di una verità oggettiva verificabile, mentre la soggettività e la diversità di opinioni su Internet rendono la verità oggettiva più un'eccezione che una norma.
L'autore sostiene che abbiamo trascurato un problema altrettanto importante: come quantificare e aumentare la consapevolezza della completezza informativa nel contesto del sovraccarico informativo e del consumo acritico di informazioni incomplete.
Metrica Innovativa: Propone una metrica di misurazione dinamica della "completezza informativa" basata su embedding di testo e tecniche di recupero informativo
Validazione su Larga Scala: Utilizza 6,5 trilioni di risultati di ricerca (coprendo 48 paesi, per un anno) per validare la metrica
Prove Causali: Attraverso esperimenti controllati randomizzati, dimostra che la consapevolezza della completezza informativa riduce la resistenza ai fatti
Piattaforma Open Source: Sviluppa la piattaforma sperimentale di ricerca web open source Sonder, che può segnalare dinamicamente i punteggi di completezza informativa
Per una query di ricerca q data, da un totale di N risultati di ricerca, quanto sono rappresentativi i primi n risultati visualizzati (n < N)? Questo differisce dalla valutazione se questi n risultati contengono disinformazione o pregiudizio, ma valuta la completezza dell'informazione.
L'approccio tradizionale si concentra sulla rilevanza tra query e singoli risultati di ricerca:
Rilevanza = cos(q⃗, r⃗ᵢ) = (q⃗ · r⃗ᵢ)/(‖q⃗‖‖r⃗ᵢ‖)
La metrica di completezza informativa proposta in questo articolo si concentra sulla somiglianza semantica tra i risultati di ricerca e l'intero corpus di risultati:
Convalida la metrica confrontando la completezza informativa di diversi paesi con la libertà dei media (utilizzando dati di Reporters Without Borders).
Completezza Più Bassa: Regione Medio Oriente e Nord Africa (circa 25% di completezza nella prima pagina)
Completezza Più Alta: Nord America (circa 62% di completezza nella prima pagina)
Relazione Statistica: Per ogni aumento unitario del punteggio di restrizione mediatica, la completezza informativa diminuisce di 0,28 punti percentuali (p < 0,001)
Dopo l'inclusione di effetti fissi regionali, l'entità dell'effetto diminuisce a 0,17 punti percentuali (p < 0,001), indicando differenze significative a livello nazionale all'interno delle regioni.
Effetto Complessivo: Il gruppo di trattamento mostra un miglioramento del pensiero aperto di 0,076 unità di deviazione standard (p = 0,207, non significativo)
Resistenza ai Fatti: Riduzione significativa di 0,212 unità di deviazione standard (p = 0,003, statisticamente significativo)
Dogmatismo: Riduzione di 0,048 unità di deviazione standard (p = 0,432, non significativo)
Personalizzazione delle Credenze: Riduzione di 0,012 unità di deviazione standard (p = 0,777, non significativo)
Pensiero Liberale: Riduzione di 0,032 unità di deviazione standard (p = 1,302, non significativo)
Profondità di Ricerca: Il gruppo di trattamento visualizza risultati di rango minimo mediamente 6,14 posizioni più in basso (p < 0,001)
Numero di Clic: Il gruppo di trattamento fa in media 2,182 clic in più sui risultati (p = 0,312, non significativo)
Miglioramento della Completezza: I risultati su cui ha fatto clic il gruppo di trattamento hanno punteggi di completezza informativa superiori di 7,6 punti percentuali (p = 0,001)
Validità della Metrica: La metrica di completezza informativa riflette efficacemente il grado di libertà dei media in diversi paesi e regioni
Impatto Cognitivo: La consapevolezza della completezza informativa migliora principalmente le dimensioni correlate alla conoscenza (riduce la resistenza ai fatti), con effetti limitati sulle dimensioni interpersonali
Cambiamento Comportamentale: Gli utenti esplorano attivamente risultati di ricerca più profondi e completi
Dipendenza Tecnologica: La qualità della metrica dipende dalla qualità degli embedding di testo, che potrebbe essere influenzata da pregiudizi nei dati di addestramento
Limitazioni Culturali: Il concetto di pensiero aperto (AOT) proviene dalla psicologia occidentale, con applicabilità transculturale limitata
Soglia di Comprensione: Il grado di comprensione dei partecipanti del concetto di completezza informativa influisce sull'efficacia del trattamento
Questo articolo cita una ricca letteratura interdisciplinare, che comprende:
Recupero informativo e elaborazione del linguaggio naturale (Vaswani et al., 2017; Devlin et al., 2018)
Psicologia e scienze cognitive (Baron, 2000; Stanovich & West, 2007)
Scienze politiche e comunicazione (Dahlberg, 2001; Lazer et al., 2020)
Scienze sociali computazionali (Hofman et al., 2021; Vosoughi et al., 2018)
Questa ricerca propone una prospettiva importante e innovativa nell'era del sovraccarico informativo, fornendo contributi significativi alla comprensione e al miglioramento del nostro modo di interagire con le informazioni digitali attraverso metodologie rigorose e ricerca empirica su larga scala. Nonostante alcune limitazioni, il suo valore teorico e il suo significato pratico meritano attenzione e ulteriore sviluppo.