Knowing Unknowns in an Age of Information Overload
Khanna
The technological revolution of the Internet has digitized the social, economic, political, and cultural activities of billions of humans. While researchers have been paying due attention to concerns of misinformation and bias, these obscure a much less researched and equally insidious problem - that of uncritically consuming incomplete information. The problem of incomplete information consumption stems from the very nature of explicitly ranked information on digital platforms, where our limited mental capacities leave us with little choice but to consume the tip of a pre-ranked information iceberg. This study makes two chief contributions. First, we leverage the context of internet search to propose an innovative metric that quantifies information completeness. For a given search query, this refers to the extent of the information spectrum that is observed during web browsing. We then validate this metric using 6.5 trillion search results extracted from daily search trends across 48 nations for one year. Second, we find causal evidence that awareness of information completeness while browsing the Internet reduces resistance to factual information, hence paving the way towards an open-minded and tolerant mindset.
academic
Conocer lo Desconocido en una Era de Sobrecarga de Información
La revolución tecnológica de Internet ha digitalizado miles de millones de actividades sociales, económicas, políticas y culturales humanas. Aunque los investigadores han prestado atención a los problemas de desinformación y sesgo, estos enmascaraban un problema menos estudiado pero igualmente insidioso: el consumo acrítico de información incompleta. El problema del consumo de información incompleta surge de la naturaleza inherentemente ordenada de la información en plataformas digitales, y nuestras capacidades mentales limitadas nos obligan a consumir solo una pequeña fracción del iceberg de información preordenada. Este estudio realiza dos contribuciones principales: primero, propone una métrica innovadora para cuantificar la "integridad de la información" utilizando el contexto de búsquedas en Internet; segundo, presenta evidencia causal de que la conciencia sobre la integridad de la información reduce la resistencia a los hechos al navegar por Internet.
El problema central que aborda esta investigación es: ¿cómo pueden las personas saber qué no saben en una era de sobrecarga de información (knowing unknowns)? Específicamente, ¿cuánto del espectro de información realmente vemos cuando navegamos por Internet?
Explosión de Información: Se proyecta que la esfera de datos global crezca de 33 zettabytes en 2018 a 175 zettabytes en 2025, con una tasa de crecimiento anual compuesto de aproximadamente 61%
Limitaciones Cognitivas: La capacidad mental humana es limitada y no puede procesar flujos de información que crecen exponencialmente
Ordenamiento Algorítmico: La información en Internet es inherentemente ordenada, y los usuarios tienden a ver solo los resultados mejor clasificados
Impacto Social: El consumo de información incompleta puede conducir al refuerzo de sesgos y a la fragmentación social
La investigación existente se enfoca principalmente en dos aspectos:
Propagación de Desinformación: Estudia las diferencias entre la información y la verdad objetiva
Equidad Algorítmica: Se enfoca en el daño del sesgo algorítmico a grupos marginados
Sin embargo, estas investigaciones dependen de la existencia de una verdad objetiva verificable, mientras que la subjetividad y la diversidad de opiniones en Internet hacen que la verdad objetiva sea más una excepción que la norma.
El autor argumenta que hemos pasado por alto un problema igualmente importante: cómo cuantificar y aumentar la conciencia sobre la integridad de la información en el contexto de la sobrecarga de información y el consumo acrítico de información incompleta.
Métrica Innovadora: Propone una métrica de medición dinámica de "integridad de la información" basada en incrustaciones de texto y tecnologías de recuperación de información
Validación a Gran Escala: Valida la métrica utilizando 6.5 billones de resultados de búsqueda (cubriendo 48 países durante un año)
Evidencia Causal: Mediante un ensayo controlado aleatorizado, demuestra que la conciencia sobre la integridad de la información reduce la resistencia a los hechos
Plataforma de Código Abierto: Desarrolla una plataforma experimental de búsqueda web de código abierto llamada Sonder, que reporta dinámicamente puntuaciones de integridad de la información
Para una consulta de búsqueda dada q, de un total de N resultados de búsqueda, ¿qué tan representativos son los primeros n resultados visualizados (n < N)? Esto es diferente de evaluar si estos n resultados contienen desinformación o sesgo, sino que evalúa la integridad de la información.
La métrica de integridad de la información propuesta en este artículo se enfoca en la similitud semántica entre los resultados de búsqueda y todo el corpus de resultados:
Valida la métrica comparando la integridad de la información en diferentes países con la libertad de prensa (utilizando datos de Reporteros sin Fronteras).
Integridad Más Baja: Región de Oriente Medio y Norte de África (aproximadamente 25% de integridad en la primera página)
Integridad Más Alta: América del Norte (aproximadamente 62% de integridad en la primera página)
Relación Estadística: Por cada aumento de 1 unidad en la puntuación de restricciones de medios, la integridad de la información disminuye 0.28 puntos porcentuales (p < 0.001)
Después de agregar efectos fijos regionales, el tamaño del efecto se reduce a 0.17 puntos porcentuales (p < 0.001), indicando que aún existen diferencias significativas a nivel nacional dentro de las regiones.
Profundidad de Búsqueda: El grupo de tratamiento visualizó resultados clasificados en promedio 6.14 posiciones más abajo (p < 0.001)
Cantidad de Clics: El grupo de tratamiento hizo en promedio 2.182 clics adicionales (p = 0.312, no significativo)
Mejora de Integridad: La puntuación de integridad de la información de los resultados en los que hizo clic el grupo de tratamiento fue 7.6 puntos porcentuales más alta (p = 0.001)
Validez de la Métrica: La métrica de integridad de la información puede reflejar efectivamente el grado de libertad de prensa en diferentes países y regiones
Impacto Cognitivo: La conciencia sobre la integridad de la información mejora principalmente dimensiones relacionadas con el conocimiento (reduciendo la resistencia a los hechos), con impacto limitado en dimensiones interpersonales
Cambio de Comportamiento: Los usuarios explorarán activamente resultados de búsqueda más profundos y completos
Dependencia Tecnológica: La calidad de la métrica depende de la calidad de las incrustaciones de texto, que pueden verse afectadas por sesgos en los datos de entrenamiento
Limitaciones Culturales: El concepto de mentalidad abierta (AOT) proviene de la psicología occidental, con aplicabilidad transcultural limitada
Umbral de Comprensión: El grado de comprensión de los participantes sobre el concepto de integridad de la información afecta la efectividad del tratamiento
Este artículo cita literatura interdisciplinaria abundante que abarca:
Recuperación de información y procesamiento del lenguaje natural (Vaswani et al., 2017; Devlin et al., 2018)
Psicología y ciencias cognitivas (Baron, 2000; Stanovich & West, 2007)
Ciencia política y comunicación (Dahlberg, 2001; Lazer et al., 2020)
Ciencia computacional social (Hofman et al., 2021; Vosoughi et al., 2018)
Esta investigación presenta una perspectiva importante e innovadora en una era de sobrecarga de información. A través de una metodología rigurosa e investigación empírica a gran escala, realiza contribuciones importantes para comprender y mejorar la forma en que interactuamos con la información digital. Aunque existen algunas limitaciones, tanto su valor teórico como su significado práctico merecen atención y desarrollo posterior.