Knowing Unknowns in an Age of Information Overload
Khanna
The technological revolution of the Internet has digitized the social, economic, political, and cultural activities of billions of humans. While researchers have been paying due attention to concerns of misinformation and bias, these obscure a much less researched and equally insidious problem - that of uncritically consuming incomplete information. The problem of incomplete information consumption stems from the very nature of explicitly ranked information on digital platforms, where our limited mental capacities leave us with little choice but to consume the tip of a pre-ranked information iceberg. This study makes two chief contributions. First, we leverage the context of internet search to propose an innovative metric that quantifies information completeness. For a given search query, this refers to the extent of the information spectrum that is observed during web browsing. We then validate this metric using 6.5 trillion search results extracted from daily search trends across 48 nations for one year. Second, we find causal evidence that awareness of information completeness while browsing the Internet reduces resistance to factual information, hence paving the way towards an open-minded and tolerant mindset.
academic
Connaître les Inconnues à l'Ère de la Surcharge Informationnelle
La révolution technologique d'Internet a numérisé les activités sociales, économiques, politiques et culturelles de milliards de personnes. Bien que les chercheurs se soient concentrés sur les problèmes de désinformation et de biais, ces questions masquent un problème moins étudié mais tout aussi insidieux : la consommation non critique d'informations incomplètes. Le problème de la consommation d'informations incomplètes découle de la nature intrinsèquement ordonnée des informations sur les plateformes numériques ; nos capacités cognitives limitées nous obligent à ne consommer qu'une fraction de l'iceberg d'informations préordonnées. Cette recherche apporte deux contributions majeures : premièrement, elle propose une métrique innovante pour quantifier l'« intégrité informationnelle » en s'appuyant sur le contexte de la recherche Internet ; deuxièmement, elle fournit des preuves causales que la sensibilisation à l'intégrité informationnelle réduit la résistance aux faits lors de la navigation sur Internet.
Le problème central que cette recherche vise à résoudre est : à l'ère de la surcharge informationnelle, comment les gens peuvent-ils savoir ce qu'ils ne savent pas (knowing unknowns) ? Plus précisément, lorsque nous naviguons sur Internet, quel pourcentage du spectre informatif réel voyons-nous réellement ?
Explosion informationnelle : La sphère de données mondiale devrait croître de 33 zettaoctets en 2018 à 175 zettaoctets en 2025, avec un taux de croissance annuel composé d'environ 61 %
Limitations cognitives : Les capacités psychologiques humaines sont limitées et ne peuvent pas traiter les flux informationnels en croissance exponentielle
Classement algorithmique : Les informations sur Internet sont intrinsèquement ordonnées ; les utilisateurs ont tendance à ne consulter que les résultats les mieux classés
Impact social : La consommation d'informations incomplètes peut entraîner le renforcement des biais et la fragmentation sociale
La recherche existante se concentre principalement sur deux aspects :
Propagation de la désinformation : Étudier les écarts entre l'information et la vérité objective
Équité algorithmique : Examiner les biais algorithmiques nuisant aux groupes marginalisés
Cependant, ces recherches dépendent toutes de l'existence d'une vérité objective vérifiable, tandis que la subjectivité et la diversité des opinions sur Internet rendent la vérité objective plus une exception qu'une règle.
L'auteur soutient que nous avons négligé un problème tout aussi important : comment quantifier et améliorer la sensibilisation à l'intégrité informationnelle dans un contexte de surcharge informationnelle et de consommation non critique d'informations incomplètes.
Métrique innovante : Propose une métrique dynamique de mesure de l'« intégrité informationnelle » basée sur les plongements de texte et les techniques de récupération d'informations
Validation à grande échelle : Valide la métrique à l'aide de 6,5 billions de résultats de recherche (couvrant 48 pays sur une période d'un an)
Preuves causales : Démontre par essai contrôlé randomisé que la sensibilisation à l'intégrité informationnelle réduit la résistance aux faits
Plateforme open-source : Développe une plateforme expérimentale de moteur de recherche web open-source appelée Sonder, capable de rapporter dynamiquement les scores d'intégrité informationnelle
Pour une requête de recherche donnée q, parmi N résultats de recherche au total, dans quelle mesure les n premiers résultats consultés (n < N) sont-ils représentatifs ? Cela diffère de l'évaluation de la présence de désinformation ou de biais dans ces n résultats ; il s'agit plutôt d'évaluer l'intégrité informationnelle.
La métrique d'intégrité informationnelle proposée dans cet article se concentre sur la similarité sémantique entre les résultats de recherche et l'ensemble du corpus de résultats :
Valide la métrique en comparant l'intégrité informationnelle dans différents pays avec la liberté des médias (en utilisant les données de Reporters sans frontières).
Intégrité la plus faible : Région Moyen-Orient et Afrique du Nord (environ 25 % d'intégrité sur la première page)
Intégrité la plus élevée : Région Amérique du Nord (environ 62 % d'intégrité sur la première page)
Relation statistique : Chaque augmentation d'une unité du score de restriction médiatique réduit l'intégrité informationnelle de 0,28 point de pourcentage (p < 0,001)
Après l'ajout d'effets fixes régionaux, l'ampleur de l'effet diminue à 0,17 point de pourcentage (p < 0,001), indiquant que des différences significatives au niveau national subsistent au sein des régions.
Profondeur de recherche : Le groupe de traitement consulte en moyenne 6,14 positions supplémentaires vers le bas (p < 0,001)
Nombre de clics : Le groupe de traitement clique en moyenne sur 2,182 résultats supplémentaires (p = 0,312, non significatif)
Amélioration de l'intégrité : Le score d'intégrité informationnelle des résultats cliqués par le groupe de traitement est supérieur de 7,6 points de pourcentage (p = 0,001)
Validité de la métrique : La métrique d'intégrité informationnelle reflète efficacement le degré de liberté des médias dans différents pays et régions
Impact cognitif : La sensibilisation à l'intégrité informationnelle améliore principalement les dimensions liées aux connaissances (réduction de la résistance aux faits), avec un impact limité sur les dimensions interpersonnelles
Changement comportemental : Les utilisateurs explorent activement des résultats de recherche plus profonds et plus complets
Dépendance technologique : La qualité de la métrique dépend de la qualité des plongements de texte, qui peuvent être affectés par les biais des données d'entraînement
Limitations culturelles : Le concept d'ouverture d'esprit (AOT) provient de la psychologie occidentale, avec une applicabilité transculturelle limitée
Seuil de compréhension : Le degré de compréhension des participants concernant le concept d'intégrité informationnelle affecte l'efficacité du traitement
Innovativité du problème : Identifie et quantifie l'incomplétude informationnelle, un problème négligé mais important
Rigueur méthodologique : Combine des données observationnelles à grande échelle et des essais contrôlés randomisés, fournissant des preuves empiriques solides
Valeur pratique : Développe une plateforme de moteur de recherche open-source avec un potentiel d'application réelle
Intégration interdisciplinaire : Fusionne les théories et méthodes de la récupération d'informations, de la psychologie, des sciences politiques et d'autres domaines
Cet article cite une riche littérature interdisciplinaire, couvrant :
La récupération d'informations et le traitement du langage naturel (Vaswani et al., 2017 ; Devlin et al., 2018)
La psychologie et les sciences cognitives (Baron, 2000 ; Stanovich & West, 2007)
Les sciences politiques et la communication (Dahlberg, 2001 ; Lazer et al., 2020)
Les sciences sociales computationnelles (Hofman et al., 2021 ; Vosoughi et al., 2018)
Cette recherche propose une perspective importante et innovante à l'ère de la surcharge informationnelle. Grâce à une méthodologie rigoureuse et à des recherches empiriques à grande échelle, elle apporte des contributions significatives à la compréhension et à l'amélioration de notre interaction avec les informations numériques. Malgré certaines limitations, sa valeur théorique et sa signification pratique méritent attention et développement ultérieur.