Knowing Unknowns in an Age of Information Overload
Khanna
The technological revolution of the Internet has digitized the social, economic, political, and cultural activities of billions of humans. While researchers have been paying due attention to concerns of misinformation and bias, these obscure a much less researched and equally insidious problem - that of uncritically consuming incomplete information. The problem of incomplete information consumption stems from the very nature of explicitly ranked information on digital platforms, where our limited mental capacities leave us with little choice but to consume the tip of a pre-ranked information iceberg. This study makes two chief contributions. First, we leverage the context of internet search to propose an innovative metric that quantifies information completeness. For a given search query, this refers to the extent of the information spectrum that is observed during web browsing. We then validate this metric using 6.5 trillion search results extracted from daily search trends across 48 nations for one year. Second, we find causal evidence that awareness of information completeness while browsing the Internet reduces resistance to factual information, hence paving the way towards an open-minded and tolerant mindset.
academic
Знание неизвестного в эпоху информационной перегрузки
Интернет-революция оцифровала миллиарды социальной, экономической, политической и культурной деятельности человечества. Хотя исследователи уделяли внимание проблемам дезинформации и предвзятости, эти проблемы скрывают менее изученный, но одинаково коварный вопрос — некритическое потребление неполной информации. Проблема потребления неполной информации вытекает из природы явно упорядоченной информации на цифровых платформах; наши ограниченные когнитивные способности вынуждают нас потреблять только верхушку айсберга предварительно упорядоченной информации. Данное исследование вносит два основных вклада: во-первых, предлагает инновационный показатель для количественной оценки «полноты информации» на основе контекста поиска в Интернете; во-вторых, обнаруживает причинно-следственные доказательства того, что осведомленность о полноте информации снижает сопротивление фактической информации при просмотре Интернета.
Основная проблема, которую решает данное исследование: как люди узнают, что они не знают в эпоху информационной перегрузки (knowing unknowns)? Конкретнее: какую часть информационного спектра мы фактически видим при просмотре Интернета?
Информационный взрыв: глобальная сфера данных, по прогнозам, вырастет с 33 зеттабайт в 2018 году до 175 зеттабайт в 2025 году, с годовым темпом роста около 61%
Когнитивные ограничения: человеческие психические способности ограничены и не могут обработать экспоненциально растущий поток информации
Алгоритмическое упорядочение: информация в Интернете по своей природе упорядочена, пользователи склонны просматривать только результаты с высоким рейтингом
Социальное воздействие: потребление неполной информации может привести к усилению предвзятости и социальной фрагментации
Существующие исследования сосредоточены на двух аспектах:
Распространение дезинформации: изучение различий между информацией и объективной истиной
Справедливость алгоритмов: внимание к алгоритмической предвзятости и её влиянию на маргинализированные группы
Однако все эти исследования зависят от существования проверяемой объективной истины, в то время как субъективность и многообразие мнений в Интернете делают объективную истину скорее исключением, чем правилом.
Автор считает, что мы упустили одинаково важный вопрос: как количественно оценить и повысить осведомленность о полноте информации в контексте информационной перегрузки и некритического потребления неполной информации.
Инновационный показатель: предложен динамический показатель измерения «полноты информации» на основе текстовых эмбеддингов и технологий информационного поиска
Крупномасштабная валидация: использованы данные 6,5 триллиона результатов поиска (охватывающие 48 стран в течение одного года) для проверки показателя
Причинно-следственные доказательства: рандомизированный контролируемый эксперимент доказывает, что осведомленность о полноте информации снижает сопротивление фактической информации
Открытая платформа: разработана экспериментальная платформа поиска Sonder с открытым исходным кодом, которая динамически сообщает оценки полноты информации
Для заданного поискового запроса q: насколько репрезентативны первые n результатов поиска (n < N) из общего количества N результатов поиска? Это отличается от оценки того, содержат ли эти n результатов дезинформацию или предвзятость, а скорее оценивает полноту информации.
Проверка показателя путем сравнения полноты информации в разных странах со степенью свободы прессы (с использованием данных организации Reporters Without Borders).
После добавления региональных фиксированных эффектов величина эффекта снизилась до 0,17 процентных пункта (p < 0,001), что указывает на значительные различия на уровне стран в пределах регионов.
Валидность показателя: показатель полноты информации эффективно отражает степень свободы прессы в разных странах и регионах
Когнитивное воздействие: осведомленность о полноте информации в основном улучшает знаниевые аспекты (снижает сопротивление фактам), но имеет ограниченное влияние на межличностные аспекты
Изменение поведения: пользователи активно исследуют более глубокие и полные результаты поиска
Технологическая зависимость: качество показателя зависит от качества текстовых эмбеддингов, которые могут быть подвержены предвзятости обучающих данных
Культурные ограничения: концепция открытости мышления (AOT) происходит из западной психологии, её кросс-культурная применимость ограничена
Порог понимания: степень понимания участниками концепции полноты информации влияет на эффективность лечения
Инновационность проблемы: выявление и количественная оценка проблемы неполноты информации, которая была упущена, но важна
Методологическая строгость: сочетание крупномасштабных наблюдательных данных и рандомизированного контролируемого эксперимента обеспечивает достаточные эмпирические доказательства
Практическая ценность: разработка платформы поиска с открытым исходным кодом имеет потенциал практического применения
Междисциплинарная интеграция: объединение теорий и методов из информационного поиска, психологии, политологии и других областей
Статья цитирует богатую междисциплинарную литературу, охватывающую:
Информационный поиск и обработку естественного языка (Vaswani et al., 2017; Devlin et al., 2018)
Психологию и когнитивные науки (Baron, 2000; Stanovich & West, 2007)
Политологию и коммуникативистику (Dahlberg, 2001; Lazer et al., 2020)
Вычислительные социальные науки (Hofman et al., 2021; Vosoughi et al., 2018)
Данное исследование предлагает важную и инновационную перспективу в эпоху информационной перегрузки. Благодаря строгой методологии и крупномасштабному эмпирическому исследованию, оно вносит значительный вклад в понимание и улучшение нашего взаимодействия с цифровой информацией. Несмотря на некоторые ограничения, его теоретическая ценность и практическое значение заслуживают внимания и дальнейшего развития.