Leveraging Twitter Data for Sentiment Analysis of Transit User Feedback: An NLP Framework
Das, Prajapati, Zhang et al.
Traditional methods of collecting user feedback through transit surveys are often time-consuming, resource intensive, and costly. In this paper, we propose a novel NLP-based framework that harnesses the vast, abundant, and inexpensive data available on social media platforms like Twitter to understand users' perceptions of various service issues. Twitter, being a microblogging platform, hosts a wealth of real-time user-generated content that often includes valuable feedback and opinions on various products, services, and experiences. The proposed framework streamlines the process of gathering and analyzing user feedback without the need for costly and time-consuming user feedback surveys using two techniques. First, it utilizes few-shot learning for tweet classification within predefined categories, allowing effective identification of the issues described in tweets. It then employs a lexicon-based sentiment analysis model to assess the intensity and polarity of the tweet sentiments, distinguishing between positive, negative, and neutral tweets. The effectiveness of the framework was validated on a subset of manually labeled Twitter data and was applied to the NYC subway system as a case study. The framework accurately classifies tweets into predefined categories related to safety, reliability, and maintenance of the subway system and effectively measured sentiment intensities within each category. The general findings were corroborated through a comparison with an agency-run customer survey conducted in the same year. The findings highlight the effectiveness of the proposed framework in gauging user feedback through inexpensive social media data to understand the pain points of the transit system and plan for targeted improvements.
academic
Использование данных Twitter для анализа тональности отзывов пользователей транспорта: фреймворк NLP
Традиционные опросы пассажиров общественного транспорта требуют значительных ресурсов и времени, что ограничивает их способность эффективно решать локальные проблемы. В данном исследовании предлагается фреймворк на основе NLP, который использует данные в реальном времени из Twitter (теперь X) в качестве инструмента предварительного отбора для оптимизации и целевого направления опросов транспортных организаций. Фреймворк применяет двухэтапный подход: обучение с малым количеством примеров (Few-Shot learning) классифицирует твиты по категориям безопасности, надежности и обслуживания, а словарный анализ тональности оценивает полярность эмоций (положительная, отрицательная, нейтральная) и интенсивность. Кроме того, пространственный анализ отображает тенденции тональности на конкретные географические области, позволяя транспортным организациям точно определять и приоритизировать проблемные зоны.
Ограничения традиционных опросов: опросы пассажиров общественного транспорта требуют высоких затрат, отнимают много времени и имеют ограниченный географический охват. Исследования показывают, что средние затраты транспортных организаций на проведение опроса составляют примерно 36 долларов на человека, а общие средние затраты на опрос среднего размера составляют около 350 000 долларов.
Потенциал данных социальных сетей: Twitter имеет более 3,3 миллиарда активных пользователей и генерирует примерно 500 миллионов твитов в день, предоставляя уникальные возможности для получения крупномасштабных данных в реальном времени о настроениях и опыте пользователей.
Необходимость географической точности: данные социальных сетей могут выявить проблемы и настроения в конкретных местах, позволяя транспортным организациям определить уникальные потребности и вызовы различных сообществ.
Входные данные: текст твитов, временные метки, географические теги
Выходные данные: классификация категорий твитов, оценки полярности и интенсивности эмоций, анализ пространственного распределения
Ограничения: твиты должны быть связаны с системой общественного транспорта, необходимо обработать неформальный язык и выражения, специфичные для социальных сетей
Основной принцип: основан на предварительно построенном словаре эмоций, отображающем лексические особенности на оценки интенсивности эмоций
Диапазон оценок: оценки на уровне слова от -4 до 4, составные оценки на уровне предложения от -1 до +1
Формула нормализации:
CSCi=xi2+αxi
где xi — сумма оценок эмоций составляющих слов в твите i, α=15 — параметр нормализации
Применение Few-Shot обучения: решает проблему сложной аннотации крупномасштабных твитов, достигая высокой точности с минимальным количеством размеченных примеров
Многомерный фреймворк анализа: одновременное рассмотрение классификации, эмоций и пространственного измерения
Стратегия пространственного отображения: отображение геотегированных твитов на станции метро в радиусе 1 мили, обеспечивающее точный пространственный анализ
Возможность обработки в реальном времени: архитектура фреймворка поддерживает обработку и анализ крупномасштабных данных социальных сетей в реальном времени
Период наибольшей удовлетворенности: март и летние месяцы (июнь-сентябрь)
Изменение доли отрицательных твитов: снижение с 33% в апреле-мае до 28% в июне-августе
Согласованность с опросом MTA: опрос осенью 2022 года показал 54% удовлетворенность пассажиров метро, что на 6 процентных пункта выше, чем в весеннем опросе
Статья предоставляет 8 конкретных примеров твитов, демонстрирующих способность фреймворка обрабатывать сложные эмоции (такие как сарказм) и точно классифицировать. Например:
Отрицательный твит об обслуживании: "Why would you WANT to ride the subway without a mask? It is so stinky" (оценка: -0,6651)
Положительный твит о расписании: твит с благодарностью проводнику за открытие дверей (оценка: 0,7701)
Эффективность фреймворка: предложенный фреймворк NLP может точно классифицировать твиты и измерять интенсивность эмоций, показывая высокую согласованность с официальными опросами
Экономическая эффективность: анализ данных социальных сетей может служить жизнеспособной альтернативой или дополнением к дорогостоящим опросам пользователей
Пространственная точность: способность определять точки концентрации проблем в конкретных географических областях, поддерживая оптимальное распределение ресурсов
Возможность мониторинга в реальном времени: обеспечение постоянного мониторинга общественного мнения и поддержка принятия решений на основе данных
Поддержка многоязычности: расширение фреймворка для обработки многоязычных твитов
Оптимизация обработки в реальном времени: повышение способности к обработке крупномасштабных данных в реальном времени
Применение в других областях: применение фреймворка к аэропортам, автобусам, парковкам, услугам совместного использования и другим транспортным услугам
Анализ политики тарификации: оценка влияния изменений тарифов на удовлетворенность пользователей
Высокая инновационность методологии: комбинация Few-Shot обучения и анализа тональности VADER является инновационной и эффективно решает проблему крупномасштабной аннотации
Достаточный дизайн экспериментов: крупномасштабный анализ 36 000 твитов, валидация на 500 вручную аннотированных твитов, сравнение с официальными опросами MTA
Высокая практическая ценность: предоставляет транспортным организациям экономически эффективную альтернативу для сбора отзывов пользователей
Глубокий пространственный анализ: анализ эмоций с географическим измерением обеспечивает мощную поддержку для целевого вмешательства
Высокая надежность результатов: согласованность с официальными опросами MTA повышает достоверность фреймворка
Ограниченная способность к обобщению: валидация проведена только на системе метро Нью-Йорка, применимость к другим городам и транспортным системам требует дальнейшей проверки
Ограниченный временной охват: анализ только данных 2022 года, недостаточно для анализа долгосрочных тенденций
Зависимость от технологии: зависимость от коммерческого API (GPT-3.5) может привести к проблемам с затратами и доступностью
Однообразие метрик оценки: в основном полагается на сравнение с официальными опросами, недостаточно валидации по другим измерениям
Статья цитирует 64 соответствующих источника, охватывающих анализ тональности, обработку естественного языка, исследования транспорта, анализ социальных сетей и другие области, предоставляя прочную теоретическую базу и методологическую поддержку для данного исследования.
Общая оценка: это высококачественная прикладная исследовательская работа, которая успешно применяет передовые технологии NLP к практическим проблемам городского транспорта. Статья отличается инновационной методологией, достаточным экспериментальным дизайном и надежными результатами, обладая значительной академической ценностью и практической значимостью. Несмотря на некоторые ограничения, она предоставляет ценный технологический путь и практический опыт для цифровой трансформации в области транспорта.