2025-11-24T02:19:18.891948

Leveraging Twitter Data for Sentiment Analysis of Transit User Feedback: An NLP Framework

Das, Prajapati, Zhang et al.
Traditional methods of collecting user feedback through transit surveys are often time-consuming, resource intensive, and costly. In this paper, we propose a novel NLP-based framework that harnesses the vast, abundant, and inexpensive data available on social media platforms like Twitter to understand users' perceptions of various service issues. Twitter, being a microblogging platform, hosts a wealth of real-time user-generated content that often includes valuable feedback and opinions on various products, services, and experiences. The proposed framework streamlines the process of gathering and analyzing user feedback without the need for costly and time-consuming user feedback surveys using two techniques. First, it utilizes few-shot learning for tweet classification within predefined categories, allowing effective identification of the issues described in tweets. It then employs a lexicon-based sentiment analysis model to assess the intensity and polarity of the tweet sentiments, distinguishing between positive, negative, and neutral tweets. The effectiveness of the framework was validated on a subset of manually labeled Twitter data and was applied to the NYC subway system as a case study. The framework accurately classifies tweets into predefined categories related to safety, reliability, and maintenance of the subway system and effectively measured sentiment intensities within each category. The general findings were corroborated through a comparison with an agency-run customer survey conducted in the same year. The findings highlight the effectiveness of the proposed framework in gauging user feedback through inexpensive social media data to understand the pain points of the transit system and plan for targeted improvements.
academic

Sfruttare i Dati di Twitter per l'Analisi del Sentimento dei Feedback degli Utenti del Trasporto: Un Framework NLP

Informazioni Fondamentali

  • ID Articolo: 2310.07086
  • Titolo: Urban Echoes: Decoding Transit Riders' Sentiments on Social Media for Smarter Mobility
  • Autori: Adway Das, Abhishek Kumar Prajapati, Pengxiang Zhang, Mukund Srinath, Andisheh Ranjbari
  • Istituzioni Affiliate: The Pennsylvania State University, Optym Inc.
  • Classificazione: cs.AI cs.SI
  • Data di Pubblicazione: Ottobre 2023 (arXiv v2: Ottobre 2025)
  • Link dell'Articolo: https://arxiv.org/abs/2310.07086v2

Riassunto

I sondaggi tradizionali sui trasporti pubblici consumano risorse significative e richiedono molto tempo, limitando la loro capacità di affrontare efficacemente problemi specifici di determinate località. Questo studio propone un framework basato su NLP che sfrutta i dati in tempo reale di Twitter (ora X) come strumento di pre-screening per ottimizzare e indirizzare i sondaggi delle agenzie di trasporto. Il framework adotta un approccio a due fasi: l'apprendimento Few-Shot classifica i tweet in categorie quali sicurezza, affidabilità e manutenzione, mentre un modello di analisi del sentimento basato su dizionario valuta la polarità del sentimento (positivo, negativo, neutro) e l'intensità. Inoltre, l'analisi spaziale mappa le tendenze del sentimento su aree geografiche specifiche, consentendo alle agenzie di trasporto di localizzare e dare priorità alle aree problematiche con precisione.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

  1. Limitazioni dei Sondaggi Tradizionali: I sondaggi sul feedback degli utenti del trasporto pubblico sono costosi, richiedono molto tempo e hanno una copertura geografica limitata. La ricerca mostra che il costo pro capite per le agenzie di trasporto che conducono sondaggi è di circa 36 dollari, con un costo totale medio di circa 350.000 dollari per sondaggi di medie dimensioni.
  2. Potenziale dei Dati dei Social Media: Twitter ha oltre 3,3 miliardi di utenti attivi e genera circa 500 milioni di tweet al giorno, offrendo un'opportunità unica per ottenere intuizioni in tempo reale su larga scala sui sentimenti e le esperienze degli utenti.
  3. Necessità di Precisione Geografica: I dati dei social media possono rivelare problemi e sentimenti specifici di determinate località, consentendo alle agenzie di trasporto di identificare esigenze e sfide uniche di diverse comunità.

Importanza della Ricerca

  • Ottimizzazione delle Risorse: Il pre-screening tramite dati dei social media può ridurre significativamente i costi dei sondaggi e migliorare l'efficienza
  • Monitoraggio in Tempo Reale: Capacità di monitorare continuamente l'opinione pubblica per il supporto decisionale
  • Precisione Spaziale: Identificazione di aree ad alta attenzione per interventi mirati
  • Equità nei Trasporti: Garantire che tutte le comunità abbiano accesso a opzioni di trasporto sicure e affidabili

Contributi Fondamentali

  1. Proposta di un Framework NLP Innovativo: Approccio multifaccettato che combina l'apprendimento Few-Shot e l'analisi del sentimento VADER
  2. Realizzazione di Classificazione Precisa dei Tweet: Classificazione dei tweet in categorie relative ai servizi come manutenzione, sicurezza, programmazione, ecc.
  3. Fornitura di Analisi Spazio-Temporale: Identificazione di reclami ricorrenti o punti di attenzione in specifiche ubicazioni geografiche
  4. Validazione dell'Efficacia del Framework: Attraverso uno studio di caso del sistema della metropolitana di New York e confronto con sondaggi ufficiali dell'MTA
  5. Costruzione di una Soluzione Scalabile: Applicabile a diverse regioni, periodi di tempo e molteplici fornitori di servizi

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Testo del tweet, timestamp, etichette geografiche Output: Classificazione della categoria del tweet, valutazione della polarità del sentimento e dell'intensità, analisi della distribuzione spaziale Vincoli: I tweet devono essere correlati al sistema di trasporto pubblico, è necessario gestire il linguaggio informale e le espressioni specifiche dei social media

Architettura del Modello

1. Raccolta e Pre-elaborazione dei Dati

  • Fonte dei Dati: Raccolta tramite API di Twitter e strumento snscrape
  • Strategia di Ricerca: Utilizzo di 10 termini di ricerca univoci ("MTA", "NYC SUBWAY", ecc.) e 12 località correlate
  • Elaborazione dei Filtri: Rimozione di tweet duplicati e link incorporati
  • Scala dei Dati: Campionamento casuale di 36.000 tweet da 102.530 per l'analisi

2. Modulo di Classificazione Few-Shot Learning

Scelta del Modello: OpenAI GPT-3.5 Turbo Categorie di Classificazione:

  • Pulizia e Manutenzione: Discussione di problemi di pulizia e manutenzione del sistema metropolitano
  • Programmazione e Operazioni: Riguardanti orari della metropolitana, ritardi, puntualità, ecc.
  • Sicurezza e Protezione: Evidenziamento di preoccupazioni relative alla sicurezza e protezione degli utenti
  • Altro: Tweet non correlati all'esperienza dell'utente del sistema di trasporto pubblico

Configurazione Few-Shot: Utilizzo di 5 campioni per categoria per l'addestramento, raggiungendo un equilibrio tra prestazioni ed efficienza delle risorse

3. Modulo di Analisi del Sentimento VADER

Principio Fondamentale: Basato su un dizionario del sentimento pre-costruito, mappando le caratteristiche lessicali ai punteggi di intensità del sentimento Intervallo di Punteggio: Punteggio a livello di parola da -4 a 4, punteggio composito a livello di frase da -1 a +1 Formula di Normalizzazione: CSCi=xixi2+αCSC_i = \frac{x_i}{\sqrt{x_i^2 + \alpha}} dove xix_i è la somma totale dei punteggi del sentimento delle parole costitutive nel tweet i, e α=15\alpha=15 è il parametro di normalizzazione

Soglie di Classificazione del Sentimento:

  • Sentimento Positivo: punteggio composito > 0,1
  • Sentimento Negativo: punteggio composito < -0,1
  • Sentimento Neutro: -0,1 ≤ punteggio composito ≤ 0,1

Punti di Innovazione Tecnica

  1. Applicazione dell'Apprendimento Few-Shot: Risolve la difficoltà dell'annotazione su larga scala dei tweet, richiedendo solo pochi campioni annotati per ottenere una classificazione ad alta precisione
  2. Framework di Analisi Multimodale: Considera simultaneamente le dimensioni di classificazione, sentimento e spazio per un'analisi integrata
  3. Strategia di Mappatura Spaziale: Mappa i tweet con etichette geografiche alle stazioni della metropolitana entro un raggio di 1 miglio, realizzando un'analisi spaziale precisa
  4. Capacità di Elaborazione in Tempo Reale: Il design del framework supporta l'elaborazione e l'analisi in tempo reale di dati dai social media su larga scala

Configurazione Sperimentale

Dataset

  • Nome del Dataset: Dati di Twitter correlati al sistema della metropolitana di New York
  • Scala dei Dati: 36.000 tweet (campionati da 102.530)
  • Intervallo Temporale: Anno 2022
  • Intervallo Geografico: Area di servizio della metropolitana di New York e aree estese
  • Set di Validazione: 500 tweet annotati manualmente per la validazione del modello

Metriche di Valutazione

  • Prestazioni di Classificazione: Precisione, Recall, F1-Score
  • Analisi del Sentimento: Punteggio del sentimento composito, distribuzione della polarità del sentimento
  • Analisi Spaziale: Mappe di calore della distribuzione geografica, aggregazione del sentimento per regione

Metodi di Confronto

  • Confronto di Base: Risultati del sondaggio clienti dell'MTA autunno 2022
  • Confronto Temporale: Tendenze di variazione tra i sondaggi primaverili e autunnali dell'MTA

Dettagli di Implementazione

  • Modello di Classificazione: GPT-3.5 Turbo, configurazione Few-Shot con 5 campioni per categoria
  • Analisi del Sentimento: Modello VADER, senza necessità di passaggi di pre-elaborazione
  • Analisi Spaziale: Strategia di mappatura della stazione della metropolitana con raggio di 1 miglio

Risultati Sperimentali

Risultati Principali

Prestazioni di Classificazione

MetricaValore
Precisione0,9456
Recall0,9420
F1-Score0,9425

Distribuzione della Classificazione dei Tweet

CategoriaNumero di TweetPercentuale
Pulizia/Manutenzione1.6674,6%
Programmazione/Operazioni6.05016,8%
Sicurezza/Protezione7.70821,5%
Altro20.57557,1%

Scoperte Chiave: La sicurezza e la protezione sono il punto di attenzione più elevato (21,5%), seguiti dai problemi relativi alla programmazione (16,8%)

Analisi delle Tendenze Temporali

  • Periodo di Massima Soddisfazione: Marzo e mesi estivi (giugno-settembre)
  • Variazione della Percentuale di Tweet Negativi: Dal 33% di aprile-maggio al 28% di giugno-agosto
  • Coerenza con il Sondaggio dell'MTA: Il sondaggio autunnale 2022 mostra una soddisfazione dei clienti della metropolitana del 54%, con un aumento di 6 punti percentuali rispetto al sondaggio primaverile

Risultati dell'Analisi Spaziale

  • Aree di Concentrazione delle Preoccupazioni di Sicurezza: Midtown e Financial District
  • Aree di Problemi di Programmazione Prominenti: Upper Manhattan e Queens
  • Aree di Feedback Negativo Continuo: Times Square, Central Park e altre aree turistiche ad alto traffico
  • Aree di Problemi di Sicurezza Specifici: Upper East Side e East Harlem

Analisi di Casi

L'articolo fornisce 8 casi specifici di tweet, dimostrando la capacità del framework nel gestire sentimenti complessi (come l'ironia) e la classificazione accurata. Ad esempio:

  • Tweet negativo sulla manutenzione: "Why would you WANT to ride the subway without a mask? It is so stinky" (punteggio: -0,6651)
  • Tweet positivo sulla programmazione: Tweet di ringraziamento ai conducenti per aver mantenuto le porte aperte (punteggio: 0,7701)

Lavori Correlati

Applicazione dell'Analisi del Sentimento nei Trasporti Pubblici

  • Metodi di Machine Learning: SVM, Naive Bayes, Decision Tree, BERT, ecc.
  • Metodi Basati su Dizionario: SentiWordNet, VADER, TextBlob, Afinn, LIWC, ecc.
  • Casi di Applicazione: Studi di analisi del sentimento della Chicago Transit Authority e del sistema della metropolitana di Londra

Applicazione dei Dati dei Social Media nella Ricerca sui Trasporti

  • Modello T-MAPS: Modello spazio-temporale per le intuizioni sul traffico di New York
  • Sistema di Trasporto Pubblico di Singapore: Tracciamento dell'opinione pubblica in tempo reale durante le ore di punta
  • Sistema di Trasporto Pubblico di Toronto: Classificazione tematica dei post sui social media

Classificazione Tematica e Sfide nell'Annotazione di Big Data

  • Limitazioni dei Metodi Tradizionali: Richiedono grandi quantità di dati annotati, mancanza di capacità di generalizzazione
  • Vantaggi dei Modelli Pre-addestrati: Capacità di apprendimento Few-Shot dei modelli linguistici di grandi dimensioni come GPT e LLaMA
  • Applicazioni dell'Apprendimento Few-Shot: Recensioni di film, feedback su prodotti, classificazione dell'intento nei sistemi di dialogo, ecc.

Conclusioni e Discussione

Conclusioni Principali

  1. Efficacia del Framework: Il framework NLP proposto può classificare accuratamente i tweet e misurare l'intensità del sentimento, con risultati altamente coerenti con i sondaggi ufficiali
  2. Rapporto Costo-Beneficio: L'analisi dei dati dei social media può fungere da alternativa praticabile o complemento ai costosi sondaggi degli utenti
  3. Precisione Spaziale: Capacità di identificare punti di concentrazione dei problemi in aree geografiche specifiche, supportando l'allocazione precisa delle risorse
  4. Capacità di Monitoraggio in Tempo Reale: Fornisce monitoraggio continuo dell'opinione pubblica e supporto decisionale basato sui dati

Limitazioni

  1. Distorsione dei Dati: La popolazione degli utenti dei social media tende verso utenti più giovani, potrebbe non rappresentare completamente tutti i gruppi di passeggeri
  2. Precisione Geografica: Le etichette geografiche dei tweet potrebbero non essere accurate, la strategia di mappatura di 1 miglio presenta margini di errore
  3. Complessità Linguistica: Le espressioni linguistiche complesse come l'ironia e lo slang rimangono una sfida
  4. Privacy ed Etica: L'utilizzo di dati pubblici dai social media richiede una gestione attenta della privacy e delle questioni etiche

Direzioni Future

  1. Supporto Multilingue: Estensione del framework per gestire dati di tweet in più lingue
  2. Ottimizzazione dell'Elaborazione in Tempo Reale: Miglioramento della capacità di elaborazione in tempo reale di dati su larga scala
  3. Applicazione Cross-Domain: Applicazione del framework ad altri servizi di trasporto come aeroporti, autobus, parcheggi, mobilità condivisa, ecc.
  4. Analisi della Politica Tariffaria: Valutazione dell'impatto dei cambiamenti tariffari sulla soddisfazione degli utenti

Valutazione Approfondita

Punti di Forza

  1. Forte Innovazione Metodologica: La combinazione di apprendimento Few-Shot e analisi del sentimento VADER è innovativa e risolve efficacemente la difficoltà dell'annotazione su larga scala
  2. Design Sperimentale Completo: Analisi su larga scala di 36.000 tweet, validazione con 500 tweet annotati manualmente, verifica del confronto con sondaggi ufficiali
  3. Alto Valore Pratico: Fornisce alle agenzie di trasporto un'alternativa economicamente vantaggiosa per la raccolta di feedback degli utenti
  4. Analisi Spaziale Approfondita: L'analisi del sentimento nella dimensione geografica fornisce un forte supporto per interventi mirati
  5. Alta Credibilità dei Risultati: La coerenza con i risultati dei sondaggi ufficiali dell'MTA aumenta la credibilità del framework

Insufficienze

  1. Capacità di Generalizzazione Limitata: Validazione solo nel sistema della metropolitana di New York, l'applicabilità ad altri sistemi di trasporto e città richiede ulteriore verifica
  2. Limitazione dell'Intervallo Temporale: Analisi solo dei dati 2022, analisi insufficiente delle tendenze a lungo termine
  3. Dipendenza Tecnologica: Dipendenza da API commerciali (GPT-3.5), potrebbe affrontare problemi di costi e disponibilità
  4. Metriche di Valutazione Singole: Principalmente basate sul confronto con sondaggi ufficiali, mancanza di validazione in più dimensioni

Impatto

  1. Contributo Accademico: Fornisce un nuovo framework metodologico per l'analisi dei dati dei social media nel settore dei trasporti
  2. Valore Pratico: Fornisce alle agenzie di trasporto globali una soluzione tecnologica operativa
  3. Implicazioni Politiche: Supporta la formulazione di politiche sui trasporti basate sui dati e l'ottimizzazione dell'allocazione delle risorse
  4. Ispirazione Cross-Domain: Il metodo è estensibile all'analisi del feedback degli utenti in altri settori dei servizi pubblici

Scenari Applicabili

  1. Ottimizzazione dei Sistemi di Trasporto: Miglioramento dei servizi per metropolitane, autobus, tranvie e altri sistemi di trasporto pubblico
  2. Pianificazione Urbana: Pianificazione delle infrastrutture di trasporto basata sul feedback degli utenti
  3. Risposta alle Emergenze: Monitoraggio dell'umore pubblico durante incidenti di trasporto o interruzioni di servizio
  4. Valutazione delle Politiche: Valutazione in tempo reale dell'efficacia dell'implementazione delle politiche di trasporto
  5. Applicazioni Commerciali: Analisi dell'esperienza dell'utente per servizi di mobilità condivisa, servizi di taxi, ecc.

Bibliografia

L'articolo cita 64 fonti correlate, coprendo molteplici campi come l'analisi del sentimento, l'elaborazione del linguaggio naturale, la ricerca sui trasporti e l'analisi dei social media, fornendo una solida base teorica e supporto metodologico per questa ricerca.


Valutazione Complessiva: Questo è un articolo di ricerca applicata di alta qualità che applica con successo la tecnologia NLP avanzata a problemi reali di trasporto urbano. Il metodo è innovativo, gli esperimenti sono completi e i risultati sono credibili, con significativo valore accademico e pratico. Sebbene presenti alcune limitazioni, fornisce un percorso tecnologico e un'esperienza pratica preziosi per la trasformazione digitale nel settore dei trasporti.