2025-11-24T02:19:18.891948

Leveraging Twitter Data for Sentiment Analysis of Transit User Feedback: An NLP Framework

Das, Prajapati, Zhang et al.

Traditional methods of collecting user feedback through transit surveys are often time-consuming, resource intensive, and costly. In this paper, we propose a novel NLP-based framework that harnesses the vast, abundant, and inexpensive data available on social media platforms like Twitter to understand users' perceptions of various service issues. Twitter, being a microblogging platform, hosts a wealth of real-time user-generated content that often includes valuable feedback and opinions on various products, services, and experiences. The proposed framework streamlines the process of gathering and analyzing user feedback without the need for costly and time-consuming user feedback surveys using two techniques. First, it utilizes few-shot learning for tweet classification within predefined categories, allowing effective identification of the issues described in tweets. It then employs a lexicon-based sentiment analysis model to assess the intensity and polarity of the tweet sentiments, distinguishing between positive, negative, and neutral tweets. The effectiveness of the framework was validated on a subset of manually labeled Twitter data and was applied to the NYC subway system as a case study. The framework accurately classifies tweets into predefined categories related to safety, reliability, and maintenance of the subway system and effectively measured sentiment intensities within each category. The general findings were corroborated through a comparison with an agency-run customer survey conducted in the same year. The findings highlight the effectiveness of the proposed framework in gauging user feedback through inexpensive social media data to understand the pain points of the transit system and plan for targeted improvements.

academic

Sfruttare i Dati di Twitter per l'Analisi del Sentimento dei Feedback degli Utenti del Trasporto: Un Framework NLP

Informazioni Fondamentali

ID Articolo: 2310.07086
Titolo: Urban Echoes: Decoding Transit Riders' Sentiments on Social Media for Smarter Mobility
Autori: Adway Das, Abhishek Kumar Prajapati, Pengxiang Zhang, Mukund Srinath, Andisheh Ranjbari
Istituzioni Affiliate: The Pennsylvania State University, Optym Inc.
Classificazione: cs.AI cs.SI
Data di Pubblicazione: Ottobre 2023 (arXiv v2: Ottobre 2025)
Link dell'Articolo: https://arxiv.org/abs/2310.07086v2

Riassunto

I sondaggi tradizionali sui trasporti pubblici consumano risorse significative e richiedono molto tempo, limitando la loro capacità di affrontare efficacemente problemi specifici di determinate località. Questo studio propone un framework basato su NLP che sfrutta i dati in tempo reale di Twitter (ora X) come strumento di pre-screening per ottimizzare e indirizzare i sondaggi delle agenzie di trasporto. Il framework adotta un approccio a due fasi: l'apprendimento Few-Shot classifica i tweet in categorie quali sicurezza, affidabilità e manutenzione, mentre un modello di analisi del sentimento basato su dizionario valuta la polarità del sentimento (positivo, negativo, neutro) e l'intensità. Inoltre, l'analisi spaziale mappa le tendenze del sentimento su aree geografiche specifiche, consentendo alle agenzie di trasporto di localizzare e dare priorità alle aree problematiche con precisione.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

Limitazioni dei Sondaggi Tradizionali: I sondaggi sul feedback degli utenti del trasporto pubblico sono costosi, richiedono molto tempo e hanno una copertura geografica limitata. La ricerca mostra che il costo pro capite per le agenzie di trasporto che conducono sondaggi è di circa 36 dollari, con un costo totale medio di circa 350.000 dollari per sondaggi di medie dimensioni.
Potenziale dei Dati dei Social Media: Twitter ha oltre 3,3 miliardi di utenti attivi e genera circa 500 milioni di tweet al giorno, offrendo un'opportunità unica per ottenere intuizioni in tempo reale su larga scala sui sentimenti e le esperienze degli utenti.
Necessità di Precisione Geografica: I dati dei social media possono rivelare problemi e sentimenti specifici di determinate località, consentendo alle agenzie di trasporto di identificare esigenze e sfide uniche di diverse comunità.

Importanza della Ricerca

Ottimizzazione delle Risorse: Il pre-screening tramite dati dei social media può ridurre significativamente i costi dei sondaggi e migliorare l'efficienza
Monitoraggio in Tempo Reale: Capacità di monitorare continuamente l'opinione pubblica per il supporto decisionale
Precisione Spaziale: Identificazione di aree ad alta attenzione per interventi mirati
Equità nei Trasporti: Garantire che tutte le comunità abbiano accesso a opzioni di trasporto sicure e affidabili

Contributi Fondamentali

Proposta di un Framework NLP Innovativo: Approccio multifaccettato che combina l'apprendimento Few-Shot e l'analisi del sentimento VADER
Realizzazione di Classificazione Precisa dei Tweet: Classificazione dei tweet in categorie relative ai servizi come manutenzione, sicurezza, programmazione, ecc.
Fornitura di Analisi Spazio-Temporale: Identificazione di reclami ricorrenti o punti di attenzione in specifiche ubicazioni geografiche
Validazione dell'Efficacia del Framework: Attraverso uno studio di caso del sistema della metropolitana di New York e confronto con sondaggi ufficiali dell'MTA
Costruzione di una Soluzione Scalabile: Applicabile a diverse regioni, periodi di tempo e molteplici fornitori di servizi

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Testo del tweet, timestamp, etichette geografiche Output: Classificazione della categoria del tweet, valutazione della polarità del sentimento e dell'intensità, analisi della distribuzione spaziale Vincoli: I tweet devono essere correlati al sistema di trasporto pubblico, è necessario gestire il linguaggio informale e le espressioni specifiche dei social media

Architettura del Modello

1. Raccolta e Pre-elaborazione dei Dati

Fonte dei Dati: Raccolta tramite API di Twitter e strumento snscrape
Strategia di Ricerca: Utilizzo di 10 termini di ricerca univoci ("MTA", "NYC SUBWAY", ecc.) e 12 località correlate
Elaborazione dei Filtri: Rimozione di tweet duplicati e link incorporati
Scala dei Dati: Campionamento casuale di 36.000 tweet da 102.530 per l'analisi

2. Modulo di Classificazione Few-Shot Learning

Scelta del Modello: OpenAI GPT-3.5 Turbo Categorie di Classificazione:

Pulizia e Manutenzione: Discussione di problemi di pulizia e manutenzione del sistema metropolitano
Programmazione e Operazioni: Riguardanti orari della metropolitana, ritardi, puntualità, ecc.
Sicurezza e Protezione: Evidenziamento di preoccupazioni relative alla sicurezza e protezione degli utenti
Altro: Tweet non correlati all'esperienza dell'utente del sistema di trasporto pubblico

Configurazione Few-Shot: Utilizzo di 5 campioni per categoria per l'addestramento, raggiungendo un equilibrio tra prestazioni ed efficienza delle risorse

3. Modulo di Analisi del Sentimento VADER

Principio Fondamentale: Basato su un dizionario del sentimento pre-costruito, mappando le caratteristiche lessicali ai punteggi di intensità del sentimento Intervallo di Punteggio: Punteggio a livello di parola da -4 a 4, punteggio composito a livello di frase da -1 a +1 Formula di Normalizzazione: $CSC_i = \frac{x_i}{\sqrt{x_i^2 + \alpha}}$ dove $x_i$ è la somma totale dei punteggi del sentimento delle parole costitutive nel tweet i, e $\alpha=15$ è il parametro di normalizzazione

Soglie di Classificazione del Sentimento:

Sentimento Positivo: punteggio composito > 0,1
Sentimento Negativo: punteggio composito < -0,1
Sentimento Neutro: -0,1 ≤ punteggio composito ≤ 0,1

Punti di Innovazione Tecnica

Applicazione dell'Apprendimento Few-Shot: Risolve la difficoltà dell'annotazione su larga scala dei tweet, richiedendo solo pochi campioni annotati per ottenere una classificazione ad alta precisione
Framework di Analisi Multimodale: Considera simultaneamente le dimensioni di classificazione, sentimento e spazio per un'analisi integrata
Strategia di Mappatura Spaziale: Mappa i tweet con etichette geografiche alle stazioni della metropolitana entro un raggio di 1 miglio, realizzando un'analisi spaziale precisa
Capacità di Elaborazione in Tempo Reale: Il design del framework supporta l'elaborazione e l'analisi in tempo reale di dati dai social media su larga scala

Configurazione Sperimentale

Dataset

Nome del Dataset: Dati di Twitter correlati al sistema della metropolitana di New York
Scala dei Dati: 36.000 tweet (campionati da 102.530)
Intervallo Temporale: Anno 2022
Intervallo Geografico: Area di servizio della metropolitana di New York e aree estese
Set di Validazione: 500 tweet annotati manualmente per la validazione del modello

Metriche di Valutazione

Prestazioni di Classificazione: Precisione, Recall, F1-Score
Analisi del Sentimento: Punteggio del sentimento composito, distribuzione della polarità del sentimento
Analisi Spaziale: Mappe di calore della distribuzione geografica, aggregazione del sentimento per regione

Metodi di Confronto

Confronto di Base: Risultati del sondaggio clienti dell'MTA autunno 2022
Confronto Temporale: Tendenze di variazione tra i sondaggi primaverili e autunnali dell'MTA

Dettagli di Implementazione

Modello di Classificazione: GPT-3.5 Turbo, configurazione Few-Shot con 5 campioni per categoria
Analisi del Sentimento: Modello VADER, senza necessità di passaggi di pre-elaborazione
Analisi Spaziale: Strategia di mappatura della stazione della metropolitana con raggio di 1 miglio

Risultati Sperimentali

Risultati Principali

Prestazioni di Classificazione

Metrica	Valore
Precisione	0,9456
Recall	0,9420
F1-Score	0,9425

Distribuzione della Classificazione dei Tweet

Categoria	Numero di Tweet	Percentuale
Pulizia/Manutenzione	1.667	4,6%
Programmazione/Operazioni	6.050	16,8%
Sicurezza/Protezione	7.708	21,5%
Altro	20.575	57,1%

Scoperte Chiave: La sicurezza e la protezione sono il punto di attenzione più elevato (21,5%), seguiti dai problemi relativi alla programmazione (16,8%)

Analisi delle Tendenze Temporali

Periodo di Massima Soddisfazione: Marzo e mesi estivi (giugno-settembre)
Variazione della Percentuale di Tweet Negativi: Dal 33% di aprile-maggio al 28% di giugno-agosto
Coerenza con il Sondaggio dell'MTA: Il sondaggio autunnale 2022 mostra una soddisfazione dei clienti della metropolitana del 54%, con un aumento di 6 punti percentuali rispetto al sondaggio primaverile

Risultati dell'Analisi Spaziale

Aree di Concentrazione delle Preoccupazioni di Sicurezza: Midtown e Financial District
Aree di Problemi di Programmazione Prominenti: Upper Manhattan e Queens
Aree di Feedback Negativo Continuo: Times Square, Central Park e altre aree turistiche ad alto traffico
Aree di Problemi di Sicurezza Specifici: Upper East Side e East Harlem

Analisi di Casi

L'articolo fornisce 8 casi specifici di tweet, dimostrando la capacità del framework nel gestire sentimenti complessi (come l'ironia) e la classificazione accurata. Ad esempio:

Tweet negativo sulla manutenzione: "Why would you WANT to ride the subway without a mask? It is so stinky" (punteggio: -0,6651)
Tweet positivo sulla programmazione: Tweet di ringraziamento ai conducenti per aver mantenuto le porte aperte (punteggio: 0,7701)

Lavori Correlati

Applicazione dell'Analisi del Sentimento nei Trasporti Pubblici

Metodi di Machine Learning: SVM, Naive Bayes, Decision Tree, BERT, ecc.
Metodi Basati su Dizionario: SentiWordNet, VADER, TextBlob, Afinn, LIWC, ecc.
Casi di Applicazione: Studi di analisi del sentimento della Chicago Transit Authority e del sistema della metropolitana di Londra

Modello T-MAPS: Modello spazio-temporale per le intuizioni sul traffico di New York
Sistema di Trasporto Pubblico di Singapore: Tracciamento dell'opinione pubblica in tempo reale durante le ore di punta
Sistema di Trasporto Pubblico di Toronto: Classificazione tematica dei post sui social media

Classificazione Tematica e Sfide nell'Annotazione di Big Data

Limitazioni dei Metodi Tradizionali: Richiedono grandi quantità di dati annotati, mancanza di capacità di generalizzazione
Vantaggi dei Modelli Pre-addestrati: Capacità di apprendimento Few-Shot dei modelli linguistici di grandi dimensioni come GPT e LLaMA
Applicazioni dell'Apprendimento Few-Shot: Recensioni di film, feedback su prodotti, classificazione dell'intento nei sistemi di dialogo, ecc.

Conclusioni e Discussione

Conclusioni Principali

Efficacia del Framework: Il framework NLP proposto può classificare accuratamente i tweet e misurare l'intensità del sentimento, con risultati altamente coerenti con i sondaggi ufficiali
Rapporto Costo-Beneficio: L'analisi dei dati dei social media può fungere da alternativa praticabile o complemento ai costosi sondaggi degli utenti
Precisione Spaziale: Capacità di identificare punti di concentrazione dei problemi in aree geografiche specifiche, supportando l'allocazione precisa delle risorse
Capacità di Monitoraggio in Tempo Reale: Fornisce monitoraggio continuo dell'opinione pubblica e supporto decisionale basato sui dati

Limitazioni

Distorsione dei Dati: La popolazione degli utenti dei social media tende verso utenti più giovani, potrebbe non rappresentare completamente tutti i gruppi di passeggeri
Precisione Geografica: Le etichette geografiche dei tweet potrebbero non essere accurate, la strategia di mappatura di 1 miglio presenta margini di errore
Complessità Linguistica: Le espressioni linguistiche complesse come l'ironia e lo slang rimangono una sfida
Privacy ed Etica: L'utilizzo di dati pubblici dai social media richiede una gestione attenta della privacy e delle questioni etiche

Direzioni Future

Supporto Multilingue: Estensione del framework per gestire dati di tweet in più lingue
Ottimizzazione dell'Elaborazione in Tempo Reale: Miglioramento della capacità di elaborazione in tempo reale di dati su larga scala
Applicazione Cross-Domain: Applicazione del framework ad altri servizi di trasporto come aeroporti, autobus, parcheggi, mobilità condivisa, ecc.
Analisi della Politica Tariffaria: Valutazione dell'impatto dei cambiamenti tariffari sulla soddisfazione degli utenti

Valutazione Approfondita

Punti di Forza

Forte Innovazione Metodologica: La combinazione di apprendimento Few-Shot e analisi del sentimento VADER è innovativa e risolve efficacemente la difficoltà dell'annotazione su larga scala
Design Sperimentale Completo: Analisi su larga scala di 36.000 tweet, validazione con 500 tweet annotati manualmente, verifica del confronto con sondaggi ufficiali
Alto Valore Pratico: Fornisce alle agenzie di trasporto un'alternativa economicamente vantaggiosa per la raccolta di feedback degli utenti
Analisi Spaziale Approfondita: L'analisi del sentimento nella dimensione geografica fornisce un forte supporto per interventi mirati
Alta Credibilità dei Risultati: La coerenza con i risultati dei sondaggi ufficiali dell'MTA aumenta la credibilità del framework

Insufficienze

Capacità di Generalizzazione Limitata: Validazione solo nel sistema della metropolitana di New York, l'applicabilità ad altri sistemi di trasporto e città richiede ulteriore verifica
Limitazione dell'Intervallo Temporale: Analisi solo dei dati 2022, analisi insufficiente delle tendenze a lungo termine
Dipendenza Tecnologica: Dipendenza da API commerciali (GPT-3.5), potrebbe affrontare problemi di costi e disponibilità
Metriche di Valutazione Singole: Principalmente basate sul confronto con sondaggi ufficiali, mancanza di validazione in più dimensioni

Impatto

Contributo Accademico: Fornisce un nuovo framework metodologico per l'analisi dei dati dei social media nel settore dei trasporti
Valore Pratico: Fornisce alle agenzie di trasporto globali una soluzione tecnologica operativa
Implicazioni Politiche: Supporta la formulazione di politiche sui trasporti basate sui dati e l'ottimizzazione dell'allocazione delle risorse
Ispirazione Cross-Domain: Il metodo è estensibile all'analisi del feedback degli utenti in altri settori dei servizi pubblici

Scenari Applicabili

Ottimizzazione dei Sistemi di Trasporto: Miglioramento dei servizi per metropolitane, autobus, tranvie e altri sistemi di trasporto pubblico
Pianificazione Urbana: Pianificazione delle infrastrutture di trasporto basata sul feedback degli utenti
Risposta alle Emergenze: Monitoraggio dell'umore pubblico durante incidenti di trasporto o interruzioni di servizio
Valutazione delle Politiche: Valutazione in tempo reale dell'efficacia dell'implementazione delle politiche di trasporto
Applicazioni Commerciali: Analisi dell'esperienza dell'utente per servizi di mobilità condivisa, servizi di taxi, ecc.

Bibliografia

L'articolo cita 64 fonti correlate, coprendo molteplici campi come l'analisi del sentimento, l'elaborazione del linguaggio naturale, la ricerca sui trasporti e l'analisi dei social media, fornendo una solida base teorica e supporto metodologico per questa ricerca.

Valutazione Complessiva: Questo è un articolo di ricerca applicata di alta qualità che applica con successo la tecnologia NLP avanzata a problemi reali di trasporto urbano. Il metodo è innovativo, gli esperimenti sono completi e i risultati sono credibili, con significativo valore accademico e pratico. Sebbene presenti alcune limitazioni, fornisce un percorso tecnologico e un'esperienza pratica preziosi per la trasformazione digitale nel settore dei trasporti.