2025-11-14T15:49:11.600012

When or What? Understanding Consumer Engagement on Digital Platforms

Wu, Liang
Understanding what drives popularity is critical in today's digital service economy, where content creators compete for consumer attention. Prior studies have primarily emphasized the role of content features, yet creators often misjudge what audiences actually value. This study applies Latent Dirichlet Allocation (LDA) modeling to a large corpus of TED Talks, treating the platform as a case of digital service provision in which creators (speakers) and consumers (audiences) interact. By comparing the thematic supply of creators with the demand expressed in audience engagement, we identify persistent mismatches between producer offerings and consumer preferences. Our longitudinal analysis further reveals that temporal dynamics exert a stronger influence on consumer engagement than thematic content, suggesting that when content is delivered may matter more than what is delivered. These findings challenge the dominant assumption that content features are the primary drivers of popularity and highlight the importance of timing and contextual factors in shaping consumer responses. The results provide new insights into consumer attention dynamics on digital platforms and carry practical implications for marketers, platform managers, and content creators seeking to optimize audience engagement strategies.
academic

Quando o Cosa? Comprendere l'Engagement dei Consumatori sulle Piattaforme Digitali

Informazioni Fondamentali

  • ID Articolo: 2510.10474
  • Titolo: When or What? Understanding Consumer Engagement on Digital Platforms
  • Autori: Jingyi Wu (Università di Zhejiang), Junying Liang (Università di Zhejiang)
  • Classificazione: cs.CL (Linguistica Computazionale), cs.CY (Informatica e Società)
  • Data di Pubblicazione: 12 ottobre 2025 (preprint arXiv)
  • Link Articolo: https://arxiv.org/abs/2510.10474

Riassunto

Questo studio esamina i fattori che determinano l'engagement dei consumatori sulle piattaforme digitali. Ricerche precedenti hanno enfatizzato principalmente il ruolo delle caratteristiche del contenuto, ma i creatori di contenuti spesso fraintendono le reali esigenze del pubblico. L'articolo utilizza il modello Latent Dirichlet Allocation (LDA) per analizzare un ampio corpus di conferenze TED, considerando la piattaforma come un caso di servizio digitale di interazione tra creatori (relatori) e consumatori (pubblico). Confrontando l'offerta tematica dei creatori con la domanda espressa dal livello di engagement del pubblico, lo studio identifica un disallineamento persistente tra l'offerta dei produttori e le preferenze dei consumatori. L'analisi longitudinale rivela inoltre che la dinamica temporale ha un impatto più forte sull'engagement dei consumatori rispetto al contenuto tematico, suggerendo che il "quando" della trasmissione del contenuto potrebbe essere più importante del "cosa".

Contesto e Motivazione della Ricerca

Problema Centrale

Il problema centrale affrontato da questa ricerca è: Sulle piattaforme digitali, sono le caratteristiche del contenuto ("cosa") o i fattori temporali ("quando") a determinare maggiormente l'engagement dei consumatori?

Importanza del Problema

  1. Valore Economico: I video con oltre un milione di visualizzazioni su YouTube generano tipicamente ricavi pubblicitari superiori a 2000 dollari, con i creatori di maggior successo che guadagnano fino a 54 milioni di dollari annui
  2. Competizione Intensa: YouTube ospita oltre 51 milioni di canali, ma solo una minoranza raggiunge il traguardo di un milione di iscritti
  3. Esigenza Pratica: Creatori di contenuti, gestori di piattaforme e professionisti del marketing hanno urgente necessità di comprendere come ottimizzare le strategie di engagement del pubblico

Limitazioni dei Metodi Esistenti

  1. Eccessiva Focalizzazione sul Contenuto: La ricerca esistente si concentra principalmente sulla qualità del contenuto, sulla scelta degli argomenti e su altri fattori intrinseci
  2. Trascuratezza del Disallineamento Domanda-Offerta: Manca un'analisi quantitativa delle differenze tra l'offerta dei creatori e la domanda del pubblico
  3. Sottovalutazione dei Fattori Temporali: Insufficiente comprensione dell'impatto della tempistica di pubblicazione e della dinamica temporale

Motivazione della Ricerca

Basandosi sulla teoria dell'esposizione selettiva e sull'economia dell'attenzione, questo studio ipotizza che esista una differenza sistematica di preferenze tra creatori e pubblico, e che i fattori temporali potrebbero essere più importanti del contenuto stesso.

Contributi Principali

  1. Propone il metodo dell'"Indice di Differenza": Quantifica le differenze di preferenza tra creatori e pubblico
  2. Sfida la concezione tradizionale del primato del contenuto: Scopre che la dinamica temporale ha un impatto maggiore sull'engagement del pubblico rispetto al contenuto tematico
  3. Costruisce un ampio dataset di conferenze TED: Contiene 4.475 conferenze dal 2006-2022, per un totale di 8.065.104 parole
  4. Fornisce Indicazioni Strategiche Pratiche: Offre raccomandazioni basate su dati per l'ottimizzazione rivolte a creatori di contenuti e gestori di piattaforme

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Trascrizioni di conferenze TED, numero di visualizzazioni, anno di pubblicazione Output: Distribuzione tematica, quantificazione delle differenze di preferenza, impatto relativo del tempo e dei temi sul livello di engagement Vincoli: L'analisi è limitata alle conferenze TED in inglese dal 2006-2022

Architettura del Modello

1. Modellazione Tematica LDA

Documento → Preelaborazione → Modello LDA → 14 Temi
  • Preelaborazione: Conservazione di verbi, sostantivi, aggettivi e avverbi; rimozione di parole vuote; tokenizzazione
  • Numero di Temi: 14 temi selezionati sulla base della perplessità
  • Annotazione Tematica: Annotazione semantica manuale basata su parole ad alta frequenza

2. Metodo di Quantificazione delle Preferenze

Preferenza dei Creatori: Proporzione del numero di video su un tema rispetto al totale dell'anno Preferenza del Pubblico: Valore trasformato logaritmicamente del numero medio di visualizzazioni per tema

3. Calcolo dell'Indice di Differenza

Indice di Differenza_{tema,anno} = |Visualizzazioni Medie_{tema,anno}/Visualizzazioni Totali_{anno} - Conteggio Video_{tema,anno}/Conteggio Video Totali_{anno}|

Indice di Differenza_{anno} = ∑_{temi} Indice di Differenza_{tema,anno}

Punti di Innovazione Tecnica

  1. Quadro di Analisi Multidimensionale: Considera simultaneamente l'impatto duale del contenuto tematico e della dinamica temporale
  2. Quantificazione del Disallineamento Domanda-Offerta: Quantificazione sistematica per la prima volta delle differenze tra l'offerta dei creatori e la domanda del pubblico
  3. Analisi Comparativa Longitudinale: Analisi dinamica delle tendenze su un arco di 17 anni
  4. Validazione mediante Modellazione Statistica: Utilizzo della regressione Beta per verificare l'importanza relativa dei fattori tematici e temporali

Configurazione Sperimentale

Dataset

  • Fonte Dati: Sito ufficiale TED, in rigorosa conformità alle condizioni d'uso
  • Scala: 4.475 conferenze, 8.065.104 parole
  • Arco Temporale: 2006-2022
  • Variabili: Trascrizioni di conferenze, numero di visualizzazioni, anno di pubblicazione

Preelaborazione dei Dati

  1. Pulizia del Testo: Rimozione di parole con lunghezza inferiore a 3 caratteri
  2. Elaborazione delle Parole Vuote: Basata sulla lista di parole vuote del pacchetto NLTK, con rimozione aggiuntiva di 'kind', 'little', 'sort', ecc.
  3. Normalizzazione dei Dati: Trasformazione logaritmica naturale del numero di visualizzazioni per gestire la distribuzione asimmetrica

Metriche di Valutazione

  • Coerenza Tematica: Coerenza semantica basata su parole ad alta frequenza
  • Adattamento del Modello: Perplessità (Perplexity)
  • Significatività Statistica: Test del chi-quadrato, test H di Kruskal-Wallis
  • Potere Esplicativo del Modello: Pseudo R² della regressione Beta

Metodi di Analisi Statistica

  • Test di Indipendenza: Test del chi-quadrato per valutare l'associazione tra tema e anno
  • Test Non Parametrico: Test H di Kruskal-Wallis per confrontare le differenze di visualizzazioni tra temi
  • Analisi di Regressione: Regressione Beta per valutare l'impatto relativo dei fattori tematici e temporali
  • Analisi di Correlazione: Test di correlazione di Spearman per verificare l'associazione tra preferenze dei creatori e del pubblico

Risultati Sperimentali

Risultati Principali

1. Scoperte sulla Distribuzione Tematica

Identificazione di 14 temi con distribuzione estremamente disomogenea:

  • Temi Popolari: Emozione (20,02%), Interazione Sociale (14,03%)
  • Temi Scientifici: Universo (5,92%), Tecnologia (5,90%), Cervello (5,34%)
  • Temi Poco Popolari: Minoranze (1,09%)

2. Analisi delle Preferenze dei Creatori

  • Fattore Tematico più Importante: Pseudo R² della regressione Beta = 0,361, con coefficienti tematici generalmente superiori ai coefficienti temporali
  • Stabilità delle Preferenze: Emozione (β=2,695) e Interazione Sociale (β=2,231) presentano i coefficienti più elevati
  • Sensibilità Temporale: I temi Clima-Energia e Politica sono significativamente influenzati dal tempo

3. Analisi delle Preferenze del Pubblico

  • Fattore Temporale più Importante: Pseudo R² della regressione Beta = 0,249, con coefficienti temporali generalmente superiori ai coefficienti tematici
  • Temi Popolari: Cervello, Interazione Sociale, Minoranze presentano il numero medio di visualizzazioni più elevato
  • Disallineamento Domanda-Offerta: Gli argomenti sulle minoranze hanno l'offerta più bassa ma la domanda più alta

4. Quantificazione delle Differenze di Preferenza

  • Correlazione Complessiva Debole: Coefficiente di correlazione di Spearman r=0,143 (p=0,028)
  • Fluttuazione Significativa delle Differenze: L'indice di differenza annuale non mostra tendenze evidenti, con fluttuazioni significative
  • Differenze Tematiche: I temi Emozione, Minoranze, Cervello presentano l'indice di differenza più elevato

Esperimenti di Ablazione

Risultati dell'Analisi dei Residui

  • Temi Stabili: Arte, Assistenza Sanitaria non sono influenzati dal tempo
  • Temi Sensibili: Clima-Energia mostra aumenti significativi nel 2009, 2021, 2022
  • Guidati da Eventi: Gli argomenti politici raggiungono il picco nel 2020 (impatto della pandemia)

Confronto dei Modelli di Regressione Beta

Tipo di FattorePreferenza dei CreatoriPreferenza del Pubblico
Impatto TematicoForte (coefficienti elevati)Moderato
Impatto TemporaleDebole (coefficienti bassi)Forte
Potere Esplicativo del Modello36,1%24,9%

Analisi di Casi

Casi di Corrispondenza Riuscita

  • Argomenti Politici: Le curve di preferenza di creatori e pubblico sono relativamente stabili, con indice di differenza basso
  • Assistenza Sanitaria: Come argomento di interesse universale, la corrispondenza domanda-offerta è buona

Casi Tipici di Disallineamento

  • Argomenti sulle Minoranze: Offerta gravemente insufficiente (1,09%) ma domanda di visualizzazione elevata
  • Argomenti Emotivi: Eccessiva offerta da parte dei creatori (20,02%) ma interesse del pubblico moderato
  • Scienza del Cervello: Differenza significativa domanda-offerta nel 2016-2019

Lavori Correlati

Principali Direzioni di Ricerca

  1. Impatto dei Social Network: Meccanismi di influenza dei social network reali sulla popolarità online
  2. Analisi delle Caratteristiche del Contenuto: Previsione della popolarità basata su tag e argomenti
  3. Teoria dell'Esposizione Selettiva: Relazione tra preferenze degli utenti e scelta del contenuto
  4. Impatto degli Algoritmi di Raccomandazione: Influenza degli algoritmi sulla visibilità del contenuto

Punti di Innovazione di Questo Articolo

  1. Analisi Bidirezionale: Primo confronto sistematico tra l'offerta dei creatori e la domanda del pubblico
  2. Dimensione Temporale: Enfasi sull'importanza della dinamica temporale, sfidando la concezione del primato del contenuto
  3. Metodo di Quantificazione: Proposta di strumenti di misurazione operativi come l'indice di differenza
  4. Orientamento Pratico: Fornisce raccomandazioni strategiche concrete piuttosto che analisi puramente teoriche

Conclusioni e Discussione

Conclusioni Principali

  1. Il Tempo è più Importante del Contenuto: Per il pubblico, il "quando" influenza maggiormente il livello di engagement rispetto al "cosa"
  2. Disallineamento Sistematico Domanda-Offerta: Esiste una differenza persistente tra le preferenze dei creatori e la domanda del pubblico
  3. Differenze Tematiche Significative: Il grado di corrispondenza domanda-offerta varia enormemente tra i diversi temi
  4. Necessità di Revisione dei Concetti Tradizionali: La qualità del contenuto non è l'unico o il principale fattore determinante della popolarità

Limitazioni

  1. Limitazione della Piattaforma: Basato solo sulla piattaforma TED, la generalizzabilità rimane da verificare
  2. Incompletezza delle Variabili: Non considera indicatori di interazione come mi piace e condivisioni
  3. Effetti di Interazione: I problemi di convergenza del modello limitano l'analisi dei termini di interazione tema-tempo
  4. Relazioni Causali: L'analisi di correlazione non può determinare relazioni causali

Direzioni Future

  1. Validazione Multipiattaforma: Estensione a YouTube, podcast e altre piattaforme
  2. Modellazione degli Effetti di Interazione: Miglioramento dei modelli statistici per gestire interazioni complesse
  3. Sistema di Previsione in Tempo Reale: Sviluppo di strumenti di previsione della popolarità basati sulla dinamica temporale
  4. Strategie di Ottimizzazione dei Contenuti: Ricerca su metodi di ottimizzazione della struttura narrativa e delle modalità espressive

Valutazione Approfondita

Punti di Forza

  1. Forte Innovazione Metodologica: Il concetto di indice di differenza è innovativo e fornisce uno strumento di quantificazione per l'analisi domanda-offerta
  2. Scala Dati Ampia: Arco di 17 anni, 4.475 campioni, potenza statistica sufficiente
  3. Scoperte Controintuitive: Sfida la concezione del primato del contenuto e propone l'ipotesi della priorità temporale
  4. Valore Pratico Elevato: Fornisce raccomandazioni concrete e operabili ai creatori di contenuti
  5. Analisi Completa: Combina metodi qualitativi e quantitativi, verifica le conclusioni da più angolazioni

Insufficienze

  1. Fondamento Teorico Debole: Manca una spiegazione dei meccanismi sottostanti il motivo per cui i fattori temporali sono più importanti
  2. Limitazioni Metodologiche: La scelta del numero di temi LDA presenta forte soggettività, potendo influenzare la stabilità dei risultati
  3. Problemi di Validità Esterna: La particolarità della piattaforma TED potrebbe limitare l'universalità delle conclusioni
  4. Omissione di Variabili: Trascura fattori importanti come la reputazione del relatore e la qualità del video
  5. Insufficienza dell'Inferenza Causale: Basata principalmente su analisi di correlazione, manca di strategie di identificazione causale

Impatto

  1. Contributo Accademico: Fornisce un nuovo quadro di analisi per la ricerca sulle piattaforme digitali
  2. Valore Pratico: Ha significato diretto di guida per il marketing dei contenuti e la gestione delle piattaforme
  3. Significato Interdisciplinare: Connette la comunicazione, la linguistica computazionale e il comportamento dei consumatori
  4. Implicazioni Politiche: Fornisce supporto dati per la governance delle piattaforme e la regolamentazione dei contenuti

Scenari Applicabili

  1. Piattaforme di Contenuti: Formulazione di strategie di contenuto per piattaforme video come YouTube e Bilibili
  2. Settore del Marketing: Scelta della tempistica e pianificazione degli argomenti per il content marketing dei brand
  3. Ricerca Accademica: Ricerca empirica sulla comunicazione digitale e il comportamento dei consumatori
  4. Governance delle Piattaforme: Ottimizzazione degli algoritmi di raccomandazione e identificazione dei pregiudizi

Bibliografia

L'articolo cita 89 fonti correlate, che includono:

  • Letteratura classica sull'analisi dei social network (Kwak et al., 2010)
  • Articoli sulla metodologia della modellazione tematica (Blei et al., 2003)
  • Letteratura sulla teoria dell'esposizione selettiva (Stroud, 2010)
  • Ricerca empirica sulla comunicazione digitale (Cinelli et al., 2021)

Valutazione Complessiva: Questo è un articolo di ricerca innovativo e di valore pratico che, attraverso l'analisi di dati su larga scala, sfida la concezione tradizionale del primato del contenuto e propone una nuova prospettiva che privilegia il fattore temporale. Sebbene vi sia ancora spazio per miglioramenti nella profondità teorica e nella completezza metodologica, le scoperte principali hanno un significato di importante illuminazione sia per il mondo accademico che per la pratica.