2025-11-14T15:49:11.600012

When or What? Understanding Consumer Engagement on Digital Platforms

Wu, Liang
Understanding what drives popularity is critical in today's digital service economy, where content creators compete for consumer attention. Prior studies have primarily emphasized the role of content features, yet creators often misjudge what audiences actually value. This study applies Latent Dirichlet Allocation (LDA) modeling to a large corpus of TED Talks, treating the platform as a case of digital service provision in which creators (speakers) and consumers (audiences) interact. By comparing the thematic supply of creators with the demand expressed in audience engagement, we identify persistent mismatches between producer offerings and consumer preferences. Our longitudinal analysis further reveals that temporal dynamics exert a stronger influence on consumer engagement than thematic content, suggesting that when content is delivered may matter more than what is delivered. These findings challenge the dominant assumption that content features are the primary drivers of popularity and highlight the importance of timing and contextual factors in shaping consumer responses. The results provide new insights into consumer attention dynamics on digital platforms and carry practical implications for marketers, platform managers, and content creators seeking to optimize audience engagement strategies.
academic

Wann oder Was? Verständnis der Verbraucherengagement auf digitalen Plattformen

Grundinformationen

  • Papier-ID: 2510.10474
  • Titel: When or What? Understanding Consumer Engagement on Digital Platforms
  • Autoren: Jingyi Wu (Zhejiang-Universität), Junying Liang (Zhejiang-Universität)
  • Klassifizierung: cs.CL (Computerlinguistik), cs.CY (Informatik und Gesellschaft)
  • Veröffentlichungsdatum: 12. Oktober 2025 (arXiv-Preprint)
  • Papierlink: https://arxiv.org/abs/2510.10474

Zusammenfassung

Diese Studie untersucht die Treiber des Verbraucherengagements auf digitalen Plattformen. Bisherige Forschungen betonten hauptsächlich die Rolle von Inhaltsmerkmalen, doch Inhaltsersteller bewerten häufig die tatsächlichen Bedürfnisse des Publikums falsch ein. Der Artikel nutzt das Latent Dirichlet Allocation (LDA)-Modell zur Analyse eines großen TED-Vortragskorpus und betrachtet die Plattform als Fallbeispiel für digitale Dienste mit Interaktion zwischen Erstellern (Rednern) und Verbrauchern (Publikum). Durch den Vergleich des Themenangebots der Ersteller mit der durch das Engagement ausgedrückten Nachfrage des Publikums identifiziert die Studie eine anhaltende Diskrepanz zwischen Produzentenangebot und Verbraucherpräferenzen. Eine Längsschnittanalyse zeigt weiter, dass zeitliche Dynamiken einen stärkeren Einfluss auf das Verbraucherengagement haben als Inhaltsthemen, was darauf hindeutet, dass der Zeitpunkt der Inhaltsbereitstellung möglicherweise wichtiger ist als der Inhalt selbst.

Forschungshintergrund und Motivation

Kernfrage

Die zentrale Frage dieser Studie lautet: Sind auf digitalen Plattformen Inhaltsmerkmale ("Was") oder zeitliche Faktoren ("Wann") stärkere Treiber des Verbraucherengagements?

Bedeutung der Frage

  1. Wirtschaftlicher Wert: Videos mit über einer Million Aufrufen auf YouTube generieren typischerweise über 2.000 US-Dollar Werbeeinnahmen, wobei die höchstverdienenden Ersteller jährliche Einnahmen von 54 Millionen US-Dollar erzielen
  2. Intensiver Wettbewerb: YouTube hat über 51 Millionen Kanäle, aber nur sehr wenige erreichen die Millionen-Abonnenten-Marke
  3. Praktische Notwendigkeit: Inhaltsersteller, Plattformmanager und Marketingfachleute benötigen dringend Erkenntnisse zur Optimierung von Publikumsengagement-Strategien

Einschränkungen bestehender Methoden

  1. Überbetonung von Inhaltsmerkmalen: Bisherige Forschungen konzentrieren sich hauptsächlich auf Inhaltsqualität, Themenauswahl und andere intrinsische Faktoren
  2. Vernachlässigung von Angebots-Nachfrage-Diskrepanzen: Mangel an quantitativer Analyse der Unterschiede zwischen Ersteller-Angebot und Publikumsnachfrage
  3. Unterschätzung zeitlicher Faktoren: Unzureichendes Verständnis der Auswirkungen von Veröffentlichungszeitpunkt und zeitlicher Dynamik

Forschungsmotivation

Basierend auf der Theorie der selektiven Exposition und der Aufmerksamkeitsökonomie geht diese Studie davon aus, dass zwischen Erstellern und Publikum systematische Präferenzunterschiede bestehen und dass zeitliche Faktoren möglicherweise wichtiger sind als der Inhalt selbst.

Kernbeiträge

  1. Entwicklung der "Differenzindex"-Methode: Quantifizierung der Präferenzunterschiede zwischen Erstellern und Publikum
  2. Infragestellung des traditionellen Inhalts-Primat-Konzepts: Feststellung, dass zeitliche Dynamiken einen größeren Einfluss auf das Publikumsengagement haben als Inhaltsthemen
  3. Konstruktion eines großen TED-Vortrags-Datensatzes: Umfasst 4.475 Vorträge von 2006-2022 mit insgesamt 8.065.104 Wörtern
  4. Bereitstellung praktischer Strategieleitung: Datengestützte Optimierungsempfehlungen für Inhaltsersteller und Plattformmanager

Methodische Details

Aufgabendefinition

Eingabe: TED-Vortragsabschriften, Aufrufe, Veröffentlichungsjahr Ausgabe: Themenverteilung, quantifizierte Präferenzunterschiede, relative Auswirkungen von Zeit und Thema auf Engagement Einschränkungen: Analysebereich begrenzt auf englischsprachige TED-Vorträge 2006-2022

Modellarchitektur

1. LDA-Themenmodellierung

Dokument → Vorverarbeitung → LDA-Modell → 14 Themen
  • Vorverarbeitung: Beibehaltung von Verben, Substantiven, Adjektiven, Adverbien; Entfernung von Stoppwörtern; Tokenisierung
  • Themenzahl: Basierend auf Perplexität werden 14 Themen ausgewählt
  • Themenbezeichnung: Manuelle semantische Annotation basierend auf hochfrequenten Wörtern

2. Präferenzquantifizierungsmethode

Ersteller-Präferenz: Anteil der Videos eines Themas an der Gesamtzahl des Jahres Publikums-Präferenz: Logarithmisch transformierter Wert der durchschnittlichen Aufrufe eines Themas

3. Differenzindex-Berechnung

Differenzindex_{Thema,Jahr} = |Durchschnittliche Aufrufe_{Thema,Jahr}/Gesamtaufrufe_{Jahr} - Videoanzahl_{Thema,Jahr}/Gesamtvideoanzahl_{Jahr}|

Differenzindex_{Jahr} = ∑_{Themen} Differenzindex_{Thema,Jahr}

Technische Innovationen

  1. Mehrdimensionales Analyserahmenwerk: Berücksichtigung sowohl von Inhaltsthemen als auch zeitlicher Dynamiken
  2. Quantifizierung von Angebots-Nachfrage-Diskrepanzen: Erstmalige systematische Quantifizierung der Unterschiede zwischen Ersteller-Angebot und Publikumsnachfrage
  3. Längsschnittvergleichsanalyse: Dynamische Trendanalyse über 17 Jahre
  4. Statistische Modellvalidierung: Beta-Regressionsmodell zur Validierung der relativen Bedeutung von Thema und Zeit

Experimentelle Einrichtung

Datensatz

  • Datenquelle: Offizielle TED-Website, strikte Einhaltung der Nutzungsbedingungen
  • Umfang: 4.475 Vorträge, 8.065.104 Wörter
  • Zeitspanne: 2006-2022
  • Variablen: Vortragsabschriften, Aufrufe, Veröffentlichungsjahr

Datenvorverarbeitung

  1. Textreinigung: Entfernung von Wörtern mit weniger als 3 Zeichen
  2. Stoppwort-Verarbeitung: Basierend auf NLTK-Stoppwortliste, zusätzliche Entfernung von 'kind', 'little', 'sort' usw.
  3. Datennormalisierung: Logarithmische Transformation der Aufrufe zur Behandlung von Schiefverteilungen

Bewertungsmetriken

  • Themen-Kohärenz: Semantische Konsistenz basierend auf hochfrequenten Wörtern
  • Modell-Anpassungsgüte: Perplexität
  • Statistische Signifikanz: Chi-Quadrat-Test, Kruskal-Wallis-H-Test
  • Modell-Erklärungskraft: Pseudo-R² der Beta-Regression

Statistische Analysemethoden

  • Unabhängigkeitstest: Chi-Quadrat-Test zur Bewertung der Assoziation zwischen Thema und Jahr
  • Nichtparametrischer Test: Kruskal-Wallis-H-Test zum Vergleich von Aufrufsunterschieden zwischen Themen
  • Regressionsanalyse: Beta-Regression zur Bewertung der relativen Auswirkungen von Thema und Zeit
  • Korrelationsanalyse: Spearman-Korrelationstest zur Überprüfung der Assoziation zwischen Ersteller- und Publikumspräferenzen

Experimentelle Ergebnisse

Hauptergebnisse

1. Themenverteilungsfunde

Identifikation von 14 Themen mit äußerst ungleichmäßiger Verteilung:

  • Beliebte Themen: Emotionen (20,02%), soziale Interaktion (14,03%)
  • Wissenschaftliche Themen: Universum (5,92%), Technologie (5,90%), Gehirn (5,34%)
  • Unpopuläre Themen: Minderheiten (1,09%)

2. Analyse der Ersteller-Präferenzen

  • Themenfaktor wichtiger: Beta-Regression Pseudo-R²=0,361, Themenkoeffizienten generell größer als Jahreskoeffizienten
  • Präferenzstabilität: Emotionen (β=2,695) und soziale Interaktion (β=2,231) mit höchsten Koeffizienten
  • Zeitsensitivität: Klima-Energie- und Politikthemen zeigen signifikante zeitliche Auswirkungen

3. Analyse der Publikums-Präferenzen

  • Zeitfaktor wichtiger: Beta-Regression Pseudo-R²=0,249, Jahreskoeffizienten generell höher als Themenkoeffizienten
  • Beliebte Themen: Gehirn, soziale Interaktion, Minderheiten mit höchsten durchschnittlichen Aufrufen
  • Angebots-Nachfrage-Diskrepanz: Minderheitsthemen mit geringster Angebotsmenge aber höchster Nachfrage

4. Quantifizierung von Präferenzunterschieden

  • Schwache Gesamtkorrelation: Spearman-Korrelationskoeffizient r=0,143 (p=0,028)
  • Große Unterschiedsschwankungen: Jährliche Differenzindizes ohne klaren Trend, signifikante Schwankungen
  • Themenunterschiede: Emotionen, Minderheiten, Gehirn-Themen mit größten Differenzindizes

Ablationsexperimente

Residuenanalyse-Ergebnisse

  • Stabile Themen: Kunst, Gesundheitswesen nicht durch Zeit beeinflusst
  • Empfindliche Themen: Klima-Energie in 2009, 2021, 2022 signifikant erhöht
  • Ereignisgesteuert: Politikthemen 2020 Spitzenwert (Pandemie-Auswirkung)

Beta-Regressionsmodell-Vergleich

FaktortypErsteller-PräferenzPublikums-Präferenz
ThemenauswirkungStark (große Koeffizienten)Mittel
ZeitauswirkungSchwach (kleine Koeffizienten)Stark
Modell-Erklärungskraft36,1%24,9%

Fallstudien

Erfolgreiche Übereinstimmungsfälle

  • Politikthemen: Ersteller- und Publikumspräferenzkurven relativ stabil, niedrigere Differenzindizes
  • Gesundheitswesen: Als universell beachtetes Thema mit guter Angebots-Nachfrage-Übereinstimmung

Typische Diskrepanzfälle

  • Minderheitsthemen: Schweres Angebotsdefizit (1,09%) aber hohe Nachfrage
  • Emotionsthemen: Überangebot durch Ersteller (20,02%) aber allgemeines Publikumsinteresse
  • Gehirnwissenschaft: 2016-2019 signifikante Angebots-Nachfrage-Unterschiede

Verwandte Arbeiten

Hauptforschungsrichtungen

  1. Einfluss sozialer Netzwerke: Mechanismen des Einflusses echter sozialer Netzwerke auf Online-Popularität
  2. Inhaltsmerkmalsanalyse: Popularitätsprognose basierend auf Tags und Themen
  3. Theorie der selektiven Exposition: Beziehung zwischen Nutzerpräferenzen und Inhaltsauswahl
  4. Auswirkungen von Empfehlungsalgorithmen: Gestaltung der Inhaltssichtbarkeit durch Algorithmen

Innovationen dieses Artikels

  1. Bidirektionale Analyse: Erstmalige systematische Vergleich von Ersteller-Angebot und Publikumsnachfrage
  2. Zeitdimension: Betonung der Bedeutung zeitlicher Dynamiken, Infragestellung des Inhalts-Primat-Konzepts
  3. Quantifizierungsmethode: Vorschlag von Differenzindex und anderen operationalisierbaren Messinstrumenten
  4. Praktische Ausrichtung: Bereitstellung konkreter Strategieempfehlungen statt rein theoretischer Analyse

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Zeit wichtiger als Inhalt: Für das Publikum ist der Zeitpunkt ("Wann") wichtiger als der Inhalt ("Was") für das Engagement
  2. Systematische Angebots-Nachfrage-Diskrepanz: Anhaltende Unterschiede zwischen Ersteller-Präferenzen und Publikumsnachfrage
  3. Signifikante Themenunterschiede: Enorme Unterschiede in der Angebots-Nachfrage-Übereinstimmung zwischen verschiedenen Themen
  4. Revision traditioneller Konzepte: Inhaltsqualität ist nicht der einzige oder Haupttreiber der Popularität

Einschränkungen

  1. Plattformbegrenzung: Nur basierend auf TED-Plattform, Verallgemeinerbarkeit zu überprüfen
  2. Unvollständige Variablen: Berücksichtigung von Likes, Shares und anderen Interaktionsindikatoren fehlt
  3. Interaktionseffekte: Modellkonvergenzprobleme begrenzen die Analyse von Thema-Zeit-Interaktionen
  4. Kausalbeziehungen: Korrelationsanalyse kann keine Kausalbeziehungen bestimmen

Zukünftige Richtungen

  1. Multi-Plattform-Validierung: Erweiterung auf YouTube, Podcasts und andere Plattformen
  2. Interaktionseffekt-Modellierung: Verbesserung statistischer Modelle zur Behandlung komplexer Interaktionen
  3. Echtzeit-Prognosesystem: Entwicklung von Popularitätsprognosetools basierend auf zeitlichen Dynamiken
  4. Inhaltsoptimierungsstrategien: Untersuchung von Optimierungsmethoden für Erzählstruktur und Ausdrucksweise

Tiefgreifende Bewertung

Stärken

  1. Starke methodische Innovation: Das Differenzindex-Konzept ist neuartig und bietet Quantifizierungswerkzeuge für Angebots-Nachfrage-Analyse
  2. Großer Datensatz: 17-jährige Zeitspanne, 4.475 Stichproben, ausreichende statistische Power
  3. Kontraintuitive Ergebnisse: Infragestellung des Inhalts-Primat-Konzepts, Vorschlag der Zeit-Prioritäts-Hypothese
  4. Hoher praktischer Wert: Konkrete, umsetzbare Empfehlungen für Inhaltsersteller
  5. Umfassende Analyse: Kombination qualitativer und quantitativer Methoden, mehrseitige Validierung von Schlussfolgerungen

Mängel

  1. Schwache theoretische Grundlage: Mangel an tiefgreifender Erklärung der Mechanismen, warum zeitliche Faktoren wichtiger sind
  2. Methodische Einschränkungen: Starke Subjektivität bei der LDA-Themenzahlauswahl, mögliche Auswirkungen auf Ergebnisstabilität
  3. Externe Validitätsprobleme: Die Besonderheit der TED-Plattform könnte die Universalität von Schlussfolgerungen begrenzen
  4. Variablenverlust: Vernachlässigung wichtiger Einflussfaktoren wie Redner-Reputation und Videoqualität
  5. Unzureichende Kausalinferenz: Hauptsächlich auf Korrelationsanalyse basierend, fehlende Kausalidentifikationsstrategien

Auswirkungen

  1. Akademischer Beitrag: Neuer Analyserahmen für Digitalplattformforschung
  2. Praktischer Wert: Direkte Orientierungsbedeutung für Content-Marketing und Plattformbetrieb
  3. Interdisziplinäre Bedeutung: Verbindung von Kommunikationswissenschaft, Computerlinguistik und Verbraucherverhalten
  4. Politische Implikationen: Datenstütze für Plattformgovernance und Content-Regulierung

Anwendungsszenarien

  1. Content-Plattformen: Strategieentwicklung für Video-Plattformen wie YouTube, Bilibili
  2. Marketing-Bereich: Zeitpunktauswahl und Themenplanung für Brand-Content-Marketing
  3. Akademische Forschung: Empirische Forschung in digitaler Kommunikation und Verbraucherverhalten
  4. Plattform-Governance: Optimierung von Empfehlungsalgorithmen und Bias-Identifikation

Literaturverzeichnis

Der Artikel zitiert 89 verwandte Literaturquellen, einschließlich:

  • Klassische Literatur zur Analyse sozialer Netzwerke (Kwak et al., 2010)
  • Methodologische Literatur zur Themenmodellierung (Blei et al., 2003)
  • Literatur zur Theorie der selektiven Exposition (Stroud, 2010)
  • Empirische Forschung zur digitalen Kommunikation (Cinelli et al., 2021)

Gesamtbewertung: Dies ist ein innovatives und praktisch wertvolles Forschungspapier, das durch großflächige Datenanalyse das traditionelle inhaltsgesteuerte Konzept in Frage stellt und eine neue zeitpriorisierte Perspektive vorschlägt. Obwohl es noch Raum für Verbesserungen in theoretischer Tiefe und methodischer Vollständigkeit gibt, haben seine Kernfunde wichtige Implikationen für Wissenschaft und Praxis.