2025-11-12T20:37:10.312937

Bayesian forecasting of electoral outcomes with new parties' competition

Montalvo, Papaspiliopoulos, Stumpf-Fétizon
This paper proposed a methodology to forecast electoral outcomes using the result of the combination of a fundamental model and a model-based aggregation of polls. We propose a Bayesian hierarchical structure for the fundamental model that synthesises data at the provincial, regional and national level. We use a Bayesian strategy to combine the fundamental model with the information coming for recent polls. This model can naturally be updated every time new information, for instance a new poll, becomes available. This methodology is well suited to deal with increasingly frequent situations in which new political parties enter an electoral competition, although our approach is general enough to accommodate any other electoral situation. We illustrate the advantages of our method using the 2015 Spanish Congressional Election in which two new parties ended up receiving 30\% of the votes. We compare the predictive performance of our model versus alternative models. In general the predictions of our model outperform the alternative specifications, including hybrid models that combine fundamental and polls models. Our predictions are, in relative terms, particularly accurate in predicting the seats obtained by each political party.
academic

Bayesianische Vorhersage von Wahlergebnissen mit Wettbewerb neuer Parteien

Grundinformationen

  • Paper-ID: 1612.03073
  • Titel: Bayesianische Vorhersage von Wahlergebnissen mit Wettbewerb neuer Parteien
  • Autoren: Jose Garcia Montalvo, Omiros Papaspiliopoulos, Timothee Stumpf-Fetizon
  • Klassifizierung: stat.AP (Statistik-Anwendungen)
  • Veröffentlichungsdatum: 4. Februar 2019
  • Paper-Link: https://arxiv.org/abs/1612.03073

Zusammenfassung

Dieses Paper präsentiert eine neue Methode zur Vorhersage von Wahlergebnissen, die ein Fundamentalmodell und nationale Umfragen innerhalb eines evidenzbasierten Integrationssystems kombiniert. Die Methode ist besonders für Wahlprognosen mit neuen Parteien im Wettbewerb geeignet, was in der europäischen Politiklandschaft nach 2008 zunehmend häufig vorkommt. Die Autoren verwenden die spanische Parlamentswahl 2015 als Fallstudie und demonstrieren die Vorteile der Methode gegenüber konkurrierenden Ansätzen, insbesondere bei der Vorhersage der Parlamentssitze für einzelne Parteien.

Forschungshintergrund und Motivation

Kernprobleme

  1. Herausforderung durch neue Parteien: Traditionelle Wahlprognose-Methoden sind hauptsächlich für Zweiparteiensysteme oder etablierte Parteien konzipiert und können Wahlen mit neuen Parteien schwer bewältigen
  2. Komplexität der Sitzverteilung: Die meisten Umfragen prognostizieren nationale Ergebnisse, aber die Sitzverteilung erfolgt auf lokaler Ebene mit nichtlinearen Umwandlungsbeziehungen
  3. Fehlende historische Daten: Neue Parteien verfügen über keine historischen Wahldaten, wodurch traditionelle Zeitreihen-Regressionsmethoden ausfallen

Forschungsrelevanz

  • Nach der Finanzkrise 2008 entstanden in Europa 45 "insurgent"-Parteien, die 18,3% der Parlamentssitze in 27 EU-Ländern erhielten
  • Bei der spanischen Wahl 2015 erhielten zwei neue Parteien (Podemos und Ciudadanos) über 30% der Parlamentssitze
  • Traditionelle Prognosemethoden zeigen schlechte Leistung bei dramatischen politischen Umbrüchen

Einschränkungen bestehender Methoden

  1. Fundamentalmodelle: Abhängig von historischen Daten und sozioökonomischen Variablen, unwirksam für neue Parteien
  2. Umfrage-Aggregation: Liefert typischerweise nur nationale Prognosen und ignoriert lokale Unterschiede
  3. Hybridmodelle: Bestehende Methoden erfordern ausreichende historische Daten für Regressionen und sind für neue Parteien ungeeignet

Kernbeiträge

  1. Innovatives Hybrid-Framework: Präsentation eines neuen Hybrid-Modells basierend auf bayesianischer Evidenzintegration, das ohne historische Daten neue Parteien verarbeiten kann
  2. Mehrstufige Modellierung: Entwicklung einer bayesianischen hierarchischen Struktur, die Daten auf Provinz-, Regional- und Nationalebene kombiniert
  3. Optimierte Sitzvorhersage: Spezialisierte Modellierung der Parlamentssitzverteilung unter Berücksichtigung der nichtlinearen Eigenschaften der D'Hondt-Verteilungsmethode
  4. Empirische Validierung: Validierung der Methode bei der spanischen Wahl 2015 mit signifikant geringeren Sitzvorhersagefehlern als alternative Methoden

Methodische Details

Aufgabendefinition

Eingaben:

  • Individuelle Antwortenaten aus Vorwahlumfragen
  • Veröffentlichte Umfrageergebnisse
  • Volkszählungsdaten

Ausgaben:

  • Stimmanteilsprognosen für jede Partei in jeder Provinz
  • Parlamentssitzverteilungsprognosen
  • Unsicherheitsintervalle für Prognosen

Nebenbedingungen:

  • Umgang mit fehlenden historischen Daten für neue Parteien
  • Berücksichtigung der D'Hondt-Sitzverteilungsregel
  • Erfüllung der 3%-Wahlhürde pro Provinz

Modellarchitektur

1. Fundamentalmodell

Verwendung eines multinomialen logistischen Regressionsmodells zur Vorhersage von Wahlabsichten auf lokaler Ebene:

sₙ|μₙ ~ Multinomial(μₙ)

wobei μₙ der Wahlwahrscheinlichkeitsvektor der n-ten Ebene ist, berechnet durch:

μₙ(l) = exp(fₙ,ₗ) / Σᴸₘ₌₁ exp(fₙ,ₘ)

Lineare Kombinationsform:

fₙ,ₗ = αₗ + Σₖ β(k,jₖ[n],l)

2. Umfrage-Modell

Aufbau eines erklärenden Varianzanalyse-Modells zur Zerlegung von Umfagefehlern:

(pₖ - vₜ[ₖ]) ~ N(γⱼ[ₖ] + δₜ[ₖ] + dₖεₜ[ₖ], Σⱼ[ₖ])

wobei:

  • γⱼ: Zeitinvariante Verzerrung des Umfrageinstituts (house effect)
  • δₜ: Systematische Verzerrung auf Wahleben (election effect)
  • εₜ: Zeittrend-Effekt (trending)
  • dₖ: Tage bis zur Wahl

3. Hybrid-Modell

Verwendung der bayesianischen Evidenzintegrationsmethode:

Prob[Wahlergebnis|verfügbare Umfragen] ∝ Prob[verfügbare Umfragen|Wahlergebnis] × Prob[Wahlergebnis]

Operativer Ablauf:

  1. Generierung von lokalen Ergebnis-Simulationen basierend auf dem Fundamentalmodell
  2. Aggregation auf nationale Ebene zur Erlangung von vₛ
  3. Berechnung von Gewichten nach dem Umfrage-Modell: Wₓ = Probverfügbare Umfragen|vₛ
  4. Berechnung des gewichteten Durchschnitts: Σₛ g(v₁,ₛ,...,vᵢ,ₛ)Wₛ / Σₛ Wₛ

Technische Innovationen

  1. Post-Stratifizierungstechnik: Verwendung von Volkszählungsdaten zur Post-Stratifizierung zur Lösung von Repräsentativitätsproblemen bei Umfragestichproben
  2. Inverse Regressionsmethode: Umwandlung des erklärenden Umfrage-Modells in ein prädiktives Modell
  3. Importance Sampling: Verwendung von Importance Sampling zur Erkundung der posterioren Verteilung
  4. Sitzverteilungsmodellierung: Direkte Modellierung des nichtlinearen Sitzverteilungsprozesses der D'Hondt-Methode

Experimentelles Setup

Datensätze

  1. Vorwahlumfrage: CIS-Vorwahlumfrage 2015 mit 17.452 Befragten
  2. Historische Umfragen: 157 Wahlumfragen (veröffentlicht in den 30 Tagen vor den Parlamentswahlen 1996-2011)
  3. Umfragen 2015: 51 Umfragen (veröffentlicht in den 30 Tagen vor der Wahl)
  4. Volkszählung: Offizielle spanische Volkszählungsdaten für Post-Stratifizierung

Bewertungsmetriken

  1. RMSE: Quadratischer Mittelfehler
  2. Korrelationskoeffizient: Korrelation zwischen Prognose und tatsächlichen Werten
  3. Sitzvorhersagefehler: Absolute Differenz in der Sitzanzahl
  4. Probabilistische Vorhersage: Kalibrierung der Prognoseintervalle

Vergleichsmethoden

  1. Alternatives Fundamentalmodell: BIP-Wachstum + Regressionsmodell mit verzögertem Wahlergebnis
  2. Alternatives Umfrage-Modell: Einfacher Umfragedurchschnitt
  3. Alternatives Hybrid-Modell: Klassisches Hybrid-Regressionsmodell von Lewis-Beck et al.

Implementierungsdetails

  • Bayesianische Inferenz mit Stan
  • MCMC-Sampling: 4 Ketten mit je 2000 Iterationen
  • Unsicherheits-Verstärkungsfaktor: 1,5-fache konstante Term-Unsicherheit
  • Hierarchische Modellierung mit Standard-Priorverteilungen

Experimentelle Ergebnisse

Hauptergebnisse

Stimmanteilsprognose (Wahl 2015)

ParteiTatsächliches ErgebnisDiese MethodeFehlerAlternatives Hybrid-ModellFehler
PSOE0.2200.2030.0170.607-0.387
PP0.2870.2750.0120.2730.013

Sitzvorhersage (Wahl 2015)

ParteiTatsächliche SitzeDiese MethodeFehlerAlternatives Hybrid-ModellFehler
PSOE9075.4714.53137.57-47.57
PP123125.32-2.31105.6517.34

Wichtigste Erkenntnisse

  1. Signifikante Sitzvorhersage-Vorteile: Die Methode reduziert Sitzvorhersagefehler um etwa 70% im Vergleich zu alternativen Methoden
  2. Umfrage-Gewichtung: Im nationalen Durchschnitt beträgt das Fundamentalmodell-Gewicht etwa 35%, das Umfrage-Modell-Gewicht 65%
  3. Geografische Verteilung: Das Modell erfasst erfolgreich die geografischen Verteilungsmerkmale verschiedener Parteien

Ablationsexperimente

  1. Fundamentalmodell-Einzelleistung: RMSE 0.04-0.06, Korrelationskoeffizient 0.78-0.90
  2. Umfrage-Modell-Einzelleistung: Genaue Vorhersage auf nationaler Ebene, aber keine lokalen Informationen
  3. Synergieeffekt: Das Hybrid-Modell kombiniert die Vorteile beider Ansätze und zeigt die beste Leistung bei der Sitzvorhersage

Verwandte Arbeiten

Hauptforschungsrichtungen

  1. Fundamentalmodell-Ansätze: Strukturierte Methoden basierend auf historischen und sozioökonomischen Daten (z.B. Hibbs' "bread and peace"-Modell)
  2. Umfrage-Aggregation: Gewichtete Umfragedurchschnitte und Prognosemarkt-Methoden
  3. Hybrid-Modelle: Integrative Prognosemethoden, die Fundamentalvariablen und Umfragedaten kombinieren

Innovationen dieses Papers

  1. Umgang mit neuen Parteien: Erste systematische Lösung des Prognoseproblems bei Wahlen mit neuen Parteien
  2. Mehrstufige Integration: Innovative Kombination von individuellen Umfragedaten und aggregierten Umfragedaten
  3. Sitzorientierung: Spezialisierte Optimierung für Parlamentssitzverteilung statt nur Stimmanteilsprognose

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Die vorgeschlagene bayesianische Hybrid-Methode kann Wahlprognosen mit neuen Parteien effektiv bewältigen
  2. Die Methode zeigt signifikante Überlegenheit gegenüber traditionellen Methoden bei der Sitzvorhersage
  3. Post-Stratifizierungstechnik und Evidenzintegrations-Framework bieten neue technische Wege für Wahlprognosen

Einschränkungen

  1. Kalibrierungsprobleme: CIS-Umfragedaten zeigen systematische Varianzüberschätzung
  2. Rechenkomplexität: Bayesianische Inferenz und Importance Sampling haben hohe Rechenkosten
  3. Prior-Abhängigkeit: Methodenleistung hängt von angemessener Prior-Verteilungseinstellung ab

Zukünftige Richtungen

  1. Verbesserung der Kalibrierungsmethoden für Umfragedaten
  2. Erweiterung auf andere Wahlsysteme und Länder
  3. Integration neuer Datenquellen wie Social Media

Tiefgreifende Bewertung

Stärken

  1. Starke methodische Innovation: Erste systematische Lösung des wichtigen Problems der Wahlprognose mit neuen Parteien
  2. Solide theoretische Grundlagen: Basierend auf modernen statistischen bayesianischen hierarchischen Modelltheorien
  3. Umfassende empirische Validierung: Validierung mit echten Wahldaten mit überzeugenden Ergebnissen
  4. Hoher praktischer Wert: Methode kann direkt auf praktische Wahlprognosen angewendet werden

Mängel

  1. Validierung mit einzelnem Fall: Hauptsächlich basierend auf spanischer Wahl 2015, Verallgemeinerbarkeit zu überprüfen
  2. Recheneffizienz: Bayesianische Inferenz ist rechnerisch komplex, Echtzeit-Prognosen könnten Herausforderungen gegenüberstehen
  3. Datenanforderungen: Erfordert hochwertige individuelle Umfragedaten, die in einigen Ländern schwer zu beschaffen sind

Auswirkungen

  1. Akademischer Beitrag: Bietet neues methodologisches Framework für Wahlprognose-Forschung
  2. Praktische Anwendung: Methode wurde bereits in nachfolgenden Wahlprognose-Praktiken angewendet
  3. Interdisziplinärer Wert: Methode kann auf andere Szenarien mit Wettbewerb neuer Akteure verallgemeinert werden

Anwendungsszenarien

  1. Wahlumgebungen mit schnell verändernder politischer Landschaft
  2. Wahlen mit neuen Parteien oder Kandidaten
  3. Szenarien, die präzise Sitzverteilungsprognosen in Verhältniswahlsystemen erfordern
  4. Prognose-Szenarien mit verfügbaren individuellen Umfragedaten und Umfragedaten

Literaturverzeichnis

  1. Hibbs, D. A. (2008). Implikationen des "bread and peace"-Modells für die US-Präsidentschaftswahl 2008
  2. Lewis-Beck, M. & Dassonneville, R. (2016). Prognosemethoden in Europa: synthetische Modelle
  3. Park, D. K., Gelman, A., & Bafumi, J. (2004). Bayesianische mehrstufige Schätzung mit Post-Stratifizierung
  4. Gelman, A. & Hill, J. (2007). Datenanalyse mit Regressions- und mehrstufigen/hierarchischen Modellen

Zusammenfassung: Dieses Paper leistet wichtige methodologische Innovationen in der Wahlprognose, insbesondere bei der Bereitstellung effektiver Lösungen für das zunehmend wichtige Problem der Wahlen mit neuen Parteien in der modernen Demokratie. Obwohl es gewisse Einschränkungen gibt, sind sowohl sein theoretischer Beitrag als auch sein praktischer Wert bemerkenswert.