2025-11-12T20:37:10.312937

Bayesian forecasting of electoral outcomes with new parties' competition

Montalvo, Papaspiliopoulos, Stumpf-Fétizon
This paper proposed a methodology to forecast electoral outcomes using the result of the combination of a fundamental model and a model-based aggregation of polls. We propose a Bayesian hierarchical structure for the fundamental model that synthesises data at the provincial, regional and national level. We use a Bayesian strategy to combine the fundamental model with the information coming for recent polls. This model can naturally be updated every time new information, for instance a new poll, becomes available. This methodology is well suited to deal with increasingly frequent situations in which new political parties enter an electoral competition, although our approach is general enough to accommodate any other electoral situation. We illustrate the advantages of our method using the 2015 Spanish Congressional Election in which two new parties ended up receiving 30\% of the votes. We compare the predictive performance of our model versus alternative models. In general the predictions of our model outperform the alternative specifications, including hybrid models that combine fundamental and polls models. Our predictions are, in relative terms, particularly accurate in predicting the seats obtained by each political party.
academic

Previsione bayesiana dei risultati elettorali con la concorrenza di nuovi partiti

Informazioni di base

  • ID articolo: 1612.03073
  • Titolo: Bayesian forecasting of electoral outcomes with new parties' competition
  • Autori: Jose Garcia Montalvo, Omiros Papaspiliopoulos, Timothee Stumpf-Fetizon
  • Classificazione: stat.AP (Applicazioni statistiche)
  • Data di pubblicazione: 4 febbraio 2019
  • Link articolo: https://arxiv.org/abs/1612.03073

Riassunto

Questo articolo propone un nuovo metodo per prevedere i risultati elettorali che combina modelli fondamentali (fundamental model) e sondaggi nazionali, integrandoli all'interno di un quadro di sintesi delle evidenze. Il metodo è particolarmente adatto alla previsione elettorale in elezioni con la partecipazione di nuovi partiti, fenomeno sempre più comune nell'ambiente politico europeo dopo il 2008. Gli autori utilizzano le elezioni parlamentari spagnole del 2015 come caso di studio, dimostrando i vantaggi del metodo rispetto ad altri approcci concorrenti, in particolare nell'eccellente previsione dei seggi parlamentari ottenuti da ciascun partito.

Contesto di ricerca e motivazione

Problemi fondamentali

  1. Sfida dei partiti emergenti: I metodi tradizionali di previsione elettorale sono principalmente orientati verso sistemi bipartitici o partiti storicamente consolidati, e faticano a gestire elezioni con partiti emergenti
  2. Complessità dell'allocazione dei seggi: La maggior parte dei sondaggi prevede risultati a livello nazionale, ma l'allocazione dei seggi avviene a livello locale, con relazioni di conversione non lineari
  3. Mancanza di dati storici: I nuovi partiti mancano di dati elettorali storici, rendendo inefficaci i metodi tradizionali di regressione temporale

Importanza della ricerca

  • Dopo la crisi finanziaria del 2008, sono emersi 45 partiti "insurgent" in Europa, occupando il 18,3% dei seggi parlamentari in 27 paesi dell'UE
  • Nelle elezioni spagnole del 2015, due nuovi partiti (Podemos e Ciudadanos) hanno ottenuto oltre il 30% dei seggi parlamentari
  • I metodi di previsione tradizionali hanno mostrato scarsi risultati di fronte a cambiamenti radicali del panorama politico

Limitazioni dei metodi esistenti

  1. Modelli fondamentali: Dipendono da dati storici e variabili socioeconomiche, inefficaci per i nuovi partiti
  2. Aggregazione di sondaggi: Fornisce solitamente solo previsioni a livello nazionale, ignorando le differenze locali
  3. Modelli ibridi: I metodi esistenti richiedono dati storici sufficienti per la regressione, non applicabili a scenari con nuovi partiti

Contributi principali

  1. Quadro ibrido innovativo: Propone un nuovo modello ibrido basato sulla sintesi bayesiana delle evidenze, in grado di gestire i nuovi partiti senza richiedere dati storici
  2. Modellazione multilivello: Sviluppa una struttura gerarchica bayesiana che combina dati provinciali, regionali e nazionali
  3. Ottimizzazione della previsione dei seggi: Modellazione specializzata per l'allocazione dei seggi parlamentari, considerando le caratteristiche non lineari del metodo D'Hondt
  4. Verifica empirica: Valida l'efficacia del metodo nelle elezioni spagnole del 2015, con errori di previsione dei seggi significativamente inferiori ai metodi alternativi

Dettagli metodologici

Definizione del compito

Input:

  • Dati di risposta individuale da sondaggi preeletorali
  • Risultati di sondaggi pubblicati
  • Dati censuari

Output:

  • Previsioni della percentuale di voti per ciascun partito in ciascuna provincia
  • Previsioni dell'allocazione dei seggi parlamentari
  • Intervalli di incertezza delle previsioni

Vincoli:

  • Gestire la mancanza di dati storici per i nuovi partiti
  • Considerare le regole di allocazione dei seggi D'Hondt
  • Soddisfare il requisito di soglia di voto del 3% in ciascuna provincia

Architettura del modello

1. Modello fondamentale (Fundamental Model)

Utilizza un modello di regressione logistica multinomiale per prevedere le intenzioni di voto a livello locale:

sₙ|μₙ ~ Multinomial(μₙ)

dove μₙ è il vettore di probabilità di voto al livello n-esimo, calcolato mediante:

μₙ(l) = exp(fₙ,ₗ) / Σᴸₘ₌₁ exp(fₙ,ₘ)

Forma della combinazione lineare:

fₙ,ₗ = αₗ + Σₖ β(k,jₖ[n],l)

2. Modello di sondaggi (Polls Model)

Stabilisce un modello di analisi della varianza esplicativa, decomponendo l'errore di sondaggio:

(pₖ - vₜ[ₖ]) ~ N(γⱼ[ₖ] + δₜ[ₖ] + dₖεₜ[ₖ], Σⱼ[ₖ])

dove:

  • γⱼ: distorsione invariante nel tempo dell'istituto di sondaggio (house effect)
  • δₜ: distorsione sistematica a livello elettorale (election effect)
  • εₜ: effetto di tendenza temporale (trending)
  • dₖ: giorni prima dell'elezione

3. Modello ibrido (Hybrid Model)

Utilizza il metodo bayesiano di sintesi delle evidenze:

Prob[risultato elettorale|sondaggi disponibili] ∝ Prob[sondaggi disponibili|risultato elettorale] × Prob[risultato elettorale]

Procedura operativa:

  1. Generare simulazioni di risultati locali secondo il modello fondamentale
  2. Aggregare al livello nazionale per ottenere vₛ
  3. Calcolare i pesi secondo il modello di sondaggi: Wₓ = Probsondaggi disponibili|vₛ
  4. Calcolare la media ponderata: Σₛ g(v₁,ₛ,...,vᵢ,ₛ)Wₛ / Σₛ Wₛ

Punti di innovazione tecnica

  1. Tecnica di post-stratificazione: Utilizza dati censuari per la post-stratificazione, risolvendo problemi di rappresentatività del campione di sondaggio
  2. Metodo di regressione inversa: Converte il modello di sondaggio esplicativo in un modello predittivo
  3. Campionamento per importanza: Utilizza il campionamento per importanza per esplorare la distribuzione a posteriori
  4. Modellazione dell'allocazione dei seggi: Modella direttamente il processo non lineare di allocazione dei seggi del metodo D'Hondt

Configurazione sperimentale

Dataset

  1. Sondaggio preelettorale: Sondaggio CIS preelettorale 2015, 17.452 intervistati
  2. Sondaggi storici: 157 sondaggi elettorali (pubblicati nei 30 giorni precedenti le elezioni parlamentari 1996-2011)
  3. Sondaggi 2015: 51 sondaggi (pubblicati nei 30 giorni precedenti l'elezione)
  4. Dati censuari: Dati censuari ufficiali spagnoli utilizzati per la post-stratificazione

Metriche di valutazione

  1. RMSE: Errore quadratico medio
  2. Coefficiente di correlazione: Correlazione tra valori previsti e valori effettivi
  3. Errore di previsione dei seggi: Differenza assoluta nel numero di seggi
  4. Previsione probabilistica: Calibrazione dell'intervallo di previsione

Metodi di confronto

  1. Modello fondamentale alternativo: Modello di regressione con tasso di crescita del PIL e risultati elettorali ritardati
  2. Modello di sondaggi alternativo: Media semplice dei sondaggi
  3. Modello ibrido alternativo: Modello di regressione ibrida classico di Lewis-Beck et al.

Dettagli di implementazione

  • Inferenza bayesiana utilizzando Stan
  • Campionamento MCMC: 4 catene, 2000 iterazioni per catena
  • Fattore di amplificazione dell'incertezza: 1,5 volte l'incertezza del termine costante
  • Modellazione gerarchica con distribuzioni a priori standard

Risultati sperimentali

Risultati principali

Previsione della percentuale di voti (elezioni 2015)

PartitoRisultato effettivoMetodo propostoErroreModello ibrido alternativoErrore
PSOE0.2200.2030.0170.607-0.387
PP0.2870.2750.0120.2730.013

Previsione dei seggi (elezioni 2015)

PartitoSeggi effettiviMetodo propostoErroreModello ibrido alternativoErrore
PSOE9075.4714.53137.57-47.57
PP123125.32-2.31105.6517.34

Risultati chiave

  1. Vantaggio significativo nella previsione dei seggi: Il metodo proposto riduce l'errore di previsione dei seggi di circa il 70% rispetto ai metodi alternativi
  2. Pesi dei sondaggi: Nella previsione media nazionale, il peso del modello fondamentale è circa il 35%, mentre il peso del modello di sondaggi è il 65%
  3. Distribuzione geografica: Il modello cattura con successo le caratteristiche di distribuzione geografica di diversi partiti

Esperimenti di ablazione

  1. Prestazioni del modello fondamentale isolato: RMSE 0.04-0.06, coefficiente di correlazione 0.78-0.90
  2. Prestazioni del modello di sondaggi isolato: Previsione accurata a livello nazionale, ma senza informazioni locali
  3. Effetto sinergico: Il modello ibrido combina i vantaggi di entrambi, con le migliori prestazioni nella previsione dei seggi

Lavori correlati

Principali direzioni di ricerca

  1. Approcci con modelli fondamentali: Metodi strutturati basati su dati storici e variabili socioeconomiche (come il modello "bread and peace" di Hibbs)
  2. Aggregazione di sondaggi: Metodi di media ponderata di sondaggi e mercati di previsione
  3. Modelli ibridi: Metodi di previsione integrata che combinano variabili fondamentali e dati di sondaggi

Innovazioni di questo articolo

  1. Gestione dei nuovi partiti: Primo approccio sistematico al problema della previsione elettorale con partiti emergenti
  2. Sintesi multilivello: Combinazione innovativa di dati di sondaggi individuali a livello individuale e dati di sondaggi aggregati a livello aggregato
  3. Orientamento ai seggi: Ottimizzazione specializzata per l'allocazione dei seggi parlamentari, non solo per la percentuale di voti

Conclusioni e discussione

Conclusioni principali

  1. Il metodo ibrido bayesiano proposto può gestire efficacemente la previsione elettorale con partiti emergenti
  2. Il metodo è significativamente superiore ai metodi tradizionali nella previsione dei seggi
  3. La tecnica di post-stratificazione e il quadro di sintesi delle evidenze forniscono nuovi percorsi tecnici per la previsione elettorale

Limitazioni

  1. Problema di calibrazione: I dati del sondaggio CIS presentano una sovrastima sistematica della varianza
  2. Complessità computazionale: L'inferenza bayesiana e il campionamento per importanza hanno costi computazionali elevati
  3. Dipendenza dalle distribuzioni a priori: Le prestazioni del metodo dipendono dall'impostazione ragionevole delle distribuzioni a priori

Direzioni future

  1. Migliorare i metodi di calibrazione dei dati di sondaggio
  2. Estendere ad altri sistemi elettorali e paesi
  3. Integrare nuove fonti di dati come i social media

Valutazione approfondita

Punti di forza

  1. Forte innovazione metodologica: Primo approccio sistematico al problema importante della previsione elettorale con nuovi partiti
  2. Fondamenti teorici solidi: Basato sulla teoria moderna dei modelli gerarchici bayesiani
  3. Verifica empirica adeguata: Validazione con dati elettorali reali, risultati convincenti
  4. Alto valore pratico: Il metodo può essere direttamente applicato alla previsione elettorale pratica

Insufficienze

  1. Verifica su singolo caso: Principalmente basato sulle elezioni spagnole del 2015, capacità di generalizzazione da verificare
  2. Efficienza computazionale: L'inferenza bayesiana è computazionalmente complessa, la previsione in tempo reale potrebbe affrontare sfide
  3. Requisiti di dati: Richiede dati di sondaggi individuali di alta qualità, difficili da ottenere in alcuni paesi

Impatto

  1. Contributo accademico: Fornisce un nuovo quadro metodologico al campo della previsione elettorale
  2. Applicazione pratica: Il metodo è stato applicato nella pratica di previsione elettorale successiva
  3. Valore interdisciplinare: Il metodo può essere esteso a altri scenari di previsione che coinvolgono la concorrenza di nuovi attori

Scenari applicabili

  1. Ambienti elettorali con rapidi cambiamenti del panorama politico
  2. Elezioni con partecipazione di nuovi partiti o candidati
  3. Elezioni con sistema proporzionale che richiedono previsioni precise dell'allocazione dei seggi
  4. Scenari di previsione con dati di sondaggi individuali e dati di sondaggi aggregati disponibili

Bibliografia

  1. Hibbs, D. A. (2008). Implications of the 'bread and peace' model for the 2008 US presidential election
  2. Lewis-Beck, M. & Dassonneville, R. (2016). Forecasting methods in Europe: synthetic models
  3. Park, D. K., Gelman, A., & Bafumi, J. (2004). Bayesian multilevel estimation with poststratification
  4. Gelman, A. & Hill, J. (2007). Data analysis using regression and multilevel/hierarchical models

Sintesi: Questo articolo apporta importanti innovazioni nella metodologia di previsione elettorale, in particolare nel fornire soluzioni efficaci al problema sempre più importante nella democrazia moderna della previsione elettorale con partiti emergenti. Sebbene presenti alcune limitazioni, sia il suo contributo teorico che il suo valore pratico meritano riconoscimento.