2025-11-12T20:37:10.312937

Bayesian forecasting of electoral outcomes with new parties' competition

Montalvo, Papaspiliopoulos, Stumpf-Fétizon
This paper proposed a methodology to forecast electoral outcomes using the result of the combination of a fundamental model and a model-based aggregation of polls. We propose a Bayesian hierarchical structure for the fundamental model that synthesises data at the provincial, regional and national level. We use a Bayesian strategy to combine the fundamental model with the information coming for recent polls. This model can naturally be updated every time new information, for instance a new poll, becomes available. This methodology is well suited to deal with increasingly frequent situations in which new political parties enter an electoral competition, although our approach is general enough to accommodate any other electoral situation. We illustrate the advantages of our method using the 2015 Spanish Congressional Election in which two new parties ended up receiving 30\% of the votes. We compare the predictive performance of our model versus alternative models. In general the predictions of our model outperform the alternative specifications, including hybrid models that combine fundamental and polls models. Our predictions are, in relative terms, particularly accurate in predicting the seats obtained by each political party.
academic

Pronóstico bayesiano de resultados electorales con competencia de nuevos partidos

Información Básica

  • ID del Artículo: 1612.03073
  • Título: Bayesian forecasting of electoral outcomes with new parties' competition
  • Autores: Jose Garcia Montalvo, Omiros Papaspiliopoulos, Timothee Stumpf-Fetizon
  • Clasificación: stat.AP (Aplicaciones Estadísticas)
  • Fecha de Publicación: 4 de febrero de 2019
  • Enlace del Artículo: https://arxiv.org/abs/1612.03073

Resumen

Este artículo propone un nuevo método para pronosticar resultados electorales que combina modelos fundamentales (fundamental model) y encuestas nacionales, integrándolos dentro de un marco de síntesis de evidencia. El método es particularmente adecuado para pronósticos electorales con participación de nuevos partidos políticos, fenómeno cada vez más común en el entorno político europeo posterior a 2008. Los autores utilizan las elecciones al Congreso español de 2015 como estudio de caso, demostrando las ventajas del método respecto a otros enfoques competitivos, especialmente en la predicción de escaños parlamentarios obtenidos por cada partido.

Contexto e Motivación de la Investigación

Problemas Centrales

  1. Desafío de Partidos Emergentes: Los métodos tradicionales de pronóstico electoral se orientan principalmente hacia sistemas bipartidistas o partidos con larga trayectoria, teniendo dificultades para manejar elecciones con participación de partidos emergentes
  2. Complejidad de Asignación de Escaños: La mayoría de las encuestas predicen resultados a nivel nacional, pero la asignación de escaños se realiza a nivel local, existiendo relaciones de conversión no lineales
  3. Ausencia de Datos Históricos: Los nuevos partidos carecen de datos electorales históricos, invalidando los métodos tradicionales de regresión de series temporales

Importancia de la Investigación

  • Tras la crisis financiera de 2008, surgieron 45 partidos "insurgentes" en Europa, ocupando el 18,3% de los escaños parlamentarios en 27 países de la Unión Europea
  • En las elecciones españolas de 2015, dos nuevos partidos (Podemos y Ciudadanos) obtuvieron más del 30% de los escaños parlamentarios
  • Los métodos de pronóstico tradicionales muestran un desempeño deficiente ante cambios drásticos en el panorama político

Limitaciones de Métodos Existentes

  1. Modelos Fundamentales: Dependen de datos históricos y variables socioeconómicas, ineficaces para nuevos partidos
  2. Agregación de Encuestas: Generalmente proporcionan solo predicciones a nivel nacional, ignorando variaciones locales
  3. Modelos Híbridos: Los métodos existentes requieren datos históricos suficientes para regresión, inaplicables en escenarios de nuevos partidos

Contribuciones Principales

  1. Marco Híbrido Innovador: Propone un nuevo modelo híbrido basado en síntesis bayesiana de evidencia, capaz de manejar nuevos partidos sin necesidad de datos históricos
  2. Modelado Multinivel: Desarrolla una estructura jerárquica bayesiana que combina datos a nivel provincial, regional y nacional
  3. Optimización de Predicción de Escaños: Modelado especializado para asignación de escaños parlamentarios, considerando las características no lineales del método D'Hondt
  4. Verificación Empírica: Valida la efectividad del método en las elecciones españolas de 2015, con errores de predicción de escaños significativamente menores que métodos alternativos

Explicación Detallada del Método

Definición de la Tarea

Entrada:

  • Datos de respuestas individuales de encuestas preelectorales
  • Resultados de encuestas publicadas
  • Datos de censos

Salida:

  • Predicciones de porcentaje de votos para cada partido en cada provincia
  • Predicciones de asignación de escaños parlamentarios
  • Intervalos de incertidumbre de las predicciones

Restricciones:

  • Manejo de nuevos partidos sin datos históricos
  • Consideración de la regla de asignación de escaños D'Hondt
  • Cumplimiento del umbral de votación del 3% en cada provincia

Arquitectura del Modelo

1. Modelo Fundamental (Fundamental Model)

Utiliza un modelo de regresión logística multinomial para predecir intenciones de voto a nivel local:

sₙ|μₙ ~ Multinomial(μₙ)

Donde μₙ es el vector de probabilidades de voto en el nivel n, calculado mediante:

μₙ(l) = exp(fₙ,ₗ) / Σᴸₘ₌₁ exp(fₙ,ₘ)

Forma de combinación lineal:

fₙ,ₗ = αₗ + Σₖ β(k,jₖ[n],l)

2. Modelo de Encuestas (Polls Model)

Establece un modelo explicativo de análisis de varianza descomponiendo errores de encuestas:

(pₖ - vₜ[ₖ]) ~ N(γⱼ[ₖ] + δₜ[ₖ] + dₖεₜ[ₖ], Σⱼ[ₖ])

Donde:

  • γⱼ: sesgo invariante en el tiempo de la institución de encuestas (house effect)
  • δₜ: sesgo sistemático a nivel electoral (election effect)
  • εₜ: efecto de tendencia temporal (trending)
  • dₖ: días hasta la elección

3. Modelo Híbrido (Hybrid Model)

Utiliza el método bayesiano de síntesis de evidencia:

Prob[resultado electoral|encuestas disponibles] ∝ Prob[encuestas disponibles|resultado electoral] × Prob[resultado electoral]

Procedimiento operativo:

  1. Generar simulaciones de resultados locales según el modelo fundamental
  2. Agregar al nivel nacional para obtener vₛ
  3. Calcular pesos según el modelo de encuestas: Wₓ = Probencuestas disponibles|vₛ
  4. Calcular promedio ponderado: Σₛ g(v₁,ₛ,...,vᵢ,ₛ)Wₛ / Σₛ Wₛ

Puntos de Innovación Técnica

  1. Técnica de Poststratificación: Utiliza datos de censos para poststratificación, resolviendo problemas de representatividad de muestras de encuestas
  2. Método de Regresión Inversa: Convierte el modelo explicativo de encuestas en un modelo predictivo
  3. Muestreo por Importancia: Utiliza muestreo por importancia para explorar la distribución posterior
  4. Modelado de Asignación de Escaños: Modela directamente el proceso no lineal de asignación de escaños del método D'Hondt

Configuración Experimental

Conjunto de Datos

  1. Encuesta Preelectoral: Encuesta preelectoral CIS 2015, 17.452 encuestados
  2. Encuestas Históricas: 157 encuestas electorales (publicadas 30 días antes de elecciones nacionales 1996-2011)
  3. Encuestas 2015: 51 encuestas (publicadas 30 días antes de la elección)
  4. Censo: Datos de censo oficial español utilizados para poststratificación

Indicadores de Evaluación

  1. RMSE: Error cuadrático medio
  2. Coeficiente de Correlación: Correlación entre valores predichos y reales
  3. Error de Predicción de Escaños: Diferencia absoluta en número de escaños
  4. Predicción Probabilística: Calibración de intervalos de predicción

Métodos de Comparación

  1. Modelo Fundamental Alternativo: Modelo de regresión con crecimiento del PIB + resultados electorales rezagados
  2. Modelo de Encuestas Alternativo: Promedio simple de encuestas
  3. Modelo Híbrido Alternativo: Modelo de regresión híbrida clásico de Lewis-Beck et al.

Detalles de Implementación

  • Inferencia bayesiana utilizando Stan
  • Muestreo MCMC: 4 cadenas, 2000 iteraciones por cadena
  • Factor de amplificación de incertidumbre: 1,5 veces la incertidumbre del término constante
  • Modelado jerárquico utilizando distribuciones previas estándar

Resultados Experimentales

Resultados Principales

Predicción de Porcentaje de Votos (Elecciones 2015)

PartidoResultado RealMétodo PropuestoErrorModelo Híbrido AlternativoError
PSOE0.2200.2030.0170.607-0.387
PP0.2870.2750.0120.2730.013

Predicción de Escaños (Elecciones 2015)

PartidoEscaños RealesMétodo PropuestoErrorModelo Híbrido AlternativoError
PSOE9075.4714.53137.57-47.57
PP123125.32-2.31105.6517.34

Hallazgos Clave

  1. Ventaja Significativa en Predicción de Escaños: El método propuesto reduce el error en predicción de escaños aproximadamente un 70% comparado con métodos alternativos
  2. Ponderación de Encuestas: En la predicción promedio nacional, el peso del modelo fundamental es aproximadamente 35%, mientras que el del modelo de encuestas es 65%
  3. Distribución Geográfica: El modelo captura exitosamente las características de distribución geográfica de diferentes partidos

Experimentos de Ablación

  1. Desempeño del Modelo Fundamental Aislado: RMSE de 0.04-0.06, coeficiente de correlación 0.78-0.90
  2. Desempeño del Modelo de Encuestas Aislado: Predicción precisa a nivel nacional, pero sin capacidad de proporcionar información local
  3. Efecto Sinérgico: El modelo híbrido combina las ventajas de ambos, mostrando el mejor desempeño en predicción de escaños

Trabajo Relacionado

Principales Direcciones de Investigación

  1. Métodos de Modelos Fundamentales: Enfoques estructurados basados en datos históricos y variables socioeconómicas (como el modelo "bread and peace" de Hibbs)
  2. Agregación de Encuestas: Métodos de promedio ponderado de encuestas y mercados de predicción
  3. Modelos Híbridos: Métodos de pronóstico integral que combinan variables fundamentales y datos de encuestas

Innovación de Este Artículo

  1. Manejo de Nuevos Partidos: Primera solución sistemática al problema de pronóstico electoral con participación de nuevos partidos
  2. Síntesis Multinivel: Combinación innovadora de datos de encuestas individuales a nivel micro con datos de encuestas agregadas a nivel macro
  3. Orientación hacia Escaños: Optimización especializada para asignación de escaños parlamentarios, no solo enfocada en porcentaje de votos

Conclusiones y Discusión

Conclusiones Principales

  1. El método híbrido bayesiano propuesto puede manejar efectivamente pronósticos electorales con participación de nuevos partidos
  2. El método muestra ventajas significativas sobre métodos tradicionales en predicción de escaños
  3. La técnica de poststratificación y el marco de síntesis de evidencia bayesiana proporcionan nuevas rutas técnicas para pronóstico electoral

Limitaciones

  1. Problema de Calibración: Los datos de la encuesta CIS presentan problemas de sobreestimación sistemática de varianza
  2. Complejidad Computacional: La inferencia bayesiana y el muestreo por importancia tienen costos computacionales elevados
  3. Dependencia de Priors: El desempeño del método depende de la configuración razonable de distribuciones previas

Direcciones Futuras

  1. Mejorar métodos de calibración de datos de encuestas
  2. Extender a otros sistemas electorales y países
  3. Integrar nuevas fuentes de datos como redes sociales

Evaluación Profunda

Fortalezas

  1. Fuerte Innovación Metodológica: Primera solución sistemática al importante problema de pronóstico electoral con nuevos partidos
  2. Fundamentos Teóricos Sólidos: Basado en teoría moderna de modelos jerárquicos bayesianos
  3. Verificación Empírica Suficiente: Validación con datos electorales reales, resultados convincentes
  4. Alto Valor Práctico: El método puede aplicarse directamente a pronósticos electorales reales

Insuficiencias

  1. Verificación en Caso Único: Principalmente basado en elecciones españolas de 2015, capacidad de generalización pendiente de verificación
  2. Eficiencia Computacional: La inferencia bayesiana es computacionalmente compleja, pronósticos en tiempo real pueden enfrentar desafíos
  3. Requisitos de Datos: Requiere datos de encuestas individuales de alta calidad, posiblemente difíciles de obtener en algunos países

Impacto

  1. Contribución Académica: Proporciona nuevo marco metodológico para el campo de pronóstico electoral
  2. Aplicación Práctica: El método ha sido aplicado en prácticas de pronóstico electoral posteriores
  3. Valor Interdisciplinario: El método puede generalizarse a otros escenarios de predicción con participación de nuevos actores

Escenarios Aplicables

  1. Entornos electorales con cambios rápidos en el panorama político
  2. Elecciones con participación de nuevos partidos o candidatos
  3. Elecciones de representación proporcional que requieren predicciones precisas de asignación de escaños
  4. Escenarios de pronóstico con disponibilidad de datos de encuestas individuales y datos de encuestas agregadas

Referencias

  1. Hibbs, D. A. (2008). Implications of the 'bread and peace' model for the 2008 US presidential election
  2. Lewis-Beck, M. & Dassonneville, R. (2016). Forecasting methods in Europe: synthetic models
  3. Park, D. K., Gelman, A., & Bafumi, J. (2004). Bayesian multilevel estimation with poststratification
  4. Gelman, A. & Hill, J. (2007). Data analysis using regression and multilevel/hierarchical models

Resumen: Este artículo realiza una contribución importante a la metodología de pronóstico electoral, especialmente al proporcionar una solución efectiva al problema cada vez más importante en la democracia moderna de elecciones con participación de nuevos partidos. Aunque presenta ciertas limitaciones, tanto su contribución teórica como su valor práctico merecen reconocimiento.