2025-11-12T20:37:10.312937

Bayesian forecasting of electoral outcomes with new parties' competition

Montalvo, Papaspiliopoulos, Stumpf-Fétizon
This paper proposed a methodology to forecast electoral outcomes using the result of the combination of a fundamental model and a model-based aggregation of polls. We propose a Bayesian hierarchical structure for the fundamental model that synthesises data at the provincial, regional and national level. We use a Bayesian strategy to combine the fundamental model with the information coming for recent polls. This model can naturally be updated every time new information, for instance a new poll, becomes available. This methodology is well suited to deal with increasingly frequent situations in which new political parties enter an electoral competition, although our approach is general enough to accommodate any other electoral situation. We illustrate the advantages of our method using the 2015 Spanish Congressional Election in which two new parties ended up receiving 30\% of the votes. We compare the predictive performance of our model versus alternative models. In general the predictions of our model outperform the alternative specifications, including hybrid models that combine fundamental and polls models. Our predictions are, in relative terms, particularly accurate in predicting the seats obtained by each political party.
academic

Bayesian forecasting of electoral outcomes with new parties' competition

基本信息

  • 论文ID: 1612.03073
  • 标题: Bayesian forecasting of electoral outcomes with new parties' competition
  • 作者: Jose Garcia Montalvo, Omiros Papaspiliopoulos, Timothee Stumpf-Fetizon
  • 分类: stat.AP (Statistics Applications)
  • 发表时间: February 4, 2019
  • 论文链接: https://arxiv.org/abs/1612.03073

摘要

本文提出了一种预测选举结果的新方法,该方法结合了基础模型(fundamental model)和全国民调,并在证据综合框架内进行整合。该方法特别适用于有新政党参与竞争的选举预测,这在2008年后的欧洲政治环境中越来越常见。作者使用2015年西班牙国会选举作为案例研究,展示了该方法相对于其他竞争方法的优势,特别是在预测各政党获得的议会席位方面表现出色。

研究背景与动机

核心问题

  1. 新兴政党挑战: 传统选举预测方法主要针对双党制或历史悠久的政党,难以处理新兴政党参与的选举
  2. 席位分配复杂性: 大多数民调预测全国层面结果,但席位分配在地方层面进行,存在非线性转换关系
  3. 历史数据缺失: 新政党缺乏历史选举数据,传统时间序列回归方法失效

研究重要性

  • 2008年金融危机后,欧洲出现45个"insurgent"政党,占27个欧盟国家议会席位的18.3%
  • 西班牙2015年选举中,两个新政党(Podemos和Ciudadanos)获得了30%以上的议会席位
  • 传统预测方法在面对政治格局剧变时表现不佳

现有方法局限性

  1. 基础模型: 依赖历史数据和社会经济变量,对新政党无效
  2. 民调聚合: 通常只提供全国层面预测,忽略地方差异
  3. 混合模型: 现有方法需要足够的历史数据进行回归,不适用于新政党场景

核心贡献

  1. 创新混合框架: 提出了基于贝叶斯证据综合的新型混合模型,无需历史数据即可处理新政党
  2. 多层次建模: 开发了结合省级、地区级和全国级数据的贝叶斯层次结构
  3. 席位预测优化: 专门针对议会席位分配进行建模,考虑D'Hondt分配方法的非线性特性
  4. 实证验证: 在2015年西班牙选举中验证了方法的有效性,席位预测误差显著低于替代方法

方法详解

任务定义

输入:

  • 选前调查的个体响应数据
  • 已发布的民调结果
  • 人口普查数据

输出:

  • 各政党在各省的得票率预测
  • 议会席位分配预测
  • 预测的不确定性区间

约束条件:

  • 处理新政党缺乏历史数据的情况
  • 考虑D'Hondt席位分配规则
  • 满足各省3%得票门槛要求

模型架构

1. 基础模型 (Fundamental Model)

采用多项式逻辑回归模型预测地方层面投票意向:

sₙ|μₙ ~ Multinomial(μₙ)

其中μₙ是第n个层次的投票概率向量,通过以下公式计算:

μₙ(l) = exp(fₙ,ₗ) / Σᴸₘ₌₁ exp(fₙ,ₘ)

线性组合形式:

fₙ,ₗ = αₗ + Σₖ β(k,jₖ[n],l)

2. 民调模型 (Polls Model)

建立解释性方差分析模型,分解民调误差:

(pₖ - vₜ[ₖ]) ~ N(γⱼ[ₖ] + δₜ[ₖ] + dₖεₜ[ₖ], Σⱼ[ₖ])

其中:

  • γⱼ: 民调机构的时不变偏差(house effect)
  • δₜ: 选举层面的系统性偏差(election effect)
  • εₜ: 时间趋势效应(trending)
  • dₖ: 距选举天数

3. 混合模型 (Hybrid Model)

使用贝叶斯证据综合方法:

Prob[选举结果|可用民调] ∝ Prob[可用民调|选举结果] × Prob[选举结果]

操作流程:

  1. 根据基础模型生成地方结果模拟
  2. 聚合到全国层面获得vₛ
  3. 根据民调模型计算权重: Wₓ = Prob可用民调|vₛ
  4. 计算加权平均: Σₛ g(v₁,ₛ,...,vᵢ,ₛ)Wₛ / Σₛ Wₛ

技术创新点

  1. 后分层技术: 使用人口普查数据进行后分层,解决调查样本代表性问题
  2. 逆回归方法: 将解释性民调模型转换为预测性模型
  3. 重要性采样: 使用重要性采样探索后验分布
  4. 席位分配建模: 直接建模D'Hondt方法的非线性席位分配过程

实验设置

数据集

  1. 选前调查: 2015年CIS选前调查,17,452名受访者
  2. 历史民调: 157个选举民调(1996-2011年国会选举前30天内发布)
  3. 2015年民调: 51个民调(选举前30天内)
  4. 人口普查: 西班牙官方人口普查数据用于后分层

评价指标

  1. RMSE: 均方根误差
  2. 相关系数: 预测值与实际值的相关性
  3. 席位预测误差: 绝对席位数差异
  4. 概率预测: 预测区间的校准度

对比方法

  1. 替代基础模型: GDP增长率 + 滞后选举结果的回归模型
  2. 替代民调模型: 简单民调平均
  3. 替代混合模型: Lewis-Beck等人的经典混合回归模型

实现细节

  • 使用Stan进行贝叶斯推断
  • MCMC采样:4条链,每条2000次迭代
  • 不确定性放大因子:1.5倍常数项不确定性
  • 分层建模使用标准先验分布

实验结果

主要结果

得票率预测 (2015年选举)

政党实际结果本文方法误差替代混合模型误差
PSOE0.2200.2030.0170.607-0.387
PP0.2870.2750.0120.2730.013

席位预测 (2015年选举)

政党实际席位本文方法误差替代混合模型误差
PSOE9075.4714.53137.57-47.57
PP123125.32-2.31105.6517.34

关键发现

  1. 席位预测优势显著: 本文方法在席位预测上相比替代方法误差减少约70%
  2. 民调权重: 在全国平均预测中,基础模型权重约35%,民调模型权重65%
  3. 地理分布: 模型成功捕捉了不同政党的地理分布特征

消融实验

  1. 基础模型单独表现: RMSE为0.04-0.06,相关系数0.78-0.90
  2. 民调模型单独表现: 在全国层面预测准确,但无法提供地方信息
  3. 合成效果: 混合模型结合了两者优势,在席位预测上表现最佳

相关工作

主要研究方向

  1. 基础模型方法: 基于历史和社会经济数据的结构化方法(如Hibbs的"bread and peace"模型)
  2. 民调聚合: 民调加权平均和预测市场方法
  3. 混合模型: 结合基础变量和民调的综合预测方法

本文创新

  1. 新政党处理: 首次系统性解决新政党参与选举的预测问题
  2. 多层次综合: 创新性地结合了个体层面调查数据和聚合层面民调数据
  3. 席位导向: 专门针对议会席位分配进行优化,而非仅关注得票率

结论与讨论

主要结论

  1. 提出的贝叶斯混合方法能有效处理新政党参与的选举预测
  2. 方法在席位预测方面显著优于传统方法
  3. 后分层技术和证据综合框架为选举预测提供了新的技术路径

局限性

  1. 校准问题: CIS调查数据存在系统性的方差高估问题
  2. 计算复杂度: 贝叶斯推断和重要性采样计算成本较高
  3. 先验依赖: 方法性能依赖于先验分布的合理设置

未来方向

  1. 改进调查数据的校准方法
  2. 扩展到其他选举制度和国家
  3. 整合社交媒体等新型数据源

深度评价

优点

  1. 方法创新性强: 首次系统性解决新政党选举预测这一重要问题
  2. 理论基础扎实: 基于现代统计学的贝叶斯层次模型理论
  3. 实证验证充分: 使用真实选举数据验证,结果说服力强
  4. 实用价值高: 方法可直接应用于实际选举预测

不足

  1. 单一案例验证: 主要基于西班牙2015年选举,泛化能力有待验证
  2. 计算效率: 贝叶斯推断计算复杂,实时预测可能面临挑战
  3. 数据要求: 需要高质量的个体调查数据,在某些国家可能难以获得

影响力

  1. 学术贡献: 为选举预测领域提供了新的方法论框架
  2. 实际应用: 方法已被应用于后续选举预测实践
  3. 跨学科价值: 方法可推广到其他涉及新主体竞争的预测场景

适用场景

  1. 政治格局快速变化的选举环境
  2. 有新政党或候选人参与的选举
  3. 需要精确席位分配预测的比例代表制选举
  4. 具备个体调查数据和民调数据的预测场景

参考文献

  1. Hibbs, D. A. (2008). Implications of the 'bread and peace' model for the 2008 US presidential election
  2. Lewis-Beck, M. & Dassonneville, R. (2016). Forecasting methods in Europe: synthetic models
  3. Park, D. K., Gelman, A., & Bafumi, J. (2004). Bayesian multilevel estimation with poststratification
  4. Gelman, A. & Hill, J. (2007). Data analysis using regression and multilevel/hierarchical models

总结: 这篇论文在选举预测方法论上做出了重要创新,特别是在处理新政党参与选举这一现代民主政治中日益重要的问题上提供了有效解决方案。虽然存在一定局限性,但其理论贡献和实用价值都值得肯定。