In this paper we analyze the FIA formula one world championships from 2012 to 2022 taking into account the drivers classifications and the constructors teams classifications of each Grand Prix. The needed data consisted of 22 matrices of sizes ranging from $25 \times 20$ to $10 \times 19$ that have been elaborated from the GP classifications extracted from the official FIA site. We have used the Kendall corrected evolutive coefficient, recently introduced, as a measure of Competitive Balance (CB) to study the evolution of the competitiveness along the years in both drivers and teams championships. In addition, we have compared the CB of F1 championships and two major European football leagues from the seasons 2012-2013 to 2022-2023.
- 论文ID: 2501.00126
- 标题: Competitiveness of Formula 1 championship from 2012 to 2022 as measured by Kendall corrected evolutive coefficient
- 作者: Francisco Pedroche (Universitat Politècnica de València)
- 分类: stat.AP (Statistics - Applications)
- 发表时间: 2024年12月30日
- 论文链接: https://arxiv.org/abs/2501.00126
本文分析了2012年至2022年FIA一级方程式世界锦标赛的竞争平衡,考虑了每场大奖赛的车手分类和车队分类。研究数据包含22个大小从25×20到10×19不等的矩阵,这些数据从FIA官方网站的大奖赛分类中提取。作者使用了最近提出的Kendall修正演化系数作为竞争平衡(CB)的度量,研究了车手和车队锦标赛多年来竞争力的演变。此外,还比较了F1锦标赛与两大欧洲足球联赛在2012-2013至2022-2023赛季的竞争平衡。
- 要解决的问题:本研究致力于量化分析一级方程式赛车的竞争平衡程度,并与其他体育项目进行比较分析。
- 问题的重要性:
- 竞争平衡是体育比赛吸引力的重要指标
- 高竞争平衡意味着比赛结果难以预测,增加观赏性
- 低竞争平衡则表明比赛结果可预测,降低趣味性
- 现有方法的局限性:
- 传统的排名比较方法主要针对两个排名之间的比较
- 缺乏处理多个排名序列、不完整排名和并列情况的综合方法
- 现有的竞争平衡度量方法在处理复杂体育数据时存在局限
- 研究动机:
- 将最新提出的Kendall修正演化系数应用于体育竞争分析
- 提供一个统一的框架来分析包含缺失数据和并列的排名序列
- 为不同体育项目的竞争平衡提供可比较的量化指标
- 首次将Kendall修正演化系数应用于F1竞争平衡分析,提供了处理不完整排名和缺失数据的有效方法
- 构建了2012-2022年F1完整的排名数据集,包括车手和车队在每场大奖赛的分类数据
- 提出了两种处理车队零分情况的方法,并验证了方法的稳健性
- 实现了跨体育项目的竞争平衡比较,量化了F1与欧洲足球联赛竞争平衡的差异
- 提供了标准化的竞争平衡度量指标,便于不同时期和项目间的比较
输入:一系列m个排名(最多包含n个元素),可能包含不完整排名、并列情况和缺失数据
输出:标准化强度指数NS ∈ 0,1,作为竞争平衡的度量
约束条件:处理体育比赛中常见的退赛、未参赛等情况
基础的Kendall τ系数定义为:
其中:
- P:保持相对顺序的元素对数量
- Q:改变顺序的元素对数量
- n:排名中的元素数量
NS的取值范围为0,1,值越高表示竞争平衡越好。
使用向量a = a1, a2, ..., an表示排名,其中:
- ai:元素vi在排名中的位置
- ai = aj表示并列
- ai = •表示元素未参与排名
- 处理不完整排名:能够处理F1比赛中常见的退赛、未完赛情况
- 两种车队评分方法:
- Method 1:零分车队并列最后
- Method 2:零分车队视为缺席
- 多排名序列分析:扩展了传统的两排名比较到多排名序列分析
- 标准化度量:提供了0,1范围内的标准化竞争平衡指标
- F1数据(2012-2022):
- 数据来源:FIA官方网站
- 包含22个赛季,每赛季17-22场大奖赛
- 车手数量:20-25人
- 车队数量:10-12支
- 足球联赛数据(2012-2023):
- 西班牙足球甲级联赛
- 英格兰足球超级联赛
- 每赛季38轮比赛数据
- NS (Normalized Strength):标准化竞争平衡指数
- 统计检验:Shapiro-Wilk正态性检验、t检验
- 描述性统计:均值、标准差
- F1车手锦标赛 vs F1车队锦标赛
- Method 1 vs Method 2(车队评分方法)
- F1锦标赛 vs 欧洲足球联赛
- 使用R/Python进行统计分析
- 置信区间设定为95%
- 对所有NS序列进行正态性检验
| 年份 | NS车手 | NS车队(方法1) | NS车队(方法2) |
|---|
| 2012 | 0.2561 | 0.2456 | 0.4052 |
| 2013 | 0.2136 | 0.1924 | 0.3421 |
| 2014 | 0.1913 | 0.1616 | 0.3106 |
| 2015 | 0.2270 | 0.2722 | 0.2350 |
| 2022 | 0.2092 | 0.2455 | 0.2376 |
统计摘要:
- 车手NS均值:0.2203 (s = 0.018)
- 车队NS均值(方法1):0.2394 (s = 0.035)
- 车队NS均值(方法2):0.2771 (s = 0.070)
- 西班牙联赛NS均值:0.059 (s = 0.0094)
- 英超联赛NS均值:0.056 (s = 0.0062)
方法比较:通过配对t检验,两种车队评分方法的均值差异不显著(p = 0.18),验证了方法的稳健性。
- F1内部比较:
- 车手和车队锦标赛的竞争平衡水平相近
- 车队锦标赛的竞争平衡略高于车手锦标赛
- 两种车队评分方法结果统计上无显著差异
- 跨体育比较:
- F1的竞争平衡约为足球联赛的4倍
- F1比赛的不可预测性明显高于足球联赛
- 两大欧洲足球联赛的竞争平衡水平相近
- 排名理论:基于Kendall's tau的经典排名比较理论
- 体育竞争平衡研究:Herfindahl-Hirschman指数等传统方法
- F1竞争分析:已有研究主要关注规则变化对竞争的影响
- 复杂网络方法:将网络分析方法应用于体育排名比较
本文相比现有工作的优势在于提供了统一的框架处理不完整排名,并实现了跨体育项目的定量比较。
- Kendall修正演化系数是分析体育竞争平衡的有效工具,特别适合处理包含缺失数据的排名序列
- F1车手和车队锦标赛具有相似的竞争平衡水平,证明了度量方法的一致性
- F1的竞争平衡显著高于足球联赛,反映了不同体育项目的竞争特征差异
- 2012-2022年期间F1的竞争平衡相对稳定,未出现显著的趋势性变化
- 数据时间范围有限:仅覆盖2012-2022年,未包含更早期的F1数据
- 规则变化影响:未深入分析F1规则变化对竞争平衡的具体影响
- 因子分析缺失:未分析影响竞争平衡的具体因素(如技术规则、经济因素等)
- 预测能力未验证:未测试该指标对未来竞争平衡的预测能力
- 扩展到更多体育项目和更长时间序列
- 分析竞争平衡的影响因素
- 开发基于竞争平衡的预测模型
- 研究竞争平衡与观众兴趣的关系
- 方法创新性强:首次将Kendall修正演化系数应用于F1分析,处理了实际数据中的复杂情况
- 数据处理完整:系统地处理了11年的F1完整数据,数据质量高
- 统计分析严谨:使用了适当的统计检验方法,结论可靠
- 跨领域比较有意义:F1与足球的比较提供了新的视角
- 实用价值高:为体育管理者和研究者提供了量化工具
- 理论深度有限:主要是方法应用,缺乏对竞争平衡机制的深入理论分析
- 影响因素分析不足:未探讨造成竞争平衡差异的根本原因
- 预测和应用价值待验证:缺乏对实际应用场景的讨论
- 方法比较不充分:未与其他竞争平衡度量方法进行详细比较
- 学术贡献:为体育统计学和排名理论提供了新的应用案例
- 实用价值:为体育联盟和监管机构提供了竞争平衡监测工具
- 可复现性强:方法描述清晰,数据来源公开
- 扩展潜力大:可应用于其他具有排名特征的领域
- 体育联盟管理:监测和评估联赛竞争平衡
- 体育政策制定:为规则修改提供量化依据
- 学术研究:体育经济学和统计学研究
- 商业分析:体育营销和投资决策支持
论文引用了29篇相关文献,主要包括:
- Kendall排名理论的经典文献
- 体育竞争平衡的理论研究
- 复杂网络在体育分析中的应用
- F1和足球的实证研究
总体评价:这是一篇应用统计学的优秀论文,将新的统计方法成功应用于体育数据分析,提供了有价值的实证结果和跨体育项目的比较分析。方法严谨,结果可信,具有良好的学术价值和实用价值。