2025-11-25T20:16:18.201421

The Initial Screening Order Problem

Alvarez, Mastropietro, Ruggieri
We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.
academic

The Initial Screening Order Problem

基本信息

  • 论文ID: 2307.15398
  • 标题: The Initial Screening Order Problem
  • 作者: Jose M. Alvarez (KU Leuven), Antonio Mastropietro (University of Pisa), Salvatore Ruggieri (University of Pisa)
  • 分类: cs.LG cs.CY
  • 发表时间: 2023年7月(arXiv预印本,2025年1月更新)
  • 论文链接: https://arxiv.org/abs/2307.15398

摘要

本文研究初始筛选顺序(Initial Screening Order, ISO)在候选人筛选中的作用。ISO指的是筛选者在选择k个候选人时搜索候选池的顺序。当前,ISO通常由信息访问系统(如在线平台或数据库查询)产生。尽管ISO对所选k个候选人的最优性和公平性有重要影响(特别是在人工筛选者情况下),但文献中很大程度上忽略了这一点。作者定义了两个问题表述来描述给定ISO下筛选者的搜索行为:best-k问题(选择前k个最佳候选人)和good-k问题(选择前k个足够好的候选人)。为研究ISO的影响,作者引入了人类型筛选者并与算法筛选者进行比较,其中人类型筛选者被设计为随时间变化而不一致。分析表明,在人类型筛选者求解good-k问题时,ISO会阻碍个体公平性(尽管满足群体公平性),并损害所选k个候选人的最优性。这是由于位置偏差造成的,即候选人的评估受其在ISO中位置的影响。

研究背景与动机

问题背景

候选人筛选是一个复杂的、依赖人工的任务,广泛存在于简历筛选、大学招生等场景中。随着机器学习的发展,信息访问系统(IAS)如LinkedIn、Taleo等平台在候选人筛选中发挥着核心作用,它们通常按照估计的相关性或特定特征呈现候选人。

研究动机

  1. 实践需求:基于与欧洲财富全球500强公司G的合作经验,作者发现了五个关键实践模式:
    • G1: 筛选者选择不同的ISO
    • G2: 存在完全搜索和部分搜索两种方式
    • G3: 关注满足最低基本要求的候选人
    • G4: 存在多样性表示配额的公平性目标
    • G5: 每个候选人评估时间约为一分钟
  2. 理论缺口:现有文献主要关注ISO的创建(作为公平集合选择或排序问题),但很少研究筛选者如何使用ISO,特别是人工筛选者的行为。
  3. 公平性关切:位置偏差可能导致相似候选人因在ISO中的位置不同而受到不同对待,违反个体公平性原则。

核心贡献

  1. 首次形式化ISO问题:将ISO作为集合选择问题中的关键参数,定义了best-k和good-k两种搜索行为的问题表述。
  2. 引入人类型筛选者模型:提出了考虑疲劳效应的人类型筛选者,并与算法筛选者进行理论和实验比较。
  3. 提供灵活的仿真工具:开发了能够研究ISO问题的仿真框架,可以在不需要运行真实筛选场景的情况下为实践者提供指导。
  4. 揭示位置偏差的公平性影响:证明了ISO在人类型筛选者下会导致个体公平性违反,同时仍满足群体公平性约束。

方法详解

任务定义

给定候选池C包含n个候选人,每个候选人c由特征向量X_c ∈ R^d和保护属性w_c描述。筛选者h需要基于ISO θ选择k个候选人的集合S^k,同时满足表示配额q(保护群体在S^k中的最小比例)。

两种问题表述

Best-k问题

筛选者需要评估完整的候选池C,选择得分最高的k个候选人:

argmax_{S^k ∈ [C]^k} U^k_add(S^k, θ) s.t. f(S^k) ≥ q

其中效用函数定义为:

U^k_add(S^k, θ) = Σ_{c∈S^k} s(X_c)

Good-k问题

筛选者寻找满足最低要求ψ的前k个候选人,允许部分搜索:

argmax_{S^k ∈ [C]^k} U^k_ψ(S^k, θ) s.t. f(S^k) ≥ q

其中效用函数定义为:

U^k_ψ(S^k, θ) = {
  k - Σ_{c∈S^k} p(c, S^k, θ)  if ∀c ∈ S^k, s(X_c) ≥ ψ
  0                            otherwise
}

惩罚函数p(c, S^k, θ)衡量选择候选人c的"浪费努力"。

筛选者模型

算法筛选者h_a

一致性评估候选人,无疲劳效应,按照确定性算法执行。

人类型筛选者h_h

引入疲劳组件Φ(t) = λ·t,影响候选人评估:

s_h_h(X_c) + ε

其中ε是依赖于累积疲劳的随机变量,考虑两种建模选择:

  • ε₁ ~ N(0, v(Φ(t-1))):方差随疲劳增加
  • ε₂ ~ N(μ(Φ(t-1)), v(Φ(t-1))):均值随疲劳递减

搜索算法

  • ExaminationSearch(算法1):解决best-k问题,按得分降序搜索
  • CascadeSearch(算法2):解决good-k问题,按ISO顺序搜索
  • 对应的人类型版本(算法3-4):加入疲劳效应

实验设置

仿真框架

使用R语言开发的蒙特卡罗仿真框架,每组参数运行10,000次实验。

候选人得分分布

考虑三种截断正态分布t_N(μ, σ):

  • 对称分布:μ=0.5, σ=0.02(顶级候选人概率很低)
  • 非对称分布:μ=0.8, σ=0.05(顶级候选人概率较高)
  • 递增分布:μ=1, σ=0.05(顶级候选人概率最高)

ISO设置

  • θ ⊥⊥ s:ISO与个体得分独立(随机或字母顺序)
  • θ ⊥̸⊥ s:ISO与得分相关,相关系数ρ ∈ {-1, -0.8, -0.5}

实验参数

  • 候选池大小:n = 120, 400, 30
  • 选择数量:k = 6, 20
  • 配额:q = 0.5
  • 保护群体比例:pr = 0.2
  • 最低要求:ψ ∈ 0.3, 0.8

评价指标

  • 基准比率(RtB):相对于基准解的效用比率
  • Jaccard相似度(JdS):候选人重叠比例

实验结果

无疲劳情况(算法筛选者)

Good-k vs Best-k性能

  1. 得分分布影响
    • 对称分布下,随着ψ增加,good-k逐渐接近best-k
    • 非对称和递增分布下,即使ψ较大,good-k也难以达到best-k的性能
  2. ISO相关性影响
    • ρ = -1时(完全负相关),good-k与best-k性能相同
    • ρ = -0.5时,good-k已能很好近似best-k
  3. 规模效应
    • 较大的k/n比率使good-k更好地近似best-k
    • ISO影响随k/n增加而减弱

有疲劳情况(人类型筛选者)

疲劳对Good-k的影响

  1. 方差型疲劳(ε₁)
    • 对称分布在高ψ值下性能显著下降
    • 非对称和递增分布相对稳定
  2. 偏差型疲劳(ε₂)
    • 由于标准差较小,对称分布影响较小
    • 在候选人质量较低的情况下,偏差的影响不大

Best-k vs Good-k with疲劳

  • 疲劳情况下,good-k解有时优于best-k解
  • 说明过长的搜索对人类型筛选者有害
  • 某些设置下应优选good-k策略

ISO相关性的保护作用

  • 提供包含候选人质量信息的ISO可减少疲劳影响
  • 强调了IAS在ISO问题中的重要作用

相关工作

公平集合选择

本文属于公平集合选择文献,与秘书问题(Secretary Problem)相关,但关注筛选过程而非面试阶段,采用离线集合选择设置。

位置偏差研究

  • 点击模型:最早形式化和测试用户如何搜索ISO
  • 实证研究:Echterhoff等人和Wang等人提供了候选筛选中位置偏差的实证证据
  • 本文贡献:将ISO定义为问题表述中的参数,使用仿真捕获多种筛选场景

信息访问系统

现有工作主要关注ISO的创建(公平排序),本文关注筛选者如何使用ISO,特别是人类用户的行为。

结论与讨论

主要结论

  1. 位置偏差的公平性影响:ISO在人类型筛选者下会导致个体公平性违反,即使满足群体公平性约束。
  2. 问题表述的重要性:正确定义问题表述对理解ISO对候选人选择的影响至关重要。
  3. 筛选者行为的复杂性:Best-k和good-k问题之间存在复杂关系,取决于候选人质量分布、ISO相关性和疲劳效应。

局限性

  1. 功能假设限制:效用模型和疲劳项的函数假设可能过于简化
  2. 疲劳建模:线性疲劳累积可能不够现实
  3. 仿真vs现实:仿真结果需要真实场景验证

未来方向

  1. 替代效用模型:探索exposure discounting等其他效用模型
  2. 高级疲劳模型:考虑筛选者休息的循环生存模型
  3. 人类决策理论:整合更多人类决策理论
  4. 参数优化:使用仿真框架测试最优参数

深度评价

优点

  1. 问题重要性:首次系统性地研究了ISO这一被忽视但重要的问题
  2. 理论贡献:提供了严格的数学框架和算法实现
  3. 实践相关性:基于真实企业合作的洞察,具有实际应用价值
  4. 方法创新:引入人类型筛选者模型,考虑疲劳效应
  5. 实验全面性:通过大规模仿真探索了多种参数组合
  6. 工具贡献:提供了开源的仿真框架

不足

  1. 模型简化:疲劳模型相对简单,可能无法捕获复杂的人类行为
  2. 验证不足:主要基于仿真,缺乏大规模真实数据验证
  3. 假设限制:独立性假设(A1、A2)在现实中可能不成立
  4. 评价指标单一:主要关注效用和重叠度,缺乏其他公平性指标

影响力

  1. 学术价值:为公平机器学习和人机交互领域提供新视角
  2. 实用价值:为招聘平台和HR系统设计提供指导
  3. 方法论贡献:仿真框架可扩展到其他决策场景
  4. 政策意义:为算法审计和公平性监管提供工具

适用场景

  1. 招聘筛选:简历筛选、候选人评估
  2. 教育评估:申请审核、作业评分
  3. 推荐系统:考虑用户搜索行为的公平推荐
  4. 决策支持:任何涉及序列化评估的决策场景

技术创新点

核心创新

  1. ISO参数化:将初始筛选顺序作为问题的显式参数
  2. 双重问题表述:区分best-k(全局最优)和good-k(满足条件)两种目标
  3. 疲劳建模:引入时间依赖的评估误差模型
  4. 公平性分析:区分群体公平性和个体公平性的不同表现

算法设计

ExaminationSearch和CascadeSearch算法设计巧妙:

  • 顺序处理保证了ISO的影响
  • 配额管理确保了公平性约束
  • 人类型版本自然地整合了疲劳效应

实验设计

仿真框架的设计考虑周全:

  • 多种得分分布模拟不同候选人质量场景
  • ISO相关性参数控制信息系统的质量
  • 大规模重复实验确保结果稳定性

本文为理解和改进候选人筛选系统提供了重要的理论基础和实用工具,对于构建更公平、更有效的人工智能辅助决策系统具有重要意义。