We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.
論文ID : 2307.15398タイトル : The Initial Screening Order Problem著者 : Jose M. Alvarez (KU Leuven)、Antonio Mastropietro (University of Pisa)、Salvatore Ruggieri (University of Pisa)分類 : cs.LG cs.CY発表時期 : 2023年7月(arXiv プレプリント、2025年1月更新)論文リンク : https://arxiv.org/abs/2307.15398 本論文は、候補者スクリーニングにおける初期スクリーニング順序(Initial Screening Order, ISO)の役割を研究している。ISOとは、スクリーニング担当者がk人の候補者を選択する際に候補者プールを検索する順序を指す。現在、ISOは通常、情報アクセスシステム(オンラインプラットフォームやデータベースクエリなど)によって生成される。ISOは選択されたk人の候補者の最適性と公平性に重要な影響を与えるにもかかわらず(特に人間のスクリーニング担当者の場合)、文献では大部分が無視されている。著者らは、与えられたISO下でのスクリーニング担当者の検索行動を記述するために、2つの問題定式化を定義している:best-k問題(上位k人の最良候補者を選択)とgood-k問題(上位k人の十分に良い候補者を選択)。ISOの影響を研究するため、著者らは人間型スクリーニング担当者を導入し、アルゴリズム型スクリーニング担当者と比較している。人間型スクリーニング担当者は時間とともに変動する不一貫性を示すように設計されている。分析により、人間型スクリーニング担当者がgood-k問題を解く場合、ISOは個人的公平性を阻害する(集団的公平性は満たすが)ことが示され、選択されたk人の候補者の最適性が損なわれる。これは位置バイアスによるもので、候補者の評価がISO内での位置の影響を受けるためである。
候補者スクリーニングは複雑で人間に依存するタスクであり、履歴書スクリーニング、大学入試など多くの場面で広く存在している。機械学習の発展に伴い、LinkedInやTaleoなどのプラットフォームのような情報アクセスシステム(IAS)は候補者スクリーニングにおいて中核的な役割を果たしており、通常、推定される関連性または特定の特性に基づいて候補者を提示する。
実践的必要性 :ヨーロッパのフォーチュン・グローバル500企業Gとの協力経験に基づき、著者らは5つの重要な実践パターンを発見した:G1: スクリーニング担当者は異なるISOを選択する G2: 完全検索と部分検索の2つの方法が存在する G3: 最低限の基本要件を満たす候補者に焦点を当てる G4: 多様性表現クォータの公平性目標が存在する G5: 各候補者の評価時間は約1分である 理論的ギャップ :既存文献はISO作成(公平集合選択または順序付け問題として)に主に焦点を当てているが、スクリーニング担当者がISOをどのように使用するか、特に人間のスクリーニング担当者の行動についてはほとんど研究されていない。公平性への懸念 :位置バイアスは、ISO内の位置が異なるため、類似の候補者が異なる扱いを受ける可能性があり、個人的公平性の原則に違反する。ISO問題の初めての形式化 :ISOを集合選択問題における重要なパラメータとして位置づけ、best-kおよびgood-kという2つの検索行動の問題定式化を定義した。人間型スクリーニング担当者モデルの導入 :疲労効果を考慮した人間型スクリーニング担当者を提案し、アルゴリズム型スクリーニング担当者と理論的および実験的に比較した。柔軟なシミュレーションツールの提供 :ISO問題を研究できるシミュレーションフレームワークを開発し、実際のスクリーニングシナリオを実行することなく実務家に指導を提供できる。位置バイアスの公平性への影響の解明 :ISOが人間型スクリーニング担当者の下で個人的公平性違反をもたらすことを証明しながら、集団的公平性制約を満たしていることを示した。n人の候補者を含む候補者プールCが与えられ、各候補者cは特徴ベクトルX_c ∈ R^dと保護属性w_cで記述される。スクリーニング担当者hはISO θに基づいてk人の候補者の集合S^kを選択する必要があり、同時に表現クォータq(保護グループがS^k内の最小比率)を満たす必要がある。
スクリーニング担当者は完全な候補者プールCを評価し、スコアが最も高いk人の候補者を選択する必要がある:
argmax_{S^k ∈ [C]^k} U^k_add(S^k, θ) s.t. f(S^k) ≥ q
ここで効用関数は以下のように定義される:
U^k_add(S^k, θ) = Σ_{c∈S^k} s(X_c)
スクリーニング担当者は最低要件ψを満たす最初のk人の候補者を探し、部分検索を許可する:
argmax_{S^k ∈ [C]^k} U^k_ψ(S^k, θ) s.t. f(S^k) ≥ q
ここで効用関数は以下のように定義される:
U^k_ψ(S^k, θ) = {
k - Σ_{c∈S^k} p(c, S^k, θ) if ∀c ∈ S^k, s(X_c) ≥ ψ
0 otherwise
}
ペナルティ関数p(c, S^k, θ)は候補者cを選択する「無駄な努力」を測定する。
候補者を一貫して評価し、疲労効果がなく、決定論的アルゴリズムに従う。
疲労成分Φ(t) = λ·tを導入し、候補者評価に影響を与える:
ここでεは累積疲労に依存する確率変数であり、2つのモデリング選択肢を考慮する:
ε₁ ~ N(0, v(Φ(t-1))):分散が疲労とともに増加 ε₂ ~ N(μ(Φ(t-1)), v(Φ(t-1))):平均が疲労とともに低下 ExaminationSearch (アルゴリズム1):best-k問題を解く、スコアの降順で検索CascadeSearch (アルゴリズム2):good-k問題を解く、ISO順序で検索対応する人間型版(アルゴリズム3-4):疲労効果を組み込む R言語で開発されたモンテカルロシミュレーションフレームワークを使用し、各パラメータセットについて10,000回の実験を実行した。
3つの切断正規分布t_N(μ, σ)を考慮した:
対称分布 :μ=0.5, σ=0.02(トップ候補者の確率が非常に低い)非対称分布 :μ=0.8, σ=0.05(トップ候補者の確率が比較的高い)増加分布 :μ=1, σ=0.05(トップ候補者の確率が最も高い)θ ⊥⊥ s :ISOが個人スコアと独立(ランダムまたはアルファベット順)θ ⊥̸⊥ s :ISOがスコアと相関、相関係数ρ ∈ {-1, -0.8, -0.5}候補者プールサイズ:n = 120, 400, 30 選択数:k = 6, 20 クォータ:q = 0.5 保護グループの比率:pr = 0.2 最低要件:ψ ∈ 0.3, 0.8 ベースラインに対する比率(RtB) :ベースラインソリューションに対する効用比率Jaccard類似度(JdS) :候補者の重複比率スコア分布の影響 :対称分布では、ψが増加するにつれてgood-kは徐々にbest-kに接近する 非対称および増加分布では、ψが大きい場合でも、good-kはbest-kのパフォーマンスに達することが難しい ISO相関性の影響 :ρ = -1の場合(完全負相関)、good-kとbest-kのパフォーマンスは同じである ρ = -0.5の場合、good-kはすでにbest-kをよく近似している スケール効果 :より大きいk/n比率により、good-kはbest-kをより良く近似する ISO影響はk/nの増加とともに減弱する 分散型疲労(ε₁) :対称分布は高いψ値でパフォーマンスが著しく低下する 非対称および増加分布は比較的安定している バイアス型疲労(ε₂) :標準偏差が小さいため、対称分布への影響は小さい 候補者の質が低い場合、バイアスの影響は大きくない 疲労の場合、good-kソリューションはbest-kソリューションより優れていることがある 長い検索は人間型スクリーニング担当者に害をもたらすことを示唆している 特定の設定ではgood-k戦略を優先すべきである 候補者の質情報を含むISOを提供することで、疲労の影響を軽減できる IASがISO問題における重要性を強調している 本論文は公平集合選択文献に属し、秘書問題(Secretary Problem)と関連しているが、面接段階ではなくスクリーニングプロセスに焦点を当て、オフライン集合選択設定を採用している。
クリックモデル :ユーザーがISOをどのように検索するかを形式化およびテストする最初の形式実証研究 :EchterhofffらおよびWangらは候補者スクリーニングにおける位置バイアスの実証的証拠を提供している本論文の貢献 :ISOを問題定式化のパラメータとして定義し、シミュレーションを使用して複数のスクリーニングシナリオをキャプチャする既存の研究はISO作成(公平なランキング)に主に焦点を当てているが、本論文はスクリーニング担当者がISOをどのように使用するか、特に人間ユーザーの行動に焦点を当てている。
位置バイアスの公平性への影響 :ISOは人間型スクリーニング担当者の下で個人的公平性違反をもたらし、集団的公平性制約を満たしている場合でも同様である。問題定式化の重要性 :正しい問題定式化は、ISOが候補者選択に与える影響を理解するために重要である。スクリーニング担当者行動の複雑性 :Best-kおよびgood-k問題間には複雑な関係が存在し、候補者の質分布、ISO相関性、疲労効果に依存する。関数仮定の制限 :効用モデルと疲労項の関数仮定は過度に単純化されている可能性がある疲労モデリング :線形疲労蓄積は現実的でない可能性があるシミュレーション対現実 :シミュレーション結果は実際のシナリオで検証する必要がある代替効用モデル :exposure discountingなどの他の効用モデルを探索する高度な疲労モデル :スクリーニング担当者の休息を考慮した周期的生存モデルを検討する人間の意思決定理論 :より多くの人間の意思決定理論を統合するパラメータ最適化 :シミュレーションフレームワークを使用して最適なパラメータをテストする問題の重要性 :無視されているが重要なISO問題を初めて体系的に研究した理論的貢献 :厳密な数学的フレームワークとアルゴリズム実装を提供した実践的関連性 :実際の企業協力の洞察に基づき、実用的応用価値がある方法論の革新 :人間型スクリーニング担当者モデルを導入し、疲労効果を考慮した実験の包括性 :大規模シミュレーションを通じて複数のパラメータ組み合わせを探索したツール貢献 :オープンソースのシミュレーションフレームワークを提供したモデルの単純化 :疲労モデルは比較的単純であり、複雑な人間行動をキャプチャできない可能性がある検証不足 :主にシミュレーションに基づいており、大規模な実データ検証が不足している仮定の制限 :独立性仮定(A1、A2)は現実では成立しない可能性がある評価指標の単一性 :主に効用と重複度に焦点を当てており、他の公平性指標が不足している学術的価値 :公平機械学習と人間-機械相互作用分野に新しい視点を提供した実用的価値 :採用プラットフォームとHRシステム設計に指導を提供した方法論的貢献 :シミュレーションフレームワークは他の意思決定シナリオに拡張可能である政策的意義 :アルゴリズム監査と公平性規制のためのツールを提供した採用スクリーニング :履歴書スクリーニング、候補者評価教育評価 :申請書審査、課題採点推奨システム :ユーザー検索行動を考慮した公平な推奨意思決定支援 :順序付き評価を伴うあらゆる意思決定シナリオISOのパラメータ化 :初期スクリーニング順序を問題の明示的なパラメータとして位置づけた二重問題定式化 :best-k(グローバル最適)とgood-k(条件満足)という2つの目標を区別した疲労モデリング :時間依存の評価誤差モデルを導入した公平性分析 :集団的公平性と個人的公平性の異なる表現を区別したExaminationSearchおよびCascadeSearchアルゴリズムの設計は巧妙である:
順序処理によりISOの影響を保証する クォータ管理により公平性制約を確保する 人間型版は自然に疲労効果を統合する シミュレーションフレームワークの設計は周到である:
複数のスコア分布は異なる候補者の質シナリオをシミュレートする ISO相関性パラメータは情報システムの質を制御する 大規模な反復実験により結果の安定性を確保する 本論文は、候補者スクリーニングシステムの理解と改善のための重要な理論的基礎と実用的ツールを提供し、より公平で効果的な人工知能支援意思決定システムの構築に重要な意義を持つ。