2025-11-25T20:16:18.201421

The Initial Screening Order Problem

Alvarez, Mastropietro, Ruggieri

We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.

academic

Проблема начального порядка скрининга

Основная информация

ID статьи: 2307.15398
Название: The Initial Screening Order Problem
Авторы: Jose M. Alvarez (KU Leuven), Antonio Mastropietro (University of Pisa), Salvatore Ruggieri (University of Pisa)
Классификация: cs.LG cs.CY
Дата публикации: июль 2023 г. (препринт arXiv, обновлено в январе 2025 г.)
Ссылка на статью: https://arxiv.org/abs/2307.15398

Аннотация

В данной работе исследуется роль начального порядка скрининга (Initial Screening Order, ISO) при отборе кандидатов. ISO определяется как порядок, в котором скринер просматривает пул кандидатов при выборе k кандидатов. В настоящее время ISO обычно генерируется системами доступа к информации (например, онлайн-платформами или запросами к базам данных). Несмотря на значительное влияние ISO на оптимальность и справедливость выбранных k кандидатов (особенно в случае человеческих скринеров), этот аспект в значительной степени игнорируется в литературе. Авторы определяют две формулировки проблемы для описания поведения скринера при поиске при заданном ISO: задача best-k (выбор k лучших кандидатов) и задача good-k (выбор k достаточно хороших кандидатов). Для исследования влияния ISO авторы вводят модель человеческого скринера и сравнивают её с алгоритмическим скринером, где человеческий скринер спроектирован как непоследовательный во времени. Анализ показывает, что при решении задачи good-k человеческим скринером ISO препятствует индивидуальной справедливости (хотя удовлетворяет групповой справедливости) и снижает оптимальность выбранных k кандидатов. Это вызвано смещением позиции, то есть влиянием позиции кандидата в ISO на его оценку.

Исследовательский контекст и мотивация

Предпосылки проблемы

Отбор кандидатов — это сложная, зависящая от человека задача, широко распространённая в таких сценариях, как просмотр резюме и поступление в университеты. С развитием машинного обучения системы доступа к информации (IAS), такие как LinkedIn и Taleo, играют центральную роль в отборе кандидатов, обычно представляя кандидатов в соответствии с предполагаемой релевантностью или конкретными характеристиками.

Исследовательская мотивация

Практические требования: На основе опыта сотрудничества с компанией G (входящей в глобальный список Fortune 500 в Европе) авторы выявили пять ключевых практических закономерностей:
- G1: скринеры выбирают различные ISO
- G2: существуют полный и частичный поиск
- G3: внимание сосредоточено на кандидатах, соответствующих минимальным базовым требованиям
- G4: наличие целей справедливости с квотами представительства разнообразия
- G5: время оценки каждого кандидата составляет примерно одну минуту
Теоретический пробел: Существующая литература в основном сосредоточена на создании ISO (как задача справедливого выбора множества или ранжирования), но мало исследует, как скринеры используют ISO, особенно поведение человеческих скринеров.
Озабоченность справедливостью: Смещение позиции может привести к тому, что похожие кандидаты будут рассматриваться по-разному в зависимости от их положения в ISO, нарушая принцип индивидуальной справедливости.

Основные вклады

Первая формализация проблемы ISO: Определение ISO как ключевого параметра в задаче выбора множества с формулировками для best-k и good-k поведения при поиске.
Введение модели человеческого скринера: Предложение модели человеческого скринера с учётом эффектов усталости и теоретическое и экспериментальное сравнение с алгоритмическим скринером.
Предоставление гибкого инструмента моделирования: Разработка фреймворка моделирования для исследования проблемы ISO, предоставляющего рекомендации практикам без необходимости проведения реальных сценариев скрининга.
Выявление влияния смещения позиции на справедливость: Демонстрация того, что ISO приводит к нарушению индивидуальной справедливости при использовании человеческим скринером, одновременно удовлетворяя ограничениям групповой справедливости.

Подробное описание методов

Определение задачи

Дан пул кандидатов C, содержащий n кандидатов, где каждый кандидат c описывается вектором признаков X_c ∈ R^d и защищённым атрибутом w_c. Скринер h должен выбрать множество S^k из k кандидатов на основе ISO θ, удовлетворяя квоте представительства q (минимальная доля защищённой группы в S^k).

Две формулировки проблемы

Задача best-k

Скринер должен оценить полный пул кандидатов и выбрать k кандидатов с наивысшими баллами:

argmax_{S^k ∈ [C]^k} U^k_add(S^k, θ) s.t. f(S^k) ≥ q

где функция полезности определяется как:

U^k_add(S^k, θ) = Σ_{c∈S^k} s(X_c)

Задача good-k

Скринер ищет первых k кандидатов, удовлетворяющих минимальному требованию ψ, допуская частичный поиск:

argmax_{S^k ∈ [C]^k} U^k_ψ(S^k, θ) s.t. f(S^k) ≥ q

где функция полезности определяется как:

U^k_ψ(S^k, θ) = {
  k - Σ_{c∈S^k} p(c, S^k, θ)  если ∀c ∈ S^k, s(X_c) ≥ ψ
  0                            иначе
}

Функция штрафа p(c, S^k, θ) измеряет "потраченные впустую усилия" при выборе кандидата c.

Модели скринеров

Алгоритмический скринер h_a

Последовательно оценивает кандидатов без эффектов усталости, выполняя детерминированный алгоритм.

Человеческий скринер h_h

Вводит компонент усталости Φ(t) = λ·t, влияющий на оценку кандидата:

s_h_h(X_c) + ε

где ε — случайная переменная, зависящая от накопленной усталости, с двумя вариантами моделирования:

ε₁ ~ N(0, v(Φ(t-1))): дисперсия увеличивается с усталостью
ε₂ ~ N(μ(Φ(t-1)), v(Φ(t-1))): среднее значение уменьшается с усталостью

Алгоритмы поиска

ExaminationSearch (алгоритм 1): решение задачи best-k, поиск в порядке убывания баллов
CascadeSearch (алгоритм 2): решение задачи good-k, поиск в порядке ISO
Соответствующие версии для человеческого скринера (алгоритмы 3-4): с включением эффектов усталости

Экспериментальная установка

Фреймворк моделирования

Использован фреймворк моделирования Монте-Карло, разработанный на языке R, с 10 000 экспериментов для каждого набора параметров.

Распределение баллов кандидатов

Рассмотрены три усечённых нормальных распределения t_N(μ, σ):

Симметричное распределение: μ=0,5, σ=0,02 (низкая вероятность топ-кандидатов)
Асимметричное распределение: μ=0,8, σ=0,05 (средняя вероятность топ-кандидатов)
Возрастающее распределение: μ=1, σ=0,05 (высокая вероятность топ-кандидатов)

Параметры ISO

θ ⊥⊥ s: ISO независим от индивидуальных баллов (случайный или алфавитный порядок)
θ ⊥̸⊥ s: ISO коррелирует с баллами, коэффициент корреляции ρ ∈ {-1, -0,8, -0,5}

Параметры экспериментов

Размер пула кандидатов: n = 120, 400, 30
Количество выбираемых: k = 6, 20
Квота: q = 0,5
Доля защищённой группы: pr = 0,2
Минимальное требование: ψ ∈ 0,3, 0,8

Метрики оценки

Базовый коэффициент (RtB): отношение полезности к базовому решению
Сходство Жаккара (JdS): доля перекрытия кандидатов

Результаты экспериментов

Случай без усталости (алгоритмический скринер)

Производительность good-k vs best-k

Влияние распределения баллов:
- При симметричном распределении good-k постепенно приближается к best-k с увеличением ψ
- При асимметричном и возрастающем распределениях good-k с трудом достигает производительности best-k даже при большом ψ
Влияние корреляции ISO:
- При ρ = -1 (полная отрицательная корреляция) производительность good-k и best-k одинакова
- При ρ = -0,5 good-k уже хорошо аппроксимирует best-k
Эффект масштаба:
- Больший коэффициент k/n позволяет good-k лучше аппроксимировать best-k
- Влияние ISO ослабевает с увеличением k/n

Случай с усталостью (человеческий скринер)

Влияние усталости на good-k

Усталость типа дисперсии (ε₁):
- Значительное снижение производительности при симметричном распределении и высоких значениях ψ
- Относительная стабильность при асимметричном и возрастающем распределениях
Усталость типа смещения (ε₂):
- Меньшее влияние на симметричное распределение из-за меньшего стандартного отклонения
- Незначительное влияние смещения при низком качестве кандидатов

Best-k vs good-k с усталостью

При наличии усталости решение good-k иногда превосходит best-k
Указывает на вредность чрезмерно длительного поиска для человеческого скринера
В некоторых условиях следует отдавать предпочтение стратегии good-k

Защитное действие корреляции ISO

Предоставление ISO, содержащего информацию о качестве кандидатов, снижает влияние усталости
Подчёркивает важность роли IAS в проблеме ISO

Связанные работы

Справедливый выбор множества

Данная работа относится к литературе по справедливому выбору множества и связана с задачей о секретаре (Secretary Problem), но сосредоточена на процессе скрининга, а не на этапе интервью, используя автономную установку выбора множества.

Исследования смещения позиции

Модели кликов: первые формализации и тестирование того, как пользователи просматривают ISO
Эмпирические исследования: Echterhoff и др., Wang и др. предоставили эмпирические доказательства смещения позиции при отборе кандидатов
Вклад данной работы: определение ISO как параметра в формулировке проблемы, использование моделирования для захвата множества сценариев скрининга

Системы доступа к информации

Существующие работы в основном сосредоточены на создании ISO (справедливое ранжирование), данная работа сосредоточена на том, как скринеры используют ISO, особенно поведение человеческих пользователей.

Заключение и обсуждение

Основные выводы

Влияние смещения позиции на справедливость: ISO приводит к нарушению индивидуальной справедливости при использовании человеческим скринером, даже при удовлетворении ограничений групповой справедливости.
Важность формулировки проблемы: Правильное определение формулировки проблемы имеет решающее значение для понимания влияния ISO на выбор кандидатов.
Сложность поведения скринера: Существует сложная связь между задачами best-k и good-k, зависящая от распределения качества кандидатов, корреляции ISO и эффектов усталости.

Ограничения

Ограничения функциональных предположений: Функциональные предположения модели полезности и члена усталости могут быть чрезмерно упрощены
Моделирование усталости: Линейное накопление усталости может быть недостаточно реалистичным
Моделирование vs реальность: Результаты моделирования требуют проверки в реальных сценариях

Направления будущих исследований

Альтернативные модели полезности: Исследование других моделей полезности, таких как exposure discounting
Продвинутые модели усталости: Рассмотрение циклических моделей выживания с учётом отдыха скринеров
Теория принятия решений человеком: Интеграция большего количества теорий принятия решений человеком
Оптимизация параметров: Использование фреймворка моделирования для тестирования оптимальных параметров

Глубокая оценка

Преимущества

Важность проблемы: Первое систематическое исследование игнорируемой, но важной проблемы ISO
Теоретический вклад: Предоставление строгого математического фреймворка и реализации алгоритмов
Практическая релевантность: Основано на инсайтах из реального сотрудничества с предприятиями, имеет практическую ценность применения
Методологическое инновация: Введение модели человеческого скринера с учётом эффектов усталости
Полнота экспериментов: Исследование множества комбинаций параметров через крупномасштабное моделирование
Вклад инструмента: Предоставление открытого фреймворка моделирования

Недостатки

Упрощение модели: Модель усталости относительно простая, может не захватить сложное человеческое поведение
Недостаточная проверка: В основном основано на моделировании, отсутствует проверка на крупномасштабных реальных данных
Ограничения предположений: Предположения независимости (A1, A2) могут не выполняться в реальности
Ограниченность метрик оценки: Основное внимание на полезности и перекрытии, отсутствие других метрик справедливости

Влияние

Академическая ценность: Предоставление новой перспективы для области справедливого машинного обучения и взаимодействия человека и машины
Практическая ценность: Предоставление рекомендаций для проектирования платформ найма и систем управления персоналом
Методологический вклад: Расширяемость фреймворка моделирования на другие сценарии принятия решений
Политическое значение: Предоставление инструментов для аудита алгоритмов и регулирования справедливости

Применимые сценарии

Отбор при найме: Просмотр резюме, оценка кандидатов
Образовательная оценка: Проверка заявок, оценка работ
Системы рекомендаций: Справедливые рекомендации с учётом поведения пользователя при поиске
Поддержка принятия решений: Любые сценарии, включающие последовательную оценку

Технические инновационные моменты

Основные инновации

Параметризация ISO: Определение начального порядка скрининга как явного параметра проблемы
Двойная формулировка проблемы: Различие между best-k (глобальная оптимальность) и good-k (удовлетворение условиям) целями
Моделирование усталости: Введение модели оценочной ошибки, зависящей от времени
Анализ справедливости: Различие между групповой и индивидуальной справедливостью в их проявлениях

Проектирование алгоритмов

Алгоритмы ExaminationSearch и CascadeSearch спроектированы искусно:

Последовательная обработка гарантирует влияние ISO
Управление квотой обеспечивает ограничения справедливости
Версия для человеческого скринера естественно интегрирует эффекты усталости

Проектирование экспериментов

Проектирование фреймворка моделирования тщательно продумано:

Множество распределений баллов моделируют различные сценарии качества кандидатов
Параметры корреляции ISO контролируют качество информационной системы
Крупномасштабные повторные эксперименты обеспечивают стабильность результатов

Данная работа предоставляет важный теоретический фундамент и практические инструменты для понимания и улучшения систем отбора кандидатов, имеющие значительное значение для построения более справедливых и эффективных систем поддержки принятия решений на основе искусственного интеллекта.