We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.
В данной работе исследуется роль начального порядка скрининга (Initial Screening Order, ISO) при отборе кандидатов. ISO определяется как порядок, в котором скринер просматривает пул кандидатов при выборе k кандидатов. В настоящее время ISO обычно генерируется системами доступа к информации (например, онлайн-платформами или запросами к базам данных). Несмотря на значительное влияние ISO на оптимальность и справедливость выбранных k кандидатов (особенно в случае человеческих скринеров), этот аспект в значительной степени игнорируется в литературе. Авторы определяют две формулировки проблемы для описания поведения скринера при поиске при заданном ISO: задача best-k (выбор k лучших кандидатов) и задача good-k (выбор k достаточно хороших кандидатов). Для исследования влияния ISO авторы вводят модель человеческого скринера и сравнивают её с алгоритмическим скринером, где человеческий скринер спроектирован как непоследовательный во времени. Анализ показывает, что при решении задачи good-k человеческим скринером ISO препятствует индивидуальной справедливости (хотя удовлетворяет групповой справедливости) и снижает оптимальность выбранных k кандидатов. Это вызвано смещением позиции, то есть влиянием позиции кандидата в ISO на его оценку.
Отбор кандидатов — это сложная, зависящая от человека задача, широко распространённая в таких сценариях, как просмотр резюме и поступление в университеты. С развитием машинного обучения системы доступа к информации (IAS), такие как LinkedIn и Taleo, играют центральную роль в отборе кандидатов, обычно представляя кандидатов в соответствии с предполагаемой релевантностью или конкретными характеристиками.
Практические требования: На основе опыта сотрудничества с компанией G (входящей в глобальный список Fortune 500 в Европе) авторы выявили пять ключевых практических закономерностей:
G1: скринеры выбирают различные ISO
G2: существуют полный и частичный поиск
G3: внимание сосредоточено на кандидатах, соответствующих минимальным базовым требованиям
G4: наличие целей справедливости с квотами представительства разнообразия
G5: время оценки каждого кандидата составляет примерно одну минуту
Теоретический пробел: Существующая литература в основном сосредоточена на создании ISO (как задача справедливого выбора множества или ранжирования), но мало исследует, как скринеры используют ISO, особенно поведение человеческих скринеров.
Озабоченность справедливостью: Смещение позиции может привести к тому, что похожие кандидаты будут рассматриваться по-разному в зависимости от их положения в ISO, нарушая принцип индивидуальной справедливости.
Первая формализация проблемы ISO: Определение ISO как ключевого параметра в задаче выбора множества с формулировками для best-k и good-k поведения при поиске.
Введение модели человеческого скринера: Предложение модели человеческого скринера с учётом эффектов усталости и теоретическое и экспериментальное сравнение с алгоритмическим скринером.
Предоставление гибкого инструмента моделирования: Разработка фреймворка моделирования для исследования проблемы ISO, предоставляющего рекомендации практикам без необходимости проведения реальных сценариев скрининга.
Выявление влияния смещения позиции на справедливость: Демонстрация того, что ISO приводит к нарушению индивидуальной справедливости при использовании человеческим скринером, одновременно удовлетворяя ограничениям групповой справедливости.
Дан пул кандидатов C, содержащий n кандидатов, где каждый кандидат c описывается вектором признаков X_c ∈ R^d и защищённым атрибутом w_c. Скринер h должен выбрать множество S^k из k кандидатов на основе ISO θ, удовлетворяя квоте представительства q (минимальная доля защищённой группы в S^k).
Данная работа относится к литературе по справедливому выбору множества и связана с задачей о секретаре (Secretary Problem), но сосредоточена на процессе скрининга, а не на этапе интервью, используя автономную установку выбора множества.
Существующие работы в основном сосредоточены на создании ISO (справедливое ранжирование), данная работа сосредоточена на том, как скринеры используют ISO, особенно поведение человеческих пользователей.
Влияние смещения позиции на справедливость: ISO приводит к нарушению индивидуальной справедливости при использовании человеческим скринером, даже при удовлетворении ограничений групповой справедливости.
Важность формулировки проблемы: Правильное определение формулировки проблемы имеет решающее значение для понимания влияния ISO на выбор кандидатов.
Сложность поведения скринера: Существует сложная связь между задачами best-k и good-k, зависящая от распределения качества кандидатов, корреляции ISO и эффектов усталости.
Проектирование фреймворка моделирования тщательно продумано:
Множество распределений баллов моделируют различные сценарии качества кандидатов
Параметры корреляции ISO контролируют качество информационной системы
Крупномасштабные повторные эксперименты обеспечивают стабильность результатов
Данная работа предоставляет важный теоретический фундамент и практические инструменты для понимания и улучшения систем отбора кандидатов, имеющие значительное значение для построения более справедливых и эффективных систем поддержки принятия решений на основе искусственного интеллекта.