2025-11-25T20:16:18.201421

The Initial Screening Order Problem

Alvarez, Mastropietro, Ruggieri
We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.
academic

El Problema del Orden de Cribado Inicial

Información Básica

  • ID del Artículo: 2307.15398
  • Título: El Problema del Orden de Cribado Inicial
  • Autores: Jose M. Alvarez (KU Leuven), Antonio Mastropietro (Universidad de Pisa), Salvatore Ruggieri (Universidad de Pisa)
  • Clasificación: cs.LG cs.CY
  • Fecha de Publicación: Julio de 2023 (preimpresión en arXiv, actualizado en enero de 2025)
  • Enlace del Artículo: https://arxiv.org/abs/2307.15398

Resumen

Este artículo investiga el papel del Orden de Cribado Inicial (Initial Screening Order, ISO) en la selección de candidatos. El ISO se refiere al orden en el que un evaluador busca en el conjunto de candidatos al seleccionar k candidatos. Actualmente, el ISO es típicamente generado por sistemas de acceso a información (como plataformas en línea o consultas de bases de datos). Aunque el ISO tiene un impacto importante en la optimalidad y equidad de los k candidatos seleccionados (particularmente en el caso de evaluadores humanos), la literatura ha pasado por alto en gran medida este aspecto. Los autores definen dos formulaciones de problemas para describir el comportamiento de búsqueda de los evaluadores bajo un ISO dado: el problema best-k (seleccionar los k mejores candidatos) y el problema good-k (seleccionar los primeros k candidatos suficientemente buenos). Para investigar el impacto del ISO, los autores introducen un modelo de evaluador tipo humano y lo comparan con evaluadores algorítmicos, donde el evaluador tipo humano está diseñado para ser inconsistente a lo largo del tiempo. El análisis demuestra que cuando el evaluador tipo humano resuelve el problema good-k, el ISO obstaculiza la equidad individual (aunque satisface la equidad grupal) y daña la optimalidad de los k candidatos seleccionados. Esto se debe al sesgo de posición, es decir, la evaluación de un candidato se ve afectada por su posición en el ISO.

Contexto de Investigación y Motivación

Contexto del Problema

La selección de candidatos es una tarea compleja y dependiente del factor humano, ampliamente presente en escenarios como cribado de currículums y admisiones universitarias. Con el desarrollo del aprendizaje automático, los sistemas de acceso a información (IAS) como plataformas LinkedIn, Taleo, etc., juegan un papel central en la selección de candidatos, presentando típicamente candidatos según la relevancia estimada o características específicas.

Motivación de la Investigación

  1. Necesidades Prácticas: Basándose en la experiencia de colaboración con la empresa G de la lista Fortune Global 500 europea, los autores identificaron cinco patrones prácticos clave:
    • G1: Los evaluadores seleccionan diferentes ISOs
    • G2: Existen dos modos de búsqueda: completa y parcial
    • G3: Se enfoca en candidatos que cumplen con los requisitos mínimos básicos
    • G4: Existen objetivos de equidad con cuotas de representación de diversidad
    • G5: El tiempo de evaluación de cada candidato es aproximadamente un minuto
  2. Brecha Teórica: La literatura existente se enfoca principalmente en la creación del ISO (como problema de selección de conjuntos justos u ordenamiento), pero rara vez investiga cómo los evaluadores utilizan el ISO, particularmente el comportamiento de evaluadores humanos.
  3. Preocupaciones de Equidad: El sesgo de posición puede llevar a que candidatos similares sean tratados de manera diferente debido a sus posiciones diferentes en el ISO, violando el principio de equidad individual.

Contribuciones Principales

  1. Formalización del Problema ISO por Primera Vez: Se presenta el ISO como un parámetro clave en problemas de selección de conjuntos, definiendo formulaciones de problemas para dos comportamientos de búsqueda: best-k y good-k.
  2. Introducción de Modelo de Evaluador Tipo Humano: Se propone un evaluador tipo humano que considera efectos de fatiga y se realiza comparación teórica y experimental con evaluadores algorítmicos.
  3. Herramienta de Simulación Flexible: Se desarrolla un marco de simulación capaz de investigar el problema ISO, proporcionando orientación a profesionales sin necesidad de ejecutar escenarios de cribado reales.
  4. Revelación del Impacto de Equidad del Sesgo de Posición: Se demuestra que el ISO bajo evaluadores tipo humano conduce a violaciones de equidad individual, mientras que aún satisface restricciones de equidad grupal.

Detalle de Métodos

Definición de Tareas

Dado un conjunto de candidatos C que contiene n candidatos, cada candidato c se describe mediante un vector de características X_c ∈ R^d y un atributo protegido w_c. Un evaluador h necesita seleccionar un conjunto S^k de k candidatos basándose en el ISO θ, satisfaciendo simultáneamente una cuota de representación q (proporción mínima del grupo protegido en S^k).

Dos Formulaciones de Problemas

Problema Best-k

El evaluador necesita evaluar el conjunto completo de candidatos C y seleccionar los k candidatos con puntuaciones más altas:

argmax_{S^k ∈ [C]^k} U^k_add(S^k, θ) s.t. f(S^k) ≥ q

donde la función de utilidad se define como:

U^k_add(S^k, θ) = Σ_{c∈S^k} s(X_c)

Problema Good-k

El evaluador busca los primeros k candidatos que satisfacen un requisito mínimo ψ, permitiendo búsqueda parcial:

argmax_{S^k ∈ [C]^k} U^k_ψ(S^k, θ) s.t. f(S^k) ≥ q

donde la función de utilidad se define como:

U^k_ψ(S^k, θ) = {
  k - Σ_{c∈S^k} p(c, S^k, θ)  si ∀c ∈ S^k, s(X_c) ≥ ψ
  0                            en otro caso
}

La función de penalización p(c, S^k, θ) mide el "esfuerzo desperdiciado" al seleccionar el candidato c.

Modelos de Evaluador

Evaluador Algorítmico h_a

Evalúa candidatos de manera consistente, sin efectos de fatiga, ejecutando un algoritmo determinista.

Evaluador Tipo Humano h_h

Introduce un componente de fatiga Φ(t) = λ·t, que afecta la evaluación de candidatos:

s_h_h(X_c) + ε

donde ε es una variable aleatoria dependiente de la fatiga acumulada, considerando dos opciones de modelado:

  • ε₁ ~ N(0, v(Φ(t-1))): La varianza aumenta con la fatiga
  • ε₂ ~ N(μ(Φ(t-1)), v(Φ(t-1))): La media disminuye con la fatiga

Algoritmos de Búsqueda

  • ExaminationSearch (Algoritmo 1): Resuelve el problema best-k, buscando en orden descendente de puntuación
  • CascadeSearch (Algoritmo 2): Resuelve el problema good-k, buscando en orden ISO
  • Versiones tipo humano (Algoritmos 3-4): Incorporan efectos de fatiga

Configuración Experimental

Marco de Simulación

Se utiliza un marco de simulación de Monte Carlo desarrollado en R, ejecutando 10,000 experimentos por cada conjunto de parámetros.

Distribución de Puntuaciones de Candidatos

Se consideran tres distribuciones normales truncadas t_N(μ, σ):

  • Distribución Simétrica: μ=0.5, σ=0.02 (probabilidad muy baja de candidatos de nivel superior)
  • Distribución Asimétrica: μ=0.8, σ=0.05 (probabilidad moderada de candidatos de nivel superior)
  • Distribución Creciente: μ=1, σ=0.05 (probabilidad más alta de candidatos de nivel superior)

Configuración del ISO

  • θ ⊥⊥ s: ISO independiente de puntuaciones individuales (aleatorio u orden alfabético)
  • θ ⊥̸⊥ s: ISO correlacionado con puntuaciones, coeficiente de correlación ρ ∈ {-1, -0.8, -0.5}

Parámetros Experimentales

  • Tamaño del conjunto de candidatos: n = 120, 400, 30
  • Cantidad de selecciones: k = 6, 20
  • Cuota: q = 0.5
  • Proporción del grupo protegido: pr = 0.2
  • Requisito mínimo: ψ ∈ 0.3, 0.8

Métricas de Evaluación

  • Tasa Base (RtB): Proporción de utilidad relativa a la solución de referencia
  • Similitud de Jaccard (JdS): Proporción de superposición de candidatos

Resultados Experimentales

Caso sin Fatiga (Evaluador Algorítmico)

Rendimiento Good-k vs Best-k

  1. Impacto de la Distribución de Puntuaciones:
    • Bajo distribución simétrica, good-k se aproxima gradualmente a best-k conforme ψ aumenta
    • Bajo distribuciones asimétrica y creciente, good-k tiene dificultad para alcanzar el rendimiento de best-k incluso con ψ grande
  2. Impacto de la Correlación del ISO:
    • Cuando ρ = -1 (correlación completamente negativa), el rendimiento de good-k es idéntico al de best-k
    • Cuando ρ = -0.5, good-k ya aproxima bien a best-k
  3. Efecto de Escala:
    • Una proporción k/n más grande permite que good-k aproxime mejor a best-k
    • El impacto del ISO disminuye conforme k/n aumenta

Caso con Fatiga (Evaluador Tipo Humano)

Impacto de la Fatiga en Good-k

  1. Fatiga de Tipo Varianza (ε₁):
    • El rendimiento bajo distribución simétrica disminuye significativamente con valores altos de ψ
    • Las distribuciones asimétrica y creciente son relativamente estables
  2. Fatiga de Tipo Sesgo (ε₂):
    • Debido a la desviación estándar más pequeña, el impacto en distribución simétrica es menor
    • En casos donde la calidad de candidatos es baja, el impacto del sesgo es limitado

Best-k vs Good-k con Fatiga

  • Bajo fatiga, las soluciones good-k a veces superan a las soluciones best-k
  • Esto indica que búsquedas demasiado largas son perjudiciales para evaluadores tipo humano
  • En ciertos escenarios, debería preferirse la estrategia good-k

Efecto Protector de la Correlación del ISO

  • Proporcionar un ISO que contenga información sobre la calidad de candidatos puede reducir el impacto de la fatiga
  • Enfatiza la importancia del IAS en el problema ISO

Trabajo Relacionado

Selección de Conjuntos Justos

Este artículo pertenece a la literatura de selección de conjuntos justos, relacionado con el Problema del Secretario (Secretary Problem), pero se enfoca en el proceso de cribado en lugar de la etapa de entrevista, adoptando un escenario de selección de conjuntos fuera de línea.

Investigación sobre Sesgo de Posición

  • Modelos de Clics: Formalizaron y probaron tempranamente cómo los usuarios buscan en el ISO
  • Investigación Empírica: Echterhoff et al. y Wang et al. proporcionan evidencia empírica del sesgo de posición en cribado de candidatos
  • Contribución de este Artículo: Define el ISO como parámetro en la formulación del problema, utilizando simulación para capturar múltiples escenarios de cribado

Sistemas de Acceso a Información

El trabajo existente se enfoca principalmente en la creación del ISO (ordenamiento justo), mientras que este artículo se enfoca en cómo los evaluadores utilizan el ISO, particularmente el comportamiento de usuarios humanos.

Conclusiones y Discusión

Conclusiones Principales

  1. Impacto de Equidad del Sesgo de Posición: El ISO bajo evaluadores tipo humano conduce a violaciones de equidad individual, incluso cuando se satisfacen restricciones de equidad grupal.
  2. Importancia de la Formulación del Problema: Definir correctamente la formulación del problema es crucial para entender el impacto del ISO en la selección de candidatos.
  3. Complejidad del Comportamiento del Evaluador: Existe una relación compleja entre los problemas best-k y good-k, dependiendo de la distribución de calidad de candidatos, la correlación del ISO y los efectos de fatiga.

Limitaciones

  1. Restricciones de Supuestos Funcionales: Los supuestos de funciones del modelo de utilidad y términos de fatiga pueden ser demasiado simplificadores
  2. Modelado de Fatiga: La acumulación lineal de fatiga puede no ser suficientemente realista
  3. Simulación vs Realidad: Los resultados de simulación requieren validación en escenarios reales

Direcciones Futuras

  1. Modelos de Utilidad Alternativos: Explorar otros modelos de utilidad como descuento de exposición
  2. Modelos de Fatiga Avanzados: Considerar modelos de supervivencia cíclicos que incorporen descansos del evaluador
  3. Teoría de Decisión Humana: Integrar más teoría de decisión humana
  4. Optimización de Parámetros: Utilizar el marco de simulación para probar parámetros óptimos

Evaluación Profunda

Fortalezas

  1. Importancia del Problema: Primera investigación sistemática de este problema ISO previamente ignorado pero importante
  2. Contribución Teórica: Proporciona un marco matemático riguroso e implementación algorítmica
  3. Relevancia Práctica: Basado en perspectivas de colaboración empresarial real, con valor de aplicación práctica
  4. Innovación Metodológica: Introduce modelo de evaluador tipo humano, considerando efectos de fatiga
  5. Completitud Experimental: Explora múltiples combinaciones de parámetros a través de simulación a gran escala
  6. Contribución de Herramientas: Proporciona marco de simulación de código abierto

Deficiencias

  1. Simplificación del Modelo: El modelo de fatiga es relativamente simple, pudiendo no capturar comportamientos humanos complejos
  2. Validación Insuficiente: Principalmente basado en simulación, carece de validación con datos reales a gran escala
  3. Restricciones de Supuestos: Los supuestos de independencia (A1, A2) pueden no cumplirse en la realidad
  4. Métricas de Evaluación Limitadas: Se enfoca principalmente en utilidad y grado de superposición, careciendo de otras métricas de equidad

Impacto

  1. Valor Académico: Proporciona nueva perspectiva para campos de aprendizaje automático justo e interacción humano-máquina
  2. Valor Práctico: Proporciona orientación para diseño de plataformas de reclutamiento y sistemas de RRHH
  3. Contribución Metodológica: El marco de simulación es extensible a otros escenarios de decisión
  4. Significado Político: Proporciona herramientas para auditoría algorítmica y regulación de equidad

Escenarios Aplicables

  1. Cribado de Reclutamiento: Cribado de currículums, evaluación de candidatos
  2. Evaluación Educativa: Revisión de solicitudes, calificación de tareas
  3. Sistemas de Recomendación: Recomendación justa considerando comportamiento de búsqueda del usuario
  4. Apoyo a Decisiones: Cualquier escenario de decisión que implique evaluación secuencial

Puntos de Innovación Técnica

Innovaciones Principales

  1. Parametrización del ISO: Presenta el orden de cribado inicial como parámetro explícito del problema
  2. Formulación Dual de Problemas: Distingue entre objetivos best-k (óptimo global) y good-k (satisfacción de condiciones)
  3. Modelado de Fatiga: Introduce modelo de error de evaluación dependiente del tiempo
  4. Análisis de Equidad: Distingue diferentes manifestaciones de equidad grupal e individual

Diseño de Algoritmos

Los algoritmos ExaminationSearch y CascadeSearch están ingeniosamente diseñados:

  • El procesamiento secuencial garantiza el impacto del ISO
  • La gestión de cuotas asegura restricciones de equidad
  • Las versiones tipo humano integran naturalmente efectos de fatiga

Diseño Experimental

El diseño del marco de simulación es considerado:

  • Múltiples distribuciones de puntuación simulan escenarios de calidad de candidatos diferentes
  • Parámetros de correlación del ISO controlan la calidad del sistema de información
  • Experimentos repetidos a gran escala aseguran estabilidad de resultados

Este artículo proporciona una base teórica importante y herramientas prácticas para entender y mejorar sistemas de selección de candidatos, siendo significativo para construir sistemas de toma de decisiones asistidos por inteligencia artificial más justos y efectivos.