2025-11-25T20:16:18.201421

The Initial Screening Order Problem

Alvarez, Mastropietro, Ruggieri

We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.

academic

Il Problema dell'Ordine di Screening Iniziale

Informazioni Fondamentali

ID Articolo: 2307.15398
Titolo: The Initial Screening Order Problem
Autori: Jose M. Alvarez (KU Leuven), Antonio Mastropietro (Università di Pisa), Salvatore Ruggieri (Università di Pisa)
Classificazione: cs.LG cs.CY
Data di Pubblicazione: Luglio 2023 (preprint arXiv, aggiornato gennaio 2025)
Link Articolo: https://arxiv.org/abs/2307.15398

Riassunto

Questo articolo esamina il ruolo dell'Ordine di Screening Iniziale (Initial Screening Order, ISO) nella selezione dei candidati. L'ISO si riferisce all'ordine in cui uno screener ricerca il pool di candidati quando seleziona k candidati. Attualmente, l'ISO è tipicamente generato da sistemi di accesso alle informazioni (come piattaforme online o interrogazioni di database). Sebbene l'ISO abbia un impatto significativo sull'ottimalità e l'equità dei k candidati selezionati (in particolare nel caso di screener umani), questo aspetto è stato in gran parte trascurato nella letteratura. Gli autori definiscono due formulazioni di problemi per descrivere il comportamento di ricerca dello screener sotto un dato ISO: il problema best-k (selezione dei k migliori candidati) e il problema good-k (selezione dei primi k candidati sufficientemente buoni). Per studiare l'impatto dell'ISO, gli autori introducono uno screener di tipo umano e lo confrontano con uno screener algoritmico, dove lo screener di tipo umano è progettato per essere incoerente nel tempo. L'analisi rivela che l'ISO ostacola l'equità individuale (sebbene soddisfi l'equità di gruppo) quando uno screener di tipo umano risolve il problema good-k, e compromette l'ottimalità dei k candidati selezionati. Ciò è dovuto al bias di posizione, ovvero l'influenza della posizione di un candidato nell'ISO sulla sua valutazione.

Contesto di Ricerca e Motivazione

Contesto del Problema

La selezione dei candidati è un compito complesso e dipendente dall'uomo, ampiamente presente in scenari come lo screening dei curriculum vitae e l'ammissione universitaria. Con lo sviluppo dell'apprendimento automatico, i sistemi di accesso alle informazioni (IAS) come LinkedIn e Taleo svolgono un ruolo centrale nella selezione dei candidati, presentando tipicamente i candidati in base alla rilevanza stimata o a caratteristiche specifiche.

Motivazione della Ricerca

Esigenze Pratiche: Basandosi sull'esperienza di collaborazione con un'azienda Fortune Global 500 europea G, gli autori hanno identificato cinque modelli pratici chiave:
- G1: Gli screener scelgono diversi ISO
- G2: Esistono modalità di ricerca completa e parziale
- G3: Attenzione ai candidati che soddisfano i requisiti minimi di base
- G4: Obiettivi di equità con quote di rappresentanza diversificata
- G5: Tempo di valutazione di circa un minuto per candidato
Lacuna Teorica: La letteratura esistente si concentra principalmente sulla creazione dell'ISO (come problema di selezione di insiemi equi o di ranking), ma pochi studi esaminano come gli screener utilizzano l'ISO, in particolare il comportamento degli screener umani.
Preoccupazioni di Equità: Il bias di posizione potrebbe portare candidati simili a essere trattati diversamente a causa della loro posizione nell'ISO, violando il principio di equità individuale.

Contributi Principali

Prima Formalizzazione del Problema ISO: Presenta l'ISO come parametro chiave nella selezione di insiemi, definendo formulazioni di problemi per due comportamenti di ricerca: best-k e good-k.
Introduzione del Modello di Screener di Tipo Umano: Propone uno screener di tipo umano che considera effetti di affaticamento e lo confronta teoricamente e sperimentalmente con uno screener algoritmico.
Fornitura di Strumenti di Simulazione Flessibili: Sviluppa un framework di simulazione in grado di studiare il problema ISO, fornendo orientamenti ai professionisti senza necessità di eseguire scenari di screening reali.
Rivelazione dell'Impatto del Bias di Posizione sull'Equità: Dimostra che l'ISO porta a violazioni dell'equità individuale sotto uno screener di tipo umano, pur soddisfacendo i vincoli di equità di gruppo.

Dettagli Metodologici

Definizione del Compito

Dato un pool di candidati C contenente n candidati, ogni candidato c è descritto da un vettore di caratteristiche X_c ∈ R^d e un attributo protetto w_c. Uno screener h deve selezionare un insieme S^k di k candidati basato sull'ISO θ, soddisfacendo contemporaneamente una quota di rappresentanza q (proporzione minima del gruppo protetto in S^k).

Due Formulazioni di Problemi

Problema Best-k

Lo screener deve valutare il pool di candidati completo e selezionare i k candidati con i punteggi più alti:

argmax_{S^k ∈ [C]^k} U^k_add(S^k, θ) s.t. f(S^k) ≥ q

dove la funzione di utilità è definita come:

U^k_add(S^k, θ) = Σ_{c∈S^k} s(X_c)

Problema Good-k

Lo screener cerca i primi k candidati che soddisfano un requisito minimo ψ, consentendo una ricerca parziale:

argmax_{S^k ∈ [C]^k} U^k_ψ(S^k, θ) s.t. f(S^k) ≥ q

dove la funzione di utilità è definita come:

U^k_ψ(S^k, θ) = {
  k - Σ_{c∈S^k} p(c, S^k, θ)  if ∀c ∈ S^k, s(X_c) ≥ ψ
  0                            otherwise
}

La funzione di penalità p(c, S^k, θ) misura lo "sforzo sprecato" nella selezione del candidato c.

Modelli di Screener

Screener Algoritmico h_a

Valuta i candidati in modo coerente, senza effetti di affaticamento, eseguendo un algoritmo deterministico.

Screener di Tipo Umano h_h

Introduce una componente di affaticamento Φ(t) = λ·t, che influenza la valutazione dei candidati:

s_h_h(X_c) + ε

dove ε è una variabile casuale dipendente dall'affaticamento cumulativo, considerando due scelte di modellazione:

ε₁ ~ N(0, v(Φ(t-1))): la varianza aumenta con l'affaticamento
ε₂ ~ N(μ(Φ(t-1)), v(Φ(t-1))): la media diminuisce con l'affaticamento

Algoritmi di Ricerca

ExaminationSearch (Algoritmo 1): Risolve il problema best-k, ricercando in ordine decrescente di punteggio
CascadeSearch (Algoritmo 2): Risolve il problema good-k, ricercando in ordine ISO
Versioni di tipo umano corrispondenti (Algoritmi 3-4): Incorporano effetti di affaticamento

Configurazione Sperimentale

Framework di Simulazione

Utilizza un framework di simulazione Monte Carlo sviluppato in R, con 10.000 esperimenti per ogni set di parametri.

Distribuzione dei Punteggi dei Candidati

Considera tre distribuzioni normali troncate t_N(μ, σ):

Distribuzione Simmetrica: μ=0.5, σ=0.02 (probabilità molto bassa di candidati di alto livello)
Distribuzione Asimmetrica: μ=0.8, σ=0.05 (probabilità moderata di candidati di alto livello)
Distribuzione Crescente: μ=1, σ=0.05 (probabilità più alta di candidati di alto livello)

Configurazioni ISO

θ ⊥⊥ s: ISO indipendente dai punteggi individuali (casuale o ordine alfabetico)
θ ⊥̸⊥ s: ISO correlato ai punteggi, con coefficiente di correlazione ρ ∈ {-1, -0.8, -0.5}

Parametri Sperimentali

Dimensione del pool di candidati: n = 120, 400, 30
Numero di selezioni: k = 6, 20
Quota: q = 0.5
Proporzione del gruppo protetto: pr = 0.2
Requisito minimo: ψ ∈ 0.3, 0.8

Metriche di Valutazione

Rapporto di Base (RtB): Rapporto di utilità relativo alla soluzione di base
Somiglianza Jaccard (JdS): Proporzione di sovrapposizione dei candidati

Risultati Sperimentali

Caso Senza Affaticamento (Screener Algoritmico)

Prestazioni Good-k vs Best-k

Impatto della Distribuzione dei Punteggi:
- Con distribuzione simmetrica, good-k si avvicina gradualmente a best-k all'aumentare di ψ
- Con distribuzioni asimmetriche e crescenti, good-k fatica a raggiungere le prestazioni di best-k anche con ψ elevato
Impatto della Correlazione ISO:
- Con ρ = -1 (correlazione completamente negativa), good-k e best-k hanno prestazioni identiche
- Con ρ = -0.5, good-k approssima già bene best-k
Effetti di Scala:
- Rapporti k/n più elevati consentono a good-k di approssimare meglio best-k
- L'impatto dell'ISO diminuisce all'aumentare di k/n

Caso Con Affaticamento (Screener di Tipo Umano)

Impatto dell'Affaticamento su Good-k

Affaticamento di Tipo Varianza (ε₁):
- La distribuzione simmetrica mostra un calo significativo delle prestazioni con valori elevati di ψ
- Le distribuzioni asimmetriche e crescenti rimangono relativamente stabili
Affaticamento di Tipo Bias (ε₂):
- A causa della deviazione standard inferiore, la distribuzione simmetrica è meno influenzata
- Quando la qualità dei candidati è inferiore, l'impatto del bias è minore

Best-k vs Good-k con Affaticamento

Con affaticamento, le soluzioni good-k talvolta superano le soluzioni best-k
Suggerisce che ricerche troppo lunghe sono dannose per gli screener di tipo umano
In alcune configurazioni, la strategia good-k dovrebbe essere preferita

Effetto Protettivo della Correlazione ISO

Fornire un ISO che contiene informazioni sulla qualità dei candidati può ridurre l'impatto dell'affaticamento
Sottolinea l'importanza dell'IAS nel problema ISO

Lavori Correlati

Selezione di Insiemi Equi

Questo articolo appartiene alla letteratura sulla selezione di insiemi equi, correlato al Problema del Segretario (Secretary Problem), ma si concentra sul processo di screening piuttosto che sulla fase di intervista, adottando un'impostazione di selezione di insiemi offline.

Ricerca sul Bias di Posizione

Modelli di Clic: Formalizzazione iniziale e test di come gli utenti ricercano l'ISO
Studi Empirici: Echterhoff et al. e Wang et al. forniscono prove empiriche del bias di posizione nella selezione dei candidati
Contributo di Questo Articolo: Definisce l'ISO come parametro nella formulazione del problema, utilizzando la simulazione per catturare molteplici scenari di screening

Sistemi di Accesso alle Informazioni

I lavori esistenti si concentrano principalmente sulla creazione dell'ISO (ranking equo), mentre questo articolo si concentra su come gli screener utilizzano l'ISO, in particolare il comportamento degli utenti umani.

Conclusioni e Discussione

Conclusioni Principali

Impatto del Bias di Posizione sull'Equità: L'ISO porta a violazioni dell'equità individuale sotto uno screener di tipo umano, anche quando soddisfa i vincoli di equità di gruppo.
Importanza della Formulazione del Problema: La corretta definizione della formulazione del problema è cruciale per comprendere l'impatto dell'ISO sulla selezione dei candidati.
Complessità del Comportamento dello Screener: Esiste una relazione complessa tra i problemi best-k e good-k, dipendente dalla distribuzione della qualità dei candidati, dalla correlazione ISO e dagli effetti di affaticamento.

Limitazioni

Limitazioni delle Assunzioni Funzionali: Le assunzioni funzionali del modello di utilità e del termine di affaticamento potrebbero essere eccessivamente semplificate
Modellazione dell'Affaticamento: L'accumulo lineare di affaticamento potrebbe non essere sufficientemente realistico
Simulazione vs Realtà: I risultati della simulazione necessitano di validazione in scenari reali

Direzioni Future

Modelli di Utilità Alternativi: Esplorare altri modelli di utilità come lo sconto di esposizione
Modelli di Affaticamento Avanzati: Considerare modelli di sopravvivenza ciclici che tengono conto delle pause dello screener
Teoria della Decisione Umana: Integrare più teoria della decisione umana
Ottimizzazione dei Parametri: Utilizzare il framework di simulazione per testare parametri ottimali

Valutazione Approfondita

Punti di Forza

Importanza del Problema: Primo studio sistematico di questo problema ISO trascurato ma importante
Contributi Teorici: Fornisce un framework matematico rigoroso e implementazioni algoritmiche
Rilevanza Pratica: Basato su intuizioni da collaborazioni aziendali reali, con valore applicativo concreto
Innovazione Metodologica: Introduce il modello di screener di tipo umano, considerando effetti di affaticamento
Completezza Sperimentale: Esplora molteplici combinazioni di parametri attraverso simulazioni su larga scala
Contributo Strumentale: Fornisce un framework di simulazione open-source

Limitazioni

Semplificazione del Modello: Il modello di affaticamento è relativamente semplice e potrebbe non catturare comportamenti umani complessi
Validazione Insufficiente: Principalmente basato su simulazione, manca validazione su dati reali su larga scala
Limitazioni delle Assunzioni: Le assunzioni di indipendenza (A1, A2) potrebbero non valere nella realtà
Metriche di Valutazione Limitate: Si concentra principalmente su utilità e sovrapposizione, mancano altre metriche di equità

Impatto

Valore Accademico: Fornisce una nuova prospettiva per l'apprendimento automatico equo e l'interazione uomo-macchina
Valore Pratico: Fornisce orientamenti per la progettazione di piattaforme di reclutamento e sistemi HR
Contributo Metodologico: Il framework di simulazione è estendibile ad altri scenari decisionali
Significato Politico: Fornisce strumenti per l'audit algoritmico e la regolamentazione dell'equità

Scenari Applicabili

Screening di Reclutamento: Screening dei curriculum vitae, valutazione dei candidati
Valutazione Educativa: Revisione delle domande, valutazione dei compiti
Sistemi di Raccomandazione: Raccomandazioni eque considerando il comportamento di ricerca degli utenti
Supporto Decisionale: Qualsiasi scenario decisionale che coinvolga valutazione sequenziale

Punti di Innovazione Tecnica

Innovazioni Fondamentali

Parametrizzazione dell'ISO: Tratta l'ordine di screening iniziale come parametro esplicito del problema
Doppia Formulazione del Problema: Distingue tra best-k (ottimalità globale) e good-k (soddisfacimento dei vincoli)
Modellazione dell'Affaticamento: Introduce un modello di errore di valutazione dipendente dal tempo
Analisi dell'Equità: Distingue tra diverse manifestazioni dell'equità di gruppo e dell'equità individuale

Progettazione Algoritmica

Gli algoritmi ExaminationSearch e CascadeSearch sono ben progettati:

L'elaborazione sequenziale garantisce l'impatto dell'ISO
La gestione delle quote assicura il rispetto dei vincoli di equità
Le versioni di tipo umano integrano naturalmente gli effetti di affaticamento

Progettazione Sperimentale

Il framework di simulazione è ben concepito:

Molteplici distribuzioni di punteggi simulano diversi scenari di qualità dei candidati
I parametri di correlazione ISO controllano la qualità del sistema informativo
Gli esperimenti ripetuti su larga scala garantiscono la stabilità dei risultati

Questo articolo fornisce una base teorica importante e strumenti pratici per comprendere e migliorare i sistemi di selezione dei candidati, con significato importante per la costruzione di sistemi di supporto decisionale assistiti dall'intelligenza artificiale più equi ed efficienti.