2025-11-25T20:16:18.201421

The Initial Screening Order Problem

Alvarez, Mastropietro, Ruggieri

We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.

academic

Das Initial Screening Order Problem

Grundinformationen

Papier-ID: 2307.15398
Titel: The Initial Screening Order Problem
Autoren: Jose M. Alvarez (KU Leuven), Antonio Mastropietro (Universität Pisa), Salvatore Ruggieri (Universität Pisa)
Klassifizierung: cs.LG cs.CY
Veröffentlichungsdatum: Juli 2023 (arXiv-Preprint, aktualisiert Januar 2025)
Papier-Link: https://arxiv.org/abs/2307.15398

Zusammenfassung

Dieses Papier untersucht die Rolle der Initial Screening Order (ISO) bei der Kandidatenauswahl. ISO bezieht sich auf die Reihenfolge, in der ein Prüfer einen Kandidatenpool durchsucht, wenn er k Kandidaten auswählt. Derzeit wird ISO typischerweise durch Informationszugriffssysteme (wie Online-Plattformen oder Datenbankabfragen) generiert. Obwohl ISO einen wichtigen Einfluss auf die Optimalität und Fairness der ausgewählten k Kandidaten hat (besonders bei menschlichen Prüfern), wurde dies in der Literatur weitgehend übersehen. Die Autoren definieren zwei Problemformulierungen, um das Suchverhalten von Prüfern unter einer gegebenen ISO zu beschreiben: das best-k-Problem (Auswahl der k besten Kandidaten) und das good-k-Problem (Auswahl der k ausreichend guten Kandidaten). Um die Auswirkungen der ISO zu untersuchen, führen die Autoren menschenähnliche Prüfer ein und vergleichen diese mit algorithmischen Prüfern, wobei menschenähnliche Prüfer so konzipiert sind, dass sie zeitlich inkonsistent sind. Die Analyse zeigt, dass ISO bei menschenähnlichen Prüfern, die das good-k-Problem lösen, die individuelle Fairness behindert (obwohl die Gruppenfairness erfüllt wird) und die Optimalität der ausgewählten k Kandidaten beeinträchtigt. Dies wird durch Positionsverzerrung verursacht, d. h. die Bewertung eines Kandidaten wird durch seine Position in der ISO beeinflusst.

Forschungshintergrund und Motivation

Problemhintergrund

Die Kandidatenauswahl ist eine komplexe, arbeitsintensive Aufgabe, die in Szenarien wie Lebenslaufscreening und Universitätszulassungen weit verbreitet ist. Mit der Entwicklung des maschinellen Lernens spielen Informationszugriffssysteme (IAS) wie LinkedIn und Taleo eine zentrale Rolle bei der Kandidatenauswahl und präsentieren Kandidaten typischerweise nach geschätzter Relevanz oder spezifischen Merkmalen.

Forschungsmotivation

Praktische Anforderungen: Basierend auf Erfahrungen aus der Zusammenarbeit mit dem Global-500-Unternehmen G identifizierten die Autoren fünf Schlüsselmuster:
- G1: Prüfer wählen unterschiedliche ISOs
- G2: Es gibt vollständige und teilweise Suche
- G3: Fokus auf Kandidaten, die Mindestanforderungen erfüllen
- G4: Fairnesszielen mit Diversitätsquoten
- G5: Etwa eine Minute Bewertungszeit pro Kandidat
Theoretische Lücke: Bestehende Literatur konzentriert sich hauptsächlich auf die Erstellung von ISO (als Fair-Set-Selection oder Ranking-Problem), untersucht aber selten, wie Prüfer ISO nutzen, besonders das Verhalten menschlicher Prüfer.
Fairness-Bedenken: Positionsverzerrung kann dazu führen, dass ähnliche Kandidaten aufgrund unterschiedlicher Positionen in der ISO unterschiedlich behandelt werden, was gegen das Prinzip der individuellen Fairness verstößt.

Kernbeiträge

Erstmalige Formalisierung des ISO-Problems: ISO als Schlüsselparameter in Set-Selection-Problemen definieren, mit Problemformulierungen für best-k und good-k Suchverhalten.
Einführung eines menschenähnlichen Prüfermodells: Vorschlag eines menschenähnlichen Prüfers, der Ermüdungseffekte berücksichtigt, mit theoretischem und experimentellem Vergleich zu algorithmischen Prüfern.
Bereitstellung eines flexiblen Simulationswerkzeugs: Entwicklung eines Simulationsrahmens zur Untersuchung des ISO-Problems, der Praktikern Orientierung bietet, ohne echte Screening-Szenarien durchführen zu müssen.
Offenlegung der Fairness-Auswirkungen von Positionsverzerrung: Nachweis, dass ISO bei menschenähnlichen Prüfern zu Verstößen gegen individuelle Fairness führt, während Gruppenfairness-Beschränkungen erfüllt bleiben.

Methodische Details

Aufgabendefinition

Gegeben ein Kandidatenpool C mit n Kandidaten, wobei jeder Kandidat c durch einen Merkmalsvektor X_c ∈ R^d und ein Schutzattribut w_c beschrieben wird. Ein Prüfer h muss basierend auf ISO θ eine Menge S^k von k Kandidaten auswählen und dabei eine Repräsentationsquote q (Mindestanteil der Schutzgruppe in S^k) erfüllen.

Zwei Problemformulierungen

Best-k-Problem

Der Prüfer muss den gesamten Kandidatenpool bewerten und die k Kandidaten mit den höchsten Bewertungen auswählen:

argmax_{S^k ∈ [C]^k} U^k_add(S^k, θ) s.t. f(S^k) ≥ q

wobei die Nutzenfunktion definiert ist als:

U^k_add(S^k, θ) = Σ_{c∈S^k} s(X_c)

Good-k-Problem

Der Prüfer sucht die ersten k Kandidaten, die eine Mindestanforderung ψ erfüllen, mit Erlaubnis zur Teilsuche:

argmax_{S^k ∈ [C]^k} U^k_ψ(S^k, θ) s.t. f(S^k) ≥ q

wobei die Nutzenfunktion definiert ist als:

U^k_ψ(S^k, θ) = {
  k - Σ_{c∈S^k} p(c, S^k, θ)  wenn ∀c ∈ S^k, s(X_c) ≥ ψ
  0                            sonst
}

Die Strafunktion p(c, S^k, θ) misst die "verschwendete Anstrengung" bei der Auswahl von Kandidat c.

Prüfermodelle

Algorithmischer Prüfer h_a

Bewertet Kandidaten konsistent ohne Ermüdungseffekte, führt einen deterministischen Algorithmus aus.

Menschenähnlicher Prüfer h_h

Führt eine Ermüdungskomponente Φ(t) = λ·t ein, die die Kandidatenbewertung beeinflusst:

s_h_h(X_c) + ε

wobei ε eine von kumulativer Ermüdung abhängige Zufallsvariable ist, mit zwei Modellierungsoptionen:

ε₁ ~ N(0, v(Φ(t-1))): Varianz nimmt mit Ermüdung zu
ε₂ ~ N(μ(Φ(t-1)), v(Φ(t-1))): Mittelwert nimmt mit Ermüdung ab

Suchalgorithmen

ExaminationSearch (Algorithmus 1): Löst best-k-Problem, sucht in absteigender Bewertungsreihenfolge
CascadeSearch (Algorithmus 2): Löst good-k-Problem, sucht in ISO-Reihenfolge
Entsprechende menschenähnliche Versionen (Algorithmen 3-4): Integrieren Ermüdungseffekte

Experimentelle Einrichtung

Simulationsrahmen

Verwendung eines in R entwickelten Monte-Carlo-Simulationsrahmens mit 10.000 Experimenten pro Parametersatz.

Kandidaten-Bewertungsverteilungen

Betrachtung von drei abgeschnittenen Normalverteilungen t_N(μ, σ):

Symmetrische Verteilung: μ=0,5, σ=0,02 (sehr niedrige Wahrscheinlichkeit für Top-Kandidaten)
Asymmetrische Verteilung: μ=0,8, σ=0,05 (höhere Wahrscheinlichkeit für Top-Kandidaten)
Steigende Verteilung: μ=1, σ=0,05 (höchste Wahrscheinlichkeit für Top-Kandidaten)

ISO-Einstellungen

θ ⊥⊥ s: ISO unabhängig von individuellen Bewertungen (zufällig oder alphabetisch)
θ ⊥̸⊥ s: ISO korreliert mit Bewertungen, Korrelationskoeffizient ρ ∈ {-1, -0,8, -0,5}

Experimentelle Parameter

Kandidatenpool-Größe: n = 120, 400, 30
Auswahlmenge: k = 6, 20
Quote: q = 0,5
Anteil der Schutzgruppe: pr = 0,2
Mindestanforderung: ψ ∈ 0,3, 0,8

Bewertungsmetriken

Basis-Verhältnis (RtB): Nutzenverhältnis relativ zur Baseline-Lösung
Jaccard-Ähnlichkeit (JdS): Kandidaten-Überlappungsquote

Experimentelle Ergebnisse

Ohne Ermüdung (Algorithmischer Prüfer)

Good-k vs. Best-k-Leistung

Auswirkung der Bewertungsverteilung:
- Bei symmetrischer Verteilung nähert sich good-k mit zunehmendem ψ dem best-k an
- Bei asymmetrischer und steigender Verteilung erreicht good-k auch bei großem ψ nicht die best-k-Leistung
Auswirkung der ISO-Korrelation:
- Bei ρ = -1 (vollständig negativ korreliert) ist good-k-Leistung identisch mit best-k
- Bei ρ = -0,5 approximiert good-k bereits gut das best-k
Skaleneffekte:
- Größere k/n-Verhältnisse ermöglichen bessere Approximation von best-k durch good-k
- ISO-Auswirkungen schwächen sich mit zunehmendem k/n ab

Mit Ermüdung (Menschenähnlicher Prüfer)

Ermüdungsauswirkungen auf Good-k

Varianz-Typ-Ermüdung (ε₁):
- Symmetrische Verteilung zeigt signifikante Leistungsabnahme bei hohen ψ-Werten
- Asymmetrische und steigende Verteilungen sind relativ stabil
Bias-Typ-Ermüdung (ε₂):
- Aufgrund kleinerer Standardabweichung geringere Auswirkung auf symmetrische Verteilung
- Bei niedriger Kandidatenqualität ist die Bias-Auswirkung gering

Best-k vs. Good-k mit Ermüdung

Bei Ermüdung ist die good-k-Lösung manchmal besser als best-k
Zeigt, dass längere Suche für menschenähnliche Prüfer schädlich ist
In bestimmten Einstellungen sollte good-k-Strategie bevorzugt werden

Schutzwirkung der ISO-Korrelation

Bereitstellung einer ISO mit Kandidatenqualitätsinformationen reduziert Ermüdungsauswirkungen
Unterstreicht die Bedeutung von IAS im ISO-Problem

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Fairness-Auswirkungen von Positionsverzerrung: ISO führt bei menschenähnlichen Prüfern zu Verstößen gegen individuelle Fairness, auch wenn Gruppenfairness-Beschränkungen erfüllt sind.
Bedeutung der Problemformulierung: Die korrekte Definition der Problemformulierung ist entscheidend für das Verständnis der Auswirkungen von ISO auf die Kandidatenauswahl.
Komplexität des Prüferverhaltens: Es besteht eine komplexe Beziehung zwischen best-k und good-k Problemen, abhängig von Kandidatenqualitätsverteilung, ISO-Korrelation und Ermüdungseffekten.

Einschränkungen

Funktionale Annahmen: Die funktionalen Annahmen des Nutzenmodells und der Ermüdungsterme könnten zu vereinfacht sein
Ermüdungsmodellierung: Lineare Ermüdungsakkumulation könnte unrealistisch sein
Simulation vs. Realität: Simulationsergebnisse benötigen Validierung in echten Szenarien

Zukünftige Richtungen

Alternative Nutzenmodelle: Erkundung anderer Nutzenmodelle wie Exposure Discounting
Fortgeschrittene Ermüdungsmodelle: Berücksichtigung zyklischer Überlebensmodelle mit Prüfer-Pausen
Menschliche Entscheidungstheorie: Integration umfassenderer Theorien menschlicher Entscheidungsfindung
Parameteroptimierung: Verwendung des Simulationsrahmens zur Prüfung optimaler Parameter

Tiefgreifende Bewertung

Stärken

Problemrelevanz: Erste systematische Untersuchung des übersehenen, aber wichtigen ISO-Problems
Theoretische Beiträge: Bereitstellung eines strengen mathematischen Rahmens und algorithmischer Implementierung
Praktische Relevanz: Basierend auf Erkenntnissen aus echter Unternehmenskooperation mit praktischem Anwendungswert
Methodische Innovation: Einführung eines menschenähnlichen Prüfermodells mit Berücksichtigung von Ermüdungseffekten
Experimentelle Umfassendheit: Erkundung mehrerer Parameterkombinationen durch großflächige Simulation
Werkzeugbeitrag: Bereitstellung eines Open-Source-Simulationsrahmens

Schwächen

Modellvereinfachung: Ermüdungsmodell ist relativ einfach und könnte komplexes menschliches Verhalten nicht erfassen
Unzureichende Validierung: Hauptsächlich auf Simulation basierend, mangelnde Validierung mit großen echten Datensätzen
Annahmebeschränkungen: Unabhängigkeitsannahmen (A1, A2) könnten in der Realität nicht gelten
Begrenzte Bewertungsmetriken: Fokus hauptsächlich auf Nutzen und Überlappung, mangelnde andere Fairness-Metriken

Auswirkungen

Akademischer Wert: Bietet neue Perspektive für Fair Machine Learning und Human-Computer Interaction
Praktischer Wert: Bietet Orientierung für Design von Recruiting-Plattformen und HR-Systemen
Methodologischer Beitrag: Simulationsrahmen ist auf andere Entscheidungsszenarien übertragbar
Politische Bedeutung: Bietet Werkzeuge für Algorithmus-Audit und Fairness-Regulierung

Anwendungsszenarien

Recruiting-Screening: Lebenslauf-Screening, Kandidatenbewertung
Bildungsbewertung: Bewerbungsprüfung, Aufgabenbewertung
Empfehlungssysteme: Fair Recommendations unter Berücksichtigung von Benutzer-Suchverhalten
Entscheidungsunterstützung: Alle Szenarien mit sequenzieller Bewertung

Technische Innovationspunkte

Kerninnnovationen

ISO-Parametrisierung: Behandlung der Initial Screening Order als expliziter Problemparameter
Duale Problemformulierung: Unterscheidung zwischen best-k (global optimal) und good-k (bedingungserfüllend)
Ermüdungsmodellierung: Einführung eines zeitabhängigen Bewertungsfehlermodells
Fairness-Analyse: Unterscheidung zwischen unterschiedlichen Manifestationen von Gruppen- und Individueller Fairness

Algorithmusdesign

ExaminationSearch und CascadeSearch sind sorgfältig konzipiert:

Sequenzielle Verarbeitung garantiert ISO-Auswirkungen
Quotenverwaltung sichert Fairness-Beschränkungen
Menschenähnliche Versionen integrieren natürlich Ermüdungseffekte

Experimentdesign

Der Simulationsrahmen ist durchdacht konzipiert:

Verschiedene Bewertungsverteilungen simulieren unterschiedliche Kandidatenqualitätsszenarien
ISO-Korrelationsparameter steuern Informationssystem-Qualität
Großflächige wiederholte Experimente sichern Ergebnisstabilität

Dieses Papier bietet eine wichtige theoretische Grundlage und praktische Werkzeuge zum Verständnis und zur Verbesserung von Kandidaten-Screening-Systemen und ist von großer Bedeutung für den Aufbau fairerer und effektiverer KI-gestützter Entscheidungssysteme.