2025-11-25T20:16:18.201421

The Initial Screening Order Problem

Alvarez, Mastropietro, Ruggieri
We investigate the role of the initial screening order (ISO) in candidate screening. The ISO refers to the order in which the screener searches the candidate pool when selecting $k$ candidates. Today, it is common for the ISO to be the product of an information access system, such as an online platform or a database query. The ISO has been largely overlooked in the literature, despite its impact on the optimality and fairness of the selected $k$ candidates, especially under a human screener. We define two problem formulations describing the search behavior of the screener given an ISO: the best-$k$, where it selects the top $k$ candidates; and the good-$k$, where it selects the first good-enough $k$ candidates. To study the impact of the ISO, we introduce a human-like screener and compare it to its algorithmic counterpart, where the human-like screener is conceived to be inconsistent over time. Our analysis, in particular, shows that the ISO, under a human-like screener solving for the good-$k$ problem, hinders individual fairness despite meeting group fairness, and hampers the optimality of the selected $k$ candidates. This is due to position bias, where a candidate's evaluation is affected by its position within the ISO. We report extensive simulated experiments exploring the parameters of the best-$k$ and good-$k$ problems for both screeners. Our simulation framework is flexible enough to account for multiple candidate screening tasks, being an alternative to running real-world procedures.
academic

Das Initial Screening Order Problem

Grundinformationen

  • Papier-ID: 2307.15398
  • Titel: The Initial Screening Order Problem
  • Autoren: Jose M. Alvarez (KU Leuven), Antonio Mastropietro (Universität Pisa), Salvatore Ruggieri (Universität Pisa)
  • Klassifizierung: cs.LG cs.CY
  • Veröffentlichungsdatum: Juli 2023 (arXiv-Preprint, aktualisiert Januar 2025)
  • Papier-Link: https://arxiv.org/abs/2307.15398

Zusammenfassung

Dieses Papier untersucht die Rolle der Initial Screening Order (ISO) bei der Kandidatenauswahl. ISO bezieht sich auf die Reihenfolge, in der ein Prüfer einen Kandidatenpool durchsucht, wenn er k Kandidaten auswählt. Derzeit wird ISO typischerweise durch Informationszugriffssysteme (wie Online-Plattformen oder Datenbankabfragen) generiert. Obwohl ISO einen wichtigen Einfluss auf die Optimalität und Fairness der ausgewählten k Kandidaten hat (besonders bei menschlichen Prüfern), wurde dies in der Literatur weitgehend übersehen. Die Autoren definieren zwei Problemformulierungen, um das Suchverhalten von Prüfern unter einer gegebenen ISO zu beschreiben: das best-k-Problem (Auswahl der k besten Kandidaten) und das good-k-Problem (Auswahl der k ausreichend guten Kandidaten). Um die Auswirkungen der ISO zu untersuchen, führen die Autoren menschenähnliche Prüfer ein und vergleichen diese mit algorithmischen Prüfern, wobei menschenähnliche Prüfer so konzipiert sind, dass sie zeitlich inkonsistent sind. Die Analyse zeigt, dass ISO bei menschenähnlichen Prüfern, die das good-k-Problem lösen, die individuelle Fairness behindert (obwohl die Gruppenfairness erfüllt wird) und die Optimalität der ausgewählten k Kandidaten beeinträchtigt. Dies wird durch Positionsverzerrung verursacht, d. h. die Bewertung eines Kandidaten wird durch seine Position in der ISO beeinflusst.

Forschungshintergrund und Motivation

Problemhintergrund

Die Kandidatenauswahl ist eine komplexe, arbeitsintensive Aufgabe, die in Szenarien wie Lebenslaufscreening und Universitätszulassungen weit verbreitet ist. Mit der Entwicklung des maschinellen Lernens spielen Informationszugriffssysteme (IAS) wie LinkedIn und Taleo eine zentrale Rolle bei der Kandidatenauswahl und präsentieren Kandidaten typischerweise nach geschätzter Relevanz oder spezifischen Merkmalen.

Forschungsmotivation

  1. Praktische Anforderungen: Basierend auf Erfahrungen aus der Zusammenarbeit mit dem Global-500-Unternehmen G identifizierten die Autoren fünf Schlüsselmuster:
    • G1: Prüfer wählen unterschiedliche ISOs
    • G2: Es gibt vollständige und teilweise Suche
    • G3: Fokus auf Kandidaten, die Mindestanforderungen erfüllen
    • G4: Fairnesszielen mit Diversitätsquoten
    • G5: Etwa eine Minute Bewertungszeit pro Kandidat
  2. Theoretische Lücke: Bestehende Literatur konzentriert sich hauptsächlich auf die Erstellung von ISO (als Fair-Set-Selection oder Ranking-Problem), untersucht aber selten, wie Prüfer ISO nutzen, besonders das Verhalten menschlicher Prüfer.
  3. Fairness-Bedenken: Positionsverzerrung kann dazu führen, dass ähnliche Kandidaten aufgrund unterschiedlicher Positionen in der ISO unterschiedlich behandelt werden, was gegen das Prinzip der individuellen Fairness verstößt.

Kernbeiträge

  1. Erstmalige Formalisierung des ISO-Problems: ISO als Schlüsselparameter in Set-Selection-Problemen definieren, mit Problemformulierungen für best-k und good-k Suchverhalten.
  2. Einführung eines menschenähnlichen Prüfermodells: Vorschlag eines menschenähnlichen Prüfers, der Ermüdungseffekte berücksichtigt, mit theoretischem und experimentellem Vergleich zu algorithmischen Prüfern.
  3. Bereitstellung eines flexiblen Simulationswerkzeugs: Entwicklung eines Simulationsrahmens zur Untersuchung des ISO-Problems, der Praktikern Orientierung bietet, ohne echte Screening-Szenarien durchführen zu müssen.
  4. Offenlegung der Fairness-Auswirkungen von Positionsverzerrung: Nachweis, dass ISO bei menschenähnlichen Prüfern zu Verstößen gegen individuelle Fairness führt, während Gruppenfairness-Beschränkungen erfüllt bleiben.

Methodische Details

Aufgabendefinition

Gegeben ein Kandidatenpool C mit n Kandidaten, wobei jeder Kandidat c durch einen Merkmalsvektor X_c ∈ R^d und ein Schutzattribut w_c beschrieben wird. Ein Prüfer h muss basierend auf ISO θ eine Menge S^k von k Kandidaten auswählen und dabei eine Repräsentationsquote q (Mindestanteil der Schutzgruppe in S^k) erfüllen.

Zwei Problemformulierungen

Best-k-Problem

Der Prüfer muss den gesamten Kandidatenpool bewerten und die k Kandidaten mit den höchsten Bewertungen auswählen:

argmax_{S^k ∈ [C]^k} U^k_add(S^k, θ) s.t. f(S^k) ≥ q

wobei die Nutzenfunktion definiert ist als:

U^k_add(S^k, θ) = Σ_{c∈S^k} s(X_c)

Good-k-Problem

Der Prüfer sucht die ersten k Kandidaten, die eine Mindestanforderung ψ erfüllen, mit Erlaubnis zur Teilsuche:

argmax_{S^k ∈ [C]^k} U^k_ψ(S^k, θ) s.t. f(S^k) ≥ q

wobei die Nutzenfunktion definiert ist als:

U^k_ψ(S^k, θ) = {
  k - Σ_{c∈S^k} p(c, S^k, θ)  wenn ∀c ∈ S^k, s(X_c) ≥ ψ
  0                            sonst
}

Die Strafunktion p(c, S^k, θ) misst die "verschwendete Anstrengung" bei der Auswahl von Kandidat c.

Prüfermodelle

Algorithmischer Prüfer h_a

Bewertet Kandidaten konsistent ohne Ermüdungseffekte, führt einen deterministischen Algorithmus aus.

Menschenähnlicher Prüfer h_h

Führt eine Ermüdungskomponente Φ(t) = λ·t ein, die die Kandidatenbewertung beeinflusst:

s_h_h(X_c) + ε

wobei ε eine von kumulativer Ermüdung abhängige Zufallsvariable ist, mit zwei Modellierungsoptionen:

  • ε₁ ~ N(0, v(Φ(t-1))): Varianz nimmt mit Ermüdung zu
  • ε₂ ~ N(μ(Φ(t-1)), v(Φ(t-1))): Mittelwert nimmt mit Ermüdung ab

Suchalgorithmen

  • ExaminationSearch (Algorithmus 1): Löst best-k-Problem, sucht in absteigender Bewertungsreihenfolge
  • CascadeSearch (Algorithmus 2): Löst good-k-Problem, sucht in ISO-Reihenfolge
  • Entsprechende menschenähnliche Versionen (Algorithmen 3-4): Integrieren Ermüdungseffekte

Experimentelle Einrichtung

Simulationsrahmen

Verwendung eines in R entwickelten Monte-Carlo-Simulationsrahmens mit 10.000 Experimenten pro Parametersatz.

Kandidaten-Bewertungsverteilungen

Betrachtung von drei abgeschnittenen Normalverteilungen t_N(μ, σ):

  • Symmetrische Verteilung: μ=0,5, σ=0,02 (sehr niedrige Wahrscheinlichkeit für Top-Kandidaten)
  • Asymmetrische Verteilung: μ=0,8, σ=0,05 (höhere Wahrscheinlichkeit für Top-Kandidaten)
  • Steigende Verteilung: μ=1, σ=0,05 (höchste Wahrscheinlichkeit für Top-Kandidaten)

ISO-Einstellungen

  • θ ⊥⊥ s: ISO unabhängig von individuellen Bewertungen (zufällig oder alphabetisch)
  • θ ⊥̸⊥ s: ISO korreliert mit Bewertungen, Korrelationskoeffizient ρ ∈ {-1, -0,8, -0,5}

Experimentelle Parameter

  • Kandidatenpool-Größe: n = 120, 400, 30
  • Auswahlmenge: k = 6, 20
  • Quote: q = 0,5
  • Anteil der Schutzgruppe: pr = 0,2
  • Mindestanforderung: ψ ∈ 0,3, 0,8

Bewertungsmetriken

  • Basis-Verhältnis (RtB): Nutzenverhältnis relativ zur Baseline-Lösung
  • Jaccard-Ähnlichkeit (JdS): Kandidaten-Überlappungsquote

Experimentelle Ergebnisse

Ohne Ermüdung (Algorithmischer Prüfer)

Good-k vs. Best-k-Leistung

  1. Auswirkung der Bewertungsverteilung:
    • Bei symmetrischer Verteilung nähert sich good-k mit zunehmendem ψ dem best-k an
    • Bei asymmetrischer und steigender Verteilung erreicht good-k auch bei großem ψ nicht die best-k-Leistung
  2. Auswirkung der ISO-Korrelation:
    • Bei ρ = -1 (vollständig negativ korreliert) ist good-k-Leistung identisch mit best-k
    • Bei ρ = -0,5 approximiert good-k bereits gut das best-k
  3. Skaleneffekte:
    • Größere k/n-Verhältnisse ermöglichen bessere Approximation von best-k durch good-k
    • ISO-Auswirkungen schwächen sich mit zunehmendem k/n ab

Mit Ermüdung (Menschenähnlicher Prüfer)

Ermüdungsauswirkungen auf Good-k

  1. Varianz-Typ-Ermüdung (ε₁):
    • Symmetrische Verteilung zeigt signifikante Leistungsabnahme bei hohen ψ-Werten
    • Asymmetrische und steigende Verteilungen sind relativ stabil
  2. Bias-Typ-Ermüdung (ε₂):
    • Aufgrund kleinerer Standardabweichung geringere Auswirkung auf symmetrische Verteilung
    • Bei niedriger Kandidatenqualität ist die Bias-Auswirkung gering

Best-k vs. Good-k mit Ermüdung

  • Bei Ermüdung ist die good-k-Lösung manchmal besser als best-k
  • Zeigt, dass längere Suche für menschenähnliche Prüfer schädlich ist
  • In bestimmten Einstellungen sollte good-k-Strategie bevorzugt werden

Schutzwirkung der ISO-Korrelation

  • Bereitstellung einer ISO mit Kandidatenqualitätsinformationen reduziert Ermüdungsauswirkungen
  • Unterstreicht die Bedeutung von IAS im ISO-Problem

Verwandte Arbeiten

Fair Set Selection

Dieses Papier gehört zur Literatur über faire Mengenauswahl und ist mit dem Sekretärsproblem verwandt, konzentriert sich aber auf den Screening-Prozess statt auf das Interview-Stadium und verwendet ein Offline-Set-Selection-Setting.

Positionsverzerrungsforschung

  • Click-Modelle: Erste Formalisierung und Prüfung, wie Benutzer ISO durchsuchen
  • Empirische Studien: Echterhoff et al. und Wang et al. liefern empirische Belege für Positionsverzerrung bei Kandidatenscreening
  • Beitrag dieses Papiers: Definiert ISO als Parameter in Problemformulierungen, verwendet Simulation zur Erfassung verschiedener Screening-Szenarien

Informationszugriffssysteme

Bestehende Arbeiten konzentrieren sich hauptsächlich auf die Erstellung von ISO (Fair Ranking), dieses Papier konzentriert sich auf die Nutzung von ISO durch Prüfer, besonders das Verhalten menschlicher Benutzer.

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Fairness-Auswirkungen von Positionsverzerrung: ISO führt bei menschenähnlichen Prüfern zu Verstößen gegen individuelle Fairness, auch wenn Gruppenfairness-Beschränkungen erfüllt sind.
  2. Bedeutung der Problemformulierung: Die korrekte Definition der Problemformulierung ist entscheidend für das Verständnis der Auswirkungen von ISO auf die Kandidatenauswahl.
  3. Komplexität des Prüferverhaltens: Es besteht eine komplexe Beziehung zwischen best-k und good-k Problemen, abhängig von Kandidatenqualitätsverteilung, ISO-Korrelation und Ermüdungseffekten.

Einschränkungen

  1. Funktionale Annahmen: Die funktionalen Annahmen des Nutzenmodells und der Ermüdungsterme könnten zu vereinfacht sein
  2. Ermüdungsmodellierung: Lineare Ermüdungsakkumulation könnte unrealistisch sein
  3. Simulation vs. Realität: Simulationsergebnisse benötigen Validierung in echten Szenarien

Zukünftige Richtungen

  1. Alternative Nutzenmodelle: Erkundung anderer Nutzenmodelle wie Exposure Discounting
  2. Fortgeschrittene Ermüdungsmodelle: Berücksichtigung zyklischer Überlebensmodelle mit Prüfer-Pausen
  3. Menschliche Entscheidungstheorie: Integration umfassenderer Theorien menschlicher Entscheidungsfindung
  4. Parameteroptimierung: Verwendung des Simulationsrahmens zur Prüfung optimaler Parameter

Tiefgreifende Bewertung

Stärken

  1. Problemrelevanz: Erste systematische Untersuchung des übersehenen, aber wichtigen ISO-Problems
  2. Theoretische Beiträge: Bereitstellung eines strengen mathematischen Rahmens und algorithmischer Implementierung
  3. Praktische Relevanz: Basierend auf Erkenntnissen aus echter Unternehmenskooperation mit praktischem Anwendungswert
  4. Methodische Innovation: Einführung eines menschenähnlichen Prüfermodells mit Berücksichtigung von Ermüdungseffekten
  5. Experimentelle Umfassendheit: Erkundung mehrerer Parameterkombinationen durch großflächige Simulation
  6. Werkzeugbeitrag: Bereitstellung eines Open-Source-Simulationsrahmens

Schwächen

  1. Modellvereinfachung: Ermüdungsmodell ist relativ einfach und könnte komplexes menschliches Verhalten nicht erfassen
  2. Unzureichende Validierung: Hauptsächlich auf Simulation basierend, mangelnde Validierung mit großen echten Datensätzen
  3. Annahmebeschränkungen: Unabhängigkeitsannahmen (A1, A2) könnten in der Realität nicht gelten
  4. Begrenzte Bewertungsmetriken: Fokus hauptsächlich auf Nutzen und Überlappung, mangelnde andere Fairness-Metriken

Auswirkungen

  1. Akademischer Wert: Bietet neue Perspektive für Fair Machine Learning und Human-Computer Interaction
  2. Praktischer Wert: Bietet Orientierung für Design von Recruiting-Plattformen und HR-Systemen
  3. Methodologischer Beitrag: Simulationsrahmen ist auf andere Entscheidungsszenarien übertragbar
  4. Politische Bedeutung: Bietet Werkzeuge für Algorithmus-Audit und Fairness-Regulierung

Anwendungsszenarien

  1. Recruiting-Screening: Lebenslauf-Screening, Kandidatenbewertung
  2. Bildungsbewertung: Bewerbungsprüfung, Aufgabenbewertung
  3. Empfehlungssysteme: Fair Recommendations unter Berücksichtigung von Benutzer-Suchverhalten
  4. Entscheidungsunterstützung: Alle Szenarien mit sequenzieller Bewertung

Technische Innovationspunkte

Kerninnnovationen

  1. ISO-Parametrisierung: Behandlung der Initial Screening Order als expliziter Problemparameter
  2. Duale Problemformulierung: Unterscheidung zwischen best-k (global optimal) und good-k (bedingungserfüllend)
  3. Ermüdungsmodellierung: Einführung eines zeitabhängigen Bewertungsfehlermodells
  4. Fairness-Analyse: Unterscheidung zwischen unterschiedlichen Manifestationen von Gruppen- und Individueller Fairness

Algorithmusdesign

ExaminationSearch und CascadeSearch sind sorgfältig konzipiert:

  • Sequenzielle Verarbeitung garantiert ISO-Auswirkungen
  • Quotenverwaltung sichert Fairness-Beschränkungen
  • Menschenähnliche Versionen integrieren natürlich Ermüdungseffekte

Experimentdesign

Der Simulationsrahmen ist durchdacht konzipiert:

  • Verschiedene Bewertungsverteilungen simulieren unterschiedliche Kandidatenqualitätsszenarien
  • ISO-Korrelationsparameter steuern Informationssystem-Qualität
  • Großflächige wiederholte Experimente sichern Ergebnisstabilität

Dieses Papier bietet eine wichtige theoretische Grundlage und praktische Werkzeuge zum Verständnis und zur Verbesserung von Kandidaten-Screening-Systemen und ist von großer Bedeutung für den Aufbau fairerer und effektiverer KI-gestützter Entscheidungssysteme.