When Are Learning Biases Equivalent? A Unifying Framework for Fairness, Robustness, and Distribution Shift
Mehta
Machine learning systems exhibit diverse failure modes: unfairness toward protected groups, brittleness to spurious correlations, poor performance on minority sub-populations, which are typically studied in isolation by distinct research communities. We propose a unifying theoretical framework that characterizes when different bias mechanisms produce quantitatively equivalent effects on model performance. By formalizing biases as violations of conditional independence through information-theoretic measures, we prove formal equivalence conditions relating spurious correlations, subpopulation shift, class imbalance, and fairness violations. Our theory predicts that a spurious correlation of strength $α$ produces equivalent worst-group accuracy degradation as a sub-population imbalance ratio $r \approx (1+α)/(1-α)$ under feature overlap assumptions. Empirical validation in six datasets and three architectures confirms that predicted equivalences hold within the accuracy of the worst group 3\%, enabling the principled transfer of debiasing methods across problem domains. This work bridges the literature on fairness, robustness, and distribution shifts under a common perspective.
academic
जब सीखने के पूर्वाग्रह समतुल्य होते हैं? न्यायसंगतता, मजबूती और वितरण बदलाव के लिए एक एकीकृत ढांचा
मशीन लर्निंग प्रणालियां कई विफलता पैटर्न प्रदर्शित करती हैं: संरक्षित समूहों के प्रति अन्याय, नकली संबंधों के प्रति नाजुकता, और अल्पसंख्यक उप-समूहों पर खराब प्रदर्शन। ये समस्याएं आमतौर पर विभिन्न अनुसंधान समुदायों द्वारा स्वतंत्र रूप से अध्ययन की जाती हैं। यह पेपर एक एकीकृत सैद्धांतिक ढांचा प्रस्तावित करता है जो यह दर्शाता है कि विभिन्न पूर्वाग्रह तंत्र कब मॉडल प्रदर्शन पर मात्रात्मक रूप से समतुल्य प्रभाव डालते हैं। पूर्वाग्रहों को सशर्त स्वतंत्रता के उल्लंघन के रूप में औपचारिक बनाकर (सूचना-सैद्धांतिक उपायों का उपयोग करके), लेखक नकली संबंध, उप-समूह बदलाव, वर्ग असंतुलन और न्यायसंगतता उल्लंघन के बीच औपचारिक समतुल्यता शर्तों को साबित करते हैं। सिद्धांत भविष्यवाणी करता है कि शक्ति α का नकली संबंध उप-समूह असंतुलन अनुपात r ≈ (1+α)/(1-α) के समतुल्य सबसे खराब समूह सटीकता में गिरावट का कारण बनता है। छह डेटासेट और तीन आर्किटेक्चर पर प्रायोगिक सत्यापन पूर्वानुमानित समतुल्यता की पुष्टि करता है जो सबसे खराब समूह सटीकता में 3% त्रुटि के भीतर है, जिससे पूर्वाग्रह-निष्कासन विधियां समस्या डोमेन में सिद्धांत-आधारित स्थानांतरण को सक्षम करती हैं।
एकीकृत सैद्धांतिक ढांचा: सभी पूर्वाग्रहों को सशर्त स्वतंत्रता के उल्लंघन के रूप में देखता है (सूचना-सैद्धांतिक उपायों के साथ औपचारिक)
औपचारिक समतुल्यता शर्तें: साबित करता है कि नकली संबंध, उप-समूह बदलाव और न्यायसंगतता उल्लंघन कब मात्रात्मक रूप से समतुल्य प्रभाव डालते हैं (प्रमेय 2)
पूर्वानुमान सिद्धांत: ढांचा वितरण गुणों से सबसे खराब समूह प्रदर्शन की भविष्यवाणी कर सकता है, 18 समस्या कॉन्फ़िगरेशन पर प्रायोगिक रूप से सत्यापित
विधि स्थानांतरण सत्यापन: सफलतापूर्वक सैद्धांतिक रूप से समतुल्य समस्याओं में पूर्वाग्रह-निष्कासन तकनीकों के स्थानांतरण को प्रदर्शित करता है, शुरुआत से प्रशिक्षण विधि प्रदर्शन के 5% के भीतर
साहित्य को पुल करना: न्यायसंगतता, मजबूती और सामान्यीकरण अनुसंधान समुदायों के बीच एकीकृत दृष्टिकोण स्थापित करता है
प्रमेय 2 (पूर्वाग्रह समतुल्यता):
दो सीखने की समस्याओं पर विचार करें (D₁, A₁) और (D₂, A₂), समान विशेषता स्थान X और लेबल स्थान Y के साथ, लेकिन विभिन्न विशेषताएं A₁, A₂। हानि फ़ंक्शन ℓ की चिकनाई और विशेषता ओवरलैप की स्थिति के तहत:
η = min_y ∫ min(p₁(x|y), p₂(x|y))dx > τ
यदि पूर्वाग्रह तंत्र ϵ-समतुल्यता को संतुष्ट करते हैं:
|B(f; D₁) - B(f; D₂)| ≤ ϵ
तो सबसे खराब समूह सटीकता अंतर अधिकतम δ(ϵ, η) है, जहां:
δ(ϵ, η) = O(√ϵ/η)
अनुमान 3 (नकली संबंध ↔ असंतुलन):
शक्ति α का नकली संबंध उप-समूह असंतुलन अनुपात r के समतुल्य है, जब:
चरण 1: पूर्वाग्रह को सबसे खराब समूह हानि से संबंधित करना
Fano असमानता के माध्यम से, सबसे खराब समूह त्रुटि दर संतुष्ट करता है:
Err_worst ≤ [H(Y|A) + B(f; D)] / log 2
चरण 2: विशेषता ओवरलैप और हानि वितरण
विशेषता ओवरलैप स्थिति η > τ के तहत, युग्मन लेम्मा और Lipschitz निरंतरता के माध्यम से, Wasserstein-1 दूरी संतुष्ट करता है:
|B(f; D₁) - B(f; D₂)| ≤ ϵ ⟹ W₁(L₁, L₂) ≤ C√ϵ/η
चरण 3: सटीकता अंतर को सीमित करना
Kantorovich-Rubinstein द्वैत के माध्यम से:
निष्कर्ष: समतुल्यता कसाई ओवरलैप में सुधार के साथ, सैद्धांतिक पूर्वानुमान δ ∝ 1/η से मेल खाता है
आर्किटेक्चर संवेदनशीलता (तालिका 5)
आर्किटेक्चर
Waterbirds सबसे खराब सटीकता
ColoredMNIST सबसे खराब सटीकता
∆Acc
ResNet-50
73.8%
71.2%
2.6%
ViT-B/16
72.4%
70.1%
2.3%
MLP-4L
69.7%
67.9%
1.8%
निष्कर्ष: आर्किटेक्चर में सुसंगत समतुल्यता (औसत परिवर्तन 0.8%), यह दर्शाता है कि घटना वितरणात्मक रूप से आवश्यक है
संबंध शक्ति:
नकली संबंध शक्ति α को 0.7 से 0.99 तक व्यवस्थित रूप से भिन्न करते हैं, पूर्वानुमानित समतुल्य असंतुलन अनुपात 5.7:1 से 199:1 तक देखते हैं, सभी पूर्वानुमान 4% सबसे खराब समूह सटीकता के भीतर सत्यापित, अनुमान 3 को संपूर्ण संबंध शक्ति श्रेणी में पुष्ट करते हैं।
द्विआधारी वर्गीकरण धारणा: वर्तमान सिद्धांत द्विआधारी वर्गीकरण तक सीमित है, हालांकि one-vs-rest अपघटन के माध्यम से बहु-वर्ग में स्वाभाविक रूप से विस्तारित होता है
सीमा की शिथिलता: δ(ϵ, η) सीमा व्यवहार में शिथिल हो सकती है, सांद्रता असमानताओं के माध्यम से कसी हुई लक्षण वर्णन अभी भी खुली समस्या है
सबसे खराब समूह मेट्रिक: सबसे खराब समूह मेट्रिक पर ध्यान केंद्रित करता है, कैलिब्रेशन न्यायसंगतता और व्यक्तिगत न्यायसंगतता के साथ संबंध अन्वेषण योग्य है
व्यावहारिक सीमा शर्तें (समतुल्यता विफलता):
अपर्याप्त विशेषता ओवरलैप: η < τ (आमतौर पर 0.2), जब समूह विशेषता स्थान में पूरी तरह से अलग क्षेत्र पर कब्जा करते हैं
गैर-चिकनी हानि: 0-1 हानि निरंतरता धारणा का उल्लंघन करता है (लेकिन व्यवहार में उपयोग की जाने वाली क्रॉस-एंट्रॉपी आवश्यकताओं को संतुष्ट करता है)
आर्किटेक्चर पूर्वाग्रह प्रभुत्व: वितरण प्रभाव को दबाता है (विलोपन अध्ययन दर्शाता है यह दुर्लभ है)
सशर्त स्वतंत्रता धारणा उल्लंघन: उदाहरण के लिए नकली विशेषता वास्तव में कारणात्मक है
यह पेपर निम्नलिखित मुख्य साहित्य का हवाला देता है:
Sagawa et al. (2020) - GroupDRO विधि और Waterbirds बेंचमार्क
Geirhos et al. (2020) - गहन नेटवर्क में शॉर्टकट सीखना
Hardt et al. (2016) - पर्यवेक्षित शिक्षा में अवसर समानता
Koh et al. (2021) - WILDS वाइल्ड वितरण बदलाव बेंचमार्क
Kirichenko et al. (2022) - अंतिम परत पुनः प्रशिक्षण (DFR)
Liu et al. (2021) - Just Train Twice (JTT) विधि
समग्र मूल्यांकन: यह उच्च गुणवत्ता का सैद्धांतिक और प्रायोगिक कार्य है, मशीन लर्निंग पूर्वाग्रह अनुसंधान में अग्रणी योगदान के साथ। सैद्धांतिक ढांचा सुरुचिपूर्ण और व्यावहारिक है, प्रायोगिक सत्यापन व्यापक है। मुख्य सीमाएं द्विआधारी वर्गीकरण धारणा और बहु-वर्ग विस्तार की कमी हैं। NeurIPS जैसे शीर्ष सम्मेलन के लिए, यह स्वीकृति के योग्य एक मजबूत पेपर है, जिससे महत्वपूर्ण प्रभाव और बाद के अनुसंधान की प्रेरणा की उम्मीद है। अंतिम संस्करण में अधिक विधि स्थानांतरण प्रयोग और विफलता मामले विश्लेषण जोड़ने और विशेषता ओवरलैप थ्रेशोल्ड τ के व्यावहारिक चयन के लिए मार्गदर्शन प्रदान करने की सिफारिश की जाती है।