When Are Learning Biases Equivalent? A Unifying Framework for Fairness, Robustness, and Distribution Shift
Mehta
Machine learning systems exhibit diverse failure modes: unfairness toward protected groups, brittleness to spurious correlations, poor performance on minority sub-populations, which are typically studied in isolation by distinct research communities. We propose a unifying theoretical framework that characterizes when different bias mechanisms produce quantitatively equivalent effects on model performance. By formalizing biases as violations of conditional independence through information-theoretic measures, we prove formal equivalence conditions relating spurious correlations, subpopulation shift, class imbalance, and fairness violations. Our theory predicts that a spurious correlation of strength $α$ produces equivalent worst-group accuracy degradation as a sub-population imbalance ratio $r \approx (1+α)/(1-α)$ under feature overlap assumptions. Empirical validation in six datasets and three architectures confirms that predicted equivalences hold within the accuracy of the worst group 3\%, enabling the principled transfer of debiasing methods across problem domains. This work bridges the literature on fairness, robustness, and distribution shifts under a common perspective.
academic
শেখার পক্ষপাত কখন সমতুল্য? ন্যায্যতা, শক্তিশালীতা এবং বিতরণ পরিবর্তনের জন্য একটি একীভূত কাঠামো
মেশিন লার্নিং সিস্টেম বিভিন্ন ব্যর্থতার ধরন প্রদর্শন করে: সুরক্ষিত গোষ্ঠীগুলির প্রতি অন্যায্যতা, মিথ্যা সম্পর্কের প্রতি দুর্বলতা এবং সংখ্যালঘু উপগোষ্ঠীতে দুর্বল কর্মক্ষমতা। এই সমস্যাগুলি সাধারণত বিভিন্ন গবেষণা সম্প্রদায় দ্বারা স্বাধীনভাবে অধ্যয়ন করা হয়। এই পত্রটি একটি একীভূত তাত্ত্বিক কাঠামো প্রস্তাব করে যা বিভিন্ন পক্ষপাত প্রক্রিয়া কখন মডেল কর্মক্ষমতায় পরিমাণগতভাবে সমতুল্য প্রভাব ফেলে তা চিহ্নিত করে। পক্ষপাতকে শর্তসাপেক্ষ স্বাধীনতার লঙ্ঘন হিসাবে আনুষ্ঠানিক করে (তথ্য-তাত্ত্বিক পরিমাপ ব্যবহার করে), লেখক মিথ্যা সম্পর্ক, উপগোষ্ঠী পরিবর্তন, শ্রেণী অসন্তুলন এবং ন্যায্যতা লঙ্ঘনের মধ্যে আনুষ্ঠানিক সমতুল্যতার শর্ত প্রমাণ করেন। তত্ত্ব পূর্বাভাস দেয় যে শক্তি α এর মিথ্যা সম্পর্ক উপগোষ্ঠী অসন্তুলন অনুপাত r ≈ (1+α)/(1-α) এর সমতুল্য সর্বনিম্ন গোষ্ঠী নির্ভুলতা হ্রাস উৎপন্ন করে। ছয়টি ডেটাসেট এবং তিনটি স্থাপত্যে অভিজ্ঞতামূলক যাচাইকরণ সর্বনিম্ন গোষ্ঠী নির্ভুলতায় 3% ত্রুটির মধ্যে পূর্বাভাসিত সমতুল্যতা নিশ্চিত করে, যা সমস্যা ডোমেন জুড়ে নীতিগত পক্ষপাত-হ্রাস পদ্ধতি স্থানান্তর সক্ষম করে।
একীভূত তাত্ত্বিক কাঠামো: সমস্ত পক্ষপাতকে প্রকৃত লেবেল দেওয়া শর্তে পূর্বাভাস এবং সুরক্ষিত/মিথ্যা বৈশিষ্ট্যের মধ্যে শর্তসাপেক্ষ স্বাধীনতার লঙ্ঘন হিসাবে দেখুন, তথ্য-তাত্ত্বিক পরিমাপ দ্বারা আনুষ্ঠানিক
আনুষ্ঠানিক সমতুল্যতা শর্ত: প্রমাণ করে যে মিথ্যা সম্পর্ক, উপগোষ্ঠী পরিবর্তন এবং ন্যায্যতা লঙ্ঘন কখন পরিমাণগত সমতুল্য প্রভাব উৎপন্ন করে (উপপাদ্য 2)
পূর্বাভাস তত্ত্ব: কাঠামো বিতরণ বৈশিষ্ট্য থেকে সর্বনিম্ন গোষ্ঠী কর্মক্ষমতা পূর্বাভাস দিতে পারে, 18টি সমস্যা কনফিগারেশনে অভিজ্ঞতামূলকভাবে যাচাই করা
পদ্ধতি স্থানান্তর যাচাইকরণ: তাত্ত্বিকভাবে সমতুল্য সমস্যা জুড়ে পক্ষপাত-হ্রাস কৌশলের সফল স্থানান্তর প্রদর্শন, স্ক্র্যাচ থেকে প্রশিক্ষণ পদ্ধতির কর্মক্ষমতার 5% এর মধ্যে অর্জন
সাহিত্য সেতু: ন্যায্যতা, শক্তিশালীতা এবং সাধারণীকরণ গবেষণা সম্প্রদায়ের মধ্যে একটি একীভূত দৃষ্টিভঙ্গি প্রতিষ্ঠা করে
উপপাদ্য 2 (পক্ষপাত সমতুল্যতা):
দুটি শেখার সমস্যা (D₁, A₁) এবং (D₂, A₂) বিবেচনা করুন, একই বৈশিষ্ট্য স্থান X এবং লেবেল স্থান Y সহ, কিন্তু বিভিন্ন বৈশিষ্ট্য A₁, A₂। ক্ষতি ফাংশন ℓ এর মসৃণতা অনুমান এবং বৈশিষ্ট্য ওভারল্যাপ অবস্থার অধীনে:
η = min_y ∫ min(p₁(x|y), p₂(x|y))dx > τ
যদি পক্ষপাত প্রক্রিয়া ϵ-সমতুল্যতা সন্তুষ্ট করে:
|B(f; D₁) - B(f; D₂)| ≤ ϵ
তাহলে সর্বনিম্ন গোষ্ঠী নির্ভুলতা পার্থক্য সর্বাধিক δ(ϵ, η), যেখানে:
δ(ϵ, η) = O(√ϵ/η)
উপসিদ্ধান্ত 3 (মিথ্যা সম্পর্ক ↔ অসন্তুলন):
শক্তি α এর মিথ্যা সম্পর্ক উপগোষ্ঠী অসন্তুলন অনুপাত r এর সমতুল্য, যখন:
পদক্ষেপ 1: পক্ষপাত এবং সর্বনিম্ন গোষ্ঠী ক্ষতি সম্পর্কিত করুন
Fano অসমতার মাধ্যমে, সর্বনিম্ন গোষ্ঠী ত্রুটির হার সন্তুষ্ট করে:
Err_worst ≤ [H(Y|A) + B(f; D)] / log 2
পদক্ষেপ 2: বৈশিষ্ট্য ওভারল্যাপ এবং ক্ষতি বিতরণ
বৈশিষ্ট্য ওভারল্যাপ অবস্থা η > τ এর অধীনে, কাপলিং লেমা এবং Lipschitz ধারাবাহিকতার মাধ্যমে, Wasserstein-1 দূরত্ব সন্তুষ্ট করে:
|B(f; D₁) - B(f; D₂)| ≤ ϵ ⟹ W₁(L₁, L₂) ≤ C√ϵ/η
পদক্ষেপ 3: নির্ভুলতা পার্থক্য সীমাবদ্ধ করুন
Kantorovich-Rubinstein দ্বৈততার মাধ্যমে:
আবিষ্কার: সমতুল্যতা কঠোরতা ওভারল্যাপের সাথে উন্নত হয়, তাত্ত্বিক পূর্বাভাস δ ∝ 1/η মেলে
স্থাপত্য সংবেদনশীলতা (টেবিল 5)
স্থাপত্য
Waterbirds সর্বনিম্ন নির্ভুলতা
ColoredMNIST সর্বনিম্ম নির্ভুলতা
∆Acc
ResNet-50
73.8%
71.2%
2.6%
ViT-B/16
72.4%
70.1%
2.3%
MLP-4L
69.7%
67.9%
1.8%
আবিষ্কার: স্থাপত্য জুড়ে সামঞ্জস্যপূর্ণ সমতুল্যতা (গড় পরিবর্তন 0.8%), ঘটনা বিতরণগতভাবে অপরিহার্য নির্দেশ করে
সম্পর্ক শক্তি:
মিথ্যা সম্পর্ক শক্তি α 0.7 থেকে 0.99 পর্যন্ত পদ্ধতিগতভাবে পরিবর্তন করুন, পূর্বাভাস সমতুল্য অসন্তুলন অনুপাত 5.7:1 থেকে 199:1 পর্যবেক্ষণ করুন, সমস্ত পূর্বাভাস 4% সর্বনিম্ম গোষ্ঠী নির্ভুলতার মধ্যে যাচাই করা হয়, সম্পূর্ণ সম্পর্ক শক্তি পরিসীমা জুড়ে উপসিদ্ধান্ত 3 নিশ্চিত করে।
Sagawa et al. (2020) - GroupDRO পদ্ধতি এবং Waterbirds বেঞ্চমার্ক
Geirhos et al. (2020) - গভীর নেটওয়ার্কে শর্টকাট শেখা
Hardt et al. (2016) - তত্ত্বাবধানে শেখায় সুযোগের সমতা
Koh et al. (2021) - WILDS বন্য বিতরণ পরিবর্তন বেঞ্চমার্ক
Kirichenko et al. (2022) - শেষ স্তর পুনঃপ্রশিক্ষণ (DFR)
Liu et al. (2021) - Just Train Twice (JTT) পদ্ধতি
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের তাত্ত্বিক এবং অভিজ্ঞতামূলক সমন্বিত কাজ, মেশিন লার্নিং পক্ষপাত গবেষণা ক্ষেত্রে অগ্রগামী অবদান সহ। তাত্ত্বিক কাঠামো মার্জিত এবং ব্যবহারিক, পরীক্ষামূলক যাচাইকরণ ব্যাপক। প্রধান সীমাবদ্ধতা দ্বিশ্রেণী অনুমান এবং বহুশ্রেণী সম্প্রসারণের অনুপস্থিতি। NeurIPS এর মতো শীর্ষ সম্মেলনের জন্য, এটি একটি গ্রহণযোগ্য শক্তিশালী নিবন্ধ, উল্লেখযোগ্য প্রভাব প্রত্যাশিত এবং পরবর্তী গবেষণা অনুপ্রাণিত করবে। লেখকদের চূড়ান্ত সংস্করণে আরও পদ্ধতি স্থানান্তর পরীক্ষা এবং ব্যর্থতা কেস বিশ্লেষণ যোগ করার পরামর্শ দেওয়া হয়, এবং বৈশিষ্ট্য ওভারল্যাপ থ্রেশহোল্ড τ এর ব্যবহারিক নির্বাচন নির্দেশনা প্রদান করুন।