2025-11-14T22:04:10.870857

Characterizing the Multiclass Learnability of Forgiving 0-1 Loss Functions

Trauger, Trauger, Tewari

In this paper we will give a characterization of the learnability of forgiving 0-1 loss functions in the finite label multiclass setting. To do this, we create a new combinatorial dimension that is based off of the Natarajan Dimension and we show that a hypothesis class is learnable in our setting if and only if this Generalized Natarajan Dimension is finite. We also show a connection to learning with set-valued feedback. Through our results we show that the learnability of a set learning problem is characterized by the Natarajan Dimension.

academic

寛容な0-1損失関数の多クラス学習可能性の特性化

基本情報

論文ID: 2510.08382
タイトル: Characterizing the Multiclass Learnability of Forgiving 0-1 Loss Functions
著者: Jacob Trauger (ミシガン大学), Tyson Trauger (オハイオ州立大学), Ambuj Tewari (ミシガン大学)
分類: cs.LG (機械学習), stat.ML (統計-機械学習)
発表時期: 2025年10月 (arXiv プレプリント)
論文リンク: https://arxiv.org/abs/2510.08382

要旨

本論文は、有限ラベル多クラス分類設定における寛容な0-1損失関数の学習可能性の特性化を提供する。そのため、著者はNatarajan次元に基づいて新しい組合せ次元を構築し、仮説クラスがこの設定で学習可能であることと、この一般化されたNatarajan次元が有限であることが同値であることを証明した。また、集合値フィードバック学習との関連性を示し、集合学習問題の学習可能性がNatarajan次元によって特性化されることを示した。

研究背景と動機

問題背景

機械学習理論において、分類タスクの学習可能性の特性化は中心的な問題である。二値分類ではVC次元がPAC学習可能性を完全に特性化し、多クラス分類では有限ラベルの場合Natarajan次元が同様の役割を果たす。しかし、これらの理論はすべて標準的な0-1損失関数に基づいており、この関数は「識別不可能性の同一性」(Identity of Indiscernibles)性質を持つ。すなわち、2つのラベルが等しい場合に限り損失が0である。

研究動機

実際の応用では、より「寛容な」損失関数が必要とされることが多い。例えば：

文の言い換えタスク: 複数の異なる文が同じ言い換えとして正しい場合がある
閾値ベースの指標: 特定の閾値範囲内の出力がすべて受け入れ可能である
集合値フィードバック学習: 予測結果が与えられた集合内にあれば十分である

これらのシナリオでは、複数の異なる出力が同じ真のラベルに対して0損失を生成する可能性があり、従来の理論の基本的な仮定を破壊する。

既存手法の限界

既存の学習可能性理論（VC次元、Natarajan次元など）は、ラベルの等価性を損失値と暗黙的に関連付けている。損失関数が識別不可能性の同一性を満たさない場合、これらの理論は適用できなくなり、学習可能性を特性化するための新しい理論的枠組みが必要である。

核心的貢献

一般化されたNatarajan次元の提案: Natarajan次元に基づいて、寛容な0-1損失関数に適用可能な新しい組合せ次元を構築した
完全な学習可能性の特性化: 仮説クラスが寛容な0-1損失の下でPAC学習可能であることと、一般化されたNatarajan次元が有限であることが同値であることを証明した
集合学習問題の解決: バッチ設定で集合値フィードバック学習の学習可能性を初めて特性化した
理論的枠組みの確立: 識別不可能性の同一性を満たさない損失関数に対する体系的な学習理論を構築した

方法の詳細

タスク定義

入力空間: $X$ （任意の入力空間） 出力空間: $Y = [k]$ （有限ラベル集合、 $|Y| = k$ ） 仮説クラス: $H \subset Y^X$ 損失関数: $\ell: Y \times Y \to \{0,1\}$ 、以下の制約を満たす：

二値性: $\forall y_1, y_2 \in Y, \ell(y_1, y_2) \in \{0,1\}$
対称性: $\forall y_1, y_2 \in Y, \ell(y_1, y_2) = \ell(y_2, y_1)$
非包含性: $\forall y_1, y_2 \in Y, \sigma(y_1) \not\subset \sigma(y_2)$
反射性: $\forall y \in Y, \ell(y, y) = 0$

ここで $\sigma(y) = \{y' | \ell(y, y') = 0\}$ は $y$ に対して0損失を生成するすべてのラベルの集合を表す。

核心的理論構築

1. 一般化されたNatarajan次元

定義4（一般化されたNatarajan次元）: 仮説クラス $H$ と損失関数 $\ell$ が集合 $S = \{s_1, ..., s_n\}$ を一般化されたNatarajan粉砕するとは、 $h_1, h_2 \in H$ が存在して以下を満たすことである：

分離条件: $\forall s_i \in S, \sigma(h_1(s_i)) \neq \sigma(h_2(s_i))$
実現条件: $\forall S' \subseteq S$ $\forall S^{'} \subseteq S$ に対して、 $h \in H$ $h \in H$ が存在して：
- $\forall s \in S': \sigma(h(s)) = \sigma(h_1(s))$
- $\forall s \in S \setminus S': \sigma(h(s)) = \sigma(h_2(s))$