TabPFNなどの表形式データ用基盤モデルの最近の進展により、事前学習されたTransformerアーキテクチャがベイズ推論を高い予測性能で近似できることが実証されました。しかし、Transformerはシーケンス長に対して二次の計算量を持つため、より効率的なシーケンスモデルの探索が求められています。本研究では、双方向線形時間構造化状態空間モデル(SSM)であるHydraをTabPFNのTransformerの代替案として使用する可能性を調査します。主な課題は、SSMが入力トークンの順序に対して本質的に敏感であることです。これは、行の順序が意味的に無意味である表形式データセットにとって望ましくない特性です。双方向アプローチが効率性を保持し、対称的なコンテキスト集約を可能にする程度を調査します。実験結果から、このアプローチが順序依存性を低減し、元のTabPFNモデルと競争力のある予測性能を達成することが示されました。
本論文は表形式分類タスクを研究しており、以下の特徴があります:
アルゴリズムフローは以下の通りです:
入力: 順列回数r、コンテキストD、テストサンプルxtest
出力: 予測されたクラス値
空リストを初期化: outputs ← []
for i = 1 to r do
Dの行をシャッフル: Dp ← shuffle(D)
xtestをDpに連結: Din ← Dp ∪ xtest
予測: outputs[i] ← PFN.predict(Din)
end for
outputsの平均値を返す
KL発散で測定:
主要な参考文献には以下が含まれます:
本論文は表形式基盤モデルのスケーラビリティ問題の解決において価値のある貢献をしており、双方向SSMと繰り返し順列戦略を巧みに組み合わせることで、効率と性能の需要を成功裏にバランスさせています。理論的革新の面では不足していますが、その実用価値と今後の研究への啓発的意義は認識する価値があります。