2025-11-14T07:52:11.150813

Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis

Bhatia, de Amorim, De Feo
Regression analysis is employed to examine and quantify the relationships between input variables and a dependent and continuous output variable. It is widely used for predictive modelling in fields such as finance, healthcare, and engineering. However, traditional methods often struggle with real-world data complexities, including uncertainty and ambiguity. While deep learning approaches excel at capturing complex non-linear relationships, they lack interpretability and risk over-fitting on small datasets. Fuzzy systems provide an alternative framework for handling uncertainty and imprecision, with Mamdani and Takagi-Sugeno-Kang (TSK) systems offering complementary strengths: interpretability versus accuracy. This paper presents a novel fuzzy regression method that combines the interpretability of Mamdani systems with the precision of TSK models. The proposed approach introduces a hybrid rule structure with fuzzy and crisp components and dual dominance types, enhancing both accuracy and explainability. Evaluations on benchmark datasets demonstrate state-of-the-art performance in several cases, with rules maintaining a component similar to traditional Mamdani systems while improving precision through improved rule outputs. This hybrid methodology offers a balanced and versatile tool for predictive modelling, addressing the trade-off between interpretability and accuracy inherent in fuzzy systems. In the 6 datasets tested, the proposed approach gave the best fuzzy methodology score in 4 datasets, out-performed the opaque models in 2 datasets and produced the best overall score in 1 dataset with the improvements in RMSE ranging from 0.4% to 19%.
academic

ハイブリッド区間型2型Mamdani-TSKファジィシステムの回帰分析への応用

基本情報

  • 論文ID: 2510.13437
  • タイトル: Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis
  • 著者: Ashish Bhatia, Renato Cordeiro de Amorim, Vito De Feo(エセックス大学、イギリス)
  • 分類: cs.LG(機械学習)
  • 発表日: 2025年10月15日
  • 論文リンク: https://arxiv.org/abs/2510.13437v1

要約

回帰分析は金融、医療、工学などの分野における予測モデリングに広く応用されており、入力変数と連続出力変数の関係を検証および定量化するために使用されている。しかし、従来の手法は不確実性と曖昧性を含む現実世界データの複雑性への対応に困難を抱えている。深層学習手法は複雑な非線形関係の捕捉に優れているが、解釈可能性に欠け、小規模データセットでの過学習のリスクがある。ファジィシステムは不確実性と不正確性に対処するための代替フレームワークを提供し、Mamdaniシステムと高木-菅野-カン(TSK)システムは相補的な利点を提供する:解釈可能性と精度である。本論文は、Mamdaniシステムの解釈可能性とTSKモデルの精度を組み合わせた新規なファジィ回帰手法を提案する。本手法は、ファジィ成分と明確な成分を有し、二重支配型を備えたハイブリッド規則構造を導入し、精度と解釈可能性の両方を向上させる。

研究背景と動機

問題定義

従来の回帰手法が現実世界データの処理において直面する主要な課題:

  1. 不確実性と曖昧性:現実データに内在する不確実性と言語情報
  2. 解釈可能性と精度のトレードオフ:深層学習モデルは精度が高いが解釈可能性に欠ける
  3. 小規模データセット問題:複雑なモデルは小規模データセットでの学習時に過学習しやすい

既存手法の限界

  • 従来の回帰手法:正確で明確な数値関係を仮定し、不確実性への対応が困難
  • 深層学習手法:解釈可能性に欠け、パラメータが多く、小規模データセットの学習に不適切
  • Mamdaniファジィシステム:解釈可能性は高いが精度に限界があり、粗粒度の分割により性能が低下
  • TSKファジィシステム:精度は高いが解釈可能性に欠け、ファジィシステム使用の本来の目的に反する

研究動機

Mamdaniシステムの解釈可能性とTSKシステムの精度の両方を保持するハイブリッドフレームワークを開発し、予測モデリングのための均衡のとれた多機能なツールを提供する。

核心的貢献

  1. ハイブリッド規則構造:Mamdaniシステムの言語的解釈可能性とTSKモデルの数値的精度を組み合わせた新規なファジィ回帰システムを提案
  2. 二重支配メカニズム:ファジィサポート度/信頼度に基づく支配度とエラーに基づく支配度の2つの規則重み付け計算方法を導入
  3. 制約付きTSK成分:TSK関数の出力を対応するファジィ集合の境界内に制限し、解釈可能性を維持
  4. 区間型2型ファジィ集合:区間型2型ファジィ集合を使用して不確実性をより適切に処理
  5. ACO最適化:蟻群最適化アルゴリズムを採用して規則部分集合選択を実施し、モデルのコンパクト性と精度のバランスを取る

手法の詳細

タスク定義

入力変数 x1,x2,...,xnx_1, x_2, ..., x_n と連続出力変数 yy が与えられたとき、目標は精度と解釈可能性の両方を備え、データ内の不確実性と曖昧性に対応できる回帰モデルを構築することである。

モデルアーキテクチャ

1. 区間型2型ファジィ集合のファジィ化

入力と出力は区間型2型ファジィ集合を使用してファジィ化される:

F~=xX[u[μ(x),μ(x)]1/u]/x\tilde{F} = \int_{x \in X} \left[ \int_{u \in [\underline{\mu}(x), \overline{\mu}(x)]} 1/u \right] /x

ここで μ(x)\underline{\mu}(x)μ(x)\overline{\mu}(x) はそれぞれ下界と上界の帰属度である。

2. ハイブリッド規則構造

各規則は2つの後件成分を含む:

規則形式

IF x1 is F1 AND ... AND xn is Fn 
THEN (y is G, y = f(x1, x2, ..., xn))
  • ファジィ成分:従来のMamdani後件で、出力ファジィ集合を指定
  • TSK関数成分:n次多項式関数で、明確な出力値を提供

TSK関数制約youtput[LowerBound(Fupper),UpperBound(Fupper)]y_{output} \in [LowerBound(F_{upper}), UpperBound(F_{upper})]

TSK出力が常に対応するファジィ集合の境界内にあることを保証する。

3. 二重重み付けメカニズム

ファジィ規則重み付け

  • サポート度:Support(AjC~j)=1Np=1NμAj(xp)μCj(yp)Support(A_j \to \tilde{C}_j) = \frac{1}{|N|} \sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)
  • 信頼度:Confidence(AjC~j)=p=1NμAj(xp)μCj(yp)p=1NμAj(xp)Confidence(A_j \to \tilde{C}_j) = \frac{\sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)}{\sum_{p=1}^N \mu_{A_j}(x_p)}
  • 支配度:D=[SRule_lowerClower,SRule_upperCupper]D = [S_{Rule\_lower} \cdot C_{lower}, S_{Rule\_upper} \cdot C_{upper}]

エラーベースの支配度Dominanceri=11+riDominance_{ri} = \frac{1}{1 + r_i} ここで rir_i は第i規則のRMSEである。

4. ACO規則選択

蟻群最適化アルゴリズムを使用して最適な規則部分集合を選択:

  • 各蟻が規則部分集合ソリューションを構築
  • RMSE性能に基づいてソリューション品質を評価
  • フェロモン更新メカニズムが探索プロセスを誘導
  • モデルのコンパクト性と予測精度のバランスを取る

5. 逆ファジィ化

TSK加重平均法を使用して最終出力を計算: yfinal=i=1Mωiyii=1Mωiy_{final} = \frac{\sum_{i=1}^M \omega_i y_i}{\sum_{i=1}^M \omega_i}

技術的革新点

  1. 制約付きTSK成分:従来のTSKと異なり、関数出力はファジィ集合の境界内に制限される
  2. 部分集合訓練:TSK関数は正の発火強度を有する訓練サンプルのみで訓練される
  3. 二重支配メカニズム:ファジィロジックと数値精度の重み付け計算を組み合わせる
  4. 解釈可能性の維持:規則形式は従来のMamdaniシステムと類似しているが、精度がより高い

実験設定

データセット

KEELリポジトリから6つのベンチマークデータセットを使用:

  1. コンクリート圧縮強度:1,030インスタンス、8入力変数
  2. 糖尿病:768レコード、2入力属性
  3. ELE-2:11,105インスタンス、4予測変数
  4. 住宅ローン:1,045インスタンス、14変数
  5. 財務省:956レコード、16金融属性
  6. ワンカラ:1,609レコード、4入力変数

評価指標

  • RMSE(二乗平均平方根誤差):主要評価指標
  • 解釈可能性指標:規則カバレッジ、活動規則数、規則ベース特性、ロバスト性

比較手法

  • MP:多層パーセプトロン
  • SMOreg:逐次最小最適化
  • WM:Wang-Mendelアルゴリズム
  • CHV:Cordon、Herrera、Villarアルゴリズム
  • GLD-WM:グローバル横方向パラメータ + WM規則ベース

モデルバリエーション

  • HIT2-MTSK-D2:2次TSK関数
  • HIT2-MTSK-D3:3次TSK関数

実験結果

主要結果

6つのデータセット中:

  • 4つのデータセットで最良のファジィ手法スコアを達成
  • 2つのデータセットで非透明モデルを超越
  • 1つのデータセットで最良の総合スコアを達成
  • RMSE改善範囲:0.4% - 19%

具体的性能

  • コンクリート:HIT2-MTSK-D3が7.29 RMSEを達成、最良の総合性能
  • 住宅ローン:HIT2-MTSK-D3が0.13 RMSEを達成、最良のファジィ手法
  • 財務省:HIT2-MTSK-D3が0.27 RMSEを達成、最良のファジィ手法
  • ワンカラ:両バリエーションが1.58 RMSEを達成、SMOregの性能と一致

ケーススタディ:カリフォルニア住宅価格予測

カリフォルニア住宅データセットでの性能:

  • データセット:20,640観測値、8特性
  • HIT2-MTSK RMSE:0.695
  • Mamdani FRBS RMSE:0.751
  • 規則数:75規則
  • カバレッジ:100%のテストインスタンスが少なくとも1つの規則を発火

解釈可能性評価

  • カテゴリカバレッジ:実際のテストデータ範囲の96%をカバー
  • 活動規則:閾値0.15で平均8.38規則が発火
  • 規則特性:75規則、平均2.67前件
  • ノイズロバスト性:10%ノイズレベルで予測変化12.24%

関連研究

ファジィ規則システムの発展

  • Wang-Mendelメソッド:初期のデータ駆動型規則生成
  • 遺伝的ファジィシステム(GFS):遺伝的アルゴリズムを統合した規則学習の最適化
  • 進化的アルゴリズムの応用:知識ベース、規則ベース、データベースの最適化

ハイブリッド手法

  • Gr-MFおよびGA-WM:規則ベースとデータベース最適化の統合
  • GA-CORメソッド:遺伝的アルゴリズムとCORフレームワークの統合
  • WM+GLメソッド:言語2-タプルを使用した横方向調整

本論文の優位性

既存研究と比較して、本手法は解釈可能性を保持しながら精度を大幅に向上させ、従来の手法における精度と解釈可能性のトレードオフ問題を解決する。

結論と考察

主要な結論

  1. 効果的なバランス:ファジィシステムにおける解釈可能性と精度のトレードオフを成功裏にバランス
  2. 顕著な改善:多くのベンチマークデータセットで最良またはそれに近い性能を達成
  3. 解釈可能性の維持:規則形式は従来のMamdaniシステムと類似し、理解しやすい
  4. 強いロバスト性:異なる領域とデータセットにおいて安定した性能を発揮

限界

  1. 複雑性のトレードオフ:高次TSK関数は過学習につながる可能性がある
  2. 最適化の余地:一部のデータセットではまだ性能向上の余地がある
  3. 計算複雑性:ACO最適化は計算コストを増加させる
  4. パラメータ感度:ファジィ集合数とTSK関数の次数の適切な設定が必要

今後の方向性

  1. 最適化の強化:他のメタヒューリスティック最適化技術の探索
  2. 領域適応:特定領域のための前処理と特徴選択
  3. 評価の拡張:より多くのデータセットと評価指標による検証
  4. 理論分析:収束性と複雑性の深い分析

深層的評価

長所

  1. 革新性が高い:制約付きTSK成分を有するハイブリッドファジィシステムを初めて提案
  2. 実用価値が高い:実際の応用における主要な問題を解決
  3. 実験が充分:複数のベンチマークデータセットで検証、詳細な解釈可能性分析を含む
  4. 手法が合理的:技術設計の論理が明確で、理論的基礎が堅実

不足点

  1. 理論分析の不足:収束性と複雑性の理論的保証に欠ける
  2. パラメータ選択の指導不足:体系的なパラメータ選択戦略が提供されていない
  3. 計算効率:ACO最適化の計算複雑性分析が十分でない
  4. 適用性の境界:手法の適用条件に関する議論が限定的

影響力

  1. 学術的貢献:ファジィシステム分野に新しい研究方向を提供
  2. 実用価値:解釈可能なAIが必要なシナリオで重要な応用価値を有する
  3. 再現性:手法の説明が詳細で、再現と拡張が容易

適用シーン

  1. 金融リスク評価:解釈可能な予測モデルが必要な場合
  2. 医療診断:透明な意思決定プロセスが要求される場合
  3. 工学制御:システム動作の理解が必要な制御応用
  4. 小規模データセット回帰:従来の深層学習手法が不適切なシーン

参考文献

論文はファジィシステム、進化的アルゴリズム、機械学習分野の重要な文献を引用しており、Zadehのファジィロジック基礎研究、MamdaniとTSKの古典的ファジィシステム、および最近の遺伝的ファジィシステムと区間型2型ファジィ集合の研究を含む。


総合評価:これは高品質の学術論文であり、解釈可能性を保持しながら回帰精度を大幅に向上させた革新的なハイブリッドファジィシステム手法を提案している。手法設計が合理的で、実験検証が充分であり、ファジィシステムと解釈可能なAI分野に重要な貢献価値を有する。