2025-11-14T07:52:11.150813

Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis

Bhatia, de Amorim, De Feo
Regression analysis is employed to examine and quantify the relationships between input variables and a dependent and continuous output variable. It is widely used for predictive modelling in fields such as finance, healthcare, and engineering. However, traditional methods often struggle with real-world data complexities, including uncertainty and ambiguity. While deep learning approaches excel at capturing complex non-linear relationships, they lack interpretability and risk over-fitting on small datasets. Fuzzy systems provide an alternative framework for handling uncertainty and imprecision, with Mamdani and Takagi-Sugeno-Kang (TSK) systems offering complementary strengths: interpretability versus accuracy. This paper presents a novel fuzzy regression method that combines the interpretability of Mamdani systems with the precision of TSK models. The proposed approach introduces a hybrid rule structure with fuzzy and crisp components and dual dominance types, enhancing both accuracy and explainability. Evaluations on benchmark datasets demonstrate state-of-the-art performance in several cases, with rules maintaining a component similar to traditional Mamdani systems while improving precision through improved rule outputs. This hybrid methodology offers a balanced and versatile tool for predictive modelling, addressing the trade-off between interpretability and accuracy inherent in fuzzy systems. In the 6 datasets tested, the proposed approach gave the best fuzzy methodology score in 4 datasets, out-performed the opaque models in 2 datasets and produced the best overall score in 1 dataset with the improvements in RMSE ranging from 0.4% to 19%.
academic

Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis

基本信息

  • 论文ID: 2510.13437
  • 标题: Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis
  • 作者: Ashish Bhatia, Renato Cordeiro de Amorim, Vito De Feo (University of Essex, United Kingdom)
  • 分类: cs.LG (Machine Learning)
  • 发表时间: 2025年10月15日
  • 论文链接: https://arxiv.org/abs/2510.13437v1

摘要

回归分析被广泛应用于金融、医疗和工程等领域的预测建模,用于检查和量化输入变量与连续输出变量之间的关系。然而,传统方法在处理现实世界数据的复杂性(包括不确定性和模糊性)时往往存在困难。虽然深度学习方法擅长捕捉复杂的非线性关系,但缺乏可解释性且在小数据集上存在过拟合风险。模糊系统为处理不确定性和不精确性提供了替代框架,其中Mamdani和Takagi-Sugeno-Kang (TSK)系统提供了互补的优势:可解释性与准确性。本文提出了一种新颖的模糊回归方法,结合了Mamdani系统的可解释性和TSK模型的精确性。该方法引入了具有模糊和清晰组件以及双重主导类型的混合规则结构,同时增强了准确性和可解释性。

研究背景与动机

问题定义

传统回归方法在处理现实世界数据时面临的主要挑战:

  1. 不确定性和模糊性:现实数据中存在的固有不确定性和语言信息
  2. 可解释性与准确性的权衡:深度学习模型虽然准确但缺乏可解释性
  3. 小数据集问题:复杂模型在小数据集上容易过拟合

现有方法局限性

  • 传统回归方法:假设精确和明确的数值关系,难以处理不确定性
  • 深度学习方法:缺乏可解释性,参数众多,不适合小数据集训练
  • Mamdani模糊系统:可解释性强但精度有限,粗粒度划分导致性能下降
  • TSK模糊系统:精度高但缺乏可解释性,违背了使用模糊系统的初衷

研究动机

开发一个既能保持Mamdani系统可解释性又能达到TSK系统精确性的混合框架,为预测建模提供平衡且多功能的工具。

核心贡献

  1. 混合规则结构:提出了结合Mamdani系统语言可解释性和TSK模型数值精确性的新型模糊回归系统
  2. 双重主导机制:引入了两种规则权重计算方法——基于模糊支持度/置信度和基于误差的主导度
  3. 约束TSK组件:TSK函数输出被约束在相应模糊集的边界内,保持可解释性
  4. 区间二型模糊集:使用区间二型模糊集更好地处理不确定性
  5. ACO优化:采用蚁群优化算法进行规则子集选择,平衡模型紧凑性和准确性

方法详解

任务定义

给定输入变量 x1,x2,...,xnx_1, x_2, ..., x_n 和连续输出变量 yy,目标是建立一个既准确又可解释的回归模型,能够处理数据中的不确定性和模糊性。

模型架构

1. 区间二型模糊集模糊化

输入和输出使用区间二型模糊集进行模糊化:

F~=xX[u[μ(x),μ(x)]1/u]/x\tilde{F} = \int_{x \in X} \left[ \int_{u \in [\underline{\mu}(x), \overline{\mu}(x)]} 1/u \right] /x

其中 μ(x)\underline{\mu}(x)μ(x)\overline{\mu}(x) 分别是下界和上界隶属度。

2. 混合规则结构

每个规则包含两个后件组件:

规则形式

IF x1 is F1 AND ... AND xn is Fn 
THEN (y is G, y = f(x1, x2, ..., xn))
  • 模糊组件:传统Mamdani后件,指向输出模糊集
  • TSK函数组件:n阶多项式函数,提供清晰输出值

TSK函数约束youtput[LowerBound(Fupper),UpperBound(Fupper)]y_{output} \in [LowerBound(F_{upper}), UpperBound(F_{upper})]

确保TSK输出始终在对应模糊集边界内。

3. 双重权重机制

模糊规则权重

  • 支持度:Support(AjC~j)=1Np=1NμAj(xp)μCj(yp)Support(A_j \to \tilde{C}_j) = \frac{1}{|N|} \sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)
  • 置信度:Confidence(AjC~j)=p=1NμAj(xp)μCj(yp)p=1NμAj(xp)Confidence(A_j \to \tilde{C}_j) = \frac{\sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)}{\sum_{p=1}^N \mu_{A_j}(x_p)}
  • 主导度:D=[SRule_lowerClower,SRule_upperCupper]D = [S_{Rule\_lower} \cdot C_{lower}, S_{Rule\_upper} \cdot C_{upper}]

误差基础主导度Dominanceri=11+riDominance_{ri} = \frac{1}{1 + r_i} 其中 rir_i 是第i条规则的RMSE。

4. ACO规则选择

使用蚁群优化算法选择最优规则子集:

  • 每只蚂蚁构建规则子集解决方案
  • 基于RMSE性能评估解决方案质量
  • 信息素更新机制引导搜索过程
  • 平衡模型紧凑性和预测准确性

5. 去模糊化

使用TSK加权平均方法计算最终输出: yfinal=i=1Mωiyii=1Mωiy_{final} = \frac{\sum_{i=1}^M \omega_i y_i}{\sum_{i=1}^M \omega_i}

技术创新点

  1. 约束TSK组件:与传统TSK不同,函数输出被限制在模糊集边界内
  2. 子集训练:TSK函数仅在具有正激发强度的训练样本上训练
  3. 双重主导机制:结合模糊逻辑和数值精度的权重计算
  4. 保持可解释性:规则形式与传统Mamdani系统相似,但精度更高

实验设置

数据集

使用KEEL存储库中的6个基准数据集:

  1. Concrete Compressive Strength:1030实例,8输入变量
  2. Diabetes:768记录,2输入属性
  3. ELE-2:11,105实例,4预测变量
  4. Mortgage:1045实例,14变量
  5. Treasury:956记录,16金融属性
  6. Wankara:1609记录,4输入变量

评价指标

  • RMSE (Root Mean Squared Error):主要评价指标
  • 可解释性指标:规则覆盖率、活跃规则数、规则库特征、鲁棒性

对比方法

  • MP:多层感知器
  • SMOreg:序列最小优化
  • WM:Wang和Mendel算法
  • CHV:Cordon, Herrera和Villar算法
  • GLD-WM:全局横向参数 + WM规则库

模型变体

  • HIT2-MTSK-D2:2阶TSK函数
  • HIT2-MTSK-D3:3阶TSK函数

实验结果

主要结果

在6个数据集中:

  • 4个数据集取得最佳模糊方法得分
  • 2个数据集超越不透明模型
  • 1个数据集取得最佳总体得分
  • RMSE改进范围:0.4% - 19%

具体性能

  • Concrete:HIT2-MTSK-D3达到7.29 RMSE,为最佳总体表现
  • Mortgage:HIT2-MTSK-D3达到0.13 RMSE,最佳模糊方法
  • Treasury:HIT2-MTSK-D3达到0.27 RMSE,最佳模糊方法
  • Wankara:两个变体均达到1.58 RMSE,匹配SMOreg性能

案例分析:加州房价预测

在加州住房数据集上的表现:

  • 数据集:20,640观测值,8个特征
  • HIT2-MTSK RMSE:0.695
  • Mamdani FRBS RMSE:0.751
  • 规则数量:75条规则
  • 覆盖率:100%测试实例激活至少一条规则

可解释性评估

  • 类别覆盖:覆盖96%的实际测试数据范围
  • 活跃规则:阈值0.15时平均8.38条规则激发
  • 规则特征:75条规则,平均2.67个前件
  • 噪声鲁棒性:10%噪声水平下预测变化12.24%

相关工作

模糊规则系统发展

  • Wang-Mendel方法:早期数据驱动规则生成
  • 遗传模糊系统(GFS):集成遗传算法优化规则学习
  • 进化算法应用:优化知识库、规则库和数据库

混合方法

  • Gr-MF和GA-WM:结合规则库和数据库优化
  • GA-COR方法:集成遗传算法与COR框架
  • WM+GL方法:使用语言2-元组进行横向调优

本文优势

相比现有工作,本文方法在保持可解释性的同时显著提高了精度,解决了传统方法中准确性与可解释性的权衡问题。

结论与讨论

主要结论

  1. 有效平衡:成功平衡了模糊系统中可解释性与准确性的权衡
  2. 显著改进:在多数基准数据集上取得最佳或接近最佳性能
  3. 保持可解释性:规则形式与传统Mamdani系统相似,易于理解
  4. 鲁棒性强:在不同领域和数据集上表现稳定

局限性

  1. 复杂度权衡:高阶TSK函数可能导致过拟合
  2. 优化空间:某些数据集上仍有性能提升空间
  3. 计算复杂性:ACO优化增加了计算成本
  4. 参数敏感性:需要合理设置模糊集数量和TSK函数阶数

未来方向

  1. 优化增强:探索其他元启发式优化技术
  2. 领域适应:针对特定领域的预处理和特征选择
  3. 扩展评估:更多数据集和评价指标的验证
  4. 理论分析:深入的收敛性和复杂度分析

深度评价

优点

  1. 创新性强:首次提出约束TSK组件的混合模糊系统
  2. 实用价值高:解决了实际应用中的关键问题
  3. 实验充分:多个基准数据集验证,包含详细的可解释性分析
  4. 方法合理:技术设计逻辑清晰,理论基础扎实

不足

  1. 理论分析不足:缺乏收敛性和复杂度的理论保证
  2. 参数选择指导:未提供系统的参数选择策略
  3. 计算效率:ACO优化的计算复杂度分析不够详细
  4. 适用性边界:对方法适用条件的讨论有限

影响力

  1. 学术贡献:为模糊系统领域提供了新的研究方向
  2. 实用价值:在需要可解释AI的场景中具有重要应用价值
  3. 可复现性:方法描述详细,便于复现和扩展

适用场景

  1. 金融风险评估:需要可解释的预测模型
  2. 医疗诊断:要求透明的决策过程
  3. 工程控制:需要理解系统行为的控制应用
  4. 小数据集回归:传统深度学习方法不适用的场景

参考文献

论文引用了模糊系统、进化算法和机器学习领域的重要文献,包括Zadeh的模糊逻辑基础工作、Mamdani和TSK的经典模糊系统,以及近期的遗传模糊系统和区间二型模糊集研究。


总体评价:这是一篇高质量的学术论文,提出了创新的混合模糊系统方法,在保持可解释性的同时显著提高了回归精度。方法设计合理,实验验证充分,对模糊系统和可解释AI领域具有重要贡献价值。