Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis
Bhatia, de Amorim, De Feo
Regression analysis is employed to examine and quantify the relationships between input variables and a dependent and continuous output variable. It is widely used for predictive modelling in fields such as finance, healthcare, and engineering. However, traditional methods often struggle with real-world data complexities, including uncertainty and ambiguity. While deep learning approaches excel at capturing complex non-linear relationships, they lack interpretability and risk over-fitting on small datasets. Fuzzy systems provide an alternative framework for handling uncertainty and imprecision, with Mamdani and Takagi-Sugeno-Kang (TSK) systems offering complementary strengths: interpretability versus accuracy. This paper presents a novel fuzzy regression method that combines the interpretability of Mamdani systems with the precision of TSK models. The proposed approach introduces a hybrid rule structure with fuzzy and crisp components and dual dominance types, enhancing both accuracy and explainability. Evaluations on benchmark datasets demonstrate state-of-the-art performance in several cases, with rules maintaining a component similar to traditional Mamdani systems while improving precision through improved rule outputs. This hybrid methodology offers a balanced and versatile tool for predictive modelling, addressing the trade-off between interpretability and accuracy inherent in fuzzy systems. In the 6 datasets tested, the proposed approach gave the best fuzzy methodology score in 4 datasets, out-performed the opaque models in 2 datasets and produced the best overall score in 1 dataset with the improvements in RMSE ranging from 0.4% to 19%.
academic
Sistema Difuso Híbrido Mamdani-TSK de Tipo-2 Intervalar para Análisis de Regresión
El análisis de regresión se aplica ampliamente en modelado predictivo en finanzas, medicina e ingeniería para examinar y cuantificar las relaciones entre variables de entrada y variables de salida continuas. Sin embargo, los métodos tradicionales frecuentemente enfrentan dificultades al tratar la complejidad de datos del mundo real, incluyendo incertidumbre y ambigüedad. Aunque los métodos de aprendizaje profundo destacan en capturar relaciones no lineales complejas, carecen de interpretabilidad y presentan riesgo de sobreajuste en conjuntos de datos pequeños. Los sistemas difusos proporcionan un marco alternativo para manejar incertidumbre e imprecisión, donde los sistemas Mamdani y Takagi-Sugeno-Kang (TSK) ofrecen ventajas complementarias: interpretabilidad versus precisión. Este artículo propone un nuevo método de regresión difusa que combina la interpretabilidad del sistema Mamdani con la precisión del modelo TSK. El método introduce una estructura de reglas híbrida con componentes difusos y claros, así como un tipo dominante dual, mejorando simultáneamente la precisión y la interpretabilidad.
Métodos de Regresión Tradicionales: Asumen relaciones numéricas exactas y claras, dificultando el manejo de incertidumbre
Métodos de Aprendizaje Profundo: Carecen de interpretabilidad, contienen numerosos parámetros y no son adecuados para entrenar con conjuntos de datos pequeños
Sistemas Difusos Mamdani: Fuerte interpretabilidad pero precisión limitada; la partición de grano grueso resulta en rendimiento reducido
Sistemas Difusos TSK: Alta precisión pero falta de interpretabilidad, contradiciendo el propósito de usar sistemas difusos
Desarrollar un marco híbrido que mantenga la interpretabilidad del sistema Mamdani mientras logra la precisión del sistema TSK, proporcionando una herramienta equilibrada y versátil para modelado predictivo.
Estructura de Reglas Híbrida: Propone un nuevo sistema de regresión difusa que combina la interpretabilidad lingüística del sistema Mamdani con la precisión numérica del modelo TSK
Mecanismo de Dominancia Dual: Introduce dos métodos de cálculo de pesos de reglas—dominancia basada en soporte/confianza difusa y dominancia basada en error
Componente TSK Restringido: Las salidas de funciones TSK se restringen dentro de los límites del conjunto difuso correspondiente, manteniendo interpretabilidad
Conjuntos Difusos de Tipo-2 Intervalar: Utiliza conjuntos difusos de tipo-2 intervalar para manejar mejor la incertidumbre
Optimización ACO: Emplea algoritmo de optimización por colonia de hormigas para selección de subconjuntos de reglas, equilibrando compacidad del modelo y precisión
Dado un conjunto de variables de entrada x1,x2,...,xn y una variable de salida continua y, el objetivo es construir un modelo de regresión que sea tanto preciso como interpretable, capaz de manejar incertidumbre y ambigüedad en los datos.
En comparación con trabajos existentes, el método propuesto mejora significativamente la precisión mientras mantiene interpretabilidad, resolviendo el problema de compensación entre precisión e interpretabilidad en métodos tradicionales.
El artículo cita literatura importante en los campos de sistemas difusos, algoritmos evolutivos y aprendizaje automático, incluyendo trabajos fundamentales de Zadeh sobre lógica difusa, sistemas difusos clásicos de Mamdani y TSK, así como investigaciones recientes en sistemas difusos genéticos y conjuntos difusos de tipo-2 intervalar.
Evaluación General: Este es un artículo académico de alta calidad que propone un método innovador de sistema difuso híbrido, mejorando significativamente la precisión de regresión mientras mantiene interpretabilidad. El diseño del método es razonable, la validación experimental es suficiente y tiene valor de contribución importante para los campos de sistemas difusos e IA interpretable.