2025-11-14T07:52:11.150813

Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis

Bhatia, de Amorim, De Feo

Regression analysis is employed to examine and quantify the relationships between input variables and a dependent and continuous output variable. It is widely used for predictive modelling in fields such as finance, healthcare, and engineering. However, traditional methods often struggle with real-world data complexities, including uncertainty and ambiguity. While deep learning approaches excel at capturing complex non-linear relationships, they lack interpretability and risk over-fitting on small datasets. Fuzzy systems provide an alternative framework for handling uncertainty and imprecision, with Mamdani and Takagi-Sugeno-Kang (TSK) systems offering complementary strengths: interpretability versus accuracy. This paper presents a novel fuzzy regression method that combines the interpretability of Mamdani systems with the precision of TSK models. The proposed approach introduces a hybrid rule structure with fuzzy and crisp components and dual dominance types, enhancing both accuracy and explainability. Evaluations on benchmark datasets demonstrate state-of-the-art performance in several cases, with rules maintaining a component similar to traditional Mamdani systems while improving precision through improved rule outputs. This hybrid methodology offers a balanced and versatile tool for predictive modelling, addressing the trade-off between interpretability and accuracy inherent in fuzzy systems. In the 6 datasets tested, the proposed approach gave the best fuzzy methodology score in 4 datasets, out-performed the opaque models in 2 datasets and produced the best overall score in 1 dataset with the improvements in RMSE ranging from 0.4% to 19%.

academic

Sistema Difuso Híbrido Mamdani-TSK de Tipo-2 Intervalar para Análisis de Regresión

Información Básica

ID del Artículo: 2510.13437
Título: Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis
Autores: Ashish Bhatia, Renato Cordeiro de Amorim, Vito De Feo (Universidad de Essex, Reino Unido)
Clasificación: cs.LG (Aprendizaje Automático)
Fecha de Publicación: 15 de octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2510.13437v1

Resumen

El análisis de regresión se aplica ampliamente en modelado predictivo en finanzas, medicina e ingeniería para examinar y cuantificar las relaciones entre variables de entrada y variables de salida continuas. Sin embargo, los métodos tradicionales frecuentemente enfrentan dificultades al tratar la complejidad de datos del mundo real, incluyendo incertidumbre y ambigüedad. Aunque los métodos de aprendizaje profundo destacan en capturar relaciones no lineales complejas, carecen de interpretabilidad y presentan riesgo de sobreajuste en conjuntos de datos pequeños. Los sistemas difusos proporcionan un marco alternativo para manejar incertidumbre e imprecisión, donde los sistemas Mamdani y Takagi-Sugeno-Kang (TSK) ofrecen ventajas complementarias: interpretabilidad versus precisión. Este artículo propone un nuevo método de regresión difusa que combina la interpretabilidad del sistema Mamdani con la precisión del modelo TSK. El método introduce una estructura de reglas híbrida con componentes difusos y claros, así como un tipo dominante dual, mejorando simultáneamente la precisión y la interpretabilidad.

Antecedentes de Investigación y Motivación

Definición del Problema

Los principales desafíos que enfrentan los métodos de regresión tradicionales al procesar datos del mundo real:

Incertidumbre y Ambigüedad: Incertidumbre inherente e información lingüística presente en datos reales
Compensación entre Interpretabilidad y Precisión: Los modelos de aprendizaje profundo, aunque precisos, carecen de interpretabilidad
Problema de Conjuntos de Datos Pequeños: Los modelos complejos tienden a sobreajustarse cuando se entrenan con conjuntos de datos pequeños

Limitaciones de Métodos Existentes

Métodos de Regresión Tradicionales: Asumen relaciones numéricas exactas y claras, dificultando el manejo de incertidumbre
Métodos de Aprendizaje Profundo: Carecen de interpretabilidad, contienen numerosos parámetros y no son adecuados para entrenar con conjuntos de datos pequeños
Sistemas Difusos Mamdani: Fuerte interpretabilidad pero precisión limitada; la partición de grano grueso resulta en rendimiento reducido
Sistemas Difusos TSK: Alta precisión pero falta de interpretabilidad, contradiciendo el propósito de usar sistemas difusos

Motivación de la Investigación

Desarrollar un marco híbrido que mantenga la interpretabilidad del sistema Mamdani mientras logra la precisión del sistema TSK, proporcionando una herramienta equilibrada y versátil para modelado predictivo.

Contribuciones Principales

Estructura de Reglas Híbrida: Propone un nuevo sistema de regresión difusa que combina la interpretabilidad lingüística del sistema Mamdani con la precisión numérica del modelo TSK
Mecanismo de Dominancia Dual: Introduce dos métodos de cálculo de pesos de reglas—dominancia basada en soporte/confianza difusa y dominancia basada en error
Componente TSK Restringido: Las salidas de funciones TSK se restringen dentro de los límites del conjunto difuso correspondiente, manteniendo interpretabilidad
Conjuntos Difusos de Tipo-2 Intervalar: Utiliza conjuntos difusos de tipo-2 intervalar para manejar mejor la incertidumbre
Optimización ACO: Emplea algoritmo de optimización por colonia de hormigas para selección de subconjuntos de reglas, equilibrando compacidad del modelo y precisión

Detalles del Método

Definición de la Tarea

Dado un conjunto de variables de entrada $x_1, x_2, ..., x_n$ y una variable de salida continua $y$ , el objetivo es construir un modelo de regresión que sea tanto preciso como interpretable, capaz de manejar incertidumbre y ambigüedad en los datos.

Arquitectura del Modelo

1. Difusificación con Conjuntos Difusos de Tipo-2 Intervalar

Las entradas y salidas se difusifican utilizando conjuntos difusos de tipo-2 intervalar:

$\tilde{F} = \int_{x \in X} \left[ \int_{u \in [\underline{\mu}(x), \overline{\mu}(x)]} 1/u \right] /x$

donde $\underline{\mu}(x)$ y $\overline{\mu}(x)$ son los grados de pertenencia inferior y superior, respectivamente.

2. Estructura de Reglas Híbrida

Cada regla contiene dos componentes de consecuente:

Forma de Regla:

SI x1 es F1 Y ... Y xn es Fn 
ENTONCES (y es G, y = f(x1, x2, ..., xn))

Componente Difuso: Consecuente Mamdani tradicional que apunta a un conjunto difuso de salida
Componente de Función TSK: Función polinomial de n-ésimo orden que proporciona un valor de salida claro

Restricción de Función TSK: $y_{salida} \in [LímiteInferior(F_{superior}), LímiteSuperior(F_{superior})]$

Asegura que la salida TSK siempre permanezca dentro de los límites del conjunto difuso correspondiente.

3. Mecanismo de Pesos Dual

Pesos de Reglas Difusas:

Soporte: $Soporte(A_j \to \tilde{C}_j) = \frac{1}{|N|} \sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)$
Confianza: $Confianza(A_j \to \tilde{C}_j) = \frac{\sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)}{\sum_{p=1}^N \mu_{A_j}(x_p)}$
Dominancia: $D = [S_{Regla\_inferior} \cdot C_{inferior}, S_{Regla\_superior} \cdot C_{superior}]$

Dominancia Basada en Error: $Dominancia_{ri} = \frac{1}{1 + r_i}$ donde $r_i$ es el RMSE de la i-ésima regla.

4. Selección de Reglas ACO

Utiliza algoritmo de optimización por colonia de hormigas para seleccionar el subconjunto óptimo de reglas:

Cada hormiga construye una solución de subconjunto de reglas
La calidad de la solución se evalúa basándose en rendimiento RMSE
Mecanismo de actualización de feromona guía el proceso de búsqueda
Equilibra compacidad del modelo y precisión predictiva

5. Desfusificación

Utiliza el método de promedio ponderado TSK para calcular la salida final: $y_{final} = \frac{\sum_{i=1}^M \omega_i y_i}{\sum_{i=1}^M \omega_i}$

Puntos de Innovación Técnica

Componente TSK Restringido: A diferencia del TSK tradicional, la salida de función se limita dentro de los límites del conjunto difuso
Entrenamiento de Subconjuntos: Las funciones TSK se entrenan únicamente en muestras de entrenamiento con intensidad de activación positiva
Mecanismo de Dominancia Dual: Combina lógica difusa y precisión numérica en el cálculo de pesos
Preservación de Interpretabilidad: La forma de regla es similar a sistemas Mamdani tradicionales, pero con mayor precisión

Configuración Experimental

Conjuntos de Datos

Se utilizan 6 conjuntos de datos de referencia del repositorio KEEL:

Concrete Compressive Strength: 1030 instancias, 8 variables de entrada
Diabetes: 768 registros, 2 atributos de entrada
ELE-2: 11,105 instancias, 4 variables predictoras
Mortgage: 1045 instancias, 14 variables
Treasury: 956 registros, 16 atributos financieros
Wankara: 1609 registros, 4 variables de entrada

Métricas de Evaluación

RMSE (Error Cuadrático Medio Raíz): Métrica de evaluación principal
Métricas de Interpretabilidad: Cobertura de reglas, número de reglas activas, características de la base de reglas, robustez

Métodos de Comparación

MP: Perceptrón Multicapa
SMOreg: Optimización Mínima Secuencial
WM: Algoritmo de Wang y Mendel
CHV: Algoritmo de Cordon, Herrera y Villar
GLD-WM: Parámetros Laterales Globales + Base de Reglas WM

Variantes del Modelo

HIT2-MTSK-D2: Función TSK de 2do orden
HIT2-MTSK-D3: Función TSK de 3er orden

Resultados Experimentales

Resultados Principales

En los 6 conjuntos de datos:

4 conjuntos de datos logran la mejor puntuación de método difuso
2 conjuntos de datos superan modelos no transparentes
1 conjunto de datos logra la mejor puntuación general
Rango de mejora RMSE: 0.4% - 19%

Rendimiento Específico:

Concrete: HIT2-MTSK-D3 alcanza 7.29 RMSE, mejor rendimiento general
Mortgage: HIT2-MTSK-D3 alcanza 0.13 RMSE, mejor método difuso
Treasury: HIT2-MTSK-D3 alcanza 0.27 RMSE, mejor método difuso
Wankara: Ambas variantes alcanzan 1.58 RMSE, igualando rendimiento de SMOreg

Análisis de Caso: Predicción de Precios de Vivienda en California

Rendimiento en el conjunto de datos de vivienda de California:

Conjunto de Datos: 20,640 observaciones, 8 características
RMSE HIT2-MTSK: 0.695
RMSE Mamdani FRBS: 0.751
Número de Reglas: 75 reglas
Cobertura: 100% de instancias de prueba activan al menos una regla

Evaluación de Interpretabilidad

Cobertura de Categoría: Cubre el 96% del rango de datos de prueba real
Reglas Activas: Promedio de 8.38 reglas activadas con umbral 0.15
Características de Reglas: 75 reglas, promedio de 2.67 antecedentes
Robustez al Ruido: Cambio de predicción del 12.24% con nivel de ruido del 10%

Trabajo Relacionado

Desarrollo de Sistemas de Reglas Difusas

Método Wang-Mendel: Generación de reglas impulsada por datos de temprana etapa
Sistemas Difusos Genéticos (GFS): Integración de algoritmos genéticos para optimización de aprendizaje de reglas
Aplicación de Algoritmos Evolutivos: Optimización de base de conocimiento, base de reglas y base de datos

Métodos Híbridos

Métodos Gr-MF y GA-WM: Combinación de optimización de base de reglas y base de datos
Método GA-COR: Integración de algoritmo genético con marco COR
Método WM+GL: Uso de 2-tuplas lingüísticas para ajuste lateral

Ventajas del Presente Trabajo

En comparación con trabajos existentes, el método propuesto mejora significativamente la precisión mientras mantiene interpretabilidad, resolviendo el problema de compensación entre precisión e interpretabilidad en métodos tradicionales.

Conclusiones y Discusión

Conclusiones Principales

Equilibrio Efectivo: Logra exitosamente equilibrar la compensación entre interpretabilidad y precisión en sistemas difusos
Mejora Significativa: Logra rendimiento óptimo o cercano al óptimo en la mayoría de conjuntos de datos de referencia
Preservación de Interpretabilidad: La forma de regla es similar a sistemas Mamdani tradicionales, fácil de entender
Robustez Fuerte: Rendimiento consistente en diferentes dominios y conjuntos de datos

Limitaciones

Compensación de Complejidad: Las funciones TSK de orden superior pueden conducir a sobreajuste
Espacio de Optimización: Existe espacio para mejora de rendimiento en algunos conjuntos de datos
Complejidad Computacional: La optimización ACO aumenta el costo computacional
Sensibilidad de Parámetros: Requiere configuración razonable del número de conjuntos difusos y orden de función TSK

Direcciones Futuras

Mejora de Optimización: Explorar otras técnicas de optimización metaheurística
Adaptación de Dominio: Preprocesamiento y selección de características específicos del dominio
Evaluación Extendida: Validación con más conjuntos de datos e indicadores de evaluación
Análisis Teórico: Análisis profundo de convergencia y complejidad

Evaluación Profunda

Fortalezas

Fuerte Innovación: Propone por primera vez un sistema difuso híbrido con componente TSK restringido
Alto Valor Práctico: Resuelve problemas clave en aplicaciones prácticas
Experimentación Suficiente: Validación en múltiples conjuntos de datos de referencia, incluyendo análisis detallado de interpretabilidad
Método Razonable: Diseño técnico con lógica clara y base teórica sólida

Insuficiencias

Análisis Teórico Limitado: Carece de garantías teóricas de convergencia y complejidad
Orientación en Selección de Parámetros: No proporciona estrategia sistemática de selección de parámetros
Eficiencia Computacional: Análisis de complejidad computacional de optimización ACO insuficiente
Límites de Aplicabilidad: Discusión limitada sobre condiciones de aplicabilidad del método

Impacto

Contribución Académica: Proporciona nueva dirección de investigación para el campo de sistemas difusos
Valor Práctico: Tiene importante valor de aplicación en escenarios que requieren IA interpretable
Reproducibilidad: Descripción detallada del método, facilitando reproducción y extensión

Escenarios de Aplicación

Evaluación de Riesgo Financiero: Requiere modelos predictivos interpretables
Diagnóstico Médico: Requiere procesos de decisión transparentes
Control de Ingeniería: Requiere aplicaciones de control que comprendan el comportamiento del sistema
Regresión en Conjuntos de Datos Pequeños: Escenarios donde métodos tradicionales de aprendizaje profundo no son aplicables

Referencias Bibliográficas

El artículo cita literatura importante en los campos de sistemas difusos, algoritmos evolutivos y aprendizaje automático, incluyendo trabajos fundamentales de Zadeh sobre lógica difusa, sistemas difusos clásicos de Mamdani y TSK, así como investigaciones recientes en sistemas difusos genéticos y conjuntos difusos de tipo-2 intervalar.

Evaluación General: Este es un artículo académico de alta calidad que propone un método innovador de sistema difuso híbrido, mejorando significativamente la precisión de regresión mientras mantiene interpretabilidad. El diseño del método es razonable, la validación experimental es suficiente y tiene valor de contribución importante para los campos de sistemas difusos e IA interpretable.