2025-11-14T07:52:11.150813

Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis

Bhatia, de Amorim, De Feo
Regression analysis is employed to examine and quantify the relationships between input variables and a dependent and continuous output variable. It is widely used for predictive modelling in fields such as finance, healthcare, and engineering. However, traditional methods often struggle with real-world data complexities, including uncertainty and ambiguity. While deep learning approaches excel at capturing complex non-linear relationships, they lack interpretability and risk over-fitting on small datasets. Fuzzy systems provide an alternative framework for handling uncertainty and imprecision, with Mamdani and Takagi-Sugeno-Kang (TSK) systems offering complementary strengths: interpretability versus accuracy. This paper presents a novel fuzzy regression method that combines the interpretability of Mamdani systems with the precision of TSK models. The proposed approach introduces a hybrid rule structure with fuzzy and crisp components and dual dominance types, enhancing both accuracy and explainability. Evaluations on benchmark datasets demonstrate state-of-the-art performance in several cases, with rules maintaining a component similar to traditional Mamdani systems while improving precision through improved rule outputs. This hybrid methodology offers a balanced and versatile tool for predictive modelling, addressing the trade-off between interpretability and accuracy inherent in fuzzy systems. In the 6 datasets tested, the proposed approach gave the best fuzzy methodology score in 4 datasets, out-performed the opaque models in 2 datasets and produced the best overall score in 1 dataset with the improvements in RMSE ranging from 0.4% to 19%.
academic

Sistema Difuso Híbrido Mamdani-TSK de Tipo-2 Intervalar para Análisis de Regresión

Información Básica

  • ID del Artículo: 2510.13437
  • Título: Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis
  • Autores: Ashish Bhatia, Renato Cordeiro de Amorim, Vito De Feo (Universidad de Essex, Reino Unido)
  • Clasificación: cs.LG (Aprendizaje Automático)
  • Fecha de Publicación: 15 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.13437v1

Resumen

El análisis de regresión se aplica ampliamente en modelado predictivo en finanzas, medicina e ingeniería para examinar y cuantificar las relaciones entre variables de entrada y variables de salida continuas. Sin embargo, los métodos tradicionales frecuentemente enfrentan dificultades al tratar la complejidad de datos del mundo real, incluyendo incertidumbre y ambigüedad. Aunque los métodos de aprendizaje profundo destacan en capturar relaciones no lineales complejas, carecen de interpretabilidad y presentan riesgo de sobreajuste en conjuntos de datos pequeños. Los sistemas difusos proporcionan un marco alternativo para manejar incertidumbre e imprecisión, donde los sistemas Mamdani y Takagi-Sugeno-Kang (TSK) ofrecen ventajas complementarias: interpretabilidad versus precisión. Este artículo propone un nuevo método de regresión difusa que combina la interpretabilidad del sistema Mamdani con la precisión del modelo TSK. El método introduce una estructura de reglas híbrida con componentes difusos y claros, así como un tipo dominante dual, mejorando simultáneamente la precisión y la interpretabilidad.

Antecedentes de Investigación y Motivación

Definición del Problema

Los principales desafíos que enfrentan los métodos de regresión tradicionales al procesar datos del mundo real:

  1. Incertidumbre y Ambigüedad: Incertidumbre inherente e información lingüística presente en datos reales
  2. Compensación entre Interpretabilidad y Precisión: Los modelos de aprendizaje profundo, aunque precisos, carecen de interpretabilidad
  3. Problema de Conjuntos de Datos Pequeños: Los modelos complejos tienden a sobreajustarse cuando se entrenan con conjuntos de datos pequeños

Limitaciones de Métodos Existentes

  • Métodos de Regresión Tradicionales: Asumen relaciones numéricas exactas y claras, dificultando el manejo de incertidumbre
  • Métodos de Aprendizaje Profundo: Carecen de interpretabilidad, contienen numerosos parámetros y no son adecuados para entrenar con conjuntos de datos pequeños
  • Sistemas Difusos Mamdani: Fuerte interpretabilidad pero precisión limitada; la partición de grano grueso resulta en rendimiento reducido
  • Sistemas Difusos TSK: Alta precisión pero falta de interpretabilidad, contradiciendo el propósito de usar sistemas difusos

Motivación de la Investigación

Desarrollar un marco híbrido que mantenga la interpretabilidad del sistema Mamdani mientras logra la precisión del sistema TSK, proporcionando una herramienta equilibrada y versátil para modelado predictivo.

Contribuciones Principales

  1. Estructura de Reglas Híbrida: Propone un nuevo sistema de regresión difusa que combina la interpretabilidad lingüística del sistema Mamdani con la precisión numérica del modelo TSK
  2. Mecanismo de Dominancia Dual: Introduce dos métodos de cálculo de pesos de reglas—dominancia basada en soporte/confianza difusa y dominancia basada en error
  3. Componente TSK Restringido: Las salidas de funciones TSK se restringen dentro de los límites del conjunto difuso correspondiente, manteniendo interpretabilidad
  4. Conjuntos Difusos de Tipo-2 Intervalar: Utiliza conjuntos difusos de tipo-2 intervalar para manejar mejor la incertidumbre
  5. Optimización ACO: Emplea algoritmo de optimización por colonia de hormigas para selección de subconjuntos de reglas, equilibrando compacidad del modelo y precisión

Detalles del Método

Definición de la Tarea

Dado un conjunto de variables de entrada x1,x2,...,xnx_1, x_2, ..., x_n y una variable de salida continua yy, el objetivo es construir un modelo de regresión que sea tanto preciso como interpretable, capaz de manejar incertidumbre y ambigüedad en los datos.

Arquitectura del Modelo

1. Difusificación con Conjuntos Difusos de Tipo-2 Intervalar

Las entradas y salidas se difusifican utilizando conjuntos difusos de tipo-2 intervalar:

F~=xX[u[μ(x),μ(x)]1/u]/x\tilde{F} = \int_{x \in X} \left[ \int_{u \in [\underline{\mu}(x), \overline{\mu}(x)]} 1/u \right] /x

donde μ(x)\underline{\mu}(x) y μ(x)\overline{\mu}(x) son los grados de pertenencia inferior y superior, respectivamente.

2. Estructura de Reglas Híbrida

Cada regla contiene dos componentes de consecuente:

Forma de Regla:

SI x1 es F1 Y ... Y xn es Fn 
ENTONCES (y es G, y = f(x1, x2, ..., xn))
  • Componente Difuso: Consecuente Mamdani tradicional que apunta a un conjunto difuso de salida
  • Componente de Función TSK: Función polinomial de n-ésimo orden que proporciona un valor de salida claro

Restricción de Función TSK: ysalida[LıˊmiteInferior(Fsuperior),LıˊmiteSuperior(Fsuperior)]y_{salida} \in [LímiteInferior(F_{superior}), LímiteSuperior(F_{superior})]

Asegura que la salida TSK siempre permanezca dentro de los límites del conjunto difuso correspondiente.

3. Mecanismo de Pesos Dual

Pesos de Reglas Difusas:

  • Soporte: Soporte(AjC~j)=1Np=1NμAj(xp)μCj(yp)Soporte(A_j \to \tilde{C}_j) = \frac{1}{|N|} \sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)
  • Confianza: Confianza(AjC~j)=p=1NμAj(xp)μCj(yp)p=1NμAj(xp)Confianza(A_j \to \tilde{C}_j) = \frac{\sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)}{\sum_{p=1}^N \mu_{A_j}(x_p)}
  • Dominancia: D=[SRegla_inferiorCinferior,SRegla_superiorCsuperior]D = [S_{Regla\_inferior} \cdot C_{inferior}, S_{Regla\_superior} \cdot C_{superior}]

Dominancia Basada en Error: Dominanciari=11+riDominancia_{ri} = \frac{1}{1 + r_i} donde rir_i es el RMSE de la i-ésima regla.

4. Selección de Reglas ACO

Utiliza algoritmo de optimización por colonia de hormigas para seleccionar el subconjunto óptimo de reglas:

  • Cada hormiga construye una solución de subconjunto de reglas
  • La calidad de la solución se evalúa basándose en rendimiento RMSE
  • Mecanismo de actualización de feromona guía el proceso de búsqueda
  • Equilibra compacidad del modelo y precisión predictiva

5. Desfusificación

Utiliza el método de promedio ponderado TSK para calcular la salida final: yfinal=i=1Mωiyii=1Mωiy_{final} = \frac{\sum_{i=1}^M \omega_i y_i}{\sum_{i=1}^M \omega_i}

Puntos de Innovación Técnica

  1. Componente TSK Restringido: A diferencia del TSK tradicional, la salida de función se limita dentro de los límites del conjunto difuso
  2. Entrenamiento de Subconjuntos: Las funciones TSK se entrenan únicamente en muestras de entrenamiento con intensidad de activación positiva
  3. Mecanismo de Dominancia Dual: Combina lógica difusa y precisión numérica en el cálculo de pesos
  4. Preservación de Interpretabilidad: La forma de regla es similar a sistemas Mamdani tradicionales, pero con mayor precisión

Configuración Experimental

Conjuntos de Datos

Se utilizan 6 conjuntos de datos de referencia del repositorio KEEL:

  1. Concrete Compressive Strength: 1030 instancias, 8 variables de entrada
  2. Diabetes: 768 registros, 2 atributos de entrada
  3. ELE-2: 11,105 instancias, 4 variables predictoras
  4. Mortgage: 1045 instancias, 14 variables
  5. Treasury: 956 registros, 16 atributos financieros
  6. Wankara: 1609 registros, 4 variables de entrada

Métricas de Evaluación

  • RMSE (Error Cuadrático Medio Raíz): Métrica de evaluación principal
  • Métricas de Interpretabilidad: Cobertura de reglas, número de reglas activas, características de la base de reglas, robustez

Métodos de Comparación

  • MP: Perceptrón Multicapa
  • SMOreg: Optimización Mínima Secuencial
  • WM: Algoritmo de Wang y Mendel
  • CHV: Algoritmo de Cordon, Herrera y Villar
  • GLD-WM: Parámetros Laterales Globales + Base de Reglas WM

Variantes del Modelo

  • HIT2-MTSK-D2: Función TSK de 2do orden
  • HIT2-MTSK-D3: Función TSK de 3er orden

Resultados Experimentales

Resultados Principales

En los 6 conjuntos de datos:

  • 4 conjuntos de datos logran la mejor puntuación de método difuso
  • 2 conjuntos de datos superan modelos no transparentes
  • 1 conjunto de datos logra la mejor puntuación general
  • Rango de mejora RMSE: 0.4% - 19%

Rendimiento Específico:

  • Concrete: HIT2-MTSK-D3 alcanza 7.29 RMSE, mejor rendimiento general
  • Mortgage: HIT2-MTSK-D3 alcanza 0.13 RMSE, mejor método difuso
  • Treasury: HIT2-MTSK-D3 alcanza 0.27 RMSE, mejor método difuso
  • Wankara: Ambas variantes alcanzan 1.58 RMSE, igualando rendimiento de SMOreg

Análisis de Caso: Predicción de Precios de Vivienda en California

Rendimiento en el conjunto de datos de vivienda de California:

  • Conjunto de Datos: 20,640 observaciones, 8 características
  • RMSE HIT2-MTSK: 0.695
  • RMSE Mamdani FRBS: 0.751
  • Número de Reglas: 75 reglas
  • Cobertura: 100% de instancias de prueba activan al menos una regla

Evaluación de Interpretabilidad

  • Cobertura de Categoría: Cubre el 96% del rango de datos de prueba real
  • Reglas Activas: Promedio de 8.38 reglas activadas con umbral 0.15
  • Características de Reglas: 75 reglas, promedio de 2.67 antecedentes
  • Robustez al Ruido: Cambio de predicción del 12.24% con nivel de ruido del 10%

Trabajo Relacionado

Desarrollo de Sistemas de Reglas Difusas

  • Método Wang-Mendel: Generación de reglas impulsada por datos de temprana etapa
  • Sistemas Difusos Genéticos (GFS): Integración de algoritmos genéticos para optimización de aprendizaje de reglas
  • Aplicación de Algoritmos Evolutivos: Optimización de base de conocimiento, base de reglas y base de datos

Métodos Híbridos

  • Métodos Gr-MF y GA-WM: Combinación de optimización de base de reglas y base de datos
  • Método GA-COR: Integración de algoritmo genético con marco COR
  • Método WM+GL: Uso de 2-tuplas lingüísticas para ajuste lateral

Ventajas del Presente Trabajo

En comparación con trabajos existentes, el método propuesto mejora significativamente la precisión mientras mantiene interpretabilidad, resolviendo el problema de compensación entre precisión e interpretabilidad en métodos tradicionales.

Conclusiones y Discusión

Conclusiones Principales

  1. Equilibrio Efectivo: Logra exitosamente equilibrar la compensación entre interpretabilidad y precisión en sistemas difusos
  2. Mejora Significativa: Logra rendimiento óptimo o cercano al óptimo en la mayoría de conjuntos de datos de referencia
  3. Preservación de Interpretabilidad: La forma de regla es similar a sistemas Mamdani tradicionales, fácil de entender
  4. Robustez Fuerte: Rendimiento consistente en diferentes dominios y conjuntos de datos

Limitaciones

  1. Compensación de Complejidad: Las funciones TSK de orden superior pueden conducir a sobreajuste
  2. Espacio de Optimización: Existe espacio para mejora de rendimiento en algunos conjuntos de datos
  3. Complejidad Computacional: La optimización ACO aumenta el costo computacional
  4. Sensibilidad de Parámetros: Requiere configuración razonable del número de conjuntos difusos y orden de función TSK

Direcciones Futuras

  1. Mejora de Optimización: Explorar otras técnicas de optimización metaheurística
  2. Adaptación de Dominio: Preprocesamiento y selección de características específicos del dominio
  3. Evaluación Extendida: Validación con más conjuntos de datos e indicadores de evaluación
  4. Análisis Teórico: Análisis profundo de convergencia y complejidad

Evaluación Profunda

Fortalezas

  1. Fuerte Innovación: Propone por primera vez un sistema difuso híbrido con componente TSK restringido
  2. Alto Valor Práctico: Resuelve problemas clave en aplicaciones prácticas
  3. Experimentación Suficiente: Validación en múltiples conjuntos de datos de referencia, incluyendo análisis detallado de interpretabilidad
  4. Método Razonable: Diseño técnico con lógica clara y base teórica sólida

Insuficiencias

  1. Análisis Teórico Limitado: Carece de garantías teóricas de convergencia y complejidad
  2. Orientación en Selección de Parámetros: No proporciona estrategia sistemática de selección de parámetros
  3. Eficiencia Computacional: Análisis de complejidad computacional de optimización ACO insuficiente
  4. Límites de Aplicabilidad: Discusión limitada sobre condiciones de aplicabilidad del método

Impacto

  1. Contribución Académica: Proporciona nueva dirección de investigación para el campo de sistemas difusos
  2. Valor Práctico: Tiene importante valor de aplicación en escenarios que requieren IA interpretable
  3. Reproducibilidad: Descripción detallada del método, facilitando reproducción y extensión

Escenarios de Aplicación

  1. Evaluación de Riesgo Financiero: Requiere modelos predictivos interpretables
  2. Diagnóstico Médico: Requiere procesos de decisión transparentes
  3. Control de Ingeniería: Requiere aplicaciones de control que comprendan el comportamiento del sistema
  4. Regresión en Conjuntos de Datos Pequeños: Escenarios donde métodos tradicionales de aprendizaje profundo no son aplicables

Referencias Bibliográficas

El artículo cita literatura importante en los campos de sistemas difusos, algoritmos evolutivos y aprendizaje automático, incluyendo trabajos fundamentales de Zadeh sobre lógica difusa, sistemas difusos clásicos de Mamdani y TSK, así como investigaciones recientes en sistemas difusos genéticos y conjuntos difusos de tipo-2 intervalar.


Evaluación General: Este es un artículo académico de alta calidad que propone un método innovador de sistema difuso híbrido, mejorando significativamente la precisión de regresión mientras mantiene interpretabilidad. El diseño del método es razonable, la validación experimental es suficiente y tiene valor de contribución importante para los campos de sistemas difusos e IA interpretable.