2025-11-14T07:52:11.150813

Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis

Bhatia, de Amorim, De Feo
Regression analysis is employed to examine and quantify the relationships between input variables and a dependent and continuous output variable. It is widely used for predictive modelling in fields such as finance, healthcare, and engineering. However, traditional methods often struggle with real-world data complexities, including uncertainty and ambiguity. While deep learning approaches excel at capturing complex non-linear relationships, they lack interpretability and risk over-fitting on small datasets. Fuzzy systems provide an alternative framework for handling uncertainty and imprecision, with Mamdani and Takagi-Sugeno-Kang (TSK) systems offering complementary strengths: interpretability versus accuracy. This paper presents a novel fuzzy regression method that combines the interpretability of Mamdani systems with the precision of TSK models. The proposed approach introduces a hybrid rule structure with fuzzy and crisp components and dual dominance types, enhancing both accuracy and explainability. Evaluations on benchmark datasets demonstrate state-of-the-art performance in several cases, with rules maintaining a component similar to traditional Mamdani systems while improving precision through improved rule outputs. This hybrid methodology offers a balanced and versatile tool for predictive modelling, addressing the trade-off between interpretability and accuracy inherent in fuzzy systems. In the 6 datasets tested, the proposed approach gave the best fuzzy methodology score in 4 datasets, out-performed the opaque models in 2 datasets and produced the best overall score in 1 dataset with the improvements in RMSE ranging from 0.4% to 19%.
academic

نظام مامداني-تسك الضبابي من النوع الثاني الهجين لتحليل الانحدار

المعلومات الأساسية

  • معرّف الورقة: 2510.13437
  • العنوان: نظام مامداني-تسك الضبابي من النوع الثاني الهجين لتحليل الانحدار
  • المؤلفون: أشيش بهاتيا، رينيتو كوردييرو دي أموريم، فيتو دي فيو (جامعة إسيكس، المملكة المتحدة)
  • التصنيف: cs.LG (التعلم الآلي)
  • تاريخ النشر: 15 أكتوبر 2025
  • رابط الورقة: https://arxiv.org/abs/2510.13437v1

الملخص

يُستخدم تحليل الانحدار على نطاق واسع في النمذجة التنبؤية في المجالات المالية والطبية والهندسية، لفحص وتحديد العلاقات بين متغيرات الإدخال والمتغيرات الإخراج المستمرة. ومع ذلك، غالباً ما تواجه الطرق التقليدية صعوبات في التعامل مع تعقيد البيانات الحقيقية، بما في ذلك عدم اليقين والغموض. بينما تتفوق طرق التعلم العميق في التقاط العلاقات غير الخطية المعقدة، إلا أنها تفتقر إلى القابلية للتفسير وتواجه خطر الإفراط في التدريب على مجموعات البيانات الصغيرة. توفر الأنظمة الضبابية إطار عمل بديل للتعامل مع عدم اليقين وعدم الدقة، حيث توفر أنظمة مامداني وتاكاجي-سوجينو-كانج (تسك) مزايا متكاملة: القابلية للتفسير والدقة. تقترح هذه الورقة طريقة ضبابية جديدة للانحدار تجمع بين قابلية تفسير نظام مامداني ودقة نموذج تسك. تقدم الطريقة بنية قاعدة هجينة بمكونات ضبابية وواضحة وذات نوع مهيمن مزدوج، مع تعزيز الدقة والقابلية للتفسير.

خلفية البحث والدافع

تعريف المشكلة

التحديات الرئيسية التي تواجهها طرق الانحدار التقليدية عند التعامل مع البيانات الحقيقية:

  1. عدم اليقين والغموض: عدم اليقين الكامن والمعلومات اللغوية الموجودة في البيانات الحقيقية
  2. المقايضة بين القابلية للتفسير والدقة: نماذج التعلم العميق دقيقة لكنها تفتقر إلى القابلية للتفسير
  3. مشكلة مجموعات البيانات الصغيرة: النماذج المعقدة عرضة للإفراط في التدريب على مجموعات البيانات الصغيرة

قيود الطرق الموجودة

  • طرق الانحدار التقليدية: تفترض علاقات عددية دقيقة وواضحة، يصعب التعامل مع عدم اليقين
  • طرق التعلم العميق: تفتقر إلى القابلية للتفسير، معاملات عديدة، غير مناسبة لتدريب مجموعات البيانات الصغيرة
  • أنظمة مامداني الضبابية: قابلية تفسير قوية لكن دقة محدودة، التقسيم الخشن يؤدي إلى انخفاض الأداء
  • أنظمة تسك الضبابية: دقة عالية لكن تفتقر إلى القابلية للتفسير، تتعارض مع الغرض من استخدام الأنظمة الضبابية

دافع البحث

تطوير إطار عمل هجين يحافظ على قابلية تفسير نظام مامداني بينما يحقق دقة نظام تسك، مما يوفر أداة متوازنة ومتعددة الاستخدامات للنمذجة التنبؤية.

المساهمات الأساسية

  1. بنية القاعدة الهجينة: تقترح نظام انحدار ضبابي جديد يجمع بين القابلية للتفسير اللغوية لنظام مامداني والدقة العددية لنموذج تسك
  2. آلية الهيمنة المزدوجة: تقدم طريقتين لحساب أوزان القاعدة - الهيمنة القائمة على الدعم/الثقة والهيمنة القائمة على الخطأ
  3. مكون تسك المقيد: يتم تقييد مخرجات دالة تسك ضمن حدود المجموعة الضبابية المقابلة، مما يحافظ على القابلية للتفسير
  4. مجموعات ضبابية من النوع الثاني الفاصلة: استخدام مجموعات ضبابية من النوع الثاني الفاصلة للتعامل بشكل أفضل مع عدم اليقين
  5. تحسين ACO: استخدام خوارزمية تحسين مستعمرة النمل لاختيار مجموعة فرعية من القواعد، موازنة بين الإحكام والدقة

شرح الطريقة

تعريف المهمة

بالنظر إلى متغيرات الإدخال x1,x2,...,xnx_1, x_2, ..., x_n والمتغير الإخراج المستمر yy، الهدف هو بناء نموذج انحدار دقيق وقابل للتفسير يمكنه التعامل مع عدم اليقين والغموض في البيانات.

معمارية النموذج

1. التضبيب باستخدام المجموعات الضبابية من النوع الثاني الفاصلة

يتم تضبيب الإدخال والإخراج باستخدام مجموعات ضبابية من النوع الثاني الفاصلة:

F~=xX[u[μ(x),μ(x)]1/u]/x\tilde{F} = \int_{x \in X} \left[ \int_{u \in [\underline{\mu}(x), \overline{\mu}(x)]} 1/u \right] /x

حيث μ(x)\underline{\mu}(x) و μ(x)\overline{\mu}(x) هما الحد الأدنى والأعلى لدرجات العضوية على التوالي.

2. بنية القاعدة الهجينة

تحتوي كل قاعدة على مكونين للنتيجة:

صيغة القاعدة:

إذا كان x1 هو F1 و ... و xn هو Fn
إذن (y هو G، y = f(x1, x2, ..., xn))
  • المكون الضبابي: النتيجة التقليدية لمامداني، تشير إلى مجموعة ضبابية للإخراج
  • مكون دالة تسك: دالة متعددة الحدود من الدرجة n، توفر قيمة إخراج واضحة

قيود دالة تسك: youtput[LowerBound(Fupper),UpperBound(Fupper)]y_{output} \in [LowerBound(F_{upper}), UpperBound(F_{upper})]

يضمن أن مخرجات تسك تقع دائماً ضمن حدود المجموعة الضبابية المقابلة.

3. آلية الأوزان المزدوجة

أوزان القاعدة الضبابية:

  • الدعم: Support(AjC~j)=1Np=1NμAj(xp)μCj(yp)Support(A_j \to \tilde{C}_j) = \frac{1}{|N|} \sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)
  • الثقة: Confidence(AjC~j)=p=1NμAj(xp)μCj(yp)p=1NμAj(xp)Confidence(A_j \to \tilde{C}_j) = \frac{\sum_{p=1}^N \mu_{A_j}(x_p) \cdot \mu_{C_j}(y_p)}{\sum_{p=1}^N \mu_{A_j}(x_p)}
  • الهيمنة: D=[SRule_lowerClower,SRule_upperCupper]D = [S_{Rule\_lower} \cdot C_{lower}, S_{Rule\_upper} \cdot C_{upper}]

الهيمنة القائمة على الخطأ: Dominanceri=11+riDominance_{ri} = \frac{1}{1 + r_i} حيث rir_i هو جذر متوسط مربع الخطأ للقاعدة i.

4. اختيار القاعدة بـ ACO

استخدام خوارزمية تحسين مستعمرة النمل لاختيار مجموعة فرعية مثلى من القواعد:

  • تبني كل نملة حل مجموعة فرعية من القواعد
  • تقييم جودة الحل بناءً على أداء RMSE
  • آلية تحديث الفيرومون توجه عملية البحث
  • موازنة بين إحكام النموذج ودقة التنبؤ

5. إلغاء التضبيب

استخدام طريقة المتوسط المرجح لتسك لحساب الإخراج النهائي: yfinal=i=1Mωiyii=1Mωiy_{final} = \frac{\sum_{i=1}^M \omega_i y_i}{\sum_{i=1}^M \omega_i}

نقاط الابتكار التقني

  1. مكون تسك المقيد: على عكس تسك التقليدي، يتم تقييد مخرجات الدالة ضمن حدود المجموعة الضبابية
  2. تدريب المجموعة الفرعية: يتم تدريب دوال تسك فقط على عينات التدريب ذات قوة الإثارة الإيجابية
  3. آلية الهيمنة المزدوجة: دمج المنطق الضبابي والدقة العددية في حساب الأوزان
  4. الحفاظ على القابلية للتفسير: صيغة القاعدة مشابهة لأنظمة مامداني التقليدية، لكن بدقة أعلى

إعداد التجارب

مجموعات البيانات

استخدام 6 مجموعات بيانات معيارية من مستودع KEEL:

  1. قوة ضغط الخرسانة: 1030 حالة، 8 متغيرات إدخال
  2. السكري: 768 سجل، 2 خاصية إدخال
  3. ELE-2: 11,105 حالة، 4 متغيرات تنبؤية
  4. الرهن العقاري: 1045 حالة، 14 متغير
  5. الخزانة: 956 سجل، 16 خاصية مالية
  6. وانكارا: 1609 سجل، 4 متغيرات إدخال

مقاييس التقييم

  • RMSE (جذر متوسط مربع الخطأ): مقياس التقييم الرئيسي
  • مقاييس القابلية للتفسير: تغطية القاعدة، عدد القواعد النشطة، خصائص قاعدة القواعد، الاستقرار

طرق المقارنة

  • MP: المحرك متعدد الطبقات
  • SMOreg: التحسين المتسلسل الأدنى
  • WM: خوارزمية وانج وميندل
  • CHV: خوارزمية كوردون وهيريرا وفيلار
  • GLD-WM: معاملات لاتيرالية عامة + قاعدة قواعد WM

متغيرات النموذج

  • HIT2-MTSK-D2: دالة تسك من الدرجة الثانية
  • HIT2-MTSK-D3: دالة تسك من الدرجة الثالثة

نتائج التجارب

النتائج الرئيسية

عبر 6 مجموعات بيانات:

  • 4 مجموعات بيانات: حققت أفضل درجة للطريقة الضبابية
  • مجموعتا بيانات: تفوقت على النماذج غير الشفافة
  • مجموعة بيانات واحدة: حققت أفضل أداء إجمالية
  • تحسن RMSE: 0.4% - 19%

الأداء المحدد:

  • الخرسانة: HIT2-MTSK-D3 حقق 7.29 RMSE، أفضل أداء إجمالية
  • الرهن العقاري: HIT2-MTSK-D3 حقق 0.13 RMSE، أفضل طريقة ضبابية
  • الخزانة: HIT2-MTSK-D3 حقق 0.27 RMSE، أفضل طريقة ضبابية
  • وانكارا: كلا المتغيرين حقق 1.58 RMSE، مطابق لأداء SMOreg

دراسة الحالة: التنبؤ بأسعار المنازل في كاليفورنيا

الأداء على مجموعة بيانات الإسكان في كاليفورنيا:

  • مجموعة البيانات: 20,640 ملاحظة، 8 ميزات
  • RMSE لـ HIT2-MTSK: 0.695
  • RMSE لـ Mamdani FRBS: 0.751
  • عدد القواعد: 75 قاعدة
  • التغطية: 100% من حالات الاختبار تثير قاعدة واحدة على الأقل

تقييم القابلية للتفسير

  • تغطية الفئة: تغطي 96% من نطاق البيانات الاختبارية الفعلية
  • القواعد النشطة: متوسط 8.38 قاعدة تثار عند حد 0.15
  • خصائص القاعدة: 75 قاعدة، متوسط 2.67 مقدمة
  • الاستقرار في مواجهة الضوضاء: تغيير التنبؤ 12.24% عند مستوى ضوضاء 10%

الأعمال ذات الصلة

تطور أنظمة القواعد الضبابية

  • طريقة وانج-ميندل: توليد القواعد المبكر المدفوع بالبيانات
  • الأنظمة الضبابية الوراثية (GFS): دمج الخوارزميات الوراثية لتحسين تعلم القواعد
  • تطبيق الخوارزميات التطورية: تحسين قاعدة المعرفة وقاعدة القواعد وقاعدة البيانات

الطرق الهجينة

  • طرق Gr-MF و GA-WM: دمج تحسين قاعدة القواعد وقاعدة البيانات
  • طريقة GA-COR: دمج الخوارزمية الوراثية مع إطار عمل COR
  • طريقة WM+GL: استخدام 2-tuple اللغوية للتحسين الجانبي

مزايا هذه الورقة

مقارنة بالأعمال الموجودة، تحقق طريقة هذه الورقة توازناً كبيراً بين الدقة والقابلية للتفسير، مما يحل مشكلة المقايضة بين الدقة والقابلية للتفسير في الطرق التقليدية.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. توازن فعال: نجحت في موازنة المقايضة بين القابلية للتفسير والدقة في الأنظمة الضبابية
  2. تحسن كبير: حققت أفضل أو قريبة من أفضل أداء على معظم مجموعات البيانات المعيارية
  3. الحفاظ على القابلية للتفسير: صيغة القاعدة مشابهة لأنظمة مامداني التقليدية، سهلة الفهم
  4. استقرار قوي: أداء ثابتة عبر مجالات وقطاعات بيانات مختلفة

القيود

  1. موازنة التعقيد: دوال تسك من الدرجة العالية قد تؤدي إلى الإفراط في التدريب
  2. مساحة التحسين: لا تزال هناك مساحة لتحسين الأداء على بعض مجموعات البيانات
  3. التعقيد الحسابي: تحسين ACO يزيد من التكلفة الحسابية
  4. حساسية المعاملات: يتطلب تعيين معقول لعدد المجموعات الضبابية ودرجة دالة تسك

الاتجاهات المستقبلية

  1. تحسين التحسين: استكشاف تقنيات تحسين ميتاهيوريستية أخرى
  2. التكيف مع المجال: معالجة مسبقة واختيار ميزات خاصة بمجال معين
  3. التقييم الموسع: التحقق على مجموعات بيانات ومقاييس تقييم أكثر
  4. التحليل النظري: تحليل عميق للتقارب والتعقيد

التقييم المتعمق

المزايا

  1. ابتكار قوي: أول من يقترح نظام ضبابي هجين بمكون تسك مقيد
  2. قيمة عملية عالية: حل المشاكل الرئيسية في التطبيقات الفعلية
  3. تجارب شاملة: التحقق على مجموعات بيانات معيارية متعددة، مع تحليل تفصيلي للقابلية للتفسير
  4. تصميم الطريقة معقول: منطق التصميم التقني واضح، الأساس النظري متين

أوجه القصور

  1. نقص التحليل النظري: افتقار الضمانات النظرية للتقارب والتعقيد
  2. إرشادات اختيار المعاملات: عدم توفير استراتيجية منهجية لاختيار المعاملات
  3. الكفاءة الحسابية: تحليل التعقيد الحسابي لتحسين ACO غير كافٍ
  4. حدود القابلية للتطبيق: نقاش محدود حول شروط تطبيق الطريقة

التأثير

  1. المساهمة الأكاديمية: توفير اتجاه بحثي جديد لمجال الأنظمة الضبابية
  2. القيمة العملية: قيمة تطبيقية مهمة في السيناريوهات التي تتطلب ذكاء اصطناعي قابل للتفسير
  3. قابلية التكرار: وصف الطريقة تفصيلي، يسهل التكرار والتوسع

السيناريوهات المناسبة

  1. تقييم المخاطر المالية: الحاجة إلى نماذج تنبؤية قابلة للتفسير
  2. التشخيص الطبي: يتطلب عملية صنع قرار شفافة
  3. التحكم الهندسي: تطبيقات التحكم التي تتطلب فهم سلوك النظام
  4. انحدار مجموعات البيانات الصغيرة: السيناريوهات التي لا تناسبها طرق التعلم العميق التقليدية

المراجع

تستشهد الورقة بأدبيات مهمة في مجالات الأنظمة الضبابية والخوارزميات التطورية والتعلم الآلي، بما في ذلك الأعمال الأساسية لزاده في المنطق الضبابي، والأنظمة الضبابية الكلاسيكية لمامداني وتسك، والبحث الحديث في الأنظمة الضبابية الوراثية والمجموعات الضبابية من النوع الثاني الفاصلة.


التقييم الإجمالي: هذه ورقة أكاديمية عالية الجودة تقترح طريقة نظام ضبابي هجين مبتكرة، تحقق تحسناً كبيراً في دقة الانحدار مع الحفاظ على القابلية للتفسير. التصميم المنهجي معقول، التحقق التجريبي شامل، وتتمتع بقيمة مساهمة مهمة لمجالات الأنظمة الضبابية والذكاء الاصطناعي القابل للتفسير.