Beyond single-model XAI: aggregating multi-model explanations for enhanced trustworthiness
Vascotto, Rodriguez, Bonaita et al.
The use of Artificial Intelligence (AI) models in real-world and high-risk applications has intensified the discussion about their trustworthiness and ethical usage, from both a technical and a legislative perspective. The field of eXplainable Artificial Intelligence (XAI) addresses this challenge by proposing explanations that bring to light the decision-making processes of complex black-box models. Despite being an essential property, the robustness of explanations is often an overlooked aspect during development: only robust explanation methods can increase the trust in the system as a whole. This paper investigates the role of robustness through the usage of a feature importance aggregation derived from multiple models ($k$-nearest neighbours, random forest and neural networks). Preliminary results showcase the potential in increasing the trustworthiness of the application, while leveraging multiple model's predictive power.
academic
एकल-मॉडल XAI से परे: बेहतर विश्वसनीयता के लिए बहु-मॉडल व्याख्याओं को एकत्रित करना
जैसे-जैसे कृत्रिम बुद्धिमत्ता मॉडल वास्तविक दुनिया के उच्च-जोखिम अनुप्रयोगों में व्यापक रूप से उपयोग किए जा रहे हैं, उनकी विश्वसनीयता और नैतिक उपयोग के मुद्दे तकनीकी और विधायी दोनों दृष्टिकोणों से बढ़ती हुई ध्यान आकर्षित कर रहे हैं। व्याख्यायोग्य कृत्रिम बुद्धिमत्ता (XAI) क्षेत्र जटिल ब्लैक-बॉक्स मॉडल के निर्णय प्रक्रिया को प्रकट करने के लिए व्याख्याएं प्रदान करके इस चुनौती का समाधान करता है। हालांकि मजबूती एक महत्वपूर्ण विशेषता है, लेकिन विकास प्रक्रिया में इसे अक्सर नजरअंदाज किया जाता है: केवल मजबूत व्याख्या विधियां ही संपूर्ण प्रणाली में विश्वास बढ़ा सकती हैं। यह पेपर कई मॉडल (k-निकटतम पड़ोसी, यादृच्छिक वन और तंत्रिका नेटवर्क) से एकत्रित विशेषता महत्व का उपयोग करके मजबूती की भूमिका की जांच करता है। प्रारंभिक परिणाम कई मॉडल की भविष्यवाणी क्षमता का उपयोग करते हुए अनुप्रयोग विश्वसनीयता में सुधार की संभावना प्रदर्शित करते हैं।
यह अनुसंधान मौजूदा XAI विधियों की दो मुख्य कमियों को संबोधित करता है:
व्याख्या मजबूती की कमी: LIME और SHAP जैसी लोकप्रिय व्याख्या विधियों को कई अध्ययनों में मजबूती की कमी साबित किया गया है, फिर भी उच्च-जोखिम परिदृश्यों में व्यापक रूप से लागू किए जाते हैं
व्याख्या विसंगति समस्या: जब एक ही उदाहरण पर कई व्याख्या विधियां लागू की जाती हैं तो परस्पर विरोधाभासी व्याख्याएं उत्पन्न होती हैं, व्याख्या के लिए कोई सत्य मानदंड न होने के कारण सर्वोत्तम विधि का चयन नहीं किया जा सकता
GDPR और AI अधिनियम जैसे विधायी आवश्यकताओं के साथ जो मॉडल पारदर्शिता की मांग करते हैं, व्याख्या की विश्वसनीयता महत्वपूर्ण हो गई है। केवल व्याख्याओं में विश्वास के माध्यम से ही मॉडल में विश्वास स्थापित किया जा सकता है, जो उच्च-जोखिम अनुप्रयोगों में विशेष रूप से महत्वपूर्ण है।
तंत्रिका नेटवर्क समूहों की व्याख्या में पिछले काम के आधार पर, यह पेपर विधि को विभिन्न श्रेणियों के मॉडल तक विस्तारित करने का प्रस्ताव करता है, जिसका उद्देश्य विभिन्न निर्णय प्रक्रियाओं की व्याख्याओं को एकत्रित करके प्रणाली की समग्र विश्वसनीयता में सुधार करना है।
यह पेपर सारणीबद्ध डेटा के द्विआधारी वर्गीकरण कार्य पर केंद्रित है, जिसका लक्ष्य प्रत्येक भविष्यवाणी उदाहरण के लिए विश्वसनीय विशेषता महत्व व्याख्याएं उत्पन्न करना है। इनपुट सारणीबद्ध डेटा उदाहरण है, आउटपुट मानकीकृत विशेषता आरोपण वेक्टर है।
जहां L=3 मॉडल की संख्या है। जब मॉडल भविष्यवाणियां असंगत हों, तो विसंगत मॉडल की व्याख्याओं को चिन्ह में उलट दें ताकि व्याख्या एक ही वर्ग की ओर इशारा करे।
सभी मॉडल विभिन्न डेटासेट पर 80% से अधिक सटीकता प्राप्त करते हैं (HELOC पर k-NN को छोड़कर जो 75.51% है)। तंत्रिका नेटवर्क जटिल डेटासेट पर सर्वश्रेष्ठ प्रदर्शन करता है, यादृच्छिक वन सरल डेटासेट पर सर्वश्रेष्ठ प्रदर्शन करता है।
मॉडल भविष्यवाणी सामंजस्य और पड़ोस आकार के बीच संबंध ने परिकल्पना को सत्यापित किया: जब तीनों मॉडल सामंजस्यपूर्ण भविष्यवाणी करते हैं, तो आमतौर पर बड़े पड़ोस आकार प्राप्त होते हैं, जो इंगित करता है कि इस क्षेत्र में बेहतर व्याख्या मजबूती है।
परिशिष्ट परिणाम दर्शाते हैं कि LIME और SHAP के मजबूती स्कोर 0.5 थ्रेशोल्ड से बहुत कम हैं, जो साहित्य में इन विधियों की अस्थिरता के बारे में निष्कर्षों को सत्यापित करता है, उन्हें बाहर करने के निर्णय का समर्थन करता है।
पेपर XAI क्षेत्र के महत्वपूर्ण साहित्य को उद्धृत करता है, जिसमें शामिल हैं:
LIME और SHAP के मूल पेपर और उनकी मजबूती की आलोचना
DeepLIFT, Integrated Gradients आदि तंत्रिका नेटवर्क व्याख्या विधियां
संबंधित मजबूती मूल्यांकन और व्याख्या एकत्रीकरण अनुसंधान
GDPR और EU AI अधिनियम जैसे विधायी दस्तावेज
समग्र मूल्यांकन: यह XAI मजबूती अनुसंधान दिशा में महत्वपूर्ण योगदान वाला एक पेपर है। हालांकि विधि अपेक्षाकृत सरल है, लेकिन यह व्यावहारिक रूप से महत्वपूर्ण समस्या को हल करता है और विश्वसनीय AI के विकास के लिए मूल्यवान उपकरण प्रदान करता है। पेपर का मुख्य मूल्य मॉडल प्रकारों के बीच व्याख्या एकत्रीकरण अनुसंधान दिशा की स्थापना में है और एक व्यवस्थित मूल्यांकन ढांचा प्रदान करता है। भविष्य के कार्य की दिशाएं स्पष्ट हैं, जो इस क्षेत्र के आगे विकास के लिए आधार तैयार करती हैं।