Beyond single-model XAI: aggregating multi-model explanations for enhanced trustworthiness
Vascotto, Rodriguez, Bonaita et al.
The use of Artificial Intelligence (AI) models in real-world and high-risk applications has intensified the discussion about their trustworthiness and ethical usage, from both a technical and a legislative perspective. The field of eXplainable Artificial Intelligence (XAI) addresses this challenge by proposing explanations that bring to light the decision-making processes of complex black-box models. Despite being an essential property, the robustness of explanations is often an overlooked aspect during development: only robust explanation methods can increase the trust in the system as a whole. This paper investigates the role of robustness through the usage of a feature importance aggregation derived from multiple models ($k$-nearest neighbours, random forest and neural networks). Preliminary results showcase the potential in increasing the trustworthiness of the application, while leveraging multiple model's predictive power.
인공지능 모델이 현실 세계의 고위험 응용 분야에서 광범위하게 사용됨에 따라, 그 신뢰성과 윤리적 사용 문제는 기술적, 입법적 관점 모두에서 점점 더 많은 주목을 받고 있습니다. 설명 가능한 인공지능(XAI) 분야는 복잡한 블랙박스 모델의 의사결정 과정을 밝히는 설명을 제공함으로써 이러한 과제에 대응하고 있습니다. 견고성이 중요한 속성임에도 불구하고, 개발 과정에서 종종 간과됩니다: 견고한 설명 방법만이 전체 시스템에 대한 신뢰를 증가시킬 수 있습니다. 본 논문은 여러 모델(k-최근접 이웃, 랜덤 포레스트, 신경망)에서 집계된 특성 중요도를 사용하여 견고성의 역할을 조사합니다. 초기 결과는 여러 모델의 예측 능력을 활용하면서 동시에 응용 신뢰도를 향상시킬 수 있는 잠재력을 보여줍니다.
종합 평가: 이것은 XAI 견고성 연구 방향에서 중요한 기여를 한 논문입니다. 방법이 상대적으로 단순하지만, 실제로 중요한 문제를 해결하며 신뢰할 수 있는 AI의 발전을 위해 가치 있는 도구를 제공합니다. 논문의 주요 가치는 모델 유형 간 설명 집계 연구 방향을 개척하고 체계적인 평가 프레임워크를 제공한다는 점에 있습니다. 향후 작업의 방향이 명확하며, 이 분야의 추가 발전을 위한 기초를 마련했습니다.