KnowThyself: An Agentic Assistant for LLM Interpretability
Prasai, Du, Zhang et al.
We develop KnowThyself, an agentic assistant that advances large language model (LLM) interpretability. Existing tools provide useful insights but remain fragmented and code-intensive. KnowThyself consolidates these capabilities into a chat-based interface, where users can upload models, pose natural language questions, and obtain interactive visualizations with guided explanations. At its core, an orchestrator LLM first reformulates user queries, an agent router further directs them to specialized modules, and the outputs are finally contextualized into coherent explanations. This design lowers technical barriers and provides an extensible platform for LLM inspection. By embedding the whole process into a conversational workflow, KnowThyself offers a robust foundation for accessible LLM interpretability.
academic
KnowThyself: LLM व्याख्यात्मकता के लिए एक एजेंटिक सहायक
शीर्षक: KnowThyself: An Agentic Assistant for LLM Interpretability
लेखक: Suraj Prasai (Wake Forest University), Mengnan Du (New Jersey Institute of Technology), Ying Zhang (Wake Forest University), Fan Yang (Wake Forest University)
वर्गीकरण: cs.AI, cs.IR, cs.LG, cs.MA
प्रकाशन समय/सम्मेलन: AAAI 2026 (40वां AAAI कृत्रिम बुद्धिमत्ता सम्मेलन - प्रदर्शन ट्रैक)
यह पेपर KnowThyself विकसित करता है, जो बड़े भाषा मॉडल (LLM) की व्याख्यात्मकता को आगे बढ़ाने के लिए एक बुद्धिमान एजेंट सहायक है। मौजूदा उपकरण हालांकि उपयोगी अंतर्दृष्टि प्रदान करते हैं, लेकिन फिर भी विखंडित हैं और बड़ी मात्रा में कोडिंग कार्य की आवश्यकता है। KnowThyself इन क्षमताओं को चैट-आधारित इंटरफेस में एकीकृत करता है, जहां उपयोगकर्ता मॉडल अपलोड कर सकते हैं, प्राकृतिक भाषा प्रश्न पूछ सकते हैं, और निर्देशित व्याख्या के साथ इंटरैक्टिव विज़ुअलाइज़ेशन प्राप्त कर सकते हैं। इसके मूल में शामिल हैं: ऑर्केस्ट्रेटर LLM पहले उपयोगकर्ता क्वेरी को पुनर्गठित करता है, एजेंट राउटर आगे क्वेरी को विशेष मॉड्यूल की ओर निर्देशित करता है, और अंत में आउटपुट को सुसंगत व्याख्या में संदर्भित किया जाता है। यह डिज़ाइन तकनीकी बाधा को कम करता है और LLM निरीक्षण के लिए एक स्केलेबल प्लेटफॉर्म प्रदान करता है। पूरी प्रक्रिया को संवादात्मक वर्कफ़्लो में एम्बेड करके, KnowThyself सुलभ LLM व्याख्यात्मकता के लिए एक ठोस आधार प्रदान करता है।
बड़े भाषा मॉडल भाषा समझ, तर्क और समस्या समाधान में उत्कृष्ट प्रदर्शन करते हैं, लेकिन उनकी ब्लैक-बॉक्स प्रकृति आंतरिक निर्णय प्रक्रिया को समझना मुश्किल बनाती है, जो पारदर्शिता, विश्वास और जवाबदेही के बारे में चिंताएं उठाती है।
अग्रणी व्याख्यात्मकता अनुसंधान और व्यावहारिक अनुप्रयोग के बीच अंतर को पाटना, बहु-एजेंट ऑर्केस्ट्रेशन, मॉड्यूलर आर्किटेक्चर और इंटरैक्टिव विज़ुअलाइज़ेशन के माध्यम से एक एकीकृत, सुलभ और स्केलेबल प्लेटफॉर्म बनाना, जो व्यापक दर्शकों को उभरती व्याख्या तकनीकों में भाग लेने में सक्षम बनाता है।
बहु-एजेंट ऑर्केस्ट्रेशन ढांचा: व्यापक व्याख्या कार्यों को समन्वित करने के लिए एक ढांचा प्रस्तावित करता है, जो लचीले रूटिंग और सुसंगत व्याख्या उत्पन्न करने का समर्थन करता है
मॉड्यूलर आर्किटेक्चर: विभिन्न व्याख्या विधियों को स्वतंत्र एजेंटों के रूप में एनकैप्सुलेट करता है, नई उपकरणों के निर्बाध एकीकरण और भविष्य की स्केलेबिलिटी का समर्थन करता है
इंटरैक्टिव विज़ुअलाइज़ेशन इंटरफेस: प्राकृतिक भाषा व्याख्या के साथ आउटपुट प्रदर्शन प्रदान करता है, प्रभावी मॉडल निरीक्षण की बाधा को काफी कम करता है
संवादात्मक वर्कफ़्लो: पूरी व्याख्या प्रक्रिया को संवादात्मक प्रवाह में एम्बेड करता है, कोड लिखे बिना मॉडल अपलोड, क्वेरी और परिणाम प्राप्त करना संभव बनाता है
सिस्टम मूल्य: KnowThyself LLM व्याख्यात्मकता उपकरणों को संवादात्मक वर्कफ़्लो में सफलतापूर्वक एकीकृत करता है
तकनीकी नवाचार: बहु-एजेंट ऑर्केस्ट्रेशन और मॉड्यूलर आर्किटेक्चर तकनीकी बाधा को प्रभावी रूप से कम करते हैं
व्यावहारिकता: इंटरैक्टिव विज़ुअलाइज़ेशन और साहित्य-समर्थित व्याख्या के माध्यम से, व्यवसायी मॉडल व्याख्यात्मकता कार्य में अधिक प्रभावी रूप से भाग ले सकते हैं
स्केलेबिलिटी: आर्किटेक्चर डिज़ाइन नई विधियों के आसान एकीकरण का समर्थन करता है
KnowThyself एक अग्रणी कार्य है जो विखंडित LLM व्याख्यात्मकता उपकरणों को एकीकृत संवादात्मक प्लेटफॉर्म में सफलतापूर्वक एकीकृत करता है। इसका बहु-एजेंट आर्किटेक्चर और मॉड्यूलर डिज़ाइन अच्छी इंजीनियरिंग प्रथाओं को प्रदर्शित करता है, संवादात्मक इंटरैक्शन तकनीकी बाधा को काफी कम करता है।
मुख्य मूल्य इसकी व्यावहारिक अभिविन्यास और स्केलेबिलिटी में निहित है, जो व्याख्यात्मकता उपकरणों के लोकतांत्रीकरण के लिए एक व्यावहारिक समाधान प्रदान करता है। AAAI प्रदर्शन पेपर के रूप में, यह सिस्टम की व्यवहार्यता और क्षमता को सफलतापूर्वक प्रदर्शित करता है।
मुख्य खेद पर्याप्त मात्रात्मक मूल्यांकन और उपयोगकर्ता अनुसंधान की कमी है, जो वास्तविक परिदृश्यों में सिस्टम प्रभावशीलता को पूरी तरह से सत्यापित नहीं कर सकता है। यदि भविष्य के कार्य इन मूल्यांकनों को पूरक कर सकें, तो यह पेपर की प्रेरणा को बहुत बढ़ा देगा।
कुल मिलाकर, यह एक उच्च गुणवत्ता वाला सिस्टम पेपर है जो LLM व्याख्यात्मकता अनुसंधान और अनुप्रयोग के लिए मूल्यवान उपकरण और विचार प्रदान करता है, ध्यान देने और आगे विकास के योग्य है।