Grounded AI for Code Review: Resource-Efficient Large-Model Serving in Enterprise Pipelines
Mandal, Jiang
Automated code review adoption lags in compliance-heavy settings, where static analyzers produce high-volume, low-rationale outputs, and naive LLM use risks hallucination and incurring cost overhead. We present a production system for grounded, PR-native review that pairs static-analysis findings with AST-guided context extraction and a single-GPU, on-demand serving stack (quantized open-weight model, multi-tier caching) to deliver concise explanations and remediation guidance. Evaluated on safety-oriented C/C++ standards, the approach achieves sub-minute median first-feedback (offline p50 build+LLM 59.8s) while maintaining competitive violation reduction and lower violation rates versus larger proprietary models. The architecture is decoupled: teams can adopt the grounding/prompting layer or the serving layer independently. A small internal survey (n=8) provides directional signals of reduced triage effort and moderate perceived grounding, with participants reporting fewer human review iterations. We outline operational lessons and limitations, emphasizing reproducibility, auditability, and pathways to broader standards and assisted patching.
academic
कोड समीक्षा के लिए ग्राउंडेड AI: एंटरप्राइज पाइपलाइनों में संसाधन-कुशल बड़े-मॉडल सेवा
यह पेपर एंटरप्राइज कोड समीक्षा के लिए एक AI-आधारित उत्पादन प्रणाली प्रस्तावित करता है, जो अनुपालन आवश्यकताओं वाले कठोर वातावरण में स्वचालित कोड समीक्षा के अपनाने में देरी की समस्या को संबोधित करता है। यह प्रणाली स्थिर विश्लेषण परिणामों को AST-निर्देशित संदर्भ निष्कर्षण के साथ जोड़ती है, एकल GPU ऑन-डिमांड सेवा स्टैक (परिमाणित ओपन-सोर्स वजन मॉडल, बहु-स्तरीय कैशिंग) का उपयोग करके संक्षिप्त व्याख्या और सुधार मार्गदर्शन प्रदान करती है। सुरक्षा-केंद्रित C/C++ मानकों पर मूल्यांकन किया गया, यह विधि सबमिनट-स्तरीय पहली प्रतिक्रिया माध्यिका (ऑफलाइन p50 निर्माण + LLM के लिए 59.8 सेकंड) प्राप्त करती है, जबकि प्रतिस्पर्धी उल्लंघन में कमी दर और बड़े मालिकाना मॉडल की तुलना में कम उल्लंघन दर बनाए रखती है।
इनपुट: Pull Request अंतर, कोड भंडार संदर्भ, स्थिर विश्लेषण नियम
आउटपुट: साक्ष्य-आधारित PR टिप्पणियां, जिनमें उल्लंघन व्याख्या, जोखिम मूल्यांकन और सुधार सुझाव शामिल हैं
बाधाएं: सबमिनट-स्तरीय प्रतिक्रिया, एकल GPU संसाधन सीमा, एंटरप्राइज सुरक्षा आवश्यकताएं
"ग्राउंडिंग-पहले, फिर उत्पन्न करें" पैटर्न:
1. स्थिर विश्लेषण समस्या का पता लगाता है
2. AST-निर्देशित संदर्भ निष्कर्षण
3. संरचित प्रॉम्प्ट उत्पन्न करना
4. LLM तर्क स्थान को सीमित करना
पेपर स्थिर विश्लेषण, LLM सेवा, कोड समीक्षा आदि मुख्य क्षेत्रों को कवर करते हुए 42 संबंधित साहित्य का हवाला देता है, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार और तकनीकी तुलना प्रदान करता है।
समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला प्रणाली पेपर है जो शैक्षणिक अनुसंधान को व्यावहारिक उत्पादन प्रणाली में सफलतापूर्वक परिवर्तित करता है। नवाचारी ग्राउंडिंग तंत्र और संसाधन-कुशल सेवा आर्किटेक्चर के माध्यम से, यह एंटरप्राइज-स्तरीय AI कोड समीक्षा के लिए एक व्यवहार्य समाधान प्रदान करता है। हालांकि मूल्यांकन दायरे और उपयोगकर्ता अनुसंधान में सीमाएं हैं, लेकिन इसका तकनीकी योगदान और व्यावहारिक मूल्य महत्वपूर्ण है, जो सॉफ्टवेयर इंजीनियरिंग में AI के अनुप्रयोग को आगे बढ़ाने में महत्वपूर्ण है।