2025-11-11T13:46:09.477452

Compiler.next: A Search-Based Compiler to Power the AI-Native Future of Software Engineering

Cogo, Oliva, Hassan

The rapid advancement of AI-assisted software engineering has brought transformative potential to the field of software engineering, but existing tools and paradigms remain limited by cognitive overload, inefficient tool integration, and the narrow capabilities of AI copilots. In response, we propose Compiler.next, a novel search-based compiler designed to enable the seamless evolution of AI-native software systems as part of the emerging Software Engineering 3.0 era. Unlike traditional static compilers, Compiler.next takes human-written intents and automatically generates working software by searching for an optimal solution. This process involves dynamic optimization of cognitive architectures and their constituents (e.g., prompts, foundation model configurations, and system parameters) while finding the optimal trade-off between several objectives, such as accuracy, cost, and latency. This paper outlines the architecture of Compiler.next and positions it as a cornerstone in democratizing software development by lowering the technical barrier for non-experts, enabling scalable, adaptable, and reliable AI-powered software. We present a roadmap to address the core challenges in intent compilation, including developing quality programming constructs, effective search heuristics, reproducibility, and interoperability between compilers. Our vision lays the groundwork for fully automated, search-driven software development, fostering faster innovation and more efficient AI-driven systems.

academic

Compiler.next: AI-मूल सॉफ्टवेयर इंजीनियरिंग के भविष्य को शक्ति देने वाला खोज-आधारित संकलक

मूल जानकारी

पेपर ID: 2510.24799
शीर्षक: Compiler.next: A Search-Based Compiler to Power the AI-Native Future of Software Engineering
लेखक: Filipe R. Cogo (Huawei Canada), Gustavo A. Oliva (Huawei Canada), Ahmed E. Hassan (Queen's University)
वर्गीकरण: cs.SE (सॉफ्टवेयर इंजीनियरिंग)
प्रकाशन समय: अक्टूबर 2025 (ACM को प्रस्तुत पांडुलिपि)
पेपर लिंक: https://arxiv.org/abs/2510.24799

सारांश

यह पेपर Compiler.next प्रस्तावित करता है, एक खोज-आधारित संकलक जो सॉफ्टवेयर इंजीनियरिंग 3.0 युग में AI-मूल सॉफ्टवेयर प्रणालियों का समर्थन करने के लिए डिज़ाइन किया गया है। पारंपरिक स्थिर संकलकों के विपरीत, Compiler.next मानव-लिखित इरादों को स्वीकार करता है और खोज के माध्यम से स्वचालित रूप से कार्यशील सॉफ्टवेयर उत्पन्न करता है। यह प्रक्रिया संज्ञानात्मक आर्किटेक्चर और इसके घटकों (जैसे प्रॉम्प्ट, आधार मॉडल कॉन्फ़िगरेशन और सिस्टम पैरामीटर) के गतिशील अनुकूलन को शामिल करती है, जबकि सटीकता, लागत और विलंबता जैसे कई उद्देश्यों के बीच इष्टतम समझौता खोजती है। पेपर Compiler.next की आर्किटेक्चर की रूपरेखा प्रदान करता है और इसे तकनीकी बाधा को कम करके सॉफ्टवेयर विकास को लोकतांत्रिक बनाने की आधारशिला के रूप में स्थापित करता है, जो स्केलेबल, अनुकूलनीय और विश्वसनीय AI-संचालित सॉफ्टवेयर को सक्षम बनाता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या पृष्ठभूमि

मौजूदा AI-सहायक सॉफ्टवेयर इंजीनियरिंग की सीमाएं:
- डेवलपर्स को संज्ञानात्मक अधिभार का सामना करना पड़ता है
- उपकरण एकीकरण दक्षता कम है
- AI सहायक क्षमताएं सीमित हैं
सॉफ्टवेयर इंजीनियरिंग प्रतिमान का विकास:
- SE 1.0: मैनुअल प्रोग्रामिंग युग
- SE 2.0: मशीन लर्निंग-सहायक युग
- SE 3.0: AI-मूल युग, मानव और AI का निर्बाध सहयोग
FMware (आधार मॉडल सॉफ्टवेयर) की जटिलता:
- केवल आधार मॉडल का सरल आवरण नहीं
- कॉन्फ़िगरेशन, डेटा संग्रह, RAG सिस्टम, डेटा सत्यापन, विश्लेषण उपकरण आदि जटिल घटक शामिल हैं
- प्रतिक्रिया डेटा प्रतिक्रिया में निरंतर विकास की आवश्यकता है

अनुसंधान प्रेरणा

पारंपरिक संकलक डिज़ाइन स्थिर वातावरण के लिए बनाए गए हैं, AI-संचालित प्रणालियों की वास्तविक समय अनुकूलन आवश्यकताओं को संभाल नहीं सकते
इरादे से अनुकूलित FMware में रूपांतरण का समर्थन करने के लिए एक नई संकलन बुनियादी ढांचे की आवश्यकता है
सच्चे इरादा-संचालित विकास को सक्षम बनाएं, डेवलपर्स को "क्या करना है" पर ध्यान केंद्रित करने दें, "कैसे करना है" पर नहीं

मुख्य योगदान

Compiler.next आर्किटेक्चर प्रस्तावित किया: एक खोज-आधारित संकलक ढांचा जो मानव इरादों को अनुकूलित FMware में संकलित कर सकता है
FMware प्रोग्राम प्रतिनिधित्व परिभाषित किया: Promptware और Agentware के मॉड्यूलर संयोजन सहित
बहु-उद्देश्य अनुकूलन तंत्र डिज़ाइन किया: सटीकता, विलंबता और लागत जैसे प्रतिस्पर्धी उद्देश्यों को एक साथ अनुकूलित करता है
10 कार्रवाई आह्वान स्थापित किए: SE 3.0 संकलकों के R&D के लिए व्यवस्थित रोडमैप प्रदान करता है
अवधारणा प्रमाण लागू किया: HumanEval-Plus बेंचमार्क पर सिस्टम की व्यवहार्यता सत्यापित की
शब्दार्थ कैशिंग तंत्र प्रदान किया: संकलन दक्षता में उल्लेखनीय सुधार और लागत में कमी

विधि विवरण

कार्य परिभाषा

इनपुट: मानव-लिखित इरादा (प्राकृतिक भाषा में वर्णित सॉफ्टवेयर आवश्यकताएं) आउटपुट: अनुकूलित FMware प्रोग्राम (प्रॉम्प्ट टेम्पलेट, संज्ञानात्मक आर्किटेक्चर कॉन्फ़िगरेशन, सिस्टम पैरामीटर आदि सहित) बाधाएं: बहु-उद्देश्य अनुकूलन (सटीकता, विलंबता, लागत का समझौता)

मॉडल आर्किटेक्चर

1. तकनीकी स्टैक घटक

संज्ञानात्मक अन्वेषण अनुकूलक: स्व-प्रतिबिंब जैसी तकनीकों का उपयोग करके खोज प्रक्रिया को बुद्धिमानी से संचालित करता है
प्रॉम्प्ट पुनर्लेखक: प्रॉम्प्ट संरचना को बढ़ाता और परिष्कृत करता है
आर्किटेक्चर एक्सप्लोरर: RAG पैरामीटर और संज्ञानात्मक आर्किटेक्चर पैटर्न के इष्टतम कॉन्फ़िगरेशन की खोज करता है
परिदृश्य विस्तारक: सिंथेटिक नए परिदृश्यों के माध्यम से अनुकूलन वातावरण को विस्तारित करता है
खोज अनुकूलक: ऐतिहासिक संकलन ट्रैजेक्टरी का उपयोग करके खोज दक्षता में सुधार करता है
वितरित संश्लेषण रनटाइम: संश्लेषण प्रक्रिया को तेज करने के लिए वितरित प्लेटफॉर्म का उपयोग करता है
संश्लेषण अवलोकनीयता इंजन: डिबगिंग और ट्रेसेबिलिटी का समर्थन करता है

2. खोज तंत्र

1. FMware घटक तत्काल करें → 2. विशिष्ट कॉन्फ़िगरेशन उत्पन्न करें → 3. अनुमान निष्पादित करें
     ↑                                                              ↓
6. अनुमानी सन्निकटक ← 5. सर्वश्रेष्ठ कॉन्फ़िगरेशन रिकॉर्ड करें ← 4. त्रुटि अनुमानक

मुख्य चरण:

टेम्पलेट भरना: समस्या उदाहरण जानकारी के साथ प्रॉम्प्ट टेम्पलेट में प्लेसहोल्डर तत्काल करना
FM अनुमान प्रकाशित करें: परिणाम उम्मीदवार उत्पन्न करने के लिए प्रकाशित FM का उपयोग करके तत्काल प्रॉम्प्ट निष्पादित करें
FM मूल्यांकन का मूल्यांकन करें: परिणाम उम्मीदवारों की गुणवत्ता का मूल्यांकन करने के लिए मूल्यांकन FM का उपयोग करें
स्व-प्रतिबिंब (वैकल्पिक): प्रॉम्प्ट टेम्पलेट में सुधार के बारे में तर्क प्रतिक्रिया उत्पन्न करें
मूल्यांकन स्कोर एकत्रित करें: कई समस्या उदाहरणों में समग्र फिटनेस स्कोर की गणना करें
उम्मीदवार चुनें: मूल्यांकन स्कोर के आधार पर उच्च-गुणवत्ता वाले टेम्पलेट चुनें
क्रॉस-म्यूटेशन: FM-निर्देशित संचालन के माध्यम से नए उम्मीदवार उत्पन्न करें

3. अवधारणात्मक मॉडल

Operation: FMware प्रोग्राम का घटक, जिसमें स्थिर और गतिशील पैरामीटर शामिल हैं
Optimizer: प्लग-इन घटक, Operation पैरामीटर के अनुकूलन के तरीके को निर्दिष्ट करता है
EvaluationBench: अनुकूलन प्रक्रिया में उपयोग किए जाने वाले गोल्ड लेबल प्रारूप और मूल्यांकन तर्क को परिभाषित करता है

तकनीकी नवाचार बिंदु

बहु-उद्देश्य Pareto अनुकूलन: प्रतिस्पर्धी उद्देश्यों को एक साथ अनुकूलित करने के लिए NSGA-II एल्गोरिदम का उपयोग करता है, सरल भारित संयोजन के बजाय
शब्दार्थ कैशिंग तंत्र: एम्बेडिंग समानता के आधार पर कैशिंग, संकलन गति और खोज स्थान अन्वेषण के बीच संतुलन
चिंताओं का अलगाव: इरादे (क्या लागू करना है) को कार्यान्वयन (अनुकूलित प्रॉम्प्ट और कॉन्फ़िगरेशन) से अलग करता है
संयोजनीय आर्किटेक्चर: कई परस्पर निर्भर FMware घटकों के संयुक्त अनुकूलन का समर्थन करता है

प्रयोगात्मक सेटअप

डेटासेट

HumanEval-Plus: Python प्रोग्रामिंग कार्य बेंचमार्क, फ़ंक्शन हस्ताक्षर और दस्तावेज़ स्ट्रिंग सहित
डेटा विभाजन: 70% अनुकूलन को निर्देशित करने के लिए गोल्ड लेबल के रूप में, 30% मूल्यांकन के लिए

मूल्यांकन मेट्रिक्स

सटीकता: यूनिट परीक्षण पास करने वाले उत्पन्न समाधानों का अनुपात
विलंबता: उम्मीदवार समाधानों का मूल्यांकन करने के लिए आवश्यक रनटाइम
निष्पादन लागत: प्रति रन खपत किए गए टोकन की संख्या (इनपुट + आउटपुट)

तुलना विधियां

प्रारंभिक संश्लेषण प्रॉम्प्ट बनाम अनुकूलित प्रॉम्प्ट
कैशिंग के साथ बनाम कैशिंग के बिना संकलन प्रदर्शन

कार्यान्वयन विवरण

खोज एल्गोरिदम: NSGA-II बहु-उद्देश्य आनुवंशिक एल्गोरिदम
जनसंख्या आकार: प्रति कार्य 10 उम्मीदवार समाधान
पुनरावृत्ति संख्या: 5 पीढ़ियां
समानता थ्रेशोल्ड: 0.85 (यूक्लिडियन दूरी)
परीक्षण मॉडल: Qwen2.5-7B-Instruct और GPT-4o-mini

प्रयोगात्मक परिणाम

मुख्य परिणाम

मॉडल	मेट्रिक	प्रारंभिक	अनुकूलित	सुधार(%)
Qwen2.5-7B-Instruct	सटीकता(%)	0.26	0.56	46.4
	औसत विलंबता(s)	14.2	10.8	76.6
	औसत टोकन संख्या	537.1	369.3	68.7
GPT-4o-mini	सटीकता(%)	0.68	1.00	47.0
	औसत विलंबता(s)	8.7	5.0	42.5
	औसत टोकन संख्या	500.0	417.1	16.5

कैशिंग तंत्र प्रभाव

मेट्रिक	कैशिंग के बिना	कैशिंग के साथ	अंतर
सटीकता(%)	1.00	0.70	-30%
औसत विलंबता(s)	5.0	5.9	-18%
औसत टोकन संख्या	417.1	467.0	12%
कुल रनटाइम	8m:15s	10m:27s	22.1% त्वरण

प्रयोगात्मक निष्कर्ष

महत्वपूर्ण प्रदर्शन सुधार: अनुकूलित प्रॉम्प्ट सटीकता और दक्षता दोनों में उल्लेखनीय सुधार दिखाते हैं
कैशिंग समझौता: शब्दार्थ कैशिंग संकलन समय में उल्लेखनीय कमी कर सकता है, लेकिन खोज विविधता को सीमित कर सकता है
मॉडल अनुकूलनीयता: यह विधि विभिन्न आकारों के आधार मॉडल के लिए प्रभावी है

दस कार्रवाई आह्वान

FMware प्रोग्राम प्रतिनिधित्व

गुणवत्ता प्रोग्रामिंग निर्माण स्थापित करें: FMware प्रोग्राम का प्रतिनिधित्व करने के लिए शब्दार्थ निर्माण स्थापित करें
अंत-से-अंत FMware अनुकूलन: अकेले प्रॉम्प्ट टेम्पलेट अनुकूलन से परे

कम्प्यूटेशनल प्रदर्शन

प्रभावी खोज अनुमानी: FM आउटपुट को प्रभावित करने वाली प्रॉम्प्ट विशेषताओं और FMware पैरामीटर को निर्धारित करें
दक्षता सुधार और लागत में कमी: विलंबता को कम करने और संकलन थ्रूपुट में सुधार के लिए तकनीकें विकसित करें

परिणाम सत्यापन

गोल्ड लेबल निर्माण: उच्च-गुणवत्ता, स्वतंत्र डेटा बिंदु बनाएं
गुणवत्ता सीमा अनुमान: गुणवत्ता थ्रेशोल्ड के भीतर FMware निष्पादन की संभावना की गणना करें
पुनरुत्पादनीय संकलन: संकलन प्रक्रिया की पुनरुत्पादनीयता लागू करें

उपयोगकर्ता प्राथमिकता और उद्देश्य

उपयोगकर्ता-परिभाषित अनुकूलन उद्देश्य: लचीले बहु-उद्देश्य अनुकूलन का समर्थन करें
संकलक अंतरसंचालनीयता: विभिन्न संकलकों के बीच अंतरसंचालनीयता सुनिश्चित करें
संकलन ट्रैजेक्टरी सामुदायिक साझाकरण: संकलन ट्रैजेक्टरी साझाकरण प्लेटफॉर्म स्थापित करें

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

Compiler.next ने इरादे से FMware में स्वचालित संकलन सफलतापूर्वक लागू किया
बहु-उद्देश्य अनुकूलन ने सटीकता, विलंबता और लागत को प्रभावी ढंग से संतुलित किया
शब्दार्थ कैशिंग तंत्र ने संकलन दक्षता में उल्लेखनीय सुधार किया
यह विधि SE 3.0 युग में सॉफ्टवेयर विकास के लिए एक नया प्रतिमान प्रदान करती है

सीमाएं

वर्तमान कार्यान्वयन मुख्य रूप से एकल Promptware घटक पर केंद्रित है: जटिल बहु-घटक FMware अनुकूलन को आगे के अनुसंधान की आवश्यकता है
गोल्ड लेबल निर्भरता: उच्च-गुणवत्ता मूल्यांकन डेटासेट की आवश्यकता है, जो प्रयोज्यता को सीमित कर सकता है
पुनरुत्पादनीयता चुनौती: FM का गैर-नियतात्मक व्यवहार पूरी तरह से पुनरुत्पादनीय संकलन को चुनौतीपूर्ण बनाता है
खोज स्थान विस्फोट: घटकों की संख्या बढ़ने के साथ, खोज स्थान अनुपयोगी हो सकता है

भविष्य की दिशाएं

पदानुक्रमित अनुकूलन रणनीति: जटिल FMware घटकों को चरणबद्ध तरीके से अनुकूलित करने की विधि विकसित करें
अनुकूली कैशिंग रणनीति: दक्षता और विविधता को संतुलित करने के लिए समानता थ्रेशोल्ड को गतिशील रूप से समायोजित करें
क्रॉस-फ्रेमवर्क अंतरसंचालनीयता: मानकीकृत FMware मध्यवर्ती प्रतिनिधित्व स्थापित करें
गुणवत्ता आश्वासन तंत्र: अधिक robust FMware गुणवत्ता मूल्यांकन विधियां विकसित करें

गहन मूल्यांकन

शक्तियां

मजबूत नवाचार: पहली बार एक व्यवस्थित इरादा संकलन ढांचा प्रस्तावित किया, SE 3.0 के लिए सैद्धांतिक आधार प्रदान किया
उच्च व्यावहारिक मूल्य: FMware विकास में वास्तविक दर्द बिंदुओं को हल करता है, स्पष्ट अनुप्रयोग संभावनाएं हैं
मजबूत व्यवस्थितता: केवल तकनीकी समाधान प्रदान नहीं करता, बल्कि संपूर्ण R&D रोडमैप प्रदान करता है
पर्याप्त सत्यापन: अवधारणा प्रमाण के माध्यम से विधि की व्यवहार्यता और प्रभावशीलता प्रदर्शित करता है
स्पष्ट लेखन: पेपर संरचना स्पष्ट है, तकनीकी विवरण विस्तृत हैं, समझने और पुनरुत्पादन में आसान है

कमियां

सीमित मूल्यांकन सीमा: केवल कोड जनरेशन कार्यों पर सत्यापित, अन्य प्रकार के कार्यों का मूल्यांकन नहीं
स्केलेबिलिटी अज्ञात: बड़े पैमाने पर, जटिल FMware सिस्टम को संभालने की क्षमता अभी तक सत्यापित नहीं की गई है
अपर्याप्त लागत विश्लेषण: हालांकि लागत अनुकूलन का उल्लेख किया गया है, विस्तृत लागत-लाभ विश्लेषण की कमी है
मौजूदा उपकरण एकीकरण: मौजूदा विकास उपकरण श्रृंखला के साथ कैसे एकीकृत करें इस पर चर्चा पर्याप्त नहीं है

प्रभाव

शैक्षणिक योगदान: सॉफ्टवेयर इंजीनियरिंग क्षेत्र में नई अनुसंधान दिशा और सैद्धांतिक ढांचा पेश किया
औद्योगिक मूल्य: AI-मूल सॉफ्टवेयर विकास उपकरणों के विकास को आगे बढ़ाने की संभावना है
मानकीकरण प्रचार: FMware विकास मानकों और सर्वोत्तम प्रथाओं की स्थापना को बढ़ावा दे सकता है
सामुदायिक निर्माण: दस कार्रवाई आह्वान अनुसंधान समुदाय के लिए स्पष्ट अनुसंधान एजेंडा प्रदान करते हैं

लागू परिदृश्य

AI-मूल अनुप्रयोग विकास: विशेष रूप से बड़ी मात्रा में प्रॉम्प्ट इंजीनियरिंग की आवश्यकता वाले अनुप्रयोगों के लिए उपयुक्त
कम-कोड/नो-कोड प्लेटफॉर्म: गैर-तकनीकी लोगों को सॉफ्टवेयर विकास क्षमता प्रदान करता है
तेजी से प्रोटोटाइप विकास: विचार से कार्यशील सॉफ्टवेयर तक तेजी से संक्रमण का समर्थन करता है
FMware रखरखाव अनुकूलन: मौजूदा FMware सिस्टम के निरंतर अनुकूलन और विकास में सहायता करता है

संदर्भ

पेपर में 94 संदर्भ शामिल हैं, जो सॉफ्टवेयर इंजीनियरिंग, मशीन लर्निंग, संकलक डिज़ाइन, खोज एल्गोरिदम आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को कवर करते हैं, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं।

समग्र मूल्यांकन: यह एक दूरदर्शी और व्यवस्थित उत्कृष्ट पेपर है, जो न केवल एक नवीन तकनीकी समाधान प्रस्तावित करता है, बल्कि अधिक महत्वपूर्ण रूप से सॉफ्टवेयर इंजीनियरिंग के भविष्य विकास के लिए एक स्पष्ट दृष्टिकोण और रोडमैप प्रदान करता है। हालांकि कुछ पहलुओं में आगे के सुधार की आवश्यकता है, लेकिन इसके मूल विचार और ढांचा डिज़ाइन AI युग में सॉफ्टवेयर इंजीनियरिंग अभ्यास के लिए नई संभावनाएं खोलते हैं।