Faver: Boosting LLM-based RTL Generation with Function Abstracted Verifiable Middleware
Mu, Shi, Wang et al.
LLM-based RTL generation is an interesting research direction, as it holds the potential to liberate the least automated stage in the current chip design. However, due to the substantial semantic gap between high-level specifications and RTL, coupled with limited training data, existing models struggle with generation accuracy. Drawing on human experience, design with verification helps improving accuracy. However, as the RTL testbench data are even more scarce, it is not friendly for LLMs. Although LLMs excel at higher-level languages like Python/C, they have a huge semantic gap from RTL. When implementing the same functionality, Python/C code and hardware code differ significantly in the spatiotemporal granularity, requiring the LLM not only to consider high-level functional semantics but also to ensure the low-level details align with the circuit code. It is not an easy task. In this paper, we propose a function abstracted verifiable middleware (Faver) that streamlines RTL verification in LLM-based workflows. By mixing LLM-friendly code structures with a rule-based template, Faver decouples the details of circuit verification, allowing the LLM to focus on the functionality itself. In our experiments on the SFT model and open-source models, Faver improved the model's generation accuracy by up to 14%.
academic
Faver: फंक्शन एब्सट्रैक्टेड वेरिफाइएबल मिडलवेयर के साथ LLM-आधारित RTL जनरेशन को बूस्ट करना
यह पेपर बड़े भाषा मॉडल (LLM) आधारित RTL कोड जनरेशन की सटीकता की समस्या को संबोधित करता है और एक फंक्शन एब्सट्रैक्टेड वेरिफाइएबल मिडलवेयर (Faver) प्रस्तावित करता है। यह विधि LLM-अनुकूल कोड संरचना को नियम-आधारित टेम्पलेट के साथ जोड़कर, सर्किट सत्यापन के विवरण को अलग करती है, जिससे LLM कार्यक्षमता पर ध्यान केंद्रित कर सकता है। SFT मॉडल और ओपन-सोर्स मॉडल के प्रयोगों में, Faver ने मॉडल की जनरेशन सटीकता को 14% तक बढ़ाया है।
RTL डिज़ाइन चिप डिज़ाइन में सबसे कम स्वचालित और सबसे श्रम-गहन चरण है। हालांकि LLM RTL जनरेशन में संभावना दिखाता है, लेकिन उच्च-स्तरीय विनिर्देश और RTL के बीच विशाल शब्दार्थ अंतराल के कारण, साथ ही सीमित प्रशिक्षण डेटा के कारण, मौजूदा मॉडल जनरेशन सटीकता में खराब प्रदर्शन करते हैं।
मानव डिज़ाइन अनुभव में "डिज़ाइन और सत्यापन" विधि से सीखना, लेकिन हार्डवेयर सत्यापन में LLM की अंतर्निहित कठिनाइयों को हल करने की आवश्यकता है, विशेष रूप से समय-संबंधित चर और परीक्षण उत्तेजना जनरेशन की चुनौतियां।
Faver फ्रेमवर्क प्रस्तावित करना: LLM को सर्किट को सत्यापित करने के लिए उच्च-स्तरीय शब्दार्थ कोड लिखने की अनुमति देता है और डिज़ाइन और सत्यापन फ्रेमवर्क से लाभ उठाता है
फंक्शन-क्लास एब्सट्रैक्शन टेम्पलेट डिज़ाइन करना: हार्डवेयर डिज़ाइन में घड़ी और रजिस्टर शब्दार्थ को ईवेंट-संचालित Python/C फंक्शन क्लास में मैप करना, हार्डवेयर और सॉफ्टवेयर सत्यापन के बीच समय-स्थान अंतराल को कम करना
प्रायोगिक सत्यापन: कई परीक्षण सेट और LLM पर साबित करना कि Faver LLM-आधारित RTL जनरेशन सटीकता को 14% तक बढ़ाता है
सैद्धांतिक विश्लेषण: सिस्टम सफलता दर और प्रतिक्रिया सत्यता दर के लिए गणितीय मॉडल प्रदान करना
इनपुट: प्राकृतिक भाषा विनिर्देश द्वारा वर्णित हार्डवेयर कार्यक्षमता आवश्यकताएं
आउटपुट: कार्यात्मक रूप से सही और सत्यापित RTL (Verilog) कोड
बाधाएं: जनरेट किया गया RTL वाक्य-विन्यास और कार्यक्षमता दोनों में सही होना चाहिए
तकनीकी नवाचार: LLM में हार्डवेयर सत्यापन में समय-संबंधित समस्या को पहली बार व्यवस्थित रूप से हल करना, क्लास टेम्पलेट और ईवेंट-संचालित मॉडल के माध्यम से प्रभावी शब्दार्थ मैपिंग प्राप्त करना
प्रायोगिक पूर्णता: कई मॉडल, डेटासेट पर व्यापक मूल्यांकन, विलोपन प्रयोग और सैद्धांतिक विश्लेषण सहित
व्यावहारिक मूल्य: संपूर्ण ओपन-सोर्स कार्यान्वयन प्रदान करना, अच्छी पुनरुत्पादनीयता के साथ
सैद्धांतिक समर्थन: सिस्टम सफलता दर के लिए गणितीय मॉडल प्रदान करना, विधि के सैद्धांतिक आधार को बढ़ाना
पेपर इस क्षेत्र के महत्वपूर्ण कार्यों का संदर्भ देता है, जिनमें शामिल हैं:
ChipGPT, ChipNeMo आदि विशेष हार्डवेयर डिज़ाइन LLM
VerilogCoder, MAGE आदि डिज़ाइन और सत्यापन विधियां
RTLLM, VerilogEval आदि मानक मूल्यांकन बेंचमार्क
Toffee, Verilator आदि सहयोगी सिमुलेशन उपकरण
समग्र मूल्यांकन: यह LLM-आधारित RTL जनरेशन क्षेत्र में महत्वपूर्ण योगदान वाला एक उच्च-गुणवत्ता वाला पेपर है। नवीन कार्यक्षमता एब्सट्रैक्शन मिडलवेयर डिज़ाइन के माध्यम से, सॉफ्टवेयर-हार्डवेयर सत्यापन के बीच शब्दार्थ अंतराल समस्या को प्रभावी ढंग से हल करता है, प्रायोगिक परिणाम convincing हैं, अच्छी व्यावहारिक मूल्य और शैक्षणिक प्रभाव के साथ।