With the increasing capabilities of Large Language Models (LLMs), parallel reasoning has emerged as a new inference paradigm that enhances reasoning robustness by concurrently exploring multiple lines of thought before converging on a final answer. It has become a significant trend to explore parallel reasoning to overcome the fragility of standard sequential methods and improve practical performance. In this paper, we aim to survey and summarize the progress and challenges of parallel reasoning. We first present a formal definition of parallel reasoning and clarify its distinction from related concepts like Chain-of-Thought. Then, we organize and discuss advanced techniques based on a novel taxonomy, including non-interactive reasoning, interactive reasoning, and efficiency-focused decoding strategies. Additionally, we explore various application scenarios, such as solving complex problems and enhancing the reliability of LLM outputs.Finally, we highlight the core challenges of parallel reasoning and suggest potential directions for future research. We hope that our work can provide a useful roadmap for beginners and encourage more research on improving parallel reasoning methods. Related source can be avaliable in https://github.com/PPPP-kaqiu/Awesome-Parallel-Reasoning.
बड़े भाषा मॉडल (LLMs) की क्षमताओं में वृद्धि के साथ, समांतर तर्क एक नया तर्क प्रतिमान बनकर उभरा है, जो एकाधिक विचार पथों को एक साथ खोजकर और अंततः एक उत्तर में परिवर्तित करके तर्क की मजबूती को बढ़ाता है। यह पेपर समांतर तर्क की प्रगति और चुनौतियों का सर्वेक्षण और सारांश प्रदान करने का उद्देश्य रखता है। सबसे पहले, यह समांतर तर्क की औपचारिक परिभाषा प्रदान करता है और श्रृंखला-विचार (Chain-of-Thought) जैसी संबंधित अवधारणाओं से इसके अंतर को स्पष्ट करता है। फिर, एक नवीन वर्गीकरण के आधार पर उन्नत तकनीकों को संगठित और चर्चा करता है, जिसमें गैर-इंटरैक्टिव तर्क, इंटरैक्टिव तर्क और दक्षता-केंद्रित डिकोडिंग रणनीतियां शामिल हैं, और विभिन्न अनुप्रयोग परिदृश्यों की खोज करता है।
पारंपरिक अनुक्रमिक तर्क विधियों में अंतर्निहित कमजोरियां हैं और "उपसर्ग जाल" (prefix trap) में फंसने का खतरा है—एक बार जब मॉडल प्रारंभिक तर्क पथ चुन लेता है, तो स्व-सुधार करना कठिन हो जाता है और यह कभी भी इष्टतम समाधान तक नहीं पहुंच सकता। यह कमजोरी एकल पास प्रदर्शन (Pass@1) और बहु-नमूना सर्वश्रेष्ठ परिणाम (Pass@k) के बीच के अंतर में स्पष्ट रूप से प्रतिबिंबित होती है।
औद्योगिक अनुप्रयोग: OpenAI o1, Gemini DeepThink आदि अत्याधुनिक मॉडल
यह सर्वेक्षण पेपर समांतर तर्क के इस उभरते क्षेत्र के लिए एक व्यापक और व्यवस्थित तकनीकी मानचित्र प्रदान करता है, जो न केवल महत्वपूर्ण शैक्षणिक मूल्य रखता है बल्कि व्यावहारिक अनुप्रयोगों के लिए भी मूल्यवान मार्गदर्शन प्रदान करता है। बड़े मॉडल तर्क क्षमता की मांग में निरंतर वृद्धि के साथ, समांतर तर्क अगली पीढ़ी के AI सिस्टम की मुख्य तकनीकों में से एक बनने की संभावना है।