With the increasing capabilities of Large Language Models (LLMs), parallel reasoning has emerged as a new inference paradigm that enhances reasoning robustness by concurrently exploring multiple lines of thought before converging on a final answer. It has become a significant trend to explore parallel reasoning to overcome the fragility of standard sequential methods and improve practical performance. In this paper, we aim to survey and summarize the progress and challenges of parallel reasoning. We first present a formal definition of parallel reasoning and clarify its distinction from related concepts like Chain-of-Thought. Then, we organize and discuss advanced techniques based on a novel taxonomy, including non-interactive reasoning, interactive reasoning, and efficiency-focused decoding strategies. Additionally, we explore various application scenarios, such as solving complex problems and enhancing the reliability of LLM outputs.Finally, we highlight the core challenges of parallel reasoning and suggest potential directions for future research. We hope that our work can provide a useful roadmap for beginners and encourage more research on improving parallel reasoning methods. Related source can be avaliable in https://github.com/PPPP-kaqiu/Awesome-Parallel-Reasoning.
대규모 언어 모델(LLMs)의 능력이 지속적으로 향상됨에 따라, 병렬 추론은 여러 사고 경로를 동시에 탐색하고 최종적으로 하나의 답으로 수렴함으로써 추론의 견고성을 강화하는 새로운 추론 패러다임으로 등장했습니다. 본 논문은 병렬 추론의 진전과 과제를 조사하고 요약하는 것을 목표로 하며, 먼저 병렬 추론의 형식적 정의를 제시하고 사고의 연쇄(Chain-of-Thought) 등 관련 개념과의 차이를 명확히 한 후, 새로운 분류법을 기반으로 비상호작용 추론, 상호작용 추론, 효율성 지향 디코딩 전략을 포함한 고급 기술을 조직하고 논의하며, 다양한 응용 시나리오를 탐색합니다.
기존의 순차 추론 방법은 내재적 취약성을 가지고 있으며, "접두사 함정"(prefix trap)에 빠지기 쉽습니다. 즉, 모델이 초기 추론 경로를 선택하면 자기 수정이 어려워져 최적해에 도달하지 못할 수 있습니다. 이러한 약점은 단일 통과 성능(Pass@1)과 다중 샘플링의 최고 결과(Pass@k) 간의 격차에서 명확하게 드러납니다.
기초 방법: 자기 일관성(Wang et al., 2023), 사고의 트리(Yao et al., 2023)
효율성 최적화: 추측 디코딩 시리즈, 병렬 디코딩 방법
다중 에이전트 시스템: 다중 에이전트 토론, 에이전트 혼합
산업 응용: OpenAI o1, Gemini DeepThink 등 최첨단 모델
이 종합 논문은 병렬 추론이라는 신흥 분야에 대한 포괄적이고 체계적인 기술 지도를 제공하며, 중요한 학술적 가치뿐만 아니라 실제 응용을 위한 귀중한 지침을 제공합니다. 대규모 모델 추론 능력 요구의 지속적 증가에 따라, 병렬 추론은 차세대 AI 시스템의 핵심 기술 중 하나가 될 것으로 예상됩니다.