2025-11-16T09:07:12.223206

Where to Search: Measure the Prior-Structured Search Space of LLM Agents

Song

The generate-filter-refine (iterative paradigm) based on large language models (LLMs) has achieved progress in reasoning, programming, and program discovery in AI+Science. However, the effectiveness of search depends on where to search, namely, how to encode the domain prior into an operationally structured hypothesis space. To this end, this paper proposes a compact formal theory that describes and measures LLM-assisted iterative search guided by domain priors. We represent an agent as a fuzzy relation operator on inputs and outputs to capture feasible transitions; the agent is thereby constrained by a fixed safety envelope. To describe multi-step reasoning/search, we weight all reachable paths by a single continuation parameter and sum them to obtain a coverage generating function; this induces a measure of reachability difficulty; and it provides a geometric interpretation of search on the graph induced by the safety envelope. We further provide the simplest testable inferences and validate them via a majority-vote instantiation. This theory offers a workable language and operational tools to measure agents and their search spaces, proposing a systematic formal description of iterative search constructed by LLMs.

academic

어디를 검색할 것인가: LLM 에이전트의 사전-구조화된 검색 공간 측정

기본 정보

논문 ID: 2510.14846
제목: Where to Search: Measure the Prior-Structured Search Space of LLM Agents
저자: Zhuo-Yang Song
분류: cs.AI cs.CL cs.LO
발표 시간: 2025년 10월 16일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.14846

초록

대형 언어 모델(LLM)을 기반으로 한 생성-필터링-최적화(generate-filter-refine) 반복 패러다임은 추론, 프로그래밍 및 AI+과학의 프로그램 발견 분야에서 진전을 이루었습니다. 그러나 검색의 효율성은 어디를 검색할 것인가, 즉 영역 사전 정보를 작동 가능한 구조화된 가설 공간으로 어떻게 인코딩할 것인가에 달려 있습니다. 이를 위해 본 논문은 영역 사전 정보에 의해 안내되는 LLM 보조 반복 검색을 설명하고 측정하기 위한 간결한 형식화 이론을 제안합니다. 저자는 에이전트를 입출력 상의 퍼지 관계 연산자로 표현하여 실행 가능한 변환을 포착하며, 에이전트는 따라서 고정된 안전 봉투 제약으로 제한됩니다. 다단계 추론/검색을 설명하기 위해 저자는 단일 연속 매개변수를 통해 모든 도달 가능한 경로에 가중치를 부여하고 합산하여 생성 함수를 포함하는 방식을 사용합니다. 이는 도달 가능성 난이도의 측정을 유도하며, 안전 봉투가 유도하는 그래프 상의 검색에 대한 기하학적 해석을 제공합니다.

연구 배경 및 동기

핵심 문제

본 연구가 해결하고자 하는 핵심 문제는 다음과 같습니다: LLM 에이전트의 검색 공간을 체계적으로 측정하고 설명하는 방법은 무엇인가. 구체적으로, LLM 기반 반복 검색 과정에서 검색 효율성은 근본적으로 "어디를 검색할 것인가"라는 문제, 즉 영역 사전 정보를 에이전트가 작동 가능한 공간으로 어떻게 인코딩할 것인가에 의해 제한됩니다.

문제의 중요성

장기 작업 요구사항: 장기 작업은 안전성과 제어 가능성에 대한 더 높은 요구사항을 제시하며, 검증 가능하고 제어 가능한 경계 내에서 작동해야 합니다.
복잡성 문제: 장기 문제는 종종 조합 폭발과 희소 보상을 포함하며, 순수 휴리스틱 또는 0/1 점수는 도달 가능성 난이도를 정량화하기에 충분하지 않습니다.
이론적 공백: 현재 실무는 주로 공학적 휴리스틱(프롬프트 설계, 필터, 점수 함수 등)에 의존하며, 통합된 언어와 정량적 도구가 부족합니다.

기존 방법의 한계

에이전트-공간-검색 측정을 위한 통합된 언어 부재
서로 다른 에이전트 간 도달 가능성과 안전성의 트레이드오프를 비교 가능하게 측정하기 어려움
에이전트의 장기 행동 특성에 대한 명확한 특성화 및 설명 부재

연구 동기

간결하고 계산 가능하며 모델 무관한 형식화 이론을 수립하여 안전성과 도달 가능성 측정을 통합하고, 검증 가능한 예측과 공학적으로 활용 가능한 설계 원칙을 제공합니다.

핵심 기여

간결한 형식화 이론 제안: 에이전트를 퍼지 관계 연산자로 형식화하고, 생성 함수를 통해 반복 검색 과정을 통합적으로 설명합니다.
통합된 측정 프레임워크 수립: 연속 매개변수와 포함 지수를 도입하여 안전성과 도달 가능성의 통합된 정량화 방법을 제공합니다.
기하학적 해석 제공: 안전 봉투가 유도하는 방향 그래프에서 기하학적 량을 정의하여 검색 과정의 기하학적 해석을 제공합니다.
이론 예측 검증: 다수결 투표 인스턴스화를 통해 이론의 검증 가능한 결론을 검증하고 외부 검증을 제공합니다.

방법론 상세 설명

작업 정의

입력 공간: $C_1$ (에이전트 입력 공간)
출력 공간: $C_2$ (에이전트 출력 공간, 반복을 지원하기 위해 $C_2 \subseteq C_1$ 만족)
목표: 안전 제약 하에서 반복 검색 과정을 측정하고 설명합니다.

핵심 수학 프레임워크

1. 에이전트 표현

이상적 에이전트는 퍼지 관계 연산자로 정의됩니다: $T(f,g) := \mu_f(g), \quad \mu_f: C_2 \to [0,1]$

취약한 이상적 에이전트(안전 봉투): $\mu_f(g) \in \{0,1\}, \quad 0 \leq T(f,g) \leq T_0(f,g)$

2. 생성 함수 포함

연속 매개변수 $p \in [0,1]$ 을 도입하여, $f$ 에서 $g$ 로의 생성 함수 포함을 정의합니다: $P_{f,g}(p) := \sum_{n=0}^{\infty} \sum_{S_T: f^{(0)}=f, f^{(n)}=g} p^n \prod_{i=0}^{n-1} \mu_{f^{(i)}}(f^{(i+1)})$

$C_1, C_2$ 가 가산일 때, 행렬 형식으로 표현할 수 있습니다: $P(p) = \sum_{n \geq 0} p^n M^n = (I - pM)^{-1}$

3. 주요 기하학적 량

최단 거리: $d_0(f,g) := \inf\{n \in \mathbb{N}: N_n(f,g) \geq 1\}$
최단 경로 수: $N_{d_0}(f,g)$
임계 매개변수: $p_c(f,g) := \inf\{p \in [0,1]: P_{f,g}^{ideal}(p) \geq 1\}$
포함 지수: $R_c(f,g) := 1 - p_c(f,g)$

기술적 혁신점

1. 통합된 측정 언어

퍼지 관계 연산자를 통해 에이전트를 통합적으로 표현하여 안전성과 도달 가능성을 동일한 수학 기호와 기하학적 량으로 측정할 수 있습니다.

2. 연속 매개변수 메커니즘

단일 연속 매개변수 $p$ 를 도입하여 궤적 길이에 가중치를 부여하며, 확률 해석의 복잡성을 피하고 계산 가능한 측정 방법을 제공합니다.

3. 기하학적 해석

안전 봉투가 유도하는 방향 그래프에서 검색 기하학을 정의하여 추상적인 검색 과정을 구체적인 그래프 이론 문제로 변환합니다.

4. 검증 가능한 가정

LLM으로 구성된 반복 에이전트에 대한 두 가지 주요 가정을 제안합니다:

가정 1: 근사 단방향 검색(폐쇄 루프 경로 희소)
가정 2: 저차 항 지배(과도하게 긴 궤적 상대적으로 희소)

실험 설정

실험 환경

검색 공간: 2차원 격자 $G_N := \{0,\ldots,N-1\}^2$
격자 규모: $N = 3, 5, 8$
목표점: 각각 $(1,2), (3,4), (6,7)$

에이전트 구성

LLM 모델 집합: gpt-4-mini, gpt-4, qwen3, qwen-plus, gemini-2.5-flash, deepseek-v3, grok-4, doubao
다수결 투표 메커니즘: 각 위치 $f$ 에 대해 독립적으로 $m=5$ 회 샘플링하여 최빈값을 의사결정으로 선택
이상적 에이전트: $\mu_f^{(t)}(g) := \frac{1}{n}\sum_L \mu_f^{(L,t)}(g)$
안전 봉투: $\mu_f^{0,(t)}(g) := \mathbf{1}\{\mu_f^{(t)}(g) > 0\}$

평가 지표

최단 거리 $d_0(f,t)$
최단 경로 수 $N_{d_0}(f,t)$
검증 부등식: $\log N_{d_0}(f,g) \ll d_0(f,g)$

데이터 포인트는 이론적 예측의 경험적 상한 아래에 위치
$d_0$ 이 클 때, 부등식 $\log N_{d_0} \ll d_0$ 가 더 잘 맞음
작은 $R_c$ 극한에서의 경험적 규칙을 지원

3. 가정 검증

단방향 그래프 구조: 실험에서 관찰된 그래프는 단방향 특성을 보여주며 가정 1을 지원
경로 계산 유한성: 유한한 경로 계산은 가정 2의 설정과 일치
복잡성 지배: 복잡성(최단 거리)이 지배하고 경로 다양성이 제한된 특성을 검증

실험 발견

임계값 행동: 작은 연속 매개변수에서 검색은 불충분한 확장 상태에 있으며, 최단 경로 항이 $P_{f,g}(p)$ 의 행동을 지배합니다.
기하학적 제약: LLM의 의미론적 제약은 그래프가 단방향 구조를 나타내도록 하여 검색 공간을 효과적으로 제한합니다.
도달 가능성 패턴: 관찰된 $(d_0, N_{d_0})$ 관계는 이론적 예측의 상한 추세와 일치합니다.