2025-11-11T20:37:15.929319

DynaSpec: Context-aware Dynamic Speculative Sampling for Large-Vocabulary Language Models

Zhang, Ullah, Schultheis et al.
Speculative decoding (a.k.a. speculative sampling) has become a standard way to accelerate LLM inference: a small drafter proposes multiple tokens and a large target model verifies them once per speculation length. Recently, scaling of the LLM vocabulary has pushed the number of tokens to grow substantially. While verification over the full vocabulary leaves the target model largely unaffected, the O(|V|d) parameters in the drafter's output head become a latency bottleneck, slowing the entire pipeline. Contemporary methods (e.g., FR-Spec, VocabTrim) restrict the drafter's vocabulary to a fixed subset of the target model's vocabulary, ranked in descending order of token frequency. Although this reduces draft-time compute, it is brittle, since: (i) frequency lists are corpus-dependent and require retuning to generalize, and (ii) static shortlists suppress rare or domain-specific tokens, lowering the expected number of tokens per verification step. We propose DynaSpec, a context-dependent dynamic shortlisting mechanism that is robust, speeds up drafting, and generalizes across diverse tasks. Concretely, we introduce lightweight, coarse-grained meta-classifiers that route contexts to a small number of token clusters; the union of the top-k selected clusters forms the drafter's shortlist, while verification retains the full vocabulary and exactness. The meta-classifier finishes its computation earlier than the drafter's hidden state generation by exploiting parallel execution of draft encoding and meta shortlisting on separate streams. On standard speculative-decoding benchmarks, we observe consistent gains in mean accepted length over fixed-shortlist baselines, while context-dependent selection enables smaller shortlists without degrading acceptance.
academic

DynaSpec: рдмрдбрд╝реЗ-рд╢рдмреНрджрдХреЛрд╢ рднрд╛рд╖рд╛ рдореЙрдбрд▓реЛрдВ рдХреЗ рд▓рд┐рдП рд╕рдВрджрд░реНрдн-рдЬрд╛рдЧрд░реВрдХ рдЧрддрд┐рд╢реАрд▓ рдЕрдиреБрдорд╛рдиреА рдирдореВрдирд╛рдХрд░рдг

рдореВрд▓ рдЬрд╛рдирдХрд╛рд░реА

  • рдкреЗрдкрд░ ID: 2510.13847
  • рд╢реАрд░реНрд╖рдХ: DynaSpec: Context-aware Dynamic Speculative Sampling for Large-Vocabulary Language Models
  • рд▓реЗрдЦрдХ: Jinbin Zhang (Aalto University), Nasib Ullah (Aalto University), Erik Schultheis (IST Austria), Rohit Babbar (University of Bath)
  • рд╡рд░реНрдЧреАрдХрд░рдг: cs.CL cs.AI cs.LG
  • рдкреНрд░рдХрд╛рд╢рди рддрд┐рдерд┐: 17 рдЕрдХреНрдЯреВрдмрд░, 2025 (рдкреНрд░реАрдкреНрд░рд┐рдВрдЯ)
  • рдкреЗрдкрд░ рд▓рд┐рдВрдХ: https://arxiv.org/abs/2510.13847

рд╕рд╛рд░рд╛рдВрд╢

рдЕрдиреБрдорд╛рдиреА рдбрд┐рдХреЛрдбрд┐рдВрдЧ (Speculative decoding) рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ (LLM) рдХреЗ рдЕрдиреБрдорд╛рди рдХреЛ рддреЗрдЬрд╝ рдХрд░рдиреЗ рдХреА рдПрдХ рдорд╛рдирдХ рд╡рд┐рдзрд┐ рдмрди рдЧрдИ рд╣реИ: рдПрдХ рдЫреЛрдЯрд╛ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдХрдИ рдЯреЛрдХрди рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ, рдФрд░ рдПрдХ рдмрдбрд╝рд╛ рд▓рдХреНрд╖реНрдп рдореЙрдбрд▓ рдЕрдиреБрдорд╛рдирд┐рдд рд▓рдВрдмрд╛рдИ рдкрд░ рдПрдХ рдмрд╛рд░ рдореЗрдВ рд╕рддреНрдпрд╛рдкрди рдХрд░рддрд╛ рд╣реИред LLM рд╢рдмреНрджрдХреЛрд╢ рдХреЗ рдЖрдХрд╛рд░ рдореЗрдВ рд╡реГрджреНрдзрд┐ рдХреЗ рд╕рд╛рде, рдЯреЛрдХрди рдХреА рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рднреА рдЙрд▓реНрд▓реЗрдЦрдиреАрдп рд╡реГрджреНрдзрд┐ рд╣реБрдИ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐ рдкреВрд░реНрдг рд╢рдмреНрджрдХреЛрд╢ рдкрд░ рд╕рддреНрдпрд╛рдкрди рд▓рдХреНрд╖реНрдп рдореЙрдбрд▓ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ, рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдЖрдЙрдЯрдкреБрдЯ рд╣реЗрдб рдХреЗ O(|V|d) рдкреИрд░рд╛рдореАрдЯрд░ рд╡рд┐рд▓рдВрдмрддрд╛ рдХреА рдмрд╛рдзрд╛ рдмрди рдЬрд╛рддреЗ рд╣реИрдВ, рдЬреЛ рдкреВрд░реА рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЛ рдзреАрдорд╛ рдХрд░ рджреЗрддреЗ рд╣реИрдВред рдореМрдЬреВрджрд╛ рд╡рд┐рдзрд┐рдпрд╛рдВ (рдЬреИрд╕реЗ FR-Spec, VocabTrim) рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдХреЗ рд╢рдмреНрджрдХреЛрд╢ рдХреЛ рд▓рдХреНрд╖реНрдп рдореЙрдбрд▓ рдХреЗ рд╢рдмреНрджрдХреЛрд╢ рдХреЗ рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рдЙрдкрд╕рдореБрдЪреНрдЪрдп рддрдХ рд╕реАрдорд┐рдд рдХрд░рддреА рд╣реИрдВ, рдЬреЛ рдЯреЛрдХрди рдЖрд╡реГрддреНрддрд┐ рдХреЗ рдЕрд╡рд░реЛрд╣реА рдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рд╣реЛрддреЗ рд╣реИрдВред рд╣рд╛рд▓рд╛рдВрдХрд┐ рдпрд╣ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рд╕рдордп рдХреА рдЧрдгрдирд╛ рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЗрд╕рдореЗрдВ рдХрдордЬреЛрд░рд┐рдпрд╛рдВ рд╣реИрдВ: (i) рдЖрд╡реГрддреНрддрд┐ рд╕реВрдЪреА рдХреЙрд░реНрдкрд╕ рдкрд░ рдирд┐рд░реНрднрд░ рд╣реИ рдФрд░ рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдХреЗ рд▓рд┐рдП рдкреБрдирдГ-рдЯреНрдпреВрдирд┐рдВрдЧ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ; (ii) рд╕реНрдерд┐рд░ рдЫреЛрдЯреА рд╕реВрдЪреА рджреБрд░реНрд▓рдн рдпрд╛ рдбреЛрдореЗрди-рд╡рд┐рд╢рд┐рд╖реНрдЯ рдЯреЛрдХрди рдХреЛ рджрдмрд╛рддреА рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдкреНрд░рддрд┐ рд╕рддреНрдпрд╛рдкрди рдЪрд░рдг рдореЗрдВ рдЕрдкреЗрдХреНрд╖рд┐рдд рдЯреЛрдХрди рд╕рдВрдЦреНрдпрд╛ рдХрдо рд╣реЛ рдЬрд╛рддреА рд╣реИред рдпрд╣ рдкреЗрдкрд░ DynaSpec рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ, рдПрдХ рд╕рдВрджрд░реНрдн-рдЬрд╛рдЧрд░реВрдХ рдЧрддрд┐рд╢реАрд▓ рдЫреЛрдЯреА рд╕реВрдЪреА рддрдВрддреНрд░ рдЬреЛ рдордЬрдмреВрдд рд╣реИ, рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдХреЛ рддреЗрдЬрд╝ рдХрд░рддрд╛ рд╣реИ рдФрд░ рд╡рд┐рд╡рд┐рдз рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рдЕрдЪреНрдЫреА рддрд░рд╣ рд╕реЗ рд╕рд╛рдорд╛рдиреНрдпреАрдХреГрдд рд╣реЛрддрд╛ рд╣реИред

рдЕрдиреБрд╕рдВрдзрд╛рди рдкреГрд╖реНрдарднреВрдорд┐ рдФрд░ рдкреНрд░реЗрд░рдгрд╛

рдореВрд▓ рд╕рдорд╕реНрдпрд╛

рдмрдбрд╝реЗ рднрд╛рд╖рд╛ рдореЙрдбрд▓ рдХреЗ рд╡рд┐рдХрд╛рд╕ рдХреЗ рд╕рд╛рде, рд╢рдмреНрджрдХреЛрд╢ рдХрд╛ рдЖрдХрд╛рд░ рддреЗрдЬреА рд╕реЗ рдмрдврд╝рд╛ рд╣реИ: Llama-2 рдХреЗ 32k рдЯреЛрдХрди рд╕реЗ Llama-3 рдХреЗ 128k, DeepSeek-V3 рдХреЗ 129k, Qwen-2.5 рдХреЗ 152k, рдФрд░ рдпрд╣рд╛рдВ рддрдХ рдХрд┐ Gemma-3 рдХреЗ 262k рдЯреЛрдХрди рддрдХред рдЕрдиреБрдорд╛рдиреА рдбрд┐рдХреЛрдбрд┐рдВрдЧ рдореЗрдВ, рд╣рд╛рд▓рд╛рдВрдХрд┐ рдмрдбрд╝рд╛ рд▓рдХреНрд╖реНрдп рдореЙрдбрд▓ рдкреВрд░реНрдг рд╢рдмреНрджрдХреЛрд╢ рдХреА рдЧрдгрдирд╛ рдХрд╛ рдмреЛрдЭ рд╕рд╣рди рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рдЫреЛрдЯреЗ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдХреЗ рдЖрдЙрдЯрдкреБрдЯ рдкрд░рдд рдХреЗ O(|V|d) рдкреИрд░рд╛рдореАрдЯрд░ рдПрдХ рдЧрдВрднреАрд░ рд╡рд┐рд▓рдВрдмрддрд╛ рдмрд╛рдзрд╛ рдмрди рдЬрд╛рддреЗ рд╣реИрдВред

рдореМрдЬреВрджрд╛ рд╡рд┐рдзрд┐рдпреЛрдВ рдХреА рд╕реАрдорд╛рдПрдВ

  1. FR-Spec рдФрд░ VocabTrim: рдЙрдЪреНрдЪ-рдЖрд╡реГрддреНрддрд┐ рдЯреЛрдХрди рдХреЗ рдирд┐рд╢реНрдЪрд┐рдд рдЙрдкрд╕рдореБрдЪреНрдЪрдп рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ, рдЬрд┐рдирдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕рдорд╕реНрдпрд╛рдПрдВ рд╣реИрдВ:
    • рдЖрд╡реГрддреНрддрд┐ рд╕реВрдЪреА рд╡рд┐рд╢рд┐рд╖реНрдЯ рдХреЙрд░реНрдкрд╕ рдкрд░ рдирд┐рд░реНрднрд░ рд╣реИ, рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдореЗрдВ рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдЦрд░рд╛рдм рд╣реИ
    • рд╕реНрдерд┐рд░ рдЙрдкрд╕рдореБрдЪреНрдЪрдп рджреБрд░реНрд▓рдн рдпрд╛ рдбреЛрдореЗрди-рд╡рд┐рд╢рд┐рд╖реНрдЯ рдЯреЛрдХрди рдХреЛ рджрдмрд╛ рд╕рдХрддрд╛ рд╣реИ, рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдХреЛ рдХрдо рдХрд░ рд╕рдХрддрд╛ рд╣реИ
  2. рд╕рдВрджрд░реНрдн-рдЬрд╛рдЧрд░реВрдХрддрд╛ рдХреА рдХрдореА: рдореМрдЬреВрджрд╛ рд╡рд┐рдзрд┐рдпрд╛рдВ рд╡рд░реНрддрдорд╛рди рд╕рдВрджрд░реНрдн рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдЯреЛрдХрди рдЙрдореНрдореАрджрд╡рд╛рд░ рд╕реЗрдЯ рдХреЛ рдЧрддрд┐рд╢реАрд▓ рд░реВрдк рд╕реЗ рд╕рдорд╛рдпреЛрдЬрд┐рдд рдирд╣реАрдВ рдХрд░ рд╕рдХрддреА рд╣реИрдВ

рдЕрдиреБрд╕рдВрдзрд╛рди рдкреНрд░реЗрд░рдгрд╛

рдЪрд░рдо рд╡рд░реНрдЧреАрдХрд░рдг (extreme classification) рдореЗрдВ рдореЛрдЯреЗ-рд╕реЗ-рдмрд╛рд░реАрдХ рд░реВрдЯрд┐рдВрдЧ рд╡рд┐рдЪрд╛рд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░, рдпрд╣ рдкреЗрдкрд░ рд╕рдВрджрд░реНрдн-рдЬрд╛рдЧрд░реВрдХ рдЧрддрд┐рд╢реАрд▓ рд╢рдмреНрджрдХреЛрд╢ рдЪрдпрди рддрдВрддреНрд░ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЬреЛ рд╕рддреНрдпрд╛рдкрди рд╕рдЯреАрдХрддрд╛ рдмрдирд╛рдП рд░рдЦрддреЗ рд╣реБрдП рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рджрдХреНрд╖рддрд╛ рдореЗрдВ рд╕реБрдзрд╛рд░ рдХрд░рддрд╛ рд╣реИред

рдореВрд▓ рдпреЛрдЧрджрд╛рди

  1. DynaSpec рдлреНрд░реЗрдорд╡рд░реНрдХ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рдирд╛: рдПрдХ рд╣рд▓реНрдХреЗ-рд╡рдЬрди рдореЛрдЯреЗ-рдЕрдирд╛рдЬ рдореЗрдЯрд╛-рд╡рд░реНрдЧреАрдХрд░рдг рдХреЛ рдкреЗрд╢ рдХрд░рддрд╛ рд╣реИ рдЬреЛ рд╕рдВрджрд░реНрдн рдХреЛ рдХреБрдЫ рдЯреЛрдХрди рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рд░реВрдЯ рдХрд░рддрд╛ рд╣реИ, рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдХреЗрд╡рд▓ рдЪрдпрдирд┐рдд рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рд╕рдВрдШ рдкрд░ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ
  2. рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг: рд╕рд╛рдмрд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдЧрддрд┐рд╢реАрд▓ рд╕рдВрджрд░реНрдн рд╢рд░реНрдд рдЕрдкреЗрдХреНрд╖рд┐рдд рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдХреЗ рд╕рдВрджрд░реНрдн рдореЗрдВ рдХрд┐рд╕реА рднреА рд╕реНрдерд┐рд░ рдЙрдкрд╕рдореБрдЪреНрдЪрдп рд╕реЗ рд╕рдЦреНрддреА рд╕реЗ рдмреЗрд╣рддрд░ рд╣реИ
  3. рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рд╢реЗрдбреНрдпреВрд▓рд┐рдВрдЧ: рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рдХреНрд▓рд╕реНрдЯрд░ рдмрдЬрдЯ рдиреАрддрд┐ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ, рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЯреЛрдХрди рдХреЛ рдЕрдзрд┐рдХ рдХреНрд▓рд╕реНрдЯрд░ рдЖрд╡рдВрдЯрд┐рдд рдХрд░рддрд╛ рд╣реИ, рдмрд╛рдж рдореЗрдВ рдзреАрд░реЗ-рдзреАрд░реЗ рдХрдо рдХрд░рддрд╛ рд╣реИ, рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдФрд░ рд╡рд┐рд▓рдВрдмрддрд╛ рдХреЛ рд╕рдВрддреБрд▓рд┐рдд рдХрд░рддрд╛ рд╣реИ
  4. рд╕рд┐рд╕реНрдЯрдо рдЕрдиреБрдХреВрд▓рди: рдлреНрдпреВрдЬреНрдб рдЗрдВрдбреЗрдХреНрд╕рд┐рдВрдЧ + GEMM рдХрд░реНрдиреЗрд▓ рдФрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдирд┐рд╖реНрдкрд╛рджрди рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ, рдЧрддрд┐рд╢реАрд▓ рд╣реЗрдб рдХреЗ matmul рдУрд╡рд░рд╣реЗрдб рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИ
  5. рдкреНрд░рд╛рдпреЛрдЧрд┐рдХ рд╕рддреНрдпрд╛рдкрди: 7 рдорд╛рдирдХ рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рд╕рддреНрдпрд╛рдкрд┐рдд, рдирд┐рд╢реНрдЪрд┐рдд рдЫреЛрдЯреА рд╕реВрдЪреА рдЖрдзрд╛рд░ рд░реЗрдЦрд╛ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдФрд╕рдд рд╕реНрд╡реАрдХреГрддрд┐ рд▓рдВрдмрд╛рдИ рдореЗрдВ рд╕реБрд╕рдВрдЧрдд рд╕реБрдзрд╛рд░ рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИ

рд╡рд┐рдзрд┐ рд╡рд┐рд╡рд░рдг

рдХрд╛рд░реНрдп рдкрд░рд┐рднрд╛рд╖рд╛

рдЕрдиреБрдорд╛рдиреА рдбрд┐рдХреЛрдбрд┐рдВрдЧ рдлреНрд░реЗрдорд╡рд░реНрдХ рдХреЗ рддрд╣рдд, рд▓рдХреНрд╖реНрдп рдореЙрдбрд▓ T рдФрд░ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ D рджрд┐рдП рдЧрдП, рд▓рдХреНрд╖реНрдп рд╣реИ:

  • рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдХреЗ рдкреНрд░рддрд┐-рдЯреЛрдХрди рд╡рд┐рд▓рдВрдмрддрд╛ TD рдХреЛ рдХрдо рдХрд░рдирд╛
  • рдЙрдЪреНрдЪ рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ ╬▒ рдмрдирд╛рдП рд░рдЦрдирд╛
  • рд╕рддреНрдпрд╛рдкрди рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреА рд╕рдЯреАрдХрддрд╛ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдирд╛ (рдкреВрд░реНрдг рд╢рдмреНрджрдХреЛрд╢)

рдореЙрдбрд▓ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░

1. рд╢рдмреНрджрдХреЛрд╢ рд╡рд┐рднрд╛рдЬрди

LM рд╣реЗрдб рд╡рдЬрди рдХреЗ рд╕реНрддрдВрдн-рд╕рд╛рдорд╛рдиреНрдпреАрдХреГрдд рдкрд░ рдЧреЛрд▓рд╛рдХрд╛рд░ k-means рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ:

{WLM[:, v]/||WLM[:, v]||тВВ}vтИИV тЖТ {CтВБ, ..., CM}

рд╢рдмреНрджрдХреЛрд╢ V рдХреЛ M рдореЛрдЯреЗ-рдЕрдирд╛рдЬ рдЯреЛрдХрди рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рддрд╛ рд╣реИред

2. рд╣рд▓реНрдХреЗ-рд╡рдЬрди рд░реВрдЯрд░

рдореЗрдЯрд╛-рд╡рд░реНрдЧреАрдХрд░рдг r╬╕: Rс╡И╩│ тЖТ RM, рдЯреЛрдХрди рдПрдореНрдмреЗрдбрд┐рдВрдЧ рдФрд░ рдкрд┐рдЫрд▓реЗ рдЪрд░рдг рдХреА рдЫрд┐рдкреА рд╕реНрдерд┐рддрд┐ рдХреЛ рдЗрдирдкреБрдЯ рдХреЗ рд░реВрдк рдореЗрдВ:

s = r╬╕([E(xt), H╠Гt-1])

рд╕реНрд╡рддрдВрддреНрд░ CUDA рд╕реНрдЯреНрд░реАрдо рдкрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдореЗрдВ рдирд┐рд╖реНрдкрд╛рджрд┐рдд, рдкреНрд░рддреНрдпреЗрдХ рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рд▓рд┐рдП рд╕реНрдХреЛрд░ рдХреА рдЧрдгрдирд╛ рдХрд░рддрд╛ рд╣реИред

3. рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рдХреНрд▓рд╕реНрдЯрд░ рдЪрдпрди

рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рдмрдЬрдЯ kc(t) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ:

kc(t) = {
  kmax,                    t тИИ {0,1}
  тМКkmax/((t+1)┬╖2)тМЛ,      t тЙе 2
}

рд╢реАрд░реНрд╖-k рдХреНрд▓рд╕реНрдЯрд░ рдЪреБрдирддрд╛ рд╣реИ рдЫреЛрдЯреА рд╕реВрдЪреА рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП: VS(c,t) = тЛГmтИИK(c,t) Cm

4. рдЧрддрд┐рд╢реАрд▓ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ

рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рд╕рдордп рдХреЛ рд╡рд┐рдШрдЯрд┐рдд рдХрд░рддрд╛ рд╣реИ:

TD(c,t) тЙИ Tembed + max{Tcore, Tmeta} + Tindex+gemm(B(c,t))

рдЬрд╣рд╛рдВ B(c,t) тЙк |V|, рд╢рдмреНрджрдХреЛрд╢-рд╕рдВрдмрдВрдзрд┐рдд рдЧрдгрдирд╛ рдХреЛ рдХрд╛рдлреА рдХрдо рдХрд░рддрд╛ рд╣реИред

рддрдХрдиреАрдХреА рдирд╡рд╛рдЪрд╛рд░ рдмрд┐рдВрджреБ

  1. рд╕рдВрджрд░реНрдн-рдЬрд╛рдЧрд░реВрдХ рдЧрддрд┐рд╢реАрд▓ рдЪрдпрди: рд╕реНрдерд┐рд░ рд╡рд┐рдзрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ, рд╡рд░реНрддрдорд╛рди рд╕рдВрджрд░реНрдн рдХреЗ рдЕрдиреБрд╕рд╛рд░ рд╕рдмрд╕реЗ рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рдЯреЛрдХрди рдХреНрд▓рд╕реНрдЯрд░ рдЪреБрди рд╕рдХрддрд╛ рд╣реИ
  2. рдореЛрдЯреЗ-рд╕реЗ-рдмрд╛рд░реАрдХ рд░реВрдЯрд┐рдВрдЧ: рдЪрд░рдо рд╡рд░реНрдЧреАрдХрд░рдг рд╡рд┐рдЪрд╛рд░ рд╕реЗ рдЙрдзрд╛рд░ рд▓реЗрддрд╛ рд╣реИ, O(|V|d) рдЬрдЯрд┐рд▓рддрд╛ рдХреЛ O((M + |VS|)d) рд╕реЗ рдмрджрд▓рддрд╛ рд╣реИ
  3. рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рдиреАрддрд┐: рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЪрд░рдг рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рд░рдгрдиреАрддрд┐, рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдФрд░ рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рджрдХреНрд╖рддрд╛ рдХреЛ рд╕рдВрддреБрд▓рд┐рдд рдХрд░рддрд╛ рд╣реИ
  4. рд╕рдорд╛рдирд╛рдВрддрд░ рдирд┐рд╖реНрдкрд╛рджрди: рд░реВрдЯрд░ рдФрд░ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдПрдиреНрдХреЛрдбрд┐рдВрдЧ рд╡рд┐рднрд┐рдиреНрди CUDA рд╕реНрдЯреНрд░реАрдо рдкрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдореЗрдВ, wall-clock рдУрд╡рд░рд╣реЗрдб рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИ

рдкреНрд░рд╛рдпреЛрдЧрд┐рдХ рд╕реЗрдЯрдЕрдк

рдбреЗрдЯрд╛рд╕реЗрдЯ

7 рд╡рд┐рд╡рд┐рдз рдХрд╛рд░реНрдпреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ:

  • Spec-Bench: 6 рдХрд╛рд░реНрдп рдЬрд┐рдирдореЗрдВ рдорд╢реАрди рдЕрдиреБрд╡рд╛рдж (WMT14 DE-EN), рдмрд╣реБ-рдореЛрдбрд╝ рд╕рдВрд╡рд╛рдж (MT-Bench), рдкреБрдирд░реНрдкреНрд░рд╛рдкреНрддрд┐ рдкреНрд░рд╢реНрдиреЛрддреНрддрд░ (Natural Questions), рдЧрдгрд┐рддреАрдп рддрд░реНрдХ (GSM8K), рд╕рд╛рд░рд╛рдВрд╢ (CNN/DailyMail), RAG рд╢рд╛рдорд┐рд▓ рд╣реИрдВ
  • рдХреЛрдб рдЬрдирд░реЗрд╢рди: HumanEval (164 рд╕рдорд╕реНрдпрд╛рдПрдВ)
  • рдкреНрд░рддреНрдпреЗрдХ рдХрд╛рд░реНрдп рдХреЗ рд▓рд┐рдП 80 рдкреНрд░реЙрдореНрдкреНрдЯ, 1024 рдЯреЛрдХрди рддрдХ рдЬрдирд░реЗрд╢рди рд╕реАрдорд╛

рдореВрд▓реНрдпрд╛рдВрдХрди рдореЗрдЯреНрд░рд┐рдХреНрд╕

  • рдФрд╕рдд рд╕реНрд╡реАрдХреГрддрд┐ рд▓рдВрдмрд╛рдИ (Mean Acceptance Length): рдкреНрд░рддреНрдпреЗрдХ рдбреНрд░рд╛рдлреНрдЯ-рд╕рддреНрдпрд╛рдкрди рдЪрдХреНрд░ рдореЗрдВ рдФрд╕рддрди рдкреНрд░рд╕реНрддреБрдд рдЯреЛрдХрди рдХреА рд╕рдВрдЦреНрдпрд╛
  • рдФрд╕рдд рд╢рдмреНрджрдХреЛрд╢ рдЖрдХрд╛рд░: рдЧрддрд┐рд╢реАрд▓ рдЫреЛрдЯреА рд╕реВрдЪреА рдХрд╛ рдФрд╕рдд рдЖрдХрд╛рд░

рддреБрд▓рдирд╛рддреНрдордХ рд╡рд┐рдзрд┐рдпрд╛рдВ

  • Full Vocab (EAGLE-2): рдкреВрд░реНрдг 128k рд╢рдмреНрджрдХреЛрд╢ рдЖрдзрд╛рд░ рд░реЗрдЦрд╛
  • FR-Spec: рдЖрд╡реГрддреНрддрд┐-рдХреНрд░рдордмрджреНрдз 32k рдирд┐рд╢реНрдЪрд┐рдд рдЙрдкрд╕рдореБрдЪреНрдЪрдп рд╡рд┐рдзрд┐
  • DynaSpec рд╡реЗрд░рд┐рдПрдВрдЯ: рдирд┐рд╢реНрдЪрд┐рдд top-k рдмрдирд╛рдо рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ top-k

рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рд╡рд┐рд╡рд░рдг

  • рдореЙрдбрд▓: Llama-3-8B-Instruct (128k рд╢рдмреНрджрдХреЛрд╢)
  • рд╣рд╛рд░реНрдбрд╡реЗрдпрд░: рдПрдХрд▓ NVIDIA A6000 GPU
  • рдХреНрд▓рд╕реНрдЯрд░ рд╕рдВрдЦреНрдпрд╛ M рд╕реЗрдЯрд┐рдВрдЧ рдФрд░ рд░реВрдЯрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг ShareGPT рдФрд░ UltraChat200K рдЙрдкрд╕рдореБрдЪреНрдЪрдп рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ

рдкреНрд░рд╛рдпреЛрдЧрд┐рдХ рдкрд░рд┐рдгрд╛рдо

рдореБрдЦреНрдп рдкрд░рд┐рдгрд╛рдо

рд╡рд┐рдзрд┐MTConv.RAGMathQASumm.CodeрдФрд╕рдд
Full Vocab3.664.114.034.313.453.684.774.00
FR-Spec3.383.873.854.163.323.514.113.74
DynaSpec3.514.053.914.213.403.514.713.90

рдореБрдЦреНрдп рдирд┐рд╖реНрдХрд░реНрд╖:

  • DynaSpec рдФрд╕рдд рд╕реНрд╡реАрдХреГрддрд┐ рд▓рдВрдмрд╛рдИ рдореЗрдВ FR-Spec рд╕реЗ рдмреЗрд╣рддрд░ рд╣реИ, рдЬрдмрдХрд┐ рдЫреЛрдЯреА рдФрд╕рдд рдЫреЛрдЯреА рд╕реВрдЪреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ (27.3k рдмрдирд╛рдо 32k)
  • рдкреВрд░реНрдг рд╢рдмреНрджрдХреЛрд╢ рдЖрдзрд╛рд░ рд░реЗрдЦрд╛ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ, DynaSpec рдкреНрд░рддрд┐рд╕реНрдкрд░реНрдзреА рдкреНрд░рджрд░реНрд╢рди рдмрдирд╛рдП рд░рдЦрддреЗ рд╣реБрдП рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рдУрд╡рд░рд╣реЗрдб рдХреЛ рдХрд╛рдлреА рдХрдо рдХрд░рддрд╛ рд╣реИ

рд╡рд┐рд▓реЛрдкрди рдкреНрд░рдпреЛрдЧ

рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рдиреАрддрд┐ рдкреНрд░рднрд╛рд╡:

  • DynaSpec-PA (рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ) рдмрдирд╛рдо DynaSpec-F (рдирд┐рд╢реНрдЪрд┐рдд top-k)
  • рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рдиреАрддрд┐ рд╕рднреА рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рдирд┐рд╢реНрдЪрд┐рдд рдиреАрддрд┐ рд╕реЗ рдмреЗрд╣рддрд░ рд╣реИ
  • рдФрд╕рдд рд╢рдмреНрджрдХреЛрд╢ рдЖрдХрд╛рд░ рдЫреЛрдЯрд╛ рд╣реИ рд▓реЗрдХрд┐рди рд╕реНрд╡реАрдХреГрддрд┐ рд▓рдВрдмрд╛рдИ рдЕрдзрд┐рдХ рд╣реИ

FR-Spec + рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ:

рд╡рд┐рдзрд┐рдФрд╕рдд рд╕реНрд╡реАрдХреГрддрд┐ рд▓рдВрдмрд╛рдИрдФрд╕рдд рд╢рдмреНрджрдХреЛрд╢ рдЖрдХрд╛рд░
FR-Spec-F3.7432,768
FR-Spec-PA3.8131,739

рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╕рддреНрдпрд╛рдкрди

рдкреНрд░рд╛рдпреЛрдЧрд┐рдХ рдкрд░рд┐рдгрд╛рдо рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдореЗрдВ рдореВрд▓ рдирд┐рд╖реНрдХрд░реНрд╖реЛрдВ рдХреЛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рддреЗ рд╣реИрдВ:

  • рдЧрддрд┐рд╢реАрд▓ рд╕рдВрджрд░реНрдн-рдЬрд╛рдЧрд░реВрдХ рдЙрдкрд╕рдореБрдЪреНрдЪрдп рдЕрдкреЗрдХреНрд╖рд┐рдд рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдореЗрдВ рд╕реНрдерд┐рд░ рдЙрдкрд╕рдореБрдЪреНрдЪрдп рд╕реЗ рд╕рдЦреНрддреА рд╕реЗ рдмреЗрд╣рддрд░ рд╣реИ
  • рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рд╢реЗрдбреНрдпреВрд▓рд┐рдВрдЧ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдФрд░ рдмрд╛рдж рдХреА рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рджрдХреНрд╖рддрд╛ рдХреЛ рдкреНрд░рднрд╛рд╡реА рдврдВрдЧ рд╕реЗ рд╕рдВрддреБрд▓рд┐рдд рдХрд░рддрд╛ рд╣реИ

рд╕рдВрдмрдВрдзрд┐рдд рдХрд╛рд░реНрдп

рдмрдбрд╝реЗ рд╢рдмреНрджрдХреЛрд╢ LLMs

  • рд╢рдмреНрджрдХреЛрд╢ рдЖрдХрд╛рд░ рдкреНрд░рд╡реГрддреНрддрд┐: GPT-3/LLaMA-2 (32k) тЖТ LLaMA-3 (128k) тЖТ Qwen-2.5 (152k) тЖТ Gemma-3 (262k)
  • рдмрд╣реБрднрд╛рд╖реА рдореЙрдбрд▓ рдЬреИрд╕реЗ mT5 рдХреНрд░реЙрд╕-рднрд╛рд╖рд╛ рдХрд╡рд░реЗрдЬ рдореЗрдВ рд╕реБрдзрд╛рд░ рдХреЗ рд▓рд┐рдП 250k рд╢рдмреНрджрдХреЛрд╢ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ
  • рдЕрдиреБрднрд╡рдЬрдиреНрдп рд╕реНрдХреЗрд▓рд┐рдВрдЧ рдХрд╛рдиреВрди рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ рдХрд┐ рдмрдбрд╝реЗ рд╢рдмреНрджрдХреЛрд╢ рдЕрднрд┐рд╡реНрдпрдХреНрддрд┐ рдХреНрд╖рдорддрд╛ рдФрд░ рднреНрд░рдо рдХреЛ рдмреЗрд╣рддрд░ рдмрдирд╛рддреЗ рд╣реИрдВ

рдЕрдиреБрдорд╛рдиреА рдбрд┐рдХреЛрдбрд┐рдВрдЧ

  • рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдХрд╛рд░реНрдп: рд▓рд╛рд▓рдЪреА рдЬрдирд░реЗрд╢рди рддреНрд╡рд░рдг
  • рд╡рд┐рддрд░рдг-рд╕рдВрд░рдХреНрд╖рдг рд╡рд┐рдзрд┐рдпрд╛рдВ: Leviathan рдЖрджрд┐ рджреНрд╡рд╛рд░рд╛ рдЧреИрд░-рд▓рд╛рд▓рдЪреА рдирдореВрдирд╛рдХрд░рдг рд╡рд┐рд╕реНрддрд╛рд░
  • EAGLE рд╕реАрд░реАрдЬ: рд╣рд▓реНрдХреЗ-рд╡рдЬрди рдЯреНрд░рд╛рдВрд╕рдлреЙрд░реНрдорд░ рдбреНрд░рд╛рдлреНрдЯрд░, EAGLE-2 рдЧрддрд┐рд╢реАрд▓ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдкреЗрдбрд╝ рдкреЗрд╢ рдХрд░рддрд╛ рд╣реИ
  • рд╕рд┐рд╕реНрдЯрдо рдЕрдиреБрдХреВрд▓рди: рдХреИрд╢ рдкреБрдирдГ рдЙрдкрдпреЛрдЧ, рдХреБрд╢рд▓ рд╕реЗрд╡рд╛ рд╕реНрдЯреИрдХ рдЖрджрд┐

рдмрдбрд╝реЗ рд╢рдмреНрджрдХреЛрд╢ рддреНрд╡рд░рдг

  • рд╕реНрдерд┐рд░ рд╡рд┐рдзрд┐рдпрд╛рдВ: FR-Spec, VocabTrim рдЙрдЪреНрдЪ-рдЖрд╡реГрддреНрддрд┐ рдЯреЛрдХрди рдХреЗ рдирд┐рд╢реНрдЪрд┐рдд рдЙрдкрд╕рдореБрдЪреНрдЪрдп рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ
  • рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдЕрдиреБрдХреВрд▓рди: CCE рдлреНрдпреВрдЬреНрдб рдХреНрд░реЙрд╕-рдПрдВрдЯреНрд░реЙрдкреА рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдкреАрдХ рдореЗрдореЛрд░реА рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИ
  • рдЪрд░рдо рд╡рд░реНрдЧреАрдХрд░рдг рдкреНрд░реЗрд░рдгрд╛: LightXML, CascadeXML рдЖрджрд┐ рдореЛрдЯреЗ-рд╕реЗ-рдмрд╛рд░реАрдХ рддрдВрддреНрд░

рдирд┐рд╖реНрдХрд░реНрд╖ рдФрд░ рдЪрд░реНрдЪрд╛

рдореБрдЦреНрдп рдирд┐рд╖реНрдХрд░реНрд╖

  1. рдЧрддрд┐рд╢реАрд▓ рд╕реНрдерд┐рд░ рд╕реЗ рдмреЗрд╣рддрд░ рд╣реИ: рд╕рдВрджрд░реНрдн-рдЬрд╛рдЧрд░реВрдХ рдЧрддрд┐рд╢реАрд▓ рдЯреЛрдХрди рдЪрдпрди рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдореЗрдВ рдХрд┐рд╕реА рднреА рдирд┐рд╢реНрдЪрд┐рдд рдЙрдкрд╕рдореБрдЪреНрдЪрдп рд╕реЗ рд╕рдЦреНрддреА рд╕реЗ рдмреЗрд╣рддрд░ рд╣реИ
  2. рд╕реНрдерд┐рддрд┐-рдЬрд╛рдЧрд░реВрдХ рдкреНрд░рднрд╛рд╡реА рд╣реИ: рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЯреЛрдХрди рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рдиреАрддрд┐ рд╕реНрд╡реАрдХреГрддрд┐ рджрд░ рдФрд░ рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рджрдХреНрд╖рддрд╛ рдХреЛ рдкреНрд░рднрд╛рд╡реА рдврдВрдЧ рд╕реЗ рд╕рдВрддреБрд▓рд┐рдд рдХрд░ рд╕рдХрддреА рд╣реИ
  3. рд╕рд┐рд╕реНрдЯрдо рд╡реНрдпрд╡рд╣рд╛рд░реНрдпрддрд╛: рд╕рдорд╛рдирд╛рдВрддрд░ рдирд┐рд╖реНрдкрд╛рджрди рдФрд░ рдХрд░реНрдиреЗрд▓ рдлреНрдпреВрдЬрди рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ, рдЧрддрд┐рд╢реАрд▓ рд╡рд┐рдзрд┐ рдХрд╛ рд╕рд┐рд╕реНрдЯрдо рдУрд╡рд░рд╣реЗрдб рдирд┐рдпрдВрддреНрд░рдгреАрдп рд╣реИ
  4. рд╡реНрдпрд╛рдкрдХ рдкреНрд░рдпреЛрдЬреНрдпрддрд╛: рд╡рд┐рдзрд┐ EAGLE-рд╢реИрд▓реА рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд рд╣реИ, рдкреНрд▓рдЧ-рдПрдВрдб-рдкреНрд▓реЗ рдШрдЯрдХ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рд░реНрдп рдХрд░ рд╕рдХрддрд╛ рд╣реИ

рд╕реАрдорд╛рдПрдВ

  1. рдХреНрд▓рд╕реНрдЯрд░ рд╡рд┐рднрд╛рдЬрди рдирд┐рд░реНрднрд░рддрд╛: LM рд╣реЗрдб рд╡рдЬрди рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рд╕рд░реНрд╡реЛрддреНрддрдо рд░рдгрдиреАрддрд┐ рдирд╣реАрдВ рд╣реЛ рд╕рдХрддреА рд╣реИ
  2. рд╣рд╛рдЗрдкрд░рдкреИрд░рд╛рдореАрдЯрд░ рд╕рдВрд╡реЗрджрдирд╢реАрд▓рддрд╛: рдХреНрд▓рд╕реНрдЯрд░ рд╕рдВрдЦреНрдпрд╛ M рдФрд░ рдмрдЬрдЯ рд╢реЗрдбреНрдпреВрд▓рд┐рдВрдЧ рдкреИрд░рд╛рдореАрдЯрд░ рд╡рд┐рднрд┐рдиреНрди рдореЙрдбрд▓реЛрдВ рдХреЗ рд▓рд┐рдП рдЯреНрдпреВрдирд┐рдВрдЧ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ
  3. рдореЗрдореЛрд░реА рдУрд╡рд░рд╣реЗрдб: рдХреНрд▓рд╕реНрдЯрд░ рдореИрдкрд┐рдВрдЧ рдФрд░ рд░реВрдЯрд░ рдкреИрд░рд╛рдореАрдЯрд░ рд╕рдВрдЧреНрд░рд╣реАрдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ
  4. рдХреЛрд▓реНрдб рд╕реНрдЯрд╛рд░реНрдЯ рд╕рдорд╕реНрдпрд╛: рд░реВрдЯрд░ рдХреЛ рдЕрддрд┐рд░рд┐рдХреНрдд рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдбреЗрдЯрд╛ рдФрд░ рд╕рдордп рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ

рднрд╡рд┐рд╖реНрдп рдХреА рджрд┐рд╢рд╛рдПрдВ

  1. рдЕрдиреБрдХреВрд▓реА рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ: рдХрд╛рд░реНрдп рдпрд╛ рдбреЛрдореЗрди-рдЖрдзрд╛рд░рд┐рдд рдЧрддрд┐рд╢реАрд▓ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рд░рдгрдиреАрддрд┐ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░рдирд╛
  2. рдЕрдВрдд-рд╕реЗ-рдЕрдВрдд рдЕрдиреБрдХреВрд▓рди: рд░реВрдЯрд░ рдФрд░ рдбреНрд░рд╛рдлреНрдЯрд┐рдВрдЧ рдореЙрдбрд▓ рдХрд╛ рд╕рдВрдпреБрдХреНрдд рдЕрдиреБрдХреВрд▓рди
  3. рдмрд╣реБ-рдореЛрдбрд▓ рд╡рд┐рд╕реНрддрд╛рд░: рд╡рд┐рдзрд┐ рдХреЛ рджреГрд╢реНрдп-рднрд╛рд╖рд╛ рдореЙрдбрд▓ рддрдХ рд╡рд┐рд╕реНрддрд╛рд░рд┐рдд рдХрд░рдирд╛
  4. рд╣рд╛рд░реНрдбрд╡реЗрдпрд░ рд╕рд╣-рдбрд┐рдЬрд╛рдЗрди: рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╣рд╛рд░реНрдбрд╡реЗрдпрд░ рдХреЗ рд▓рд┐рдП рдХрд░реНрдиреЗрд▓ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЛ рдЕрдиреБрдХреВрд▓рд┐рдд рдХрд░рдирд╛

рдЧрд╣рди рдореВрд▓реНрдпрд╛рдВрдХрди

рд╢рдХреНрддрд┐рдпрд╛рдВ

  1. рдареЛрд╕ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░: рдЧрддрд┐рд╢реАрд▓ рд╡рд┐рдзрд┐ рдХреА рд╢реНрд░реЗрд╖реНрдарддрд╛ рд╕рд╛рдмрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрдареЛрд░ рдЧрдгрд┐рддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ
  2. рдордЬрдмреВрдд рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХрддрд╛: рдореМрдЬреВрджрд╛ рдлреНрд░реЗрдорд╡рд░реНрдХ рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд, рддреИрдирд╛рддреА рдореЗрдВ рдЖрд╕рд╛рди
  3. рд╕рд┐рд╕реНрдЯрдо рд╕реЛрдЪ: рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдФрд░ рд╕рд┐рд╕реНрдЯрдо рдЕрдиреБрдХреВрд▓рди рджреЛрдиреЛрдВ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░рддрд╛ рд╣реИ, рд╡рд╛рд╕реНрддрд╡рд┐рдХ рддреИрдирд╛рддреА рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рд╣рд▓ рдХрд░рддрд╛ рд╣реИ
  4. рд╡реНрдпрд╛рдкрдХ рдкреНрд░рдпреЛрдЧ: рдХрдИ рдХрд╛рд░реНрдпреЛрдВ рдФрд░ рдореЗрдЯреНрд░рд┐рдХреНрд╕ рдкрд░ рд╡рд┐рдзрд┐ рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реИ
  5. рд╕реНрдкрд╖реНрдЯ рд▓реЗрдЦрди: рддрдХрдиреАрдХреА рд╡рд┐рд╡рд░рдг рд╕рдЯреАрдХ рд░реВрдк рд╕реЗ рд╡рд░реНрдгрд┐рдд, рддрд╛рд░реНрдХрд┐рдХ рд╕рдВрд░рдЪрдирд╛ рд╕реНрдкрд╖реНрдЯ рд╣реИ

рдХрдордЬреЛрд░рд┐рдпрд╛рдВ

  1. рдореВрд▓реНрдпрд╛рдВрдХрди рд╕реАрдорд╛рдПрдВ: рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдПрдХрд▓ рдореЙрдбрд▓ рд╕реАрд░реАрдЬ (Llama-3) рдкрд░ рдкрд░реАрдХреНрд╖рдг, рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдХреА рдкреБрд╖реНрдЯрд┐ рдмрд╛рдХреА рд╣реИ
  2. рд╡рд┐рд▓рдВрдмрддрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдЕрдкрд░реНрдпрд╛рдкреНрдд: рдЕрдВрдд-рд╕реЗ-рдЕрдВрдд рд╡рд┐рд▓рдВрдмрддрд╛ рдХрд╛ рд╡рд┐рд╕реНрддреГрдд рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдФрд░ рддреБрд▓рдирд╛ рдХреА рдХрдореА
  3. рдХреНрд▓рд╕реНрдЯрд░ рдЧреБрдгрд╡рддреНрддрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди: рд╡рд┐рднрд┐рдиреНрди рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рднрд╛рд╡ рдХрд╛ рдЧрд╣рди рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдирд╣реАрдВ
  4. рд╕реНрдХреЗрд▓ рд╕рддреНрдпрд╛рдкрди: рдмрдбрд╝реЗ рдореЙрдбрд▓ рдпрд╛ рдмрдбрд╝реЗ рд╢рдмреНрджрдХреЛрд╢ рдкрд░ рд╕рддреНрдпрд╛рдкрди рдирд╣реАрдВ
  5. рд▓рд╛рдЧрдд рд╡рд┐рд╢реНрд▓реЗрд╖рдг: рд░реВрдЯрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреА рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд▓рд╛рдЧрдд рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреА рдХрдореА

рдкреНрд░рднрд╛рд╡

  1. рд╢реИрдХреНрд╖рдгрд┐рдХ рдореВрд▓реНрдп: рдмрдбрд╝реЗ рд╢рдмреНрджрдХреЛрд╢ LLM рдЕрдиреБрдорд╛рди рдЕрдиреБрдХреВрд▓рди рдХреЗ рд▓рд┐рдП рдирдИ рд╕реЛрдЪ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ
  2. рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдореВрд▓реНрдп: рд╡рд╛рд╕реНрддрд╡рд┐рдХ рддреИрдирд╛рддреА рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд╛рдзрд╛ рд╕рдорд╕реНрдпрд╛ рдХреЛ рд╣рд▓ рдХрд░рддрд╛ рд╣реИ
  3. рдкреБрдирд░реБрддреНрдкрд╛рджрдиреАрдпрддрд╛: рд╡рд┐рд╕реНрддреГрдд рдПрд▓реНрдЧреЛрд░рд┐рджрдо рд╡рд┐рд╡рд░рдг рдФрд░ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рд╡рд┐рд╡рд░рдг рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ
  4. рдкреНрд░реЗрд░рдгрд╛: рд╕рдВрдмрдВрдзрд┐рдд рдЕрдиреБрдХреВрд▓рди рджрд┐рд╢рд╛рдУрдВ рдХреЗ рд▓рд┐рдП рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдФрд░ рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдорд╛рд░реНрдЧрджрд░реНрд╢рди рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ

рдкреНрд░рдпреЛрдЬреНрдп рдкрд░рд┐рджреГрд╢реНрдп

  1. рдмрдбрд╝реЗ рд╢рдмреНрджрдХреЛрд╢ LLM рддреИрдирд╛рддреА: рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ 128k+ рд╢рдмреНрджрдХреЛрд╢ рд╡рд╛рд▓реЗ рдореЙрдбрд▓реЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд
  2. рд╕рдВрд╕рд╛рдзрди-рд╕реАрдорд┐рдд рд╡рд╛рддрд╛рд╡рд░рдг: рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рд╕рдВрд╕рд╛рдзрди рд╕реАрдорд┐рдд рд╣реЛрдиреЗ рдкрд░ рдкреНрд░рджрд░реНрд╢рди рдФрд░ рджрдХреНрд╖рддрд╛ рдХреЛ рд╕рдВрддреБрд▓рд┐рдд рдХрд░рддрд╛ рд╣реИ
  3. рдмрд╣реБ-рдХрд╛рд░реНрдп рдЕрдиреБрдкреНрд░рдпреЛрдЧ: рд╡рд┐рднрд┐рдиреНрди рдбреЛрдореЗрди рдореЗрдВ рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╡рд╛рд▓реЗ рдкрд░рд┐рджреГрд╢реНрдп
  4. рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╕рдордп рдЕрдиреБрдорд╛рди рдкреНрд░рдгрд╛рд▓реА: рд╡рд┐рд▓рдВрдмрддрд╛-рд╕рдВрд╡реЗрджрдирд╢реАрд▓ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдкрд░рд┐рджреГрд╢реНрдп

рд╕рдВрджрд░реНрдн

рдкреЗрдкрд░ рдЕрдиреБрдорд╛рдиреА рдбрд┐рдХреЛрдбрд┐рдВрдЧ, рдмрдбрд╝реЗ рд╢рдмреНрджрдХреЛрд╢ LLM, рдЪрд░рдо рд╡рд░реНрдЧреАрдХрд░рдг рдЖрджрд┐ рд╕рдВрдмрдВрдзрд┐рдд рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдХрд╛рд░реНрдпреЛрдВ рдХрд╛ рд╣рд╡рд╛рд▓рд╛ рджреЗрддрд╛ рд╣реИ, рдЬреЛ рд╡рд┐рдзрд┐ рдбрд┐рдЬрд╛рдЗрди рдХреЗ рд▓рд┐рдП рдареЛрд╕ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИред рдореБрдЦреНрдп рд╕рдВрджрд░реНрдн рд╕рд╛рд╣рд┐рддреНрдп рдореЗрдВ EAGLE рд╕реАрд░реАрдЬ, FR-Spec, рдФрд░ рдЪрд░рдо рд╡рд░реНрдЧреАрдХрд░рдг рдореЗрдВ LightXML рдФрд░ CascadeXML рдЬреИрд╕реЗ рдХрд╛рд░реНрдп рд╢рд╛рдорд┐рд▓ рд╣реИрдВред