Task arithmetic has emerged as a simple yet powerful technique for model merging, enabling the combination of multiple finetuned models into one. Despite its empirical success, a clear theoretical explanation of why and when it works is lacking. This paper provides a rigorous theoretical foundation for task arithmetic by establishing a connection between task vectors and gradients of the task losses. We show that under standard gradient descent, a task vector generated from one epoch of finetuning is exactly equivalent to the negative gradient of the loss, scaled by the learning rate. For the practical multi-epoch setting, we prove that this equivalence holds approximately, with a second-order error term that we explicitly bound for feed-forward networks. Our empirical analysis across seven vision benchmarks corroborates our theory, demonstrating that the first-epoch gradient dominates the finetuning trajectory in both norm and direction. A key implication is that merging models finetuned for only a single epoch often yields performance comparable to merging fully converged models. These findings reframe task arithmetic as a form of approximate multitask learning, providing a clear rationale for its effectiveness and highlighting the critical role of early training dynamics in model merging.
рдкреЗрдкрд░ ID : 2508.16082рд╢реАрд░реНрд╖рдХ : рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдФрд░ рдкреНрд░рд╡рдгрддрд╛ рдкрд░рд▓реЗрдЦрдХ : рд▓реБрдХрд╛ рдЭреЛрдЙ, рдбреЗрдирд┐рдПрд▓реЗ рд╕реЛрд▓реЛрдореНрдмреНрд░рд┐рдиреЛ, рдбреЛрдирд╛рдЯреЛ рдХреНрд░рд┐рд╕реЛрд╕реНрдЯреЛрдореА, рдорд╛рд░рд┐рдпрд╛ рд╕реЛрдлрд┐рдпрд╛ рдмреБрдХрд╛рд░реЗрд▓реА, рдЧреНрдпреВрд╕реЗрдкреНрдкреЗ рдП. рдбреА'рдЗрдирд╡рд░реНрдиреЛ, рдлреИрдмреНрд░рд┐рдЬрд┐рдпреЛ рд╕рд┐рд▓реНрд╡реЗрд╕реНрддреНрд░реА, рдЗрдорд╛рдиреБрдПрд▓реЗ рд░реЛрдбреЛрд▓рд╛рд╡рд░реНрдЧреАрдХрд░рдг : cs.LG, cs.AIрдкреНрд░рдХрд╛рд╢рди рд╕рдордп/рд╕рдореНрдореЗрд▓рди : NeurIPS 2025 рдХрд╛рд░реНрдпрд╢рд╛рд▓рд╛: UniRepsрдкреЗрдкрд░ рд▓рд┐рдВрдХ : https://arxiv.org/abs/2508.16082 рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд (Task Arithmetic) рдПрдХ рд╕рд░рд▓ рдХрд┐рдВрддреБ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рдореЙрдбрд▓ рд╡рд┐рд▓рдп рддрдХрдиреАрдХ рд╣реИ рдЬреЛ рдХрдИ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрд┐рдд рдореЙрдбрд▓реЛрдВ рдХреЛ рдПрдХ рдПрдХреАрдХреГрдд рдореЙрдбрд▓ рдореЗрдВ рд╕рдВрдпреЛрдЬрд┐рдд рдХрд░рддреА рд╣реИред рдпрджреНрдпрдкрд┐ рдкреНрд░рдпреЛрдЧреЛрдВ рдореЗрдВ рдЙрддреНрдХреГрд╖реНрдЯ рдкреНрд░рджрд░реНрд╢рди рджрд┐рдЦрд╛рдИ рджреЗрддрд╛ рд╣реИ, рдХрд┐рдВрддреБ рдЗрд╕рдХреЗ рдХрд╛рд░реНрдп рдХрд░рдиреЗ рдХреЗ рддрд░реАрдХреЗ рдФрд░ рдкреНрд░рдпреЛрдЬреНрдпрддрд╛ рдХреА рд╢рд░реНрддреЛрдВ рдХреЛ рд╕рдордЭрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрдкрд╖реНрдЯ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд╛ рдЕрднрд╛рд╡ рд╣реИред рдпрд╣ рдкреЗрдкрд░ рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдФрд░ рдХрд╛рд░реНрдп рд╣рд╛рдирд┐ рдкреНрд░рд╡рдгрддрд╛ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдХреЗ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХреЗ рд▓рд┐рдП рдХрдареЛрд░ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИред рдЕрдиреБрд╕рдВрдзрд╛рди рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдорд╛рдирдХ рдкреНрд░рд╡рдгрддрд╛ рдЕрд╡рддрд░рдг рдХреЗ рддрд╣рдд, рдПрдХ epoch рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рджреНрд╡рд╛рд░рд╛ рдЙрддреНрдкрд╛рджрд┐рдд рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╣рд╛рдирд┐ рдХреА рдирдХрд╛рд░рд╛рддреНрдордХ рдкреНрд░рд╡рдгрддрд╛ рдХреЗ рдмрд░рд╛рдмрд░ рд╣реИ рдЬрд┐рд╕реЗ рд╕реАрдЦрдиреЗ рдХреА рджрд░ рд╕реЗ рдЧреБрдгрд╛ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдмрд╣реБ-epoch рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдХреЗ рд▓рд┐рдП, рдпрд╣ рд╕рдорд╛рдирддрд╛ рд▓рдЧрднрдЧ рдорд╛рдиреНрдп рд╣реИ, рдПрдХ рджреНрд╡рд┐рддреАрдп-рдХреНрд░рдо рддреНрд░реБрдЯрд┐ рдкрдж рдХреЗ рд╕рд╛рде, рдЬрд┐рд╕рдХреЗ рд▓рд┐рдП рд▓реЗрдЦрдХреЛрдВ рдиреЗ рдлреАрдбрдлреЙрд░рд╡рд░реНрдб рдиреЗрдЯрд╡рд░реНрдХ рдХреЗ рд▓рд┐рдП рд╕реНрдкрд╖реНрдЯ рд╕реАрдорд╛рдПрдВ рджреА рд╣реИрдВред рд╕рд╛рдд рджреГрд╢реНрдп рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдкрд░ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рд╕рд┐рджреНрдзрд╛рдВрдд рдХреЛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЬреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдкрд╣рд▓реЗ epoch рдХреА рдкреНрд░рд╡рдгрддрд╛ рдорд╛рдирджрдВрдб рдФрд░ рджрд┐рд╢рд╛ рджреЛрдиреЛрдВ рдореЗрдВ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдкрд░ рдкреНрд░рднреБрддреНрд╡ рд░рдЦрддреА рд╣реИред рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЦреЛрдЬ рдпрд╣ рд╣реИ рдХрд┐ рдХреЗрд╡рд▓ рдПрдХ epoch рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреЗ рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдирд╛ рдЕрдХреНрд╕рд░ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрднрд┐рд╕рд╛рд░рд┐рдд рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХреЗ рд╕рдорд╛рди рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд░ рд╕рдХрддрд╛ рд╣реИред
рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рдг-рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдкреНрд░рддрд┐рдорд╛рди рдЧрд╣рди рд╢рд┐рдХреНрд╖рд╛ рдХреА рдиреАрдВрд╡ рдмрди рдЧрдпрд╛ рд╣реИ, рдЬреЛ рдмрдбрд╝реЗ рд╕рд╛рдорд╛рдиреНрдп-рдЙрджреНрджреЗрд╢реНрдп рдореЙрдбрд▓реЛрдВ рдХреЛ рдЕрдирдЧрд┐рдирдд рд╡рд┐рд╢рд┐рд╖реНрдЯ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рдЕрдиреБрдХреВрд▓ рдмрдирд╛рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдмрдирд╛рддрд╛ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐, рдпрд╣ рд╕рдлрд▓рддрд╛ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд▓рд╛рдЧрдд рд▓рд╛рддреА рд╣реИ: рдкреНрд░рддреНрдпреЗрдХ рдХрд╛рд░реНрдп рдХреЗ рд▓рд┐рдП рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрд┐рдд рдореЙрдбрд▓реЛрдВ рдХреЛ рд╕рдВрдЧреНрд░рд╣реАрдд рдХрд░рдиреЗ рд╕реЗ рд╡рд┐рд╢рд╛рд▓ рднрдВрдбрд╛рд░рдг рдУрд╡рд░рд╣реЗрдб рдЙрддреНрдкрдиреНрди рд╣реЛрддрд╛ рд╣реИ, рдЬреЛ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдмрдврд╝рдиреЗ рдХреЗ рд╕рд╛рде рддреАрд╡реНрд░ рд╣реЛрддрд╛ рд╣реИред
рднрдВрдбрд╛рд░рдг рджрдХреНрд╖рддрд╛ рд╕рдорд╕реНрдпрд╛ : рдкреНрд░рддреНрдпреЗрдХ рдХрд╛рд░реНрдп рдХреЗ рд▓рд┐рдП рд╕реНрд╡рддрдВрддреНрд░ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрд┐рдд рдореЙрдбрд▓ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ, рдЬрд┐рд╕рд╕реЗ рднрдВрдбрд╛рд░рдг рд▓рд╛рдЧрдд рд░реИрдЦрд┐рдХ рд░реВрдк рд╕реЗ рдмрдврд╝рддреА рд╣реИрд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╕рдордЭ рдХреА рдХрдореА : рдпрджреНрдпрдкрд┐ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдкреНрд░рдпреЛрдЧреЛрдВ рдореЗрдВ рдЕрдЪреНрдЫрд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддреА рд╣реИ, рдХрд┐рдВрддреБ рдХрдареЛрд░ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд╛ рдЕрднрд╛рд╡ рд╣реИрдЗрд╖реНрдЯрддрдо рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рд░рдгрдиреАрддрд┐ рдЕрд╕реНрдкрд╖реНрдЯ : рдпрд╣ рд╕реНрдкрд╖реНрдЯ рдирд╣реАрдВ рд╣реИ рдХрд┐ рдореЙрдбрд▓ рд╡рд┐рд▓рдп рдХреЗ рд▓рд┐рдП рдХрд┐рддрдиреЗ рд╕рдордп рддрдХ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдкреНрд░рднрд╛рд╡реА рд╣реИрдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рд╕рд░рд▓ рдФрд░ рдкреНрд░рднрд╛рд╡реА рд╣реИ, рдХрд┐рдВрддреБ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рдХреА рдХрдореА рд╣реИ рдкреВрд░реНрд╡рд╡рд░реНрддреА рдХрд╛рд░реНрдпреЛрдВ рдиреЗ рдХреЗрд╡рд▓ рдЕрдиреБрднрд╡рдЬрдиреНрдп рд░реВрдк рд╕реЗ рджреЗрдЦрд╛ рд╣реИ рдХрд┐ рдЕрд▓реНрдкрдХрд╛рд▓реАрди рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреЗ рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рд╡рд┐рд▓рдп рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рдЙрдкрдпреБрдХреНрдд рд╣реИрдВ, рдХрд┐рдВрддреБ рдХрдареЛрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдирд╣реАрдВ рджреА рд╣реИ рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдФрд░ рдкреНрд░рд╡рдгрддрд╛ рдХреЗ рд╕рдВрдмрдВрдз рдХрд╛ рдЧрдгрд┐рддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдЕрдиреБрдкрд╕реНрдерд┐рдд рд╣реИ рдпрд╣ рдкреЗрдкрд░ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЕрдВрддрд░рд╛рд▓ рдХреЛ рднрд░рдиреЗ рдХрд╛ рд▓рдХреНрд╖реНрдп рд░рдЦрддрд╛ рд╣реИ, рдЧрдгрд┐рддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХреЗ рдХрд╛рд░реНрдп рдХрд░рдиреЗ рдХреЗ рддрд░реАрдХреЗ рдХреЛ рдкреНрд░рдХрдЯ рдХрд░рддрд╛ рд╣реИ, рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдФрд░ рдмрд╣реБ-рдХрд╛рд░реНрдп рд╢рд┐рдХреНрд╖рд╛ рдкреНрд░рд╡рдгрддрд╛ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реИред
рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рд╕реНрдерд╛рдкрдирд╛ : рдХрдареЛрд░рддрд╛ рд╕реЗ рд╕рд┐рджреНрдз рдХрд┐рдпрд╛ рдХрд┐ рдПрдХрд▓-epoch рдкреНрд░рд╡рдгрддрд╛ рдЕрд╡рддрд░рдг рдХрд╛ рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рд╕реНрдХреЗрд▓ рдХреА рдЧрдИ рдирдХрд╛рд░рд╛рддреНрдордХ рдкреНрд░рд╡рдгрддрд╛ рд╣реИ, рдФрд░ рдмрд╛рдж рдХреЗ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐рдпреЛрдВ рдФрд░ рд╕рдВрдпреБрдХреНрдд рдмрд╣реБ-рдХрд╛рд░реНрдп рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рдмреАрдЪ рдЕрдВрддрд░ рдХреЗрд╡рд▓ рджреНрд╡рд┐рддреАрдп-рдХреНрд░рдо рдкрдж O(╬╖┬▓) рд╣реИрддреНрд░реБрдЯрд┐ рд╕реАрдорд╛ рд╡реНрдпреБрддреНрдкрддреНрддрд┐ : рдлреАрдбрдлреЙрд░рд╡рд░реНрдб рдиреЗрдЯрд╡рд░реНрдХ рдХреЗ рд▓рд┐рдП рджреНрд╡рд┐рддреАрдп-рдХреНрд░рдо рддреНрд░реБрдЯрд┐ рдкрдж рдХреА рд╕реНрдкрд╖реНрдЯ рд╕рдорд╛рди 2-рдорд╛рдирджрдВрдб рд╕реАрдорд╛ рд╡реНрдпреБрддреНрдкрдиреНрди рдХреА, рдкрд░рд┐рдмрджреНрдз рднрд╛рд░ рдФрд░ рдкрд░рд┐рдмрджреНрдз рд╡реНрдпреБрддреНрдкрдиреНрди рд╕рдХреНрд░рд┐рдпрдг рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рдорд╛рдирддреЗ рд╣реБрдПрдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд╕рддреНрдпрд╛рдкрди : рдХрдИ рджреГрд╢реНрдп рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рдкреНрд░рдпреЛрдЧ рдкреБрд╖реНрдЯрд┐ рдХрд░рддреЗ рд╣реИрдВ рдХрд┐ рдкрд╣рд▓реЗ epoch рдХреА рдкреНрд░рд╡рдгрддрд╛ рд╕рдордЧреНрд░ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдкрд░ рдкреНрд░рднреБрддреНрд╡ рд░рдЦрддреА рд╣реИ, рдорд╛рдирджрдВрдб рдФрд░ рджрд┐рд╢рд╛ рджреЛрдиреЛрдВ рдореЗрдВрд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдорд╛рд░реНрдЧрджрд░реНрд╢рди : рдЕрд▓реНрдкрдХрд╛рд▓реАрди рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреЗ рдореЙрдбрд▓ рд╡рд┐рд▓рдп рдХреЗ рд▓рд┐рдП рд▓рд╛рднрдХрд╛рд░реА рд╣реЛрдиреЗ рдХреЗ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ, рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХреЛ рдЕрдиреБрдорд╛рдирд┐рдд рдмрд╣реБ-рдХрд╛рд░реНрдп рд╢рд┐рдХреНрд╖рд╛ рдХреЗ рд░реВрдк рдореЗрдВ рдкреБрдирдГ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рддрд╛ рд╣реИT рдХреЛ рдХрд╛рд░реНрдп рд╕рдореВрд╣ рдорд╛рдиреЗрдВ, |T| рдХрд╛рд░реНрдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╣реИред рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдореЙрдбрд▓ рднрд╛рд░ ╬╕_base рд╣реИред рдХрд╛рд░реНрдп tтИИT рдХреЗ рд▓рд┐рдП, ╬╕_t^(k) рдХрд╛рд░реНрдп t рдкрд░ k epochs рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреЗ рдмрд╛рдж рдХреЗ рдкреИрд░рд╛рдореАрдЯрд░ рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдХреЛ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
╧Д_t^(k) := ╬╕_t^(k) - ╬╕_base
рдХрд╛рд░реНрдп t рдХреА рдЕрдиреБрднрд╡рдЬрдиреНрдп рд╣рд╛рдирд┐ рд╣реИ:
L_t(╬╕) := (1/n_t) ╬г_{i=1}^{n_t} тДУ(x_i, y_i, ╬╕)
╬╕_TA^(k) = ╬╕_base + ╬▒ ╬г_{tтИИT} ╧Д_t^(k) рдХреЛ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдкреНрд░рд╛рдкреНрдд рдореЙрдбрд▓ рдорд╛рдиреЗрдВ, рдЬрд╣рд╛рдВ {╬╕_t^(k)}{tтИИT} k epochs рдХреА рдкреВрд░реНрдг-рдмреИрдЪ рдкреНрд░рд╡рдгрддрд╛ рдЕрд╡рддрд░рдг рджреНрд╡рд╛рд░рд╛ рдЙрддреНрдкрд╛рджрд┐рдд рд╣реЛрддреЗ рд╣реИрдВ, рдЪрд░рдг рдЖрдХрд╛рд░ ╬╖ рдХреЗ рд╕рд╛рдеред ╬╕_MT^(k) рдХреЛ рд╕рдордЧреНрд░ рд╣рд╛рдирд┐ ╬г {tтИИT} L_t рдкрд░ k epochs рдкреНрд░рд╡рдгрддрд╛ рдЕрд╡рддрд░рдг рдХрд╛ рдкрд░рд┐рдгрд╛рдо рдорд╛рдиреЗрдВ, рдЪрд░рдг рдЖрдХрд╛рд░ ╬▒╬╖ рдХреЗ рд╕рд╛рдеред рддрдм:
рдкрд╣рд▓реЗ epoch рдХреА рдкреВрд░реНрдг рд╕рдорд╛рдирддрд╛ :рдмрд╣реБ-epoch рдЕрдиреБрдорд╛рдирд┐рдд рд╕рдорд╛рдирддрд╛ (k > 1):╬╕_TA^(k) = ╬╕_MT^(k) + ╬╖┬▓C({╬╕_MT^(j)}_{j=1}^{k-2}) + O(╬╖┬│)
рдЬрд╣рд╛рдВ C рдкрдж рджреНрд╡рд┐рддреАрдп-рдХреНрд░рдо рддреНрд░реБрдЯрд┐ рдкрдж рд╣реИ:
C({╬╕_MT^(j)}_{j=1}^h) = ╬г_{tтИИT} ╬г_{e=0}^h тИЗ┬▓L_t(╬╕_MT^(e)) ╬г_{m=0}^e r_t(╬╕_MT^(m))
рд╕рд┐рджреНрдзрд╛рдВрдд рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдкрд╣рд▓реЗ epoch рдХреА рдкреНрд░рд╡рдгрддрд╛ рдЬрд╛рдирдХрд╛рд░реА рдкреВрд░реЗ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдкрд░ рдкреНрд░рднреБрддреНрд╡ рд░рдЦрддреА рд╣реИ:
рдкреНрд░рд╡рдгрддрд╛ рдорд╛рдирджрдВрдб рд╡рд┐рд╢реНрд▓реЗрд╖рдг : рдкрд╣рд▓рд╛ epoch рдХреБрд▓ рдкреНрд░рд╡рдгрддрд╛ рдорд╛рдирджрдВрдб рдХрд╛ рд╕рдмрд╕реЗ рдмрдбрд╝рд╛ рд╣рд┐рд╕реНрд╕рд╛ рдпреЛрдЧрджрд╛рди рджреЗрддрд╛ рд╣реИрджрд┐рд╢рд╛ рд╕рдВрдЧрддрд┐ : рдмрд╛рдж рдХреЗ epochs рдХреА рдкреНрд░рд╡рдгрддрд╛ рдкрд╣рд▓реЗ epoch рдХреА рдкреНрд░рд╡рдгрддрд╛ рдХреЗ рд╕рд╛рде рдЙрдЪреНрдЪ рдХреЛрд╕рд╛рдЗрди рд╕рдорд╛рдирддрд╛ рдмрдирд╛рдП рд░рдЦрддреА рд╣реИ (>0.8)рдкреНрд░рджрд░реНрд╢рди рд╕рдорд╛рдирддрд╛ : рдПрдХ epoch рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреЗ рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрднрд┐рд╕рд╛рд░рд┐рдд рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХреЗ рд╕рдорд╛рди рд╣реИрдЧрд╣рд░рд╛рдИ L рдХреЗ рдлреАрдбрдлреЙрд░рд╡рд░реНрдб рдиреЗрдЯрд╡рд░реНрдХ рдХреЗ рд▓рд┐рдП, рдкрд░рд┐рдмрджреНрдз рднрд╛рд░, рдкрд░рд┐рдмрджреНрдз рдЗрдирдкреБрдЯ рдФрд░ рдкрд░рд┐рдмрджреНрдз рд╡реНрдпреБрддреНрдкрдиреНрди рд╕рдХреНрд░рд┐рдпрдг рдХрд╛рд░реНрдпреЛрдВ рдХреА рдзрд╛рд░рдгрд╛ рдХреЗ рддрд╣рдд:
рд╕рд╛рдорд╛рдиреНрдп рд╕рдХреНрд░рд┐рдпрдг рдХрд╛рд░реНрдп :
||C({╬╕_MT^(j)}_{j=1}^h)||_2 тЙд T((h+2)/2)|╬▒T+1|H_max^╧Ж G_max^╧Ж
ReLU рд╕рдХреНрд░рд┐рдпрдг рдХрд╛рд░реНрдп :
||C({╬╕_MT^(j)}_{j=1}^h)||_2 тЙд T((h+2)/2)|╬▒T+1|H_max^ReLU G_max^ReLU
рдЬрд╣рд╛рдВ H_max рдФрд░ G_max рдХреНрд░рдорд╢рдГ Hessian рдФрд░ рдкреНрд░рд╡рдгрддрд╛ рдХреА рдКрдкрд░реА рд╕реАрдорд╛рдПрдВ рд╣реИрдВред
рдкреНрд░рдпреЛрдЧ рд╕рд╛рдд рджреГрд╢реНрдп рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ:
CIFAR-100 SVHN RESISC45 MNIST EuroSAT GTSRB DTD SUN397 рдПрдХ epoch рдмрдирд╛рдо рдЕрднрд┐рд╕рд░рдг рддреБрд▓рдирд╛ : рдПрдХ epoch рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдФрд░ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрднрд┐рд╕рд╛рд░рд┐рдд рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдХреА рддреБрд▓рдирд╛ рдХрд░реЗрдВрдкреНрд░рд╡рдгрддрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг : рд╡рд┐рднрд┐рдиреНрди epochs рдХреА рдкреНрд░рд╡рдгрддрд╛ рдорд╛рдирджрдВрдб рдХреЗ рд╕рд╛рдорд╛рдиреНрдпреАрдХреГрдд рдпреЛрдЧрджрд╛рди рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░реЗрдВрджрд┐рд╢рд╛ рд╕рдВрдЧрддрд┐ : рд╡рд┐рднрд┐рдиреНрди epochs рдкреНрд░рд╡рдгрддрд╛рдУрдВ рдХреЗ рдмреАрдЪ рдХреЛрд╕рд╛рдЗрди рд╕рдорд╛рдирддрд╛ рдХреА рдЧрдгрдирд╛ рдХрд░реЗрдВрдкреИрд░рд╛рдореАрдЯрд░ рдЕрдВрддрд░рд┐рдХреНрд╖ рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ : PCA рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╡рд┐рднрд┐рдиреНрди рд╡рд┐рд▓рдп рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреЗ рдкреИрд░рд╛рдореАрдЯрд░ рдЕрдВрддрд░рд┐рдХреНрд╖ рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдХреЛ рджреГрд╢реНрдпрдорд╛рди рдХрд░реЗрдВрдорд╛рдирдХ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд (Task Arithmetic) TIES-merging Model Breadcrumbs DARE рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐рдореВрд▓рдХ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд (Iterative TA) рдкреНрд░рджрд░реНрд╢рди рд╕рдорд╛рдирддрд╛ рд╕рддреНрдпрд╛рдкрди : рд╕рднреА рдкрд░реАрдХреНрд╖рдг рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░, рдПрдХ epoch рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреЗ рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЕрднрд┐рд╕рд╛рд░рд┐рдд рдореЙрдбрд▓реЛрдВ рдХреЛ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХреЗ рд╕рдорд╛рди рд╣реИ, рдХреБрдЫ рдорд╛рдорд▓реЛрдВ рдореЗрдВ рдмреЗрд╣рддрд░ рднреА рд╣реИрдкрд╣рд▓реЗ epoch рдХреА рдкреНрд░рднреБрддреНрд╡ :рдкрд╣рд▓рд╛ epoch 0.3-0.7 рдХреА рд╕рд╛рдорд╛рдиреНрдпреАрдХреГрдд рдкреНрд░рд╡рдгрддрд╛ рдорд╛рдирджрдВрдб рдореЗрдВ рдпреЛрдЧрджрд╛рди рджреЗрддрд╛ рд╣реИ рдкрд╣рд▓реЗ 5 epochs рдХреА рдкреНрд░рд╡рдгрддрд╛ рдкрд╣рд▓реЗ epoch рдХреА рдкреНрд░рд╡рдгрддрд╛ рдХреЗ рд╕рд╛рде 0.8 рд╕реЗ рдКрдкрд░ рдХреА рдХреЛрд╕рд╛рдЗрди рд╕рдорд╛рдирддрд╛ рдмрдирд╛рдП рд░рдЦрддреА рд╣реИ рдкреИрд░рд╛рдореАрдЯрд░ рдЕрдВрддрд░рд┐рдХреНрд╖ рд╡рд┐рд╢реНрд▓реЗрд╖рдг : рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐рдореВрд▓рдХ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдЫреЛрдЯреЗ рдЪрд░рдг рдЖрдХрд╛рд░ рдХреЗ рдЕрдкрдбреЗрдЯ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдореЙрдбрд▓ рдХреЛ рд╡рд┐рднрд┐рдиреНрди рдФрд░ рдХрдо рд╣рд╛рдирд┐ рд╡рд╛рд▓реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рддрдХ рдкрд╣реБрдВрдЪрд╛рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рд╣реИрдкреНрд░рдпреЛрдЧ рд╕рд┐рджреНрдзрд╛рдВрдд рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХреЗ рд╡рд┐рднрд┐рдиреНрди рдкрд╣рд▓реБрдУрдВ рдХреЛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рддреЗ рд╣реИрдВ:
рдкрд╣рд▓реЗ epoch рдкреНрд░рд╡рдгрддрд╛ рдХреА рдкреНрд░рднреБрддреНрд╡ рдХреА рдкреБрд╖реНрдЯрд┐ рдХреА рдмрд╛рдж рдХреЗ epochs рджреНрд╡рд╛рд░рд╛ рдкреЗрд╢ рдХреА рдЧрдИ рджреНрд╡рд┐рддреАрдп-рдХреНрд░рдо рддреНрд░реБрдЯрд┐ рдкрдж рдХреА рд╕рд╛рдкреЗрдХреНрд╖ рдЫреЛрдЯрд╛рдкрди рдХреЛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд┐рдпрд╛ рдЕрд▓реНрдкрдХрд╛рд▓реАрди рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреЗ рдореЙрдбрд▓ рд╡рд┐рд▓рдп рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рд▓рд╛рднрдХрд╛рд░реА рд╣реЛрдиреЗ рдХреА рдкреБрд╖реНрдЯрд┐ рдХреА рдХрд╛рд░реНрдп рджрдХреНрд╖рддрд╛ тЙа рд╡рд┐рд▓рдп рдХреНрд╖рдорддрд╛ : рдЕрддреНрдпрдзрд┐рдХ рд╡рд┐рд╢реЗрд╖реАрдХреГрдд рдореЙрдбрд▓ рдЖрд╡рд╢реНрдпрдХ рд░реВрдк рд╕реЗ рдмреЗрд╣рддрд░ рд╡рд┐рд▓рдп рдкрд░рд┐рдгрд╛рдо рдирд╣реАрдВ рджреЗрддреЗ рд╣реИрдВрдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЧрддрд┐рд╡рд┐рдЬреНрдЮрд╛рди рдХрд╛ рдорд╣рддреНрд╡ : рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдЧрддрд┐рд╡рд┐рдЬреНрдЮрд╛рди рд╕рдлрд▓ рдореЙрдбрд▓ рд╡рд┐рд▓рдп рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИрдкреНрд░рд╡рдгрддрд╛ рдЕрдиреБрдорд╛рди рдЧреБрдгрд╡рддреНрддрд╛ : рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдХреЗ рд░реВрдк рдореЗрдВ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдмрд╣реБ-рдХрд╛рд░реНрдп рдкреНрд░рд╡рдгрддрд╛ рдХрд╛ рдЕрдиреБрдорд╛рди рдЧреБрдгрд╡рддреНрддрд╛ рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рд╕рдордп рдХреЗ рд╕рд╛рде рдШрдЯрддрд╛ рд╣реИрд░реИрдЦрд┐рдХ рдкреИрдЯрд░реНрди рдХрдиреЗрдХреНрдЯрд┐рд╡рд┐рдЯреА рдЕрдиреБрд╕рдВрдзрд╛рди рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рд╕рд╛рдЭрд╛ рдЖрд░рдВрднреАрдХрд░рдг рд╡рд╛рд▓реЗ рдореЙрдбрд▓реЛрдВ рдХреЗ рдмреАрдЪ рд░реИрдЦрд┐рдХ рдкрде рдореМрдЬреВрдж рд╣реИрдВ рдХреНрд░рдордкрд░рд┐рд╡рд░реНрддрди-рдЖрдзрд╛рд░рд┐рдд рд╡рд┐рд▓рдп рд╡рд┐рдзрд┐рдпрд╛рдВ рдЗрд╖реНрдЯрддрдо рдкрд░рд┐рд╡рд╣рди рдорд┐рд▓рд╛рди рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╕рдорд░реВрдкрддрд╛ рд╕рдорд╕реНрдпрд╛ рдХреЛ рд╣рд▓ рдХрд░рддреА рд╣реИрдВ рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдХрд╛рд░реНрдп-рд╡рд┐рд╢рд┐рд╖реНрдЯ рдЕрдкрдбреЗрдЯ рдХреЛ рд╕рд╛рдЭрд╛ рдореЙрдбрд▓ рдХреЗ рд╡реГрджреНрдзрд┐ рдХреЗ рд░реВрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рддреЗ рд╣реИрдВ рд╡рд┐рд╕реНрддрд╛рд░рд┐рдд рд╡рд┐рдзрд┐рдпрд╛рдВ рд╡рд┐рд░рд▓рддрд╛, рдЫрдВрдЯрд╛рдИ, рдорд╛рд╕реНрдХрд┐рдВрдЧ рдЖрджрд┐ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╣рд╕реНрддрдХреНрд╖реЗрдк рдХреЛ рдХрдо рдХрд░рддреА рд╣реИрдВ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдмрд╣реБ-рдХрд╛рд░реНрдп рд╢рд┐рдХреНрд╖рд╛ рд╕рд╛рдЭрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдФрд░ рдЖрдЧрдордирд╛рддреНрдордХ рдкреВрд░реНрд╡рд╛рдЧреНрд░рд╣ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдкреНрд░рджрд░реНрд╢рди рдореЗрдВ рд╕реБрдзрд╛рд░ рдХрд░рддреА рд╣реИ рдкреНрд░рд╡рдгрддрд╛ рд╕рд░реНрдЬрд░реА рдЬреИрд╕реА рд╡рд┐рдзрд┐рдпрд╛рдВ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рдмреАрдЪ рдкреНрд░рд╡рдгрддрд╛ рд╕рдВрдШрд░реНрд╖ рдХреЛ рд╣рд▓ рдХрд░рддреА рд╣реИрдВ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╕рдлрд▓рддрд╛ : рдкрд╣рд▓реА рдмрд╛рд░ рдХрд╛рд░реНрдп рд╕рджрд┐рд╢ рдФрд░ рдкреНрд░рд╡рдгрддрд╛ рдХреЗ рдмреАрдЪ рдХрдареЛрд░ рдЧрдгрд┐рддреАрдп рд╕рдВрдмрдВрдз рд╕реНрдерд╛рдкрд┐рдд рдХрд┐рдпрд╛рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдорд╛рд░реНрдЧрджрд░реНрд╢рди : рдПрдХ epoch рд╕реВрдХреНрд╖реНрдо-рд╕рдорд╛рдпреЛрдЬрди рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рд╕рд┐рджреНрдз рдХреА, рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рдорд╛рд░реНрдЧрджрд░реНрд╢рди рдкреНрд░рджрд╛рди рдХрд░рддреА рд╣реИрдирдпрд╛ рджреГрд╖реНрдЯрд┐рдХреЛрдг : рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХреЛ рдЕрдиреБрдорд╛рдирд┐рдд рдмрд╣реБ-рдХрд╛рд░реНрдп рд╢рд┐рдХреНрд╖рд╛ рдХреЗ рд░реВрдк рдореЗрдВ рдкреБрдирдГ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рддрд╛ рд╣реИрд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдзрд╛рд░рдгрд╛рдПрдВ : рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдкреВрд░реНрдг-рдмреИрдЪ рдкреНрд░рд╡рдгрддрд╛ рдЕрд╡рддрд░рдг рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реИ, рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдореЗрдВ рдЕрдзрд┐рдХрддрд░ SGD рдХрд╛ рдЙрдкрдпреЛрдЧ рд╣реЛрддрд╛ рд╣реИрдиреЗрдЯрд╡рд░реНрдХ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ : рд╕реНрдкрд╖реНрдЯ рд╕реАрдорд╛рдПрдВ рдХреЗрд╡рд▓ рдлреАрдбрдлреЙрд░рд╡рд░реНрдб рдиреЗрдЯрд╡рд░реНрдХ рдХреЗ рд▓рд┐рдП рд╣реИрдВ, рдЖрдзреБрдирд┐рдХ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ (CNN, Transformer) рдЕрдзрд┐рдХ рдЬрдЯрд┐рд▓ рд╣реИрдВрдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд╕реАрдорд╛ : рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рджреГрд╢реНрдп рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рд╕рддреНрдпрд╛рдкрд┐рдд, рдЕрдиреНрдп рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдкреНрд░рдпреЛрдЬреНрдпрддрд╛ рдХреЛ рдЖрдЧреЗ рд╕рддреНрдпрд╛рдкрди рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИSGD рд╕рд┐рджреНрдзрд╛рдВрдд рд╡рд┐рд╕реНрддрд╛рд░ : рд╕рд┐рджреНрдзрд╛рдВрдд рдХреЛ рд╕реНрдЯреЛрдХреЗрд╕реНрдЯрд┐рдХ рдкреНрд░рд╡рдгрддрд╛ рдЕрд╡рддрд░рдг рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рддрдХ рд╡рд┐рд╕реНрддрд╛рд░рд┐рдд рдХрд░реЗрдВрдЬрдЯрд┐рд▓ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ : CNN, Transformer рдЖрджрд┐ рдХреЗ рд▓рд┐рдП рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╕реАрдорд╛рдПрдВ рдкреНрд░рджрд╛рди рдХрд░реЗрдВрджреНрд╡рд┐рддреАрдп-рдХреНрд░рдо рдкрдж рдЕрдиреБрдХреВрд▓рди : рдЕрдиреНрд╡реЗрд╖рдг рдХрд░реЗрдВ рдХрд┐ рджреНрд╡рд┐рддреАрдп-рдХреНрд░рдо рддреНрд░реБрдЯрд┐ рдкрдж рдХрдм рдирдЧрдгреНрдп рдпрд╛ рдЕрдиреБрдорд╛рдирд┐рдд рд╣реЛ рд╕рдХрддрд╛ рд╣реИрдПрдХреАрдХреГрдд рд╕рдордЭ : рдкреНрд░рд╛рд░рдВрднрд┐рдХ рд░реЛрдХрдерд╛рдо, рд╕рдорддрд▓/рддреАрд╡реНрд░ рдиреНрдпреВрдирддрдо рдЖрджрд┐ рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдХреЗ рд╕рд╛рде рд╕рдВрдмрдВрдз рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░реЗрдВрдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдпреЛрдЧрджрд╛рди : рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХреА рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╕рдордЭ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░рд╛рд▓ рдХреЛ рднрд░рддрд╛ рд╣реИрдХрдареЛрд░ рдЧрдгрд┐рддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг : рдкреВрд░реНрдг рдкреНрд░рдорд╛рдг рдФрд░ рд╕реНрдкрд╖реНрдЯ рддреНрд░реБрдЯрд┐ рд╕реАрдорд╛рдПрдВ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИрдкрд░реНрдпрд╛рдкреНрдд рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд╕рддреНрдпрд╛рдкрди : рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпрд╛рдВ рдХрдИ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд╕рдорд░реНрдерди рдкреНрд░рд╛рдкреНрдд рдХрд░рддреА рд╣реИрдВрдЙрдЪреНрдЪ рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдореВрд▓реНрдп : рдореЙрдбрд▓ рд╡рд┐рд▓рдп рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреЗ рд▓рд┐рдП рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдорд╛рд░реНрдЧрджрд░реНрд╢рди рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИрдордЬрдмреВрдд рдзрд╛рд░рдгрд╛ рд╢рд░реНрддреЗрдВ : рдкреВрд░реНрдг-рдмреИрдЪ GD рдзрд╛рд░рдгрд╛ рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд╕реЗ рдЕрд▓рдЧ рд╣реИрдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдкреНрд░рддрд┐рдмрдВрдз : рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдкрд░рд┐рдгрд╛рдо рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рд╕рд░рд▓ рдлреАрдбрдлреЙрд░рд╡рд░реНрдб рдиреЗрдЯрд╡рд░реНрдХ рдкрд░ рд▓рд╛рдЧреВ рд╣реЛрддреЗ рд╣реИрдВрдХрд╛рд░реНрдп рд╕реАрдорд╛ : рдкреНрд░рдпреЛрдЧ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рджреГрд╢реНрдп рд╡рд░реНрдЧреАрдХрд░рдг рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рдХреЗрдВрджреНрд░рд┐рдд рд╣реИрдВрд╢реИрдХреНрд╖рдгрд┐рдХ рдореВрд▓реНрдп : рдореЙрдбрд▓ рд╡рд┐рд▓рдп рдХреНрд╖реЗрддреНрд░ рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИрд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдорд╣рддреНрд╡ : рдЕрдзрд┐рдХ рдХреБрд╢рд▓ рдореЙрдбрд▓ рд╡рд┐рд▓рдп рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреЛ рдирд┐рд░реНрджреЗрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИрдкреНрд░реЗрд░рдгрд╛рджрд╛рдпрдХ : рдмрд╛рдж рдХреЗ рдЕрдиреБрд╕рдВрдзрд╛рди рдХреЗ рд▓рд┐рдП рдирдИ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд░реВрдкрд░реЗрдЦрд╛ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИрдмрд╣реБ-рдХрд╛рд░реНрдп рддреИрдирд╛рддреА : рдХрдИ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ рдореЙрдбрд▓реЛрдВ рдХреЛ рдПрдХреАрдХреГрдд рдореЙрдбрд▓ рдореЗрдВ рд╡рд┐рд▓рдп рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╡рд╛рд▓реЗ рдкрд░рд┐рджреГрд╢реНрдпрд╕рдВрд╕рд╛рдзрди-рд╕реАрдорд┐рдд рд╡рд╛рддрд╛рд╡рд░рдг : рднрдВрдбрд╛рд░рдг рдФрд░ рдХрдореНрдкреНрдпреВрдЯрд┐рдВрдЧ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдореЗрдВ рд╕реАрдорд┐рдд рдЕрдиреБрдкреНрд░рдпреЛрдЧрддреАрд╡реНрд░ рдЕрдиреБрдХреВрд▓рди : рдмрд╣реБ-рдХрд╛рд░реНрдп рдХреНрд╖рдорддрд╛ рддреЗрдЬреА рд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╡рд╛рд▓реЗ рдкрд░рд┐рджреГрд╢реНрдпрдкреЗрдкрд░ рдореЙрдбрд▓ рд╡рд┐рд▓рдп, рдХрд╛рд░реНрдп рд╕рджрд┐рд╢, рдмрд╣реБ-рдХрд╛рд░реНрдп рд╢рд┐рдХреНрд╖рд╛ рдЖрджрд┐ рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдХрд╛рд░реНрдпреЛрдВ рдХрд╛ рд╣рд╡рд╛рд▓рд╛ рджреЗрддрд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
Ilharco et al. (2022) - рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХрд╛ рдореВрд▓ рдХрд╛рд░реНрдп Zhou et al. (2025) - рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐рдореВрд▓рдХ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд Ortiz-Jimenez et al. (2024) - рд╕реНрдкрд░реНрд╢ рдЕрдВрддрд░рд┐рдХреНрд╖ рдореЗрдВ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд Wortsman et al. (2022) - рдореЙрдбрд▓ рд╕реВрдк рд╡рд┐рдзрд┐ рдпрд╣ рдкреЗрдкрд░ рдХрдареЛрд░ рдЧрдгрд┐рддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдХрд╛рд░реНрдп рдЕрдВрдХрдЧрдгрд┐рдд рдХреЗ рд▓рд┐рдП рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ, рди рдХреЗрд╡рд▓ рдЗрд╕рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рдХреЗ рдХрд╛рд░рдгреЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рддрд╛ рд╣реИ, рдмрд▓реНрдХрд┐ рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рдореВрд▓реНрдпрд╡рд╛рди рдорд╛рд░реНрдЧрджрд░реНрд╢рди рднреА рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИред рдпрджреНрдпрдкрд┐ рдХреБрдЫ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдзрд╛рд░рдгрд╛рдУрдВ рдХреА рд╕реАрдорд╛рдПрдВ рд╣реИрдВ, рдХрд┐рдВрддреБ рдЗрд╕рдХрд╛ рдпреЛрдЧрджрд╛рди рдореЙрдбрд▓ рд╡рд┐рд▓рдп рддрдХрдиреАрдХреЛрдВ рдХреЛ рд╕рдордЭрдиреЗ рдФрд░ рд╕реБрдзрд╛рд░рдиреЗ рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИред