2025-11-10T02:42:11.024249

Foreground-Covering Prototype Generation and Matching for SAM-Aided Few-Shot Segmentation

Park, Lee, Seong et al.
We propose Foreground-Covering Prototype Generation and Matching to resolve Few-Shot Segmentation (FSS), which aims to segment target regions in unlabeled query images based on labeled support images. Unlike previous research, which typically estimates target regions in the query using support prototypes and query pixels, we utilize the relationship between support and query prototypes. To achieve this, we utilize two complementary features: SAM Image Encoder features for pixel aggregation and ResNet features for class consistency. Specifically, we construct support and query prototypes with SAM features and distinguish query prototypes of target regions based on ResNet features. For the query prototype construction, we begin by roughly guiding foreground regions within SAM features using the conventional pseudo-mask, then employ iterative cross-attention to aggregate foreground features into learnable tokens. Here, we discover that the cross-attention weights can effectively alternate the conventional pseudo-mask. Therefore, we use the attention-based pseudo-mask to guide ResNet features to focus on the foreground, then infuse the guided ResNet feature into the learnable tokens to generate class-consistent query prototypes. The generation of the support prototype is conducted symmetrically to that of the query one, with the pseudo-mask replaced by the ground-truth mask. Finally, we compare these query prototypes with support ones to generate prompts, which subsequently produce object masks through the SAM Mask Decoder. Our state-of-the-art performances on various datasets validate the effectiveness of the proposed method for FSS. Our official code is available at https://github.com/SuhoPark0706/FCP
academic

рдЕрдЧреНрд░рднрд╛рдЧ-рдЖрд╡рд░рдг рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди рдФрд░ SAM-рд╕рд╣рд╛рдпрдХ рдХреБрдЫ-рд╢реЙрдЯ рд╡рд┐рднрд╛рдЬрди рдХреЗ рд▓рд┐рдП рдорд┐рд▓рд╛рди

рдореВрд▓ рдЬрд╛рдирдХрд╛рд░реА

  • рдкреЗрдкрд░ ID: 2501.00752
  • рд╢реАрд░реНрд╖рдХ: рдЕрдЧреНрд░рднрд╛рдЧ-рдЖрд╡рд░рдг рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди рдФрд░ SAM-рд╕рд╣рд╛рдпрдХ рдХреБрдЫ-рд╢реЙрдЯ рд╡рд┐рднрд╛рдЬрди рдХреЗ рд▓рд┐рдП рдорд┐рд▓рд╛рди
  • рд▓реЗрдЦрдХ: Suho Park*, SuBeen Lee*, Hyun Seok Seong, Jaejoon Yoo, Jae-Pil HeoтАая╝ИSungkyunkwan рд╡рд┐рд╢реНрд╡рд╡рд┐рджреНрдпрд╛рд▓рдпя╝Й
  • рд╡рд░реНрдЧреАрдХрд░рдг: cs.CV (рдХрдВрдкреНрдпреВрдЯрд░ рджреГрд╖реНрдЯрд┐)
  • рдкреНрд░рдХрд╛рд╢рди рддрд┐рдерд┐: 1 рдЬрдирд╡рд░реА 2025 рдХреЛ arXiv рдкрд░ рдкреНрд░рд╕реНрддреБрдд
  • рдкреЗрдкрд░ рд▓рд┐рдВрдХ: https://arxiv.org/abs/2501.00752
  • рдХреЛрдб рд▓рд┐рдВрдХ: https://github.com/SuhoPark0706/FCP

рд╕рд╛рд░рд╛рдВрд╢

рдпрд╣ рдкреЗрдкрд░ рдХреБрдЫ-рд╢реЙрдЯ рд╡рд┐рднрд╛рдЬрди (FSS) рд╕рдорд╕реНрдпрд╛ рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдЧреНрд░рднрд╛рдЧ-рдЖрд╡рд░рдг рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди рдФрд░ рдорд┐рд▓рд╛рди рд╡рд┐рдзрд┐ (FCP) рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИред рдкреВрд░реНрд╡рд╡рд░реНрддреА рдЕрдиреБрд╕рдВрдзрд╛рди рдЖрдорддреМрд░ рдкрд░ рд╕рдорд░реНрдерди рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдФрд░ рдХреНрд╡реЗрд░реА рдкрд┐рдХреНрд╕реЗрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд▓рдХреНрд╖реНрдп рдХреНрд╖реЗрддреНрд░ рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рддрд╛ рд╣реИ, рдЬрдмрдХрд┐ рдпрд╣ рдкреЗрдкрд░ рд╕рдорд░реНрдерди рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдФрд░ рдХреНрд╡реЗрд░реА рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред рдпрд╣ рд╡рд┐рдзрд┐ рджреЛ рдкреВрд░рдХ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЛ рдЬреЛрдбрд╝рддреА рд╣реИ: рдкрд┐рдХреНрд╕реЗрд▓ рдПрдХрддреНрд░реАрдХрд░рдг рдХреЗ рд▓рд┐рдП SAM рдЫрд╡рд┐ рдПрдирдХреЛрдбрд░ рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рдФрд░ рд╡рд░реНрдЧ рд╕рд╛рдордВрдЬрд╕реНрдп рдХреЗ рд▓рд┐рдП ResNet рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВред рд╕рдорд░реНрдерди рдФрд░ рдХреНрд╡реЗрд░реА рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рдХреЗ, рдФрд░ ResNet рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд▓рдХреНрд╖реНрдп рдХреНрд╖реЗрддреНрд░ рдХреЗ рдХреНрд╡реЗрд░реА рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдХреЛ рдЕрд▓рдЧ рдХрд░рдХреЗ, рдЕрдВрдд рдореЗрдВ SAM рдорд╛рд╕реНрдХ рдбрд┐рдХреЛрдбрд░ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╡рд╕реНрддреБ рдорд╛рд╕реНрдХ рдЙрддреНрдкрдиреНрди рдХрд░рдХреЗ, рдХрдИ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдЕрдиреБрд╕рдВрдзрд╛рди рдкреГрд╖реНрдарднреВрдорд┐ рдФрд░ рдкреНрд░реЗрд░рдгрд╛

рд╕рдорд╕реНрдпрд╛ рдкрд░рд┐рднрд╛рд╖рд╛

рдХреБрдЫ-рд╢реЙрдЯ рд╡рд┐рднрд╛рдЬрди (Few-Shot Segmentation, FSS) рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рдХрдо рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рдЪрд┐рд╣реНрдирд┐рдд рд╕рдорд░реНрдерди рдЫрд╡рд┐рдпреЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдЕрдЪрд┐рд╣реНрдирд┐рдд рдХреНрд╡реЗрд░реА рдЫрд╡рд┐рдпреЛрдВ рдореЗрдВ рд▓рдХреНрд╖реНрдп рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЛ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рдирд╛ рд╣реИред рдпрд╣ рдХрдВрдкреНрдпреВрдЯрд░ рджреГрд╖реНрдЯрд┐ рдореЗрдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдХрд╛рд░реНрдп рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рдкрд╛рд░рдВрдкрд░рд┐рдХ рд╕рд┐рдореЗрдВрдЯрд┐рдХ рд╡рд┐рднрд╛рдЬрди рд╡рд┐рдзрд┐рдпреЛрдВ рдХреЛ рдмрдбрд╝реА рдорд╛рддреНрд░рд╛ рдореЗрдВ рдЪрд┐рд╣реНрдирд┐рдд рдбреЗрдЯрд╛ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ, рдЬрдмрдХрд┐ FSS рдорд╛рдирд╡ рдПрдиреЛрдЯреЗрд╢рди рдХреЗ рдмреЛрдЭ рдХреЛ рдХрд╛рдлреА рдХрдо рдХрд░ рд╕рдХрддрд╛ рд╣реИред

рдореМрдЬреВрджрд╛ рд╡рд┐рдзрд┐рдпреЛрдВ рдХреА рд╕реАрдорд╛рдПрдВ

  1. SAM рдХреА рд╕реАрдорд╛рдПрдВ: рд╣рд╛рд▓рд╛рдВрдХрд┐ Segment Anything Model (SAM) рд╡рд┐рднрд╛рдЬрди рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рдЙрддреНрдХреГрд╖реНрдЯ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЗрд╕рдореЗрдВ рдХреНрд░реЙрд╕-рдЗрдореЗрдЬ рд╡рд░реНрдЧ рд╕рд╛рдордВрдЬрд╕реНрдп рдХреА рдХрдореА рд╣реИ рдФрд░ рдпрд╣ рд╕рдорд░реНрдерди рдЫрд╡рд┐ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдХреНрд╡реЗрд░реА рдЫрд╡рд┐ рдХреЗ рдЕрдЧреНрд░рднрд╛рдЧ рдХреНрд╖реЗрддреНрд░ рдХреЛ рд╡рд░реНрдЧреАрдХреГрдд рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ред
  2. VRP-SAM рдХреА рдХрдорд┐рдпрд╛рдВ:
    • рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рдкрд┐рдХреНрд╕реЗрд▓ рдорд┐рд▓рд╛рди рд╕рдВрдмрдВрдз рдЙрдк-рдЗрд╖реНрдЯрддрдо рд╣реИ, рдЬрд┐рд╕рд╕реЗ рджреГрд╢реНрдп рд╕рдВрджрд░реНрдн рд╕рдВрдХреЗрдд рдореЗрдВ рдкрд░реНрдпрд╛рдкреНрдд рдЕрдЧреНрд░рднрд╛рдЧ рдЬрд╛рдирдХрд╛рд░реА рдХреА рдХрдореА рд╣реЛ рд╕рдХрддреА рд╣реИ рдпрд╛ рдкреГрд╖реНрдарднреВрдорд┐ рддрддреНрд╡ рд╢рд╛рдорд┐рд▓ рд╣реЛ рд╕рдХрддреЗ рд╣реИрдВ
    • рд╕рд░рд▓ рдкрд┐рдХреНрд╕реЗрд▓-рд╕реЗ-рдкрд┐рдХреНрд╕реЗрд▓ рд╕рдорд╛рдирддрд╛ рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдкрд╛рд░рдВрдкрд░рд┐рдХ рдЫрджреНрдо рдорд╛рд╕реНрдХ рдХреА рдЧреБрдгрд╡рддреНрддрд╛ рдХрдо рд╣реИ
    • рдХреНрд╡реЗрд░реА рдЕрдЧреНрд░рднрд╛рдЧ рдкрд┐рдХреНрд╕реЗрд▓ рдХреЛ рдЪреБрдирд┐рдВрджрд╛ рд░реВрдк рд╕реЗ рдмрдврд╝рд╛рдирд╛ рдореБрд╢реНрдХрд┐рд▓ рд╣реИ, рдЬреЛ рдЕрдЧреНрд░рднрд╛рдЧ рдФрд░ рдкреГрд╖реНрдарднреВрдорд┐ рдкрд┐рдХреНрд╕реЗрд▓ рдХреЗ рдмреАрдЪ рдЕрдВрддрд░ рдХреЛ рдзреБрдВрдзрд▓рд╛ рдХрд░ рд╕рдХрддрд╛ рд╣реИ

рдЕрдиреБрд╕рдВрдзрд╛рди рдкреНрд░реЗрд░рдгрд╛

рдпрд╣ рдкреЗрдкрд░ рдкрд╛рддрд╛ рд╣реИ рдХрд┐ SAM рдЫрд╡рд┐ рдПрдирдХреЛрдбрд░ рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рдкрд┐рдХреНрд╕реЗрд▓-рд╕реНрддрд░реАрдп рдПрдХрддреНрд░реАрдХрд░рдг рдореЗрдВ рдЙрддреНрдХреГрд╖реНрдЯ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддреА рд╣реИрдВ, рдЬрдмрдХрд┐ ResNet рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рд╡рд░реНрдЧ рд╕рд╛рдордВрдЬрд╕реНрдп рдореЗрдВ рдЕрдзрд┐рдХ рдордЬрдмреВрдд рд╣реИрдВред рдЗрд╕ рдЕрд╡рд▓реЛрдХрди рдХреЗ рдЖрдзрд╛рд░ рдкрд░, рдЕрдзрд┐рдХ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рджреГрд╢реНрдп рд╕рдВрджрд░реНрдн рд╕рдВрдХреЗрдд рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рд╕реЗ-рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдорд┐рд▓рд╛рди рд░рдгрдиреАрддрд┐ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХреА рдЧрдИ рд╣реИред

рдореБрдЦреНрдп рдпреЛрдЧрджрд╛рди

  1. рдЕрдЧреНрд░рднрд╛рдЧ-рдЖрд╡рд░рдг рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди рдФрд░ рдорд┐рд▓рд╛рди рд╡рд┐рдзрд┐ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд: рд╕рдорд░реНрдерди рдФрд░ рдХреНрд╡реЗрд░реА рдЫрд╡рд┐рдпреЛрдВ рдХреЗ рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдХрд╛ рдирд┐рд░реНрдорд╛рдг, рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдХреЗ рдмреАрдЪ рддреБрд▓рдирд╛ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рджреГрд╢реНрдп рд╕рдВрджрд░реНрдн рд╕рдВрдХреЗрдд рдЙрддреНрдкрдиреНрди рдХрд░рдирд╛, рдФрд░ SAM рдорд╛рд╕реНрдХ рдбрд┐рдХреЛрдбрд░ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдХреНрд╡реЗрд░реА рдЫрд╡рд┐ рдХрд╛ рд╡рд╕реНрддреБ рдорд╛рд╕реНрдХ рдЙрддреНрдкрдиреНрди рдХрд░рдирд╛ред
  2. рджреЛрд╣рд░реА-рд╡рд┐рд╢реЗрд╖рддрд╛ рд╕рдВрд▓рдпрди рд░рдгрдиреАрддрд┐: SAM рдЫрд╡рд┐ рдПрдирдХреЛрдбрд░ рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреА рдЙрддреНрдХреГрд╖реНрдЯ рдПрдХрддреНрд░реАрдХрд░рдг рдХреНрд╖рдорддрд╛ рдФрд░ ResNet рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреА рд╡рд░реНрдЧ рд╕рд╛рдордВрдЬрд╕реНрдп рдХрд╛ рдкреНрд░рднрд╛рд╡реА рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЕрдЧреНрд░рднрд╛рдЧ-рдХреЗрдВрджреНрд░рд┐рдд рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЙрддреНрдкрдиреНрди рдХрд░рдирд╛ред
  3. рдзреНрдпрд╛рди-рдирд┐рд░реНрджреЗрд╢рд┐рдд рдЫрджреНрдо рдорд╛рд╕реНрдХ: рдзреНрдпрд╛рди-рдЖрдзрд╛рд░рд┐рдд рдЫрджреНрдо рдорд╛рд╕реНрдХ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рдирд╛, рдЬреЛ SAM рдЫрд╡рд┐ рдПрдирдХреЛрдбрд░ рд╡рд┐рд╢реЗрд╖рддрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдЫрджреНрдо рдорд╛рд╕реНрдХ рдХреЛ рдкреНрд░рднрд╛рд╡реА рд░реВрдк рд╕реЗ рдкреНрд░рддрд┐рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддрд╛ рд╣реИред
  4. рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛: рдХрдИ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рд╕реЗ-рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдорд┐рд▓рд╛рди рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рдХреЛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рдирд╛, рдирдИ рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛ред

рд╡рд┐рдзрд┐ рд╡рд┐рд╡рд░рдг

рдХрд╛рд░реНрдп рдкрд░рд┐рднрд╛рд╖рд╛

FSS рдореЗрдЯрд╛-рд▓рд░реНрдирд┐рдВрдЧ рд╡рд┐рдзрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ, рджреЛ рд╕реНрд╡рддрдВрддреНрд░ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ: рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕реЗрдЯ D_train рдФрд░ рдкрд░реАрдХреНрд╖рдг рд╕реЗрдЯ D_test, рдЬрд┐рд╕рдореЗрдВ рдЧреИрд░-рдЕрддрд┐рд╡реНрдпрд╛рдкреА рд╡рд░реНрдЧ C_base рдФрд░ C_novel рд╢рд╛рдорд┐рд▓ рд╣реИрдВред рдкреНрд░рддреНрдпреЗрдХ episode рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:

  • рд╕рдорд░реНрдерди рд╕реЗрдЯ: K рдЪрд┐рд╣реНрдирд┐рдд рдЫрд╡рд┐рдпрд╛рдВ S = {(I_Si, M_Si)}^K_
  • рдХреНрд╡реЗрд░реА рд╕реЗрдЯ: рдПрдХ рдЕрдЪрд┐рд╣реНрдирд┐рдд рдЫрд╡рд┐ Q = (I_Q, M_Q)

рд▓рдХреНрд╖реНрдп рд╕рдорд░реНрдерди рд╕реЗрдЯ рдФрд░ рдХреНрд╡реЗрд░реА рдЫрд╡рд┐ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдХреНрд╡реЗрд░реА рдорд╛рд╕реНрдХ M_pred рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдирд╛ рд╣реИред

рдореЙрдбрд▓ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░

1. рд╕рдорд░реНрдерди рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди

рд╕рдорд░реНрдерди рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдореЗрдВ рджреЛ рдореБрдЦреНрдп рдЪрд░рдг рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:

рдЕрдЧреНрд░рднрд╛рдЧ рд╡рд┐рд╢реЗрд╖рддрд╛ рдПрдХрддреНрд░реАрдХрд░рдг:

с╕а_S = ConvG(Concat(G_S, M_S, MP(G_S, M_S)))  (1)

ground truth рдорд╛рд╕реНрдХ M_S рджреНрд╡рд╛рд░рд╛ SAM рд╡рд┐рд╢реЗрд╖рддрд╛ G_S рдХреЛ рдирд┐рд░реНрджреЗрд╢рд┐рдд рдХрд░рдирд╛, рдлрд┐рд░ T-1 рдЪрд░рдгреЛрдВ рдХреЗ рдкреБрдирд░рд╛рд╡реГрддреНрдд рдХреНрд░реЙрд╕-рдзреНрдпрд╛рди рдПрдХрддреНрд░реАрдХрд░рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЕрдЧреНрд░рднрд╛рдЧ рдЬрд╛рдирдХрд╛рд░реА рдХреЛ рдПрдХрддреНрд░рд┐рдд рдХрд░рдирд╛:

P^t_S = MaskedCrossAttn(P^{t-1}_S, с╕а_S, с╕а_S; M_S)  (2)

рд╡рд░реНрдЧ рд╕рд╛рдордВрдЬрд╕реНрдп рдЗрдВрдЬреЗрдХреНрд╢рди:

F╠Д_S = ConvG(Concat(F_S, M_S, MP(F_S, M_S)))  (3)
P^T_S = MaskedCrossAttn(P^{T-1}_S, с╕а_S, F╠Д_S; M_S)  (4)

2. рдХреНрд╡реЗрд░реА рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди

рдХреНрд╡реЗрд░реА рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдЬрдирди рдХреЛ ground truth рдорд╛рд╕реНрдХ рдХреЗ рдмрд┐рдирд╛ рдЪреБрдиреМрддреА рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рддрд╛ рд╣реИ, рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд░рдгрдиреАрддрд┐ рдЕрдкрдирд╛рдИ рдЬрд╛рддреА рд╣реИ:

рдкрд╛рд░рдВрдкрд░рд┐рдХ рдЫрджреНрдо рдорд╛рд╕реНрдХ рдЧрдгрдирд╛:

M^pseudo_{h,w} = \max_{1тЙдh'тЙдH,1тЙдw'тЙдW} M_S^{h',w'}(F^Q_{h,w} ┬╖ F^S_{h',w'})  (5)

SAM рд╡рд┐рд╢реЗрд╖рддрд╛ рдПрдХрддреНрд░реАрдХрд░рдг:

с╕а_Q = ConvG(Concat(G_Q, M^{pseudo}, MP(G_S, M_S)))  (6)
P^t_Q = CrossAttn(P^{t-1}_Q, с╕а_Q, с╕а_Q)  (7)

рдзреНрдпрд╛рди-рдирд┐рд░реНрджреЗрд╢рд┐рдд рдЫрджреНрдо рдорд╛рд╕реНрдХ:

M^{attn}_{t,h,w} = \max_{1тЙдnтЙдN} A^Q_{t,n,h,w}  (8)

рдирд┐рд░реНрджреЗрд╢рд┐рдд рд╣рд╛рдирд┐:

L_{guide} = \frac{1}{T-1} \sum^{T-1}_{t=1} L_{BCE}(M^{attn}_t, M_Q) + L_{DL}(M^{attn}_t, M_Q)  (9)

ResNet рд╡рд┐рд╢реЗрд╖рддрд╛ рд╕рдВрд▓рдпрди:

F╠Д_Q = ConvF(Concat(F_Q, M^{attn}_{T-1}, MP(F_S, M_S)))  (10)
P^T_Q = CrossAttn(P^{T-1}_Q, с╕а_Q, F╠Д_Q)  (11)

3. рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рд╕реЗ-рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдорд┐рд▓рд╛рди

рдХреНрд░реЙрд╕-рдзреНрдпрд╛рди рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рджреГрд╢реНрдп рд╕рдВрджрд░реНрдн рд╕рдВрдХреЗрдд рдЙрддреНрдкрдиреНрди рдХрд░рдирд╛:

V = CrossAttn(P^T_S, P^T_Q, P^T_Q)  (12)

рд╣рд╛рдирд┐ рдлрд▓рди

рдХреБрд▓ рд╣рд╛рдирд┐ рдореЗрдВ рддреАрди рдШрдЯрдХ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:

L_{total} = L_{prompt} + ╬╗_{ortho}L_{ortho} + ╬╗_{guide}L_{guide}  (15)
  • рд╕рдВрдХреЗрдд рд╣рд╛рдирд┐: L_prompt = L_BCE(M_pred, M_Q) + L_DL(M_pred, M_Q)
  • рдСрд░реНрдереЛрдЧреЛрдирд▓ рд╣рд╛рдирд┐: рд╡рд┐рднрд┐рдиреНрди рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдХреЛ рд╡рд┐рднрд┐рдиреНрди рдЬрд╛рдирдХрд╛рд░реА рдПрдирдХреЛрдб рдХрд░рдирд╛ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рддрд╛ рд╣реИ
  • рдирд┐рд░реНрджреЗрд╢рд┐рдд рд╣рд╛рдирд┐: рдзреНрдпрд╛рди рдХреЛ рдЕрдЧреНрд░рднрд╛рдЧ рдХреНрд╖реЗрддреНрд░ рдкрд░ рдХреЗрдВрджреНрд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдирд┐рд░реНрджреЗрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИ

рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд╕реЗрдЯрдЕрдк

рдбреЗрдЯрд╛рд╕реЗрдЯ

  • PASCAL-5i: PASCAL VOC 2012 рдФрд░ SDS рд╕реЗ 20 рд╡рд░реНрдЧ, 4 fold рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд, рдкреНрд░рддреНрдпреЗрдХ fold рдореЗрдВ 15 рдЖрдзрд╛рд░ рд╡рд░реНрдЧ рдФрд░ 5 рдирдП рд╡рд░реНрдЧ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ
  • COCO-20i: COCO рдбреЗрдЯрд╛рд╕реЗрдЯ рд╕реЗ 80 рд╡рд░реНрдЧ, 4 fold рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд, рдкреНрд░рддреНрдпреЗрдХ fold рдореЗрдВ 60 рдЖрдзрд╛рд░ рд╡рд░реНрдЧ рдФрд░ 20 рдирдП рд╡рд░реНрдЧ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ

рдореВрд▓реНрдпрд╛рдВрдХрди рдореЗрдЯреНрд░рд┐рдХреНрд╕

рдФрд╕рдд рдкреНрд░рддрд┐рдЪреНрдЫреЗрджрди рд╕рдВрдШ (mean Intersection over Union, mIoU) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдирдП рд╡рд░реНрдЧреЛрдВ рдореЗрдВ 1000 рд╕рдорд░реНрдерди-рдХреНрд╡реЗрд░реА рдЬреЛрдбрд╝реЗ рдХреЛ рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рд░реВрдк рд╕реЗ рдирдореВрдирд╛ рд▓рд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рд╡рд┐рд╡рд░рдг

  • рдСрдкреНрдЯрд┐рдорд╛рдЗрдЬрд╝рд░: AdamW, рдХреЛрд╕рд╛рдЗрди рдПрдиреАрд▓рд┐рдВрдЧ рд╢реЗрдбреНрдпреВрд▓
  • PASCAL-5i: 100 epochs, рд╕реАрдЦрдиреЗ рдХреА рджрд░ 2e-4
  • COCO-20i: 50 epochs, рд╕реАрдЦрдиреЗ рдХреА рджрд░ 1e-4
  • рдмреИрдЪ рдЖрдХрд╛рд░: 8
  • рд╕реАрдЦрдиреЗ рдпреЛрдЧреНрдп token рд╕рдВрдЦреНрдпрд╛: 50
  • рдПрдХрддреНрд░реАрдХрд░рдг рдкрд░рддреЗрдВ: T=3
  • рд╣рд╛рдирд┐ рдЧреБрдгрд╛рдВрдХ: ╬╗_ortho=0.05, ╬╗_guide=0.5

рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рдкрд░рд┐рдгрд╛рдо

рдореБрдЦреНрдп рдкрд░рд┐рдгрд╛рдо

PASCAL-5i рдФрд░ COCO-20i рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рдкрд░рд┐рдгрд╛рдо рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ рдХрд┐ рдпрд╣ рд╡рд┐рдзрд┐ рд╕рднреА рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдореЗрдВ рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд░рддреА рд╣реИ:

PASCAL-5i рдбреЗрдЯрд╛рд╕реЗрдЯ (ResNet-50):

  • 1-shot: 73.2% mIoU (VRP-SAM рдХреЗ 71.8% рдХреА рддреБрд▓рдирд╛ рдореЗрдВ 1.4% рд╕реБрдзрд╛рд░)
  • 5-shot: 74.0% mIoU (VRP-SAM рдХреЗ 71.4% рдХреА рддреБрд▓рдирд╛ рдореЗрдВ 2.6% рд╕реБрдзрд╛рд░)

COCO-20i рдбреЗрдЯрд╛рд╕реЗрдЯ (ResNet-50):

  • 1-shot: 52.5% mIoU (VRP-SAM рдХреЗ 50.2% рдХреА рддреБрд▓рдирд╛ рдореЗрдВ 2.3% рд╕реБрдзрд╛рд░)
  • 5-shot: 58.0% mIoU (VRP-SAM рдХреЗ 55.5% рдХреА рддреБрд▓рдирд╛ рдореЗрдВ 2.5% рд╕реБрдзрд╛рд░)

рд╡рд┐рд▓реЛрдкрди рдкреНрд░рдпреЛрдЧ

рдореБрдЦреНрдп рдШрдЯрдХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг:

  • рдХреЗрд╡рд▓ ResNet рд╡рд┐рд╢реЗрд╖рддрд╛ (рдЖрдзрд╛рд░рднреВрдд): 71.8% mIoU
  • рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рд╕реЗ-рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдорд┐рд▓рд╛рди рдЬреЛрдбрд╝рдирд╛: 72.6% mIoU (+0.8%)
  • рдзреНрдпрд╛рди-рдирд┐рд░реНрджреЗрд╢рд┐рдд рдЫрджреНрдо рдорд╛рд╕реНрдХ рдЬреЛрдбрд╝рдирд╛: 73.2% mIoU (+1.4%)

рдПрдХрддреНрд░реАрдХрд░рдг рдЪрд░рдгреЛрдВ T рдХрд╛ рдкреНрд░рднрд╛рд╡:

  • T=3 рдкрд░ рд╕рд░реНрд╡реЛрддреНрддрдо рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рд╣реЛрддрд╛ рд╣реИ
  • рдЕрддреНрдпрдзрд┐рдХ рдЪрд░рдг рдкреНрд░рджрд░реНрд╢рди рдореЗрдВ рдЧрд┐рд░рд╛рд╡рдЯ рдХрд╛ рдХрд╛рд░рдг рдмрдирддреЗ рд╣реИрдВ, рдХреНрдпреЛрдВрдХрд┐ token рдЫреЛрдЯреЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдкрд░ рдЕрддреНрдпрдзрд┐рдХ рдХреЗрдВрджреНрд░рд┐рдд рд╣реЛ рдЬрд╛рддреЗ рд╣реИрдВ

рд╣рд╛рдирд┐ рдлрд▓рди рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛:

  • рдХреЗрд╡рд▓ рд╕рдВрдХреЗрдд рд╣рд╛рдирд┐: 72.3% mIoU
  • рдирд┐рд░реНрджреЗрд╢рд┐рдд рд╣рд╛рдирд┐ рдЬреЛрдбрд╝рдирд╛: 72.7% mIoU (+0.4%)
  • рдСрд░реНрдереЛрдЧреЛрдирд▓ рд╣рд╛рдирд┐ рдЬреЛрдбрд╝рдирд╛: 72.4% mIoU (+0.1%)
  • рд╕рднреА рд╣рд╛рдирд┐: 73.2% mIoU (+0.9%)

рдЫрджреНрдо рдорд╛рд╕реНрдХ рдЧреБрдгрд╡рддреНрддрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг

рдзреНрдпрд╛рди-рдирд┐рд░реНрджреЗрд╢рд┐рдд рдЫрджреНрдо рдорд╛рд╕реНрдХ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдЫрджреНрдо рдорд╛рд╕реНрдХ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕реБрдзрд╛рд░ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ:

  • mIoU: 60.9% vs 32.4%
  • рд╕рдЯреАрдХрддрд╛: 69.1% vs 46.5%
  • рд░рд┐рдХреЙрд▓: 79.4% vs 53.6%

рд╕рдВрдмрдВрдзрд┐рдд рдХрд╛рд░реНрдп

рджреГрд╢реНрдп рдЖрдзрд╛рд░ рдореЙрдбрд▓

SAM рд╡рд┐рднрд╛рдЬрди рдХреНрд╖реЗрддреНрд░ рдореЗрдВ рдПрдХ рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рд░реНрдп рдХрд░рддрд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рд╕рдВрдХреЗрдд рдпреЛрдЧреНрдп рдбрд┐рдЬрд╝рд╛рдЗрди рдФрд░ рдордЬрдмреВрдд рд╢реВрдиреНрдп-рд╢реЙрдЯ рдХреНрд╖рдорддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдХреНрд░реЙрд╕-рдЗрдореЗрдЬ рд╡рд░реНрдЧ рд╕рд╛рдордВрдЬрд╕реНрдп рдХреА рдХрдореА рд╣реИред

рдХреБрдЫ-рд╢реЙрдЯ рд╡рд┐рднрд╛рдЬрди рд╡рд┐рдзрд┐рдпрд╛рдВ

рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рджреЛ рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд:

  1. рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рдЖрдзрд╛рд░рд┐рдд рд╡рд┐рдзрд┐рдпрд╛рдВ: рд╕рдорд░реНрдерди рдЕрдЧреНрд░рднрд╛рдЧ рдХреЛ рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдХреЗ рд░реВрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдирд╛ рдФрд░ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛
  2. рдЖрддреНрдореАрдпрддрд╛ рд╕реАрдЦрдиреЗ рдХреА рд╡рд┐рдзрд┐рдпрд╛рдВ: рд╕рдорд░реНрдерди рдФрд░ рдХреНрд╡реЗрд░реА рдЫрд╡рд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдкрд┐рдХреНрд╕реЗрд▓-рд╕реНрддрд░реАрдп рдШрдиреА рд╕рд╣рд╕рдВрдмрдВрдзрд┐рддрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛

VRP-SAM рдиреЗ SAM рдорд╛рд╕реНрдХ рдбрд┐рдХреЛрдбрд░ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рд╕рдВрдХреЗрдд рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдХреА рд╡рд┐рдзрд┐ рдкреЗрд╢ рдХреА, рд▓реЗрдХрд┐рди рдкрд┐рдХреНрд╕реЗрд▓-рд╕реНрддрд░реАрдп рддреБрд▓рдирд╛ рдореЗрдВ рд╕реАрдорд╛рдПрдВ рд╣реИрдВред

рдирд┐рд╖реНрдХрд░реНрд╖ рдФрд░ рдЪрд░реНрдЪрд╛

рдореБрдЦреНрдп рдирд┐рд╖реНрдХрд░реНрд╖

  1. рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рд╕реЗ-рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдорд┐рд▓рд╛рди рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рд╕реЗ-рдкрд┐рдХреНрд╕реЗрд▓ рдорд┐рд▓рд╛рди рд╕реЗ рдЕрдзрд┐рдХ рдкреНрд░рднрд╛рд╡реА рд╣реИ
  2. SAM рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреА рдПрдХрддреНрд░реАрдХрд░рдг рдХреНрд╖рдорддрд╛ рдФрд░ ResNet рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреА рд╡рд░реНрдЧ рд╕рд╛рдордВрдЬрд╕реНрдп рдкреВрд░рдХ рд╣реИрдВ
  3. рдзреНрдпрд╛рди-рдирд┐рд░реНрджреЗрд╢рд┐рдд рдЫрджреНрдо рдорд╛рд╕реНрдХ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдЫрджреНрдо рдорд╛рд╕реНрдХ рд╕реЗ рдХрд╛рдлреА рдмреЗрд╣рддрд░ рд╣реИ
  4. рдХрдИ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдЕрддреНрдпрд╛рдзреБрдирд┐рдХ рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ

рд╕реАрдорд╛рдПрдВ

  1. SAM рдФрд░ ResNet рджреЛрдиреЛрдВ рдкреВрд░реНрд╡-рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдореЙрдбрд▓ рдкрд░ рдирд┐рд░реНрднрд░рддрд╛, рдЬреЛ рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рдЬрдЯрд┐рд▓рддрд╛ рдмрдврд╝рд╛рддреА рд╣реИ
  2. рд╡рд┐рдзрд┐ рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдкреНрд░рд╛рдХреГрддрд┐рдХ рдЫрд╡рд┐рдпреЛрдВ рдкрд░ рд╕рддреНрдпрд╛рдкрд┐рдд рдХреА рдЧрдИ рд╣реИ, рдЕрдиреНрдп рдбреЛрдореЗрди рдореЗрдВ рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдХреНрд╖рдорддрд╛ рдХреЛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ
  3. рд╣рд╛рдЗрдкрд░рдкреИрд░рд╛рдореАрдЯрд░ (рдЬреИрд╕реЗ T, ╬╗ рдорд╛рди) рдХреЛ рд╡рд┐рднрд┐рдиреНрди рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд▓рд┐рдП рд╕рдорд╛рдпреЛрдЬрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ

рднрд╡рд┐рд╖реНрдп рдХреА рджрд┐рд╢рд╛рдПрдВ

  1. рдЕрдзрд┐рдХ рд╣рд▓реНрдХреЗ-рдлреБрд▓реНрдХреЗ рд╡рд┐рд╢реЗрд╖рддрд╛ рд╕рдВрд▓рдпрди рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреА рдЦреЛрдЬ рдХрд░рдирд╛
  2. рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдЫрд╡рд┐рдпреЛрдВ рдЬреИрд╕реЗ рд╡рд┐рд╢рд┐рд╖реНрдЯ рдбреЛрдореЗрди рдореЗрдВ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдХрд╛ рдЕрдиреБрд╕рдВрдзрд╛рди рдХрд░рдирд╛
  3. рдзреНрдпрд╛рди рддрдВрддреНрд░ рдХреА рджрдХреНрд╖рддрд╛ рдФрд░ рд╕рдЯреАрдХрддрд╛ рдХреЛ рдФрд░ рдмрдврд╝рд╛рдирд╛

рдЧрд╣рди рдореВрд▓реНрдпрд╛рдВрдХрди

рд▓рд╛рдн

  1. рддрдХрдиреАрдХреА рдирд╡рд╛рдЪрд╛рд░ рдордЬрдмреВрдд: рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк-рд╕реЗ-рдкреНрд░реЛрдЯреЛрдЯрд╛рдЗрдк рдорд┐рд▓рд╛рди рдХрд╛ рдирдпрд╛ рдкреНрд░рддрд┐рдорд╛рди рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИ, рджреЛрдиреЛрдВ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреА рдкреВрд░рдХрддрд╛ рдХрд╛ рдкреНрд░рднрд╛рд╡реА рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ
  2. рдкреНрд░рдпреЛрдЧ рд╡реНрдпрд╛рдкрдХ: рдХрдИ рдбреЗрдЯрд╛рд╕реЗрдЯ рдФрд░ рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдореЗрдВ рд╡реНрдпрд╛рдкрдХ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рд╕рддреНрдпрд╛рдкрди рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ
  3. рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдЧрд╣рди: рджреГрд╢реНрдп рдФрд░ рдорд╛рддреНрд░рд╛рддреНрдордХ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рд╡рд┐рдзрд┐ рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХреА рдЧрдИ рд╣реИ
  4. рд▓реЗрдЦрди рд╕реНрдкрд╖реНрдЯ: рдкреЗрдкрд░ рд╕рдВрд░рдЪрдирд╛ рддрд╛рд░реНрдХрд┐рдХ рд╣реИ, рддрдХрдиреАрдХреА рд╡рд┐рд╡рд░рдг рд╕рдЯреАрдХ рд░реВрдк рд╕реЗ рд╡рд░реНрдгрд┐рдд рд╣реИрдВ

рдХрдорд┐рдпрд╛рдВ

  1. рдХрдореНрдкреНрдпреВрдЯреЗрд╢рдирд▓ рдЬрдЯрд┐рд▓рддрд╛: SAM рдФрд░ ResNet рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХрд╛ рдПрдХ рд╕рд╛рде рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛, рдЬреЛ рдЕрдиреБрдорд╛рди рд╕рдордп рдмрдврд╝рд╛ рд╕рдХрддрд╛ рд╣реИ
  2. рдкреИрд░рд╛рдореАрдЯрд░ рд╕рдВрд╡реЗрджрдирд╢реАрд▓рддрд╛: рдХрдИ рд╣рд╛рдЗрдкрд░рдкреИрд░рд╛рдореАрдЯрд░ рдХреА рд╕реЗрдЯрд┐рдВрдЧ рд╡рд┐рдзрд┐ рдХреА рд╕реНрдерд┐рд░рддрд╛ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░ рд╕рдХрддреА рд╣реИ
  3. рд╕рд╛рдорд╛рдиреНрдпреАрдХрд░рдг рдХреНрд╖рдорддрд╛: рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдкреНрд░рд╛рдХреГрддрд┐рдХ рдЫрд╡рд┐ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рд╕рддреНрдпрд╛рдкрд┐рдд, рдЕрдиреНрдп рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдкреНрд░рднрд╛рд╡ рдЕрдЬреНрдЮрд╛рдд рд╣реИ

рдкреНрд░рднрд╛рд╡

  1. рд╢реИрдХреНрд╖рдгрд┐рдХ рдпреЛрдЧрджрд╛рди: рдХреБрдЫ-рд╢реЙрдЯ рд╡рд┐рднрд╛рдЬрди рдХреЗ рд▓рд┐рдП рдирдпрд╛ рддрдХрдиреАрдХреА рдкрде рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ, рднрд╡рд┐рд╖реНрдп рдХреЗ рдЕрдиреБрд╕рдВрдзрд╛рди рдХреЛ рдкреНрд░реЗрд░рд┐рдд рдХрд░ рд╕рдХрддрд╛ рд╣реИ
  2. рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рдореВрд▓реНрдп: рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдореЗрдВ рдПрдиреЛрдЯреЗрд╢рди рд▓рд╛рдЧрдд рдХреЛ рдХрдо рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рдЙрдЪреНрдЪ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ
  3. рдкреБрдирд░реБрддреНрдкрд╛рджрдиреАрдпрддрд╛: рд╡рд┐рд╕реНрддреГрдд рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рд╡рд┐рд╡рд░рдг рдФрд░ рдЦреБрд▓рд╛ рд╕реНрд░реЛрдд рдХреЛрдб рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИ, рдкреБрдирд░реБрддреНрдкрд╛рджрди рдФрд░ рд╕реБрдзрд╛рд░ рдХреЛ рд╕реБрд╡рд┐рдзрд╛рдЬрдирдХ рдмрдирд╛рддрд╛ рд╣реИ

рд▓рд╛рдЧреВ рдкрд░рд┐рджреГрд╢реНрдп

  1. рдирдИ рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреЗ рд▓рд┐рдП рддреЗрдЬреА рд╕реЗ рдЕрдиреБрдХреВрд▓рди рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╡рд╛рд▓реЗ рд╡рд┐рднрд╛рдЬрди рдХрд╛рд░реНрдп
  2. рдПрдиреЛрдЯреЗрд╢рди рдбреЗрдЯрд╛ рджреБрд░реНрд▓рдн рд╣реЛрдиреЗ рд╡рд╛рд▓реЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдкрд░рд┐рджреГрд╢реНрдп
  3. рд╡рд┐рднрд╛рдЬрди рд╕рдЯреАрдХрддрд╛ рдХреЗ рд▓рд┐рдП рдЙрдЪреНрдЪ рдЖрд╡рд╢реНрдпрдХрддрд╛рдУрдВ рд╡рд╛рд▓реЗ рдХрдВрдкреНрдпреВрдЯрд░ рджреГрд╖реНрдЯрд┐ рдЕрдиреБрдкреНрд░рдпреЛрдЧ

рд╕рдВрджрд░реНрдн

рдкреЗрдкрд░ рдХреБрдЫ-рд╢реЙрдЯ рд╡рд┐рднрд╛рдЬрди, рджреГрд╢реНрдп рдЖрдзрд╛рд░ рдореЙрдбрд▓ рдЖрджрд┐ рд╕рдВрдмрдВрдзрд┐рдд рдХреНрд╖реЗрддреНрд░реЛрдВ рдХреЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рдЙрджреНрдзреГрдд рдХрд░рддрд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ SAM, VRP-SAM, PFENet, CyCTR рдЖрджрд┐ рд╢рд╛рд╕реНрддреНрд░реАрдп рд╡рд┐рдзрд┐рдпрд╛рдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ, рдЬреЛ рдЗрд╕ рдЕрдиреБрд╕рдВрдзрд╛рди рдХреЗ рд▓рд┐рдП рдПрдХ рдареЛрд╕ рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рдЖрдзрд╛рд░ рдкреНрд░рджрд╛рди рдХрд░рддреА рд╣реИрдВред