Decomposer Networks: Deep Component Analysis and Synthesis
Joneidi
We propose the Decomposer Networks (DecompNet), a semantic autoencoder that factorizes an input into multiple interpretable components. Unlike classical autoencoders that compress an input into a single latent representation, the Decomposer Network maintains N parallel branches, each assigned a residual input defined as the original signal minus the reconstructions of all other branches. By unrolling a Gauss--Seidel style block-coordinate descent into a differentiable network, DecompNet enforce explicit competition among components, yielding parsimonious, semantically meaningful representations. We situate our model relative to linear decomposition methods (PCA, NMF), deep unrolled optimization, and object-centric architectures (MONet, IODINE, Slot Attention), and highlight its novelty as the first semantic autoencoder to implement an all-but-one residual update rule.
academic
Сети Decomposer: Глубокий компонентный анализ и синтез
В данной работе предлагаются сети Decomposer (DecompNet) — семантический автокодировщик, способный разложить входные данные на несколько интерпретируемых компонентов. В отличие от традиционных автокодировщиков, которые сжимают входные данные в единое скрытое представление, DecompNet поддерживает N параллельных ветвей, каждой из которых назначен остаточный вход, определяемый как исходный сигнал минус реконструкции всех остальных ветвей. Путём развёртывания блочного координатного спуска в стиле Гаусса-Зейделя в дифференцируемую сеть DecompNet обеспечивает явную конкуренцию между компонентами, производя лаконичные и семантически значимые представления.
Авторы вдохновлены процессом разложения в человеческой креативности: повар разделяет вкусы, художник различает тона и текстуры, музыкант изолирует гармонии. Работа направлена на расширение духа SVD на нелинейную и семантическую области ИИ, наделяя машины способностью к структурированному, основанному на компонентах рассуждению.
Новаторская архитектура: Предложен первый семантический автокодировщик, реализующий правило остаточного обновления "все кроме одного"
Теоретическая связь: Установлена математическая связь с классическим разложением SVD, доказано, что в линейном случае DecompNet эквивалентен итеративному разложению по сингулярным значениям
Механизм конкуренции: Явная конкуренция между компонентами через остаточные входы обеспечивает семантическое разделение
Управляемый синтез: Поддерживает семантическое управление и генерацию путём регулировки весов компонентов
Для входных данных x∈Rd необходимо обучить N семантических компонентов {yi}i=1N таким образом, чтобы каждый компонент захватывал различные семантические аспекты входных данных при сохранении качества реконструкции.
Статья ссылается на важные работы в соответствующих областях, включая:
Классические методы разложения: Jolliffe (PCA), Lee & Seung (NMF)
Глубокое развёртывание: Gregor & LeCun (LISTA), Yang et al. (ADMM-Net)
Модели, ориентированные на объекты: Burgess et al. (MONet), Greff et al. (IODINE)
Управляемая генерация: Higgins et al. (β-VAE), Karras et al. (StyleGAN)
Общая оценка: Это хорошо сбалансированная работа, объединяющая теорию и практику, предлагающая новый механизм остаточной конкуренции для семантического разложения. Хотя экспериментальная проверка ограничена, теоретическая основа прочна, метод инновационен и открывает новые направления исследований в области глубокого разложения.