Class-aware Domain Knowledge Fusion and Fission for Continual Test-Time Adaptation
Zhou, Zhu, Cui et al.
Continual Test-Time Adaptation (CTTA) aims to quickly fine-tune the model during the test phase so that it can adapt to multiple unknown downstream domain distributions without pre-acquiring downstream domain data. To this end, existing advanced CTTA methods mainly reduce the catastrophic forgetting of historical knowledge caused by irregular switching of downstream domain data by restoring the initial model or reusing historical models. However, these methods are usually accompanied by serious insufficient learning of new knowledge and interference from potentially harmful historical knowledge, resulting in severe performance degradation. To this end, we propose a class-aware domain Knowledge Fusion and Fission method for continual test-time adaptation, called KFF, which adaptively expands and merges class-aware domain knowledge in old and new domains according to the test-time data from different domains, where discriminative historical knowledge can be dynamically accumulated. Specifically, considering the huge domain gap within streaming data, a domain Knowledge FIssion (KFI) module is designed to adaptively separate new domain knowledge from a paired class-aware domain prompt pool, alleviating the impact of negative knowledge brought by old domains that are distinct from the current domain. Besides, to avoid the cumulative computation and storage overheads from continuously fissioning new knowledge, a domain Knowledge FUsion (KFU) module is further designed to merge the fissioned new knowledge into the existing knowledge pool with minimal cost, where a greedy knowledge dynamic merging strategy is designed to improve the compatibility of new and old knowledge while keeping the computational efficiency. Extensive experiments on the ImageNet-C dataset verify the effectiveness of our proposed method against other methods.
academic
Класс-ориентированное слияние и разделение знаний о домене для непрерывной адаптации на этапе тестирования
В данной работе предлагается метод KFF (класс-ориентированного слияния и разделения знаний) для решения задачи непрерывной адаптации на этапе тестирования (CTTA). Метод использует модуль разделения знаний (KFI) для адаптивного отделения новых знаний о домене, избегая негативного влияния исторических знаний; модуль слияния знаний (KFU) объединяет разделённые новые знания с существующим хранилищем знаний с минимальными затратами. Экспериментальные результаты на наборе данных ImageNet-C показывают улучшение производительности на 5,1% по сравнению с методом SOTA DPCore.
Непрерывная адаптация на этапе тестирования (CTTA) направлена на быструю адаптацию предварительно обученной модели к нескольким неизвестным распределениям нижестоящих доменов на этапе тестирования без предварительного доступа к данным этих доменов. Это более сложная задача по сравнению с традиционной адаптацией на этапе тестирования (TTA).
Методы регуляризации: Сохраняют исторические знания через регуляризацию, но подавляют обучение новым знаниям
Методы сброса параметров: Избегают забывания путём восстановления исходной модели, но теряют полезные исторические знания
Методы слияния моделей: Выбирают и объединяют исторические параметры модели, но сталкиваются с проблемами конфликта доменов и неограниченным ростом затрат на хранение
Предложена структура KFF: Первая класс-ориентированная структура слияния и разделения знаний о домене, способная динамически накапливать дискриминативные исторические знания
Разработан модуль KFI: Модуль разделения знаний адаптивно отделяет новые знания о домене, снижая негативное влияние между различными доменами
Разработан модуль KFU: Модуль слияния знаний объединяет знания с использованием жадной стратегии, балансируя эффективность и производительность
Достигнута производительность SOTA: Достигнута частота ошибок 34,8% на ImageNet-C, улучшение на 5,1% по сравнению с DPCore
Предоставлен теоретический анализ: Теоретические гарантии на основе гипотезы хорошо разделённой кластеризации
Учитывая исходные данные домена DS={YS,XS} и поток тестовых данных из различных распределений доменов DT={XT}T=1N, модель fθ должна обрабатывать тестовые пакеты BTj={xt}t=0b в режиме онлайн с целью адаптации к целевому домену при сохранении способности работать с историческими доменами.
Предполагается, что тестовые пакеты могут быть естественным образом разделены на N хорошо разделённых кластеров на основе представления признаков, существует пороговое значение θ такое, что:
Лемма A.1: Механизм KFI может правильно назначить все пакеты подсказкам одного кластера
Лемма A.2: Механизм KFU объединяет только подсказки внутри одного кластера Предложение A.3: Метод KFF может правильно назначить все пакеты подсказкам одного кластера
Теоретический анализ гарантирует корректность метода, а визуализация t-SNE в экспериментах подтверждает теоретические предположения.
Зависимость от исходного домена: Требует доступа к статистической информации исходного домена, что представляет вызов в сценариях с ограничениями конфиденциальности
Синтетические искажения: Основная проверка проводится на искусственно разработанных искажениях, надёжность при реальных сдвигах распределения требует проверки
Вычислительные затраты: Хотя относительно эффективен, всё ещё представляет вызов на устройствах с ограниченными ресурсами
Чувствительность гиперпараметров: Требует тщательной настройки ключевых гиперпараметров для различных наборов данных
Академический вклад: Предоставляет новый подход к решению задач в области CTTA, ожидается широкое внимание
Практическая ценность: Имеет потенциал применения в сценариях, требующих непрерывной адаптации к изменениям доменов, таких как автономное вождение и медицинская визуализация
Воспроизводимость: Авторы обещают открыть исходный код, что способствует распространению метода
Задачи компьютерного зрения, требующие непрерывной адаптации к изменениям нескольких доменов
Сценарии граничных вычислений с требованиями к эффективности параметров
Приложения, имеющие доступ к ограниченной статистической информации исходного домена
Структурированные окружающие среды с относительно предсказуемыми изменениями доменов
Данная статья вносит значительный вклад в область CTTA, эффективно решая проблему конфликта доменов через инновационный механизм разделения и слияния знаний, достигая значительного повышения производительности при сохранении вычислительной эффективности. Несмотря на некоторые ограничения, её основные идеи и технические инновации предоставляют ценные ориентиры для связанных исследований.