Class-aware Domain Knowledge Fusion and Fission for Continual Test-Time Adaptation
Zhou, Zhu, Cui et al.
Continual Test-Time Adaptation (CTTA) aims to quickly fine-tune the model during the test phase so that it can adapt to multiple unknown downstream domain distributions without pre-acquiring downstream domain data. To this end, existing advanced CTTA methods mainly reduce the catastrophic forgetting of historical knowledge caused by irregular switching of downstream domain data by restoring the initial model or reusing historical models. However, these methods are usually accompanied by serious insufficient learning of new knowledge and interference from potentially harmful historical knowledge, resulting in severe performance degradation. To this end, we propose a class-aware domain Knowledge Fusion and Fission method for continual test-time adaptation, called KFF, which adaptively expands and merges class-aware domain knowledge in old and new domains according to the test-time data from different domains, where discriminative historical knowledge can be dynamically accumulated. Specifically, considering the huge domain gap within streaming data, a domain Knowledge FIssion (KFI) module is designed to adaptively separate new domain knowledge from a paired class-aware domain prompt pool, alleviating the impact of negative knowledge brought by old domains that are distinct from the current domain. Besides, to avoid the cumulative computation and storage overheads from continuously fissioning new knowledge, a domain Knowledge FUsion (KFU) module is further designed to merge the fissioned new knowledge into the existing knowledge pool with minimal cost, where a greedy knowledge dynamic merging strategy is designed to improve the compatibility of new and old knowledge while keeping the computational efficiency. Extensive experiments on the ImageNet-C dataset verify the effectiveness of our proposed method against other methods.
academic
Klassenabhängige Domänenwissensfusion und -fission für kontinuierliche Test-Zeit-Anpassung
Dieses Paper präsentiert KFF, eine klassenabhängige Domänenwissensfusions- und Fissionsmethode zur Lösung des Problems der kontinuierlichen Test-Zeit-Anpassung (CTTA). Die Methode trennt adaptiv neues Domänenwissen durch das Knowledge Fission (KFI) Modul und vermeidet dabei negative Wissensstörungen aus historischen Domänen. Das Knowledge Fusion (KFU) Modul integriert das getrennte neue Wissen mit minimalen Kosten in den bestehenden Wissenspool. Experimente auf dem ImageNet-C-Datensatz zeigen eine Leistungsverbesserung von 5,1% gegenüber der SOTA-Methode DPCore.
Die kontinuierliche Test-Zeit-Anpassung (CTTA) zielt darauf ab, dass vortrainierte Modelle während der Testphase schnell an mehrere unbekannte nachgelagerte Domänenverteilungen angepasst werden können, ohne dass nachgelagerte Domänendaten im Voraus verfügbar sind. Dies ist ein anspruchsvolleres Problem als die traditionelle Test-Zeit-Anpassung (TTA).
Vorschlag des KFF-Rahmens: Erstes klassenabhängiges Domänenwissensfusions- und Fissionssystem, das diskriminatives historisches Wissen dynamisch akkumuliert
Design des KFI-Moduls: Wissensfissionsmodul, das neues Domänenwissen adaptiv trennt und negative Wissensstörungen zwischen Domänen reduziert
Entwicklung des KFU-Moduls: Wissensfusionsmodul, das Wissen durch eine Greedy-Strategie verschmilzt und Effektivität mit Effizienz ausgleicht
Erreichung von SOTA-Leistung: 34,8% Fehlerrate auf ImageNet-C, Verbesserung um 5,1% gegenüber DPCore
Theoretische Analyse: Theoretische Garantien basierend auf der Annahme gut separierter Cluster
Gegeben sind Quelldomänendaten DS={YS,XS} und ein Teststrom aus verschiedenen Domänenverteilungen DT={XT}T=1N. Das Modell fθ muss Test-Batches BTj={xt}t=0b online verarbeiten mit dem Ziel, sich an die Zieldomäne anzupassen und gleichzeitig die Fähigkeit für historische Domänen zu bewahren.
Angenommen, Testbatches können basierend auf Merkmalsdarstellung natürlich in N gut separierte Cluster unterteilt werden, wobei ein Schwellenwert θ existiert, so dass:
Lemma A.1: Der KFI-Mechanismus kann alle Batches korrekt Hinweisen desselben Clusters zuordnen
Lemma A.2: Der KFU-Mechanismus verschmilzt nur Hinweise innerhalb desselben Clusters
Proposition A.3: Die KFF-Methode kann alle Batches korrekt Hinweisen desselben Clusters zuordnen
Die theoretische Analyse garantiert die Korrektheit der Methode, und die t-SNE-Visualisierung in Experimenten validiert die theoretischen Annahmen.
Bestehende Methoden konzentrieren sich hauptsächlich auf domänenebenes Wissen und ignorieren klassenebenes Wissen, das über Domänen hinweg geteilt wird
Quelldomänen-Abhängigkeit: Erfordert Zugriff auf Quelldomänen-Statistiken, stellt Herausforderungen in datenschutzgeschützten Szenarien dar
Synthetische Korruptionen: Hauptsächlich auf künstlich gestalteten Korruptionen validiert, Robustheit gegenüber echten Verteilungsverschiebungen muss noch überprüft werden
Rechenaufwand: Obwohl relativ effizient, stellt dies auf ressourcenbeschränkten Geräten eine Herausforderung dar
Hyperparameter-Empfindlichkeit: Erfordert Anpassung kritischer Hyperparameter für verschiedene Datensätze
Computervisions-Aufgaben, die kontinuierliche Anpassung an mehrere Domänenwechsel erfordern
Edge-Computing-Szenarien mit Anforderungen an Parametereffizienz
Anwendungen mit Zugriff auf begrenzte Quelldomänen-Statistiken
Strukturierte Umgebungen mit relativ vorhersehbaren Domänenwechseln
Dieses Paper leistet wichtige Beiträge im CTTA-Bereich. Durch innovative Wissensfissions- und Fusionsmechanismen löst es effektiv das Domänenkonflukt-Problem und erreicht signifikante Leistungsverbesserungen bei Beibehaltung von Recheneffizienz. Trotz einiger Einschränkungen bieten seine Kernideen und technischen Innovationen wertvolle Referenzen für verwandte Forschungen.