2025-11-23T03:16:16.407109

TARD: Test-time Domain Adaptation for Robust Fault Detection under Evolving Operating Conditions

Sun, Fink
Fault detection is essential in complex industrial systems to prevent failures and optimize performance by distinguishing abnormal from normal operating conditions. With the growing availability of condition monitoring data, data-driven approaches have increasingly applied in detecting system faults. However, these methods typically require large, diverse, and representative training datasets that capture the full range of operating scenarios, an assumption rarely met in practice, particularly in the early stages of deployment. Industrial systems often operate under highly variable and evolving conditions, making it difficult to collect comprehensive training data. This variability results in a distribution shift between training and testing data, as future operating conditions may diverge from those previously observed ones. Such domain shifts hinder the generalization of traditional models, limiting their ability to transfer knowledge across time and system instances, ultimately leading to performance degradation in practical deployments. To address these challenges, we propose a novel method for continuous test-time domain adaptation, designed to support robust early-stage fault detection in the presence of domain shifts and limited representativeness of training data. Our proposed framework --Test-time domain Adaptation for Robust fault Detection (TARD) -- explicitly separates input features into system parameters and sensor measurements. It employs a dedicated domain adaptation module to adapt to each input type using different strategies, enabling more targeted and effective adaptation to evolving operating conditions. We validate our approach on two real-world case studies from multi-phase flow facilities, delivering substantial improvements in both fault detection accuracy and model robustness over existing domain adaptation methods under real-world variability.
academic

TARD: Adaptation de Domaine au Temps de Test pour la Détection Robuste des Défauts dans des Conditions d'Exploitation Évolutives

Informations Fondamentales

  • ID de l'article: 2507.16354
  • Titre: TARD: Test-time Domain Adaptation for Robust Fault Detection under Evolving Operating Conditions
  • Auteurs: Han Sun, Olga Fink (EPFL)
  • Classification: stat.AP (Statistiques - Applications)
  • Date de publication: 13 octobre 2025 (arXiv v2)
  • Lien de l'article: https://arxiv.org/abs/2507.16354

Résumé

La détection des défauts dans les systèmes industriels est cruciale pour prévenir les défaillances et optimiser les performances. Avec l'abondance croissante de données de surveillance d'état, les méthodes pilotées par les données sont largement appliquées à la détection des défauts. Cependant, ces méthodes nécessitent généralement des ensembles de données d'entraînement volumineux, diversifiés et représentatifs, ce qui est difficile à satisfaire en pratique, particulièrement lors du déploiement initial. Les systèmes industriels fonctionnent souvent dans des conditions hautement variables et en constante évolution, ce qui entraîne un décalage de distribution entre les données d'entraînement et de test. Pour relever ces défis, cet article propose une nouvelle méthode d'adaptation de domaine au temps de test continu appelée TARD, spécialement conçue pour soutenir la détection robuste des défauts précoces dans des conditions de décalage de domaine et de données d'entraînement limitées.

Contexte de Recherche et Motivation

Problèmes Fondamentaux

  1. Rareté des données: Les systèmes industriels, en particulier les équipements nouvellement déployés ou rénovés, manquent de données historiques complètes, les données de défaut étant extrêmement rares
  2. Défis du décalage de domaine: Des différences significatives existent dans les conditions d'exploitation entre différentes unités d'équipement et au sein du même système à différents moments, violant l'hypothèse i.i.d. de l'apprentissage automatique traditionnel
  3. Environnement dynamique: Les systèmes industriels fonctionnent dans un environnement en constante évolution, nécessitant une adaptation continue plutôt qu'une adaptation de domaine discrète

Importance de la Recherche

  • La détection précoce des défauts est essentielle pour optimiser les performances du système, minimiser les coûts de maintenance et réduire l'indisponibilité des actifs
  • Les méthodes existantes produisent des taux de fausses alarmes élevés et une précision de détection réduite face aux décalages de distribution
  • Il est nécessaire de soutenir le transfert de connaissances au niveau de la flotte, transférant l'expérience des systèmes riches en données vers les nouveaux systèmes pauvres en données

Limitations des Méthodes Existantes

  1. Méthodes d'adaptation de domaine traditionnelles: Nécessitent une grande quantité de données de domaine source et cible, et nécessitent généralement des données de défaut étiquetées
  2. Adaptation statique: La plupart des méthodes supposent des caractéristiques de domaine statiques discrètes, incapables de gérer les conditions d'exploitation en constante évolution
  3. Risques d'adaptation au temps de test: Les méthodes TTA existantes peuvent adapter incorrectement les modèles de défaut en comportement normal

Contributions Principales

  1. Proposition du cadre TARD: Un cadre d'adaptation de domaine au temps de test continu conçu pour la détection de défauts non supervisée, sans dépendre du tout des données de défaut étiquetées
  2. Stratégie innovante de séparation des caractéristiques: Séparation explicite des variables d'entrée en paramètres de contrôle et mesures de capteurs, avec des stratégies d'adaptation spécialisées pour chaque catégorie
  3. Cadre pratique: Nécessite seulement un petit nombre d'échantillons normaux du système cible, adapté au déploiement précoce et au transfert de connaissances au niveau de la flotte
  4. Validation empirique: Efficacité de la méthode vérifiée dans deux études de cas réelles d'installations d'écoulement multiphasique

Explication Détaillée de la Méthode

Définition de la Tâche

Données:

  • Données d'entraînement saines abondantes du système source: Xs=[x1s,,xns]X^s = [x^s_1, \cdots, x^s_n]
  • Données normales limitées du domaine cible: Xt=[x1t,,xmt]X^t = [x^t_1, \cdots, x^t_m]

Objectif: Réaliser une détection robuste des défauts dans le domaine cible tt, en tenant compte de:

  • L'absence de données d'entraînement de défaut dans les deux domaines
  • La disponibilité limitée des données du domaine cible
  • Les décalages de distribution continus pendant l'inférence

Classification des Variables Système

Séparation des données d'entrée en deux groupes: X=[x,w]X = [x, w]

  • Variables de contrôle ww: Variables de contrôle des conditions du système définies par l'opérateur ou le système de contrôle
  • Mesures de capteurs xx: Signaux de capteurs qui surveillent les composants du système et reflètent l'état réel du système en temps réel

Architecture du Modèle

1. Détection d'Anomalies Basée sur la Reconstruction

Utilisation d'un autoencodeur fθf_\theta comme modèle de reconstruction, entraîné sur les données normales du domaine source: lossMSE=1n1n(XsX^s)2\text{loss}_{MSE} = \frac{1}{n}\sum_{1}^{n}(X^s - \hat{X}^s)^2

2. Module d'Adaptation de Domaine au Temps de Test

Introduction d'un module d'adaptation hϕh_\phi, plutôt que de modifier directement le modèle de reconstruction:

  • Entrée: Variables de contrôle ww et valeurs prédites de l'autoencodeur préentraîné
  • Sortie: Terme de compensation Δx\Delta x
  • Principe de conception: Éviter l'adaptation à la distribution potentielle de données de défaut

3. Caractéristiques Techniques Clés

  • Gel du modèle principal: L'autoencodeur préentraîné fθf_\theta reste gelé pendant la phase d'adaptation
  • Couches AdaBN: Intégration de couches de normalisation par batch adaptative dans le module d'adaptation, mettant à jour les moyennes et variances basées sur les statistiques de batch
  • Adaptation séparée: Adaptation uniquement sur les variables de contrôle, protégeant la capacité de détection d'anomalies des mesures de capteurs

Mécanisme de Notation et de Détection des Défauts

Calcul du Résidu Relatif

ri=X^iXiXˉt_trainingr_i = \frac{|\hat{X}_i - X_i|}{\bar{X}_{t\_training}}

Score d'Anomalie

si=1kj=1krij+maxj=1krijs_i = \frac{1}{k}\sum_{j=1}^{k}r_i^j + \max\sum_{j=1}^{k}r_i^j

Lissage Temporel

si_smooth=meanq=0l1si+qs_{i\_smooth} = \text{mean}\sum_{q=0}^{l-1}s_{i+q}

Jugement de Défaut

si_smooth>αrˉt_trainings_{i\_smooth} > \alpha \cdot \bar{r}_{t\_training}

Configuration Expérimentale

Ensembles de Données

1. Installation d'Écoulement Triphasique Cranfield

  • Variables surveillées: 24 variables de processus (pression, débit, niveau de liquide, densité, température, position de vanne)
  • Variables de contrôle: Points de consigne de débit d'air et d'eau
  • Types de défauts: 6 types (obstruction de conduite d'air, obstruction de conduite d'eau, obstruction d'entrée du séparateur supérieur, ouverture de dérivation directe, conditions d'écoulement en bouchon, pressurisation de conduite de 2 pouces)
  • Fréquence d'échantillonnage: 1 Hz

2. Ensemble de Référence Hétérogène PRONTO

  • Variables surveillées: 15 variables de processus
  • Conditions d'exploitation: 20 combinaisons différentes de débits d'air et d'eau
  • Types de défauts: 3 types (fuite d'air, obstruction d'air, dérivation)
  • Fréquence d'échantillonnage: 1 Hz

Métriques d'Évaluation

  • Précision (Accuracy): Taux global de prédiction correcte
  • Score F1: Moyenne harmonique de la précision et du rappel
  • AUC: Aire sous la courbe ROC

Méthodes de Comparaison

  • Baseline: Modèle entraîné uniquement sur le domaine source
  • AdaBN: Normalisation par batch adaptative
  • MMD: Différence de moyenne maximale

Détails d'Implémentation

  • Optimiseur: Adam, taux d'apprentissage 1e-5
  • Taille de batch: 128
  • Nombre d'épochs: 500 pour l'autoencodeur, 50 pour le module d'adaptation
  • Architecture: 3 couches entièrement connectées pour l'encodeur et le décodeur, dimensions 50-50-10

Résultats Expérimentaux

Résultats Principaux

Résultats sur l'Ensemble Cranfield

Type de DéfautBaselineAdaBNMMDTARD
Obstruction de conduite d'airF1: 0.43F1: 0.43F1: 0.47F1: 0.70
Obstruction de conduite d'eauF1: 0.67F1: 0.62F1: 0.69F1: 0.76
Obstruction du séparateur supérieurF1: 0.63F1: 0.65F1: 0.64F1: 0.79
Ouverture de dérivation directeF1: 0.53F1: 0.60F1: 0.56F1: 0.69
Conditions d'écoulement en bouchonF1: 0.85F1: 0.88F1: 0.89F1: 0.92
Pressurisation de conduite de 2 poucesF1: 0.94F1: 0.98F1: 1.00F1: 1.00

Résultats sur l'Ensemble PRONTO

Type de DéfautBaselineAdaBNMMDTARD
Fuite d'airF1: 0.62F1: 0.36F1: 0.51F1: 0.76
Obstruction d'airF1: 0.93F1: 0.88F1: 0.96F1: 0.94
DérivationF1: 0.11F1: 0.51F1: 0.51F1: 0.69

Études d'Ablation

Dans le cas de l'obstruction du séparateur supérieur Cranfield sous différentes conditions d'exploitation:

  • Conditions variables: TARD affiche les meilleures performances dans un environnement dynamique (F1: 0.86 vs MMD: 0.79)
  • Conditions en régime permanent: TARD maintient également un avantage dans la plupart des conditions en régime permanent

Quantification de l'Incertitude

Vérification de la haute confiance des résultats de détection de TARD par ensemble profond (10 modèles indépendants), avec des bandes d'incertitude étroites maintenues pendant la détection des défauts (écart-type d'environ 0.8).

Expériences sur Données Synthétiques Haute Dimension

  • 100 capteurs dimensionnels: F1 amélioré de 0.42 à 0.67
  • 1000 capteurs dimensionnels: F1 amélioré de 0.10 à 0.48
  • Latence d'inférence: Maintenue dans la plage requise pour la surveillance en temps réel (<2ms)

Travaux Connexes

Méthodes de Détection des Défauts

  1. Modèles probabilistes: Modèles de mélange gaussien, modèles basés sur l'énergie
  2. Classification à une classe: Méthodes de limite discriminante telles que les machines à vecteurs de support
  3. Méthodes de reconstruction: Méthodes basées sur l'erreur de reconstruction telles que les autoencodeurs

Détection des Défauts au Niveau de la Flotte

  • Sous-flottes homogènes: Méthodes basées sur le clustering de similarité
  • Apprentissage de représentation fonctionnelle: Apprentissage du comportement global de la flotte
  • Limitations: Dépendance d'hypothèses de similarité suffisante

Application de l'Adaptation de Domaine à la Détection des Défauts

  • Méthodes de minimisation de divergence: Minimisation de distance statistique telle que MMD
  • Méthodes adversariales: Réseaux de discrimination de domaine tels que DANN
  • Adaptation au temps de test: Méthodes telles que Tent, SHOT
  • Défis: Nécessité de données étiquetées, hypothèse de domaines statiques, adaptation potentielle aux données de défaut

Conclusion et Discussion

Conclusions Principales

  1. TARD résout avec succès les trois grands défis de la détection des défauts industriels: absence de données de défaut étiquetées, données limitées du domaine cible, décalage de domaine continu
  2. La stratégie de séparation des caractéristiques distingue efficacement les changements de conditions d'exploitation des défauts réels
  3. Surpasse significativement les méthodes d'adaptation de domaine existantes sur deux ensembles de données industrielles réelles

Limitations

  1. Ajustement des paramètres: Le paramètre de sensibilité de détection des défauts α nécessite un réglage manuel
  2. Changements majeurs du système: Absence de mécanisme de protection contre les changements majeurs permanents du système
  3. Dynamiques temporelles: La stratégie actuelle de lissage des résidus peut perdre des détails temporels importants

Directions Futures

  1. Mécanismes de protection automatiques: Développement de méthodes pour détecter les décalages de domaine majeurs et déclencher le réentraînement du module d'adaptation
  2. Ajustement automatique des paramètres: Méthodes pour ajuster automatiquement le paramètre de sensibilité α
  3. Analyse de séries temporelles: Introduction de modèles de séries temporelles spécialisés pour analyser les modèles complexes dans les séries de résidus

Évaluation Approfondie

Points Forts

  1. Forte praticité: Résout les défis réels existant dans l'industrie, nécessitant seulement un petit nombre de données normales
  2. Innovation technique: Conception ingénieuse et efficace de la séparation des caractéristiques et des stratégies d'adaptation spécialisées
  3. Expérimentation complète: Validation complète avec deux ensembles de données industrielles réelles + données synthétiques haute dimension
  4. Base théorique solide: Définition claire des problèmes et motivation de la méthode

Insuffisances

  1. Portée d'application: Principalement vérifiée sur les systèmes d'écoulement multiphasique, la généralisation à d'autres systèmes industriels reste à démontrer
  2. Analyse théorique: Absence de garanties théoriques sur la convergence et la stabilité de la méthode
  3. Surcharge de calcul: Bien que les temps d'inférence soient rapportés, l'analyse détaillée de la complexité de calcul fait défaut
  4. Sensibilité aux hyperparamètres: Analyse insuffisante de la sensibilité aux hyperparamètres clés (tels que α, longueur de fenêtre l)

Impact

  1. Contribution académique: Fournit une nouvelle direction de recherche pour le domaine de la détection des défauts industriels
  2. Valeur pratique: Directement applicable au déploiement industriel, particulièrement pour la surveillance précoce des nouveaux équipements
  3. Reproductibilité: Fournit des détails d'implémentation détaillés et une description d'algorithme

Scénarios d'Application

  1. Systèmes nouvellement déployés: Équipements industriels avec données historiques limitées
  2. Gestion de flotte: Scénarios nécessitant un transfert de connaissances entre équipements
  3. Environnements dynamiques: Systèmes industriels avec conditions d'exploitation en constante évolution
  4. Infrastructures critiques: Systèmes industriels importants sensibles aux fausses alarmes

Références

L'article cite 51 références connexes, couvrant les travaux importants dans les domaines fondamentaux de la détection des défauts, de l'adaptation de domaine et de l'apprentissage profond, fournissant une base théorique solide pour la recherche.


Évaluation Globale: Cet article est un travail de haute qualité en statistiques appliquées qui applique avec succès les techniques d'adaptation de domaine au problème pratique important de la détection des défauts industriels. La conception de la méthode est raisonnable, la vérification expérimentale est complète, et il possède une forte valeur pratique et une importance académique significative.