2025-11-23T03:16:16.407109

TARD: Test-time Domain Adaptation for Robust Fault Detection under Evolving Operating Conditions

Sun, Fink

Fault detection is essential in complex industrial systems to prevent failures and optimize performance by distinguishing abnormal from normal operating conditions. With the growing availability of condition monitoring data, data-driven approaches have increasingly applied in detecting system faults. However, these methods typically require large, diverse, and representative training datasets that capture the full range of operating scenarios, an assumption rarely met in practice, particularly in the early stages of deployment. Industrial systems often operate under highly variable and evolving conditions, making it difficult to collect comprehensive training data. This variability results in a distribution shift between training and testing data, as future operating conditions may diverge from those previously observed ones. Such domain shifts hinder the generalization of traditional models, limiting their ability to transfer knowledge across time and system instances, ultimately leading to performance degradation in practical deployments. To address these challenges, we propose a novel method for continuous test-time domain adaptation, designed to support robust early-stage fault detection in the presence of domain shifts and limited representativeness of training data. Our proposed framework --Test-time domain Adaptation for Robust fault Detection (TARD) -- explicitly separates input features into system parameters and sensor measurements. It employs a dedicated domain adaptation module to adapt to each input type using different strategies, enabling more targeted and effective adaptation to evolving operating conditions. We validate our approach on two real-world case studies from multi-phase flow facilities, delivering substantial improvements in both fault detection accuracy and model robustness over existing domain adaptation methods under real-world variability.

academic

TARD: विकसित परिचालन स्थितियों के तहत मजबूत दोष पहचान के लिए परीक्षण-समय डोमेन अनुकूलन

बुनियादी जानकारी

पेपर ID: 2507.16354
शीर्षक: TARD: Test-time Domain Adaptation for Robust Fault Detection under Evolving Operating Conditions
लेखक: Han Sun, Olga Fink (EPFL)
वर्गीकरण: stat.AP (सांख्यिकी - अनुप्रयोग)
प्रकाशन समय: 13 अक्टूबर 2025 (arXiv v2)
पेपर लिंक: https://arxiv.org/abs/2507.16354

सारांश

औद्योगिक प्रणालियों में दोष पहचान विफलता की रोकथाम और प्रदर्शन अनुकूलन के लिए महत्वपूर्ण है। स्थिति निगरानी डेटा की बढ़ती उपलब्धता के साथ, डेटा-संचालित विधियों को दोष पहचान में व्यापक रूप से लागू किया जा रहा है। हालांकि, ये विधियां आमतौर पर बड़े पैमाने पर, विविध और प्रतिनिधि प्रशिक्षण डेटासेट की आवश्यकता होती है, जो व्यावहारिक रूप से पूरा करना कठिन है, विशेष रूप से प्रारंभिक तैनाती में। औद्योगिक प्रणालियां अत्यधिक परिवर्तनशील और लगातार विकसित होने वाली स्थितियों में काम करती हैं, जिससे प्रशिक्षण और परीक्षण डेटा के बीच वितरण बदलाव होता है। इन चुनौतियों को हल करने के लिए, यह पेपर TARD नामक एक नई सतत परीक्षण-समय डोमेन अनुकूलन विधि प्रस्तावित करता है, जो डोमेन बदलाव और सीमित प्रशिक्षण डेटा की स्थितियों में मजबूत प्रारंभिक दोष पहचान का समर्थन करने के लिए विशेष रूप से डिज़ाइन की गई है।

अनुसंधान पृष्ठभूमि और प्रेरणा

मुख्य समस्याएं

डेटा की कमी: औद्योगिक प्रणालियां, विशेष रूप से नई तैनाती या नवीनीकृत उपकरण, व्यापक ऐतिहासिक डेटा की कमी करते हैं, विशेष रूप से दोष डेटा अत्यंत दुर्लभ है
डोमेन बदलाव की चुनौती: विभिन्न उपकरण इकाइयों के बीच और एक ही प्रणाली के विभिन्न समय में परिचालन स्थितियों में महत्वपूर्ण अंतर है, जो पारंपरिक मशीन लर्निंग की i.i.d धारणा का उल्लंघन करता है
गतिशील वातावरण: औद्योगिक प्रणालियां लगातार विकसित होने वाले वातावरण में काम करती हैं, जिन्हें असतत डोमेन अनुकूलन के बजाय सतत अनुकूलन की आवश्यकता है

अनुसंधान का महत्व

प्रारंभिक दोष पहचान प्रणाली प्रदर्शन अनुकूलन, रखरखाव लागत को कम करने और संपत्ति अनुपलब्धता को कम करने के लिए महत्वपूर्ण है
मौजूदा विधियां वितरण बदलाव का सामना करते समय उच्च झूठी सकारात्मक दर और पहचान सटीकता में गिरावट का कारण बनती हैं
डेटा-समृद्ध प्रणालियों से डेटा-दुर्लभ नई प्रणालियों में ज्ञान स्थानांतरण का समर्थन करने वाली बेड़े-स्तरीय ज्ञान स्थानांतरण की आवश्यकता है

मौजूदा विधियों की सीमाएं

पारंपरिक डोमेन अनुकूलन विधियां: बड़ी मात्रा में स्रोत डोमेन और लक्ष्य डोमेन डेटा की आवश्यकता है, और आमतौर पर लेबल किए गए दोष डेटा की आवश्यकता है
स्थिर अनुकूलन: अधिकांश विधियां असतत स्थिर डोमेन विशेषताओं को मानती हैं, लगातार विकसित होने वाली परिचालन स्थितियों को संभाल नहीं सकती हैं
परीक्षण-समय अनुकूलन जोखिम: मौजूदा TTA विधियां गलती से दोष पैटर्न को सामान्य व्यवहार में अनुकूलित कर सकती हैं

मुख्य योगदान

TARD ढांचा प्रस्तावित करना: बिना पर्यवेक्षण दोष पहचान के लिए डिज़ाइन किया गया एक सतत परीक्षण-समय डोमेन अनुकूलन ढांचा, जो पूरी तरह से लेबल किए गए दोष डेटा पर निर्भर नहीं है
नवीन विशेषता पृथक्करण रणनीति: स्पष्ट रूप से इनपुट चर को नियंत्रण पैरामीटर और सेंसर माप में विभाजित करना, और प्रत्येक प्रकार के लिए विशेष अनुकूलन रणनीति अपनाना
व्यावहारिक ढांचा: लक्ष्य प्रणाली के केवल कुछ सामान्य नमूनों की आवश्यकता है, प्रारंभिक तैनाती और बेड़े-स्तरीय ज्ञान स्थानांतरण के लिए उपयुक्त है
अनुभवजन्य सत्यापन: दो बहु-चरण प्रवाह सुविधाओं के वास्तविक केस अध्ययनों में विधि की प्रभावशीलता को सत्यापित किया गया है

विधि विवरण

कार्य परिभाषा

दिया गया:

स्रोत प्रणाली का समृद्ध स्वस्थ प्रशिक्षण डेटा: $X^s = [x^s_1, \cdots, x^s_n]$
लक्ष्य डोमेन का सीमित सामान्य डेटा: $X^t = [x^t_1, \cdots, x^t_m]$

उद्देश्य: लक्ष्य डोमेन $t$ में मजबूत दोष पहचान प्राप्त करना, निम्नलिखित पर विचार करते हुए:

दोनों डोमेन में दोष प्रशिक्षण डेटा की कमी है
लक्ष्य डोमेन डेटा उपलब्धता सीमित है
अनुमान प्रक्रिया के दौरान सतत वितरण बदलाव

प्रणाली चर वर्गीकरण

इनपुट डेटा को दो समूहों में विभाजित करना: $X = [x, w]$

नियंत्रण चर $w$ : ऑपरेटर या नियंत्रण प्रणाली द्वारा निर्धारित प्रणाली स्थिति नियंत्रण चर
सेंसर माप $x$ : प्रणाली घटकों की निगरानी करने वाले और वास्तविक समय प्रणाली स्थिति को प्रतिबिंबित करने वाले सेंसर सिग्नल

मॉडल आर्किटेक्चर

1. पुनर्निर्माण-आधारित विसंगति पहचान

स्वचालित एनकोडर $f_\theta$ को पुनर्निर्माण मॉडल के रूप में अपनाना, स्रोत डोमेन सामान्य डेटा पर प्रशिक्षित: $\text{loss}_{MSE} = \frac{1}{n}\sum_{1}^{n}(X^s - \hat{X}^s)^2$

2. परीक्षण-समय डोमेन अनुकूलन मॉड्यूल

अनुकूलन मॉड्यूल $h_\phi$ का परिचय देना, पुनर्निर्माण मॉडल को सीधे संशोधित करने के बजाय:

इनपुट: नियंत्रण चर $w$ और पूर्व-प्रशिक्षित स्वचालित एनकोडर की भविष्यवाणी
आउटपुट: मुआवजा पद $\Delta x$
डिज़ाइन सिद्धांत: संभावित दोष डेटा वितरण में अनुकूलन से बचना

3. मुख्य तकनीकी विशेषताएं

मुख्य मॉडल को फ्रीज करना: पूर्व-प्रशिक्षित स्वचालित एनकोडर $f_\theta$ अनुकूलन चरण में फ्रीज रहता है
AdaBN परत: अनुकूलन मॉड्यूल में अनुकूली बैच सामान्यीकरण परत को एकीकृत करना, बैच सांख्यिकी के आधार पर माध्य और विचरण को अपडेट करना
पृथक अनुकूलन: केवल नियंत्रण चर के लिए अनुकूलन, सेंसर माप की विसंगति पहचान क्षमता की रक्षा करना

स्कोरिंग और दोष पहचान तंत्र

सापेक्ष अवशेष गणना

$r_i = \frac{|\hat{X}_i - X_i|}{\bar{X}_{t\_training}}$

विसंगति स्कोर

$s_i = \frac{1}{k}\sum_{j=1}^{k}r_i^j + \max\sum_{j=1}^{k}r_i^j$

समय सुगमता

$s_{i\_smooth} = \text{mean}\sum_{q=0}^{l-1}s_{i+q}$

दोष निर्धारण

$s_{i\_smooth} > \alpha \cdot \bar{r}_{t\_training}$

प्रायोगिक सेटअप

डेटासेट

1. Cranfield त्रि-चरण प्रवाह सुविधा

निगरानी चर: 24 प्रक्रिया चर (दबाव, प्रवाह, तरल स्तर, घनत्व, तापमान, वाल्व स्थिति)
नियंत्रण चर: वायु और जल प्रवाह सेटपॉइंट
दोष प्रकार: 6 प्रकार (वायु पाइपलाइन रुकावट, जल पाइपलाइन रुकावट, शीर्ष विभाजक इनपुट रुकावट, प्रत्यक्ष बाईपास खुली, स्लग प्रवाह स्थिति, 2 इंच पाइपलाइन दबाव)
नमूनाकरण आवृत्ति: 1 Hz

2. PRONTO विषम बेंचमार्क डेटासेट

निगरानी चर: 15 प्रक्रिया चर
परिचालन स्थितियां: 20 विभिन्न वायु और जल प्रवाह संयोजन
दोष प्रकार: 3 प्रकार (वायु रिसाव, वायु रुकावट, विभाजन)
नमूनाकरण आवृत्ति: 1 Hz

मूल्यांकन मेट्रिक्स

सटीकता (Accuracy): कुल भविष्यवाणी सही दर
F1 स्कोर: परिशुद्धता और पुनरावृत्ति दर का हार्मोनिक माध्य
AUC: ROC वक्र के तहत क्षेत्र

तुलनात्मक विधियां

Baseline: केवल स्रोत डोमेन पर प्रशिक्षित मॉडल
AdaBN: अनुकूली बैच सामान्यीकरण
MMD: अधिकतम माध्य विसंगति

कार्यान्वयन विवरण

अनुकूलक: Adam, सीखने की दर 1e-5
बैच आकार: 128
प्रशिक्षण एपोक्स: स्वचालित एनकोडर 500 एपोक्स, अनुकूलन मॉड्यूल 50 एपोक्स
आर्किटेक्चर: एनकोडर और डिकोडर प्रत्येक 3 परत पूर्ण कनेक्टेड, आयाम 50-50-10

प्रायोगिक परिणाम

मुख्य परिणाम

Cranfield डेटासेट परिणाम

दोष प्रकार	Baseline	AdaBN	MMD	TARD
वायु पाइपलाइन रुकावट	F1: 0.43	F1: 0.43	F1: 0.47	F1: 0.70
जल पाइपलाइन रुकावट	F1: 0.67	F1: 0.62	F1: 0.69	F1: 0.76
शीर्ष विभाजक रुकावट	F1: 0.63	F1: 0.65	F1: 0.64	F1: 0.79
प्रत्यक्ष बाईपास खुली	F1: 0.53	F1: 0.60	F1: 0.56	F1: 0.69
स्लग प्रवाह स्थिति	F1: 0.85	F1: 0.88	F1: 0.89	F1: 0.92
2 इंच पाइपलाइन दबाव	F1: 0.94	F1: 0.98	F1: 1.00	F1: 1.00

PRONTO डेटासेट परिणाम

दोष प्रकार	Baseline	AdaBN	MMD	TARD
वायु रिसाव	F1: 0.62	F1: 0.36	F1: 0.51	F1: 0.76
वायु रुकावट	F1: 0.93	F1: 0.88	F1: 0.96	F1: 0.94
विभाजन	F1: 0.11	F1: 0.51	F1: 0.51	F1: 0.69

विलोपन प्रयोग

Cranfield शीर्ष विभाजक रुकावट केस में विभिन्न परिचालन स्थितियों में:

परिवर्तनशील स्थितियां: TARD गतिशील वातावरण में सर्वोत्तम प्रदर्शन करता है (F1: 0.86 vs MMD: 0.79)
स्थिर-अवस्था स्थितियां: TARD अधिकांश स्थिर-अवस्था स्थितियों में भी लाभ बनाए रखता है

अनिश्चितता परिमाणीकरण

गहन समूह (10 स्वतंत्र मॉडल) के माध्यम से TARD पहचान परिणामों की उच्च विश्वसनीयता को सत्यापित किया गया है, दोष पहचान के दौरान अनिश्चितता बैंड संकीर्ण रहता है (मानक विचलन लगभग 0.8)

उच्च-आयामी सिंथेटिक डेटा प्रयोग

100-आयामी सेंसर: F1 0.42 से 0.67 तक सुधार
1000-आयामी सेंसर: F1 0.10 से 0.48 तक सुधार
अनुमान विलंब: वास्तविक समय निगरानी आवश्यकताओं की सीमा में रहता है (<2ms)

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

TARD ने औद्योगिक दोष पहचान में तीन प्रमुख चुनौतियों को सफलतापूर्वक हल किया है: लेबल किए गए दोष डेटा की कमी, लक्ष्य डोमेन डेटा सीमित, सतत डोमेन बदलाव
विशेषता पृथक्करण रणनीति परिचालन स्थिति परिवर्तन और वास्तविक दोषों को प्रभावी ढंग से अलग करती है
दो वास्तविक औद्योगिक डेटासेट पर मौजूदा डोमेन अनुकूलन विधियों से महत्वपूर्ण रूप से बेहतर है

सीमाएं

पैरामीटर समायोजन: दोष पहचान संवेदनशीलता पैरामीटर α को मैन्युअल रूप से सेट करने की आवश्यकता है
प्रमुख प्रणाली परिवर्तन: स्थायी प्रमुख प्रणाली परिवर्तनों को संभालने के लिए सुरक्षा तंत्र की कमी है
समय गतिशीलता: वर्तमान अवशेष सुगमता रणनीति महत्वपूर्ण समय विवरण खो सकती है

भविष्य की दिशाएं

स्वचालित सुरक्षा तंत्र: प्रमुख डोमेन बदलाव का पता लगाने और अनुकूलन मॉड्यूल पुनः प्रशिक्षण को ट्रिगर करने की विधियां विकसित करना
स्वचालित पैरामीटर समायोजन: संवेदनशीलता पैरामीटर α को स्वचालित रूप से समायोजित करने की विधियां
समय श्रृंखला विश्लेषण: अवशेष अनुक्रम में जटिल पैटर्न विश्लेषण के लिए विशेष समय श्रृंखला मॉडल का परिचय

गहन मूल्यांकन

शक्तियां

व्यावहारिकता: औद्योगिक जगत में वास्तविक चुनौतियों को हल करता है, केवल कुछ सामान्य डेटा की आवश्यकता है
तकनीकी नवाचार: विशेषता पृथक्करण और विशेष अनुकूलन रणनीति का डिज़ाइन चतुर और प्रभावी है
व्यापक प्रयोग: दो वास्तविक औद्योगिक डेटासेट + उच्च-आयामी सिंथेटिक डेटा का व्यापक सत्यापन
सैद्धांतिक आधार: स्पष्ट समस्या परिभाषा और विधि प्रेरणा

कमियां

लागू क्षेत्र: मुख्य रूप से बहु-चरण प्रवाह प्रणालियों को सत्यापित किया गया है, अन्य औद्योगिक प्रणालियों में सामान्यीकरण क्षमता की जांच की जानी बाकी है
सैद्धांतिक विश्लेषण: विधि अभिसरण और स्थिरता के लिए सैद्धांतिक गारंटी की कमी है
कम्प्यूटेशनल ओवरहेड: हालांकि अनुमान समय की रिपोर्ट की गई है, लेकिन विस्तृत कम्प्यूटेशनल जटिलता विश्लेषण की कमी है
हाइपरपैरामीटर संवेदनशीलता: महत्वपूर्ण हाइपरपैरामीटर (जैसे α, विंडो लंबाई l) के लिए संवेदनशीलता विश्लेषण अपर्याप्त है

प्रभाव

शैक्षणिक योगदान: औद्योगिक दोष पहचान क्षेत्र के लिए नई अनुसंधान दिशा प्रदान करता है
व्यावहारिक मूल्य: औद्योगिक तैनाती के लिए सीधे लागू, विशेष रूप से नए उपकरणों की प्रारंभिक निगरानी
पुनरुत्पादनीयता: विस्तृत कार्यान्वयन विवरण और एल्गोरिदम विवरण प्रदान करता है

लागू परिदृश्य

नई तैनाती प्रणालियां: सीमित ऐतिहासिक डेटा वाली औद्योगिक उपकरण
बेड़े प्रबंधन: उपकरणों के बीच ज्ञान स्थानांतरण की आवश्यकता वाले परिदृश्य
गतिशील वातावरण: परिचालन स्थितियां लगातार बदलने वाली औद्योगिक प्रणालियां
महत्वपूर्ण बुनियादी ढांचा: झूठी सकारात्मकता के प्रति संवेदनशील महत्वपूर्ण औद्योगिक प्रणालियां

संदर्भ

पेपर ने 51 संबंधित संदर्भों का हवाला दिया है, जो दोष पहचान, डोमेन अनुकूलन, गहन शिक्षा आदि मुख्य क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।

समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला अनुप्रयुक्त सांख्यिकी पेपर है जो डोमेन अनुकूलन तकनीक को औद्योगिक दोष पहचान की महत्वपूर्ण व्यावहारिक समस्या पर सफलतापूर्वक लागू करता है। विधि डिज़ाइन तर्कसंगत है, प्रायोगिक सत्यापन व्यापक है, और इसमें बहुत मजबूत व्यावहारिक मूल्य और शैक्षणिक महत्व है।