Fault detection is essential in complex industrial systems to prevent failures and optimize performance by distinguishing abnormal from normal operating conditions. With the growing availability of condition monitoring data, data-driven approaches have increasingly applied in detecting system faults. However, these methods typically require large, diverse, and representative training datasets that capture the full range of operating scenarios, an assumption rarely met in practice, particularly in the early stages of deployment.
Industrial systems often operate under highly variable and evolving conditions, making it difficult to collect comprehensive training data. This variability results in a distribution shift between training and testing data, as future operating conditions may diverge from those previously observed ones. Such domain shifts hinder the generalization of traditional models, limiting their ability to transfer knowledge across time and system instances, ultimately leading to performance degradation in practical deployments.
To address these challenges, we propose a novel method for continuous test-time domain adaptation, designed to support robust early-stage fault detection in the presence of domain shifts and limited representativeness of training data. Our proposed framework --Test-time domain Adaptation for Robust fault Detection (TARD) -- explicitly separates input features into system parameters and sensor measurements. It employs a dedicated domain adaptation module to adapt to each input type using different strategies, enabling more targeted and effective adaptation to evolving operating conditions. We validate our approach on two real-world case studies from multi-phase flow facilities, delivering substantial improvements in both fault detection accuracy and model robustness over existing domain adaptation methods under real-world variability.
- पेपर ID: 2507.16354
- शीर्षक: TARD: Test-time Domain Adaptation for Robust Fault Detection under Evolving Operating Conditions
- लेखक: Han Sun, Olga Fink (EPFL)
- वर्गीकरण: stat.AP (सांख्यिकी - अनुप्रयोग)
- प्रकाशन समय: 13 अक्टूबर 2025 (arXiv v2)
- पेपर लिंक: https://arxiv.org/abs/2507.16354
औद्योगिक प्रणालियों में दोष पहचान विफलता की रोकथाम और प्रदर्शन अनुकूलन के लिए महत्वपूर्ण है। स्थिति निगरानी डेटा की बढ़ती उपलब्धता के साथ, डेटा-संचालित विधियों को दोष पहचान में व्यापक रूप से लागू किया जा रहा है। हालांकि, ये विधियां आमतौर पर बड़े पैमाने पर, विविध और प्रतिनिधि प्रशिक्षण डेटासेट की आवश्यकता होती है, जो व्यावहारिक रूप से पूरा करना कठिन है, विशेष रूप से प्रारंभिक तैनाती में। औद्योगिक प्रणालियां अत्यधिक परिवर्तनशील और लगातार विकसित होने वाली स्थितियों में काम करती हैं, जिससे प्रशिक्षण और परीक्षण डेटा के बीच वितरण बदलाव होता है। इन चुनौतियों को हल करने के लिए, यह पेपर TARD नामक एक नई सतत परीक्षण-समय डोमेन अनुकूलन विधि प्रस्तावित करता है, जो डोमेन बदलाव और सीमित प्रशिक्षण डेटा की स्थितियों में मजबूत प्रारंभिक दोष पहचान का समर्थन करने के लिए विशेष रूप से डिज़ाइन की गई है।
- डेटा की कमी: औद्योगिक प्रणालियां, विशेष रूप से नई तैनाती या नवीनीकृत उपकरण, व्यापक ऐतिहासिक डेटा की कमी करते हैं, विशेष रूप से दोष डेटा अत्यंत दुर्लभ है
- डोमेन बदलाव की चुनौती: विभिन्न उपकरण इकाइयों के बीच और एक ही प्रणाली के विभिन्न समय में परिचालन स्थितियों में महत्वपूर्ण अंतर है, जो पारंपरिक मशीन लर्निंग की i.i.d धारणा का उल्लंघन करता है
- गतिशील वातावरण: औद्योगिक प्रणालियां लगातार विकसित होने वाले वातावरण में काम करती हैं, जिन्हें असतत डोमेन अनुकूलन के बजाय सतत अनुकूलन की आवश्यकता है
- प्रारंभिक दोष पहचान प्रणाली प्रदर्शन अनुकूलन, रखरखाव लागत को कम करने और संपत्ति अनुपलब्धता को कम करने के लिए महत्वपूर्ण है
- मौजूदा विधियां वितरण बदलाव का सामना करते समय उच्च झूठी सकारात्मक दर और पहचान सटीकता में गिरावट का कारण बनती हैं
- डेटा-समृद्ध प्रणालियों से डेटा-दुर्लभ नई प्रणालियों में ज्ञान स्थानांतरण का समर्थन करने वाली बेड़े-स्तरीय ज्ञान स्थानांतरण की आवश्यकता है
- पारंपरिक डोमेन अनुकूलन विधियां: बड़ी मात्रा में स्रोत डोमेन और लक्ष्य डोमेन डेटा की आवश्यकता है, और आमतौर पर लेबल किए गए दोष डेटा की आवश्यकता है
- स्थिर अनुकूलन: अधिकांश विधियां असतत स्थिर डोमेन विशेषताओं को मानती हैं, लगातार विकसित होने वाली परिचालन स्थितियों को संभाल नहीं सकती हैं
- परीक्षण-समय अनुकूलन जोखिम: मौजूदा TTA विधियां गलती से दोष पैटर्न को सामान्य व्यवहार में अनुकूलित कर सकती हैं
- TARD ढांचा प्रस्तावित करना: बिना पर्यवेक्षण दोष पहचान के लिए डिज़ाइन किया गया एक सतत परीक्षण-समय डोमेन अनुकूलन ढांचा, जो पूरी तरह से लेबल किए गए दोष डेटा पर निर्भर नहीं है
- नवीन विशेषता पृथक्करण रणनीति: स्पष्ट रूप से इनपुट चर को नियंत्रण पैरामीटर और सेंसर माप में विभाजित करना, और प्रत्येक प्रकार के लिए विशेष अनुकूलन रणनीति अपनाना
- व्यावहारिक ढांचा: लक्ष्य प्रणाली के केवल कुछ सामान्य नमूनों की आवश्यकता है, प्रारंभिक तैनाती और बेड़े-स्तरीय ज्ञान स्थानांतरण के लिए उपयुक्त है
- अनुभवजन्य सत्यापन: दो बहु-चरण प्रवाह सुविधाओं के वास्तविक केस अध्ययनों में विधि की प्रभावशीलता को सत्यापित किया गया है
दिया गया:
- स्रोत प्रणाली का समृद्ध स्वस्थ प्रशिक्षण डेटा: Xs=[x1s,⋯,xns]
- लक्ष्य डोमेन का सीमित सामान्य डेटा: Xt=[x1t,⋯,xmt]
उद्देश्य: लक्ष्य डोमेन t में मजबूत दोष पहचान प्राप्त करना, निम्नलिखित पर विचार करते हुए:
- दोनों डोमेन में दोष प्रशिक्षण डेटा की कमी है
- लक्ष्य डोमेन डेटा उपलब्धता सीमित है
- अनुमान प्रक्रिया के दौरान सतत वितरण बदलाव
इनपुट डेटा को दो समूहों में विभाजित करना: X=[x,w]
- नियंत्रण चर w: ऑपरेटर या नियंत्रण प्रणाली द्वारा निर्धारित प्रणाली स्थिति नियंत्रण चर
- सेंसर माप x: प्रणाली घटकों की निगरानी करने वाले और वास्तविक समय प्रणाली स्थिति को प्रतिबिंबित करने वाले सेंसर सिग्नल
स्वचालित एनकोडर fθ को पुनर्निर्माण मॉडल के रूप में अपनाना, स्रोत डोमेन सामान्य डेटा पर प्रशिक्षित:
lossMSE=n1∑1n(Xs−X^s)2
अनुकूलन मॉड्यूल hϕ का परिचय देना, पुनर्निर्माण मॉडल को सीधे संशोधित करने के बजाय:
- इनपुट: नियंत्रण चर w और पूर्व-प्रशिक्षित स्वचालित एनकोडर की भविष्यवाणी
- आउटपुट: मुआवजा पद Δx
- डिज़ाइन सिद्धांत: संभावित दोष डेटा वितरण में अनुकूलन से बचना
- मुख्य मॉडल को फ्रीज करना: पूर्व-प्रशिक्षित स्वचालित एनकोडर fθ अनुकूलन चरण में फ्रीज रहता है
- AdaBN परत: अनुकूलन मॉड्यूल में अनुकूली बैच सामान्यीकरण परत को एकीकृत करना, बैच सांख्यिकी के आधार पर माध्य और विचरण को अपडेट करना
- पृथक अनुकूलन: केवल नियंत्रण चर के लिए अनुकूलन, सेंसर माप की विसंगति पहचान क्षमता की रक्षा करना
ri=Xˉt_training∣X^i−Xi∣
si=k1∑j=1krij+max∑j=1krij
si_smooth=mean∑q=0l−1si+q
si_smooth>α⋅rˉt_training
- निगरानी चर: 24 प्रक्रिया चर (दबाव, प्रवाह, तरल स्तर, घनत्व, तापमान, वाल्व स्थिति)
- नियंत्रण चर: वायु और जल प्रवाह सेटपॉइंट
- दोष प्रकार: 6 प्रकार (वायु पाइपलाइन रुकावट, जल पाइपलाइन रुकावट, शीर्ष विभाजक इनपुट रुकावट, प्रत्यक्ष बाईपास खुली, स्लग प्रवाह स्थिति, 2 इंच पाइपलाइन दबाव)
- नमूनाकरण आवृत्ति: 1 Hz
- निगरानी चर: 15 प्रक्रिया चर
- परिचालन स्थितियां: 20 विभिन्न वायु और जल प्रवाह संयोजन
- दोष प्रकार: 3 प्रकार (वायु रिसाव, वायु रुकावट, विभाजन)
- नमूनाकरण आवृत्ति: 1 Hz
- सटीकता (Accuracy): कुल भविष्यवाणी सही दर
- F1 स्कोर: परिशुद्धता और पुनरावृत्ति दर का हार्मोनिक माध्य
- AUC: ROC वक्र के तहत क्षेत्र
- Baseline: केवल स्रोत डोमेन पर प्रशिक्षित मॉडल
- AdaBN: अनुकूली बैच सामान्यीकरण
- MMD: अधिकतम माध्य विसंगति
- अनुकूलक: Adam, सीखने की दर 1e-5
- बैच आकार: 128
- प्रशिक्षण एपोक्स: स्वचालित एनकोडर 500 एपोक्स, अनुकूलन मॉड्यूल 50 एपोक्स
- आर्किटेक्चर: एनकोडर और डिकोडर प्रत्येक 3 परत पूर्ण कनेक्टेड, आयाम 50-50-10
| दोष प्रकार | Baseline | AdaBN | MMD | TARD |
|---|
| वायु पाइपलाइन रुकावट | F1: 0.43 | F1: 0.43 | F1: 0.47 | F1: 0.70 |
| जल पाइपलाइन रुकावट | F1: 0.67 | F1: 0.62 | F1: 0.69 | F1: 0.76 |
| शीर्ष विभाजक रुकावट | F1: 0.63 | F1: 0.65 | F1: 0.64 | F1: 0.79 |
| प्रत्यक्ष बाईपास खुली | F1: 0.53 | F1: 0.60 | F1: 0.56 | F1: 0.69 |
| स्लग प्रवाह स्थिति | F1: 0.85 | F1: 0.88 | F1: 0.89 | F1: 0.92 |
| 2 इंच पाइपलाइन दबाव | F1: 0.94 | F1: 0.98 | F1: 1.00 | F1: 1.00 |
| दोष प्रकार | Baseline | AdaBN | MMD | TARD |
|---|
| वायु रिसाव | F1: 0.62 | F1: 0.36 | F1: 0.51 | F1: 0.76 |
| वायु रुकावट | F1: 0.93 | F1: 0.88 | F1: 0.96 | F1: 0.94 |
| विभाजन | F1: 0.11 | F1: 0.51 | F1: 0.51 | F1: 0.69 |
Cranfield शीर्ष विभाजक रुकावट केस में विभिन्न परिचालन स्थितियों में:
- परिवर्तनशील स्थितियां: TARD गतिशील वातावरण में सर्वोत्तम प्रदर्शन करता है (F1: 0.86 vs MMD: 0.79)
- स्थिर-अवस्था स्थितियां: TARD अधिकांश स्थिर-अवस्था स्थितियों में भी लाभ बनाए रखता है
गहन समूह (10 स्वतंत्र मॉडल) के माध्यम से TARD पहचान परिणामों की उच्च विश्वसनीयता को सत्यापित किया गया है, दोष पहचान के दौरान अनिश्चितता बैंड संकीर्ण रहता है (मानक विचलन लगभग 0.8)
- 100-आयामी सेंसर: F1 0.42 से 0.67 तक सुधार
- 1000-आयामी सेंसर: F1 0.10 से 0.48 तक सुधार
- अनुमान विलंब: वास्तविक समय निगरानी आवश्यकताओं की सीमा में रहता है (<2ms)
- संभाव्य मॉडल: गॉसियन मिश्रण मॉडल, ऊर्जा-आधारित मॉडल
- एक-वर्ग वर्गीकरण: समर्थन वेक्टर मशीन जैसी विवेचक सीमा विधियां
- पुनर्निर्माण विधियां: स्वचालित एनकोडर जैसी पुनर्निर्माण त्रुटि-आधारित विधियां
- सजातीय उप-बेड़े: समानता-आधारित क्लस्टरिंग विधियां
- कार्यात्मक प्रतिनिधित्व सीखना: संपूर्ण बेड़े व्यवहार सीखने की विधियां
- सीमाएं: पर्याप्त समानता धारणा पर निर्भर
- विसंगति न्यूनीकरण विधियां: MMD जैसी सांख्यिकीय दूरी न्यूनीकरण
- विरोधी विधियां: DANN जैसी डोमेन विवेचक नेटवर्क
- परीक्षण-समय अनुकूलन: Tent, SHOT जैसी विधियां
- चुनौतियां: लेबल किए गए डेटा की आवश्यकता, स्थिर डोमेन धारणा, दोष डेटा में अनुकूलन की संभावना
- TARD ने औद्योगिक दोष पहचान में तीन प्रमुख चुनौतियों को सफलतापूर्वक हल किया है: लेबल किए गए दोष डेटा की कमी, लक्ष्य डोमेन डेटा सीमित, सतत डोमेन बदलाव
- विशेषता पृथक्करण रणनीति परिचालन स्थिति परिवर्तन और वास्तविक दोषों को प्रभावी ढंग से अलग करती है
- दो वास्तविक औद्योगिक डेटासेट पर मौजूदा डोमेन अनुकूलन विधियों से महत्वपूर्ण रूप से बेहतर है
- पैरामीटर समायोजन: दोष पहचान संवेदनशीलता पैरामीटर α को मैन्युअल रूप से सेट करने की आवश्यकता है
- प्रमुख प्रणाली परिवर्तन: स्थायी प्रमुख प्रणाली परिवर्तनों को संभालने के लिए सुरक्षा तंत्र की कमी है
- समय गतिशीलता: वर्तमान अवशेष सुगमता रणनीति महत्वपूर्ण समय विवरण खो सकती है
- स्वचालित सुरक्षा तंत्र: प्रमुख डोमेन बदलाव का पता लगाने और अनुकूलन मॉड्यूल पुनः प्रशिक्षण को ट्रिगर करने की विधियां विकसित करना
- स्वचालित पैरामीटर समायोजन: संवेदनशीलता पैरामीटर α को स्वचालित रूप से समायोजित करने की विधियां
- समय श्रृंखला विश्लेषण: अवशेष अनुक्रम में जटिल पैटर्न विश्लेषण के लिए विशेष समय श्रृंखला मॉडल का परिचय
- व्यावहारिकता: औद्योगिक जगत में वास्तविक चुनौतियों को हल करता है, केवल कुछ सामान्य डेटा की आवश्यकता है
- तकनीकी नवाचार: विशेषता पृथक्करण और विशेष अनुकूलन रणनीति का डिज़ाइन चतुर और प्रभावी है
- व्यापक प्रयोग: दो वास्तविक औद्योगिक डेटासेट + उच्च-आयामी सिंथेटिक डेटा का व्यापक सत्यापन
- सैद्धांतिक आधार: स्पष्ट समस्या परिभाषा और विधि प्रेरणा
- लागू क्षेत्र: मुख्य रूप से बहु-चरण प्रवाह प्रणालियों को सत्यापित किया गया है, अन्य औद्योगिक प्रणालियों में सामान्यीकरण क्षमता की जांच की जानी बाकी है
- सैद्धांतिक विश्लेषण: विधि अभिसरण और स्थिरता के लिए सैद्धांतिक गारंटी की कमी है
- कम्प्यूटेशनल ओवरहेड: हालांकि अनुमान समय की रिपोर्ट की गई है, लेकिन विस्तृत कम्प्यूटेशनल जटिलता विश्लेषण की कमी है
- हाइपरपैरामीटर संवेदनशीलता: महत्वपूर्ण हाइपरपैरामीटर (जैसे α, विंडो लंबाई l) के लिए संवेदनशीलता विश्लेषण अपर्याप्त है
- शैक्षणिक योगदान: औद्योगिक दोष पहचान क्षेत्र के लिए नई अनुसंधान दिशा प्रदान करता है
- व्यावहारिक मूल्य: औद्योगिक तैनाती के लिए सीधे लागू, विशेष रूप से नए उपकरणों की प्रारंभिक निगरानी
- पुनरुत्पादनीयता: विस्तृत कार्यान्वयन विवरण और एल्गोरिदम विवरण प्रदान करता है
- नई तैनाती प्रणालियां: सीमित ऐतिहासिक डेटा वाली औद्योगिक उपकरण
- बेड़े प्रबंधन: उपकरणों के बीच ज्ञान स्थानांतरण की आवश्यकता वाले परिदृश्य
- गतिशील वातावरण: परिचालन स्थितियां लगातार बदलने वाली औद्योगिक प्रणालियां
- महत्वपूर्ण बुनियादी ढांचा: झूठी सकारात्मकता के प्रति संवेदनशील महत्वपूर्ण औद्योगिक प्रणालियां
पेपर ने 51 संबंधित संदर्भों का हवाला दिया है, जो दोष पहचान, डोमेन अनुकूलन, गहन शिक्षा आदि मुख्य क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करता है, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।
समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला अनुप्रयुक्त सांख्यिकी पेपर है जो डोमेन अनुकूलन तकनीक को औद्योगिक दोष पहचान की महत्वपूर्ण व्यावहारिक समस्या पर सफलतापूर्वक लागू करता है। विधि डिज़ाइन तर्कसंगत है, प्रायोगिक सत्यापन व्यापक है, और इसमें बहुत मजबूत व्यावहारिक मूल्य और शैक्षणिक महत्व है।