Fault detection is essential in complex industrial systems to prevent failures and optimize performance by distinguishing abnormal from normal operating conditions. With the growing availability of condition monitoring data, data-driven approaches have increasingly applied in detecting system faults. However, these methods typically require large, diverse, and representative training datasets that capture the full range of operating scenarios, an assumption rarely met in practice, particularly in the early stages of deployment.
Industrial systems often operate under highly variable and evolving conditions, making it difficult to collect comprehensive training data. This variability results in a distribution shift between training and testing data, as future operating conditions may diverge from those previously observed ones. Such domain shifts hinder the generalization of traditional models, limiting their ability to transfer knowledge across time and system instances, ultimately leading to performance degradation in practical deployments.
To address these challenges, we propose a novel method for continuous test-time domain adaptation, designed to support robust early-stage fault detection in the presence of domain shifts and limited representativeness of training data. Our proposed framework --Test-time domain Adaptation for Robust fault Detection (TARD) -- explicitly separates input features into system parameters and sensor measurements. It employs a dedicated domain adaptation module to adapt to each input type using different strategies, enabling more targeted and effective adaptation to evolving operating conditions. We validate our approach on two real-world case studies from multi-phase flow facilities, delivering substantial improvements in both fault detection accuracy and model robustness over existing domain adaptation methods under real-world variability.
- পেপার আইডি: 2507.16354
- শিরোনাম: TARD: Test-time Domain Adaptation for Robust Fault Detection under Evolving Operating Conditions
- লেখক: Han Sun, Olga Fink (EPFL)
- শ্রেণীবিভাগ: stat.AP (পরিসংখ্যান - প্রয়োগ)
- প্রকাশনার সময়: ২৫ অক্টোবর ২০২৫ (arXiv v2)
- পেপার লিঙ্ক: https://arxiv.org/abs/2507.16354
শিল্প ব্যবস্থায় ত্রুটি সনাক্তকরণ ব্যর্থতা প্রতিরোধ এবং কর্মক্ষমতা অপ্টিমাইজেশনের জন্য অত্যন্ত গুরুত্বপূর্ণ। অবস্থা পর্যবেক্ষণ ডেটার ক্রমবর্ধমান প্রাচুর্যের সাথে, ডেটা-চালিত পদ্ধতিগুলি ত্রুটি সনাক্তকরণে ব্যাপকভাবে প্রয়োগ করা হয়। তবে এই পদ্ধতিগুলির জন্য সাধারণত বৃহৎ-আকারের, বৈচিত্র্যময় এবং প্রতিনিধিত্বমূলক প্রশিক্ষণ ডেটাসেটের প্রয়োজন হয়, যা বাস্তবে পূরণ করা কঠিন, বিশেষ করে স্থাপনার প্রাথমিক পর্যায়ে। শিল্প ব্যবস্থাগুলি প্রায়শই অত্যন্ত পরিবর্তনশীল এবং ক্রমাগত বিকশিত অবস্থার অধীনে কাজ করে, যা প্রশিক্ষণ এবং পরীক্ষার ডেটার মধ্যে বিতরণ পরিবর্তন ঘটায়। এই চ্যালেঞ্জগুলি সমাধানের জন্য, এই পেপারটি একটি উপন্যাস ক্রমাগত পরীক্ষা-সময় ডোমেইন অভিযোজন পদ্ধতি TARD প্রস্তাব করে, যা ডোমেইন পরিবর্তন এবং সীমিত প্রশিক্ষণ ডেটার অবস্থায় শক্তিশালী প্রাথমিক ত্রুটি সনাক্তকরণ সমর্থন করার জন্য বিশেষভাবে ডিজাইন করা হয়েছে।
- ডেটা স্বল্পতা: শিল্প ব্যবস্থা, বিশেষ করে নতুন স্থাপিত বা পুনর্নবীকৃত সরঞ্জাম, ব্যাপক ঐতিহাসিক ডেটার অভাব রয়েছে, বিশেষ করে ত্রুটি ডেটা অত্যন্ত বিরল
- ডোমেইন পরিবর্তন চ্যালেঞ্জ: বিভিন্ন সরঞ্জাম ইউনিট এবং একই সিস্টেমের বিভিন্ন সময়ের অপারেটিং অবস্থার মধ্যে উল্লেখযোগ্য পার্থক্য রয়েছে, যা ঐতিহ্যবাহী মেশিন লার্নিংয়ের i.i.d অনুমান লঙ্ঘন করে
- গতিশীল পরিবেশ: শিল্প ব্যবস্থাগুলি ক্রমাগত বিকশিত পরিবেশে কাজ করে, যার জন্য বিচ্ছিন্ন ডোমেইন অভিযোজনের পরিবর্তে ক্রমাগত অভিযোজন প্রয়োজন
- প্রাথমিক ত্রুটি সনাক্তকরণ সিস্টেম কর্মক্ষমতা অপ্টিমাইজ করা, রক্ষণাবেক্ষণ খরচ কমানো এবং সম্পদ অনুপলব্ধতা হ্রাস করার জন্য অত্যন্ত গুরুত্বপূর্ণ
- বিদ্যমান পদ্ধতিগুলি বিতরণ পরিবর্তনের মুখোমুখি হলে উচ্চ মিথ্যা সতর্কতা হার এবং সনাক্তকরণ নির্ভুলতা হ্রাসের প্রবণতা রয়েছে
- ডেটা-সমৃদ্ধ সিস্টেম থেকে ডেটা-স্বল্প নতুন সিস্টেমে অভিজ্ঞতা স্থানান্তরের জন্য ফ্লিট-স্তরের জ্ঞান স্থানান্তর সমর্থন করার প্রয়োজন
- ঐতিহ্যবাহী ডোমেইন অভিযোজন পদ্ধতি: প্রচুর পরিমাণে উৎস ডোমেইন এবং লক্ষ্য ডোমেইন ডেটা প্রয়োজন, এবং সাধারণত লেবেলযুক্ত ত্রুটি ডেটা প্রয়োজন
- স্ট্যাটিক অভিযোজন: বেশিরভাগ পদ্ধতি বিচ্ছিন্ন স্ট্যাটিক ডোমেইন বৈশিষ্ট্য অনুমান করে, ক্রমাগত বিকশিত অপারেটিং অবস্থা পরিচালনা করতে পারে না
- পরীক্ষা-সময় অভিযোজন ঝুঁকি: বিদ্যমান TTA পদ্ধতিগুলি ত্রুটি প্যাটার্নগুলিকে সাধারণ আচরণে ভুলভাবে অভিযোজিত করতে পারে
- TARD ফ্রেমওয়ার্ক প্রস্তাব: অনুপযুক্ত ত্রুটি সনাক্তকরণের জন্য ডিজাইন করা একটি ক্রমাগত পরীক্ষা-সময় ডোমেইন অভিযোজন ফ্রেমওয়ার্ক, যা সম্পূর্ণভাবে লেবেলযুক্ত ত্রুটি ডেটার উপর নির্ভর করে না
- উদ্ভাবনী বৈশিষ্ট্য বিচ্ছেদ কৌশল: স্পষ্টভাবে ইনপুট ভেরিয়েবলগুলিকে নিয়ন্ত্রণ পরামিতি এবং সেন্সর পরিমাপে বিভক্ত করে, এবং প্রতিটি শ্রেণীর জন্য বিশেষায়িত অভিযোজন কৌশল প্রয়োগ করে
- ব্যবহারিক ফ্রেমওয়ার্ক: শুধুমাত্র লক্ষ্য সিস্টেমের কয়েকটি সাধারণ নমুনার প্রয়োজন, প্রাথমিক স্থাপনা এবং ফ্লিট-স্তরের জ্ঞান স্থানান্তরের জন্য উপযুক্ত
- অভিজ্ঞতামূলক যাচাইকরণ: দুটি বহু-পর্যায়ের প্রবাহ সুবিধায় বাস্তব কেস স্টাডিতে পদ্ধতির কার্যকারিতা যাচাই করা হয়েছে
দেওয়া:
- উৎস সিস্টেমের সমৃদ্ধ স্বাস্থ্যকর প্রশিক্ষণ ডেটা: Xs=[x1s,⋯,xns]
- লক্ষ্য ডোমেইনের সীমিত সাধারণ ডেটা: Xt=[x1t,⋯,xmt]
উদ্দেশ্য: লক্ষ্য ডোমেইন t এ শক্তিশালী ত্রুটি সনাক্তকরণ অর্জন করা, বিবেচনা করে:
- উভয় ডোমেইনই ত্রুটি প্রশিক্ষণ ডেটার অভাব রয়েছে
- লক্ষ্য ডোমেইন ডেটা উপলব্ধতা সীমিত
- অনুমান প্রক্রিয়ার সময় ক্রমাগত বিতরণ পরিবর্তন
ইনপুট ডেটা দুটি গ্রুপে বিভক্ত করুন: X=[x,w]
- নিয়ন্ত্রণ ভেরিয়েবল w: অপারেটর বা নিয়ন্ত্রণ সিস্টেম দ্বারা সেট করা সিস্টেম অবস্থা নিয়ন্ত্রণ ভেরিয়েবল
- সেন্সর পরিমাপ x: সিস্টেম উপাদান পর্যবেক্ষণ করে এবং রিয়েল-টাইম সিস্টেম অবস্থা প্রতিফলিত করে এমন সেন্সর সংকেত
স্ব-এনকোডার fθ কে পুনর্নির্মাণ মডেল হিসাবে ব্যবহার করুন, উৎস ডোমেইন সাধারণ ডেটায় প্রশিক্ষিত:
lossMSE=n1∑1n(Xs−X^s)2
অভিযোজন মডিউল hϕ প্রবর্তন করুন, পুনর্নির্মাণ মডেল সরাসরি সংশোধনের পরিবর্তে:
- ইনপুট: নিয়ন্ত্রণ ভেরিয়েবল w এবং প্রি-প্রশিক্ষিত স্ব-এনকোডারের পূর্বাভাস মূল্য
- আউটপুট: ক্ষতিপূরণ পদ Δx
- ডিজাইন নীতি: সম্ভাব্য ত্রুটি ডেটা বিতরণে অভিযোজন এড়ান
- হিমায়িত প্রধান মডেল: প্রি-প্রশিক্ষিত স্ব-এনকোডার fθ অভিযোজন পর্যায়ে হিমায়িত থাকে
- AdaBN স্তর: অভিযোজন মডিউলে অভিযোজনযোগ্য ব্যাচ নর্মালাইজেশন স্তর একীভূত করুন, ব্যাচ পরিসংখ্যানের উপর ভিত্তি করে গড় এবং বৈচিত্র্য আপডেট করুন
- বিচ্ছিন্ন অভিযোজন: শুধুমাত্র নিয়ন্ত্রণ ভেরিয়েবলগুলির জন্য অভিযোজন করুন, সেন্সর পরিমাপের অসামান্যতা সনাক্তকরণ ক্ষমতা রক্ষা করুন
ri=Xˉt_training∣X^i−Xi∣
si=k1∑j=1krij+max∑j=1krij
si_smooth=mean∑q=0l−1si+q
si_smooth>α⋅rˉt_training
- পর্যবেক্ষণ ভেরিয়েবল: ২৪টি প্রক্রিয়া ভেরিয়েবল (চাপ, প্রবাহ, তরল স্তর, ঘনত্ব, তাপমাত্রা, ভালভ অবস্থান)
- নিয়ন্ত্রণ ভেরিয়েবল: বায়ু এবং জল প্রবাহ সেটপয়েন্ট
- ত্রুটির ধরন: ৬টি (বায়ু পাইপলাইন বাধা, জল পাইপলাইন বাধা, শীর্ষ বিভাজক ইনপুট বাধা, সরাসরি বাইপাস খোলা, স্লাগ প্রবাহ অবস্থা, ২ ইঞ্চি পাইপলাইন চাপ)
- নমুনা ফ্রিকোয়েন্সি: ১ Hz
- পর্যবেক্ষণ ভেরিয়েবল: ১৫টি প্রক্রিয়া ভেরিয়েবল
- অপারেটিং অবস্থা: ২০টি বিভিন্ন বায়ু এবং জল প্রবাহ সমন্বয়
- ত্রুটির ধরন: ৩টি (বায়ু ফুটো, বায়ু বাধা, বিভাজন)
- নমুনা ফ্রিকোয়েন্সি: ১ Hz
- নির্ভুলতা (Accuracy): সামগ্রিক পূর্বাভাস সঠিকতা
- F1 স্কোর: নির্ভুলতা এবং স্মরণের সুরেলা গড়
- AUC: ROC বক্ররেখার অধীন এলাকা
- Baseline: শুধুমাত্র উৎস ডোমেইনে প্রশিক্ষিত মডেল
- AdaBN: অভিযোজনযোগ্য ব্যাচ নর্মালাইজেশন
- MMD: সর্বাধিক গড় বৈষম্য
- অপ্টিমাইজার: Adam, শেখার হার 1e-5
- ব্যাচ আকার: 128
- প্রশিক্ষণ যুগ: স্ব-এনকোডার ৫০০ যুগ, অভিযোজন মডিউল ৫০ যুগ
- আর্কিটেকচার: এনকোডার এবং ডিকোডার প্রতিটি ৩ স্তরের সম্পূর্ণ সংযুক্ত, মাত্রা ৫০-৫০-১০
| ত্রুটির ধরন | Baseline | AdaBN | MMD | TARD |
|---|
| বায়ু পাইপলাইন বাধা | F1: 0.43 | F1: 0.43 | F1: 0.47 | F1: 0.70 |
| জল পাইপলাইন বাধা | F1: 0.67 | F1: 0.62 | F1: 0.69 | F1: 0.76 |
| শীর্ষ বিভাজক বাধা | F1: 0.63 | F1: 0.65 | F1: 0.64 | F1: 0.79 |
| সরাসরি বাইপাস খোলা | F1: 0.53 | F1: 0.60 | F1: 0.56 | F1: 0.69 |
| স্লাগ প্রবাহ অবস্থা | F1: 0.85 | F1: 0.88 | F1: 0.89 | F1: 0.92 |
| ২ ইঞ্চি পাইপলাইন চাপ | F1: 0.94 | F1: 0.98 | F1: 1.00 | F1: 1.00 |
| ত্রুটির ধরন | Baseline | AdaBN | MMD | TARD |
|---|
| বায়ু ফুটো | F1: 0.62 | F1: 0.36 | F1: 0.51 | F1: 0.76 |
| বায়ু বাধা | F1: 0.93 | F1: 0.88 | F1: 0.96 | F1: 0.94 |
| বিভাজন | F1: 0.11 | F1: 0.51 | F1: 0.51 | F1: 0.69 |
Cranfield শীর্ষ বিভাজক বাধা কেসে বিভিন্ন অপারেটিং অবস্থার অধীনে:
- পরিবর্তনশীল অবস্থা: TARD গতিশীল পরিবেশে সেরা পারফরম্যান্স করে (F1: 0.86 vs MMD: 0.79)
- স্থির অবস্থা: TARD বেশিরভাগ স্থির অবস্থায়ও সুবিধা বজায় রাখে
গভীর সমন্বয়ের মাধ্যমে (১০টি স্বাধীন মডেল) TARD সনাক্তকরণ ফলাফলের উচ্চ আত্মবিশ্বাস যাচাই করা হয়েছে, ত্রুটি সনাক্তকরণের সময় অনিশ্চয়তা ব্যান্ড সংকীর্ণ থাকে (মান বিচ্যুতি প্রায় 0.8)
- ১০০-মাত্রিক সেন্সর: F1 0.42 থেকে 0.67 এ উন্নত
- ১০০০-মাত্রিক সেন্সর: F1 0.10 থেকে 0.48 এ উন্নত
- অনুমান বিলম্ব: রিয়েল-টাইম পর্যবেক্ষণ প্রয়োজনীয়তার সীমার মধ্যে থাকে (<2ms)
- সম্ভাব্যতামূলক মডেল: গাউসিয়ান মিশ্রণ মডেল, শক্তি-ভিত্তিক মডেল
- এক-শ্রেণী শ্রেণীবিভাগ: সমর্থন ভেক্টর মেশিন ইত্যাদি বৈষম্যমূলক সীমানা পদ্ধতি
- পুনর্নির্মাণ পদ্ধতি: স্ব-এনকোডার ইত্যাদি পুনর্নির্মাণ ত্রুটি-ভিত্তিক পদ্ধতি
- সমজাতীয় সাব-ফ্লিট: সাদৃশ্য ক্লাস্টারিং-ভিত্তিক পদ্ধতি
- কার্যকরী প্রতিনিধিত্ব শেখা: সম্পূর্ণ ফ্লিট আচরণ শেখার পদ্ধতি
- সীমাবদ্ধতা: পর্যাপ্ত সাদৃশ্য অনুমানের উপর নির্ভর করে
- বৈষম্য ন্যূনতমকরণ পদ্ধতি: MMD ইত্যাদি পরিসংখ্যানগত দূরত্ব ন্যূনতমকরণ
- প্রতিদ্বন্দ্বী পদ্ধতি: DANN ইত্যাদি ডোমেইন বৈষম্যকারী নেটওয়ার্ক
- পরীক্ষা-সময় অভিযোজন: Tent, SHOT ইত্যাদি পদ্ধতি
- চ্যালেঞ্জ: লেবেলযুক্ত ডেটা প্রয়োজন, স্ট্যাটিক ডোমেইন অনুমান, ত্রুটি ডেটায় অভিযোজিত হতে পারে
- TARD সফলভাবে শিল্প ত্রুটি সনাক্তকরণে তিনটি প্রধান চ্যালেঞ্জ সমাধান করে: লেবেলযুক্ত ত্রুটি ডেটার অভাব, লক্ষ্য ডোমেইন ডেটা সীমিত, ক্রমাগত ডোমেইন পরিবর্তন
- বৈশিষ্ট্য বিচ্ছেদ কৌশল কার্যকরভাবে অপারেটিং অবস্থা পরিবর্তন এবং প্রকৃত ত্রুটি আলাদা করে
- দুটি বাস্তব শিল্প ডেটাসেটে বিদ্যমান ডোমেইন অভিযোজন পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে উন্নত
- প্যারামিটার সমন্বয়: ত্রুটি সনাক্তকরণ সংবেদনশীলতা প্যারামিটার α ম্যানুয়ালি সেট করা প্রয়োজন
- প্রধান সিস্টেম পরিবর্তন: স্থায়ী প্রধান সিস্টেম পরিবর্তন পরিচালনার জন্য সুরক্ষা প্রক্রিয়ার অভাব
- সময়গত গতিশীলতা: বর্তমান অবশিষ্টাংশ মসৃণকরণ কৌশল গুরুত্বপূর্ণ সময়গত বিবরণ হারাতে পারে
- স্বয়ংক্রিয় সুরক্ষা প্রক্রিয়া: প্রধান ডোমেইন পরিবর্তন সনাক্ত করে এবং অভিযোজন মডিউল পুনঃপ্রশিক্ষণ ট্রিগার করার পদ্ধতি বিকাশ করুন
- স্বয়ংক্রিয় প্যারামিটার সমন্বয়: সংবেদনশীলতা প্যারামিটার α স্বয়ংক্রিয়ভাবে সামঞ্জস্য করার পদ্ধতি
- সময় সিরিজ বিশ্লেষণ: অবশিষ্টাংশ সিরিজে জটিল প্যাটার্ন বিশ্লেষণের জন্য বিশেষায়িত সময় সিরিজ মডেল প্রবর্তন করুন
- শক্তিশালী ব্যবহারিকতা: শিল্পে প্রকৃতপক্ষে বিদ্যমান চ্যালেঞ্জ সমাধান করে, শুধুমাত্র কয়েকটি সাধারণ ডেটা প্রয়োজন
- প্রযুক্তিগত উদ্ভাবন: বৈশিষ্ট্য বিচ্ছেদ এবং বিশেষায়িত অভিযোজন কৌশলের ডিজাইন চতুর এবং কার্যকর
- ব্যাপক পরীক্ষা: দুটি বাস্তব শিল্প ডেটাসেট + উচ্চ-মাত্রিক সংশ্লেষিত ডেটার সম্পূর্ণ যাচাইকরণ
- তাত্ত্বিক ভিত্তি: স্পষ্ট সমস্যা সংজ্ঞা এবং পদ্ধতি প্রেরণা
- প্রয়োগযোগ্যতার পরিধি: প্রধানত বহু-পর্যায়ের প্রবাহ সিস্টেম যাচাই করা হয়েছে, অন্যান্য শিল্প সিস্টেমের সাধারণীকরণ যাচাই করা বাকি
- তাত্ত্বিক বিশ্লেষণ: পদ্ধতির সংগতি এবং স্থিতিশীলতার জন্য তাত্ত্বিক গ্যারান্টির অভাব
- গণনা ওভারহেড: যদিও অনুমান সময় রিপোর্ট করা হয়েছে, তবে বিস্তারিত গণনা জটিলতা বিশ্লেষণের অভাব
- হাইপারপ্যারামিটার সংবেদনশীলতা: মূল হাইপারপ্যারামিটার (যেমন α, উইন্ডো দৈর্ঘ্য l) এর সংবেদনশীলতা বিশ্লেষণ অপর্যাপ্ত
- একাডেমিক অবদান: শিল্প ত্রুটি সনাক্তকরণ ক্ষেত্রে নতুন গবেষণা দিকনির্দেশনা প্রদান করে
- ব্যবহারিক মূল্য: শিল্প স্থাপনার জন্য সরাসরি প্রয়োগযোগ্য, বিশেষ করে নতুন সরঞ্জামের প্রাথমিক পর্যবেক্ষণ
- পুনরুৎপাদনযোগ্যতা: বিস্তারিত বাস্তবায়ন বিবরণ এবং অ্যালগরিদম বর্ণনা প্রদান করে
- নতুন স্থাপিত সিস্টেম: সীমিত ঐতিহাসিক ডেটা সহ শিল্প সরঞ্জাম
- ফ্লিট ব্যবস্থাপনা: ডিভাইস জুড়ে জ্ঞান স্থানান্তর প্রয়োজন এমন পরিস্থিতি
- গতিশীল পরিবেশ: অপারেটিং অবস্থা ক্রমাগত পরিবর্তনশীল শিল্প সিস্টেম
- গুরুত্বপূর্ণ অবকাঠামো: মিথ্যা সতর্কতার প্রতি সংবেদনশীল গুরুত্বপূর্ণ শিল্প সিস্টেম
পেপারটি ৫১টি সম্পর্কিত সংদর্ভ উদ্ধৃত করে, যা ত্রুটি সনাক্তকরণ, ডোমেইন অভিযোজন, গভীর শেখা ইত্যাদি মূল ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে।
সামগ্রিক মূল্যায়ন: এটি একটি উচ্চ-মানের প্রয়োগ পরিসংখ্যান পেপার, যা শিল্প ত্রুটি সনাক্তকরণের এই গুরুত্বপূর্ণ ব্যবহারিক সমস্যায় ডোমেইন অভিযোজন প্রযুক্তি সফলভাবে প্রয়োগ করে। পদ্ধতি ডিজাইন যুক্তিসঙ্গত, পরীক্ষামূলক যাচাইকরণ ব্যাপক, এবং এটি অত্যন্ত ব্যবহারিক মূল্য এবং একাডেমিক তাৎপর্য রাখে।