Fault detection is essential in complex industrial systems to prevent failures and optimize performance by distinguishing abnormal from normal operating conditions. With the growing availability of condition monitoring data, data-driven approaches have increasingly applied in detecting system faults. However, these methods typically require large, diverse, and representative training datasets that capture the full range of operating scenarios, an assumption rarely met in practice, particularly in the early stages of deployment.
Industrial systems often operate under highly variable and evolving conditions, making it difficult to collect comprehensive training data. This variability results in a distribution shift between training and testing data, as future operating conditions may diverge from those previously observed ones. Such domain shifts hinder the generalization of traditional models, limiting their ability to transfer knowledge across time and system instances, ultimately leading to performance degradation in practical deployments.
To address these challenges, we propose a novel method for continuous test-time domain adaptation, designed to support robust early-stage fault detection in the presence of domain shifts and limited representativeness of training data. Our proposed framework --Test-time domain Adaptation for Robust fault Detection (TARD) -- explicitly separates input features into system parameters and sensor measurements. It employs a dedicated domain adaptation module to adapt to each input type using different strategies, enabling more targeted and effective adaptation to evolving operating conditions. We validate our approach on two real-world case studies from multi-phase flow facilities, delivering substantial improvements in both fault detection accuracy and model robustness over existing domain adaptation methods under real-world variability.
- معرّف الورقة: 2507.16354
- العنوان: TARD: Test-time Domain Adaptation for Robust Fault Detection under Evolving Operating Conditions
- المؤلفون: Han Sun, Olga Fink (EPFL)
- التصنيف: stat.AP (الإحصاء - التطبيقات)
- تاريخ النشر: 13 أكتوبر 2025 (arXiv v2)
- رابط الورقة: https://arxiv.org/abs/2507.16354
يعتبر الكشف عن الأعطال في الأنظمة الصناعية حاسماً لمنع الفشل وتحسين الأداء. مع تزايد توفر بيانات المراقبة الحالية، تُستخدم الطرق المستندة إلى البيانات على نطاق واسع في الكشف عن الأعطال. ومع ذلك، تتطلب هذه الطرق عادةً مجموعات بيانات تدريب كبيرة ومتنوعة وممثلة، وهو أمر يصعب تحقيقه عملياً، خاصة في المراحل الأولى من النشر. تعمل الأنظمة الصناعية غالباً في ظروف شديدة التغير والتطور المستمر، مما يؤدي إلى حدوث انزياح توزيعي بين بيانات التدريب والاختبار. لمعالجة هذه التحديات، تقترح هذه الورقة طريقة جديدة للتكيف المستمر مع المجال في وقت الاختبار تسمى TARD، مصممة خصيصاً لدعم الكشف المبكر القوي عن الأعطال في ظل ظروف الانزياح المجالي والبيانات التدريبية المحدودة.
- ندرة البيانات: تفتقر الأنظمة الصناعية، خاصة الأجهزة المنشأة حديثاً أو المجددة، إلى بيانات تاريخية شاملة، وخاصة بيانات الأعطال النادرة جداً
- تحديات الانزياح المجالي: توجد اختلافات كبيرة في ظروف التشغيل بين وحدات الأجهزة المختلفة وفي نفس النظام في أوقات مختلفة، مما ينتهك افتراض التوزيع المستقل والمتطابق (i.i.d) للتعلم الآلي التقليدي
- البيئات الديناميكية: تعمل الأنظمة الصناعية في بيئات متطورة بشكل مستمر، مما يتطلب تكيفاً مستمراً وليس تكيفاً منفصلاً للمجال
- يعتبر الكشف المبكر عن الأعطال حاسماً لتحسين أداء النظام وتقليل تكاليف الصيانة وتقليل عدم توفر الأصول
- تميل الطرق الموجودة إلى إنتاج معدلات إنذارات كاذبة عالية وانخفاض دقة الكشف عند مواجهة الانزياح التوزيعي
- الحاجة إلى دعم نقل المعرفة على مستوى الأسطول، من الأنظمة الغنية بالبيانات إلى الأنظمة الجديدة التي تعاني من ندرة البيانات
- طرق التكيف المجالي التقليدية: تتطلب كميات كبيرة من بيانات المجال المصدري والهدف، وعادةً ما تحتاج إلى بيانات أعطال مُصنفة
- التكيف الثابت: تفترض معظم الطرق خصائص مجالية ثابتة منفصلة، وغير قادرة على التعامل مع ظروف التشغيل المتطورة بشكل مستمر
- مخاطر التكيف في وقت الاختبار: قد تقوم طرق TTA الموجودة بتكييف أنماط الأعطال بشكل خاطئ كسلوك طبيعي
- اقتراح إطار عمل TARD: إطار عمل تكيف مجالي مستمر مصمم خصيصاً للكشف عن الأعطال غير الموجه، لا يعتمد على بيانات أعطال مُصنفة على الإطلاق
- استراتيجية فصل الميزات المبتكرة: فصل صريح للمتغيرات المدخلة إلى معاملات التحكم وقياسات المستشعرات، مع تطبيق استراتيجيات تكيف متخصصة لكل فئة
- إطار عمل عملي: يتطلب فقط عدداً قليلاً من العينات الطبيعية من النظام الهدف، مناسب للنشر المبكر ونقل المعرفة على مستوى الأسطول
- التحقق التجريبي: تم التحقق من فعالية الطريقة في دراسات حالة حقيقية على منشأتي تدفق متعدد الأطوار
معطى:
- بيانات تدريب صحية غنية من النظام المصدري: Xs=[x1s,⋯,xns]
- بيانات طبيعية محدودة من المجال الهدف: Xt=[x1t,⋯,xmt]
الهدف: تحقيق كشف أعطال قوي في المجال الهدف t، مع الأخذ في الاعتبار:
- كلا المجالين يفتقران إلى بيانات تدريب الأعطال
- توفر البيانات محدود في المجال الهدف
- الانزياح التوزيعي المستمر أثناء الاستدلال
تقسيم البيانات المدخلة إلى مجموعتين: X=[x,w]
- متغيرات التحكم w: متغيرات التحكم في ظروف النظام التي يحددها المشغل أو نظام التحكم
- قياسات المستشعرات x: إشارات المستشعرات التي تراقب مكونات النظام وتعكس حالة النظام في الوقت الفعلي
استخدام جهاز ترميز تلقائي fθ كنموذج إعادة بناء، مدرب على بيانات طبيعية من المجال المصدري:
lossMSE=n1∑1n(Xs−X^s)2
إدخال وحدة تكيف hϕ، بدلاً من تعديل نموذج إعادة البناء مباشرة:
- المدخل: متغيرات التحكم w والقيم المتنبأ بها من جهاز الترميز التلقائي المدرب مسبقاً
- المخرج: حد التعويض Δx
- مبدأ التصميم: تجنب التكيف مع توزيع بيانات الأعطال المحتملة
- تجميد النموذج الرئيسي: يبقى جهاز الترميز التلقائي المدرب مسبقاً fθ مجمداً أثناء مرحلة التكيف
- طبقات AdaBN: دمج طبقات التطبيع الدفعي التكيفية في وحدة التكيف، مع تحديث المتوسط والتباين بناءً على إحصائيات الدفعة
- التكيف المنفصل: تطبيق التكيف فقط على متغيرات التحكم، مع حماية قدرة الكشف عن الشذوذ في قياسات المستشعرات
ri=Xˉt_training∣X^i−Xi∣
si=k1∑j=1krij+max∑j=1krij
si_smooth=mean∑q=0l−1si+q
si_smooth>α⋅rˉt_training
- المتغيرات المراقبة: 24 متغير عملية (الضغط، التدفق، مستوى السائل، الكثافة، درجة الحرارة، موضع الصمام)
- متغيرات التحكم: نقاط تعيين تدفق الهواء والماء
- أنواع الأعطال: 6 أنواع (انسداد خط الهواء، انسداد خط الماء، انسداد مدخل فاصل القمة، فتح الالتفافة المباشرة، ظروف التدفق الخانق، ضغط خط 2 بوصة)
- تردد الأخذ: 1 Hz
- المتغيرات المراقبة: 15 متغير عملية
- ظروف التشغيل: 20 مزيجاً مختلفاً من تدفقات الهواء والماء
- أنواع الأعطال: 3 أنواع (تسرب الهواء، انسداد الهواء، الالتفافة)
- تردد الأخذ: 1 Hz
- الدقة (Accuracy): معدل التنبؤ الصحيح الإجمالي
- درجة F1: المتوسط التوافقي للدقة والاستدعاء
- AUC: المساحة تحت منحنى ROC
- الخط الأساسي (Baseline): نموذج مدرب فقط على المجال المصدري
- AdaBN: التطبيع الدفعي التكيفي
- MMD: الفرق الأقصى للمتوسط
- محسّن: Adam، معدل التعلم 1e-5
- حجم الدفعة: 128
- عدد الحقب: 500 حقبة لجهاز الترميز التلقائي، 50 حقبة لوحدة التكيف
- المعمارية: 3 طبقات متصلة بالكامل لكل من المشفر وفك التشفير، الأبعاد 50-50-10
| نوع العطل | الخط الأساسي | AdaBN | MMD | TARD |
|---|
| انسداد خط الهواء | F1: 0.43 | F1: 0.43 | F1: 0.47 | F1: 0.70 |
| انسداد خط الماء | F1: 0.67 | F1: 0.62 | F1: 0.69 | F1: 0.76 |
| انسداد فاصل القمة | F1: 0.63 | F1: 0.65 | F1: 0.64 | F1: 0.79 |
| فتح الالتفافة المباشرة | F1: 0.53 | F1: 0.60 | F1: 0.56 | F1: 0.69 |
| ظروف التدفق الخانق | F1: 0.85 | F1: 0.88 | F1: 0.89 | F1: 0.92 |
| ضغط خط 2 بوصة | F1: 0.94 | F1: 0.98 | F1: 1.00 | F1: 1.00 |
| نوع العطل | الخط الأساسي | AdaBN | MMD | TARD |
|---|
| تسرب الهواء | F1: 0.62 | F1: 0.36 | F1: 0.51 | F1: 0.76 |
| انسداد الهواء | F1: 0.93 | F1: 0.88 | F1: 0.96 | F1: 0.94 |
| الالتفافة | F1: 0.11 | F1: 0.51 | F1: 0.51 | F1: 0.69 |
في حالة انسداد فاصل القمة بـ Cranfield تحت ظروف تشغيل مختلفة:
- الظروف المتغيرة: يحقق TARD أفضل أداء في البيئات الديناميكية (F1: 0.86 مقابل MMD: 0.79)
- الظروف المستقرة: يحافظ TARD على الأفضلية أيضاً في معظم الظروف المستقرة
تم التحقق من الثقة العالية لنتائج الكشف عن TARD من خلال التجميع العميق (10 نماذج مستقلة)، مع بقاء نطاقات عدم اليقين ضيقة أثناء الكشف عن الأعطال (الانحراف المعياري حوالي 0.8)
- 100 مستشعر: تحسن F1 من 0.42 إلى 0.67
- 1000 مستشعر: تحسن F1 من 0.10 إلى 0.48
- تأخير الاستدلال: يبقى ضمن متطلبات المراقبة في الوقت الفعلي (<2ms)
- النماذج الاحتمالية: نماذج المزيج الغاوسي، النماذج القائمة على الطاقة
- التصنيف الأحادي: طرق الحدود التمييزية مثل آلات المتجهات الداعمة
- طرق إعادة البناء: طرق قائمة على خطأ إعادة البناء مثل أجهزة الترميز التلقائي
- الأسطول الفرعي المتجانس: طرق قائمة على تجميع التشابه
- تعلم التمثيل الوظيفي: طرق تعلم سلوك الأسطول الكامل
- القيود: تعتمد على افتراضات التشابه الكافية
- طرق تقليل الاختلاف: تقليل المسافات الإحصائية مثل MMD
- الطرق المعارضة: شبكات التمييز المجالي مثل DANN
- التكيف في وقت الاختبار: طرق مثل Tent و SHOT
- التحديات: الحاجة إلى بيانات مُصنفة، افتراض المجالات الثابتة، احتمالية التكيف مع بيانات الأعطال
- يحل TARD بنجاح التحديات الثلاثة الكبرى في الكشف عن الأعطال الصناعية: نقص بيانات الأعطال المُصنفة، توفر البيانات المحدود في المجال الهدف، الانزياح المجالي المستمر
- استراتيجية فصل الميزات تميز بشكل فعال بين تغييرات ظروف التشغيل والأعطال الفعلية
- تتفوق بشكل كبير على طرق التكيف المجالي الموجودة على مجموعتي بيانات صناعية حقيقية
- ضبط المعاملات: معامل حساسية الكشف عن الأعطال α يتطلب تعيين يدوي
- التغييرات الكبيرة في النظام: افتقار إلى آليات حماية من التغييرات الكبيرة الدائمة في النظام
- الديناميكيات الزمنية: قد تفقد استراتيجية التمويه الزمني الحالية التفاصيل الزمنية المهمة
- آليات الحماية التلقائية: تطوير طرق للكشف عن الانزياح المجالي الكبير وتشغيل إعادة تدريب وحدة التكيف
- ضبط المعاملات التكيفي: طرق لضبط معامل الحساسية α تلقائياً
- تحليل السلاسل الزمنية: إدخال نماذج سلاسل زمنية متخصصة لتحليل الأنماط المعقدة في سلسلة البواقي
- قوة عملية: حل التحديات الحقيقية الموجودة في الصناعة، يتطلب فقط كمية قليلة من البيانات الطبيعية
- الابتكار التقني: تصميم استراتيجية فصل الميزات والتكيف المتخصص ذكي وفعال
- التحقق الشامل: التحقق الكامل على مجموعتي بيانات صناعية حقيقية + بيانات اصطناعية عالية الأبعاد
- الأساس النظري: تعريف واضح للمشكلة ودافع الطريقة
- نطاق التطبيق: تم التحقق بشكل أساسي من أنظمة التدفق متعدد الأطوار، والقابلية للتعميم على الأنظمة الصناعية الأخرى تحتاج إلى التحقق
- التحليل النظري: نقص الضمانات النظرية لتقارب الطريقة واستقرارها
- التكلفة الحسابية: على الرغم من الإبلاغ عن وقت الاستدلال، إلا أن تحليل التعقيد الحسابي التفصيلي ناقص
- حساسية المعاملات الفائقة: تحليل غير كافٍ لحساسية المعاملات الرئيسية (مثل α، طول النافذة l)
- المساهمة الأكاديمية: توفير اتجاه بحثي جديد لمجال الكشف عن الأعطال الصناعية
- القيمة العملية: قابل للتطبيق مباشرة على النشر الصناعي، خاصة المراقبة المبكرة للأجهزة الجديدة
- إمكانية التكرار: توفير تفاصيل تنفيذ شاملة وشرح الخوارزمية
- الأنظمة المنشأة حديثاً: أجهزة صناعية بيانات تاريخية محدودة
- إدارة الأسطول: سيناريوهات تتطلب نقل المعرفة عبر الأجهزة
- البيئات الديناميكية: أنظمة صناعية تتغير ظروف التشغيل فيها بشكل مستمر
- البنية التحتية الحرجة: أنظمة صناعية مهمة حساسة للإنذارات الكاذبة
تستشهد الورقة بـ 51 مرجعاً ذا صلة، تغطي الأعمال المهمة في مجالات الكشف عن الأعطال والتكيف المجالي والتعلم العميق، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الإجمالي: هذه ورقة عالية الجودة في الإحصاء التطبيقي، تطبق بنجاح تقنيات التكيف المجالي على مشكلة عملية مهمة وهي الكشف عن الأعطال الصناعية. يتمتع تصميم الطريقة بعقلانية، والتحقق التجريبي شامل، وتتمتع بقيمة عملية وأهمية أكاديمية قوية جداً.