2025-11-25T18:04:18.517311

COGNOS: Universal Enhancement for Time Series Anomaly Detection via Constrained Gaussian-Noise Optimization and Smoothing

Shang, Chang

Reconstruction-based methods are a dominant paradigm in time series anomaly detection (TSAD), however, their near-universal reliance on Mean Squared Error (MSE) loss results in statistically flawed reconstruction residuals. This fundamental weakness leads to noisy, unstable anomaly scores with a poor signal-to-noise ratio, hindering reliable detection. To address this, we propose Constrained Gaussian-Noise Optimization and Smoothing (COGNOS), a universal, model-agnostic enhancement framework that tackles this issue at its source. COGNOS introduces a novel Gaussian-White Noise Regularization strategy during training, which directly constrains the model's output residuals to conform to a Gaussian white noise distribution. This engineered statistical property creates the ideal precondition for our second contribution: a Kalman Smoothing Post-processor that provably operates as a statistically optimal estimator to denoise the raw anomaly scores. The synergy between these two components allows COGNOS to robustly separate the true anomaly signal from random fluctuations. Extensive experiments demonstrate that COGNOS is highly effective, delivering an average F-score uplift of 57.9% when applied to 12 diverse backbone models across multiple real-world benchmark datasets. Our work reveals that directly regularizing output statistics is a powerful and generalizable strategy for significantly improving anomaly detection systems.

academic

COGNOS: التحسين الشامل لكشف الشذوذ في السلاسل الزمنية عبر تحسين الضوضاء الغاوسية المقيدة والتمويه

المعلومات الأساسية

معرّف الورقة: 2511.06894
العنوان: COGNOS: Universal Enhancement for Time Series Anomaly Detection via Constrained Gaussian-Noise Optimization and Smoothing
المؤلفون: Wenlong Shang, Peng Chang (جامعة بكين للتكنولوجيا)
التصنيف: cs.LG cs.AI
تاريخ النشر: تم تقديمه إلى arXiv في 10 نوفمبر 2025
رابط الورقة: https://arxiv.org/abs/2511.06894

الملخص

تقترح هذه الورقة إطار عمل COGNOS لمعالجة المشكلة الأساسية في كشف الشذوذ بالسلاسل الزمنية (TSAD) القائم على طرق إعادة البناء: العيوب الإحصائية في البواقي الناتجة عن خسارة MSE. يحقق الإطار هذا من خلال استراتيجية تنظيم ضوضاء غاوسية بيضاء في مرحلة التدريب، مما يقيد مباشرة بواقي مخرجات النموذج لتتوافق مع توزيع الضوضاء الغاوسية البيضاء، مع دمج معالج تمويه كالمان اللاحق للإزالة المثلى للضوضاء. حقق COGNOS تحسناً في درجة F بمتوسط 57.9% عبر 12 نموذج عمود فقري مختلف وعدة مجموعات بيانات حقيقية، مما يثبت أن التنظيم المباشر للخصائص الإحصائية للمخرجات هو استراتيجية قوية وقابلة للتعميم.

خلفية البحث والدافع

1. المشكلة الأساسية

يعتبر كشف الشذوذ في السلاسل الزمنية حاسماً في مراقبة التصنيع الصناعي وأمان الأنظمة المالية وصيانة البنية التحتية لتكنولوجيا المعلومات. أصبحت الطرق ذاتية الإشراف القائمة على إعادة البناء النموذج السائد، لكنها تعاني من عيوب أساسية:

البواقي ذات العيوب الإحصائية: البواقي الناتجة عن التدريب القياسي بـ MSE تتمتع بخصائص إحصائية غير مثالية (غير غاوسية، وتحتوي على ارتباط زمني)
نسبة إشارة إلى ضوضاء منخفضة: درجات الشذوذ الأصلية مشوشة وغير مستقرة، مما يصعب التمييز بين الشذوذ الحقيقي والتقلبات العشوائية
نمذجة غير كاملة: لم يقم النموذج بفصل كامل الأنماط الحتمية والضوضاء العشوائية

2. أهمية المشكلة

كما هو موضح في الشكل 1، يظهر Transformer المدرب بـ MSE القياسي على مجموعة بيانات SWaT ثلاث مشاكل رئيسية:

درجات الشذوذ عالية الضوضاء، مع نسبة إشارة إلى ضوضاء ضعيفة
يوضح رسم Q-Q أن البواقي غير غاوسية بشدة
يوضح رسم الارتباط الذاتي وجود ارتباط زمني كبير في البواقي

تؤثر هذه العيوب الإحصائية بشكل مباشر على أداء كشف الشذوذ، مما يؤدي إلى معدلات إنذار كاذب عالية ومعدلات فقدان عالية.

3. قيود الطرق الموجودة

طرق التعلم المقارن: بينما يمكنها تعلم تمثيلات أكثر تمييزاً، إلا أنها عادة ما تكون مقترنة بهندسة معمارية محددة، ولا تحل مباشرة مشكلة الخصائص الإحصائية للبواقي النهائية
تقنيات التصفية والتنظيم:
- الطرق التي تدمج المرشحات تنشئ معماريات هجينة جديدة، تفتقر إلى العمومية
- التنظيم في الفضاء الكامن (مثل SVD والاتساق الدوري) لا يعمل مباشرة على بواقي المخرجات
غياب حل معالجة لاحق نظري أمثل

4. دافع البحث

تقترح هذه الورقة حل المشكلة من المصدر: هندسة الخصائص الإحصائية لبواقي المخرجات بشكل مباشر، مما يخلق ظروفاً مسبقة مثالية لإزالة الضوضاء اللاحقة المثلى.

المساهمات الأساسية

اقتراح استراتيجية تنظيم الضوضاء الغاوسية البيضاء (GWNR): للمرة الأولى، تقيد بواقي إعادة البناء مباشرة لتتوافق مع توزيع الضوضاء الغاوسية البيضاء، وهي نموذج أساسي مختلف عن الطرق المقارنة الموجودة التي تركز على التمثيل
تصميم معالج تمويه كالمان اللاحق: يعمل بالتعاون مع GWNR، ويستفيد من خصائص البواقي المهندسة لتحقيق إزالة ضوضاء نظرية مثلى، مما يحسن بشكل كبير استقرار درجات الشذوذ
إثبات عدم الاعتماد على النموذج والفعالية:
- إطار عمل تحسين عام قابل للتطبيق على أي نموذج إعادة بناء
- متوسط تحسن F-score بنسبة 57.9% عبر 12 معمارية مختلفة
- التحقق على 4 مجموعات بيانات معيارية حقيقية (MSL و SMAP و SWaT و PSM)
الكشف عن اتجاهات تحسين جديدة: إثبات أن التنظيم المباشر للخصائص الإحصائية للمخرجات أكثر فعالية من تحسينات المعمارية التقليدية أو تحسينات التمثيل

شرح الطريقة

تعريف المهمة

الإدخال: سلسلة زمنية متعددة المتغيرات $\mathbf{x} \in \mathbb{R}^{L \times D}$ (الطول $L$ ، البعد $D$ )
التدريب: استخدام بيانات عادية فقط لتعلم مشعب البيانات
الإخراج: درجة شذوذ لكل نقطة زمنية، لتحديد النقاط التي تنحرف عن الأنماط العادية
الهدف: إنتاج درجات شذوذ بنسبة إشارة إلى ضوضاء عالية وإحصائياً مثلى

معمارية النموذج

COGNOS هو إطار عمل من مرحلتين (الشكل 2):

المرحلة 1: مرحلة التدريب - تنظيم الضوضاء الغاوسية البيضاء (GWNR)

دالة الخسارة الإجمالية: $L_{Total} = L_{AWL}(L_{MSE}, L_{MMD}, L_{ACF})$

حيث يتم استخدام خسارة الترجيح التلقائي (AWL) لموازنة المكونات الثلاثة بشكل ديناميكي.

1. خسارة إعادة البناء ( $L_{MSE}$ ): $L_{MSE} = \frac{1}{|R|}\sum_{r \in R} r^2$ حيث $R = \mathbf{x} - \hat{\mathbf{x}}$ هي بواقي إعادة البناء، مما يضمن إعادة بناء عالية الدقة.

2. تنظيم الغاوسية ( $L_{MMD}$ ): استخدام الفرق الأقصى للمتوسطات (MMD) لتقييد توزيع البواقي ليقترب من توزيع غاوسي مستهدف $\mathcal{N}(0, \sigma^{*2})$ :

$L_{MMD} = \frac{1}{|R|^2}\sum_{p_i,p_j \in R}\kappa(p_i, p_j) + \frac{1}{|S|^2}\sum_{q_i,q_j \in S}\kappa(q_i, q_j) - \frac{2}{|R||S|}\sum_{p_i \in R, q_j \in S}\kappa(p_i, q_j)$

دالة النواة تستخدم RBF متعدد النطاقات: $\kappa(a,b) = \sum_{j=1}^M \exp\left(-\frac{\|a-b\|^2}{2(B_j\sigma^*)^2}\right)$

مضاعفات النطاق $\{B_j\} = \{0.1, 0.5, 1.0, 2.0, 5.0\}$ ، $\sigma^* = e^\omega$ (معامل قابل للتعلم).

نقاط الابتكار:

طريقة غير معاملية، قوية جداً
تعلم مستوى الضوضاء بشكل تكيفي
معاقبة الانحيازات النظامية والهياكل المعقدة

3. تنظيم الضوضاء البيضاء ( $L_{ACF}$ ): معاقبة الارتباط الزمني، مجموع مربعات معاملات الارتباط الذاتي للتأخيرات العشرة الأولى:

$L_{ACF} = \sum_{k \in N_{lag}} \mathbb{E}_{b,d}[(\rho_{k,b,d})^2]$

حيث معامل الارتباط الذاتي للتأخير $k$ : $\rho_{k,b,d} = \frac{\sum_{l=k+1}^L (r_{b,l,d} - \mu_{b,d})(r_{b,l-k,d} - \mu_{b,d})}{\sum_{l=1}^L (r_{b,l,d} - \mu_{b,d})^2}$

أساس التصميم: الملاحظات التجريبية تظهر أن أكثر الارتباطات أهمية تحدث في التأخيرات المبكرة، $N_{lag}=\{1,...,10\}$ توازن التأثير والتكلفة الحسابية.

المرحلة 2: مرحلة الاستدلال - معالج تمويه كالمان اللاحق

الأساس النظري: مرشح كالمان هو مقدر خطي أمثل قابل للإثبات عندما تكون عملية الضوضاء ذات متوسط صفري وغير مترابطة (ضوضاء بيضاء) وموزعة بشكل غاوسي. البواقي التي ينتجها GWNR تفي بهذه الشروط بالضبط.

نموذج الفضاء الحالة: