2025-11-25T18:04:18.517311

COGNOS: Universal Enhancement for Time Series Anomaly Detection via Constrained Gaussian-Noise Optimization and Smoothing

Shang, Chang

Reconstruction-based methods are a dominant paradigm in time series anomaly detection (TSAD), however, their near-universal reliance on Mean Squared Error (MSE) loss results in statistically flawed reconstruction residuals. This fundamental weakness leads to noisy, unstable anomaly scores with a poor signal-to-noise ratio, hindering reliable detection. To address this, we propose Constrained Gaussian-Noise Optimization and Smoothing (COGNOS), a universal, model-agnostic enhancement framework that tackles this issue at its source. COGNOS introduces a novel Gaussian-White Noise Regularization strategy during training, which directly constrains the model's output residuals to conform to a Gaussian white noise distribution. This engineered statistical property creates the ideal precondition for our second contribution: a Kalman Smoothing Post-processor that provably operates as a statistically optimal estimator to denoise the raw anomaly scores. The synergy between these two components allows COGNOS to robustly separate the true anomaly signal from random fluctuations. Extensive experiments demonstrate that COGNOS is highly effective, delivering an average F-score uplift of 57.9% when applied to 12 diverse backbone models across multiple real-world benchmark datasets. Our work reveals that directly regularizing output statistics is a powerful and generalizable strategy for significantly improving anomaly detection systems.

academic

COGNOS: समय श्रृंखला विसंगति पहचान के लिए सार्वभौमिक वर्धन विवश गाऊसी-शोर अनुकूलन और स्मूथिंग के माध्यम से

मूल जानकारी

पेपर ID: 2511.06894
शीर्षक: COGNOS: Universal Enhancement for Time Series Anomaly Detection via Constrained Gaussian-Noise Optimization and Smoothing
लेखक: वेनलॉन्ग शांग, पेंग चांग (बीजिंग प्रौद्योगिकी विश्वविद्यालय)
वर्गीकरण: cs.LG cs.AI
प्रकाशन समय: 25 नवंबर 2010 को arXiv पर प्रस्तुत
पेपर लिंक: https://arxiv.org/abs/2511.06894

सारांश

यह पेपर समय श्रृंखला विसंगति पहचान (TSAD) में पुनर्निर्माण-आधारित विधियों की मूल समस्या को संबोधित करता है: MSE हानि के कारण होने वाली सांख्यिकीय खामियों वाली पुनर्निर्माण अवशेष। COGNOS ढांचा प्रशिक्षण चरण में गाऊसी श्वेत शोर नियमितकरण रणनीति के माध्यम से मॉडल आउटपुट अवशेषों को गाऊसी श्वेत शोर वितरण के अनुरूप सीधे विवश करता है, और कलमैन स्मूथिंग पोस्ट-प्रोसेसर के साथ इष्टतम शोर हटाने को जोड़ता है। 12 विभिन्न बैकबोन मॉडलों और कई वास्तविक डेटासेट पर, COGNOS ने औसतन 57.9% F-स्कोर वृद्धि प्राप्त की है, जो आउटपुट सांख्यिकीय विशेषताओं के सीधे नियमितकरण को एक शक्तिशाली और सामान्यीकृत रणनीति के रूप में साबित करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

1. मूल समस्या

समय श्रृंखला विसंगति पहचान औद्योगिक विनिर्माण निगरानी, वित्तीय प्रणाली सुरक्षा और IT बुनियादी ढांचे रखरखाव जैसे क्षेत्रों में महत्वपूर्ण है। पुनर्निर्माण-आधारित स्व-पर्यवेक्षित विधियां मुख्य प्रतिमान बन गई हैं, लेकिन मौलिक खामियां हैं:

सांख्यिकीय खामियों वाली अवशेष: मानक MSE प्रशिक्षण से उत्पन्न पुनर्निर्माण अवशेषों में अनुचित सांख्यिकीय विशेषताएं होती हैं (गैर-गाऊसी, समय सहसंबंध मौजूद)
कम संकेत-से-शोर अनुपात: मूल विसंगति स्कोर शोरयुक्त, अस्थिर होते हैं, वास्तविक विसंगतियों और यादृच्छिक उतार-चढ़ाव को अलग करना कठिन है
अधूरा मॉडलिंग: मॉडल निर्धारणात्मक पैटर्न और यादृच्छिक शोर को पूरी तरह से अलग नहीं करता है

2. समस्या की महत्ता

जैसा कि चित्र 1 में दिखाया गया है, SWaT डेटासेट पर मानक MSE प्रशिक्षण वाले Transformer में तीन मुख्य समस्याएं दिखाई देती हैं:

विसंगति स्कोर अत्यधिक शोरयुक्त, संकेत-से-शोर अनुपात खराब
Q-Q प्लॉट दिखाता है कि अवशेष दृढ़ता से गैर-गाऊसी हैं
स्वत: सहसंबंध प्लॉट दिखाता है कि अवशेषों में महत्वपूर्ण समय सहसंबंध है

ये सांख्यिकीय खामियां सीधे विसंगति पहचान प्रदर्शन को प्रभावित करती हैं, जिससे उच्च झूठी सकारात्मक दर और उच्च मिस दर होती है।

3. मौजूदा विधियों की सीमाएं

विपरीत शिक्षण विधियां: हालांकि अधिक विभेदकारी प्रतिनिधित्व सीख सकते हैं, लेकिन आमतौर पर विशिष्ट आर्किटेक्चर के साथ युग्मित होते हैं, और अंतिम अवशेषों की सांख्यिकीय विशेषताओं को सीधे संबोधित नहीं करते हैं
फ़िल्टरिंग और नियमितकरण तकनीकें:
- फ़िल्टर को एकीकृत करने वाली विधियां नई मिश्रित आर्किटेक्चर बनाती हैं, सामान्यता की कमी है
- अव्यक्त स्थान नियमितकरण (जैसे SVD, आवधिक सामंजस्य) सीधे आउटपुट अवशेषों पर कार्य नहीं करते हैं
सैद्धांतिक रूप से इष्टतम पोस्ट-प्रोसेसिंग समाधान की कमी

4. अनुसंधान प्रेरणा

यह पेपर समस्या को स्रोत से हल करने का प्रस्ताव करता है: आउटपुट अवशेषों की सांख्यिकीय विशेषताओं को सीधे इंजीनियर करना, बाद के इष्टतम शोर हटाने के लिए आदर्श पूर्वशर्तें बनाना।

मूल योगदान

गाऊसी श्वेत शोर नियमितकरण (GWNR) रणनीति प्रस्तावित करना: पहली बार पुनर्निर्माण अवशेषों को गाऊसी श्वेत शोर वितरण के अनुरूप सीधे विवश करना, जो मौजूदा प्रतिनिधित्व-केंद्रित विपरीत विधियों से मौलिक रूप से भिन्न है
कलमैन स्मूथिंग पोस्ट-प्रोसेसर डिजाइन करना: GWNR के साथ सहयोग करता है, इंजीनियर किए गए अवशेष विशेषताओं का उपयोग करके सैद्धांतिक रूप से इष्टतम शोर हटाना प्राप्त करता है, विसंगति स्कोर स्थिरता में काफी सुधार करता है
मॉडल-स्वतंत्रता और प्रभावशीलता साबित करना:
- किसी भी पुनर्निर्माण मॉडल पर लागू किया जा सकने वाला सार्वभौमिक वर्धन ढांचा
- 12 विभिन्न आर्किटेक्चर (ध्यान, समय-आवृत्ति संलयन, CNN-MLP) पर औसतन F-स्कोर में 57.9% वृद्धि
- 4 वास्तविक बेंचमार्क डेटासेट (MSL, SMAP, SWaT, PSM) पर सत्यापित
सुधार की नई दिशा प्रकट करना: साबित करता है कि आउटपुट सांख्यिकीय विशेषताओं का सीधा नियमितकरण पारंपरिक आर्किटेक्चर या प्रतिनिधित्व सुधार से अधिक प्रभावी है

विधि विवरण

कार्य परिभाषा

इनपुट: बहुभिन्न समय श्रृंखला $\mathbf{x} \in \mathbb{R}^{L \times D}$ (लंबाई $L$ , आयाम $D$ )
प्रशिक्षण: केवल सामान्य डेटा का उपयोग करके डेटा मैनिफोल्ड सीखना
आउटपुट: प्रत्येक समय बिंदु के लिए विसंगति स्कोर, सामान्य पैटर्न से विचलन वाले बिंदुओं की पहचान के लिए
लक्ष्य: उच्च संकेत-से-शोर अनुपात, सांख्यिकीय रूप से इष्टतम विसंगति स्कोर उत्पन्न करना

मॉडल आर्किटेक्चर

COGNOS एक दो-चरणीय ढांचा है (चित्र 2):

चरण 1: प्रशिक्षण चरण - गाऊसी श्वेत शोर नियमितकरण (GWNR)

समग्र उद्देश्य फ़ंक्शन: $L_{Total} = L_{AWL}(L_{MSE}, L_{MMD}, L_{ACF})$

जहां स्वचालित भारित हानि (AWL) तीन घटकों को गतिशील रूप से संतुलित करता है।

1. पुनर्निर्माण हानि ( $L_{MSE}$ ): $L_{MSE} = \frac{1}{|R|}\sum_{r \in R} r^2$ जहां $R = \mathbf{x} - \hat{\mathbf{x}}$ पुनर्निर्माण अवशेष है, उच्च निष्ठा पुनर्निर्माण सुनिश्चित करता है।

2. गाऊसीयता नियमितकरण ( $L_{MMD}$ ): अधिकतम माध्य विसंगति (MMD) का उपयोग करके अवशेष वितरण को लक्ष्य गाऊसी वितरण $\mathcal{N}(0, \sigma^{*2})$ के करीब विवश करना:

$L_{MMD} = \frac{1}{|R|^2}\sum_{p_i,p_j \in R}\kappa(p_i, p_j) + \frac{1}{|S|^2}\sum_{q_i,q_j \in S}\kappa(q_i, q_j) - \frac{2}{|R||S|}\sum_{p_i \in R, q_j \in S}\kappa(p_i, q_j)$

कर्नल फ़ंक्शन बहु-बैंडविड्थ RBF का उपयोग करता है: $\kappa(a,b) = \sum_{j=1}^M \exp\left(-\frac{\|a-b\|^2}{2(B_j\sigma^*)^2}\right)$

बैंडविड्थ गुणक $\{B_j\} = \{0.1, 0.5, 1.0, 2.0, 5.0\}$ , $\sigma^* = e^\omega$ (सीखने योग्य पैरामीटर)।

नवाचार बिंदु:

गैर-पैरामीट्रिक विधि, मजबूत
अनुकूली शोर स्तर सीखना
प्रणालीगत पूर्वाग्रह और जटिल संरचना को दंडित करता है

3. श्वेत शोर नियमितकरण ( $L_{ACF}$ ): समय सहसंबंध को दंडित करता है, पहले 10 लैग के स्वत: सहसंबंध गुणांकों के वर्गों को जोड़ता है:

$L_{ACF} = \sum_{k \in N_{lag}} \mathbb{E}_{b,d}[(\rho_{k,b,d})^2]$

जहां लैग $k$ पर स्वत: सहसंबंध गुणांक: $\rho_{k,b,d} = \frac{\sum_{l=k+1}^L (r_{b,l,d} - \mu_{b,d})(r_{b,l-k,d} - \mu_{b,d})}{\sum_{l=1}^L (r_{b,l,d} - \mu_{b,d})^2}$

डिजाइन आधार: अनुभवजन्य अवलोकन दिखाता है कि सबसे महत्वपूर्ण सहसंबंध प्रारंभिक लैग में होते हैं, $N_{lag}=\{1,...,10\}$ प्रभाव और कम्प्यूटेशनल लागत को संतुलित करता है।

चरण 2: अनुमान चरण - कलमैन स्मूथिंग पोस्ट-प्रोसेसर

सैद्धांतिक आधार: कलमैन फ़िल्टर जब शोर प्रक्रिया शून्य माध्य, असंबंधित (श्वेत शोर) और गाऊसी वितरण होती है, तो सिद्ध रूप से इष्टतम रैखिक अनुमानक है। GWNR द्वारा बनाई गई अवशेषें बिल्कुल इन शर्तों को पूरा करती हैं।

राज्य-स्थान मॉडल: