2025-11-18T12:01:20.412379

Enhancing Precision of Automated Teller Machines Network Quality Assessment: Machine Learning and Multi Classifier Fusion Approaches

Safarzadeh, Jamali, Moshiri
Ensuring reliable ATM services is essential for modern banking, directly impacting customer satisfaction and the operational efficiency of financial institutions. This study introduces a data fusion approach that utilizes multi-classifier fusion techniques, with a special focus on the Stacking Classifier, to enhance the reliability of ATM networks. To address class imbalance, the Synthetic Minority Over-sampling Technique (SMOTE) was applied, enabling balanced learning for both frequent and rare events. The proposed framework integrates diverse classification models - Random Forest, LightGBM, and CatBoost - within a Stacking Classifier, achieving a dramatic reduction in false alarms from 3.56 percent to just 0.71 percent, along with an outstanding overall accuracy of 99.29 percent. This multi-classifier fusion method synthesizes the strengths of individual models, leading to significant cost savings and improved operational decision-making. By demonstrating the power of machine learning and data fusion in optimizing ATM status detection, this research provides practical and scalable solutions for financial institutions aiming to enhance their ATM network performance and customer satisfaction.
academic

स्वचालित टेलर मशीन नेटवर्क गुणवत्ता मूल्यांकन की सटीकता में वृद्धि: मशीन लर्निंग और बहु-वर्गीकरण संलयन दृष्टिकोण

मूल जानकारी

  • पेपर ID: 2501.01067
  • शीर्षक: स्वचालित टेलर मशीन नेटवर्क गुणवत्ता मूल्यांकन की सटीकता में वृद्धि: मशीन लर्निंग और बहु-वर्गीकरण संलयन दृष्टिकोण
  • लेखक: अलीरेजा सफरज़ादेह, मोहम्मद रेजा जमाली, बहज़ाद मोशिरी
  • वर्गीकरण: cs.LG (मशीन लर्निंग)
  • प्रकाशन तिथि: 3 जनवरी 2025
  • पेपर लिंक: https://arxiv.org/abs/2501.01067

सारांश

विश्वसनीय ATM सेवा सुनिश्चित करना आधुनिक बैंकिंग के लिए महत्वपूर्ण है, जो सीधे ग्राहक संतुष्टि और वित्तीय संस्थानों की परिचालन दक्षता को प्रभावित करता है। यह अनुसंधान डेटा संलयन पद्धति का परिचय देता है, जो बहु-वर्गीकरण संलयन तकनीकों का उपयोग करता है, विशेष रूप से स्टैकिंग वर्गीकरण पर ध्यान केंद्रित करते हुए, ATM नेटवर्क की विश्वसनीयता को बढ़ाने के लिए। वर्ग असंतुलन समस्या को हल करने के लिए, सिंथेटिक अल्पसंख्यक ओवर-सैंपलिंग तकनीक (SMOTE) लागू की गई, जो बार-बार और दुर्लभ घटनाओं के संतुलित सीखने को प्राप्त करती है। प्रस्तावित ढांचा स्टैकिंग वर्गीकरण में कई वर्गीकरण मॉडल को एकीकृत करता है—रैंडम फॉरेस्ट, LightGBM और CatBoost—जिसने झूठे अलर्ट को 3.56% से 0.71% तक में नाटकीय रूप से कम किया है, साथ ही 99.29% की उत्कृष्ट समग्र सटीकता प्राप्त की है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

ATM नेटवर्क आधुनिक बैंकिंग प्रणाली में महत्वपूर्ण भूमिका निभाता है, लेकिन इसकी स्थिति का पता लगाना महत्वपूर्ण चुनौतियों का सामना करता है:

  1. झूठे अलर्ट की समस्या: ATM स्थिति फाइलें अक्सर गलत सकारात्मक परिणाम देती हैं, जिससे अनावश्यक रखरखाव गतिविधियां और संसाधनों का गलत आवंटन होता है
  2. मिस्ड डिटेक्शन समस्या: वास्तविक खराबियों का समय पर पता नहीं चलता, जिससे डाउनटाइम बढ़ता है और ग्राहक संतुष्टि में कमी आती है
  3. डेटा प्रोसेसिंग जटिलता: ATM लॉग फाइलों में विस्तृत जानकारी होती है लेकिन वॉल्यूम बड़ा होता है, जिससे वास्तविक समय प्रसंस्करण मुश्किल होता है

समस्या की महत्ता

  • ग्राहक संतुष्टि: ATM की उपलब्धता सीधे ग्राहक अनुभव और बैंक सेवा की गुणवत्ता को प्रभावित करती है
  • परिचालन दक्षता: सटीक स्थिति का पता लगाना अनावश्यक रखरखाव को कम कर सकता है, परिचालन लागत को कम कर सकता है
  • वित्तीय प्रभाव: गलत पहचान से राजस्व हानि और ग्राहक नुकसान हो सकता है

मौजूदा विधियों की सीमाएं

  • पारंपरिक संभाव्यता विधियां (जैसे बेयेसियन अनुमान) जटिल विषम डेटा को संभालने में सीमित हैं
  • एकल डेटा स्रोत आसानी से गलत निर्णय दे सकता है
  • वर्ग असंतुलन मॉडल को बहुसंख्यक वर्ग (सामान्य संचालन स्थिति) की ओर पूर्वाग्रह करता है

मुख्य योगदान

  1. बहु-वर्गीकरण संलयन ढांचा प्रस्तावित: Random Forest, LightGBM और CatBoost के स्टैकिंग वर्गीकरण को एकीकृत करता है
  2. नवीन डेटा संलयन विधि: ATM स्थिति फाइलों और लेनदेन रिकॉर्ड को विश्वसनीय स्थिति पहचान के लिए जोड़ता है
  3. महत्वपूर्ण प्रदर्शन सुधार: झूठे अलर्ट दर 3.56% से 0.71% तक कम, समग्र सटीकता 99.29% तक पहुंची
  4. व्यावहारिक वर्ग असंतुलन समाधान: दुर्लभ खराबी घटनाओं को संभालने के लिए SMOTE तकनीक को प्रभावी ढंग से लागू किया
  5. व्यावहारिक अनुप्रयोग मूल्य: वित्तीय संस्थानों को ATM नेटवर्क प्रदर्शन अनुकूलन के लिए स्केलेबल समाधान प्रदान करता है

विधि विवरण

कार्य परिभाषा

ATM स्थिति पहचान को द्विआधारी वर्गीकरण समस्या के रूप में मॉडल किया गया है:

  • इनपुट: ATM स्थिति फाइलें, लेनदेन रिकॉर्ड, समय विशेषताएं आदि
  • आउटपुट: ATM स्थिति (सेवा में/सेवा से बाहर)
  • बाधाएं: वास्तविक समय आवश्यकताएं, उच्च सटीकता आवश्यकताएं, लागत-प्रभावशीलता विचार

विशेषता इंजीनियरिंग

मुख्य विशेषता निष्कर्षण

  1. ATM स्थिति फाइल विशेषताएं:
    • कीबोर्ड, कार्ड रीडर, नेटवर्क कनेक्शन स्थिति
    • किसी भी घटक की खराबी को सेवा से बाहर के रूप में निर्धारित करता है
  2. समय संबंधित विशेषताएं:
    • महीने में दिन (1-31)
    • कार्य दिवस प्रकार (नियमित कार्य दिवस/अंशकालिक कार्य दिवस/छुट्टी)
    • दिन का समय
  3. लेनदेन संबंधित विशेषताएं:
    • मासिक लेनदेन संख्या (मात्रात्मक स्तरीकरण)
    • लेनदेन स्थिति विशेषताएं (पॉइसन प्रक्रिया धारणा के आधार पर)

लेनदेन अंतराल मॉडलिंग

Kolmogorov-Smirnov परीक्षण के माध्यम से लेनदेन अंतराल को घातीय वितरण के रूप में सत्यापित किया गया:

  • धारणा: ATM लेनदेन पॉइसन प्रक्रिया का पालन करते हैं
  • सत्यापन परिणाम: घातीय वितरण KS सांख्यिकी 0.1493 है, Gamma (0.1654), Logistic (0.1906) और Normal (0.2557) से बेहतर है
  • संभाव्यता सीमा: असामान्य स्थिति का पता लगाने के लिए 99% संभाव्यता सीमा निर्धारित की गई

वर्ग असंतुलन प्रबंधन

  • समस्या: सेवा से बाहर नमूने केवल 0.85% हैं
  • समाधान: k=3 निकटतम पड़ोसियों के साथ SMOTE
  • प्रभाव: डेटा सेट को 50:50 अनुपात में संतुलित किया गया

मॉडल आर्किटेक्चर

स्टैकिंग वर्गीकरण डिजाइन

पहली परत (आधार शिक्षार्थी):

  • Random Forest: 100 पेड़, Gini अशुद्धि मानदंड
  • LightGBM: 100 अनुमानक, सीखने की दर 0.1, पत्ती संख्या 31
  • CatBoost: 100 पुनरावृत्तियां, सीखने की दर 0.1, गहराई 6

दूसरी परत (मेटा-शिक्षार्थी):

  • Logistic Regression: L2 नियमितकरण, क्रॉस-एंट्रॉपी हानि अनुकूलन

गणितीय ढांचा

SVM उद्देश्य फलन:

min(w,b,ζ) 1/2||w||² + C∑ζᵢ
subject to: yᵢ(w^T xᵢ + b) ≥ 1-ζᵢ, ζᵢ ≥ 0

तकनीकी नवाचार बिंदु

  1. बहु-स्रोत डेटा संलयन: स्थिति फाइलों और लेनदेन डेटा को नवीन तरीके से जोड़ता है
  2. संभाव्यता मॉडलिंग सत्यापन: मॉडलिंग धारणाओं को सत्यापित करने के लिए कठोर सांख्यिकीय परीक्षण
  3. अनुकूली समेकित शिक्षण: गतिशील वर्गीकरण चयन (DCS) और गतिशील समेकन चयन (DES)
  4. संतुलित प्रदर्शन अनुकूलन: औसत सटीकता, रिकॉल और F1 स्कोर पर ध्यान केंद्रित

प्रायोगिक सेटअप

डेटा सेट विशेषताएं

  • डेटा स्रोत: बैंक ATM नेटवर्क वास्तविक परिचालन डेटा
  • गोपनीयता सुरक्षा: डेटा कड़े गोपनीयता समझौते के तहत उपयोग किया जाता है
  • वर्ग वितरण: अत्यधिक असंतुलित (सेवा से बाहर: 0.85%)

मूल्यांकन मेट्रिक्स

वर्ग पूर्वाग्रह से बचने के लिए औसत मेट्रिक्स का उपयोग किया गया:

  • औसत सटीकता: (Precision_down + Precision_up)/2
  • औसत रिकॉल: (Recall_down + Recall_up)/2
  • औसत F1 स्कोर: (F1-Score_down + F1-Score_up)/2

तुलनात्मक विधियां

  • Support Vector Machine (SVM)
  • Decision Tree
  • Bagging Classifier
  • Random Forest
  • LightGBM
  • CatBoost
  • Dynamic Classifier Selection (DCS LA)
  • Dynamic Ensemble Selection (DES KNORAE)

प्रायोगिक परिणाम

मुख्य परिणाम

मॉडल प्रदर्शन तुलना

मॉडलसेवा से बाहर सटीकतासेवा से बाहर रिकॉलसेवा से बाहर F1सेवा में सटीकतासेवा में रिकॉलसेवा में F1
SVM0.85350.87470.86390.87150.84980.8605
Random Forest0.99610.98920.99260.98920.99610.9927
स्टैकिंग वर्गीकरण0.99490.99100.99290.99100.99490.9930

उल्लेखनीय परिणाम

  • समग्र सटीकता: 99.29% (सभी मॉडलों में सर्वोच्च)
  • झूठे अलर्ट में महत्वपूर्ण कमी: 3.56% से 0.71% तक
  • संतुलित प्रदर्शन: दोनों वर्गों के F1 स्कोर 99% से अधिक

SMOTE प्रभाव विश्लेषण

SMOTE से पहले और बाद में तुलना

मॉडलSMOTE से पहले F1SMOTE के बाद F1सुधार
SVM0.500.86+72%
Random Forest0.780.99+27%
LightGBM0.730.94+29%

विलोपन प्रयोग

घटकों को क्रमिक रूप से जोड़कर प्रत्येक भाग के योगदान को सत्यापित किया गया:

  1. मूल विशेषताएं: ATM स्थिति फाइल सटीकता 96.14%
  2. लेनदेन विशेषताएं: अकेले उपयोग करने पर सटीकता 85.43%
  3. विशेषता संलयन: प्रदर्शन में महत्वपूर्ण सुधार
  4. SMOTE प्रसंस्करण: अल्पसंख्यक वर्ग पहचान में महत्वपूर्ण सुधार
  5. समेकित शिक्षण: अंतिम सर्वोत्तम प्रदर्शन प्राप्त

संबंधित कार्य

डेटा संलयन अनुसंधान

  • Bachmann et al. (2013): बहु-सेंसर ट्रैफिक गति अनुमान
  • Meng et al. (2020): मशीन लर्निंग डेटा संलयन सर्वेक्षण
  • इस पेपर का योगदान: ATM स्थिति पहचान में डेटा संलयन का पहला अनुप्रयोग

समेकित शिक्षण विकास

  • Wolpert (1992): पहली बार स्टैकिंग सामान्यीकरण प्रस्तावित
  • Klein et al. (2023): समय श्रृंखला वर्गीकरण के लिए विषम स्टैकिंग समेकन
  • इस पेपर का नवाचार: वित्तीय सेवा विश्वसनीयता के लिए अनुकूलित समेकन विधि

वर्ग असंतुलन प्रबंधन

  • Chawla et al. (2002): SMOTE मूल विधि
  • Khan et al. (2024): समेकित शिक्षण और डेटा वृद्धि का संयोजन
  • इस पेपर का अनुप्रयोग: ATM खराबी पहचान में व्यावहारिक प्रभावशीलता

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. तकनीकी प्रभावशीलता: बहु-वर्गीकरण संलयन ATM स्थिति पहचान सटीकता में महत्वपूर्ण सुधार करता है
  2. व्यावहारिक मूल्य: झूठे अलर्ट दर में बड़ी कमी, परिचालन लागत में कमी
  3. विधि सामान्यीकरण: ढांचा अन्य महत्वपूर्ण प्रणाली निगरानी तक विस्तारित हो सकता है

सीमाएं

  1. डेटा निर्भरता: प्रशिक्षण के लिए उच्च गुणवत्ता के ऐतिहासिक डेटा की आवश्यकता
  2. कम्प्यूटेशनल जटिलता: समेकन विधि कम्प्यूटेशनल ओवरहेड बढ़ाती है
  3. विशिष्ट डोमेन: विधि ATM नेटवर्क के लिए अनुकूलित है, सामान्यीकरण क्षमता सीमित है
  4. डेटा गोपनीयता: वास्तविक डेटा सार्वजनिक नहीं किया जा सकता, पुनरुत्पादनीयता को प्रभावित करता है

भविष्य की दिशाएं

  1. वास्तविक समय निगरानी: वास्तविक समय निगरानी तकनीकों को एकीकृत करना
  2. क्रॉस-डोमेन अनुप्रयोग: चिकित्सा, परिवहन आदि महत्वपूर्ण प्रणालियों तक विस्तार
  3. गहन शिक्षण: तंत्रिका नेटवर्क विधियों की खोज
  4. एज कंप्यूटिंग: एज तैनाती को समर्थन करने के लिए कम्प्यूटेशनल दक्षता अनुकूलन

गहन मूल्यांकन

शक्तियां

  1. समस्या लक्ष्यीकरण मजबूत: बैंकिंग उद्योग की वास्तविक समस्याओं को सीधे हल करता है
  2. विधि डिजाइन तर्कसंगत: बहु-स्तरीय सत्यापन विश्वसनीयता सुनिश्चित करता है
  3. प्रयोग व्यापक: व्यापक तुलना और विलोपन प्रयोग
  4. परिणाम महत्वपूर्ण: मुख्य मेट्रिक्स में सफलता प्राप्त
  5. व्यावहारिक मूल्य उच्च: सीधे तैनाती के लिए समाधान प्रदान करता है

कमियां

  1. सीमित सैद्धांतिक योगदान: मुख्य रूप से मौजूदा तकनीकों का इंजीनियरिंग अनुप्रयोग
  2. एकल डेटा सेट: केवल विशिष्ट बैंक नेटवर्क में सत्यापित
  3. सरल तुलनात्मक आधार: नवीनतम गहन शिक्षण विधियों की तुलना का अभाव
  4. अपर्याप्त सामान्यीकरण विश्लेषण: संस्थाओं के बीच प्रयोज्यता पर अपर्याप्त चर्चा

प्रभाव

  1. शैक्षणिक मूल्य: वित्तीय प्रौद्योगिकी क्षेत्र के लिए व्यावहारिक पद्धति प्रदान करता है
  2. औद्योगिक प्रभाव: बैंक परिचालन दक्षता में सीधा सुधार
  3. पद्धति योगदान: महत्वपूर्ण प्रणालियों में बहु-वर्गीकरण संलयन की सफल केस स्टडी
  4. पुनरुत्पादनीयता: विधि विवरण विस्तृत है, पुनरुत्पादन और सुधार में सहायक

प्रयोज्य परिदृश्य

  1. वित्तीय संस्थान: ATM नेटवर्क निगरानी और रखरखाव अनुकूलन
  2. महत्वपूर्ण बुनियादी ढांचा: विद्युत, संचार प्रणाली स्थिति निगरानी
  3. विनिर्माण: उपकरण खराबी पूर्वानुमान और रखरखाव शेड्यूलिंग
  4. सेवा उद्योग: स्वयं-सेवा उपकरण विश्वसनीयता प्रबंधन

संदर्भ

  1. Wolpert, D. H. (1992). Stacked generalization. Neural Networks, 5, 241-259.
  2. Chawla, N. V., et al. (2002). SMOTE: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16, 321-357.
  3. Meng, T., et al. (2020). A survey on machine learning for data fusion. Information Fusion, 57, 115-129.
  4. Ke, G., et al. (2017). LightGBM: A highly efficient gradient boosting decision tree. NIPS 2017.
  5. Prokhorenkova, L., et al. (2018). CatBoost: unbiased boosting with categorical features. NIPS 2018.

समग्र मूल्यांकन: यह पेपर ATM नेटवर्क विश्वसनीयता की महत्वपूर्ण व्यावहारिक समस्या के लिए बहु-वर्गीकरण संलयन पर आधारित प्रभावी समाधान प्रस्तावित करता है। हालांकि सैद्धांतिक नवाचार सीमित है, लेकिन इंजीनियरिंग अभ्यास और प्रदर्शन सुधार में उत्कृष्ट प्रदर्शन करता है, जिसमें महत्वपूर्ण व्यावहारिक मूल्य और औद्योगिक प्रभाव है। विधि का सफल अनुप्रयोग समान महत्वपूर्ण प्रणालियों की विश्वसनीयता निगरानी के लिए मूल्यवान संदर्भ प्रदान करता है।