2025-11-18T12:01:20.412379

Enhancing Precision of Automated Teller Machines Network Quality Assessment: Machine Learning and Multi Classifier Fusion Approaches

Safarzadeh, Jamali, Moshiri

Ensuring reliable ATM services is essential for modern banking, directly impacting customer satisfaction and the operational efficiency of financial institutions. This study introduces a data fusion approach that utilizes multi-classifier fusion techniques, with a special focus on the Stacking Classifier, to enhance the reliability of ATM networks. To address class imbalance, the Synthetic Minority Over-sampling Technique (SMOTE) was applied, enabling balanced learning for both frequent and rare events. The proposed framework integrates diverse classification models - Random Forest, LightGBM, and CatBoost - within a Stacking Classifier, achieving a dramatic reduction in false alarms from 3.56 percent to just 0.71 percent, along with an outstanding overall accuracy of 99.29 percent. This multi-classifier fusion method synthesizes the strengths of individual models, leading to significant cost savings and improved operational decision-making. By demonstrating the power of machine learning and data fusion in optimizing ATM status detection, this research provides practical and scalable solutions for financial institutions aiming to enhance their ATM network performance and customer satisfaction.

academic

Enhancing Precision of Automated Teller Machines Network Quality Assessment: Machine Learning and Multi Classifier Fusion Approaches

Basic Information

Paper ID: 2501.01067
Title: Enhancing Precision of Automated Teller Machines Network Quality Assessment: Machine Learning and Multi Classifier Fusion Approaches
Authors: Alireza Safarzadeh, Mohammad Reza Jamali, Behzad Moshiri
Category: cs.LG (Machine Learning)
Publication Date: January 3, 2025
Paper Link: https://arxiv.org/abs/2501.01067

Abstract

Ensuring reliable ATM services is critical to modern banking, directly impacting customer satisfaction and operational efficiency of financial institutions. This research introduces a data fusion approach leveraging multi-classifier fusion techniques, with particular emphasis on stacking classifiers, to enhance ATM network reliability. To address class imbalance issues, Synthetic Minority Over-sampling Technique (SMOTE) was applied to achieve balanced learning of frequent and rare events. The proposed framework integrates multiple classification models—Random Forest, LightGBM, and CatBoost—within a stacking classifier, achieving a dramatic reduction in false alarms from 3.56% to 0.71%, while attaining an outstanding overall accuracy of 99.29%.

Research Background and Motivation

Problem Definition

ATM networks play a critical role in modern banking systems, yet their state detection faces significant challenges:

False Alarm Problem: ATM status files frequently generate false positives, resulting in unnecessary maintenance activities and resource misallocation
False Negative Problem: Genuine failures are not detected timely, prolonging downtime and reducing customer satisfaction
Data Processing Complexity: ATM log files contain detailed information but are voluminous, making real-time processing difficult

Problem Significance

Customer Satisfaction: ATM availability directly impacts customer experience and banking service quality
Operational Efficiency: Accurate state detection reduces unnecessary maintenance and lowers operational costs
Financial Impact: Erroneous detection may lead to revenue loss and customer attrition

Limitations of Existing Methods

Traditional probabilistic methods (e.g., Bayesian inference) have limitations in handling complex heterogeneous data
Single data sources are prone to misclassification
Class imbalance causes models to bias toward the majority class (normal operation state)

Core Contributions

Proposed Multi-Classifier Fusion Framework: Integrating stacking classifier with Random Forest, LightGBM, and CatBoost
Innovative Data Fusion Method: Combining ATM status files and transaction records for reliable state detection
Significant Performance Improvement: Reducing false alarm rate from 3.56% to 0.71%, achieving 99.29% overall accuracy
Practical Class Imbalance Solution: Effective application of SMOTE technique for handling rare failure events
Practical Application Value: Providing financial institutions with scalable ATM network performance optimization solutions

Methodology Details

Task Definition

Modeling ATM state detection as a binary classification problem:

Input: ATM status files, transaction records, temporal features, etc.
Output: ATM state (in-service/out-of-service)
Constraints: Real-time requirements, high precision demands, cost-effectiveness considerations

Feature Engineering

Key Feature Extraction

ATM Status File Features:
- Keyboard, card reader, network connectivity status
- Any component failure indicates out-of-service state
Temporal Features:
- Day of month (1-31)
- Day type (regular weekday/part-time weekday/holiday)
- Time of day
Transaction-Related Features:
- Monthly transaction count (percentile stratification)
- Transaction status features (based on Poisson process assumption)

Transaction Interval Modeling

Validating transaction intervals follow exponential distribution via Kolmogorov-Smirnov test:

Hypothesis: ATM transactions follow a Poisson process
Validation Result: Exponential distribution KS statistic of 0.1493, superior to Gamma (0.1654), Logistic (0.1906), and Normal (0.2557)
Probability Threshold: 99% probability threshold set for anomaly detection

Class Imbalance Handling

Problem: Out-of-service samples constitute only 0.85%
Solution: SMOTE with k=3 nearest neighbors
Effect: Balancing dataset to 50:50 ratio

Model Architecture

Stacking Classifier Design

First Layer (Base Learners):

Random Forest: 100 trees, Gini impurity criterion
LightGBM: 100 estimators, learning rate 0.1, leaf count 31
CatBoost: 100 iterations, learning rate 0.1, depth 6

Second Layer (Meta-Learner):

Logistic Regression: L2 regularization, cross-entropy loss optimization

Mathematical Framework

SVM objective function:

min(w,b,ζ) 1/2||w||² + C∑ζᵢ
subject to: yᵢ(w^T xᵢ + b) ≥ 1-ζᵢ, ζᵢ ≥ 0

Technical Innovations

Multi-Source Data Fusion: Innovatively combining status files and transaction data
Probabilistic Modeling Validation: Rigorous statistical testing to verify modeling assumptions
Adaptive Ensemble Learning: Dynamic Classifier Selection (DCS) and Dynamic Ensemble Selection (DES)
Balanced Performance Optimization: Focus on average precision, recall, and F1-score

Experimental Setup

Dataset Characteristics

Data Source: Actual operational data from bank ATM networks
Privacy Protection: Data used under strict confidentiality agreements
Class Distribution: Highly imbalanced (out-of-service: 0.85%)

Evaluation Metrics

Employing averaged metrics to avoid class bias:

Average Precision: (Precision_down + Precision_up)/2
Average Recall: (Recall_down + Recall_up)/2
Average F1-Score: (F1-Score_down + F1-Score_up)/2

Comparison Methods

Support Vector Machine (SVM)
Decision Tree
Bagging Classifier
Random Forest
LightGBM
CatBoost
Dynamic Classifier Selection (DCS LA)
Dynamic Ensemble Selection (DES KNORAE)

Experimental Results

Primary Results

Model Performance Comparison

Model	Out-of-Service Precision	Out-of-Service Recall	Out-of-Service F1	In-Service Precision	In-Service Recall	In-Service F1
SVM	0.8535	0.8747	0.8639	0.8715	0.8498	0.8605
Random Forest	0.9961	0.9892	0.9926	0.9892	0.9961	0.9927
Stacking Classifier	0.9949	0.9910	0.9929	0.9910	0.9949	0.9930

Outstanding Achievements

Overall Accuracy: 99.29% (highest among all models)
Significant False Alarm Reduction: From 3.56% to 0.71%
Balanced Performance: F1-scores for both classes exceed 99%

SMOTE Effect Analysis

Pre- and Post-SMOTE Comparison

Model	Pre-SMOTE F1	Post-SMOTE F1	Improvement
SVM	0.50	0.86	+72%
Random Forest	0.78	0.99	+27%
LightGBM	0.73	0.94	+29%

Ablation Study

Validating each component's contribution through incremental addition:

Baseline Features: ATM status file accuracy 96.14%
Transaction Features: Standalone accuracy 85.43%
Feature Fusion: Significant performance improvement
SMOTE Processing: Critical enhancement for minority class detection
Ensemble Learning: Achieving optimal final performance

Data Fusion Research

Bachmann et al. (2013): Multi-sensor traffic speed estimation
Meng et al. (2020): Machine learning data fusion survey
This Paper's Contribution: First application of data fusion to ATM state detection

Ensemble Learning Development

Wolpert (1992): Original stacked generalization proposal
Klein et al. (2023): Heterogeneous stacking ensembles for time series classification
This Paper's Innovation: Customized ensemble method for financial service reliability

Class Imbalance Handling

Chawla et al. (2002): Original SMOTE method
Khan et al. (2024): Combining ensemble learning with data augmentation
This Paper's Application: Effective practice in ATM failure detection

Conclusions and Discussion

Main Conclusions

Technical Effectiveness: Multi-classifier fusion significantly enhances ATM state detection precision
Practical Value: Substantially reduces false alarm rates and operational costs
Method Generalizability: Framework is extensible to other critical system monitoring

Limitations

Data Dependency: Requires high-quality historical training data
Computational Complexity: Ensemble methods increase computational overhead
Domain-Specific: Method is customized for ATM networks with limited generalization capability
Data Privacy: Actual data cannot be disclosed, affecting reproducibility

Future Directions

Real-Time Monitoring: Integration with real-time monitoring technologies
Cross-Domain Applications: Extension to healthcare, transportation, and other critical systems
Deep Learning: Exploration of neural network approaches
Edge Computing: Optimization for edge deployment efficiency

In-Depth Evaluation

Strengths

Strong Problem Relevance: Directly addresses practical pain points in banking
Reasonable Methodology Design: Multi-level validation ensures reliability
Comprehensive Experiments: Thorough comparative and ablation studies
Significant Results: Breakthrough improvements in key metrics
High Practical Value: Provides readily deployable solutions

Weaknesses

Limited Theoretical Contribution: Primarily engineering application of existing techniques
Single Dataset: Validation only on specific bank network
Simple Baseline Comparisons: Lacks comparison with recent deep learning methods
Insufficient Generalization Analysis: Limited discussion of cross-institutional applicability

Impact

Academic Value: Provides practical methodology for fintech domain
Industry Impact: Directly improves banking operational efficiency
Methodological Contribution: Successful case of multi-classifier fusion in critical systems
Reproducibility: Detailed method description facilitates reproduction and improvement

Applicable Scenarios

Financial Institutions: ATM network monitoring and maintenance optimization
Critical Infrastructure: Power and communication system state monitoring
Manufacturing: Equipment failure prediction and maintenance scheduling
Service Industry: Self-service device reliability management

References

Wolpert, D. H. (1992). Stacked generalization. Neural Networks, 5, 241-259.
Chawla, N. V., et al. (2002). SMOTE: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16, 321-357.
Meng, T., et al. (2020). A survey on machine learning for data fusion. Information Fusion, 57, 115-129.
Ke, G., et al. (2017). LightGBM: A highly efficient gradient boosting decision tree. NIPS 2017.
Prokhorenkova, L., et al. (2018). CatBoost: unbiased boosting with categorical features. NIPS 2018.

Overall Assessment: This paper addresses the important practical problem of ATM network reliability by proposing an effective solution based on multi-classifier fusion. While theoretical innovation is limited, it demonstrates outstanding performance in engineering practice and performance improvement, possessing significant practical value and industrial impact. The successful application of this method provides valuable reference for reliability monitoring of similar critical systems.