2025-11-20T20:04:15.567359

Adversarial-Resilient RF Fingerprinting: A CNN-GAN Framework for Rogue Transmitter Detection

Dhakal, Shekhar, Kandel
Radio Frequency Fingerprinting (RFF) has evolved as an effective solution for authenticating devices by leveraging the unique imperfections in hardware components involved in the signal generation process. In this work, we propose a Convolutional Neural Network (CNN) based framework for detecting rogue devices and identifying genuine ones using softmax probability thresholding. We emulate an attack scenario in which adversaries attempt to mimic the RF characteristics of genuine devices by training a Generative Adversarial Network (GAN) using In-phase and Quadrature (IQ) samples from genuine devices. The proposed approach is verified using IQ samples collected from ten different ADALM-PLUTO Software Defined Radios (SDRs), with seven devices considered genuine, two as rogue, and one used for validation to determine the threshold.
academic

विरोधी-लचीला RF फिंगरप्रिंटिंग: दुर्भावनापूर्ण ट्रांसमीटर का पता लगाने के लिए CNN-GAN फ्रेमवर्क

मूल जानकारी

  • पेपर ID: 2510.09663
  • शीर्षक: Adversarial-Resilient RF Fingerprinting: A CNN-GAN Framework for Rogue Transmitter Detection
  • लेखक: राजु ढकाल, प्रशांत शेखर, लक्षिमा नीरे कंडेल (एम्ब्री-रिडल एरोनॉटिकल विश्वविद्यालय)
  • वर्गीकरण: cs.CR (क्रिप्टोग्राफी और सुरक्षा), cs.AI (कृत्रिम बुद्धिमत्ता)
  • प्रकाशन तिथि: 7 अक्टूबर 2025
  • पेपर लिंक: https://arxiv.org/abs/2510.09663

सारांश

रेडियो फ्रीक्वेंसी फिंगरप्रिंटिंग (RFF) सिग्नल उत्पादन प्रक्रिया में हार्डवेयर घटकों की अद्वितीय खामियों का लाभ उठाकर डिवाइस प्रमाणीकरण के लिए एक प्रभावी समाधान बन गया है। यह पेपर कनवोल्यूशनल न्यूरल नेटवर्क (CNN) पर आधारित एक फ्रेमवर्क प्रस्तावित करता है, जो दुर्भावनापूर्ण डिवाइस का पता लगाने और वैध डिवाइस की पहचान करने के लिए softmax संभाव्यता थ्रेशोल्ड का उपयोग करता है। अनुसंधान एक ऐसे परिदृश्य का अनुकरण करता है जहां प्रतिद्वंद्वी जनरेटिव एडवर्सेरियल नेटवर्क (GAN) का उपयोग करके इन-फेज़ और क्वाड्रेचर (I/Q) नमूनों को प्रशिक्षित करके वैध डिवाइस की RF विशेषताओं की नकल करने का प्रयास करते हैं। इस विधि को 10 विभिन्न ADALM-PLUTO सॉफ्टवेयर परिभाषित रेडियो (SDR) से एकत्र किए गए I/Q नमूनों के साथ सत्यापित किया गया है, जिनमें से 7 डिवाइस वैध माने जाते हैं, 2 दुर्भावनापूर्ण हैं, और 1 थ्रेशोल्ड निर्धारित करने के लिए सत्यापन के लिए उपयोग किया जाता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

वायरलेस संचार प्रौद्योगिकी के तीव्र विकास के साथ, IoT, सेंसर नेटवर्क, ड्रोन और अन्य अनुप्रयोग क्षेत्रों में डिवाइस की संख्या में तेजी से वृद्धि हुई है, जिससे गंभीर नेटवर्क सुरक्षा खतरे पैदा हुए हैं, विशेष रूप से डिवाइस प्रमाणीकरण और नेटवर्क एक्सेस प्रबंधन में। पारंपरिक क्रिप्टोग्राफिक तकनीकें संसाधन-सीमित वातावरण में अक्सर अत्यधिक कम्प्यूटेशनल ओवरहेड की समस्या पैदा करती हैं।

अनुसंधान का महत्व

  1. हल्के प्रमाणीकरण की आवश्यकता: IoT, सेंसर नेटवर्क और UAV नेटवर्क जैसे संसाधन-सीमित वातावरण को हल्के प्रमाणीकरण विधियों की आवश्यकता है
  2. हार्डवेयर फिंगरप्रिंट की विशिष्टता: प्रत्येक वायरलेस डिवाइस अपने ट्रांसमिशन सिग्नल में हार्डवेयर घटक की खामियों से उत्पन्न एक अद्वितीय पहचानकर्ता रखता है
  3. विरोधी हमले का खतरा: हमलावर सीधे दुर्भावनापूर्ण डिवाइस का उपयोग नहीं कर सकते, बल्कि नेटवर्क एक्सेस प्राप्त करने के लिए वैध डिवाइस की विशेषताओं की नकल करने का प्रयास कर सकते हैं

मौजूदा विधियों की सीमाएं

  1. एकल हमले का मॉडल: मौजूदा अनुसंधान या तो केवल वास्तविक दुर्भावनापूर्ण डिवाइस पर विचार करता है, या केवल दुर्भावनापूर्ण डिवाइस के रूप में संश्लेषित उत्पन्न नमूनों पर ध्यान केंद्रित करता है
  2. विरोधी लचीलेपन की कमी: अधिकांश विधियां GAN जैसी तकनीकों का उपयोग करके वैध डिवाइस की RF विशेषताओं की नकल करने वाले हमलावरों पर विचार नहीं करती हैं
  3. प्रायोगिक सीमाएं: कई अनुसंधान केवल आदर्श वातावरण में सत्यापित होते हैं, वास्तविक विरोधी परिदृश्यों पर विचार की कमी है

मुख्य योगदान

  1. अग्रणी फ्रेमवर्क: लेखकों के ज्ञान के अनुसार, यह पहला काम है जो वास्तविक डिवाइस I/Q नमूनों और GAN संश्लेषित नमूनों के साथ वितरण-बाहर डिवाइस पहचान प्रदर्शन को सत्यापित करता है
  2. दोहरी हमले का मॉडल: वास्तविक दुर्भावनापूर्ण डिवाइस और GAN का उपयोग करके वैध डिवाइस की विशेषताओं की नकल करने वाले हमले के परिदृश्य दोनों पर विचार करता है
  3. CNN-GAN संयुक्त फ्रेमवर्क: CNN क्लासिफायर और GAN जनरेटर को जोड़ने वाला एक संपूर्ण समाधान प्रस्तावित करता है
  4. व्यावहारिक थ्रेशोल्ड विधि: softmax संभाव्यता थ्रेशोल्ड पर आधारित खुले सेट पहचान और बंद सेट वर्गीकरण के लिए एकीकृत विधि विकसित करता है

विधि विवरण

कार्य परिभाषा

इनपुट: वायरलेस डिवाइस से I/Q सिग्नल नमूने आउटपुट:

  • बाइनरी वर्गीकरण: वैध डिवाइस बनाम दुर्भावनापूर्ण डिवाइस को अलग करना
  • बहु-वर्ग वर्गीकरण: पहचाने गए वैध डिवाइस को विशिष्ट डिवाइस श्रेणी में वर्गीकृत करना बाधाएं: अदेखे दुर्भावनापूर्ण डिवाइस और GAN-उत्पन्न नकली नमूनों को संभालने की आवश्यकता है

मॉडल आर्किटेक्चर

समग्र सिस्टम प्रवाह

सिस्टम में दो मुख्य चरण हैं:

  1. प्रशिक्षण चरण: CNN और GAN संयुक्त प्रशिक्षण
  2. अनुमान चरण: थ्रेशोल्ड-आधारित पहचान और वर्गीकरण

CNN आर्किटेक्चर डिजाइन

  • इनपुट परत: (720, 2, 1) आकार के I/Q नमूने
  • कनवोल्यूशनल परत: 32 फिल्टर, कर्नल आकार (5,1), ReLU सक्रियण, L2 नियमितकरण, बैच सामान्यीकरण, अधिकतम पूलिंग (2,1)
  • पूरी तरह से जुड़ी परत: 352 न्यूरॉन, ReLU सक्रियण, L2 नियमितकरण, 0.3 ड्रॉपआउट
  • आउटपुट परत: 7 वैध डिवाइस श्रेणियों के अनुरूप 7 न्यूरॉन

GAN आर्किटेक्चर डिजाइन

जनरेटर (G):

  • इनपुट: यादृच्छिक शोर वेक्टर
  • तीन पूरी तरह से जुड़ी परतें: 2048, 4096, 1440 न्यूरॉन
  • पहली दो परतें बैच सामान्यीकरण और ReLU सक्रियण का उपयोग करती हैं
  • आउटपुट (720, 2) के I/Q नमूनों में पुनर्गठित है

विभेदक (D):

  • इनपुट: (720, 2) के I/Q नमूने
  • दो 1D कनवोल्यूशनल परतें: 64 और 128 फिल्टर, कर्नल आकार 7 और 5
  • LeakyReLU सक्रियण (α=0.2), 0.3 ड्रॉपआउट
  • पूरी तरह से जुड़ी परत: 128 न्यूरॉन, अंतिम आउटपुट एकल logit

तकनीकी नवाचार

तापमान स्केलिंग Softmax

तापमान पैरामीटर T का उपयोग करके संभाव्यता वितरण के आत्मविश्वास को नियंत्रित करता है:

p = softmax(z/T)

जहां z logits वेक्टर है, इष्टतम तापमान T=2.5

थ्रेशोल्ड निर्णय नियम

ŷ = {
  -1 if p_max < threshold (दुर्भावनापूर्ण के रूप में वर्गीकृत)
  argmax_i p_i otherwise (वैध डिवाइस i के रूप में वर्गीकृत)
}

विशेषता मिलान हानि

जनरेटर विशेषता मिलान हानि का उपयोग करके प्रशिक्षित किया जाता है, जो वास्तविक नमूनों और उत्पन्न नमूनों के विभेदक विशेषताओं के औसत मान के बीच की दूरी पर आधारित है।

प्रायोगिक सेटअप

डेटासेट

  • डिवाइस: 11 ADALM-PLUTO SDR, जिनमें से 1 रिसीवर के रूप में कार्य करता है
  • सिग्नल: वास्तविक समय OFDM वायरलेस संचार सिग्नल
  • डेटा मात्रा: प्रति डिवाइस 19,920 फ्रेम, प्रति फ्रेम 72 I/Q नमूनों का हेडर
  • पूर्व-प्रसंस्करण: 10 लगातार फ्रेम को एकल फ्रेम (720 I/Q नमूने) में मिलाया जाता है, सामान्यीकरण प्रसंस्करण

डेटा विभाजन

  • वैध डिवाइस: डिवाइस 1-2 और 5-9 (7 डिवाइस)
  • दुर्भावनापूर्ण डिवाइस: डिवाइस 3 और 4 (2 डिवाइस)
  • सत्यापन डिवाइस: डिवाइस 10 (केवल थ्रेशोल्ड निर्धारण के लिए)
  • प्रशिक्षण सेट: वैध डिवाइस का 70% डेटा (9,760 फ्रेम)
  • सत्यापन सेट: वैध डिवाइस का 10% डेटा + सत्यापन डिवाइस का संपूर्ण डेटा (3,386 नमूने)
  • परीक्षण सेट: वैध डिवाइस का 20% डेटा + दुर्भावनापूर्ण डिवाइस का संपूर्ण डेटा + 1000 GAN-उत्पन्न नमूने (7,774 फ्रेम)

मूल्यांकन मेट्रिक्स

  • F1 स्कोर: दुर्भावनापूर्ण डिवाइस पहचान के लिए मुख्य मेट्रिक
  • वर्गीकरण सटीकता: वैध डिवाइस पहचान सटीकता
  • Fréchet दूरी (FD): GAN-उत्पन्न नमूनों की गुणवत्ता का मूल्यांकन, FD=0.0545

कार्यान्वयन विवरण

  • CNN ऑप्टिमाइज़र: Adam, सीखने की दर 0.00036, 10 एपोक प्रशिक्षण
  • GAN ऑप्टिमाइज़र: Adam, सीखने की दर 0.001, 3000 एपोक प्रशिक्षण
  • हाइपरपैरामीटर ट्यूनिंग: KerasTuner यादृच्छिक खोज, 20 परीक्षण
  • इष्टतम थ्रेशोल्ड: θ*=0.1987

प्रायोगिक परिणाम

मुख्य परिणाम

बाइनरी वर्गीकरण प्रदर्शन:

  • वैध डिवाइस पहचान सटीकता: 97.6%
  • दुर्भावनापूर्ण डिवाइस पहचान सटीकता: 96.7%
  • दुर्भावनापूर्ण डिवाइस F1 स्कोर: 0.9871

बहु-वर्ग वर्गीकरण प्रदर्शन:

  • सभी पहचाने गए वैध डिवाइस को सही ढंग से संबंधित श्रेणी में वर्गीकृत किया गया
  • अधिकांश डिवाइस वर्गीकरण सटीकता 97% से अधिक है
  • डिवाइस 1 और डिवाइस 9 लगभग परिपूर्ण वर्गीकरण प्रभाव प्राप्त करते हैं

GAN उत्पादन गुणवत्ता सत्यापन

  • I/Q नक्षत्र तुलना: उत्पन्न नमूने (लाल) और वास्तविक नमूने (नीले) I/Q समतल पर समान क्लस्टरिंग वितरण बनाते हैं
  • Fréchet दूरी: FD=0.0545, जो दर्शाता है कि उत्पन्न नमूने वास्तविक नमूनों के वितरण के करीब हैं
  • दृश्य सत्यापन: उत्पन्न नमूने सफलतापूर्वक वास्तविक वैध डिवाइस की RF सिग्नल विशेषताओं की नकल करते हैं

थ्रेशोल्ड विश्लेषण

सत्यापन सेट के माध्यम से निर्धारित थ्रेशोल्ड θ*=0.1987 वैध डिवाइस और दुर्भावनापूर्ण डिवाइस को प्रभावी ढंग से अलग करता है:

  • वैध डिवाइस की अधिकतम softmax संभाव्यता उच्च संभाव्यता क्षेत्र में कसकर एकत्रित होती है
  • दुर्भावनापूर्ण डिवाइस की संभाव्यता वितरण कम और अधिक व्यापक सीमा में होती है

संबंधित कार्य

RF फिंगरप्रिंटिंग अनुसंधान

  1. पारंपरिक विधियां: Huang आदि ने घनत्व प्रक्षेपवक्र ग्राफ और गहन शिक्षण विधियों का उपयोग किया, लेकिन दुर्भावनापूर्ण डिवाइस पहचान पर विचार नहीं किया
  2. बड़े पैमाने पर अनुसंधान: Tong आदि ने 10,000 से अधिक डिवाइस डेटा का उपयोग किया, लेकिन दुर्भावनापूर्ण डिवाइस का पता नहीं लगा सके
  3. Siamese नेटवर्क: Sun आदि और Birnbach आदि ने समान और असमान जोड़ी को अलग करने के लिए Siamese नेटवर्क का उपयोग किया

विरोधी शिक्षण फ्रेमवर्क

Roy आदि ने RFAL फ्रेमवर्क प्रस्तावित किया जो संश्लेषित दुर्भावनापूर्ण नमूने उत्पन्न करने के लिए GAN का उपयोग करता है, लेकिन वास्तविक दुर्भावनापूर्ण डिवाइस डेटा पर विचार नहीं किया।

अनुसंधान अंतराल

मौजूदा कार्य या तो केवल वास्तविक दुर्भावनापूर्ण डिवाइस पर विचार करता है, या केवल संश्लेषित नमूनों पर ध्यान केंद्रित करता है, दोनों हमले प्रकारों पर व्यापक विचार की कमी है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. प्रभावशीलता सत्यापन: CNN-GAN फ्रेमवर्क वास्तविक और संश्लेषित दुर्भावनापूर्ण डिवाइस को सफलतापूर्वक पहचानता है, सटीकता 96% से अधिक है
  2. विरोधी लचीलापन: सिस्टम GAN का उपयोग करके वैध डिवाइस की RF विशेषताओं की नकल करने वाले हमलों का विरोध कर सकता है
  3. व्यावहारिकता: softmax थ्रेशोल्ड-आधारित विधि खुले सेट पहचान और बंद सेट वर्गीकरण का एकीकृत कार्यान्वयन प्राप्त करती है

सीमाएं

  1. डिवाइस स्केल सीमा: केवल 10 डिवाइस के साथ सत्यापन, वास्तविक नेटवर्क सैकड़ों डिवाइस शामिल कर सकते हैं
  2. स्थिर वातावरण: सभी डेटा स्थिर डिवाइस से आते हैं, मोबाइल नोड्स के प्रभाव पर विचार नहीं किया गया है
  3. इनडोर वातावरण: डेटा संग्रह केवल इनडोर प्रयोगशाला वातावरण में किया गया था

भविष्य की दिशाएं

  1. डिवाइस स्केल विस्तार: बड़े पैमाने पर डिवाइस नेटवर्क में विधि की स्केलेबिलिटी को सत्यापित करना
  2. मोबाइल परिदृश्य: डेटा संग्रह प्रक्रिया में मोबाइल नोड्स को शामिल करना
  3. बहु-वातावरण सत्यापन: विभिन्न वायरलेस वातावरण में विधि की मजबूती का परीक्षण करना

गहन मूल्यांकन

लाभ

  1. मजबूत नवाचार: पहली बार वास्तविक और संश्लेषित दुर्भावनापूर्ण डिवाइस पर विचार करने वाली RF फिंगरप्रिंटिंग फ्रेमवर्क
  2. पर्याप्त प्रयोग: वास्तविक SDR डिवाइस से डेटा संग्रह, GAN उत्पादन गुणवत्ता का मात्रात्मक और गुणात्मक सत्यापन
  3. व्यावहारिक विधि: तापमान स्केलिंग और थ्रेशोल्ड विधि सरल और प्रभावी, वास्तविक तैनाती के लिए आसान
  4. विश्वसनीय परिणाम: कई मेट्रिक्स द्वारा सत्यापन, भ्रम मैट्रिक्स स्पष्ट रूप से प्रदर्शन दिखाता है

कमियां

  1. प्रायोगिक स्केल: 10 डिवाइस का प्रायोगिक स्केल अपेक्षाकृत छोटा है, स्केलेबिलिटी को सत्यापित करने की आवश्यकता है
  2. एकल वातावरण: केवल इनडोर स्थिर वातावरण में परीक्षण, विविध परिदृश्य सत्यापन की कमी
  3. तुलना अपर्याप्त: अन्य उन्नत विधियों के साथ प्रत्यक्ष प्रदर्शन तुलना की कमी
  4. सैद्धांतिक विश्लेषण: यह विधि प्रभावी क्यों है इसके गहन सैद्धांतिक विश्लेषण की कमी

प्रभाव

  1. शैक्षणिक मूल्य: RF फिंगरप्रिंटिंग क्षेत्र को विरोधी हमले की रक्षा के लिए नई सोच प्रदान करता है
  2. व्यावहारिक मूल्य: IoT, UAV आदि संसाधन-सीमित वातावरण में डिवाइस प्रमाणीकरण के लिए लागू किया जा सकता है
  3. पुनरुत्पादनीयता: विधि विवरण विस्तृत, प्रायोगिक सेटअप स्पष्ट, अच्छी पुनरुत्पादनीयता है

लागू परिदृश्य

  1. IoT नेटवर्क: हल्के डिवाइस प्रमाणीकरण
  2. ड्रोन संचार: UAV नेटवर्क सुरक्षा प्रमाणीकरण
  3. सेंसर नेटवर्क: वितरित सेंसर डिवाइस प्रबंधन
  4. इंडस्ट्री 4.0: औद्योगिक वायरलेस डिवाइस सुरक्षित एक्सेस

संदर्भ

पेपर RF फिंगरप्रिंटिंग, गहन शिक्षण, GAN और वायरलेस सुरक्षा सहित प्रमुख क्षेत्रों के महत्वपूर्ण कार्यों को कवर करते हुए 13 संबंधित संदर्भों का हवाला देता है, जो अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करता है।


समग्र मूल्यांकन: यह RF फिंगरप्रिंटिंग क्षेत्र में नवाचार के साथ एक काम है, जो पहली बार विरोधी हमले परिदृश्य में डिवाइस प्रमाणीकरण समस्या पर व्यवस्थित रूप से विचार करता है। यद्यपि प्रायोगिक स्केल अपेक्षाकृत सीमित है, विधि नवीन है, परिणाम विश्वसनीय हैं, और इस क्षेत्र के विकास के लिए मूल्यवान योगदान प्रदान करता है।