2025-11-12T03:04:29.469257

Bluetooth Fingerprint Identification Under Domain Shift Through Transient Phase Derivative

Albousayri, Hamdaoui, Wong et al.
Deep learning-based radio frequency fingerprinting (RFFP) has become an enabling physical-layer security technology, allowing device identification and authentication through received RF signals. This technology, however, faces significant challenges when it comes to adapting to domain variations, such as time, location, environment, receiver and channel. For Bluetooth Low Energy (BLE) devices, addressing these challenges is particularly crucial due to the BLE protocol's frequency-hopping nature. In this work, and for the first time, we investigated the frequency hopping effect on RFFP of BLE devices, and proposed a novel, low-cost, domain-adaptive feature extraction method. Our approach improves the classification accuracy by up to 58\% across environments and up to 80\% across receivers compared to existing benchmarks.
academic

Bluetooth-Fingerprint-Identifikation unter Domain-Verschiebung durch transiente Phasenableitung

Grundinformationen

  • Paper-ID: 2510.09940
  • Titel: Bluetooth Fingerprint Identification Under Domain Shift Through Transient Phase Derivative
  • Autoren: Haytham Albousayri, Bechir Hamdaoui, Weng-Keen Wong, Nora Basha (Oregon State University)
  • Klassifizierung: eess.SP (Elektrotechnik und Systemwissenschaften - Signalverarbeitung), cs.CR (Informatik - Kryptographie und Sicherheit)
  • Veröffentlichungsdatum: 11. Oktober 2025 (arXiv-Preprint)
  • Paper-Link: https://arxiv.org/abs/2510.09940

Zusammenfassung

Die auf tiefem Lernen basierende Hochfrequenz-Fingerprint-Identifikation (RFFP) hat sich zu einer wichtigen Sicherheitstechnologie der physischen Schicht entwickelt, die die Geräteidentifikation und -authentifizierung durch empfangene Hochfrequenzsignale ermöglicht. Diese Technologie steht jedoch vor erheblichen Herausforderungen bei der Anpassung an Domänenvariationen (wie Zeit, Ort, Umgebung, Empfänger und Kanal). Für Bluetooth Low Energy (BLE)-Geräte ist die Bewältigung dieser Herausforderungen aufgrund der Frequenzsprung-Charakteristik des BLE-Protokolls besonders kritisch. Diese Forschung untersucht erstmals die Auswirkungen von Frequenzsprüngen auf die RFFP von BLE-Geräten und schlägt eine neuartige, kostengünstige Methode zur domänenadaptiven Merkmalsextraktion vor. Diese Methode verbessert die Klassifizierungsgenauigkeit über Umgebungen hinweg um bis zu 58% und über Empfänger hinweg um bis zu 80% im Vergleich zu bestehenden Baselines.

Forschungshintergrund und Motivation

1. Problemdefinition

Die Hochfrequenz-Fingerprint-Identifikation (RFFP) nutzt eindeutige Signalmerkmale, die durch inhärente Hardwaremängel entstehen, um Geräte zu identifizieren. Bestehende Methoden zeigen jedoch eine drastische Leistungsabnahme bei Domänenvariationen. Besonders für BLE-Geräte stellt deren Frequenzsprung-Charakteristik eine unzureichend erforschte Herausforderung für die Geräteidentifikation über verschiedene Frequenzkanäle dar.

2. Problemrelevanz

  • Sicherheitsbedrohungen: BLE-Geräte sind anfällig für Kopplungslücken, Datenübertragungsangriffe und Verbindungsprotokoll-Angriffe
  • Domain-Adaptationsprobleme: Die Klassifizierungsgenauigkeit sinkt erheblich, wenn Trainings- und Testbedingungen nicht übereinstimmen
  • Praktische Anforderungen: Bestehende Methoden lassen sich schwer in großflächigen realen Einsätzen mit stabiler Leistung beibehalten

3. Einschränkungen bestehender Methoden

  • Deep-Learning-Modelle mit rohen I/Q-Daten zeigen schlechte Verallgemeinerungsfähigkeit
  • Bestehende Forschung konzentriert sich hauptsächlich auf WiFi und LoRa, BLE-Forschung ist unzureichend
  • Fehlende systematische Untersuchung der Auswirkungen von BLE-Frequenzsprüngen
  • Kleine Evaluierungsskalen (typischerweise weniger als 20 Geräte) erfüllen praktische Anforderungen nicht

4. Forschungsmotivation

Dieses Papier zielt darauf ab, das Robustheitsproblem der BLE-RFFP unter Domänenvariationen zu lösen, mit besonderem Fokus auf die Auswirkungen von Frequenzsprüngen, Umgebungsveränderungen und Empfängerunterschieden.

Kernbeiträge

  1. Neuartige Datendarstellungsmethode: Einführung der Darstellung durch transiente und Präambel-Phasenableitung (TPD), die Domänenvariabilität effektiv adressiert
  2. Umfassender BLE-Datensatz: Erfassung eines BLE-Frame-Datensatzes von 31 IoT-Geräten unter verschiedenen Umgebungen, Empfängern und Frequenzkanälen
  3. Frequenzsprung-Adaptivität: Erstmalige experimentelle Bewertung der Auswirkungen von Frequenzsprüngen auf BLE-RFFP, Nachweis der Robustheit der Methode gegenüber frequenzsprung-induzierten Domänenvariationen
  4. Umgebungsadaptivität: Beibehaltung hoher Klassifizierungsgenauigkeit unter Umgebungsveränderungen, auch wenn das Training in Innenräumen und Tests im Freien durchgeführt werden oder unterschiedliche Empfänger verwendet werden

Methodische Details

Aufgabendefinition

Gegeben sind von BLE-Geräten übertragene Hochfrequenzsignale. Unter Vorhandensein von Domänenvariationen (Frequenzkanal, Umgebung, Empfänger) soll das Quellgerät des Signals genau identifiziert werden.

Modellierung von BLE-Hardwaremängeln

Ideale GFSK-Modulation

BLE verwendet Gaussian Frequency Shift Keying (GFSK)-Modulation. Das ideale Basisband-Winkelmodulationssignal ist:

x(t) = xI(t) + jxQ(t) = cos(φ(t)) + j sin(φ(t))

wobei φ(t) = 2πfm∫₀ᵗg(t)dt die momentane Winkelabweichungsfunktion ist.

Praktische Hardwaremängel

Unter Berücksichtigung von Hardwareunvollkommenheiten ist das empfangene verzerrte Basisbandsignal:

ỹ(t) = [ỹI(t) + jỹQ(t)] e^(j(2πfCFOt+θPO))

mit folgenden Hauptmängeln:

  • Trägerfrequenzabweichung (CFO): fCFO
  • Phasenabweichung: θPO
  • IQ-Unausgewogenheit: IQAmp, IQPhase
  • DC-Abweichung: IDC, QDC
  • Abweichung der Spitzenfrequenzabweichung: ∆f = f̃m - fm
  • Bandbreitendauer-Produkt-Abweichung: B̃T-Abweichung

TPD-Merkmalsextraktionsmethode

Kernidee

Die TPD-Methode berechnet die Phasenableitung der transienten und Präambel-Teile als Gerätemerkmal:

  1. Phasenschätzung: σ(t) = unwrap(∠ỹ(t))
  2. Phasenableitung: TPD(t) = dσ(t)/dt

Theoretisch kann TPD angenähert werden als:

TPD(t) ≈ 2πfCFO + dθPO/dt + 2πf̃mg̃(t)

Diskrete Zeitbereichsimplementierung

Für diskrete Signale yn:

  1. Extrahieren der ersten L Abtastwerte (Transiente + Präambel)
  2. Berechnung der Phase: σn = unwrap(∠yn)
  3. Differenzierung zur Gewinnung von TPD: TPDn = σn - σn-1

Methodische Vorteile

  • Kanalunabhängig: Die Ableitungsoperation eliminiert statische Phasenabweichungen
  • Inhaltsunabhängig: Vermeidung von Überanpassung an PDU-Inhalte
  • Rechnerisch effizient: Verarbeitung nur des festen Längenpräambel-Teils
  • Feste Dimensionalität: Gewährleistung konsistenter Eingabedimensionen für Trainingsdaten

CNN-Klassifikator-Architektur

  • 5 Faltungsblöcke: Mit 1D-Faltung, Batch-Normalisierung, LeakyReLU-Aktivierung und Max-Pooling
  • 2 vollständig verbundene Schichten: Mit Dropout zur Überanpassungsprävention
  • Optimierer: SGD mit exponentiell abnehmender Lernrate
  • Trainingsparameter: 25 Epochen, Batch-Größe 64

Experimentelle Einrichtung

Datensatz

  • Geräteanzahl: 31 Seeed Studio XIAO ESP32-C3-Geräte
  • Empfänger: 2 Ettus USRP B210
  • Abtastparameter: 6MS/s Abtastrate, 2MHz Bandbreite
  • Aufwärmzeit: 6 Minuten Stabilisierungsphase pro Gerät + 2 Minuten Datenerfassung
  • Frequenzkanäle: Ch1(2.406GHz), Ch2(2.408GHz), Ch14(2.434GHz), Ch32(2.470GHz)

Experimentelle Szenarien

  1. Umgebungsvariationen: Verdrahteter Innenraum vs. drahtlos im Freien (1m-3m Entfernung)
  2. Kanalvariationen: Frequenzsprünge zwischen verschiedenen BLE-Frequenzkanälen
  3. Empfängervariationen: Unterschiede zwischen verschiedenen USRP-Geräten

Vergleichsmethoden

  • Raw IQ: Verwendung vollständiger roher I/Q-Daten
  • TP: Nur transiente und Präambel-Rohdaten I/Q
  • Mbed: Merkmalskombination aus Amplitude, Phase und Leistungsspektraldichte

Bewertungsmetriken

Klassifizierungsgenauigkeit (Anzahl korrekt klassifizierter Proben / Gesamtanzahl Proben)

Experimentelle Ergebnisse

Hauptergebnisse

Kanalübergreifende Adaptivität

  • TPD behält 80-95% Genauigkeit bei Training und Test über verschiedene Kanäle hinweg
  • Raw IQ-Methode fällt auf unter 10% Genauigkeit (schwere Überanpassung an PDU-Inhalte)
  • TPD verbessert sich um 20-58% im Vergleich zu TP- und Mbed-Methoden

Umgebungsübergreifende Adaptivität

  • Innentraining → Außentest: TPD behält 70-75% Genauigkeit
  • Verbesserung um 40-45% gegenüber TP, etwa 50% gegenüber Mbed
  • Stabile Leistung über verschiedene Entfernungen

Empfängerübergreifende Adaptivität

  • TPD behält 99% Genauigkeit über verschiedene Empfänger hinweg
  • Mbed sinkt von 95% auf 88%, TP von 98% auf 81%
  • Zeigt hervorragende Empfängerunabhängigkeit

Ablationsstudien

Sensitivitätsanalyse von Hardwaremängeln

Durch Simulation wird die Erfassungsfähigkeit von TPD für verschiedene Hardwaremängel überprüft:

  • CFO: Erzeugt vertikale Verschiebung in der TPD-Darstellung, ermöglicht Geräteunterscheidung
  • IQ-Unausgewogenheit: Führt zu schärferen Impulsübergängen, Steigungsumkehr bei negativen Werten
  • DC-Abweichung: Führt zu unterschiedlichen Verzerrungsmustern
  • Spitzenfrequenzabweichung: Größere Fehler erzeugen größere TPD-Schwankungen
  • BT-Produkt: Beeinflusst Präambel-Spitzenwert und Überganggeschwindigkeit

Skalierbarkeitsanalyse

Mit zunehmender Geräteanzahl (6→31) sinkt die Genauigkeit monoton, aber TPD zeigt den kleinsten Rückgang im Vergleich zu anderen Methoden.

Vergleich der Recheneffizienz

MethodeVorverarbeitungszeit(s)Trainingszeit(s)Inferenzzeit(s)
Raw IQ0.000139111.4861.40
TP0.00009730.4420.58
Mbed0.00052133.80.61
TPD0.00096329.6430.56

TPD zeigt optimale Leistung bei Trainings- und Inferenzgeschwindigkeit.

Verwandte Arbeiten

Stand der RFFP-Forschung

  • Frühe Forschung: Hauptsächlich Machbarkeitsprüfung für LoRa- und WiFi-Technologien
  • Domain-Adaptationsmethoden: Leistungsspektrum-Hüllkurve, kurzzeit-Fourier-Transformation, Aufmerksamkeitsmechanismen
  • Unzureichende BLE-Forschung: Bestehende Arbeiten sind oft auf enge Anwendungsfälle beschränkt, fehlende Forschung zu Frequenzsprung-Auswirkungen

Innovationen dieses Papiers

  • Erstmalige systematische Untersuchung der Auswirkungen von BLE-Frequenzsprüngen auf RFFP
  • Vorschlag einer einfachen und effektiven Methode zur domänenadaptiven Merkmalsextraktion
  • Großflächige Geräte-Bewertung (31 Geräte vs. üblich <20 Geräte)

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Die TPD-Methode löst effektiv das Domain-Adaptationsproblem der BLE-RFFP
  2. Frequenzsprünge, Umgebungsveränderungen und Empfängerunterschieden haben signifikante Auswirkungen auf traditionelle Methoden
  3. Einfache Phasenableitungsmerkmale sind effektiver als komplexe Merkmalskombinationen
  4. Die Methode zeigt gute Recheneffizienz und Skalierbarkeit

Einschränkungen

  1. Drahtlose Umgebungsabweichung: Einige Geräte zeigen systematische Fehlklassifizierungen in drahtloser Umgebung
  2. Kanal-Entfernungseffekt: Je weiter der Testkanal vom Trainingskanal entfernt ist, desto stärker sinkt die Genauigkeit
  3. Großflächige Geräte-Herausforderung: Die Genauigkeit sinkt monoton mit zunehmender Geräteanzahl
  4. Kanal-Ausgleichsbedarf: Drahtlose Umgebungen erfordern möglicherweise zusätzliche Ausgleichstechniken

Zukünftige Richtungen

  1. Fortgeschrittene Ausgleichstechniken: Kompensation von Kanalverzerrungen
  2. Großflächigere Bewertung: Validierung der Methode bei Hunderten von Geräten
  3. Echtzeit-Bereitstellung: Anwendungsvalidierung in echten IoT-Umgebungen
  4. Multimodale Fusion: Kombination anderer physischer Schicht-Merkmale zur Verbesserung der Robustheit

Tiefgreifende Bewertung

Stärken

  1. Starke Problemorientierung: Erstmalige systematische Untersuchung von BLE-Frequenzsprung-Auswirkungen, Schließung wichtiger Forschungslücke
  2. Einfache und effektive Methode: TPD-Methode mit klaren Prinzipien, einfacher Implementierung und signifikanten Ergebnissen
  3. Umfassende Experimente: Abdeckung mehrerer Domain-Variationsszenarios, angemessene Vergleichsmethoden
  4. Tiefgreifende theoretische Analyse: Erklärung der TPD-Effektivität aus Hardwaremängel-Perspektive
  5. Hoher praktischer Wert: Gute Recheneffizienz, geeignet für praktische Bereitstellung

Mängel

  1. Einzelne Gerätetyp: Nur ein ESP32-C3-Gerätetyp getestet, Verallgemeinerbarkeit zu überprüfen
  2. Unzureichende Analyse drahtloser Umgebungen: Mangelnde tiefgreifende Analyse systematischer Fehlklassifizierungen in drahtloser Umgebung
  3. Fehlende adversarische Bewertung: Robustheit unter böswilligen Angriffen nicht berücksichtigt
  4. Langzeitstabilität unbekannt: Fehlende Analyse von Langzeitfaktoren wie Geräteabnutzung und Temperaturveränderungen

Einflussfaktor

  1. Akademischer Beitrag: Wichtiger technologischer Durchbruch für BLE-Sicherheit und RFFP-Forschung
  2. Praktischer Wert: Kostengünstige und effiziente Lösung für IoT-Geräte-Authentifizierung
  3. Reproduzierbarkeit: Autoren verpflichten sich zur Veröffentlichung von Datensatz und Code, fördern Folgeforschung

Anwendungsszenarien

  • IoT-Geräte-Authentifizierung: Smart-Home-, Industrial-IoT-Umgebungen
  • Netzwerk-Zugriffskontrolle: Sicherheit drahtloser Unternehmungsnetzwerke
  • Geräte-Verfolgungsschutz: Geräteidentifikation in Datenschutzszenarien
  • Edge-Computing: Leichte Authentifizierung in ressourcenbeschränkten Umgebungen

Literaturverzeichnis

Das Papier zitiert 21 relevante Arbeiten, die wichtige Arbeiten in den Bereichen BLE-Sicherheit, RFFP-Technologie und tiefes Lernen abdecken und eine solide theoretische Grundlage für die Forschung bieten.


Gesamtbewertung: Dies ist ein hochqualitatives Forschungspapier zur Hochfrequenz-Fingerprint-Identifikation von BLE-Geräten mit signifikanten Beiträgen in Methodologie-Innovation, experimenteller Validierung und praktischem Wert. Der Vorschlag der TPD-Methode schließt die Forschungslücke in der Domain-Adaptation für BLE-RFFP und bietet eine wertvolle technische Lösung für IoT-Sicherheit.