2025-11-12T03:04:29.469257

Bluetooth Fingerprint Identification Under Domain Shift Through Transient Phase Derivative

Albousayri, Hamdaoui, Wong et al.
Deep learning-based radio frequency fingerprinting (RFFP) has become an enabling physical-layer security technology, allowing device identification and authentication through received RF signals. This technology, however, faces significant challenges when it comes to adapting to domain variations, such as time, location, environment, receiver and channel. For Bluetooth Low Energy (BLE) devices, addressing these challenges is particularly crucial due to the BLE protocol's frequency-hopping nature. In this work, and for the first time, we investigated the frequency hopping effect on RFFP of BLE devices, and proposed a novel, low-cost, domain-adaptive feature extraction method. Our approach improves the classification accuracy by up to 58\% across environments and up to 80\% across receivers compared to existing benchmarks.
academic

Identificación de Huella Digital Bluetooth Bajo Cambio de Dominio Mediante Derivada de Fase Transitoria

Información Básica

  • ID del Artículo: 2510.09940
  • Título: Bluetooth Fingerprint Identification Under Domain Shift Through Transient Phase Derivative
  • Autores: Haytham Albousayri, Bechir Hamdaoui, Weng-Keen Wong, Nora Basha (Oregon State University)
  • Clasificación: eess.SP (Ingeniería Eléctrica y Ciencia de Sistemas - Procesamiento de Señales), cs.CR (Informática - Criptografía y Seguridad)
  • Fecha de Publicación: 11 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.09940

Resumen

La identificación de huella digital de radiofrecuencia (RFFP) basada en aprendizaje profundo se ha convertido en una tecnología importante de seguridad de capa física, capaz de realizar identificación y autenticación de dispositivos mediante señales de radiofrecuencia recibidas. Sin embargo, esta tecnología enfrenta desafíos significativos en la adaptación a cambios de dominio (como tiempo, ubicación, entorno, receptor y canal). Para dispositivos Bluetooth de bajo consumo (BLE), resolver estos desafíos es particularmente crítico debido a la característica de salto de frecuencia del protocolo BLE. Este estudio investiga por primera vez el impacto del salto de frecuencia en RFFP para dispositivos BLE y propone un novedoso método de extracción de características de bajo costo adaptado al dominio. Este método mejora la precisión de clasificación entre entornos hasta en un 58% y entre receptores hasta en un 80% en comparación con los puntos de referencia existentes.

Antecedentes de Investigación y Motivación

1. Definición del Problema

La tecnología RFFP aprovecha características de señal únicas producidas por defectos inherentes del hardware para identificar dispositivos, pero los métodos existentes experimentan una caída drástica de rendimiento cuando se enfrentan a cambios de dominio. Particularmente para dispositivos BLE, su característica de salto de frecuencia hace que la identificación de dispositivos entre diferentes canales de frecuencia sea un desafío insuficientemente investigado.

2. Importancia del Problema

  • Amenazas de Seguridad: Los dispositivos BLE son vulnerables a vulnerabilidades de emparejamiento, ataques de transmisión de datos y ataques de protocolo de conexión
  • Desafíos de Adaptación de Dominio: La precisión de clasificación disminuye significativamente cuando las condiciones de entrenamiento y prueba no coinciden
  • Necesidad de Practicidad: Los métodos existentes tienen dificultades para mantener un rendimiento estable en implementaciones a gran escala en el mundo real

3. Limitaciones de Métodos Existentes

  • Los modelos de aprendizaje profundo utilizando datos I/Q sin procesar tienen pobre capacidad de generalización
  • La investigación existente se enfoca principalmente en WiFi y LoRa, con investigación insuficiente en BLE
  • Falta de investigación sistemática sobre los efectos del comportamiento de salto de frecuencia en BLE
  • Escala de evaluación pequeña (típicamente menos de 20 dispositivos), difícil de satisfacer requisitos de aplicaciones prácticas

4. Motivación de la Investigación

Este artículo tiene como objetivo resolver el problema de robustez de BLE RFFP bajo cambios de dominio, enfocándose particularmente en los efectos del salto de frecuencia, cambios ambientales y diferencias de receptor.

Contribuciones Principales

  1. Nuevo Método de Representación de Datos: Propone la representación de derivada de fase transitoria y de preámbulo (TPD), que resuelve efectivamente el problema de variabilidad de dominio
  2. Conjunto de Datos BLE Integral: Recopila un conjunto de datos de tramas BLE de 31 dispositivos IoT bajo diferentes entornos, receptores y canales de frecuencia
  3. Adaptabilidad de Salto de Frecuencia: Primera evaluación experimental del impacto del salto de frecuencia en BLE RFFP, demostrando robustez del método ante cambios de dominio causados por salto de frecuencia
  4. Adaptabilidad Ambiental: Mantiene alta precisión de clasificación bajo cambios ambientales, incluso cuando el entrenamiento es en interiores y la prueba es en exteriores o utilizando diferentes receptores

Explicación Detallada del Método

Definición de la Tarea

Dado un conjunto de señales de radiofrecuencia transmitidas por dispositivos BLE, identificar con precisión el dispositivo fuente de la señal en presencia de cambios de dominio (canal de frecuencia, entorno, receptor).

Modelado de Defectos de Hardware BLE

Modulación GFSK Ideal

BLE utiliza modulación por desplazamiento de frecuencia gaussiana (GFSK), donde la señal de modulación angular en banda base ideal es:

x(t) = xI(t) + jxQ(t) = cos(φ(t)) + j sin(φ(t))

donde φ(t) = 2πfm∫₀ᵗg(t)dt es la función de desplazamiento angular instantáneo.

Defectos de Hardware Reales

Considerando imperfecciones del hardware, la señal en banda base distorsionada recibida es:

ỹ(t) = [ỹI(t) + jỹQ(t)] e^(j(2πfCFOt+θPO))

que contiene los siguientes defectos principales:

  • Desplazamiento de Frecuencia Portadora (CFO): fCFO
  • Desplazamiento de Fase: θPO
  • Desbalance I/Q: IQAmp, IQPhase
  • Desplazamiento de CC: IDC, QDC
  • Desviación de Desviación de Frecuencia Máxima: ∆f = f̃m - fm
  • Desviación del Producto Ancho de Banda-Duración: B̃T

Método de Extracción de Características TPD

Idea Central

El método TPD calcula la derivada de fase de las partes transitoria y de preámbulo como características del dispositivo:

  1. Estimación de Fase: σ(t) = unwrap(∠ỹ(t))
  2. Derivada de Fase: TPD(t) = dσ(t)/dt

Teóricamente, TPD puede aproximarse como:

TPD(t) ≈ 2πfCFO + dθPO/dt + 2πf̃mg̃(t)

Implementación en Dominio de Tiempo Discreto

Para señales discretas yn:

  1. Extraer los primeros L muestras (transitoria + preámbulo)
  2. Calcular fase: σn = unwrap(∠yn)
  3. Obtener TPD mediante diferenciación: TPDn = σn - σn-1

Ventajas del Método

  • Independencia de Canal: La operación de derivada elimina desplazamientos de fase estática
  • Independencia de Contenido: Evita sobreajuste al contenido de PDU
  • Eficiencia Computacional: Solo procesa una longitud fija de la parte de preámbulo
  • Dimensión Fija: Asegura consistencia de dimensión de entrada de datos de entrenamiento

Arquitectura del Clasificador CNN

  • 5 Bloques Convolucionales: Incluyen convolución 1D, normalización por lotes, activación LeakyReLU y agrupación máxima
  • 2 Capas Completamente Conectadas: Con dropout para prevenir sobreajuste
  • Optimizador: SGD con tasa de aprendizaje de decaimiento exponencial
  • Parámetros de Entrenamiento: 25 épocas, tamaño de lote 64

Configuración Experimental

Conjunto de Datos

  • Número de Dispositivos: 31 dispositivos Seeed Studio XIAO ESP32-C3
  • Receptores: 2 Ettus USRP B210
  • Parámetros de Muestreo: Tasa de muestreo de 6MS/s, ancho de banda de 2MHz
  • Tiempo de Calentamiento: 6 minutos de período de estabilización por dispositivo + 2 minutos de recopilación de datos
  • Canales de Frecuencia: Ch1(2.406GHz), Ch2(2.408GHz), Ch14(2.434GHz), Ch32(2.470GHz)

Escenarios Experimentales

  1. Cambio Ambiental: Interior cableado vs exterior inalámbrico (distancia de 1m-3m)
  2. Cambio de Canal: Salto de frecuencia entre diferentes canales BLE
  3. Cambio de Receptor: Diferencias entre diferentes dispositivos USRP

Métodos de Comparación

  • Raw IQ: Utilizando datos I/Q sin procesar completos
  • TP: Solo I/Q sin procesar de las partes transitoria y de preámbulo
  • Mbed: Combinación de características que incluye amplitud, fase y densidad espectral de potencia

Métricas de Evaluación

Precisión de clasificación (número de muestras clasificadas correctamente / número total de muestras)

Resultados Experimentales

Resultados Principales

Adaptabilidad Entre Canales

  • TPD mantiene precisión del 80-95% cuando se entrena y prueba entre diferentes canales
  • El método Raw IQ cae por debajo del 10% de precisión (sobreajuste severo al contenido de PDU)
  • TPD mejora 20-58% en comparación con métodos TP y Mbed

Adaptabilidad Entre Entornos

  • Entrenamiento en interior → Prueba en exterior: TPD mantiene precisión del 70-75%
  • Mejora del 40-45% en comparación con TP, aproximadamente 50% en comparación con Mbed
  • Rendimiento estable a diferentes distancias

Adaptabilidad Entre Receptores

  • TPD mantiene precisión del 99% entre diferentes receptores
  • Mbed cae de 95% a 88%, TP cae de 98% a 81%
  • Demuestra excelente independencia de receptor

Experimentos de Ablación

Análisis de Sensibilidad a Defectos de Hardware

Verificación mediante simulación de la capacidad de TPD para capturar varios defectos de hardware:

  • CFO: Produce desplazamiento vertical en la representación TPD, realizando diferenciación de dispositivos
  • Desbalance I/Q: Resulta en transiciones de pulso más agudas, inversión de pendiente en valores negativos
  • Desplazamiento de CC: Introduce diferentes patrones de distorsión
  • Desviación de Frecuencia Máxima: Errores más grandes producen oscilaciones TPD más grandes
  • Producto BT: Afecta el pico de preámbulo y la velocidad de transición

Análisis de Escalabilidad

Con el aumento del número de dispositivos (6→31), la precisión disminuye monótonamente, pero TPD muestra la menor disminución en comparación con otros métodos.

Comparación de Eficiencia Computacional

MétodoTiempo de Preprocesamiento(s)Tiempo de Entrenamiento(s)Tiempo de Inferencia(s)
Raw IQ0.000139111.4861.40
TP0.00009730.4420.58
Mbed0.00052133.80.61
TPD0.00096329.6430.56

TPD muestra el mejor rendimiento en velocidad de entrenamiento e inferencia.

Trabajo Relacionado

Estado Actual de la Investigación RFFP

  • Investigación Temprana: Se enfocaba principalmente en verificación de viabilidad de tecnologías LoRa y WiFi
  • Métodos de Adaptación de Dominio: Envolvente de espectro de potencia, transformada de Fourier de tiempo corto, mecanismos de atención
  • Investigación Insuficiente en BLE: El trabajo existente se limita principalmente a casos de uso estrechos, careciendo de investigación sobre efectos de salto de frecuencia

Puntos de Innovación de Este Artículo

  • Primera investigación sistemática del impacto del salto de frecuencia en BLE RFFP
  • Propone un método simple y efectivo de extracción de características adaptado al dominio
  • Evaluación a gran escala de dispositivos (31 dispositivos vs típicamente <20)

Conclusiones y Discusión

Conclusiones Principales

  1. El método TPD resuelve efectivamente el problema de adaptación de dominio en BLE RFFP
  2. El salto de frecuencia, cambios ambientales y diferencias de receptor tienen impacto significativo en métodos tradicionales
  3. Las características simples de derivada de fase son más efectivas que combinaciones de características complejas
  4. El método tiene buena eficiencia computacional y escalabilidad

Limitaciones

  1. Sesgo en Entorno Inalámbrico: Algunos dispositivos muestran clasificación errónea sesgada en entorno inalámbrico
  2. Efecto de Distancia de Canal: Cuanto más lejos esté el canal de prueba del canal de entrenamiento, mayor es la disminución de precisión
  3. Desafío de Dispositivos a Gran Escala: La precisión disminuye monótonamente con el aumento del número de dispositivos
  4. Necesidad de Ecualización de Canal: El entorno inalámbrico puede requerir técnicas de ecualización adicionales

Direcciones Futuras

  1. Técnicas de Ecualización Avanzadas: Compensar la distorsión causada por el canal
  2. Evaluación a Mayor Escala: Verificar el rendimiento del método en cientos de dispositivos
  3. Implementación en Tiempo Real: Verificación de aplicación en entornos IoT reales
  4. Fusión Multimodal: Combinar otras características de capa física para mejorar robustez

Evaluación Profunda

Fortalezas

  1. Fuerte Especificidad del Problema: Primera investigación sistemática del impacto del salto de frecuencia en BLE, llenando un vacío de investigación importante
  2. Método Simple y Efectivo: El método TPD tiene principios claros, implementación simple y resultados significativos
  3. Experimentos Completos y Exhaustivos: Cubre múltiples escenarios de cambio de dominio, comparaciones de métodos razonables
  4. Análisis Teórico Profundo: Explica la efectividad de TPD desde la perspectiva de defectos de hardware
  5. Alto Valor Práctico: Buena eficiencia computacional, adecuado para implementación práctica

Deficiencias

  1. Tipo de Dispositivo Único: Solo prueba un tipo de dispositivo ESP32-C3, generalización pendiente de verificación
  2. Análisis Insuficiente del Entorno Inalámbrico: Falta análisis profundo de clasificación errónea sesgada en entorno inalámbrico
  3. Falta de Evaluación Adversarial: No considera robustez bajo ataques maliciosos
  4. Estabilidad a Largo Plazo Desconocida: Falta análisis del impacto de factores a largo plazo como envejecimiento de dispositivos y cambios de temperatura

Impacto

  1. Contribución Académica: Proporciona un avance tecnológico importante para seguridad BLE y el campo RFFP
  2. Valor Práctico: Proporciona una solución de bajo costo y alta eficiencia para autenticación de dispositivos IoT
  3. Reproducibilidad: Los autores se comprometen a publicar conjunto de datos y código, promoviendo investigación posterior

Escenarios Aplicables

  • Autenticación de Dispositivos IoT: Entornos de hogar inteligente e IoT industrial
  • Control de Acceso a Red: Seguridad de red inalámbrica empresarial
  • Protección de Seguimiento de Dispositivos: Identificación de dispositivos en escenarios de protección de privacidad
  • Computación de Borde: Autenticación ligera en entornos con recursos limitados

Referencias

El artículo cita 21 referencias relacionadas, cubriendo trabajo importante en seguridad BLE, tecnología RFFP, aprendizaje profundo y otros campos, proporcionando una base teórica sólida para la investigación.


Evaluación General: Este es un artículo de investigación de alta calidad sobre identificación de huella digital de radiofrecuencia para dispositivos BLE, con contribuciones significativas en innovación de métodos, verificación experimental y valor práctico. La propuesta del método TPD llena el vacío en la investigación de adaptación de dominio de BLE RFFP, proporcionando una solución tecnológica valiosa para seguridad de Internet de las Cosas.