2025-11-10T02:55:46.582245

Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength

Pour, Habibzadeh
Sound-tracking refers to the process of determining the direction from which a sound originates, making it a fundamental component of sound source localization. This capability is essential in a variety of applications, including security systems, acoustic monitoring, and speaker tracking, where accurately identifying the direction of a sound source enables real-time responses, efficient resource allocation, and improved situational awareness. While sound-tracking is closely related to localization, it specifically focuses on identifying the direction of the sound source rather than estimating its exact position in space. Despite its utility, sound-tracking systems face several challenges, such as maintaining directional accuracy and precision, along with the need for sophisticated hardware configurations and complex signal processing algorithms. This paper presents a sound-tracking method using three electret microphones. We estimate the direction of a sound source using a lightweight method that analyzes signals from three strategically placed microphones. By comparing the average power of the received signals, the system infers the most probable direction of the sound. The results indicate that the power level from each microphone effectively determines the sound source direction. Our system employs a straightforward and cost-effective hardware design, ensuring simplicity and affordability in implementation. It achieves a localization error of less than 6 degrees and a precision of 98%. Additionally, its effortless integration with various systems makes it versatile and adaptable. Consequently, this technique presents a robust and reliable solution for sound-tracking and localization, with potential applications spanning diverse domains such as security systems, smart homes, and acoustic monitoring.
academic

Estimación de la Dirección de Fuentes de Sonido Utilizando Matrices de Micrófono e Intensidad de Señal

Información Básica

  • ID del Artículo: 2507.03466
  • Título: Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength
  • Autores: Mahdi Ali Pour (Universidad Sabancı), Zahra Habibzadeh (Universidad de Teherán)
  • Clasificación: cs.SD cs.SY eess.AS eess.SY
  • Fecha de Publicación: 10 de octubre de 2025 (versión arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2507.03466
  • Enlace del Código: https://github.com/mahdi943/soundlocalization

Resumen

Este artículo propone un método de estimación de la dirección de fuentes de sonido basado en tres micrófono de condensador. El método analiza las señales recibidas por tres micrófono estratégicamente colocados, utilizando un algoritmo ligero que compara la potencia promedio de las señales para inferir la dirección más probable de la fuente de sonido. El sistema implementa un diseño de hardware simple y rentable, logrando un error de localización inferior a 6 grados y una precisión del 98%. Esta técnica tiene un amplio potencial de aplicación en múltiples campos como sistemas de seguridad, hogares inteligentes y monitoreo acústico.

Antecedentes de Investigación y Motivación

1. Problema a Resolver

Esta investigación aborda el problema del seguimiento de fuentes de sonido (sound-tracking), es decir, el proceso de determinar la dirección de la fuente de sonido. A diferencia de la localización completa de fuentes de sonido, el seguimiento de fuentes de sonido se enfoca en identificar la dirección de la fuente en lugar de su ubicación espacial exacta.

2. Importancia del Problema

La estimación de la dirección de fuentes de sonido es crucial en múltiples campos de aplicación:

  • Sistemas de Hogar Inteligente: Como Amazon Alexa y Google Assistant utilizan esta capacidad para determinar la ubicación del usuario en la habitación
  • Vigilancia de Seguridad: Respuesta en tiempo real y asignación de recursos
  • Robótica: Operaciones de búsqueda y rescate y navegación autónoma
  • Monitoreo Acústico: Seguimiento de fuentes de ruido ambiental

3. Limitaciones de Métodos Existentes

Los métodos tradicionales de localización de fuentes de sonido presentan los siguientes problemas:

  • Complejidad de Hardware: Requieren matrices de micrófono grandes y procesadores de alta gama
  • Complejidad Computacional: Los métodos TDOA, conformación de haces y otros son computacionalmente intensivos
  • Costo Elevado: Algoritmos complejos de procesamiento de señales y configuraciones de hardware costosas
  • Baja Capacidad en Tiempo Real: Dificultad para satisfacer requisitos de aplicaciones en tiempo real

4. Motivación de la Investigación

Los autores desean desarrollar una alternativa ligera y rentable que utilice el mínimo de componentes de hardware y algoritmos simples de procesamiento de señales, adecuada para entornos con recursos limitados y escenarios de despliegue rápido.

Contribuciones Principales

  1. Propone un método ligero de estimación de dirección de fuentes de sonido basado en intensidad de señal: Utiliza tres micrófono y un algoritmo de suma vectorial para lograr detección de dirección precisa
  2. Diseña un sistema de hardware de bajo costo: Basado en Arduino y micrófono de condensador, reduciendo significativamente el costo de implementación
  3. Logra rendimiento de alta precisión: Error de localización inferior a 6 grados y precisión del 98%
  4. Verifica la practicidad: Demuestra la efectividad y confiabilidad del método en pruebas reales
  5. Proporciona implementación de código abierto: Publica el código completo y los planos de diseño de hardware

Explicación Detallada del Método

Definición de la Tarea

Entrada: Señales de sonido recibidas por tres micrófono Salida: Ángulo de dirección de la fuente de sonido e intensidad de señal Restricciones: Procesamiento en tiempo real, hardware de bajo costo, algoritmo simple

Arquitectura del Modelo

1. Configuración de Hardware

  • Disposición de Micrófono: Tres micrófono de condensador colocados en posiciones de 0°, 120° y 240°
  • Configuración de Distancia: Cada micrófono a 15 cm del centro
  • Amplificación de Señal: Utiliza amplificador operacional LM358 para mejorar la señal
  • Controlador: Microcontrolador Arduino Uno R3
  • Indicador: Motor servo que apunta hacia la dirección de la fuente de sonido detectada

2. Flujo del Algoritmo

El algoritmo principal se basa en el principio de suma vectorial:

Algoritmo 1: Algoritmo de Localización de Sonido
Entrada: Señal de sonido S, número de muestras N, umbral T
Salida: Ángulo de sonido, magnitud de sonido, posición del motor servo

1. si S > T entonces
2.   para cada micrófono Mi hacer
3.     Arrayi ← Recopilar N muestras de S
4.     Avgi ← Promedio de Arrayi
5.     Vi ← Vector polar de Avgi
6.     Ri ← Forma rectangular de Vi
7.   fin
8.   X ← Σ Ri[0]  // Suma de componentes x
9.   Y ← Σ Ri[1]  // Suma de componentes y
10.  ResultMag ← √(X² + Y²)
11.  ResultAngle ← atan2(Y,X)
12.  Servo ← ServoPos
13. fin

3. Modelo Matemático

Paso 1: Representación en Coordenadas Polares Las señales de los tres micrófono se representan como vectores en coordenadas polares:

  • α = (120°, PowerAvg₁) (1)
  • β = (0°, PowerAvg₂) (2)
  • γ = (240°, PowerAvg₃) (3)

Paso 2: Conversión a Coordenadas Rectangulares

  • R₁ = (rα · cos(θα), rα · sin(θα)) (4)
  • R₂ = (rβ · cos(θβ), rβ · sin(θβ)) (5)
  • R₃ = (rγ · cos(θγ), rγ · sin(θγ)) (6)

Paso 3: Suma Vectorial

  • X = Σᵢ₌₁³ Rxᵢ (7)
  • Y = Σᵢ₌₁³ Ryᵢ (8)

Paso 4: Cálculo de Resultados

  • ResultMag = √(X² + Y²) (9)
  • ResultAngle = atan2(Y,X) (10)

Puntos de Innovación Técnica

  1. Método Vectorial Simplificado: Evita estimaciones complejas de retardo temporal y cálculos de fase
  2. Estrategia de Comparación de Intensidad: Utiliza directamente la potencia de señal en lugar de diferencias de tiempo
  3. Capacidad de Procesamiento en Tiempo Real: Respuesta en tiempo real con baja frecuencia de muestreo (50 Hz)
  4. Diseño Optimizado en Costo: Utiliza componentes comerciales económicos

Configuración Experimental

Conjunto de Datos

  • Fuente de Audio: Fragmentos de audio de 2 segundos reproducidos desde teléfono móvil
  • Distancia de Prueba: Fuente de sonido a 35 cm del centro del sistema
  • Ángulos de Prueba: Dos ángulos objetivo de 20° y 120°
  • Número de Experimentos: 30 pruebas por ángulo, total de 60 experimentos

Métricas de Evaluación

  1. Exactitud (Accuracy): Desviación promedio entre el ángulo estimado y el ángulo real
  2. Precisión (Precision): Desviación estándar de los resultados de medición
  3. Precisión Porcentual: Precisión porcentual basada en el rango completo de 360°

Detalles de Implementación

  • Estrategia de Muestreo: Recopilación de número fijo de muestras
  • Configuración de Umbral: Umbral de intensidad de señal predefinido
  • Procesamiento de Datos: Recorte del 6% para eliminar valores atípicos
  • Visualización: Gráfico de dispersión en coordenadas polares para mostrar resultados

Resultados Experimentales

Resultados Principales

Métrica120 grados20 grados
Número de Pruebas3030
Datos Después del Recorte2626
Exactitud (grados)5.267.11
Precisión (grados)3.264.01
Precisión Porcentual98.9%98.8%

Análisis Detallado

  1. Resultados de Prueba a 120°:
    • Error promedio: 5.26°
    • Desviación estándar: 3.26°
    • Precisión: 98.9%
  2. Resultados de Prueba a 20°:
    • Error promedio: 7.11°
    • Desviación estándar: 4.01°
    • Precisión: 98.8%

Resultados Visualizados

Los resultados experimentales se presentan mediante gráficos de dispersión en coordenadas polares, mostrando:

  • Distribución concentrada de vectores en la dirección objetivo
  • Cambios en la intensidad de señal reflejados en la distancia desde el origen
  • Ligeras desviaciones causadas por ruido ambiental y diferencias en la sensibilidad del micrófono

Hallazgos Experimentales

  1. Buena Consistencia: Ambos ángulos de prueba muestran alta consistencia en la estimación de dirección
  2. Precisión Estable: Precisión superior al 98% demuestra la confiabilidad del método
  3. Rendimiento en Tiempo Real: El sistema puede responder en tiempo real a cambios en la fuente de sonido
  4. Limitaciones de Hardware: La baja frecuencia de muestreo requiere que la fuente de sonido esté relativamente cerca

Trabajo Relacionado

Métodos SSL Tradicionales

  1. Método TDOA: Calcula la diferencia de tiempo de llegada de señal entre múltiples micrófono
  2. Técnicas de Fase: Utiliza el desplazamiento de fase de señales de audio entre sensores
  3. Conformación de Haces: Utiliza matrices de micrófono basadas en alineación de señales temporales para estimar dirección
  4. Filtrado Bayesiano: Mejora la precisión pero aumenta la complejidad

Métodos Modernos

  1. Métodos de Aprendizaje Automático: Clasifican la dirección del sonido utilizando datos de señal cruda o preprocesada
  2. Filtrado de Partículas: Seguimiento en tiempo real en entornos dinámicos
  3. Comparación de Intensidad: Similar al presente artículo pero generalmente con menor precisión

Ventajas del Presente Artículo

En comparación con métodos existentes, las ventajas de este artículo son:

  • Requisitos de hardware mínimos
  • Complejidad de algoritmo mínima
  • Mejor relación costo-beneficio
  • Dificultad de despliegue más baja

Conclusiones y Discusión

Conclusiones Principales

  1. Verificación de Viabilidad: Demuestra la viabilidad de realizar estimación de dirección precisa utilizando tres micrófono y un algoritmo simple
  2. Rendimiento Excelente: Logra error de localización inferior a 6 grados y precisión del 98%
  3. Rentabilidad: Proporciona una alternativa de bajo costo a sistemas complejos tradicionales
  4. Valor Práctico: Aplicable a múltiples escenarios de aplicación práctica

Limitaciones

  1. Limitación de Distancia: Debido a la baja frecuencia de muestreo del Arduino Uno, la fuente de sonido debe estar relativamente cerca (35 cm)
  2. Requisitos Ambientales: La robustez en entornos ruidosos requiere verificación adicional
  3. Limitaciones de Hardware: Limitado por la capacidad de memoria y procesamiento del Arduino
  4. Rango de Prueba: Los experimentos se realizaron solo en entornos controlados, faltando verificación de despliegue a gran escala en aplicaciones reales

Direcciones Futuras

  1. Actualización de Hardware: Explorar microcontroladores con mayor frecuencia de muestreo y capacidad de procesamiento
  2. Optimización de Algoritmo: Mejorar el algoritmo para aumentar la robustez en entornos ruidosos
  3. Pruebas Extendidas: Realizar pruebas en más escenarios reales y condiciones de ruido
  4. Fusión de Múltiples Sensores: Integrar sensores adicionales para mejorar la precisión

Evaluación Profunda

Fortalezas

  1. Innovación Moderada pero Práctica: Aunque la innovación técnica es limitada, tiene ventajas significativas en relación costo-beneficio
  2. Diseño Experimental Razonable: Método de prueba científico, resultados confiables
  3. Alto Valor Práctico: Proporciona una solución viable para entornos con recursos limitados
  4. Contribución de Código Abierto: Proporciona código completo y planos de diseño de hardware, facilitando reproducción y mejora

Deficiencias

  1. Profundidad Técnica Limitada: El algoritmo es relativamente simple, carece de profundidad teórica
  2. Rango de Prueba Limitado: Solo pruebas en condiciones ideales, verificación insuficiente en escenarios de aplicación real
  3. Falta de Análisis Comparativo: Carece de comparación directa con otros métodos de bajo costo
  4. Análisis de Robustez Insuficiente: Análisis limitado de la capacidad de manejo de ruido, múltiples fuentes de sonido y otras situaciones complejas

Impacto

  1. Valor Educativo: Proporciona un excelente caso de estudio para enseñanza y desarrollo de prototipos
  2. Practicidad de Ingeniería: Tiene buen valor práctico en escenarios de aplicación específicos
  3. Ventaja de Costo: Proporciona una solución viable para proyectos con presupuesto limitado
  4. Significado Inspirador: Demuestra la efectividad de métodos simples bajo condiciones específicas

Escenarios de Aplicación

  1. Proyectos Educativos: Cursos universitarios y proyectos de estudiantes
  2. Desarrollo de Prototipos: Verificación rápida de conceptos y fabricación de prototipos
  3. Hogar Inteligente: Seguimiento de fuentes de sonido en espacios interiores pequeños
  4. Aplicaciones Embebidas: Sistemas embebidos con recursos limitados
  5. Proyectos DIY: Proyectos de aficionados y creadores

Referencias

El artículo cita 28 referencias relacionadas, cubriendo múltiples campos incluyendo localización de fuentes de sonido, procesamiento de señales y robótica, proporcionando una base teórica suficiente y antecedentes técnicos para la investigación.


Evaluación General: Este es un artículo de ingeniería muy práctico que, aunque tiene innovación limitada en teoría, destaca en relación costo-beneficio y practicidad. Este trabajo proporciona una solución simple, viable y económica para la estimación de dirección de fuentes de sonido, particularmente adecuada para educación, desarrollo de prototipos y escenarios de aplicación con recursos limitados.