2025-11-10T02:55:46.582245

Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength

Pour, Habibzadeh

Sound-tracking refers to the process of determining the direction from which a sound originates, making it a fundamental component of sound source localization. This capability is essential in a variety of applications, including security systems, acoustic monitoring, and speaker tracking, where accurately identifying the direction of a sound source enables real-time responses, efficient resource allocation, and improved situational awareness. While sound-tracking is closely related to localization, it specifically focuses on identifying the direction of the sound source rather than estimating its exact position in space. Despite its utility, sound-tracking systems face several challenges, such as maintaining directional accuracy and precision, along with the need for sophisticated hardware configurations and complex signal processing algorithms. This paper presents a sound-tracking method using three electret microphones. We estimate the direction of a sound source using a lightweight method that analyzes signals from three strategically placed microphones. By comparing the average power of the received signals, the system infers the most probable direction of the sound. The results indicate that the power level from each microphone effectively determines the sound source direction. Our system employs a straightforward and cost-effective hardware design, ensuring simplicity and affordability in implementation. It achieves a localization error of less than 6 degrees and a precision of 98%. Additionally, its effortless integration with various systems makes it versatile and adaptable. Consequently, this technique presents a robust and reliable solution for sound-tracking and localization, with potential applications spanning diverse domains such as security systems, smart homes, and acoustic monitoring.

academic

Estimación de la Dirección de Fuentes de Sonido Utilizando Matrices de Micrófono e Intensidad de Señal

Información Básica

ID del Artículo: 2507.03466
Título: Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength
Autores: Mahdi Ali Pour (Universidad Sabancı), Zahra Habibzadeh (Universidad de Teherán)
Clasificación: cs.SD cs.SY eess.AS eess.SY
Fecha de Publicación: 10 de octubre de 2025 (versión arXiv)
Enlace del Artículo: https://arxiv.org/abs/2507.03466
Enlace del Código: https://github.com/mahdi943/soundlocalization

Resumen

Este artículo propone un método de estimación de la dirección de fuentes de sonido basado en tres micrófono de condensador. El método analiza las señales recibidas por tres micrófono estratégicamente colocados, utilizando un algoritmo ligero que compara la potencia promedio de las señales para inferir la dirección más probable de la fuente de sonido. El sistema implementa un diseño de hardware simple y rentable, logrando un error de localización inferior a 6 grados y una precisión del 98%. Esta técnica tiene un amplio potencial de aplicación en múltiples campos como sistemas de seguridad, hogares inteligentes y monitoreo acústico.

Antecedentes de Investigación y Motivación

1. Problema a Resolver

Esta investigación aborda el problema del seguimiento de fuentes de sonido (sound-tracking), es decir, el proceso de determinar la dirección de la fuente de sonido. A diferencia de la localización completa de fuentes de sonido, el seguimiento de fuentes de sonido se enfoca en identificar la dirección de la fuente en lugar de su ubicación espacial exacta.

2. Importancia del Problema

La estimación de la dirección de fuentes de sonido es crucial en múltiples campos de aplicación:

Sistemas de Hogar Inteligente: Como Amazon Alexa y Google Assistant utilizan esta capacidad para determinar la ubicación del usuario en la habitación
Vigilancia de Seguridad: Respuesta en tiempo real y asignación de recursos
Robótica: Operaciones de búsqueda y rescate y navegación autónoma
Monitoreo Acústico: Seguimiento de fuentes de ruido ambiental

3. Limitaciones de Métodos Existentes

Los métodos tradicionales de localización de fuentes de sonido presentan los siguientes problemas:

Complejidad de Hardware: Requieren matrices de micrófono grandes y procesadores de alta gama
Complejidad Computacional: Los métodos TDOA, conformación de haces y otros son computacionalmente intensivos
Costo Elevado: Algoritmos complejos de procesamiento de señales y configuraciones de hardware costosas
Baja Capacidad en Tiempo Real: Dificultad para satisfacer requisitos de aplicaciones en tiempo real

4. Motivación de la Investigación

Los autores desean desarrollar una alternativa ligera y rentable que utilice el mínimo de componentes de hardware y algoritmos simples de procesamiento de señales, adecuada para entornos con recursos limitados y escenarios de despliegue rápido.

Contribuciones Principales

Propone un método ligero de estimación de dirección de fuentes de sonido basado en intensidad de señal: Utiliza tres micrófono y un algoritmo de suma vectorial para lograr detección de dirección precisa
Diseña un sistema de hardware de bajo costo: Basado en Arduino y micrófono de condensador, reduciendo significativamente el costo de implementación
Logra rendimiento de alta precisión: Error de localización inferior a 6 grados y precisión del 98%
Verifica la practicidad: Demuestra la efectividad y confiabilidad del método en pruebas reales
Proporciona implementación de código abierto: Publica el código completo y los planos de diseño de hardware

Explicación Detallada del Método

Definición de la Tarea

Entrada: Señales de sonido recibidas por tres micrófono Salida: Ángulo de dirección de la fuente de sonido e intensidad de señal Restricciones: Procesamiento en tiempo real, hardware de bajo costo, algoritmo simple

Arquitectura del Modelo

1. Configuración de Hardware

Disposición de Micrófono: Tres micrófono de condensador colocados en posiciones de 0°, 120° y 240°
Configuración de Distancia: Cada micrófono a 15 cm del centro
Amplificación de Señal: Utiliza amplificador operacional LM358 para mejorar la señal
Controlador: Microcontrolador Arduino Uno R3
Indicador: Motor servo que apunta hacia la dirección de la fuente de sonido detectada

2. Flujo del Algoritmo

El algoritmo principal se basa en el principio de suma vectorial:

Algoritmo 1: Algoritmo de Localización de Sonido
Entrada: Señal de sonido S, número de muestras N, umbral T
Salida: Ángulo de sonido, magnitud de sonido, posición del motor servo

1. si S > T entonces
2.   para cada micrófono Mi hacer
3.     Arrayi ← Recopilar N muestras de S
4.     Avgi ← Promedio de Arrayi
5.     Vi ← Vector polar de Avgi
6.     Ri ← Forma rectangular de Vi
7.   fin
8.   X ← Σ Ri[0]  // Suma de componentes x
9.   Y ← Σ Ri[1]  // Suma de componentes y
10.  ResultMag ← √(X² + Y²)
11.  ResultAngle ← atan2(Y,X)
12.  Servo ← ServoPos
13. fin

3. Modelo Matemático

Paso 1: Representación en Coordenadas Polares Las señales de los tres micrófono se representan como vectores en coordenadas polares:

α = (120°, PowerAvg₁) (1)
β = (0°, PowerAvg₂) (2)
γ = (240°, PowerAvg₃) (3)

Paso 2: Conversión a Coordenadas Rectangulares

R₁ = (rα · cos(θα), rα · sin(θα)) (4)
R₂ = (rβ · cos(θβ), rβ · sin(θβ)) (5)
R₃ = (rγ · cos(θγ), rγ · sin(θγ)) (6)

Paso 3: Suma Vectorial

X = Σᵢ₌₁³ Rxᵢ (7)
Y = Σᵢ₌₁³ Ryᵢ (8)

Paso 4: Cálculo de Resultados

ResultMag = √(X² + Y²) (9)
ResultAngle = atan2(Y,X) (10)

Puntos de Innovación Técnica

Método Vectorial Simplificado: Evita estimaciones complejas de retardo temporal y cálculos de fase
Estrategia de Comparación de Intensidad: Utiliza directamente la potencia de señal en lugar de diferencias de tiempo
Capacidad de Procesamiento en Tiempo Real: Respuesta en tiempo real con baja frecuencia de muestreo (50 Hz)
Diseño Optimizado en Costo: Utiliza componentes comerciales económicos

Configuración Experimental

Conjunto de Datos

Fuente de Audio: Fragmentos de audio de 2 segundos reproducidos desde teléfono móvil
Distancia de Prueba: Fuente de sonido a 35 cm del centro del sistema
Ángulos de Prueba: Dos ángulos objetivo de 20° y 120°
Número de Experimentos: 30 pruebas por ángulo, total de 60 experimentos

Métricas de Evaluación

Exactitud (Accuracy): Desviación promedio entre el ángulo estimado y el ángulo real
Precisión (Precision): Desviación estándar de los resultados de medición
Precisión Porcentual: Precisión porcentual basada en el rango completo de 360°

Detalles de Implementación

Estrategia de Muestreo: Recopilación de número fijo de muestras
Configuración de Umbral: Umbral de intensidad de señal predefinido
Procesamiento de Datos: Recorte del 6% para eliminar valores atípicos
Visualización: Gráfico de dispersión en coordenadas polares para mostrar resultados

Resultados Experimentales

Resultados Principales

Métrica	120 grados	20 grados
Número de Pruebas	30	30
Datos Después del Recorte	26	26
Exactitud (grados)	5.26	7.11
Precisión (grados)	3.26	4.01
Precisión Porcentual	98.9%	98.8%

Análisis Detallado

Resultados de Prueba a 120°:
- Error promedio: 5.26°
- Desviación estándar: 3.26°
- Precisión: 98.9%
Resultados de Prueba a 20°:
- Error promedio: 7.11°
- Desviación estándar: 4.01°
- Precisión: 98.8%

Resultados Visualizados

Los resultados experimentales se presentan mediante gráficos de dispersión en coordenadas polares, mostrando:

Distribución concentrada de vectores en la dirección objetivo
Cambios en la intensidad de señal reflejados en la distancia desde el origen
Ligeras desviaciones causadas por ruido ambiental y diferencias en la sensibilidad del micrófono

Hallazgos Experimentales

Buena Consistencia: Ambos ángulos de prueba muestran alta consistencia en la estimación de dirección
Precisión Estable: Precisión superior al 98% demuestra la confiabilidad del método
Rendimiento en Tiempo Real: El sistema puede responder en tiempo real a cambios en la fuente de sonido
Limitaciones de Hardware: La baja frecuencia de muestreo requiere que la fuente de sonido esté relativamente cerca

Trabajo Relacionado

Métodos SSL Tradicionales

Método TDOA: Calcula la diferencia de tiempo de llegada de señal entre múltiples micrófono
Técnicas de Fase: Utiliza el desplazamiento de fase de señales de audio entre sensores
Conformación de Haces: Utiliza matrices de micrófono basadas en alineación de señales temporales para estimar dirección
Filtrado Bayesiano: Mejora la precisión pero aumenta la complejidad

Métodos Modernos

Métodos de Aprendizaje Automático: Clasifican la dirección del sonido utilizando datos de señal cruda o preprocesada
Filtrado de Partículas: Seguimiento en tiempo real en entornos dinámicos
Comparación de Intensidad: Similar al presente artículo pero generalmente con menor precisión

Ventajas del Presente Artículo

En comparación con métodos existentes, las ventajas de este artículo son:

Requisitos de hardware mínimos
Complejidad de algoritmo mínima
Mejor relación costo-beneficio
Dificultad de despliegue más baja

Conclusiones y Discusión

Conclusiones Principales

Verificación de Viabilidad: Demuestra la viabilidad de realizar estimación de dirección precisa utilizando tres micrófono y un algoritmo simple
Rendimiento Excelente: Logra error de localización inferior a 6 grados y precisión del 98%
Rentabilidad: Proporciona una alternativa de bajo costo a sistemas complejos tradicionales
Valor Práctico: Aplicable a múltiples escenarios de aplicación práctica

Limitaciones

Limitación de Distancia: Debido a la baja frecuencia de muestreo del Arduino Uno, la fuente de sonido debe estar relativamente cerca (35 cm)
Requisitos Ambientales: La robustez en entornos ruidosos requiere verificación adicional
Limitaciones de Hardware: Limitado por la capacidad de memoria y procesamiento del Arduino
Rango de Prueba: Los experimentos se realizaron solo en entornos controlados, faltando verificación de despliegue a gran escala en aplicaciones reales

Direcciones Futuras

Actualización de Hardware: Explorar microcontroladores con mayor frecuencia de muestreo y capacidad de procesamiento
Optimización de Algoritmo: Mejorar el algoritmo para aumentar la robustez en entornos ruidosos
Pruebas Extendidas: Realizar pruebas en más escenarios reales y condiciones de ruido
Fusión de Múltiples Sensores: Integrar sensores adicionales para mejorar la precisión

Evaluación Profunda

Fortalezas

Innovación Moderada pero Práctica: Aunque la innovación técnica es limitada, tiene ventajas significativas en relación costo-beneficio
Diseño Experimental Razonable: Método de prueba científico, resultados confiables
Alto Valor Práctico: Proporciona una solución viable para entornos con recursos limitados
Contribución de Código Abierto: Proporciona código completo y planos de diseño de hardware, facilitando reproducción y mejora

Deficiencias

Profundidad Técnica Limitada: El algoritmo es relativamente simple, carece de profundidad teórica
Rango de Prueba Limitado: Solo pruebas en condiciones ideales, verificación insuficiente en escenarios de aplicación real
Falta de Análisis Comparativo: Carece de comparación directa con otros métodos de bajo costo
Análisis de Robustez Insuficiente: Análisis limitado de la capacidad de manejo de ruido, múltiples fuentes de sonido y otras situaciones complejas

Impacto

Valor Educativo: Proporciona un excelente caso de estudio para enseñanza y desarrollo de prototipos
Practicidad de Ingeniería: Tiene buen valor práctico en escenarios de aplicación específicos
Ventaja de Costo: Proporciona una solución viable para proyectos con presupuesto limitado
Significado Inspirador: Demuestra la efectividad de métodos simples bajo condiciones específicas

Escenarios de Aplicación

Proyectos Educativos: Cursos universitarios y proyectos de estudiantes
Desarrollo de Prototipos: Verificación rápida de conceptos y fabricación de prototipos
Hogar Inteligente: Seguimiento de fuentes de sonido en espacios interiores pequeños
Aplicaciones Embebidas: Sistemas embebidos con recursos limitados
Proyectos DIY: Proyectos de aficionados y creadores

Referencias

El artículo cita 28 referencias relacionadas, cubriendo múltiples campos incluyendo localización de fuentes de sonido, procesamiento de señales y robótica, proporcionando una base teórica suficiente y antecedentes técnicos para la investigación.

Evaluación General: Este es un artículo de ingeniería muy práctico que, aunque tiene innovación limitada en teoría, destaca en relación costo-beneficio y practicidad. Este trabajo proporciona una solución simple, viable y económica para la estimación de dirección de fuentes de sonido, particularmente adecuada para educación, desarrollo de prototipos y escenarios de aplicación con recursos limitados.