2025-11-10T02:55:46.582245

Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength

Pour, Habibzadeh

Sound-tracking refers to the process of determining the direction from which a sound originates, making it a fundamental component of sound source localization. This capability is essential in a variety of applications, including security systems, acoustic monitoring, and speaker tracking, where accurately identifying the direction of a sound source enables real-time responses, efficient resource allocation, and improved situational awareness. While sound-tracking is closely related to localization, it specifically focuses on identifying the direction of the sound source rather than estimating its exact position in space. Despite its utility, sound-tracking systems face several challenges, such as maintaining directional accuracy and precision, along with the need for sophisticated hardware configurations and complex signal processing algorithms. This paper presents a sound-tracking method using three electret microphones. We estimate the direction of a sound source using a lightweight method that analyzes signals from three strategically placed microphones. By comparing the average power of the received signals, the system infers the most probable direction of the sound. The results indicate that the power level from each microphone effectively determines the sound source direction. Our system employs a straightforward and cost-effective hardware design, ensuring simplicity and affordability in implementation. It achieves a localization error of less than 6 degrees and a precision of 98%. Additionally, its effortless integration with various systems makes it versatile and adaptable. Consequently, this technique presents a robust and reliable solution for sound-tracking and localization, with potential applications spanning diverse domains such as security systems, smart homes, and acoustic monitoring.

academic

Estimation de la Direction des Sources Sonores Utilisant des Réseaux de Microphones et la Puissance du Signal

Informations Fondamentales

ID de l'article : 2507.03466
Titre : Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength
Auteurs : Mahdi Ali Pour (Université Sabancı), Zahra Habibzadeh (Université de Téhéran)
Classification : cs.SD cs.SY eess.AS eess.SY
Date de publication : 10 octobre 2025 (version arXiv)
Lien de l'article : https://arxiv.org/abs/2507.03466
Lien du code : https://github.com/mahdi943/soundlocalization

Résumé

Cet article propose une méthode d'estimation de la direction des sources sonores basée sur trois microphones électrets. La méthode analyse les signaux reçus par trois microphones placés stratégiquement et utilise un algorithme léger comparant la puissance moyenne des signaux pour déduire la direction la plus probable de la source sonore. Le système adopte une conception matérielle simple et rentable, réalisant une erreur de localisation inférieure à 6 degrés et une précision de 98 %. Cette technologie possède un large potentiel d'application dans les domaines de la sécurité, de la maison intelligente et de la surveillance acoustique.

Contexte et Motivation de la Recherche

1. Problème à Résoudre

Cette recherche vise à résoudre le problème du suivi de source sonore (sound-tracking), c'est-à-dire le processus de détermination de la direction d'une source sonore. Contrairement à la localisation complète de source sonore, le suivi de source sonore se concentre sur l'identification de la direction plutôt que sur la position spatiale exacte.

2. Importance du Problème

L'estimation de la direction des sources sonores est cruciale dans plusieurs domaines d'application :

Systèmes de maison intelligente : Amazon Alexa et Google Assistant utilisent cette capacité pour déterminer la localisation de l'utilisateur dans une pièce
Surveillance de sécurité : Réponse en temps réel et allocation des ressources
Robotique : Opérations de recherche et sauvetage et navigation autonome
Surveillance acoustique : Suivi des sources de bruit environnemental

3. Limitations des Méthodes Existantes

Les méthodes traditionnelles de localisation de source sonore présentent les problèmes suivants :

Complexité matérielle : Nécessite de grands réseaux de microphones et des processeurs haut de gamme
Complexité computationnelle : Les méthodes TDOA, formation de faisceaux, etc. sont intensives en calcul
Coût élevé : Algorithmes de traitement de signal complexes et configurations matérielles coûteuses
Faible temps réel : Difficile de satisfaire les exigences des applications en temps réel

4. Motivation de la Recherche

Les auteurs souhaitent développer une solution alternative légère et rentable, utilisant un nombre minimal de composants matériels et des algorithmes simples de traitement de signal, adaptée aux environnements aux ressources limitées et aux scénarios de déploiement rapide.

Contributions Principales

Proposition d'une méthode légère d'estimation de la direction des sources sonores basée sur la puissance du signal : Utilisation de trois microphones et d'un algorithme de sommation vectorielle pour une détection de direction précise
Conception d'un système matériel à faible coût : Basé sur Arduino et des microphones électrets, réduisant significativement le coût de mise en œuvre
Réalisation de performances de haute précision : Erreur de localisation inférieure à 6 degrés, précision atteignant 98 %
Vérification de l'applicabilité : Démonstration de l'efficacité et de la fiabilité de la méthode dans les tests pratiques
Fourniture d'une implémentation open-source : Publication du code complet et des plans de conception matérielle

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée : Signaux sonores reçus par trois microphones Sortie : Angle de direction et puissance du signal de la source sonore Contraintes : Traitement en temps réel, matériel à faible coût, algorithme simple

Architecture du Modèle

1. Configuration Matérielle

Disposition des microphones : Trois microphones électrets placés respectivement à 0°, 120° et 240°
Configuration de distance : Chaque microphone à 15 cm du centre
Amplification du signal : Utilisation d'un amplificateur opérationnel LM358 pour améliorer le signal
Contrôleur : Microcontrôleur Arduino Uno R3
Indicateur : Servomoteur pointant vers la direction de la source détectée

2. Flux de l'Algorithme

L'algorithme principal est basé sur le principe de sommation vectorielle :

Algorithme 1 : Algorithme de Localisation Sonore
Entrée : Signal sonore S, nombre d'échantillons N, seuil T
Sortie : Angle sonore, magnitude sonore, position du servomoteur

1. si S > T alors
2.   pour chaque microphone Mi faire
3.     Arrayi ← Collecter N échantillons de S
4.     Avgi ← Moyenne de Arrayi
5.     Vi ← Vecteur polaire de Avgi
6.     Ri ← Forme rectangulaire de Vi
7.   fin
8.   X ← Σ Ri[0]  // Somme des composantes x
9.   Y ← Σ Ri[1]  // Somme des composantes y
10.  ResultMag ← √(X² + Y²)
11.  ResultAngle ← atan2(Y,X)
12.  Servo ← ServoPos
13. fin

3. Modèle Mathématique

Étape 1 : Représentation en Coordonnées Polaires Les signaux des trois microphones sont représentés comme des vecteurs en coordonnées polaires :

α = (120°, PowerAvg₁) (1)
β = (0°, PowerAvg₂) (2)
γ = (240°, PowerAvg₃) (3)

Étape 2 : Conversion en Coordonnées Cartésiennes

R₁ = (rα · cos(θα), rα · sin(θα)) (4)
R₂ = (rβ · cos(θβ), rβ · sin(θβ)) (5)
R₃ = (rγ · cos(θγ), rγ · sin(θγ)) (6)

Étape 3 : Sommation Vectorielle

X = Σᵢ₌₁³ Rxᵢ (7)
Y = Σᵢ₌₁³ Ryᵢ (8)

Étape 4 : Calcul des Résultats

ResultMag = √(X² + Y²) (9)
ResultAngle = atan2(Y,X) (10)

Points d'Innovation Technique

Méthode vectorielle simplifiée : Évite l'estimation complexe des délais et les calculs de phase
Stratégie de comparaison d'intensité : Utilise directement la puissance du signal plutôt que les différences de temps
Capacité de traitement en temps réel : Réponse en temps réel à un taux d'échantillonnage faible (50 Hz)
Conception optimisée en coût : Utilisation de composants commerciaux peu coûteux

Configuration Expérimentale

Ensemble de Données

Source audio : Segments audio de 2 secondes lus depuis un téléphone mobile
Distance de test : Source sonore à 35 cm du centre du système
Angles de test : Deux angles cibles de 20° et 120°
Nombre d'expériences : 30 tests pour chaque angle, total de 60 expériences

Indicateurs d'Évaluation

Exactitude (Accuracy) : Écart moyen entre l'angle estimé et l'angle réel
Précision (Precision) : Écart-type des résultats de mesure
Précision en pourcentage : Précision basée sur la plage complète de 360°

Détails de Mise en Œuvre

Stratégie d'échantillonnage : Collecte d'un nombre fixe d'échantillons
Configuration du seuil : Seuil de puissance du signal prédéfini
Traitement des données : Élagage de 6 % pour éliminer les valeurs aberrantes
Visualisation : Graphique de dispersion en coordonnées polaires montrant les résultats

Résultats Expérimentaux

Résultats Principaux

Indicateur	120 degrés	20 degrés
Nombre de tests	30	30
Données après élagage	26	26
Exactitude (degrés)	5,26	7,11
Précision (degrés)	3,26	4,01
Précision en pourcentage	98,9 %	98,8 %

Analyse Détaillée

Résultats du test à 120° :
- Erreur moyenne : 5,26°
- Écart-type : 3,26°
- Précision : 98,9 %
Résultats du test à 20° :
- Erreur moyenne : 7,11°
- Écart-type : 4,01°
- Précision : 98,8 %

Résultats Visualisés

Les résultats expérimentaux sont présentés via un graphique de dispersion en coordonnées polaires, montrant :

Distribution concentrée des vecteurs dans la direction cible
Variation de la puissance du signal reflétée dans la distance par rapport à l'origine
Légères déviations causées par le bruit environnemental et les différences de sensibilité des microphones

Découvertes Expérimentales

Bonne cohérence : Les deux angles de test montrent une grande cohérence dans l'estimation de la direction
Précision stable : Une précision supérieure à 98 % démontre la fiabilité de la méthode
Performance en temps réel : Le système peut répondre en temps réel aux changements de source sonore
Limitations matérielles : Le faible taux d'échantillonnage exige que la source sonore soit relativement proche

Travaux Connexes

Méthodes SSL Traditionnelles

Méthode TDOA : Calcul de la différence de temps d'arrivée du signal entre plusieurs microphones
Techniques de phase : Utilisation du décalage de phase du signal audio entre les capteurs
Formation de faisceaux : Utilisation d'un réseau de microphones basée sur l'alignement temporel des signaux pour estimer la direction
Filtrage bayésien : Amélioration de la précision mais augmentation de la complexité

Méthodes Modernes

Méthodes d'apprentissage automatique : Classification des directions sonores utilisant des données de signal brutes ou prétraitées
Filtrage particulaire : Suivi en temps réel dans les environnements dynamiques
Comparaison d'intensité : Similaire à cet article mais généralement avec une précision inférieure

Avantages de Cet Article

Par rapport aux méthodes existantes, les avantages de cet article sont :

Exigences matérielles minimales
Complexité algorithmique minimale
Meilleur rapport coût-efficacité
Difficulté de déploiement minimale

Conclusion et Discussion

Conclusions Principales

Vérification de la faisabilité : Démontre la faisabilité de l'estimation de direction précise utilisant trois microphones et un algorithme simple
Performance exceptionnelle : Réalise une erreur de localisation inférieure à 6 degrés et une précision de 98 %
Rentabilité : Fournit une alternative à faible coût aux systèmes complexes traditionnels
Valeur pratique : Applicable à de nombreux scénarios d'application pratiques

Limitations

Limitation de distance : En raison du faible taux d'échantillonnage de l'Arduino Uno, la source sonore doit être relativement proche (35 cm)
Exigences environnementales : La robustesse dans les environnements bruyants nécessite une vérification supplémentaire
Limitations matérielles : Limité par la capacité mémoire et la puissance de traitement d'Arduino
Portée des tests : Les expériences ont été menées uniquement dans un environnement contrôlé, manquant de vérification de déploiement à grande échelle

Directions Futures

Mise à niveau matérielle : Exploration de microcontrôleurs avec des taux d'échantillonnage plus élevés et une puissance de traitement supérieure
Optimisation algorithmique : Amélioration de l'algorithme pour augmenter la robustesse dans les environnements bruyants
Tests étendus : Tests dans davantage de scénarios réels et conditions de bruit
Fusion multi-capteurs : Intégration de capteurs supplémentaires pour améliorer la précision

Évaluation Approfondie

Points Forts

Innovation modérée mais pratique : Bien que l'innovation technique soit limitée, elle présente des avantages significatifs en termes de rapport coût-efficacité
Conception expérimentale raisonnable : Méthodologie de test scientifique, résultats fiables
Valeur pratique élevée : Fournit une solution viable pour les environnements aux ressources limitées
Contribution open-source : Fourniture du code complet et des plans de conception matérielle, facilitant la reproduction et l'amélioration

Insuffisances

Profondeur technique limitée : L'algorithme est relativement simple, manquant de profondeur théorique
Portée des tests limitée : Tests uniquement dans des conditions idéales, vérification insuffisante dans les scénarios d'application réels
Analyse comparative manquante : Manque de comparaison directe avec d'autres méthodes à faible coût
Analyse de robustesse insuffisante : Capacité d'analyse limitée pour traiter les cas complexes tels que le bruit et les sources multiples

Impact

Valeur pédagogique : Fournit un excellent cas d'étude pour l'enseignement et le développement de prototypes
Applicabilité en ingénierie : Possède une excellente valeur pratique dans des scénarios d'application spécifiques
Avantage en coût : Fournit une solution viable pour les projets à budget limité
Signification inspirante : Démontre l'efficacité des méthodes simples dans des conditions spécifiques

Scénarios d'Application

Projets éducatifs : Cours universitaires et projets d'étudiants
Développement de prototypes : Vérification rapide de concepts et fabrication de prototypes
Maison intelligente : Suivi de source sonore en intérieur sur petite portée
Applications embarquées : Systèmes embarqués aux ressources limitées
Projets DIY : Projets de passionnés et de créateurs

Références Bibliographiques

L'article cite 28 références pertinentes, couvrant plusieurs domaines tels que la localisation de source sonore, le traitement de signal et la robotique, fournissant une base théorique et un contexte technique suffisants pour la recherche.

Évaluation Globale : Cet article est un travail d'ingénierie très pratique qui, bien que limité en innovation théorique, se distingue par son excellent rapport coût-efficacité et son applicabilité. Ce travail fournit une solution simple, viable et peu coûteuse pour l'estimation de la direction des sources sonores, particulièrement adaptée aux scénarios éducatifs, au développement de prototypes et aux applications aux ressources limitées.