2025-11-10T02:55:46.582245

Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength

Pour, Habibzadeh
Sound-tracking refers to the process of determining the direction from which a sound originates, making it a fundamental component of sound source localization. This capability is essential in a variety of applications, including security systems, acoustic monitoring, and speaker tracking, where accurately identifying the direction of a sound source enables real-time responses, efficient resource allocation, and improved situational awareness. While sound-tracking is closely related to localization, it specifically focuses on identifying the direction of the sound source rather than estimating its exact position in space. Despite its utility, sound-tracking systems face several challenges, such as maintaining directional accuracy and precision, along with the need for sophisticated hardware configurations and complex signal processing algorithms. This paper presents a sound-tracking method using three electret microphones. We estimate the direction of a sound source using a lightweight method that analyzes signals from three strategically placed microphones. By comparing the average power of the received signals, the system infers the most probable direction of the sound. The results indicate that the power level from each microphone effectively determines the sound source direction. Our system employs a straightforward and cost-effective hardware design, ensuring simplicity and affordability in implementation. It achieves a localization error of less than 6 degrees and a precision of 98%. Additionally, its effortless integration with various systems makes it versatile and adaptable. Consequently, this technique presents a robust and reliable solution for sound-tracking and localization, with potential applications spanning diverse domains such as security systems, smart homes, and acoustic monitoring.
academic

Estimation de la Direction des Sources Sonores Utilisant des Réseaux de Microphones et la Puissance du Signal

Informations Fondamentales

  • ID de l'article : 2507.03466
  • Titre : Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength
  • Auteurs : Mahdi Ali Pour (Université Sabancı), Zahra Habibzadeh (Université de Téhéran)
  • Classification : cs.SD cs.SY eess.AS eess.SY
  • Date de publication : 10 octobre 2025 (version arXiv)
  • Lien de l'article : https://arxiv.org/abs/2507.03466
  • Lien du code : https://github.com/mahdi943/soundlocalization

Résumé

Cet article propose une méthode d'estimation de la direction des sources sonores basée sur trois microphones électrets. La méthode analyse les signaux reçus par trois microphones placés stratégiquement et utilise un algorithme léger comparant la puissance moyenne des signaux pour déduire la direction la plus probable de la source sonore. Le système adopte une conception matérielle simple et rentable, réalisant une erreur de localisation inférieure à 6 degrés et une précision de 98 %. Cette technologie possède un large potentiel d'application dans les domaines de la sécurité, de la maison intelligente et de la surveillance acoustique.

Contexte et Motivation de la Recherche

1. Problème à Résoudre

Cette recherche vise à résoudre le problème du suivi de source sonore (sound-tracking), c'est-à-dire le processus de détermination de la direction d'une source sonore. Contrairement à la localisation complète de source sonore, le suivi de source sonore se concentre sur l'identification de la direction plutôt que sur la position spatiale exacte.

2. Importance du Problème

L'estimation de la direction des sources sonores est cruciale dans plusieurs domaines d'application :

  • Systèmes de maison intelligente : Amazon Alexa et Google Assistant utilisent cette capacité pour déterminer la localisation de l'utilisateur dans une pièce
  • Surveillance de sécurité : Réponse en temps réel et allocation des ressources
  • Robotique : Opérations de recherche et sauvetage et navigation autonome
  • Surveillance acoustique : Suivi des sources de bruit environnemental

3. Limitations des Méthodes Existantes

Les méthodes traditionnelles de localisation de source sonore présentent les problèmes suivants :

  • Complexité matérielle : Nécessite de grands réseaux de microphones et des processeurs haut de gamme
  • Complexité computationnelle : Les méthodes TDOA, formation de faisceaux, etc. sont intensives en calcul
  • Coût élevé : Algorithmes de traitement de signal complexes et configurations matérielles coûteuses
  • Faible temps réel : Difficile de satisfaire les exigences des applications en temps réel

4. Motivation de la Recherche

Les auteurs souhaitent développer une solution alternative légère et rentable, utilisant un nombre minimal de composants matériels et des algorithmes simples de traitement de signal, adaptée aux environnements aux ressources limitées et aux scénarios de déploiement rapide.

Contributions Principales

  1. Proposition d'une méthode légère d'estimation de la direction des sources sonores basée sur la puissance du signal : Utilisation de trois microphones et d'un algorithme de sommation vectorielle pour une détection de direction précise
  2. Conception d'un système matériel à faible coût : Basé sur Arduino et des microphones électrets, réduisant significativement le coût de mise en œuvre
  3. Réalisation de performances de haute précision : Erreur de localisation inférieure à 6 degrés, précision atteignant 98 %
  4. Vérification de l'applicabilité : Démonstration de l'efficacité et de la fiabilité de la méthode dans les tests pratiques
  5. Fourniture d'une implémentation open-source : Publication du code complet et des plans de conception matérielle

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée : Signaux sonores reçus par trois microphones Sortie : Angle de direction et puissance du signal de la source sonore Contraintes : Traitement en temps réel, matériel à faible coût, algorithme simple

Architecture du Modèle

1. Configuration Matérielle

  • Disposition des microphones : Trois microphones électrets placés respectivement à 0°, 120° et 240°
  • Configuration de distance : Chaque microphone à 15 cm du centre
  • Amplification du signal : Utilisation d'un amplificateur opérationnel LM358 pour améliorer le signal
  • Contrôleur : Microcontrôleur Arduino Uno R3
  • Indicateur : Servomoteur pointant vers la direction de la source détectée

2. Flux de l'Algorithme

L'algorithme principal est basé sur le principe de sommation vectorielle :

Algorithme 1 : Algorithme de Localisation Sonore
Entrée : Signal sonore S, nombre d'échantillons N, seuil T
Sortie : Angle sonore, magnitude sonore, position du servomoteur

1. si S > T alors
2.   pour chaque microphone Mi faire
3.     Arrayi ← Collecter N échantillons de S
4.     Avgi ← Moyenne de Arrayi
5.     Vi ← Vecteur polaire de Avgi
6.     Ri ← Forme rectangulaire de Vi
7.   fin
8.   X ← Σ Ri[0]  // Somme des composantes x
9.   Y ← Σ Ri[1]  // Somme des composantes y
10.  ResultMag ← √(X² + Y²)
11.  ResultAngle ← atan2(Y,X)
12.  Servo ← ServoPos
13. fin

3. Modèle Mathématique

Étape 1 : Représentation en Coordonnées Polaires Les signaux des trois microphones sont représentés comme des vecteurs en coordonnées polaires :

  • α = (120°, PowerAvg₁) (1)
  • β = (0°, PowerAvg₂) (2)
  • γ = (240°, PowerAvg₃) (3)

Étape 2 : Conversion en Coordonnées Cartésiennes

  • R₁ = (rα · cos(θα), rα · sin(θα)) (4)
  • R₂ = (rβ · cos(θβ), rβ · sin(θβ)) (5)
  • R₃ = (rγ · cos(θγ), rγ · sin(θγ)) (6)

Étape 3 : Sommation Vectorielle

  • X = Σᵢ₌₁³ Rxᵢ (7)
  • Y = Σᵢ₌₁³ Ryᵢ (8)

Étape 4 : Calcul des Résultats

  • ResultMag = √(X² + Y²) (9)
  • ResultAngle = atan2(Y,X) (10)

Points d'Innovation Technique

  1. Méthode vectorielle simplifiée : Évite l'estimation complexe des délais et les calculs de phase
  2. Stratégie de comparaison d'intensité : Utilise directement la puissance du signal plutôt que les différences de temps
  3. Capacité de traitement en temps réel : Réponse en temps réel à un taux d'échantillonnage faible (50 Hz)
  4. Conception optimisée en coût : Utilisation de composants commerciaux peu coûteux

Configuration Expérimentale

Ensemble de Données

  • Source audio : Segments audio de 2 secondes lus depuis un téléphone mobile
  • Distance de test : Source sonore à 35 cm du centre du système
  • Angles de test : Deux angles cibles de 20° et 120°
  • Nombre d'expériences : 30 tests pour chaque angle, total de 60 expériences

Indicateurs d'Évaluation

  1. Exactitude (Accuracy) : Écart moyen entre l'angle estimé et l'angle réel
  2. Précision (Precision) : Écart-type des résultats de mesure
  3. Précision en pourcentage : Précision basée sur la plage complète de 360°

Détails de Mise en Œuvre

  • Stratégie d'échantillonnage : Collecte d'un nombre fixe d'échantillons
  • Configuration du seuil : Seuil de puissance du signal prédéfini
  • Traitement des données : Élagage de 6 % pour éliminer les valeurs aberrantes
  • Visualisation : Graphique de dispersion en coordonnées polaires montrant les résultats

Résultats Expérimentaux

Résultats Principaux

Indicateur120 degrés20 degrés
Nombre de tests3030
Données après élagage2626
Exactitude (degrés)5,267,11
Précision (degrés)3,264,01
Précision en pourcentage98,9 %98,8 %

Analyse Détaillée

  1. Résultats du test à 120° :
    • Erreur moyenne : 5,26°
    • Écart-type : 3,26°
    • Précision : 98,9 %
  2. Résultats du test à 20° :
    • Erreur moyenne : 7,11°
    • Écart-type : 4,01°
    • Précision : 98,8 %

Résultats Visualisés

Les résultats expérimentaux sont présentés via un graphique de dispersion en coordonnées polaires, montrant :

  • Distribution concentrée des vecteurs dans la direction cible
  • Variation de la puissance du signal reflétée dans la distance par rapport à l'origine
  • Légères déviations causées par le bruit environnemental et les différences de sensibilité des microphones

Découvertes Expérimentales

  1. Bonne cohérence : Les deux angles de test montrent une grande cohérence dans l'estimation de la direction
  2. Précision stable : Une précision supérieure à 98 % démontre la fiabilité de la méthode
  3. Performance en temps réel : Le système peut répondre en temps réel aux changements de source sonore
  4. Limitations matérielles : Le faible taux d'échantillonnage exige que la source sonore soit relativement proche

Travaux Connexes

Méthodes SSL Traditionnelles

  1. Méthode TDOA : Calcul de la différence de temps d'arrivée du signal entre plusieurs microphones
  2. Techniques de phase : Utilisation du décalage de phase du signal audio entre les capteurs
  3. Formation de faisceaux : Utilisation d'un réseau de microphones basée sur l'alignement temporel des signaux pour estimer la direction
  4. Filtrage bayésien : Amélioration de la précision mais augmentation de la complexité

Méthodes Modernes

  1. Méthodes d'apprentissage automatique : Classification des directions sonores utilisant des données de signal brutes ou prétraitées
  2. Filtrage particulaire : Suivi en temps réel dans les environnements dynamiques
  3. Comparaison d'intensité : Similaire à cet article mais généralement avec une précision inférieure

Avantages de Cet Article

Par rapport aux méthodes existantes, les avantages de cet article sont :

  • Exigences matérielles minimales
  • Complexité algorithmique minimale
  • Meilleur rapport coût-efficacité
  • Difficulté de déploiement minimale

Conclusion et Discussion

Conclusions Principales

  1. Vérification de la faisabilité : Démontre la faisabilité de l'estimation de direction précise utilisant trois microphones et un algorithme simple
  2. Performance exceptionnelle : Réalise une erreur de localisation inférieure à 6 degrés et une précision de 98 %
  3. Rentabilité : Fournit une alternative à faible coût aux systèmes complexes traditionnels
  4. Valeur pratique : Applicable à de nombreux scénarios d'application pratiques

Limitations

  1. Limitation de distance : En raison du faible taux d'échantillonnage de l'Arduino Uno, la source sonore doit être relativement proche (35 cm)
  2. Exigences environnementales : La robustesse dans les environnements bruyants nécessite une vérification supplémentaire
  3. Limitations matérielles : Limité par la capacité mémoire et la puissance de traitement d'Arduino
  4. Portée des tests : Les expériences ont été menées uniquement dans un environnement contrôlé, manquant de vérification de déploiement à grande échelle

Directions Futures

  1. Mise à niveau matérielle : Exploration de microcontrôleurs avec des taux d'échantillonnage plus élevés et une puissance de traitement supérieure
  2. Optimisation algorithmique : Amélioration de l'algorithme pour augmenter la robustesse dans les environnements bruyants
  3. Tests étendus : Tests dans davantage de scénarios réels et conditions de bruit
  4. Fusion multi-capteurs : Intégration de capteurs supplémentaires pour améliorer la précision

Évaluation Approfondie

Points Forts

  1. Innovation modérée mais pratique : Bien que l'innovation technique soit limitée, elle présente des avantages significatifs en termes de rapport coût-efficacité
  2. Conception expérimentale raisonnable : Méthodologie de test scientifique, résultats fiables
  3. Valeur pratique élevée : Fournit une solution viable pour les environnements aux ressources limitées
  4. Contribution open-source : Fourniture du code complet et des plans de conception matérielle, facilitant la reproduction et l'amélioration

Insuffisances

  1. Profondeur technique limitée : L'algorithme est relativement simple, manquant de profondeur théorique
  2. Portée des tests limitée : Tests uniquement dans des conditions idéales, vérification insuffisante dans les scénarios d'application réels
  3. Analyse comparative manquante : Manque de comparaison directe avec d'autres méthodes à faible coût
  4. Analyse de robustesse insuffisante : Capacité d'analyse limitée pour traiter les cas complexes tels que le bruit et les sources multiples

Impact

  1. Valeur pédagogique : Fournit un excellent cas d'étude pour l'enseignement et le développement de prototypes
  2. Applicabilité en ingénierie : Possède une excellente valeur pratique dans des scénarios d'application spécifiques
  3. Avantage en coût : Fournit une solution viable pour les projets à budget limité
  4. Signification inspirante : Démontre l'efficacité des méthodes simples dans des conditions spécifiques

Scénarios d'Application

  1. Projets éducatifs : Cours universitaires et projets d'étudiants
  2. Développement de prototypes : Vérification rapide de concepts et fabrication de prototypes
  3. Maison intelligente : Suivi de source sonore en intérieur sur petite portée
  4. Applications embarquées : Systèmes embarqués aux ressources limitées
  5. Projets DIY : Projets de passionnés et de créateurs

Références Bibliographiques

L'article cite 28 références pertinentes, couvrant plusieurs domaines tels que la localisation de source sonore, le traitement de signal et la robotique, fournissant une base théorique et un contexte technique suffisants pour la recherche.


Évaluation Globale : Cet article est un travail d'ingénierie très pratique qui, bien que limité en innovation théorique, se distingue par son excellent rapport coût-efficacité et son applicabilité. Ce travail fournit une solution simple, viable et peu coûteuse pour l'estimation de la direction des sources sonores, particulièrement adaptée aux scénarios éducatifs, au développement de prototypes et aux applications aux ressources limitées.