2025-11-10T02:55:46.582245

Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength

Pour, Habibzadeh
Sound-tracking refers to the process of determining the direction from which a sound originates, making it a fundamental component of sound source localization. This capability is essential in a variety of applications, including security systems, acoustic monitoring, and speaker tracking, where accurately identifying the direction of a sound source enables real-time responses, efficient resource allocation, and improved situational awareness. While sound-tracking is closely related to localization, it specifically focuses on identifying the direction of the sound source rather than estimating its exact position in space. Despite its utility, sound-tracking systems face several challenges, such as maintaining directional accuracy and precision, along with the need for sophisticated hardware configurations and complex signal processing algorithms. This paper presents a sound-tracking method using three electret microphones. We estimate the direction of a sound source using a lightweight method that analyzes signals from three strategically placed microphones. By comparing the average power of the received signals, the system infers the most probable direction of the sound. The results indicate that the power level from each microphone effectively determines the sound source direction. Our system employs a straightforward and cost-effective hardware design, ensuring simplicity and affordability in implementation. It achieves a localization error of less than 6 degrees and a precision of 98%. Additionally, its effortless integration with various systems makes it versatile and adaptable. Consequently, this technique presents a robust and reliable solution for sound-tracking and localization, with potential applications spanning diverse domains such as security systems, smart homes, and acoustic monitoring.
academic

Stima della Direzione delle Sorgenti Sonore Utilizzando Array di Microfoni e Intensità del Segnale

Informazioni Fondamentali

  • ID Articolo: 2507.03466
  • Titolo: Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength
  • Autori: Mahdi Ali Pour (Sabancı University), Zahra Habibzadeh (University of Tehran)
  • Classificazione: cs.SD cs.SY eess.AS eess.SY
  • Data di Pubblicazione: 10 ottobre 2025 (versione arXiv)
  • Link Articolo: https://arxiv.org/abs/2507.03466
  • Link Codice: https://github.com/mahdi943/soundlocalization

Riassunto

Questo articolo propone un metodo per la stima della direzione delle sorgenti sonore basato su tre microfoni a condensatore. Il metodo analizza i segnali ricevuti da tre microfoni posizionati strategicamente, utilizzando un algoritmo leggero che confronta la potenza media dei segnali per dedurre la direzione più probabile della sorgente sonora. Il sistema impiega un design hardware semplice ed economico, realizzando un errore di localizzazione inferiore a 6 gradi e una precisione del 98%. Questa tecnologia ha un ampio potenziale applicativo in numerosi settori, tra cui sistemi di sicurezza, domotica intelligente e monitoraggio acustico.

Contesto di Ricerca e Motivazione

1. Problema da Risolvere

Questa ricerca affronta il problema del tracciamento della sorgente sonora (sound-tracking), ossia il processo di determinazione della direzione da cui proviene il suono. A differenza della localizzazione completa della sorgente sonora, il tracciamento della sorgente si concentra sull'identificazione della direzione piuttosto che sulla posizione spaziale precisa.

2. Importanza del Problema

La stima della direzione della sorgente sonora è cruciale in molteplici settori applicativi:

  • Sistemi di domotica intelligente: come Amazon Alexa e Google Assistant che utilizzano questa capacità per determinare la posizione dell'utente nella stanza
  • Sorveglianza di sicurezza: risposta in tempo reale e allocazione delle risorse
  • Robotica: operazioni di ricerca e soccorso e navigazione autonoma
  • Monitoraggio acustico: tracciamento delle sorgenti di rumore ambientale

3. Limitazioni dei Metodi Esistenti

I metodi tradizionali di localizzazione della sorgente sonora presentano i seguenti problemi:

  • Complessità hardware: richiedono array di microfoni di grandi dimensioni e processori ad alte prestazioni
  • Complessità computazionale: i metodi TDOA, beamforming e altri sono computazionalmente intensivi
  • Costi elevati: algoritmi di elaborazione dei segnali complessi e configurazioni hardware sofisticate
  • Scarsa reattività: difficoltà nel soddisfare i requisiti delle applicazioni in tempo reale

4. Motivazione della Ricerca

Gli autori desiderano sviluppare un'alternativa leggera ed economicamente vantaggiosa, utilizzando il numero minimo di componenti hardware e semplici algoritmi di elaborazione dei segnali, adatta a ambienti con risorse limitate e scenari di distribuzione rapida.

Contributi Principali

  1. Propone un metodo leggero di stima della direzione della sorgente sonora basato sull'intensità del segnale: utilizza tre microfoni e un algoritmo di somma vettoriale per il rilevamento accurato della direzione
  2. Progetta un sistema hardware a basso costo: basato su Arduino e microfoni a condensatore, riducendo significativamente i costi di implementazione
  3. Realizza prestazioni ad alta precisione: errore di localizzazione inferiore a 6 gradi e precisione del 98%
  4. Verifica l'applicabilità pratica: dimostra l'efficacia e l'affidabilità del metodo in test reali
  5. Fornisce un'implementazione open source: rilascia il codice completo e i progetti hardware

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Segnali sonori ricevuti da tre microfoni Output: Angolo di direzione e intensità del segnale della sorgente sonora Vincoli: Elaborazione in tempo reale, hardware a basso costo, algoritmo semplice

Architettura del Modello

1. Configurazione Hardware

  • Disposizione dei microfoni: tre microfoni a condensatore posizionati rispettivamente a 0°, 120° e 240°
  • Impostazione della distanza: ogni microfono a 15 cm dal centro
  • Amplificazione del segnale: utilizzo dell'amplificatore operazionale LM358 per migliorare il segnale
  • Controllore: microcontrollore Arduino Uno R3
  • Indicatore: motore servo che punta verso la direzione della sorgente rilevata

2. Flusso dell'Algoritmo

L'algoritmo principale si basa sul principio della somma vettoriale:

Algoritmo 1: Algoritmo di Localizzazione Sonora
Input: Segnale sonoro S, numero di campioni N, soglia T
Output: Angolo del suono, magnitudine del suono, posizione del motore servo

1. if S > T then
2.   foreach microfono Mi do
3.     Arrayi ← Raccogliere N campioni da S
4.     Avgi ← Media di Arrayi
5.     Vi ← Vettore polare da Avgi
6.     Ri ← Forma rettangolare di Vi
7.   end
8.   X ← Σ Ri[0]  // Somma delle componenti x
9.   Y ← Σ Ri[1]  // Somma delle componenti y
10.  ResultMag ← √(X² + Y²)
11.  ResultAngle ← atan2(Y,X)
12.  Servo ← ServoPos
13. end

3. Modello Matematico

Fase 1: Rappresentazione in Coordinate Polari I segnali dei tre microfoni sono rappresentati come vettori in coordinate polari:

  • α = (120°, PowerAvg₁) (1)
  • β = (0°, PowerAvg₂) (2)
  • γ = (240°, PowerAvg₃) (3)

Fase 2: Conversione in Coordinate Rettangolari

  • R₁ = (rα · cos(θα), rα · sin(θα)) (4)
  • R₂ = (rβ · cos(θβ), rβ · sin(θβ)) (5)
  • R₃ = (rγ · cos(θγ), rγ · sin(θγ)) (6)

Fase 3: Somma Vettoriale

  • X = Σᵢ₌₁³ Rxᵢ (7)
  • Y = Σᵢ₌₁³ Ryᵢ (8)

Fase 4: Calcolo dei Risultati

  • ResultMag = √(X² + Y²) (9)
  • ResultAngle = atan2(Y,X) (10)

Punti di Innovazione Tecnica

  1. Metodo vettoriale semplificato: evita complesse stime dei ritardi e calcoli di fase
  2. Strategia di confronto dell'intensità: utilizza direttamente la potenza del segnale anziché le differenze temporali
  3. Capacità di elaborazione in tempo reale: risposta in tempo reale a bassa frequenza di campionamento (50 Hz)
  4. Design ottimizzato per i costi: utilizza componenti economici disponibili in commercio

Configurazione Sperimentale

Dataset

  • Fonte audio: frammenti audio di 2 secondi riprodotti da telefono cellulare
  • Distanza di test: la sorgente sonora si trova a 35 cm dal centro del sistema
  • Angoli di test: due angoli target di 20° e 120°
  • Numero di esperimenti: 30 test per ogni angolo, totale 60 esperimenti

Metriche di Valutazione

  1. Accuratezza: deviazione media tra l'angolo stimato e l'angolo reale
  2. Precisione: deviazione standard dei risultati di misurazione
  3. Percentuale di precisione: percentuale di precisione basata sulla gamma completa di 360°

Dettagli di Implementazione

  • Strategia di campionamento: raccolta di un numero fisso di campioni
  • Impostazione della soglia: soglia predefinita dell'intensità del segnale
  • Elaborazione dei dati: trimming del 6% per rimuovere i valori anomali
  • Visualizzazione: grafico a dispersione in coordinate polari per visualizzare i risultati

Risultati Sperimentali

Risultati Principali

Metrica120°20°
Numero di test3030
Dati dopo trimming2626
Accuratezza (gradi)5,267,11
Precisione (gradi)3,264,01
Percentuale di precisione98,9%98,8%

Analisi Dettagliata

  1. Risultati del test a 120°:
    • Errore medio: 5,26°
    • Deviazione standard: 3,26°
    • Precisione: 98,9%
  2. Risultati del test a 20°:
    • Errore medio: 7,11°
    • Deviazione standard: 4,01°
    • Precisione: 98,8%

Risultati Visualizzati

I risultati sperimentali sono presentati tramite grafici a dispersione in coordinate polari, che mostrano:

  • Distribuzione concentrata dei vettori nella direzione target
  • Variazioni dell'intensità del segnale riflesse nella distanza dall'origine
  • Leggere deviazioni causate dal rumore ambientale e dalle differenze di sensibilità dei microfoni

Scoperte Sperimentali

  1. Buona coerenza: entrambi gli angoli di test mostrano un'elevata coerenza nella stima della direzione
  2. Precisione stabile: una precisione superiore al 98% dimostra l'affidabilità del metodo
  3. Prestazioni in tempo reale: il sistema è in grado di rispondere in tempo reale ai cambiamenti della sorgente sonora
  4. Limitazioni hardware: il basso tasso di campionamento richiede che la sorgente sonora sia relativamente vicina

Lavori Correlati

Metodi SSL Tradizionali

  1. Metodo TDOA: calcola la differenza di tempo di arrivo del segnale tra più microfoni
  2. Tecniche di fase: sfrutta lo sfasamento del segnale audio tra i sensori
  3. Beamforming: utilizza array di microfoni basati sull'allineamento temporale dei segnali per stimare la direzione
  4. Filtro bayesiano: migliora la precisione ma aumenta la complessità

Metodi Moderni

  1. Metodi di apprendimento automatico: classificano la direzione del suono utilizzando dati di segnale grezzo o preprocessato
  2. Filtro particellare: tracciamento in tempo reale in ambienti dinamici
  3. Confronto dell'intensità: simile a questo articolo ma generalmente con precisione inferiore

Vantaggi di Questo Articolo

Rispetto ai metodi esistenti, i vantaggi di questo articolo sono:

  • Requisiti hardware minimi
  • Complessità algoritmica minima
  • Migliore rapporto costo-efficacia
  • Difficoltà di distribuzione minima

Conclusioni e Discussione

Conclusioni Principali

  1. Verifica della fattibilità: dimostra la fattibilità della stima accurata della direzione utilizzando tre microfoni e un algoritmo semplice
  2. Prestazioni eccellenti: realizza un errore di localizzazione inferiore a 6 gradi e una precisione del 98%
  3. Convenienza economica: fornisce un'alternativa a basso costo ai sistemi tradizionali complessi
  4. Valore pratico: applicabile a molteplici scenari di applicazione reale

Limitazioni

  1. Limitazione della distanza: a causa del basso tasso di campionamento di Arduino Uno, la sorgente sonora deve essere relativamente vicina (35 cm)
  2. Requisiti ambientali: la robustezza in ambienti rumorosi richiede ulteriore verifica
  3. Limitazioni hardware: limitato dalla capacità di memoria e dalla potenza di elaborazione di Arduino
  4. Intervallo di test: gli esperimenti sono stati condotti solo in ambienti controllati, mancano verifiche di distribuzione su larga scala in scenari reali

Direzioni Future

  1. Aggiornamento hardware: esplorare microcontrollori con frequenza di campionamento più elevata e maggiore potenza di elaborazione
  2. Ottimizzazione dell'algoritmo: migliorare l'algoritmo per aumentare la robustezza in ambienti rumorosi
  3. Test estesi: condurre test in più scenari reali e condizioni di rumore
  4. Fusione multisensore: integrare sensori aggiuntivi per migliorare la precisione

Valutazione Approfondita

Punti di Forza

  1. Innovazione moderata ma pratica: sebbene l'innovazione tecnica sia limitata, presenta vantaggi significativi in termini di rapporto costo-efficacia
  2. Design sperimentale ragionevole: metodi di test scientifici e risultati affidabili
  3. Alto valore pratico: fornisce una soluzione fattibile per ambienti con risorse limitate
  4. Contributo open source: fornisce codice completo e progetti hardware, facilitando la riproduzione e il miglioramento

Insufficienze

  1. Profondità tecnica limitata: l'algoritmo è relativamente semplice e manca di profondità teorica
  2. Intervallo di test limitato: test solo in condizioni ideali, verifica insufficiente in scenari di applicazione reale
  3. Analisi comparativa mancante: manca il confronto diretto con altri metodi a basso costo
  4. Analisi di robustezza insufficiente: analisi limitata della capacità di gestire rumore, sorgenti multiple e altri casi complessi

Impatto

  1. Valore educativo: fornisce un eccellente caso di studio per l'insegnamento e lo sviluppo di prototipi
  2. Praticità ingegneristica: ha buon valore pratico in scenari di applicazione specifici
  3. Vantaggio di costo: fornisce una soluzione fattibile per progetti con budget limitato
  4. Significato ispiratore: dimostra l'efficacia dei metodi semplici in condizioni specifiche

Scenari Applicabili

  1. Progetti educativi: corsi universitari e progetti studenteschi
  2. Sviluppo di prototipi: verifica rapida dei concetti e prototipazione
  3. Domotica intelligente: tracciamento della sorgente sonora in interni su piccola scala
  4. Applicazioni embedded: sistemi embedded con risorse limitate
  5. Progetti DIY: progetti per appassionati e maker

Riferimenti Bibliografici

L'articolo cita 28 lavori correlati, coprendo importanti contributi in molteplici settori tra cui localizzazione della sorgente sonora, elaborazione dei segnali e robotica, fornendo una base teorica e uno sfondo tecnico sufficienti per la ricerca.


Valutazione Complessiva: Questo è un articolo di ingegneria pratica molto utile che, sebbene limitato nell'innovazione teorica, si distingue per l'eccellente rapporto costo-efficacia e praticità. Questo lavoro fornisce una soluzione semplice, fattibile ed economica per la stima della direzione della sorgente sonora, particolarmente adatta a scenari educativi, sviluppo di prototipi e applicazioni con risorse limitate.