2025-11-10T02:55:46.582245

Direction Estimation of Sound Sources Using Microphone Arrays and Signal Strength

Pour, Habibzadeh

Sound-tracking refers to the process of determining the direction from which a sound originates, making it a fundamental component of sound source localization. This capability is essential in a variety of applications, including security systems, acoustic monitoring, and speaker tracking, where accurately identifying the direction of a sound source enables real-time responses, efficient resource allocation, and improved situational awareness. While sound-tracking is closely related to localization, it specifically focuses on identifying the direction of the sound source rather than estimating its exact position in space. Despite its utility, sound-tracking systems face several challenges, such as maintaining directional accuracy and precision, along with the need for sophisticated hardware configurations and complex signal processing algorithms. This paper presents a sound-tracking method using three electret microphones. We estimate the direction of a sound source using a lightweight method that analyzes signals from three strategically placed microphones. By comparing the average power of the received signals, the system infers the most probable direction of the sound. The results indicate that the power level from each microphone effectively determines the sound source direction. Our system employs a straightforward and cost-effective hardware design, ensuring simplicity and affordability in implementation. It achieves a localization error of less than 6 degrees and a precision of 98%. Additionally, its effortless integration with various systems makes it versatile and adaptable. Consequently, this technique presents a robust and reliable solution for sound-tracking and localization, with potential applications spanning diverse domains such as security systems, smart homes, and acoustic monitoring.

academic

تقدير اتجاه مصادر الصوت باستخدام مصفوفات الميكروفونات وقوة الإشارة

المعلومات الأساسية

معرّف الورقة البحثية: 2507.03466
العنوان: تقدير اتجاه مصادر الصوت باستخدام مصفوفات الميكروفونات وقوة الإشارة
المؤلفون: مهدي علي پور (جامعة سابانجي)، زهرا حبيب زاده (جامعة طهران)
التصنيف: cs.SD cs.SY eess.AS eess.SY
تاريخ النشر: 10 أكتوبر 2025 (نسخة arXiv)
رابط الورقة: https://arxiv.org/abs/2507.03466
رابط الكود: https://github.com/mahdi943/soundlocalization

الملخص

تقترح هذه الورقة طريقة لتقدير اتجاه مصادر الصوت باستخدام ثلاثة ميكروفونات من نوع المكثف الكهربائي. تعمل الطريقة على تحليل الإشارات المستقبلة من خلال ثلاثة ميكروفونات موضوعة بشكل استراتيجي، وتستخدم خوارزمية خفيفة الوزن لمقارنة متوسط قوة الإشارة لاستنتاج الاتجاه الأكثر احتمالاً لمصدر الصوت. يحقق النظام تصميماً بسيطاً وفعالاً من حيث التكلفة، مع تحقيق خطأ تحديد موقع أقل من 6 درجات ودقة بنسبة 98%. تتمتع هذه التقنية بإمكانيات تطبيقية واسعة في مجالات متعددة مثل أنظمة الأمان والمنازل الذكية والمراقبة الصوتية.

خلفية البحث والدافع

1. المشكلة المراد حلها

يهدف هذا البحث إلى حل مشكلة تتبع اتجاه مصادر الصوت (sound-tracking)، أي عملية تحديد اتجاه مصدر الصوت. بخلاف تحديد موقع مصدر الصوت الكامل، يركز تتبع مصدر الصوت على تحديد اتجاه المصدر بدلاً من موقعه المكاني الدقيق.

2. أهمية المشكلة

يعتبر تقدير اتجاه مصادر الصوت حاسماً في عدة مجالات تطبيقية:

أنظمة المنازل الذكية: مثل Amazon Alexa و Google Assistant التي تستخدم هذه القدرة لتحديد موقع المستخدم داخل الغرفة
المراقبة الأمنية: الاستجابة في الوقت الفعلي وتخصيص الموارد
تكنولوجيا الروبوتات: عمليات البحث والإنقاذ والملاحة المستقلة
المراقبة الصوتية: تتبع مصادر الضوضاء البيئية

3. قيود الطرق الموجودة

تعاني الطرق التقليدية لتحديد موقع مصدر الصوت من المشاكل التالية:

تعقيد الأجهزة: تتطلب مصفوفات ميكروفونات كبيرة ومعالجات عالية الأداء
التعقيد الحسابي: طرق مثل TDOA والتشكيل الموجي كثيفة الحسابات
التكلفة العالية: خوارزميات معالجة الإشارات المعقدة والتكوينات الصعبة
ضعف الاستجابة الفورية: صعوبة تلبية متطلبات التطبيقات في الوقت الفعلي

4. دافع البحث

يسعى المؤلفون إلى تطوير بديل خفيف الوزن وفعال من حيث التكلفة، باستخدام الحد الأدنى من مكونات الأجهزة وخوارزميات معالجة إشارات بسيطة، مناسب للبيئات محدودة الموارد وسيناريوهات النشر السريع.

المساهمات الأساسية

اقتراح طريقة خفيفة الوزن لتقدير اتجاه مصادر الصوت بناءً على قوة الإشارة: استخدام ثلاثة ميكروفونات وخوارزمية جمع المتجهات لتحقيق كشف اتجاه دقيق
تصميم نظام أجهزة منخفض التكلفة: قائم على Arduino وميكروفونات المكثف الكهربائي، مما يقلل بشكل كبير من تكاليف التنفيذ
تحقيق أداء عالي الدقة: خطأ تحديد موقع أقل من 6 درجات ودقة تصل إلى 98%
التحقق من الجدوى العملية: إثبات فعالية الطريقة وموثوقيتها في الاختبارات الفعلية
توفير تنفيذ مفتوح المصدر: نشر الكود الكامل وخطط التصميم الصعب

شرح الطريقة بالتفصيل

تعريف المهمة

الإدخال: إشارات الصوت المستقبلة من ثلاثة ميكروفونات الإخراج: زاوية اتجاه مصدر الصوت وقوة الإشارة القيود: المعالجة في الوقت الفعلي، أجهزة منخفضة التكلفة، خوارزميات بسيطة

معمارية النموذج

1. التكوين الصعب

ترتيب الميكروفونات: ثلاثة ميكروفونات من نوع المكثف الكهربائي موضوعة في مواضع 0° و 120° و 240°
إعداد المسافة: كل ميكروفون على بعد 15 سم من المركز
تضخيم الإشارة: استخدام مضخم العمليات LM358 لتعزيز الإشارة
المتحكم: متحكم Arduino Uno R3 الدقيق
المؤشر: محرك سيرفو يشير إلى اتجاه مصدر الصوت المكتشف

2. تدفق الخوارزمية

تعتمد الخوارزمية الأساسية على مبدأ جمع المتجهات:

الخوارزمية 1: خوارزمية تحديد موقع الصوت
الإدخال: إشارة الصوت S، عدد العينات N، العتبة T
الإخراج: زاوية الصوت، حجم الصوت، موضع محرك السيرفو

1. إذا كان S > T إذاً
2.   لكل ميكروفون Mi قم بـ
3.     Arrayi ← جمع N عينة من S
4.     Avgi ← متوسط Arrayi
5.     Vi ← متجه قطبي من Avgi
6.     Ri ← الشكل المستطيل من Vi
7.   النهاية
8.   X ← Σ Ri[0]  // مجموع المكونات x
9.   Y ← Σ Ri[1]  // مجموع المكونات y
10.  ResultMag ← √(X² + Y²)
11.  ResultAngle ← atan2(Y,X)
12.  Servo ← ServoPos
13. النهاية

3. النموذج الرياضي

الخطوة 1: التمثيل القطبي يتم تمثيل إشارات الميكروفونات الثلاثة كمتجهات قطبية:

α = (120°, PowerAvg₁) (1)
β = (0°, PowerAvg₂) (2)
γ = (240°, PowerAvg₃) (3)

الخطوة 2: التحويل إلى الإحداثيات الديكارتية

R₁ = (rα · cos(θα), rα · sin(θα)) (4)
R₂ = (rβ · cos(θβ), rβ · sin(θβ)) (5)
R₃ = (rγ · cos(θγ), rγ · sin(θγ)) (6)

الخطوة 3: جمع المتجهات

X = Σᵢ₌₁³ Rxᵢ (7)
Y = Σᵢ₌₁³ Ryᵢ (8)

الخطوة 4: حساب النتيجة

ResultMag = √(X² + Y²) (9)
ResultAngle = atan2(Y,X) (10)

نقاط الابتكار التقني

طريقة المتجهات المبسطة: تجنب تقديرات التأخير المعقدة وحسابات الطور
استراتيجية مقارنة الشدة: استخدام قوة الإشارة مباشرة بدلاً من الفروقات الزمنية
القدرة على المعالجة في الوقت الفعلي: الاستجابة الفورية بمعدل عينات منخفض (50 هرتز)
تصميم محسّن للتكلفة: استخدام مكونات رخيصة جاهزة

إعداد التجارب

مجموعة البيانات

مصدر الصوت: مقاطع صوتية مدتها ثانيتان تُشغّل من الهاتف الذكي
مسافة الاختبار: مصدر الصوت على بعد 35 سم من مركز النظام
زوايا الاختبار: زاويتا هدف 20° و 120°
عدد التجارب: 30 اختبار لكل زاوية، إجمالي 60 تجربة

مؤشرات التقييم

الدقة (Accuracy): متوسط الانحراف بين الزاوية المقدرة والزاوية الحقيقية
الضبط (Precision): الانحراف المعياري لنتائج القياس
نسبة الدقة المئوية: الدقة بناءً على النطاق الكامل 360°

تفاصيل التنفيذ

استراتيجية العينات: جمع عدد ثابت من العينات
إعداد العتبة: عتبة قوة إشارة محددة مسبقاً
معالجة البيانات: قص بنسبة 6% لإزالة القيم الشاذة
التصور: رسوم بيانية متناثرة بالإحداثيات القطبية لعرض النتائج

نتائج التجارب

النتائج الرئيسية

المؤشر	120 درجة	20 درجة
عدد الاختبارات	30	30
البيانات بعد القص	26	26
الدقة (درجة)	5.26	7.11
الضبط (درجة)	3.26	4.01
نسبة الدقة المئوية	98.9%	98.8%

التحليل التفصيلي

نتائج اختبار 120°:
- متوسط الخطأ: 5.26°
- الانحراف المعياري: 3.26°
- الدقة: 98.9%
نتائج اختبار 20°:
- متوسط الخطأ: 7.11°
- الانحراف المعياري: 4.01°
- الدقة: 98.8%

النتائج المرئية

يتم عرض نتائج التجارب من خلال رسوم بيانية متناثرة بالإحداثيات القطبية، مما يوضح:

التركيز الجيد للمتجهات حول اتجاه الهدف
انعكاس تغيرات قوة الإشارة في المسافة من نقطة الأصل
الانحرافات الطفيفة الناجمة عن الضوضاء البيئية والاختلافات في حساسية الميكروفونات

الاستنتاجات التجريبية

اتساق جيد: يظهر كلا زاويتي الاختبار اتساقاً عالياً في تقدير الاتجاه
استقرار الدقة: تثبت الدقة التي تزيد عن 98% موثوقية الطريقة
الأداء في الوقت الفعلي: يستطيع النظام الاستجابة الفورية لتغييرات مصدر الصوت
قيود الأجهزة: يتطلب معدل العينات المنخفض أن يكون مصدر الصوت قريباً نسبياً

الأعمال ذات الصلة

طرق SSL التقليدية

طريقة TDOA: حساب الفرق في وقت وصول الإشارة بين ميكروفونات متعددة
تقنيات الطور: الاستفادة من انزياح الطور لإشارات الصوت بين المستشعرات
التشكيل الموجي: استخدام مصفوفة ميكروفونات لتقدير الاتجاه بناءً على محاذاة الإشارات الزمنية
تصفية بايز: تحسين الدقة لكن مع زيادة التعقيد

الطرق الحديثة

طرق التعلم الآلي: استخدام البيانات الخام أو المعالجة مسبقاً لتصنيف اتجاه الصوت
تصفية الجسيمات: التتبع الفوري في البيئات الديناميكية
مقارنة الشدة: مشابهة لهذه الورقة لكن عادة ما تكون الدقة أقل

مزايا هذه الورقة

مقارنة بالطرق الموجودة، تتمتع هذه الورقة بالمزايا التالية:

أقل متطلبات الأجهزة
أقل تعقيد الخوارزمية
أفضل فعالية من حيث التكلفة
أقل صعوبة في النشر

الخلاصة والنقاش

الاستنتاجات الرئيسية

التحقق من الجدوى: إثبات جدوى تقدير الاتجاه الدقيق باستخدام ثلاثة ميكروفونات وخوارزمية بسيطة
الأداء الممتاز: تحقيق خطأ تحديد موقع أقل من 6 درجات ودقة بنسبة 98%
فعالية التكلفة: توفير بديل منخفض التكلفة للأنظمة المعقدة التقليدية
القيمة العملية: الملاءمة لسيناريوهات تطبيقية متعددة

القيود

قيود المسافة: بسبب معدل العينات المنخفض لـ Arduino Uno، يجب أن يكون مصدر الصوت قريباً نسبياً (35 سم)
متطلبات البيئة: لا تزال المتانة في البيئات الصاخبة بحاجة إلى التحقق الإضافي
قيود الأجهزة: محدود بسعة ذاكرة Arduino وقدرة المعالجة
نطاق الاختبار: تم إجراء التجارب فقط في بيئة محكومة، مع نقص التحقق من النشر الفعلي على نطاق واسع

الاتجاهات المستقبلية

ترقية الأجهزة: استكشاف المتحكمات الدقيقة ذات معدلات العينات الأعلى والقدرات المعالجة الأقوى
تحسين الخوارزمية: تحسين الخوارزمية لزيادة المتانة في البيئات الصاخبة
توسيع الاختبارات: إجراء اختبارات في سيناريوهات واقعية أكثر وظروف ضوضاء متنوعة
دمج متعدد المستشعرات: دمج مستشعرات إضافية لتحسين الدقة

التقييم المتعمق

المزايا

الابتكار معتدل لكن عملي: بينما يكون الابتكار التقني محدوداً، إلا أن هناك مزايا كبيرة من حيث فعالية التكلفة
تصميم تجريبي معقول: طريقة الاختبار علمية والنتائج موثوقة
قيمة عملية عالية: توفير حل قابل للتطبيق للبيئات محدودة الموارد
مساهمة مفتوحة المصدر: توفير الكود الكامل وتصاميم الأجهزة، مما يسهل إعادة الإنتاج والتحسين

أوجه القصور

عمق تقني محدود: الخوارزمية بسيطة نسبياً وتفتقر إلى العمق النظري
نطاق الاختبار محدود: الاختبار فقط في ظروف مثالية، مع عدم كفاية التحقق من سيناريوهات التطبيق الفعلي
تحليل المقارنة مفقود: نقص المقارنة المباشرة مع طرق منخفضة التكلفة أخرى
تحليل المتانة غير كافٍ: القدرة على التعامل مع الضوضاء والمصادر المتعددة وغيرها من الحالات المعقدة

التأثير

القيمة التعليمية: توفير حالة دراسية ممتازة للتدريس والتطوير الأولي
الجدوى الهندسية: قيمة عملية جيدة جداً في سيناريوهات التطبيق المحددة
مزايا التكلفة: توفير حل قابل للتطبيق للمشاريع محدودة الميزانية
الدلالة الملهمة: إثبات فعالية الطرق البسيطة في ظروف معينة

السيناريوهات القابلة للتطبيق

المشاريع التعليمية: دورات جامعية ومشاريع الطلاب
تطوير النماذج الأولية: التحقق السريع من المفاهيم وصنع النماذج الأولية
المنازل الذكية: تتبع مصادر الصوت في الغرف الصغيرة
التطبيقات المدمجة: الأنظمة المدمجة محدودة الموارد
مشاريع DIY: مشاريع الهواة والمبدعين

المراجع

تستشهد الورقة بـ 28 مرجعاً ذا صلة، تغطي تحديد موقع مصدر الصوت ومعالجة الإشارات وتكنولوجيا الروبوتات وغيرها من المجالات المهمة، مما توفر أساساً نظرياً كافياً وخلفية تقنية للبحث.

التقييم الإجمالي: هذه ورقة بحثية هندسية عملية جداً، وعلى الرغم من محدودية الابتكار النظري، إلا أنها تتفوق في فعالية التكلفة والجدوى العملية. يوفر هذا العمل حلاً بسيطاً وقابلاً للتطبيق وفعالاً من حيث التكلفة لتقدير اتجاه مصادر الصوت، وهو مناسب بشكل خاص للسيناريوهات التعليمية وتطوير النماذج الأولية والتطبيقات محدودة الموارد.