CoDS: Enhancing Collaborative Perception in Heterogeneous Scenarios via Domain Separation
Han, Zhang, Zhang et al.
Collaborative perception has been proven to improve individual perception in autonomous driving through multi-agent interaction. Nevertheless, most methods often assume identical encoders for all agents, which does not hold true when these models are deployed in real-world applications. To realize collaborative perception in actual heterogeneous scenarios, existing methods usually align neighbor features to those of the ego vehicle, which is vulnerable to noise from domain gaps and thus fails to address feature discrepancies effectively. Moreover, they adopt transformer-based modules for domain adaptation, which causes the model inference inefficiency on mobile devices. To tackle these issues, we propose CoDS, a Collaborative perception method that leverages Domain Separation to address feature discrepancies in heterogeneous scenarios. The CoDS employs two feature alignment modules, i.e., Lightweight Spatial-Channel Resizer (LSCR) and Distribution Alignment via Domain Separation (DADS). Besides, it utilizes the Domain Alignment Mutual Information (DAMI) loss to ensure effective feature alignment. Specifically, the LSCR aligns the neighbor feature across spatial and channel dimensions using a lightweight convolutional layer. Subsequently, the DADS mitigates feature distribution discrepancy with encoder-specific and encoder-agnostic domain separation modules. The former removes domain-dependent information and the latter captures task-related information. During training, the DAMI loss maximizes the mutual information between aligned heterogeneous features to enhance the domain separation process. The CoDS employs a fully convolutional architecture, which ensures high inference efficiency. Extensive experiments demonstrate that the CoDS effectively mitigates feature discrepancies in heterogeneous scenarios and achieves a trade-off between detection accuracy and inference efficiency.
academic
CoDS: تعزيز الإدراك التعاوني في السيناريوهات غير المتجانسة عبر فصل المجال
تقترح هذه الورقة طريقة CoDS لحل مشكلة الاختلافات في الميزات في الإدراك التعاوني في السيناريوهات غير المتجانسة من خلال تقنيات فصل المجال. تستخدم CoDS معدّل مكاني-قنوي خفيف الوزن (LSCR) وموديول محاذاة التوزيع القائم على فصل المجال (DADS)، مع دمج خسارة المعلومات المتبادلة لمحاذاة المجال (DAMI)، لتحقيق محاذاة ميزات غير متجانسة فعالة. تستخدم الطريقة بنية معمارية كاملة الالتفاف، مما يضمن دقة الكشف مع تحسين كفاءة الاستدلال بشكل كبير.
تفترض طرق الإدراك التعاوني الحالية بشكل عام أن جميع الوكلاء يستخدمون نفس المشفّر، لكن في النشر الفعلي، غالباً ما تكون المركبات المختلفة والوحدات الجانبية مجهزة بتكوينات أجهزة وبرامج مختلفة، مما يؤدي إلى اختلافات في الأبعاد والتوزيع في استخراج الميزات.
بناءً على فرضية التمثيل المشترك من العلوم المعرفية وعلم الأعصاب: المعلومات المشتركة في وجهات النظر المتعددة هي الأكثر قيمة للإدراك التعاوني، بينما المعلومات الخاصة بالمشفّر تعيق الدمج الفعال.
اقتراح طريقة CoDS: أول محول إدراك تعاوني قائم على فصل المجال، يحل مشكلة الاختلافات في الميزات في السيناريوهات غير المتجانسة من خلال فصل المعلومات ذات الصلة بالمجال والمعلومات المستقلة عن المجال
تصميم وحدات LSCR و DADS:
LSCR: محاذاة أبعاد مكانية-قنوية خفيفة الوزن
DADS: آلية فصل مجال خاصة بالمشفّر ومستقلة عن المشفّر
إدخال خسارة DAMI: تعزيز تأثير فصل المجال من خلال تعظيم المعلومات المتبادلة بين الميزات المحاذاة
بنية معمارية كاملة الالتفاف: تحسين كفاءة الاستدلال بشكل كبير مقارنة بالطرق القائمة على Transformer
التحقق التجريبي الواسع: التحقق من فعالية الطريقة وكفاءتها على ثلاث مجموعات بيانات كبيرة الحجم
يتم تعريف مهمة الإدراك التعاوني غير المتجانس على النحو التالي: بالنظر إلى N وكيل، تستقبل السيارة الذاتية وتدمج ميزات الوكلاء المجاورين. في السيناريوهات غير المتجانسة، يستخدم الوكلاء المختلفون مشفّرات مختلفة F^ego_enc و F^nei_enc، مما يؤدي إلى اختلافات في الأبعاد والتوزيع في الميزات fi و fj. الهدف هو تصميم محول قابل للتوصيل والتشغيل لتخفيف الاختلافات في الميزات.
يتم استخدام مصنّف للتمييز بين أزواج العينات الموجبة (الميزات المحاذاة من نفس السيناريو) وأزواج العينات السالبة (الميزات المحاذاة من سيناريوهات مختلفة).
تُظهر تصور الميزات أن الميزات غير المتجانسة بعد معالجة CoDS تكون أكثر تشابهاً من الناحية الدلالية، وكلاهما يبرز مناطق الهدف، مما يثبت فعالية فصل المجال.
يشير تصور نتائج الكشف إلى أن CoDS يقلل بشكل كبير من الكشف الضائع مقارنة بالطرق الأخرى، مع أفضل أداء كشف.
تستشهد الورقة بـ 65 مرجعاً ذا صلة، تغطي الإدراك التعاوني والتكيف المجالي وتقدير المعلومات المتبادلة وغيرها من المجالات ذات الصلة، مع بحث أدبي شامل نسبياً.
التقييم الإجمالي: هذه ورقة عالية الجودة في مجال الإدراك التعاوني، وتقترح حلاً مبتكراً لمشكلة مهمة وعملية في السيناريوهات غير المتجانسة. يتميز التصميم بالذكاء، والتحقق التجريبي شامل، مع قيمة نظرية وعملية قوية.