2025-11-13T14:31:10.402139

Out-of-Distribution Detection in LiDAR Semantic Segmentation Using Epistemic Uncertainty from Hierarchical GMMs

Miandashti, Brenner
In addition to accurate scene understanding through precise semantic segmentation of LiDAR point clouds, detecting out-of-distribution (OOD) objects, instances not encountered during training, is essential to prevent the incorrect assignment of unknown objects to known classes. While supervised OOD detection methods depend on auxiliary OOD datasets, unsupervised methods avoid this requirement but typically rely on predictive entropy, the entropy of the predictive distribution obtained by averaging over an ensemble or multiple posterior weight samples. However, these methods often conflate epistemic (model) and aleatoric (data) uncertainties, misclassifying ambiguous in distribution regions as OOD. To address this issue, we present an unsupervised OOD detection approach that employs epistemic uncertainty derived from hierarchical Bayesian modeling of Gaussian Mixture Model (GMM) parameters in the feature space of a deep neural network. Without requiring auxiliary data or additional training stages, our approach outperforms existing uncertainty-based methods on the SemanticKITTI dataset, achieving an 18\% improvement in AUROC, 22\% increase in AUPRC, and 36\% reduction in FPR95 (from 76\% to 40\%), compared to the predictive entropy approach used in prior works.
academic

LiDAR सिमेंटिक सेगमेंटेशन में पदानुक्रमित GMM से एपिस्टेमिक अनिश्चितता का उपयोग करके आउट-ऑफ-डिस्ट्रिब्यूशन डिटेक्शन

मूल जानकारी

  • पेपर ID: 2510.08631
  • शीर्षक: LiDAR सिमेंटिक सेगमेंटेशन में पदानुक्रमित GMM से एपिस्टेमिक अनिश्चितता का उपयोग करके आउट-ऑफ-डिस्ट्रिब्यूशन डिटेक्शन
  • लेखक: Hanieh Shojaei Miandashti, Claus Brenner (लीबनिज विश्वविद्यालय हैनोवर)
  • वर्गीकरण: cs.CV, cs.LG
  • प्रकाशन समय: 8 अक्टूबर 2025 (arXiv प्रीप्रिंट)
  • पेपर लिंक: https://arxiv.org/abs/2510.08631

सारांश

यह पेपर LiDAR सिमेंटिक सेगमेंटेशन में आउट-ऑफ-डिस्ट्रिब्यूशन (OOD) डिटेक्शन के लिए पदानुक्रमित बायेसियन गॉसियन मिश्रण मॉडल (GMM) पैरामीटर मॉडलिंग पर आधारित एपिस्टेमिक अनिश्चितता अनुमान की एक विधि प्रस्तावित करता है। यह विधि सहायक डेटा या अतिरिक्त प्रशिक्षण चरण की आवश्यकता नहीं है और SemanticKITTI डेटासेट पर मौजूदा पूर्वानुमान एन्ट्रॉपी-आधारित विधियों की तुलना में महत्वपूर्ण सुधार प्राप्त करता है: AUROC में 18% सुधार, AUPRC में 22% सुधार, और FPR95 को 76% से 40% तक कम करना।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या परिभाषा

स्वायत्त ड्राइविंग जैसे सुरक्षा-महत्वपूर्ण अनुप्रयोगों में, LiDAR सिमेंटिक सेगमेंटेशन को न केवल ज्ञात दृश्यों को सटीक रूप से समझने की आवश्यकता है, बल्कि प्रशिक्षण के समय अदेखे आउट-ऑफ-डिस्ट्रिब्यूशन (OOD) वस्तुओं की पहचान करने में भी सक्षम होना चाहिए, ताकि अज्ञात वस्तुओं को ज्ञात वर्गों में गलत तरीके से वर्गीकृत करने से बचा जा सके।

समस्या की महत्ता

  1. सुरक्षा आवश्यकताएं: स्वायत्त ड्राइविंग प्रणालियों को सड़क पर असामान्य वस्तुओं (जैसे कचरा डिब्बे, संकेत, जानवर आदि) की पहचान करनी चाहिए
  2. विश्वसनीयता की मांग: गहन मॉडल अक्सर OOD इनपुट के लिए अत्यधिक आत्मविश्वास के साथ लेकिन गलत पूर्वानुमान देते हैं
  3. व्यावहारिक विचार: वास्तविक वातावरण में प्रशिक्षण डेटासेट द्वारा कवर न किए गए बड़ी संख्या में वस्तु वर्ग मौजूद हैं

मौजूदा विधियों की सीमाएं

  1. पर्यवेक्षित विधियां: सहायक OOD डेटासेट पर निर्भर करती हैं, जो LiDAR क्षेत्र में प्राप्त करना कठिन है
  2. अनुपर्यवेक्षित विधियां: मुख्य रूप से पूर्वानुमान एन्ट्रॉपी पर निर्भर करती हैं, लेकिन एपिस्टेमिक (ज्ञान संबंधी) और एलिएटोरिक (आकस्मिक) अनिश्चितता को भ्रमित करती हैं
  3. अनिश्चितता भ्रम: पूर्वानुमान एन्ट्रॉपी मॉडल अनिश्चितता और डेटा शोर को मिश्रित करता है, जिससे अस्पष्ट वितरण-भीतर क्षेत्रों को OOD के रूप में गलत तरीके से वर्गीकृत किया जाता है

मुख्य योगदान

  1. एपिस्टेमिक अनिश्चितता पर आधारित OOD डिटेक्शन विधि प्रस्तावित की: पदानुक्रमित बायेसियन मॉडलिंग के माध्यम से GMM पैरामीटर से एपिस्टेमिक और एलिएटोरिक अनिश्चितता को अलग किया
  2. अनुपर्यवेक्षित ढांचा: सहायक OOD डेटा या अतिरिक्त प्रशिक्षण चरण की आवश्यकता नहीं है, जिससे व्यावहारिकता बढ़ती है
  3. उल्लेखनीय प्रदर्शन सुधार: SemanticKITTI डेटासेट पर मौजूदा विधियों को काफी हद तक पार किया
  4. सैद्धांतिक योगदान: साबित किया कि एपिस्टेमिक अनिश्चितता OOD डिटेक्शन में पूर्वानुमान एन्ट्रॉपी से बेहतर है

विधि विवरण

कार्य परिभाषा

LiDAR बिंदु बादल के दूरी दृश्य प्रतिनिधित्व को देखते हुए, लक्ष्य है:

  1. पिक्सेल-स्तरीय सिमेंटिक सेगमेंटेशन करना
  2. OOD से संबंधित पिक्सेल क्षेत्रों की पहचान करना
  3. पूर्वानुमान की अनिश्चितता को मापना

मॉडल आर्किटेक्चर

1. जनरेटिव-डिस्क्रिमिनेटिव हाइब्रिड ढांचा

GMMSeg आर्किटेक्चर पर आधारित, गहन तंत्रिका नेटवर्क का उपयोग करके पिक्सेल-स्तरीय विशेषता प्रतिनिधित्व z ∈ R^D निकाला जाता है, फिर विशेषता स्थान में प्रत्येक सिमेंटिक वर्ग c के लिए वर्ग-सशर्त गॉसियन मिश्रण वितरण को मॉडल किया जाता है:

p(z | c) = Σ(k=1 to K) π_k^(c) N(z | μ_k^(c), Σ_k^(c))

जहां π_k^(c), μ_k^(c), Σ_k^(c) क्रमशः k-वें गॉसियन घटक के मिश्रण भार, माध्य और सहप्रसरण का प्रतिनिधित्व करते हैं।

2. पदानुक्रमित बायेसियन मॉडलिंग

मुख्य नवाचार GMM पैरामीटर के लिए पदानुक्रमित बायेसियन मॉडलिंग में निहित है:

  • पूर्व वितरण: प्रत्येक गॉसियन घटक के माध्य और विचरण के लिए गॉसियन-व्युत्क्रम गामा संयुग्म पूर्व सेट किए जाते हैं
  • पश्च अद्यतन: प्रशिक्षण डेटा के आधार पर पैरामीटर के पश्च वितरण को अद्यतन किया जाता है
  • पैरामीटर नमूनाकरण: अनुमान समय पर पश्च वितरण से कई GMM पैरामीटर सेट नमूना किए जाते हैं

विशेष रूप से:

μ_k^(c) ~ N(μ_0, σ_k^2(c)/κ_0)
σ_k^2(c) ~ Inv-Gamma(α_0, β_0)

3. एपिस्टेमिक अनिश्चितता अनुमान

n GMM पैरामीटर सेट नमूना करके, प्रत्येक पिक्सेल के लिए वर्ग पूर्वानुमान की आवृत्ति वितरण की गणना की जाती है, फिर एन्ट्रॉपी की गणना की जाती है:

H[y | z] = -Σ(c=1 to C) p̄_c log p̄_c

जहां p̄_c = (1/n)Σ(i=1 to n)Iy^(i) = c वर्ग c की अनुभवजन्य संभावना का प्रतिनिधित्व करता है।

तकनीकी नवाचार बिंदु

  1. अनिश्चितता पृथक्करण: पैरामीटर नमूनाकरण के माध्यम से सीधे एपिस्टेमिक अनिश्चितता का अनुमान लगाया जाता है, पूर्वानुमान एन्ट्रॉपी में दोनों प्रकार की अनिश्चितता के भ्रम से बचा जाता है
  2. पुनः प्रशिक्षण की आवश्यकता नहीं: मौजूदा सेगमेंटेशन नेटवर्क की विशेषता स्थान का उपयोग करके, GMM मॉडलिंग के माध्यम से अनिश्चितता अनुमान प्राप्त किया जाता है
  3. सैद्धांतिक आधार: पारस्परिक सूचना सिद्धांत पर आधारित, एपिस्टेमिक अनिश्चितता को Iy; θ | x = H(p(y|x)) - E_θH(p(y|x,θ)) के रूप में परिभाषित किया जाता है

प्रयोगात्मक सेटअप

डेटासेट

  • SemanticKITTI: 19 सिमेंटिक वर्गों वाला LiDAR बिंदु बादल डेटासेट
  • OOD वर्ग: डेटासेट में outlier वर्ग का उपयोग OOD नमूनों के रूप में किया जाता है (कचरा डिब्बे, संकेत, जानवर आदि)
  • इनपुट प्रारूप: 64×1024×5 दूरी दृश्य छवि (x, y, z निर्देशांक, तीव्रता, दूरी)
  • विशेषता आयाम: SalsaNext बैकबोन नेटवर्क का उपयोग करके 32-आयामी विशेषताएं निकाली जाती हैं

मूल्यांकन मेट्रिक्स

  • AUROC: ROC वक्र के अंतर्गत क्षेत्र, समग्र वर्गीकरण प्रदर्शन को मापता है
  • AUPRC: सटीकता-रिकॉल वक्र के अंतर्गत क्षेत्र, असंतुलित वर्ग परिदृश्य के लिए उपयुक्त
  • FPR95: 95% सच सकारात्मक दर पर झूठी सकारात्मक दर, सुरक्षा को मापता है
  • mIoU: सिमेंटिक सेगमेंटेशन के लिए औसत प्रतिच्छेदन-संघ

तुलनात्मक विधियां

  • MSP: अधिकतम Softmax संभावना
  • ODIN: तापमान स्केलिंग और इनपुट विक्षोभ विधि
  • MC Dropout: मोंटे कार्लो Dropout
  • Deep Ensembles (DE): गहन समूह
  • GMMSeg: मूल GMM सेगमेंटेशन विधि (अनिश्चितता मॉडलिंग के बिना)

कार्यान्वयन विवरण

  • बैकबोन नेटवर्क: SalsaNext
  • GMM घटक संख्या: प्रति वर्ग 2 गॉसियन घटक
  • नमूना संख्या: 20 GMM पैरामीटर नमूने
  • थ्रेसहोल्ड रणनीति: अनुपर्यवेक्षित प्रतिशतक थ्रेसहोल्ड (शीर्ष 5%)

प्रयोगात्मक परिणाम

मुख्य परिणाम

विधिAUROC (%)AUPRC (%)FPR95 (%)mIoU (%)
MSP70.4110.9076.0056.37
ODIN73.7412.4575.5456.37
MC Dropout73.6413.6575.9257.15
Deep Ensembles73.0316.1476.4857.17
GMMSeg87.6226.1448.8457.60
प्रस्तावित विधि91.0637.6740.1457.71

मुख्य निष्कर्ष

  1. उल्लेखनीय प्रदर्शन सुधार: सर्वश्रेष्ठ baseline (GMMSeg) की तुलना में, AUROC में 3.44% सुधार, AUPRC में 11.53% सुधार
  2. सुरक्षा में सुधार: Deep Ensembles की तुलना में FPR95 76.48% से 40.14% तक कम हुआ
  3. सेगमेंटेशन प्रदर्शन: मतदान तंत्र के माध्यम से, सिमेंटिक सेगमेंटेशन सटीकता में भी मामूली सुधार

गुणात्मक विश्लेषण

दृश्य तुलना के माध्यम से पाया गया:

  • प्रस्तावित विधि: वास्तविक OOD वस्तुओं (संकेत, कचरा डिब्बे आदि) की सटीक पहचान करता है, अस्पष्ट ID क्षेत्रों के लिए उचित अनिश्चितता बनाए रखता है
  • Deep Ensembles: सिमेंटिक सीमाओं पर बहुत अधिक झूठी सकारात्मकता उत्पन्न करता है, वास्तविक OOD वस्तुओं को मिस करता है

अनिश्चितता वितरण विश्लेषण

पूर्वानुमान एन्ट्रॉपी और एपिस्टेमिक अनिश्चितता के वितरण की तुलना:

  • पूर्वानुमान एन्ट्रॉपी में ID और OOD नमूनों के बीच बड़ी मात्रा में ओवरलैप होता है
  • एपिस्टेमिक अनिश्चितता अधिक स्पष्ट पृथक्करण प्राप्त करता है, ID नमूने कम अनिश्चितता क्षेत्र में केंद्रित होते हैं

संबंधित कार्य

OOD डिटेक्शन विधियों का वर्गीकरण

  1. पर्यवेक्षित विधियां: outlier exposure प्रशिक्षण के लिए सहायक डेटासेट पर निर्भर करती हैं
  2. अनुपर्यवेक्षित विधियां: अनिश्चितता अनुमान पर आधारित, जिसमें निर्धारक विधियां (MSP, ODIN) और बायेसियन विधियां (MC Dropout, Deep Ensembles) शामिल हैं

अनिश्चितता अनुमान

  • पूर्वानुमान एन्ट्रॉपी विधि: एपिस्टेमिक और एलिएटोरिक अनिश्चितता को मिश्रित करता है
  • पारस्परिक सूचना विधि: सैद्धांतिक रूप से दोनों प्रकार की अनिश्चितता को अलग कर सकता है, लेकिन गहन नेटवर्क में सटीक गणना करना कठिन है
  • इस पेपर का योगदान: GMM पैरामीटर की बायेसियन मॉडलिंग के माध्यम से एपिस्टेमिक अनिश्चितता का सीधा अनुमान प्राप्त करना

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. एपिस्टेमिक अनिश्चितता OOD डिटेक्शन में पूर्वानुमान एन्ट्रॉपी से अधिक प्रभावी है
  2. पदानुक्रमित बायेसियन GMM मॉडलिंग एपिस्टेमिक अनिश्चितता अनुमान के लिए एक व्यावहारिक विधि प्रदान करता है
  3. अनुपर्यवेक्षित ढांचा सहायक डेटा पर निर्भरता से बचता है

सीमाएं

  1. झूठी सकारात्मकता समस्या: सिमेंटिक रूप से अस्पष्ट या गलत सेगमेंटेशन वाले ID क्षेत्रों के लिए अभी भी उच्च अनिश्चितता उत्पन्न हो सकती है
  2. थ्रेसहोल्ड चयन: प्रतिशतक थ्रेसहोल्ड रणनीति पर निर्भर करता है, सभी परिदृश्यों के लिए उपयुक्त नहीं हो सकता है
  3. कम्प्यूटेशनल जटिलता: कई पैरामीटर नमूनाकरण की आवश्यकता होती है, जिससे अनुमान समय बढ़ता है

भविष्य की दिशाएं

  1. सीमा क्षेत्रों में अस्पष्टता को कम करने की रणनीति का अनुसंधान करना
  2. अनिश्चितता थ्रेसहोल्ड चयन विधि में सुधार करना
  3. अधिक कुशल अनिश्चितता अनुमान विधियों की खोज करना

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक योगदान: OOD डिटेक्शन में एपिस्टेमिक अनिश्चितता के लाभों को स्पष्ट रूप से समझाता है, सैद्धांतिक आधार प्रदान करता है
  2. विधि नवाचार: GMM पैरामीटर की बायेसियन मॉडलिंग के माध्यम से एपिस्टेमिक अनिश्चितता अनुमान को चतुराई से लागू करता है
  3. पर्याप्त प्रयोग: मानक डेटासेट पर कई baseline के साथ व्यापक तुलना
  4. मजबूत व्यावहारिकता: सहायक डेटा या पुनः प्रशिक्षण की आवश्यकता नहीं है, तैनाती में आसान

कमियां

  1. सामान्यीकरण क्षमता की पुष्टि बाकी है: केवल SemanticKITTI डेटासेट पर सत्यापित, अधिक डेटासेट पर सत्यापन की आवश्यकता है
  2. पैरामीटर संवेदनशीलता: GMM घटक संख्या जैसे हाइपरपैरामीटर चयन का विस्तृत विश्लेषण अभाव है
  3. कम्प्यूटेशनल ओवरहेड: कई नमूनाकरण की कम्प्यूटेशनल लागत विश्लेषण अपर्याप्त है
  4. सैद्धांतिक विश्लेषण: GMM मॉडलिंग अनिश्चितता को बेहतर तरीके से अलग क्यों कर सकता है, इसके गहन सैद्धांतिक व्याख्या का अभाव है

प्रभाव

  1. शैक्षणिक मूल्य: LiDAR सिमेंटिक सेगमेंटेशन में OOD डिटेक्शन के लिए नई अनुसंधान दिशा प्रदान करता है
  2. व्यावहारिक मूल्य: स्वायत्त ड्राइविंग जैसे सुरक्षा-महत्वपूर्ण अनुप्रयोगों के लिए महत्वपूर्ण है
  3. पुनरुत्पादनीयता: विधि विवरण स्पष्ट है, कार्यान्वयन अपेक्षाकृत सरल है

लागू परिदृश्य

  1. स्वायत्त ड्राइविंग: सड़क पर असामान्य वस्तुओं की पहचान करना
  2. रोबोट नेविगेशन: अज्ञात वातावरण में बाधाओं की पहचान करना
  3. सुरक्षा निगरानी: असामान्य व्यवहार या वस्तुओं की पहचान करना
  4. औद्योगिक निरीक्षण: उत्पादन लाइन पर दोषपूर्ण उत्पादों की पहचान करना

संदर्भ

पेपर संबंधित क्षेत्र के महत्वपूर्ण कार्यों का हवाला देता है, जिसमें शामिल हैं:

  • GMMSeg 18: जनरेटिव सिमेंटिक सेगमेंटेशन का मूल कार्य
  • Deep Ensembles 16: अनिश्चितता अनुमान की शास्त्रीय विधि
  • MC Dropout 7: बायेसियन गहन शिक्षा का प्रतिनिधि कार्य
  • SemanticKITTI 1: LiDAR सिमेंटिक सेगमेंटेशन का मानक डेटासेट

यह पेपर LiDAR सिमेंटिक सेगमेंटेशन के OOD डिटेक्शन क्षेत्र में महत्वपूर्ण योगदान देता है, तकनीकी डिजाइन के माध्यम से एपिस्टेमिक अनिश्चितता के प्रभावी अनुमान को प्राप्त करता है, और स्वायत्त ड्राइविंग प्रणाली की सुरक्षा और विश्वसनीयता में सुधार के लिए मूल्यवान समाधान प्रदान करता है।