This case study describes challenges and lessons learned on building Ocean Guard: a Machine Learning-Enabled System (MLES) for anomaly detection in the maritime domain. First, the paper presents the system's specification, and architecture. Ocean Guard was designed with a microservices' architecture to enable multiple teams to work on the project in parallel. Then, the paper discusses how the developers adapted contract-based design to MLOps for achieving that goal. As a MLES, Ocean Guard employs code, model, and data contracts to establish guidelines between its services. This case study hopes to inspire software engineers, machine learning engineers, and data scientists to leverage similar approaches for their systems.
- पेपर ID: 2506.06202
- शीर्षक: MLOps with Microservices: A Case Study on the Maritime Domain
- लेखक: Renato Cordeiro Ferreira, Rowanne Trapmann, Willem-Jan van den Heuvel
- संस्थान: Jheronimus Academy of Data Science (JADS), Eindhoven University of Technology (TUe), Tilburg University (TiU)
- वर्गीकरण: cs.SE cs.AI cs.LG
- प्रकाशन समय: arXiv:2506.06202v2 cs.SE 11 अगस्त 2025
- पेपर लिंक: https://arxiv.org/abs/2506.06202
यह केस स्टडी Ocean Guard सिस्टम के निर्माण की चुनौतियों और सीखे गए पाठों का वर्णन करती है: यह समुद्री डोमेन में विसंगति पहचान के लिए एक मशीन लर्निंग सक्षम प्रणाली (MLES) है। पेपर पहले सिस्टम विनिर्देश और आर्किटेक्चर का परिचय देता है। Ocean Guard माइक्रोसर्विसेज आर्किटेक्चर डिज़ाइन अपनाता है, जो कई टीमों को समानांतर में काम करने में सक्षम बनाता है। फिर यह चर्चा करता है कि डेवलपर्स इस लक्ष्य को प्राप्त करने के लिए अनुबंध-आधारित डिज़ाइन को MLOps के लिए कैसे अनुकूलित करते हैं। MLES के रूप में, Ocean Guard कोड, मॉडल और डेटा अनुबंधों को अपनाता है ताकि सेवाओं के बीच मार्गदर्शक सिद्धांत स्थापित किए जा सकें।
- समुद्री डिजिटल परिवर्तन में तेजी: अंतर्राष्ट्रीय समुद्री संगठन (IMO) के अनुसार, आधुनिक जहाज "तैरते डेटा केंद्र" बन गए हैं, जो सैकड़ों सेंसर से लैस हैं और बड़ी मात्रा में विषम डेटा उत्पन्न करते हैं
- जटिल परिचालन वातावरण: समुद्री डोमेन में सीमाओं के पार निरंतर गति, विविध नियामक ढांचे, मौसम के प्रभाव आदि की विशेषताएं हैं
- डेटा प्रोसेसिंग चुनौतियां: सिस्टम को विभिन्न डेटा स्ट्रीम को बड़े पैमाने पर ग्रहण, प्रक्रिया और विश्लेषण करने की क्षमता की आवश्यकता है, साथ ही कनेक्टिविटी और तेजी से बदलती परिस्थितियों में परिचालन विश्वसनीयता बनाए रखनी है
- तकनीकी एकीकरण की आवश्यकता: MLOps सर्वोत्तम प्रथाओं को माइक्रोसर्विसेज आर्किटेक्चर के साथ जोड़ना, समुद्री डोमेन की भविष्यसूचक विश्लेषण, विसंगति पहचान और मार्ग अनुकूलन आवश्यकताओं का सामना करना
- बहु-टीम सहयोग: सॉफ्टवेयर इंजीनियर, डेटा वैज्ञानिक और मशीन लर्निंग इंजीनियर जैसी बहु-विषयक टीमों के समानांतर विकास का समर्थन करने की आवश्यकता
- सिस्टम स्केलेबिलिटी: माइक्रोसर्विसेज आर्किटेक्चर समुद्री डोमेन की मॉड्यूलरिटी, स्केलेबिलिटी और लचीलापन आवश्यकताओं के लिए विशेष रूप से उपयुक्त है
- MLES के लिए अनुबंध-संचालित डिज़ाइन विधि प्रस्तावित की: माइक्रोसर्विसेज में कोड अनुबंध की अवधारणा को डेटा अनुबंध और मॉडल अनुबंध तक विस्तारित किया
- समुद्री विसंगति पहचान प्रणाली का संपूर्ण आर्किटेक्चर निर्मित किया: माइक्रोसर्विसेज-आधारित Ocean Guard सिस्टम, जो बहु-टीम समानांतर विकास का समर्थन करता है
- MLOps में DDD के अनुप्रयोग को सत्यापित किया: डोमेन-संचालित डिज़ाइन के माध्यम से एकीकृत भाषा बनाई, बहु-विषयक टीमों के बीच संचार में सुधार किया
- MLES विकास का व्यावहारिक अनुभव प्रदान किया:耦合, संरेखण और संचार की तीन प्रमुख चुनौतियों की पहचान और समाधान किया
जांचकर्ता (Investigator) कार्यक्षमता:
- I1-I6: भौगोलिक स्थान प्रदर्शन, फ़िल्टरिंग, ऑब्जेक्ट प्रकार पहचान, बहु-डेटा स्रोत पुनर्प्राप्ति, मेटाडेटा देखना, ट्रैजेक्टरी ट्रैकिंग
- I7-I9: विसंगति हाइलाइटिंग, विसंगति फ़िल्टरिंग, विसंगति व्याख्या देखना
विसंगति डिटेक्टर (Anomaly Detector) कार्यक्षमता:
- A1-A3: विसंगति पहचान, विसंगति गणना, विसंगति व्याख्या
- व्याख्यात्मकता: व्याख्यात्मक मॉडल या ब्लैक-बॉक्स व्याख्या तकनीकें (SHAP, LIME) का उपयोग
- अनुकूलता: EU मानकों का पालन, अन्य सिस्टमों के साथ तेजी से एकीकरण का समर्थन
- लचीलापन: उच्च क्षमता, उच्च गति डेटा स्रोतों को संभालना
- अनुपालन: GDPR और AI Act जैसे यूरोपीय विनियमों का पालन
- डेटा अधिग्रहण (Data Acquisition)
- तीसरे पक्ष के प्रदाता (1), भौतिक सेंसर (2), डेटा क्रॉलर (3)
- लेबल स्टोरेज (A) और कच्चा डेटा स्टोरेज (B)
- निरंतर प्रशिक्षण (Continuous Training)
- सिंथेटिक डेटा जनरेशन पाइपलाइन (I), डेटा संवर्धन पाइपलाइन (II)
- नियम-आधारित प्रशिक्षण पाइपलाइन (III), ML-आधारित प्रशिक्षण पाइपलाइन (IV)
- मेटाडेटा स्टोरेज (F) और मॉडल रजिस्ट्री (G)
- सेवा (Serving)
- बैच भविष्यवाणी पाइपलाइन (VIII) और API भविष्यवाणी सेवा (8)
- भविष्यवाणी स्टोरेज (H)
- निगरानी (Monitoring)
- शासन अनुप्रयोग (7) और टेलीमेट्री स्टोरेज (I)
- निरंतर वितरण (Continuous Delivery)
- CI पाइपलाइन (V), CD पाइपलाइन (VI), CD4ML पाइपलाइन (VII)
- कलाकृति रजिस्ट्री (D)
षट्भुज आर्किटेक्चर (Hexagonal Architecture) को अपनाता है:
- कोर (Core): व्यावसायिक तर्क को लागू करता है, DDD पैटर्न का पालन करता है
- इकाइयां (Entities), मूल्य वस्तुएं (Value Objects)
- समुच्चय (Aggregates), सेवाएं (Services)
- पोर्ट्स (Ports): कोर और अनुकूलकों के बीच अनुबंध स्थापित करता है
- डेटाबेस रिपॉजिटरी, निर्भरता इंजेक्शन, सुरक्षा तंत्र, वेब राउटर
- अनुकूलक (Adapters): बाहरी निर्भरताओं के साथ संचार करता है
- पढ़ने के अनुकूलक: मॉडल, तीसरे पक्ष API, स्टोरेज, डेटाबेस, कॉन्फ़िगरेशन
- आउटपुट अनुकूलक: वेब, कैश
| टीम | जिम्मेदारी | घटक |
|---|
| अनुसंधान टीम | अत्याधुनिक तकनीक अन्वेषण | प्रयोग और प्रशिक्षण पाइपलाइन |
| नवाचार टीम | व्यावहारिक तकनीक अन्वेषण | प्रयोग और प्रशिक्षण पाइपलाइन |
| मुख्य विकास टीम | बैकएंड विकास और बुनियादी ढांचा | API, डेटाबेस, मॉडल रिपॉजिटरी |
| UI विकास टीम | फ्रंटएंड विकास और इंटरफेस डिज़ाइन | वेब एप्लिकेशन |
- परिभाषा: दो सेवाओं के बीच HTTP प्रोटोकॉल के माध्यम से सिंक्रोनस/एसिंक्रोनस इंटरैक्शन व्यवहार का दस्तावेज़
- अनुप्रयोग परिदृश्य:
- डेटा क्रॉलर और बाहरी डेटा स्रोतों के बीच अनुबंध
- API भविष्यवाणी सेवा और वेब एप्लिकेशन के बीच अनुबंध
- परिभाषा: डेटा स्टोरेज में अपेक्षित प्रारूप का दस्तावेज़, जिसमें प्रकार, प्रारूप, वितरण और पढ़ने-लिखने की प्रोटोकॉल शामिल हैं
- अनुप्रयोग परिदृश्य:
- लेबल स्टोरेज के निर्माता और उपभोक्ता के बीच अनुबंध
- कच्चे डेटा स्टोरेज का बहु-पक्षीय अनुबंध
- प्रसंस्कृत डेटा की पाइपलाइनों के बीच अनुबंध
- परिभाषा: मॉडल के अपेक्षित इनपुट-आउटपुट और स्टोरेज प्रारूप का दस्तावेज़
- अनुप्रयोग परिदृश्य: मॉडल रजिस्ट्री में प्रशिक्षण पाइपलाइन और भविष्यवाणी सेवा के बीच अनुबंध
DDD के माध्यम से टीमों के बीच साझा शब्दावली बनाता है, जो सुधार करता है:
- हितधारकों और डेवलपर्स की समझ
- टीमों के बीच संरेखण
- डेटा और मॉडल अवधारणा व्याख्या
- कोड रिपॉजिटरी: केंद्रीकृत स्रोत कोड प्रबंधन
- विकास उपकरण: IDE (4) संरचित सॉफ्टवेयर इंजीनियरिंग के लिए, Notebooks (5) इंटरैक्टिव प्रोटोटाइपिंग और विश्लेषण के लिए
- CI/CD: निरंतर एकीकरण पाइपलाइन, निरंतर वितरण पाइपलाइन, ML निरंतर वितरण पाइपलाइन
- कंटेनरीकरण: संस्करणित सॉफ्टवेयर घटकों को प्रबंधित करने के लिए कलाकृति रजिस्ट्री का उपयोग
- शेड्यूलिंग सेवा: विभिन्न घटकों के निष्पादन को समन्वित करता है
- निगरानी प्रणाली: शासन अनुप्रयोग मॉडल और सिस्टम उपयोग की निगरानी करता है
- युग्मन (Coupling)
- समस्या: सिस्टम जटिलता के कारण घटक संशोधन आसानी से कैस्केडिंग प्रभाव का कारण बनता है
- समाधान: अनुबंध-संचालित डिज़ाइन के माध्यम से एकीकरण समस्याओं को कम करना
- संरेखण (Alignment)
- समस्या: चार पेशेवर टीमों के समानांतर काम करने की समन्वय चुनौती
- समाधान: स्पष्ट सीमा परिभाषा, CI/CD पाइपलाइन एकीकरण
- संचार (Communication)
- समस्या: विभिन्न तकनीकी पृष्ठभूमि वाले हितधारकों को सिस्टम विकास समझाना
- समाधान: DDD के माध्यम से एकीकृत भाषा स्थापित करना
| तकनीकी विधि | समाधान की गई चुनौतियां | विशिष्ट प्रभाव |
|---|
| अनुबंध-संचालित डिज़ाइन | युग्मन + संरेखण | एकीकरण समस्याओं को कम करता है, सिस्टम सामंजस्य में सुधार करता है |
| एकीकृत भाषा | संचार + संरेखण | समझ को गहरा करता है, प्रतिक्रिया गुणवत्ता में सुधार करता है |
- 2022 से: कई MLES संदर्भ आर्किटेक्चर प्रस्तावित किए गए
- SE4AI: AI सिस्टम निर्माण के लिए सॉफ्टवेयर इंजीनियरिंग तकनीकों के अनुकूलन का उभरता हुआ क्षेत्र
- सिस्टम घटकीकरण: MLES को कई घटकों के रूप में वर्णित किया जाता है जो सेवाओं में वितरित किए जा सकते हैं
- 2015 से: माइक्रोसर्विसेज आर्किटेक्चर शैली का उदय, मॉड्यूलरिटी, स्केलेबिलिटी और लचीलापन चुनौतियों को हल करता है
- समुद्री अनुप्रयोगिता: विभिन्न समुद्री डेटा स्रोतों और विश्लेषण आवश्यकताओं को संभालने के लिए विशेषज्ञ घटक
- आर्किटेक्चर प्रभावकारिता: माइक्रोसर्विसेज आर्किटेक्चर ने बहु-विषयक टीमों द्वारा MLES के समानांतर विकास का सफलतापूर्वक समर्थन किया
- अनुबंध विस्तार: माइक्रोसर्विसेज के कोड अनुबंध की अवधारणा को डेटा और मॉडल आयामों तक सफलतापूर्वक विस्तारित किया
- DDD अनुप्रयोगिता: डोमेन-संचालित डिज़ाइन ने बहु-विषयक टीमों के बीच संचार और समन्वय में प्रभावी ढंग से सुधार किया
- चुनौती प्रतिक्रिया: अनुबंध-संचालित डिज़ाइन और एकीकृत भाषा ने युग्मन, संरेखण और संचार चुनौतियों को प्रभावी ढंग से हल किया
- संवेदनशीलता प्रतिबंध: परियोजना संवेदनशीलता के कारण, पेपर विशिष्ट डेटा मॉडल और विसंगति पहचान तकनीकों में नहीं जाता है
- शैक्षणिक बाधाएं: अनुसंधान और नवाचार टीमें छात्रों से बनी हैं, शैक्षणिक समय सीमा से सीमित हैं
- कार्यान्वयन चरण: सिस्टम अभी भी विकास में है, उत्पादन वातावरण में दीर्घकालिक सत्यापन की कमी है
- कार्यात्मक पूर्णता: सभी कार्यात्मक और गैर-कार्यात्मक आवश्यकताओं को पूरा करने के लिए विकास जारी रखना
- तकनीकी अन्वेषण: अनुसंधान और नवाचार टीमों के साथ अत्याधुनिक और व्यावहारिक तकनीकों का अन्वेषण जारी रखना
- आर्किटेक्चर विकास: स्थापित अनुबंध विधि और एकीकृत भाषा द्वारा निर्देशित विकास प्रक्रिया पर आधारित
- उच्च व्यावहारिक मूल्य: MLOps और माइक्रोसर्विसेज संयोजन का एक संपूर्ण केस स्टडी प्रदान करता है
- विधि नवाचार: अनुबंध-संचालित डिज़ाइन को डेटा और मॉडल आयामों तक विस्तारित करना मौलिक है
- आर्किटेक्चर पूर्णता: सिस्टम आर्किटेक्चर डिज़ाइन व्यापक है, MLES के सभी पहलुओं को कवर करता है
- टीम सहयोग: बहु-विषयक टीमों के समानांतर विकास की चुनौतियों को सफलतापूर्वक हल किया
- व्यावहारिक मार्गदर्शन: समान परियोजनाओं के लिए संदर्भ योग्य अनुभव और सीखे गए पाठ प्रदान करता है
- सीमित तकनीकी गहराई: संवेदनशीलता प्रतिबंधों के कारण, विशिष्ट ML एल्गोरिदम और डेटा प्रोसेसिंग विवरणों की कमी है
- अपर्याप्त मूल्यांकन: सिस्टम प्रदर्शन, स्केलेबिलिटी आदि का मात्रात्मक मूल्यांकन नहीं है
- दीर्घकालिक सत्यापन की कमी: सिस्टम अभी तक उत्पादन वातावरण में दीर्घकालिक रूप से चलाया नहीं गया है
- तुलनात्मक विश्लेषण अपर्याप्त: अन्य MLES आर्किटेक्चर समाधानों के साथ तुलना की कमी है
- क्षेत्र योगदान: MLOps और माइक्रोसर्विसेज संयोजन के लिए महत्वपूर्ण व्यावहारिक संदर्भ प्रदान करता है
- पद्धति मूल्य: अनुबंध-संचालित डिज़ाइन का विस्तार व्यापक अनुप्रयोगिता है
- इंजीनियरिंग अभ्यास: जटिल MLES के टीम सहयोग के लिए प्रभावी पैटर्न प्रदान करता है
- पुनरुत्पादनीयता: आर्किटेक्चर डिज़ाइन और पद्धति अच्छी पुनरुत्पादनीयता है
- बहु-टीम MLES विकास: जहां कई विषयक टीमें समानांतर में काम करती हैं
- जटिल डेटा प्रोसेसिंग: बहु-स्रोत विषम डेटा वाली प्रणालियां
- उच्च अनुपालन आवश्यकताएं: कठोर नियामक आवश्यकताओं को पूरा करने वाले उद्योग अनुप्रयोग
- स्केलेबल सिस्टम: उच्च मॉड्यूलरिटी और स्केलेबिलिटी वाली ML प्रणाली आर्किटेक्चर
पेपर 17 महत्वपूर्ण संदर्भों का हवाला देता है, जिसमें शामिल हैं:
- समुद्री डिजिटल परिवर्तन संबंधित अनुसंधान
- माइक्रोसर्विसेज आर्किटेक्चर और MLOps सर्वोत्तम प्रथाएं
- सॉफ्टवेयर इंजीनियरिंग पद्धति (DDD, षट्भुज आर्किटेक्चर)
- मशीन लर्निंग सिस्टम इंजीनियरिंग (SE4AI)
सारांश: यह पेपर Ocean Guard केस स्टडी के माध्यम से माइक्रोसर्विसेज आर्किटेक्चर के MLOps में अनुप्रयोग को सफलतापूर्वक प्रदर्शित करता है, विशेष रूप से अनुबंध-संचालित डिज़ाइन का बहु-टीम सहयोग में मूल्य। हालांकि संवेदनशीलता प्रतिबंधों के कारण तकनीकी विवरणों में गहराई नहीं है, लेकिन इसके पद्धति योगदान और व्यावहारिक मार्गदर्शन मूल्य महत्वपूर्ण हैं, जो समान जटिल MLES परियोजनाओं के लिए मूल्यवान आर्किटेक्चर डिज़ाइन और टीम सहयोग अनुभव प्रदान करता है।