2025-11-14T05:07:10.818918

MLOps with Microservices: A Case Study on the Maritime Domain

Ferreira, Trapmann, Heuvel
This case study describes challenges and lessons learned on building Ocean Guard: a Machine Learning-Enabled System (MLES) for anomaly detection in the maritime domain. First, the paper presents the system's specification, and architecture. Ocean Guard was designed with a microservices' architecture to enable multiple teams to work on the project in parallel. Then, the paper discusses how the developers adapted contract-based design to MLOps for achieving that goal. As a MLES, Ocean Guard employs code, model, and data contracts to establish guidelines between its services. This case study hopes to inspire software engineers, machine learning engineers, and data scientists to leverage similar approaches for their systems.
academic

माइक्रोसर्विसेज के साथMLOps: समुद्री डोमेन पर एक केस स्टडी

बुनियादी जानकारी

  • पेपर ID: 2506.06202
  • शीर्षक: MLOps with Microservices: A Case Study on the Maritime Domain
  • लेखक: Renato Cordeiro Ferreira, Rowanne Trapmann, Willem-Jan van den Heuvel
  • संस्थान: Jheronimus Academy of Data Science (JADS), Eindhoven University of Technology (TUe), Tilburg University (TiU)
  • वर्गीकरण: cs.SE cs.AI cs.LG
  • प्रकाशन समय: arXiv:2506.06202v2 cs.SE 11 अगस्त 2025
  • पेपर लिंक: https://arxiv.org/abs/2506.06202

सारांश

यह केस स्टडी Ocean Guard सिस्टम के निर्माण की चुनौतियों और सीखे गए पाठों का वर्णन करती है: यह समुद्री डोमेन में विसंगति पहचान के लिए एक मशीन लर्निंग सक्षम प्रणाली (MLES) है। पेपर पहले सिस्टम विनिर्देश और आर्किटेक्चर का परिचय देता है। Ocean Guard माइक्रोसर्विसेज आर्किटेक्चर डिज़ाइन अपनाता है, जो कई टीमों को समानांतर में काम करने में सक्षम बनाता है। फिर यह चर्चा करता है कि डेवलपर्स इस लक्ष्य को प्राप्त करने के लिए अनुबंध-आधारित डिज़ाइन को MLOps के लिए कैसे अनुकूलित करते हैं। MLES के रूप में, Ocean Guard कोड, मॉडल और डेटा अनुबंधों को अपनाता है ताकि सेवाओं के बीच मार्गदर्शक सिद्धांत स्थापित किए जा सकें।

अनुसंधान पृष्ठभूमि और प्रेरणा

समस्या की पृष्ठभूमि

  1. समुद्री डिजिटल परिवर्तन में तेजी: अंतर्राष्ट्रीय समुद्री संगठन (IMO) के अनुसार, आधुनिक जहाज "तैरते डेटा केंद्र" बन गए हैं, जो सैकड़ों सेंसर से लैस हैं और बड़ी मात्रा में विषम डेटा उत्पन्न करते हैं
  2. जटिल परिचालन वातावरण: समुद्री डोमेन में सीमाओं के पार निरंतर गति, विविध नियामक ढांचे, मौसम के प्रभाव आदि की विशेषताएं हैं
  3. डेटा प्रोसेसिंग चुनौतियां: सिस्टम को विभिन्न डेटा स्ट्रीम को बड़े पैमाने पर ग्रहण, प्रक्रिया और विश्लेषण करने की क्षमता की आवश्यकता है, साथ ही कनेक्टिविटी और तेजी से बदलती परिस्थितियों में परिचालन विश्वसनीयता बनाए रखनी है

अनुसंधान प्रेरणा

  1. तकनीकी एकीकरण की आवश्यकता: MLOps सर्वोत्तम प्रथाओं को माइक्रोसर्विसेज आर्किटेक्चर के साथ जोड़ना, समुद्री डोमेन की भविष्यसूचक विश्लेषण, विसंगति पहचान और मार्ग अनुकूलन आवश्यकताओं का सामना करना
  2. बहु-टीम सहयोग: सॉफ्टवेयर इंजीनियर, डेटा वैज्ञानिक और मशीन लर्निंग इंजीनियर जैसी बहु-विषयक टीमों के समानांतर विकास का समर्थन करने की आवश्यकता
  3. सिस्टम स्केलेबिलिटी: माइक्रोसर्विसेज आर्किटेक्चर समुद्री डोमेन की मॉड्यूलरिटी, स्केलेबिलिटी और लचीलापन आवश्यकताओं के लिए विशेष रूप से उपयुक्त है

मुख्य योगदान

  1. MLES के लिए अनुबंध-संचालित डिज़ाइन विधि प्रस्तावित की: माइक्रोसर्विसेज में कोड अनुबंध की अवधारणा को डेटा अनुबंध और मॉडल अनुबंध तक विस्तारित किया
  2. समुद्री विसंगति पहचान प्रणाली का संपूर्ण आर्किटेक्चर निर्मित किया: माइक्रोसर्विसेज-आधारित Ocean Guard सिस्टम, जो बहु-टीम समानांतर विकास का समर्थन करता है
  3. MLOps में DDD के अनुप्रयोग को सत्यापित किया: डोमेन-संचालित डिज़ाइन के माध्यम से एकीकृत भाषा बनाई, बहु-विषयक टीमों के बीच संचार में सुधार किया
  4. MLES विकास का व्यावहारिक अनुभव प्रदान किया:耦合, संरेखण और संचार की तीन प्रमुख चुनौतियों की पहचान और समाधान किया

विधि विवरण

सिस्टम विनिर्देश

कार्यात्मक आवश्यकताएं

जांचकर्ता (Investigator) कार्यक्षमता:

  • I1-I6: भौगोलिक स्थान प्रदर्शन, फ़िल्टरिंग, ऑब्जेक्ट प्रकार पहचान, बहु-डेटा स्रोत पुनर्प्राप्ति, मेटाडेटा देखना, ट्रैजेक्टरी ट्रैकिंग
  • I7-I9: विसंगति हाइलाइटिंग, विसंगति फ़िल्टरिंग, विसंगति व्याख्या देखना

विसंगति डिटेक्टर (Anomaly Detector) कार्यक्षमता:

  • A1-A3: विसंगति पहचान, विसंगति गणना, विसंगति व्याख्या

गैर-कार्यात्मक आवश्यकताएं

  1. व्याख्यात्मकता: व्याख्यात्मक मॉडल या ब्लैक-बॉक्स व्याख्या तकनीकें (SHAP, LIME) का उपयोग
  2. अनुकूलता: EU मानकों का पालन, अन्य सिस्टमों के साथ तेजी से एकीकरण का समर्थन
  3. लचीलापन: उच्च क्षमता, उच्च गति डेटा स्रोतों को संभालना
  4. अनुपालन: GDPR और AI Act जैसे यूरोपीय विनियमों का पालन

सिस्टम आर्किटेक्चर

पांच प्रमुख उप-प्रणालियों का डिज़ाइन

  1. डेटा अधिग्रहण (Data Acquisition)
    • तीसरे पक्ष के प्रदाता (1), भौतिक सेंसर (2), डेटा क्रॉलर (3)
    • लेबल स्टोरेज (A) और कच्चा डेटा स्टोरेज (B)
  2. निरंतर प्रशिक्षण (Continuous Training)
    • सिंथेटिक डेटा जनरेशन पाइपलाइन (I), डेटा संवर्धन पाइपलाइन (II)
    • नियम-आधारित प्रशिक्षण पाइपलाइन (III), ML-आधारित प्रशिक्षण पाइपलाइन (IV)
    • मेटाडेटा स्टोरेज (F) और मॉडल रजिस्ट्री (G)
  3. सेवा (Serving)
    • बैच भविष्यवाणी पाइपलाइन (VIII) और API भविष्यवाणी सेवा (8)
    • भविष्यवाणी स्टोरेज (H)
  4. निगरानी (Monitoring)
    • शासन अनुप्रयोग (7) और टेलीमेट्री स्टोरेज (I)
  5. निरंतर वितरण (Continuous Delivery)
    • CI पाइपलाइन (V), CD पाइपलाइन (VI), CD4ML पाइपलाइन (VII)
    • कलाकृति रजिस्ट्री (D)

API आर्किटेक्चर डिज़ाइन

षट्भुज आर्किटेक्चर (Hexagonal Architecture) को अपनाता है:

  1. कोर (Core): व्यावसायिक तर्क को लागू करता है, DDD पैटर्न का पालन करता है
    • इकाइयां (Entities), मूल्य वस्तुएं (Value Objects)
    • समुच्चय (Aggregates), सेवाएं (Services)
  2. पोर्ट्स (Ports): कोर और अनुकूलकों के बीच अनुबंध स्थापित करता है
    • डेटाबेस रिपॉजिटरी, निर्भरता इंजेक्शन, सुरक्षा तंत्र, वेब राउटर
  3. अनुकूलक (Adapters): बाहरी निर्भरताओं के साथ संचार करता है
    • पढ़ने के अनुकूलक: मॉडल, तीसरे पक्ष API, स्टोरेज, डेटाबेस, कॉन्फ़िगरेशन
    • आउटपुट अनुकूलक: वेब, कैश

टीम कॉन्फ़िगरेशन और वर्कफ़्लो

टीमजिम्मेदारीघटक
अनुसंधान टीमअत्याधुनिक तकनीक अन्वेषणप्रयोग और प्रशिक्षण पाइपलाइन
नवाचार टीमव्यावहारिक तकनीक अन्वेषणप्रयोग और प्रशिक्षण पाइपलाइन
मुख्य विकास टीमबैकएंड विकास और बुनियादी ढांचाAPI, डेटाबेस, मॉडल रिपॉजिटरी
UI विकास टीमफ्रंटएंड विकास और इंटरफेस डिज़ाइनवेब एप्लिकेशन

तकनीकी नवाचार बिंदु

अनुबंध-संचालित विकास (Contract-Based Development)

1. कोड अनुबंध (Code Contracts)

  • परिभाषा: दो सेवाओं के बीच HTTP प्रोटोकॉल के माध्यम से सिंक्रोनस/एसिंक्रोनस इंटरैक्शन व्यवहार का दस्तावेज़
  • अनुप्रयोग परिदृश्य:
    • डेटा क्रॉलर और बाहरी डेटा स्रोतों के बीच अनुबंध
    • API भविष्यवाणी सेवा और वेब एप्लिकेशन के बीच अनुबंध

2. डेटा अनुबंध (Data Contracts)

  • परिभाषा: डेटा स्टोरेज में अपेक्षित प्रारूप का दस्तावेज़, जिसमें प्रकार, प्रारूप, वितरण और पढ़ने-लिखने की प्रोटोकॉल शामिल हैं
  • अनुप्रयोग परिदृश्य:
    • लेबल स्टोरेज के निर्माता और उपभोक्ता के बीच अनुबंध
    • कच्चे डेटा स्टोरेज का बहु-पक्षीय अनुबंध
    • प्रसंस्कृत डेटा की पाइपलाइनों के बीच अनुबंध

3. मॉडल अनुबंध (Model Contracts)

  • परिभाषा: मॉडल के अपेक्षित इनपुट-आउटपुट और स्टोरेज प्रारूप का दस्तावेज़
  • अनुप्रयोग परिदृश्य: मॉडल रजिस्ट्री में प्रशिक्षण पाइपलाइन और भविष्यवाणी सेवा के बीच अनुबंध

एकीकृत भाषा (Ubiquitous Language)

DDD के माध्यम से टीमों के बीच साझा शब्दावली बनाता है, जो सुधार करता है:

  • हितधारकों और डेवलपर्स की समझ
  • टीमों के बीच संरेखण
  • डेटा और मॉडल अवधारणा व्याख्या

प्रयोगात्मक सेटअप

विकास वातावरण

  • कोड रिपॉजिटरी: केंद्रीकृत स्रोत कोड प्रबंधन
  • विकास उपकरण: IDE (4) संरचित सॉफ्टवेयर इंजीनियरिंग के लिए, Notebooks (5) इंटरैक्टिव प्रोटोटाइपिंग और विश्लेषण के लिए
  • CI/CD: निरंतर एकीकरण पाइपलाइन, निरंतर वितरण पाइपलाइन, ML निरंतर वितरण पाइपलाइन

तैनाती आर्किटेक्चर

  • कंटेनरीकरण: संस्करणित सॉफ्टवेयर घटकों को प्रबंधित करने के लिए कलाकृति रजिस्ट्री का उपयोग
  • शेड्यूलिंग सेवा: विभिन्न घटकों के निष्पादन को समन्वित करता है
  • निगरानी प्रणाली: शासन अनुप्रयोग मॉडल और सिस्टम उपयोग की निगरानी करता है

चुनौतियां और समाधान

तीन प्रमुख चुनौतियां

  1. युग्मन (Coupling)
    • समस्या: सिस्टम जटिलता के कारण घटक संशोधन आसानी से कैस्केडिंग प्रभाव का कारण बनता है
    • समाधान: अनुबंध-संचालित डिज़ाइन के माध्यम से एकीकरण समस्याओं को कम करना
  2. संरेखण (Alignment)
    • समस्या: चार पेशेवर टीमों के समानांतर काम करने की समन्वय चुनौती
    • समाधान: स्पष्ट सीमा परिभाषा, CI/CD पाइपलाइन एकीकरण
  3. संचार (Communication)
    • समस्या: विभिन्न तकनीकी पृष्ठभूमि वाले हितधारकों को सिस्टम विकास समझाना
    • समाधान: DDD के माध्यम से एकीकृत भाषा स्थापित करना

समाधान प्रभावकारिता

तकनीकी विधिसमाधान की गई चुनौतियांविशिष्ट प्रभाव
अनुबंध-संचालित डिज़ाइनयुग्मन + संरेखणएकीकरण समस्याओं को कम करता है, सिस्टम सामंजस्य में सुधार करता है
एकीकृत भाषासंचार + संरेखणसमझ को गहरा करता है, प्रतिक्रिया गुणवत्ता में सुधार करता है

संबंधित कार्य

MLOps क्षेत्र विकास

  • 2022 से: कई MLES संदर्भ आर्किटेक्चर प्रस्तावित किए गए
  • SE4AI: AI सिस्टम निर्माण के लिए सॉफ्टवेयर इंजीनियरिंग तकनीकों के अनुकूलन का उभरता हुआ क्षेत्र
  • सिस्टम घटकीकरण: MLES को कई घटकों के रूप में वर्णित किया जाता है जो सेवाओं में वितरित किए जा सकते हैं

माइक्रोसर्विसेज आर्किटेक्चर

  • 2015 से: माइक्रोसर्विसेज आर्किटेक्चर शैली का उदय, मॉड्यूलरिटी, स्केलेबिलिटी और लचीलापन चुनौतियों को हल करता है
  • समुद्री अनुप्रयोगिता: विभिन्न समुद्री डेटा स्रोतों और विश्लेषण आवश्यकताओं को संभालने के लिए विशेषज्ञ घटक

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. आर्किटेक्चर प्रभावकारिता: माइक्रोसर्विसेज आर्किटेक्चर ने बहु-विषयक टीमों द्वारा MLES के समानांतर विकास का सफलतापूर्वक समर्थन किया
  2. अनुबंध विस्तार: माइक्रोसर्विसेज के कोड अनुबंध की अवधारणा को डेटा और मॉडल आयामों तक सफलतापूर्वक विस्तारित किया
  3. DDD अनुप्रयोगिता: डोमेन-संचालित डिज़ाइन ने बहु-विषयक टीमों के बीच संचार और समन्वय में प्रभावी ढंग से सुधार किया
  4. चुनौती प्रतिक्रिया: अनुबंध-संचालित डिज़ाइन और एकीकृत भाषा ने युग्मन, संरेखण और संचार चुनौतियों को प्रभावी ढंग से हल किया

सीमाएं

  1. संवेदनशीलता प्रतिबंध: परियोजना संवेदनशीलता के कारण, पेपर विशिष्ट डेटा मॉडल और विसंगति पहचान तकनीकों में नहीं जाता है
  2. शैक्षणिक बाधाएं: अनुसंधान और नवाचार टीमें छात्रों से बनी हैं, शैक्षणिक समय सीमा से सीमित हैं
  3. कार्यान्वयन चरण: सिस्टम अभी भी विकास में है, उत्पादन वातावरण में दीर्घकालिक सत्यापन की कमी है

भविष्य की दिशा

  1. कार्यात्मक पूर्णता: सभी कार्यात्मक और गैर-कार्यात्मक आवश्यकताओं को पूरा करने के लिए विकास जारी रखना
  2. तकनीकी अन्वेषण: अनुसंधान और नवाचार टीमों के साथ अत्याधुनिक और व्यावहारिक तकनीकों का अन्वेषण जारी रखना
  3. आर्किटेक्चर विकास: स्थापित अनुबंध विधि और एकीकृत भाषा द्वारा निर्देशित विकास प्रक्रिया पर आधारित

गहन मूल्यांकन

शक्तियां

  1. उच्च व्यावहारिक मूल्य: MLOps और माइक्रोसर्विसेज संयोजन का एक संपूर्ण केस स्टडी प्रदान करता है
  2. विधि नवाचार: अनुबंध-संचालित डिज़ाइन को डेटा और मॉडल आयामों तक विस्तारित करना मौलिक है
  3. आर्किटेक्चर पूर्णता: सिस्टम आर्किटेक्चर डिज़ाइन व्यापक है, MLES के सभी पहलुओं को कवर करता है
  4. टीम सहयोग: बहु-विषयक टीमों के समानांतर विकास की चुनौतियों को सफलतापूर्वक हल किया
  5. व्यावहारिक मार्गदर्शन: समान परियोजनाओं के लिए संदर्भ योग्य अनुभव और सीखे गए पाठ प्रदान करता है

कमियां

  1. सीमित तकनीकी गहराई: संवेदनशीलता प्रतिबंधों के कारण, विशिष्ट ML एल्गोरिदम और डेटा प्रोसेसिंग विवरणों की कमी है
  2. अपर्याप्त मूल्यांकन: सिस्टम प्रदर्शन, स्केलेबिलिटी आदि का मात्रात्मक मूल्यांकन नहीं है
  3. दीर्घकालिक सत्यापन की कमी: सिस्टम अभी तक उत्पादन वातावरण में दीर्घकालिक रूप से चलाया नहीं गया है
  4. तुलनात्मक विश्लेषण अपर्याप्त: अन्य MLES आर्किटेक्चर समाधानों के साथ तुलना की कमी है

प्रभाव

  1. क्षेत्र योगदान: MLOps और माइक्रोसर्विसेज संयोजन के लिए महत्वपूर्ण व्यावहारिक संदर्भ प्रदान करता है
  2. पद्धति मूल्य: अनुबंध-संचालित डिज़ाइन का विस्तार व्यापक अनुप्रयोगिता है
  3. इंजीनियरिंग अभ्यास: जटिल MLES के टीम सहयोग के लिए प्रभावी पैटर्न प्रदान करता है
  4. पुनरुत्पादनीयता: आर्किटेक्चर डिज़ाइन और पद्धति अच्छी पुनरुत्पादनीयता है

अनुप्रयोग परिदृश्य

  1. बहु-टीम MLES विकास: जहां कई विषयक टीमें समानांतर में काम करती हैं
  2. जटिल डेटा प्रोसेसिंग: बहु-स्रोत विषम डेटा वाली प्रणालियां
  3. उच्च अनुपालन आवश्यकताएं: कठोर नियामक आवश्यकताओं को पूरा करने वाले उद्योग अनुप्रयोग
  4. स्केलेबल सिस्टम: उच्च मॉड्यूलरिटी और स्केलेबिलिटी वाली ML प्रणाली आर्किटेक्चर

संदर्भ

पेपर 17 महत्वपूर्ण संदर्भों का हवाला देता है, जिसमें शामिल हैं:

  • समुद्री डिजिटल परिवर्तन संबंधित अनुसंधान
  • माइक्रोसर्विसेज आर्किटेक्चर और MLOps सर्वोत्तम प्रथाएं
  • सॉफ्टवेयर इंजीनियरिंग पद्धति (DDD, षट्भुज आर्किटेक्चर)
  • मशीन लर्निंग सिस्टम इंजीनियरिंग (SE4AI)

सारांश: यह पेपर Ocean Guard केस स्टडी के माध्यम से माइक्रोसर्विसेज आर्किटेक्चर के MLOps में अनुप्रयोग को सफलतापूर्वक प्रदर्शित करता है, विशेष रूप से अनुबंध-संचालित डिज़ाइन का बहु-टीम सहयोग में मूल्य। हालांकि संवेदनशीलता प्रतिबंधों के कारण तकनीकी विवरणों में गहराई नहीं है, लेकिन इसके पद्धति योगदान और व्यावहारिक मार्गदर्शन मूल्य महत्वपूर्ण हैं, जो समान जटिल MLES परियोजनाओं के लिए मूल्यवान आर्किटेक्चर डिज़ाइन और टीम सहयोग अनुभव प्रदान करता है।