2025-11-14T05:07:10.818918

MLOps with Microservices: A Case Study on the Maritime Domain

Ferreira, Trapmann, Heuvel

This case study describes challenges and lessons learned on building Ocean Guard: a Machine Learning-Enabled System (MLES) for anomaly detection in the maritime domain. First, the paper presents the system's specification, and architecture. Ocean Guard was designed with a microservices' architecture to enable multiple teams to work on the project in parallel. Then, the paper discusses how the developers adapted contract-based design to MLOps for achieving that goal. As a MLES, Ocean Guard employs code, model, and data contracts to establish guidelines between its services. This case study hopes to inspire software engineers, machine learning engineers, and data scientists to leverage similar approaches for their systems.

academic

MLOps mit Microservices: Eine Fallstudie im maritimen Bereich

Grundinformationen

Paper-ID: 2506.06202
Titel: MLOps with Microservices: A Case Study on the Maritime Domain
Autoren: Renato Cordeiro Ferreira, Rowanne Trapmann, Willem-Jan van den Heuvel
Institutionen: Jheronimus Academy of Data Science (JADS), Technische Universität Eindhoven (TUe), Universität Tilburg (TiU)
Klassifizierung: cs.SE cs.AI cs.LG
Veröffentlichungsdatum: arXiv:2506.06202v2 cs.SE 11. August 2025
Paper-Link: https://arxiv.org/abs/2506.06202

Zusammenfassung

Diese Fallstudie beschreibt die Herausforderungen und Erkenntnisse beim Aufbau des Ocean Guard-Systems: ein maschinenlernengestütztes System (MLES) zur Anomalieerkennung im maritimen Bereich. Das Paper stellt zunächst die Systemspezifikation und Architektur vor. Ocean Guard nutzt eine Microservice-Architektur, die es mehreren Teams ermöglicht, parallel zu arbeiten. Anschließend wird erörtert, wie Entwickler vertragsbasiertes Design für MLOps adaptiert haben, um dies zu erreichen. Als MLES nutzt Ocean Guard Code-, Modell- und Datenverträge, um Richtlinien zwischen Services zu etablieren.

Forschungshintergrund und Motivation

Problemhintergrund

Beschleunigte digitale Transformation in der Schifffahrt: Nach der Internationalen Seeschifffahrtsorganisation (IMO) sind moderne Schiffe zu „schwimmenden Datenzentren" geworden, ausgestattet mit Hunderten von Sensoren, die große Mengen heterogener Daten erzeugen
Komplexe Betriebsumgebung: Der maritime Bereich ist durch kontinuierliche grenzüberschreitende Bewegung, vielfältige Regelungsrahmen und Anfälligkeit für Wetterbedingungen gekennzeichnet
Herausforderungen bei der Datenverarbeitung: Systeme müssen in der Lage sein, verschiedene Datenströme in großem Maßstab aufzunehmen, zu verarbeiten und zu analysieren, während sie in Umgebungen mit schnell wechselnder Konnektivität und Bedingungen betriebsfähig bleiben

Forschungsmotivation

Technologische Konvergenzanforderung: Kombination von MLOps-Best-Practices mit Microservice-Architektur zur Bewältigung von Anforderungen in den Bereichen Vorhersageanalyse, Anomalieerkennung und Routenoptimierung im maritimen Bereich
Zusammenarbeit mehrerer Teams: Unterstützung paralleler Entwicklung durch multidisziplinäre Teams aus Softwareingenieuren, Datenwissenschaftlern und Machine-Learning-Ingenieuren
Systemskalierbarkeit: Microservice-Architektur ist besonders geeignet für Modularität, Skalierbarkeit und Resilienz im maritimen Bereich

Kernbeiträge

Vorschlag einer vertragsgesteuerten Designmethode für MLES: Erweiterung des Konzepts der Codekontrakte aus Microservices auf Datenkontrakte und Modellkontrakte
Aufbau einer vollständigen Architektur für maritime Anomalieerkennung: Ocean Guard-System basierend auf Microservices mit Unterstützung für parallele Entwicklung mehrerer Teams
Validierung der Anwendung von DDD in MLOps: Schaffung einer gemeinsamen Sprache durch Domain-Driven Design zur Verbesserung der Kommunikation zwischen multidisziplinären Teams
Bereitstellung praktischer Erfahrungen bei der MLES-Entwicklung: Identifikation und Bewältigung von drei Hauptherausforderungen: Kopplung, Ausrichtung und Kommunikation

Methodische Details

Systemspezifikation

Funktionale Anforderungen

Investigator-Funktionalität:

I1-I6: Geografische Standortanzeige, Filterung, Objekttypidentifikation, Multi-Datenquellen-Abruf, Metadaten-Anzeige, Trajektorienverfolgung
I7-I9: Anomaliehighlighting, Anomaliefilterung, Anomalieerklärungsanzeige

Anomalieerkenner-Funktionalität:

A1-A3: Anomalieerkennung, Anomalieaufzählung, Anomalieerklärung

Nicht-funktionale Anforderungen

Interpretierbarkeit: Verwendung interpretierbarer Modelle oder Black-Box-Erklärungstechniken (SHAP, LIME)
Kompatibilität: Einhaltung von EU-Standards, Unterstützung schneller Integration mit anderen Systemen
Resilienz: Verarbeitung hochvolumiger, hochfrequenter Datenquellen
Compliance: Einhaltung europäischer Vorschriften wie GDPR und AI Act

Systemarchitektur

Design von fünf Subsystemen

Datenerfassung (Data Acquisition)
- Drittanbieter (1), physische Sensoren (2), Daten-Crawler (3)
- Beschriftungsspeicher (A) und Rohdatenspeicher (B)
Kontinuierliches Training (Continuous Training)
- Pipeline zur Synthese-Datengenerierung (I), Datenerweiterungs-Pipeline (II)
- Regelbasierte Trainings-Pipeline (III), ML-basierte Trainings-Pipeline (IV)
- Metadatenspeicher (F) und Modellregister (G)
Serving
- Batch-Vorhersage-Pipeline (VIII) und API-Vorhersage-Service (8)
- Vorhersagespeicher (H)
Überwachung (Monitoring)
- Governance-Anwendung (7) und Telemetrie-Speicher (I)
Kontinuierliche Bereitstellung (Continuous Delivery)
- CI-Pipeline (V), CD-Pipeline (VI), CD4ML-Pipeline (VII)
- Artefakt-Register (D)

API-Architektur-Design

Verwendung der Hexagonalen Architektur (Hexagonal Architecture):

Kern (Core): Implementierung der Geschäftslogik nach DDD-Muster
- Entitäten (Entities), Wertobjekte (Value Objects)
- Aggregate, Services
Ports: Etablierung von Verträgen zwischen Kern und Adaptern
- Datenbank-Repositories, Dependency Injection, Sicherheitsmechanismen, Web-Router
Adapter: Kommunikation mit externen Abhängigkeiten
- Eingabe-Adapter: Modelle, Drittanbieter-APIs, Speicher, Datenbanken, Konfiguration
- Ausgabe-Adapter: Web, Cache

Team-Konfiguration und Arbeitsablauf

Team	Verantwortung	Komponenten
Forschungsteam	Erforschung von Spitzentechnologie	Experiment- und Trainings-Pipelines
Innovationsteam	Praktische Technologieerforschung	Experiment- und Trainings-Pipelines
Kern-Entwicklungsteam	Backend-Entwicklung und Infrastruktur	APIs, Datenbanken, Modell-Repository
UI-Entwicklungsteam	Frontend-Entwicklung und Interface-Design	Web-Anwendung

Technische Innovationen

Vertragsgesteuerte Entwicklung (Contract-Based Development)

1. Codekontrakte (Code Contracts)

Definition: Dokumentation des synchronen/asynchronen Interaktionsverhaltens zwischen zwei Services über HTTP-Protokoll
Anwendungsszenarien:
- Vertrag zwischen Daten-Crawler und externen Datenquellen
- Vertrag zwischen API-Vorhersage-Service und Web-Anwendung

2. Datenkontrakte (Data Contracts)

Definition: Dokumentation des erwarteten Formats in Datenspeichern, einschließlich Typ, Format, Verteilung und Lese-/Schreibprotokollen
Anwendungsszenarien:
- Vertrag zwischen Produzent und Konsument des Beschriftungsspeichers
- Multi-Party-Verträge des Rohdatenspeichers
- Verträge zwischen Pipelines verarbeiteter Daten

3. Modellkontrakte (Model Contracts)

Definition: Dokumentation der erwarteten Ein- und Ausgaben sowie des Speicherformats von Modellen
Anwendungsszenarien: Verträge zwischen Trainings-Pipelines und Vorhersage-Services im Modellregister

Ubiquitäre Sprache (Ubiquitous Language)

Schaffung gemeinsamer Vokabeln über Teams hinweg durch DDD zur Verbesserung von:

Verständnis zwischen Stakeholdern und Entwicklern
Ausrichtung zwischen Teams
Erklärung von Daten- und Modellkonzepten

Experimentelle Einrichtung

Entwicklungsumgebung

Code-Repository: Zentralisierte Quellcodeverwaltung
Entwicklungswerkzeuge: IDE (4) für strukturierte Softwareentwicklung, Notebooks (5) für interaktive Prototypisierung und Analyse
CI/CD: Continuous-Integration-Pipeline, Continuous-Delivery-Pipeline, ML-Continuous-Delivery-Pipeline

Deployment-Architektur

Containerisierung: Verwendung von Artefakt-Registern zur Verwaltung versionierter Softwarekomponenten
Scheduling-Service: Koordination der Komponentenausführung
Überwachungssystem: Governance-Anwendung überwacht Modell- und Systemnutzung

Herausforderungen und Lösungen

Drei Hauptherausforderungen

Kopplung (Coupling)
- Problem: Systemkomplexität führt dazu, dass Änderungen an Komponenten leicht kaskadierende Auswirkungen haben
- Lösung: Reduzierung von Integrationsproblemen durch vertragsgesteuerte Designmethode
Ausrichtung (Alignment)
- Problem: Koordinierungsherausforderungen bei paralleler Arbeit von vier Fachteams
- Lösung: Klare Grenzendefinition, CI/CD-Pipeline-Integration
Kommunikation (Communication)
- Problem: Erklärung der Systemevolution gegenüber Stakeholdern mit unterschiedlichem technischem Hintergrund
- Lösung: Etablierung einer gemeinsamen Sprache durch DDD

Lösungseffektivität

Technische Methode	Gelöste Herausforderungen	Konkrete Effekte
Vertragsgesteuerte Designmethode	Kopplung + Ausrichtung	Reduzierung von Integrationsproblemen, verbesserte Systemkohäsion
Ubiquitäre Sprache	Kommunikation + Ausrichtung	Vertieftes Verständnis, verbesserte Feedback-Qualität

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Architektur-Effektivität: Microservice-Architektur unterstützt erfolgreich die parallele Entwicklung von MLES durch multidisziplinäre Teams
Vertrag-Erweiterung: Das Konzept der Codekontrakte aus Microservices wurde erfolgreich auf Daten- und Modelldimensionen erweitert
DDD-Anwendbarkeit: Domain-Driven Design verbessert effektiv die Kommunikation und Koordination zwischen multidisziplinären Teams
Herausforderungsbewältigung: Vertragsgesteuerte Designmethode und ubiquitäre Sprache bewältigen effektiv die Herausforderungen von Kopplung, Ausrichtung und Kommunikation

Einschränkungen

Sensibilitätsbeschränkungen: Aufgrund der Projektempfindlichkeit behandelt das Paper keine spezifischen Datenmodelle und Anomalieerkenntechniken
Akademische Beschränkungen: Forschungs- und Innovationsteams bestehen aus Studierenden und unterliegen akademischen Fristen
Implementierungsphase: Das System befindet sich noch in der Entwicklung und fehlt langfristige Validierung in Produktionsumgebungen

Zukünftige Richtungen

Funktionsvervollständigung: Fortgesetzte Entwicklung zur Erfüllung aller funktionalen und nicht-funktionalen Anforderungen
Technische Erforschung: Fortgesetzte Erforschung von Spitzen- und praktischen Technologien mit Forschungs- und Innovationsteams
Architektur-Evolution: Architektur-Entwicklung unter Anleitung der etablierten Vertragsmethode und ubiquitären Sprache

Tiefgreifende Bewertung

Stärken

Hoher praktischer Wert: Bietet eine vollständige Fallstudie zur Kombination von MLOps und Microservices
Methodische Innovation: Die Erweiterung der vertragsgesteuerten Designmethode auf Daten- und Modelldimensionen ist originell
Vollständige Architektur: Umfassende Systemarchitektur-Design, das alle Aspekte von MLES abdeckt
Team-Zusammenarbeit: Erfolgreiche Bewältigung der Herausforderungen paralleler Entwicklung durch multidisziplinäre Teams
Praktische Orientierung: Bietet nachahmenswerte Erfahrungen und Erkenntnisse für ähnliche Projekte

Schwächen

Begrenzte technische Tiefe: Aufgrund von Sensibilitätsbeschränkungen fehlen spezifische ML-Algorithmen und Datenverarbeitungsdetails
Unzureichende Evaluierung: Fehlende quantitative Bewertung von Systemleistung und Skalierbarkeit
Fehlende Langzeitvalidierung: System hat noch nicht lange in Produktionsumgebungen gelaufen
Unzureichende Vergleichsanalyse: Fehlende Vergleichsanalyse mit anderen MLES-Architekturlösungen

Auswirkungen

Feldbeitrag: Bietet wichtige praktische Referenzen für die Kombination von MLOps und Microservices
Methodologischer Wert: Die Erweiterung der vertragsgesteuerten Designmethode hat breite Anwendbarkeit
Ingenieurpraxis: Bietet effektive Muster für Team-Zusammenarbeit in komplexen MLES
Reproduzierbarkeit: Architektur-Design und Methodik haben gute Reproduzierbarkeit

Anwendungsszenarien

Multi-Team-MLES-Entwicklung: Maschinenlern-Systeme, die parallele Entwicklung durch mehrere Fachteams erfordern
Komplexe Datenverarbeitung: Systemarchitektur-Design mit mehreren heterogenen Datenquellen
Hohe Compliance-Anforderungen: Branchenanwendungen mit strengem Regelungsrahmen
Skalierbare Systeme: ML-Systemarchitekturen mit hohem Grad an Modularität und Skalierbarkeit

Literaturverzeichnis

Das Paper zitiert 17 wichtige Literaturquellen, die folgende Bereiche abdecken:

Forschung zur digitalen Transformation in der Schifffahrt
Best-Practices in Microservice-Architektur und MLOps
Softwareengineering-Methoden (DDD, Hexagonale Architektur)
Machine-Learning-Systemtechnik (SE4AI)

Zusammenfassung: Dieses Paper demonstriert durch die Ocean Guard-Fallstudie erfolgreich die Anwendung von Microservice-Architektur in MLOps, insbesondere den Wert der vertragsgesteuerten Designmethode in der Multi-Team-Zusammenarbeit. Obwohl aufgrund von Sensibilitätsbeschränkungen keine tiefgreifenden technischen Details behandelt werden, sind die methodologischen Beiträge und praktischen Orientierungswerte erheblich und bieten wertvolle Architektur-Design- und Team-Zusammenarbeitserfahrungen für ähnliche komplexe MLES-Projekte.