2025-11-14T05:07:10.818918

MLOps with Microservices: A Case Study on the Maritime Domain

Ferreira, Trapmann, Heuvel

This case study describes challenges and lessons learned on building Ocean Guard: a Machine Learning-Enabled System (MLES) for anomaly detection in the maritime domain. First, the paper presents the system's specification, and architecture. Ocean Guard was designed with a microservices' architecture to enable multiple teams to work on the project in parallel. Then, the paper discusses how the developers adapted contract-based design to MLOps for achieving that goal. As a MLES, Ocean Guard employs code, model, and data contracts to establish guidelines between its services. This case study hopes to inspire software engineers, machine learning engineers, and data scientists to leverage similar approaches for their systems.

academic

MLOps con Microservicios: Un Estudio de Caso en el Dominio Marítimo

Información Básica

ID del Artículo: 2506.06202
Título: MLOps with Microservices: A Case Study on the Maritime Domain
Autores: Renato Cordeiro Ferreira, Rowanne Trapmann, Willem-Jan van den Heuvel
Instituciones: Jheronimus Academy of Data Science (JADS), Eindhoven University of Technology (TUe), Tilburg University (TiU)
Clasificación: cs.SE cs.AI cs.LG
Fecha de Publicación: arXiv:2506.06202v2 cs.SE 11 Aug 2025
Enlace del Artículo: https://arxiv.org/abs/2506.06202

Resumen

Este estudio de caso describe los desafíos y lecciones aprendidas en la construcción del sistema Ocean Guard: un sistema habilitado por aprendizaje automático (MLES) para detección de anomalías en el dominio marítimo. El artículo presenta primero la especificación y arquitectura del sistema. Ocean Guard adopta un diseño de arquitectura de microservicios, permitiendo que múltiples equipos trabajen en paralelo. Luego se discute cómo los desarrolladores adaptaron el diseño basado en contratos para MLOps con este propósito. Como MLES, Ocean Guard adopta contratos de código, modelo y datos para establecer principios rectores entre servicios.

Contexto de Investigación y Motivación

Antecedentes del Problema

Aceleración de la Transformación Digital Marítima: Según la Organización Marítima Internacional (OMI), los buques modernos se han convertido en "centros de datos flotantes", equipados con cientos de sensores que generan grandes volúmenes de datos heterogéneos
Entorno Operativo Complejo: El dominio marítimo se caracteriza por movimiento continuo transfronterizo, marcos regulatorios diversos y susceptibilidad a condiciones climáticas
Desafíos en el Procesamiento de Datos: Se requieren sistemas capaces de ingerir, procesar y analizar diferentes flujos de datos a gran escala, manteniendo confiabilidad operativa en entornos con conectividad variable y condiciones que cambian rápidamente

Motivación de la Investigación

Necesidad de Convergencia Tecnológica: Integrar mejores prácticas de MLOps con arquitectura de microservicios para abordar necesidades de análisis predictivo, detección de anomalías y optimización de rutas en el dominio marítimo
Colaboración Multidisciplinaria: Necesidad de soportar desarrollo paralelo de equipos multidisciplinarios incluyendo ingenieros de software, científicos de datos e ingenieros de aprendizaje automático
Escalabilidad del Sistema: La arquitectura de microservicios es particularmente adecuada para los requisitos de modularidad, escalabilidad y resiliencia del dominio marítimo

Contribuciones Principales

Propuesta de un Enfoque de Diseño Impulsado por Contratos Aplicable a MLES: Extensión del concepto de contratos de código en microservicios a contratos de datos y contratos de modelos
Construcción de una Arquitectura Completa de Sistema de Detección de Anomalías Marítimas: Sistema Ocean Guard basado en microservicios que soporta desarrollo paralelo de múltiples equipos
Validación de la Aplicación de DDD en MLOps: Creación de lenguaje unificado mediante diseño dirigido por dominio para mejorar comunicación entre equipos multidisciplinarios
Provisión de Experiencia Práctica en Desarrollo de MLES: Identificación y resolución de tres desafíos principales: acoplamiento, alineación y comunicación

Explicación Detallada de Métodos

Especificación del Sistema

Requisitos Funcionales

Funcionalidad del Investigador (Investigator):

I1-I6: Visualización geográfica, filtrado, identificación de tipos de objetos, recuperación de múltiples fuentes de datos, visualización de metadatos, seguimiento de trayectorias
I7-I9: Resaltado de anomalías, filtrado de anomalías, visualización de explicaciones de anomalías

Funcionalidad del Detector de Anomalías (Anomaly Detector):

A1-A3: Detección de anomalías, enumeración de anomalías, explicación de anomalías

Requisitos No Funcionales

Interpretabilidad: Uso de modelos interpretables o técnicas de explicación de caja negra (SHAP, LIME)
Compatibilidad: Cumplimiento de estándares de la UE, soporte para integración rápida con otros sistemas
Resiliencia: Manejo de fuentes de datos de alto volumen y alta velocidad
Conformidad: Cumplimiento de regulaciones europeas como GDPR y AI Act

Arquitectura del Sistema

Diseño de Cinco Subsistemas

Adquisición de Datos (Data Acquisition)
- Proveedores terceros (1), sensores físicos (2), rastreadores de datos (3)
- Almacenamiento de etiquetas (A) y almacenamiento de datos sin procesar (B)
Entrenamiento Continuo (Continuous Training)
- Tubería de generación de datos sintéticos (I), tubería de aumento de datos (II)
- Tubería de entrenamiento basada en reglas (III), tubería de entrenamiento basada en ML (IV)
- Almacenamiento de metadatos (F) y registro de modelos (G)
Servicio (Serving)
- Tubería de predicción por lotes (VIII) y servicio de predicción API (8)
- Almacenamiento de predicciones (H)
Monitoreo (Monitoring)
- Aplicación de gobernanza (7) y almacenamiento de telemetría (I)
Entrega Continua (Continuous Delivery)
- Tubería CI (V), tubería CD (VI), tubería CD4ML (VII)
- Registro de artefactos (D)

Diseño de Arquitectura API

Adopción de Arquitectura Hexagonal (Hexagonal Architecture):

Núcleo (Core): Implementación de lógica empresarial siguiendo patrones DDD
- Entidades (Entities), Objetos de Valor (Value Objects)
- Agregados (Aggregates), Servicios (Services)
Puertos (Ports): Establecimiento de contratos entre núcleo y adaptadores
- Repositorios de base de datos, inyección de dependencias, mecanismos de seguridad, enrutador web
Adaptadores (Adapters): Comunicación con dependencias externas
- Adaptadores de lectura: modelos, APIs de terceros, almacenamiento, base de datos, configuración
- Adaptadores de salida: web, caché

Configuración de Equipos y Flujo de Trabajo

Equipo	Responsabilidades	Componentes
Equipo de Investigación	Exploración de tecnología de vanguardia	Tuberías experimentales y de entrenamiento
Equipo de Innovación	Exploración de tecnología práctica	Tuberías experimentales y de entrenamiento
Equipo de Desarrollo Principal	Desarrollo de backend e infraestructura	API, base de datos, repositorio de modelos
Equipo de Desarrollo UI	Desarrollo de frontend y diseño de interfaz	Aplicación web

Puntos de Innovación Técnica

Desarrollo Impulsado por Contratos (Contract-Based Development)

1. Contratos de Código (Code Contracts)

Definición: Documentación del comportamiento de interacción síncrona/asíncrona entre dos servicios a través del protocolo HTTP
Escenarios de Aplicación:
- Contrato entre rastreador de datos y fuentes de datos externas
- Contrato entre servicio de predicción API y aplicación web

2. Contratos de Datos (Data Contracts)

Definición: Documentación del formato esperado en almacenamiento de datos, incluyendo tipos, formato, distribución y protocolos de lectura/escritura
Escenarios de Aplicación:
- Contrato entre productor y consumidor de almacenamiento de etiquetas
- Contrato multipartidista de almacenamiento de datos sin procesar
- Contrato entre tuberías de datos procesados

3. Contratos de Modelos (Model Contracts)

Definición: Documentación de entrada/salida esperada del modelo y formato de almacenamiento
Escenarios de Aplicación: Contrato entre tuberías de entrenamiento y servicio de predicción en registro de modelos

Lenguaje Unificado (Ubiquitous Language)

Creación de vocabulario compartido entre equipos mediante DDD, mejorando:

Comprensión entre partes interesadas y desarrolladores
Alineación entre equipos
Explicación de conceptos de datos y modelos

Configuración Experimental

Entorno de Desarrollo

Repositorio de Código: Gestión centralizada de código fuente
Herramientas de Desarrollo: IDE (4) para ingeniería de software estructurada, Notebooks (5) para prototipado interactivo y análisis
CI/CD: Tubería de integración continua, tubería de entrega continua, tubería de entrega continua para ML

Arquitectura de Implementación

Containerización: Uso de registro de artefactos para gestionar componentes de software versionados
Servicio de Programación: Coordinación de ejecución de componentes
Sistema de Monitoreo: Aplicación de gobernanza que monitorea uso de modelos y sistemas

Desafíos y Soluciones

Tres Desafíos Principales

Acoplamiento (Coupling)
- Problema: La complejidad del sistema causa que modificaciones de componentes tengan impactos en cascada
- Solución: Reducción de problemas de integración mediante diseño impulsado por contratos
Alineación (Alignment)
- Problema: Desafíos de coordinación en trabajo paralelo de cuatro equipos profesionales
- Solución: Definición explícita de límites, integración de tuberías CI/CD
Comunicación (Communication)
- Problema: Dificultad en explicar evolución del sistema a partes interesadas con diferentes antecedentes técnicos
- Solución: Establecimiento de lenguaje unificado mediante DDD

Efectividad de Soluciones

Método Técnico	Desafíos Resueltos	Efectos Específicos
Diseño impulsado por contratos	Acoplamiento + Alineación	Reducción de problemas de integración, mejora de cohesión del sistema
Lenguaje unificado	Comunicación + Alineación	Profundización de comprensión, mejora de calidad de retroalimentación

Trabajo Relacionado

Desarrollo del Campo MLOps

Desde 2022: Múltiples arquitecturas de referencia MLES propuestas
SE4AI: Campo emergente de adaptación de técnicas de ingeniería de software para creación de sistemas de IA
Componentización de Sistemas: MLES descrito como conteniendo múltiples componentes distribuibles entre servicios

Arquitectura de Microservicios

Desde 2015: Surgimiento del estilo de arquitectura de microservicios, abordando desafíos de modularidad, escalabilidad y resiliencia
Aplicabilidad Marítima: Componentes especializados manejando diferentes fuentes de datos marítimos y necesidades analíticas

Conclusiones y Discusión

Conclusiones Principales

Validez de la Arquitectura: La arquitectura de microservicios soportó exitosamente desarrollo paralelo de MLES por equipos multidisciplinarios
Extensión de Contratos: El concepto de contratos de código en microservicios se extendió exitosamente a dimensiones de datos y modelos
Aplicabilidad de DDD: El diseño dirigido por dominio mejoró efectivamente comunicación y coordinación entre equipos multidisciplinarios
Respuesta a Desafíos: El diseño impulsado por contratos y lenguaje unificado resolvieron efectivamente desafíos de acoplamiento, alineación y comunicación

Limitaciones

Restricciones de Sensibilidad: Debido a sensibilidad del proyecto, el artículo no aborda modelos de datos específicos y técnicas de detección de anomalías
Restricciones Académicas: Equipos de investigación e innovación compuestos por estudiantes, sujetos a plazos académicos
Fase de Implementación: El sistema aún está en desarrollo, careciendo de validación a largo plazo en entorno de producción

Direcciones Futuras

Perfeccionamiento Funcional: Desarrollo continuo para satisfacer todos los requisitos funcionales y no funcionales
Exploración Tecnológica: Exploración continua de tecnología de vanguardia y práctica con equipos de investigación e innovación
Evolución de Arquitectura: Evolución de procesos de desarrollo guiada por métodos de contratos establecidos y lenguaje unificado

Evaluación Profunda

Fortalezas

Alto Valor Práctico: Proporciona estudio de caso completo de combinación de MLOps con microservicios
Innovación Metodológica: La extensión de diseño impulsado por contratos a dimensiones de datos y modelos es original
Arquitectura Completa: Diseño de arquitectura de sistema integral, cubriendo todos los aspectos de MLES
Colaboración de Equipos: Resolución exitosa de desafíos de desarrollo paralelo multidisciplinario
Orientación Práctica: Proporciona experiencia y lecciones aplicables a proyectos similares

Insuficiencias

Profundidad Técnica Limitada: Restricciones de sensibilidad resultan en falta de detalles específicos de algoritmos ML y procesamiento de datos
Evaluación Insuficiente: Falta de evaluación cuantitativa de rendimiento del sistema, escalabilidad, etc.
Ausencia de Validación a Largo Plazo: Sistema aún no ha operado a largo plazo en entorno de producción
Análisis Comparativo Insuficiente: Falta de análisis comparativo con otras soluciones de arquitectura MLES

Impacto

Contribución Disciplinaria: Proporciona referencia práctica importante para combinación de MLOps y microservicios
Valor Metodológico: La extensión de diseño impulsado por contratos tiene amplia aplicabilidad
Práctica de Ingeniería: Proporciona modelo efectivo para colaboración de equipos en MLES complejos
Reproducibilidad: Diseño de arquitectura y metodología poseen buena reproducibilidad

Escenarios Aplicables

Desarrollo MLES Multidisciplinario: Sistemas de aprendizaje automático requiriendo desarrollo paralelo de múltiples equipos profesionales
Procesamiento de Datos Complejo: Diseño de arquitectura de sistemas involucrando múltiples fuentes de datos heterogéneos
Requisitos de Conformidad Elevada: Aplicaciones de industria requiriendo cumplimiento de requisitos regulatorios estrictos
Sistemas Altamente Escalables: Arquitectura de sistemas ML requiriendo alto grado de modularidad y escalabilidad

Referencias

El artículo cita 17 referencias importantes, cubriendo:

Investigación relacionada con transformación digital marítima
Mejores prácticas de arquitectura de microservicios y MLOps
Metodología de ingeniería de software (DDD, arquitectura hexagonal)
Ingeniería de sistemas de aprendizaje automático (SE4AI)

Resumen: A través del estudio de caso Ocean Guard, este artículo demuestra exitosamente la aplicación de arquitectura de microservicios en MLOps, particularmente el valor del diseño impulsado por contratos en colaboración multidisciplinaria. Aunque las restricciones de sensibilidad impiden profundizar en detalles técnicos, sus contribuciones metodológicas y valor de orientación práctica son significativos, proporcionando experiencia valiosa en diseño de arquitectura y colaboración de equipos para proyectos MLES complejos similares.