2025-11-20T07:49:14.984146

Montsalvat: Partitioning Java Applications to Minimize the TCB in Intel SGX

Yuhala, MÃ©nÃ©trey, Felber et al.

The popularity of the Java programming language has led to its wide adoption in cloud computing infrastructures. However, Java applications running in untrusted clouds are vulnerable to various forms of privileged attacks. The emergence of trusted execution environments (TEEs) such as Intel SGX mitigates this problem. TEEs protect code and data in secure enclaves inaccessible to untrusted software, including the kernel and hypervisors. To efficiently use TEEs, developers must manually partition their applications into trusted and untrusted parts, in order to reduce the size of the trusted computing base (TCB) and minimise the risks of security vulnerabilities. However, partitioning applications poses two important challenges: (i) ensuring efficient object communication between the partitioned components, and (ii) ensuring the consistency of garbage collection between the parts, especially with memory-managed languages such as Java. We present Montsalvat, a tool which provides a practical and intuitive annotation-based partitioning approach for Java applications destined for secure enclaves. Montsalvat provides an RMI-like mechanism to ensure inter-object communication, as well as consistent garbage collection across the partitioned components. We implement Montsalvat with GraalVM native-image, a tool for compiling Java applications ahead-of-time into standalone native executables that do not require a JVM at runtime. Our extensive evaluation with micro- and macro-benchmarks shows our partitioning approach to boost performance in real-world applications

academic

Montsalvat: Particionamiento de Aplicaciones Java para Minimizar la TCB en Intel SGX

Información Básica

ID del Artículo: 2305.00766
Título: Montsalvat: Particionamiento de Aplicaciones Java para Minimizar la TCB en Intel SGX
Autores: Peterson Yuhala, Jämes Ménétrey, Pascal Felber, Valerio Schiavoni, Alain Tchana, Gaël Thomas, Hugo Guiroux, Jean-Pierre Lozi
Clasificación: cs.CR (Criptografía y Seguridad)
Conferencia de Publicación: 22ª Conferencia Internacional de Middleware (Middleware 2021)
Enlace del Artículo: https://arxiv.org/abs/2305.00766

Resumen

La popularidad del lenguaje de programación Java ha resultado en su adopción generalizada en infraestructuras de computación en la nube. Sin embargo, las aplicaciones Java que se ejecutan en entornos de nube no confiables son susceptibles a diversos ataques privilegiados. La aparición de Entornos de Ejecución Confiable (TEE) como Intel SGX mitiga este problema. Los TEE protegen el código y los datos dentro de enclaves seguros, impidiéndoles ser accedidos por software no confiable, incluyendo el núcleo e hipervisores. Para utilizar eficientemente los TEE, los desarrolladores deben particionar manualmente las aplicaciones en componentes confiables y no confiables para reducir el tamaño de la Base de Computación Confiable (TCB) y minimizar el riesgo de vulnerabilidades de seguridad. Este artículo propone la herramienta Montsalvat, que proporciona un método de particionamiento basado en anotaciones práctico e intuitivo para aplicaciones Java orientadas a enclaves seguros. Montsalvat proporciona un mecanismo similar a RMI para garantizar la comunicación entre objetos, así como recolección de basura consistente entre componentes particionados.

Antecedentes de Investigación y Motivación

Definición del Problema

Amenazas de Seguridad: Las aplicaciones Java en entornos de nube no confiables enfrentan amenazas de ataques privilegiados, incluyendo ataques a nivel de núcleo e hipervisor
Requisito de Minimización de TCB: Al utilizar TEE como Intel SGX, es necesario minimizar la base de computación confiable para reducir la superficie de ataque
Complejidad del Particionamiento: El particionamiento manual de aplicaciones Java requiere manejar problemas complejos como la comunicación entre objetos y la consistencia de la recolección de basura

Limitaciones de Soluciones Existentes

Soluciones de Aplicación Completa: SCONE, Graphene-SGX, etc., colocan la aplicación completa (incluyendo la JVM) dentro del enclave, resultando en una TCB excesivamente grande (millones de líneas de código)
Soluciones Específicas de Marco: VC3, SecureKeeper, etc., solo se aplican a marcos específicos, careciendo de generalidad
Soluciones Existentes de Particionamiento Java:
- Civet requiere LibOS completo, la TCB sigue siendo muy grande
- Uranus requiere herramientas de terceros para inferir particiones confiables, requiriendo mayor intervención del desarrollador

Motivación de la Investigación

Desarrollar una herramienta de particionamiento de aplicaciones Java generalizada y automatizada que pueda:

Proporcionar un método de anotación intuitivo a nivel de clase
Implementar comunicación eficiente de objetos entre enclaves
Garantizar la consistencia de la recolección de basura distribuida
Reducir significativamente el tamaño de la TCB

Contribuciones Principales

Método de Particionamiento Basado en Anotaciones: Se propone un método práctico e intuitivo de anotación a nivel de clase (@Trusted, @Untrusted, @Neutral) para particionar aplicaciones Java
Mecanismo RMI: Se diseña un mecanismo de comunicación de objetos entre enclaves similar a RMI, implementando invocaciones de métodos remotos transparentes a través de objetos proxy
Recolección de Basura Distribuida: Se implementa una extensión de GC basada en referencias débiles, garantizando la consistencia de destrucción de objetos entre montones confiables y no confiables
Integración con GraalVM: Integración profunda con GraalVM native-image, aprovechando la compilación AOT para optimizar el rendimiento
Mejora de Rendimiento: Se logra una mejora de rendimiento significativa en aplicaciones reales (PalDB 6.6×, GraphChi 2.2×)

Explicación Detallada del Método

Definición de la Tarea

Entrada: Código fuente de aplicación Java con anotaciones de seguridad Salida: Native images particionados confiables y no confiables, desplegables en el entorno Intel SGX Restricciones: Mantener la semántica original de la aplicación, garantizar la comunicación de objetos y la consistencia de GC

Arquitectura del Sistema

El flujo de trabajo de Montsalvat incluye 4 fases principales:

1. Fase de Anotación de Código

Se proporcionan tres tipos de anotaciones:

@Trusted: Las clases e instancias siempre se crean y operan dentro del enclave
@Untrusted: Las clases e instancias siempre se operan fuera del enclave
@Neutral: Clases de utilidad que pueden existir independientemente en múltiples copias en ambos lados

2. Fase de Transformación de Bytecode

Utiliza el marco Javassist para la transformación de bytecode:

Generación de Clases Proxy:

Se genera una clase proxy para cada clase confiable en el tiempo de ejecución no confiable
Se genera una clase proxy para cada clase no confiable en el tiempo de ejecución confiable
Las clases proxy conservan las firmas de método originales, pero el cuerpo del método se reemplaza con llamadas entre enclaves

Inyección de Métodos de Retransmisión:

// El método original se transforma en un método de retransmisión
@CEntryPoint
public static void relayAccount(Isolate ctx, int hash, 
                               CCharPointer buf, int b) {
    String s = deserialize(buf);
    Account mirror = new Account(s, b);
    mirrorProxyRegistry.add(hash, mirror);
}

Mecanismo de Mapeo de Objetos:

A cada objeto proxy se le asigna un valor hash único
Se mantienen registros de mapeo proxy-objeto espejo
Se implementan referencias de objetos entre enclaves mediante valores hash

3. Particionamiento de Native Image

Aprovecha el análisis estático de GraalVM:

Imagen Confiable: Contiene implementaciones concretas de clases confiables + proxies de clases no confiables
Imagen No Confiable: Contiene implementaciones concretas de clases no confiables + proxies de clases confiables
El análisis de puntos automáticamente poda código inalcanzable

4. Generación de Aplicación SGX

Biblioteca Shim: Biblioteca ligera que intercepta llamadas libc no soportadas y las retransmite al tiempo de ejecución no confiable
Generación de EDL: Generación automática de archivos de lenguaje de definición de enclave
Enlace Final: Genera la aplicación SGX ejecutable

Puntos de Innovación Técnica

1. Estrategia de Particionamiento a Nivel de Clase

En comparación con el particionamiento a nivel de método o datos:

Se alinea mejor con la intuición de la programación orientada a objetos
Evita análisis de flujo de datos complejos
Límites de encapsulación naturales

2. Mecanismo de Proxy Transparente

Mantiene el modelo de programación original
Maneja automáticamente la serialización/deserialización de parámetros
Soporta el paso de gráficos de objetos complejos entre enclaves

3. Diseño de GC Distribuido

// Sincronización de GC basada en referencias débiles
WeakReference<ProxyObject> weakRef = new WeakReference<>(proxy);
proxyWeakRefs.add(new ProxyWeakRefEntry(weakRef, proxy.getHash()));

// Helper de GC verifica periódicamente
if (weakRef.get() == null) {
    // El objeto proxy ha sido recolectado, notifica al otro lado
    // para destruir el objeto espejo
    notifyMirrorDestruction(hash);
}

Configuración Experimental

Entorno Experimental

Hardware: CPU Intel Xeon E3-1270 (3.80 GHz), 64GB RAM
Configuración SGX: 128MB EPC (93.5MB disponible), montón máximo 4GB, pila 8MB
Software: Ubuntu 18.04, SGX SDK v2.11, GraalVM CE v21.0.0
Líneas Base de Comparación: SCONE (JVM ejecutándose dentro del enclave)

Métricas de Evaluación

Métricas de Rendimiento: Tiempo de ejecución de aplicación, latencia de operación
Análisis de Sobrecarga: Sobrecarga de creación de objetos proxy, sobrecarga de llamadas RMI, rendimiento de GC
Aceleración: Mejora de rendimiento relativa a esquemas no particionados y SCONE

Aplicaciones de Prueba

Benchmarks Sintéticos: Operaciones intensivas en CPU e I/O
PalDB: Almacén de clave-valor embebido de LinkedIn
GraphChi: Marco de procesamiento de gráficos a gran escala (algoritmo PageRank)
SPECjvm2008: Pruebas de rendimiento estándar de Java

Resultados Experimentales

Resultados Principales de Rendimiento

1. Mejora de Rendimiento en Aplicaciones Reales

PalDB: Mejora de 6.6× en comparación con SCONE (esquema RTWU), 2.8× (esquema RUTW)
GraphChi: Mejora de 2.2× en comparación con SCONE
SPECjvm2008: Mejora significativa en 5/6 benchmarks (1.38×-2.66×)

2. Análisis de Sobrecarga de Objetos Proxy

La creación de objetos proxy es 3-4 órdenes de magnitud más lenta que objetos concretos
Las llamadas RMI son 3-4 órdenes de magnitud más lentas que las llamadas locales
La serialización de parámetros añade 10× (dentro del enclave) a 3× (fuera del enclave) de sobrecarga

3. Impacto del Rendimiento de GC

GC dentro del enclave es aproximadamente 1 orden de magnitud más lento que fuera del enclave
Verificación de consistencia de GC: Los objetos espejo se limpian correctamente cuando se destruyen los objetos proxy

Experimentos de Ablación

Comparación de Estrategias de Particionamiento

Mediante pruebas de rendimiento sintéticas con diferentes proporciones de clases confiables:

Intensivo en CPU: Mover más clases fuera del enclave produce mejoras de rendimiento significativas
Intensivo en I/O: Mover operaciones de I/O fuera del enclave produce mejoras de rendimiento más evidentes

No Particionado vs Particionado vs SCONE

En todas las pruebas, el orden de rendimiento es:

Ejecución nativa (sin SGX) - Más rápido pero inseguro
Native image particionado - Equilibrio entre rendimiento y seguridad
Native image no particionado - Rendimiento medio
SCONE+JVM - Más lento pero mejor compatibilidad

Análisis de Casos

Estrategia de Particionamiento de PalDB

@Trusted class DBReader   // Operaciones de lectura sensibles protegidas
@Untrusted class DBWriter // Operaciones de escritura I/O movidas fuera del enclave

El esquema RTWU tiene mejor rendimiento porque evita costosas transiciones de escritura del enclave.

Estrategia de Particionamiento de GraphChi

@Trusted class GraphChiEngine    // Lógica de computación central protegida
@Untrusted class FastSharder     // Operaciones I/O de fragmentación de gráficos

Después de mover las operaciones de fragmentación fuera del enclave, el rendimiento se aproxima al rendimiento nativo.

Trabajo Relacionado

Soluciones de Enclave de Aplicación Completa

SCONE, Graphene-SGX, SGX-LKL: Proporcionan buena compatibilidad pero TCB excesivamente grande
Haven: Solución temprana de aplicación completa

Particionamiento Específico de Marco

VC3: Análisis de datos Hadoop
SecureKeeper: Extensión ZooKeeper
Opaque: Plataforma Spark SQL
Limitación: Solo aplicable a marcos específicos

Soluciones de Particionamiento Generalizado

Glamdring: Particionamiento automático de C/C++, no aplicable a Java
Panoply: Solución de microcontenedores
Civet: Particionamiento Java pero utiliza LibOS completo
Uranus: Anotación a nivel de método, requiere herramientas de terceros

Conclusiones y Discusión

Conclusiones Principales

Verificación de Viabilidad: El esquema de particionamiento a nivel de clase basado en anotaciones es viable e intuitivo
Ventajas de Rendimiento: Las aplicaciones particionadas muestran mejoras de rendimiento significativas en comparación con esquemas de enclave completo
Reducción de TCB: Se reduce significativamente la base de código confiable mediante la biblioteca shim en lugar de LibOS
Amigable para Desarrolladores: El método de anotación es más intuitivo para los desarrolladores

Limitaciones

Requisito de Encapsulación: Asume que todas las clases anotadas están correctamente encapsuladas (campos privados)
Sobrecarga de RMI: Las llamadas entre enclaves aún tienen sobrecarga significativa, no adecuadas para escenarios de interacción frecuente
Dependencia de GraalVM: Limitado al ecosistema de GraalVM
Limitaciones de Análisis Estático: Soporte limitado para ciertas características dinámicas

Direcciones Futuras

Llamadas sin Transformación: Investigar técnicas para reducir costosas llamadas RMI
Soporte de Múltiples Aislamientos: Extender a entornos con múltiples isolates
Particionamiento Automático: Recomendaciones de particionamiento automático basadas en análisis estático
Soporte de Otros TEE: Extender a AMD SME, ARM TrustZone

Evaluación Profunda

Fortalezas

Innovación Fuerte: Primera propuesta de esquema de particionamiento de aplicaciones Java a nivel de clase, con diseño intuitivo y razonable
Completitud de Ingeniería: Cadena de herramientas completa desde anotación hasta aplicación SGX final
Rendimiento Excelente: Demuestra mejoras de rendimiento significativas en aplicaciones reales
Alto Valor Práctico: Resuelve el problema práctico de despliegue seguro de aplicaciones Java en la nube

Deficiencias

Sobrecarga Aún Significativa: La sobrecarga de llamadas RMI sigue siendo de 3-4 órdenes de magnitud, limitando los escenarios de aplicación
Condiciones de Suposición Estrictas: Los requisitos de encapsulación de clases pueden limitar la aplicabilidad del código existente
Evaluación Incompleta: Falta evaluación de aplicaciones a gran escala y de ejecución prolongada
Análisis de Seguridad Insuficiente: Análisis limitado de protección contra amenazas avanzadas como ataques de canal lateral

Impacto

Contribución Académica: Proporciona nuevas perspectivas para el particionamiento de aplicaciones de lenguajes administrados en entornos TEE
Valor Práctico: Puede aplicarse directamente al endurecimiento de seguridad de aplicaciones Java en la nube
Reproducibilidad: Los autores se comprometen a hacer código abierto, facilitando la reproducción y extensión de la investigación

Escenarios de Aplicación

Servicios Java en la Nube: Aplicaciones en la nube que necesitan proteger lógica comercial sensible
Plataformas de Análisis de Datos: Marcos de análisis que procesan datos sensibles
Aplicaciones de Tecnología Financiera: Servicios financieros que requieren garantías de seguridad elevadas
Computación de Borde de IoT: Computación segura en entornos con recursos limitados

Referencias

El artículo cita 60 referencias relacionadas, cubriendo múltiples campos incluyendo tecnología SGX, aplicaciones TEE, seguridad Java, optimización de compilación, etc., proporcionando una base teórica sólida para esta investigación.

Evaluación General: Este es un artículo de investigación de sistemas de alta calidad que resuelve el problema práctico del despliegue de aplicaciones Java en entornos TEE. El diseño del método es razonable, la implementación es completa, los experimentos son suficientes, y posee excelente valor académico y práctico. Aunque aún hay espacio para mejora en la sobrecarga de RMI y la aplicabilidad, proporciona referencias importantes para investigaciones en campos relacionados.