2025-11-20T07:49:14.984146

Montsalvat: Partitioning Java Applications to Minimize the TCB in Intel SGX

Yuhala, MÃ©nÃ©trey, Felber et al.

The popularity of the Java programming language has led to its wide adoption in cloud computing infrastructures. However, Java applications running in untrusted clouds are vulnerable to various forms of privileged attacks. The emergence of trusted execution environments (TEEs) such as Intel SGX mitigates this problem. TEEs protect code and data in secure enclaves inaccessible to untrusted software, including the kernel and hypervisors. To efficiently use TEEs, developers must manually partition their applications into trusted and untrusted parts, in order to reduce the size of the trusted computing base (TCB) and minimise the risks of security vulnerabilities. However, partitioning applications poses two important challenges: (i) ensuring efficient object communication between the partitioned components, and (ii) ensuring the consistency of garbage collection between the parts, especially with memory-managed languages such as Java. We present Montsalvat, a tool which provides a practical and intuitive annotation-based partitioning approach for Java applications destined for secure enclaves. Montsalvat provides an RMI-like mechanism to ensure inter-object communication, as well as consistent garbage collection across the partitioned components. We implement Montsalvat with GraalVM native-image, a tool for compiling Java applications ahead-of-time into standalone native executables that do not require a JVM at runtime. Our extensive evaluation with micro- and macro-benchmarks shows our partitioning approach to boost performance in real-world applications

academic

Montsalvat: Intel SGX에서 Java 애플리케이션 분할을 통한 TCB 최소화

기본 정보

논문 ID: 2305.00766
제목: Montsalvat: Partitioning Java Applications to Minimize the TCB in Intel SGX
저자: Peterson Yuhala, Jämes Ménétrey, Pascal Felber, Valerio Schiavoni, Alain Tchana, Gaël Thomas, Hugo Guiroux, Jean-Pierre Lozi
분류: cs.CR (암호화 및 보안)
발표 학회: 제22회 국제 미들웨어 컨퍼런스 (Middleware 2021)
논문 링크: https://arxiv.org/abs/2305.00766

초록

Java 프로그래밍 언어의 광범위한 사용으로 인해 클라우드 컴퓨팅 인프라에서 널리 채택되고 있습니다. 그러나 신뢰할 수 없는 클라우드 환경에서 실행되는 Java 애플리케이션은 다양한 권한 기반 공격에 취약합니다. Intel SGX와 같은 신뢰할 수 있는 실행 환경(TEE)의 등장은 이러한 문제를 완화했습니다. TEE는 보안 엔클레이브(enclave) 내의 코드와 데이터를 커널 및 하이퍼바이저를 포함한 신뢰할 수 없는 소프트웨어의 접근으로부터 보호합니다. TEE를 효율적으로 사용하기 위해 개발자는 애플리케이션을 신뢰할 수 있는 부분과 신뢰할 수 없는 부분으로 수동으로 분할하여 신뢰할 수 있는 컴퓨팅 기반(TCB)의 크기를 줄이고 보안 취약점의 위험을 최소화해야 합니다. 본 논문은 보안 엔클레이브를 대상으로 하는 Java 애플리케이션을 위한 실용적이고 직관적인 주석 기반 분할 방법을 제공하는 Montsalvat 도구를 제시합니다. Montsalvat은 RMI와 유사한 메커니즘을 제공하여 객체 간 통신을 보장하고, 분할된 컴포넌트 간의 일관된 가비지 컬렉션을 제공합니다.

연구 배경 및 동기

문제 정의

보안 위협: 신뢰할 수 없는 클라우드 환경에서 실행되는 Java 애플리케이션은 커널 수준 및 하이퍼바이저 수준의 공격을 포함한 권한 기반 공격의 위협에 노출됨
TCB 최소화 필요성: Intel SGX와 같은 TEE 사용 시 공격 표면을 줄이기 위해 신뢰할 수 있는 컴퓨팅 기반을 최소화해야 함
분할 복잡성: Java 애플리케이션의 수동 분할은 객체 통신 및 가비지 컬렉션 일관성 등의 복잡한 문제를 처리해야 함

기존 방안의 한계

완전한 애플리케이션 방안: SCONE, Graphene-SGX 등은 전체 애플리케이션(JVM 포함)을 엔클레이브에 배치하여 TCB가 과도함(수백만 줄의 코드)
프레임워크 특정 방안: VC3, SecureKeeper 등은 특정 프레임워크에만 적용되어 일반성 부족
기존 Java 분할 방안:
- Civet은 완전한 LibOS가 필요하여 TCB가 여전히 큼
- Uranus는 신뢰할 수 있는 분할을 추론하기 위해 제3자 도구가 필요하여 개발자 개입이 많음

연구 동기

다음을 수행할 수 있는 범용적이고 자동화된 Java 애플리케이션 분할 도구 개발:

직관적인 클래스 수준 주석 방식 제공
효율적인 엔클레이브 간 객체 통신 구현
분산 가비지 컬렉션 일관성 보장
TCB 크기 대폭 감소

핵심 기여

주석 기반 분할 방법: 클래스 수준 주석(@Trusted, @Untrusted, @Neutral)을 사용하여 Java 애플리케이션을 분할하는 실용적이고 직관적인 방법 제시
RMI 메커니즘: 프록시 객체를 통해 투명한 원격 메서드 호출을 구현하는 엔클레이브 간 객체 통신 메커니즘 설계
분산 가비지 컬렉션: 약한 참조 기반 GC 확장을 구현하여 신뢰할 수 있는 힙과 신뢰할 수 없는 힙 간의 객체 소멸 일관성 보장
GraalVM 통합: GraalVM native-image와의 심층 통합으로 AOT 컴파일 성능 최적화
성능 향상: 실제 애플리케이션에서 상당한 성능 향상 달성(PalDB 6.6×, GraphChi 2.2×)

방법 상세 설명

작업 정의

입력: 보안 주석이 있는 Java 애플리케이션 소스 코드 출력: Intel SGX 환경에 배포 가능한 분할된 신뢰할 수 있는 및 신뢰할 수 없는 네이티브 이미지 제약 조건: 원래 애플리케이션 의미론 유지, 객체 통신 및 GC 일관성 보장

시스템 아키텍처

Montsalvat의 워크플로우는 4가지 주요 단계로 구성됩니다:

1. 코드 주석 단계

세 가지 주석 유형 제공:

@Trusted: 클래스 및 해당 인스턴스는 항상 엔클레이브 내에서 생성 및 조작됨
@Untrusted: 클래스 및 해당 인스턴스는 항상 엔클레이브 외부에서 조작됨
@Neutral: 도구 클래스로, 양쪽에서 독립적으로 여러 복사본이 존재할 수 있음

2. 바이트코드 변환 단계

Javassist 프레임워크를 사용한 바이트코드 변환:

프록시 클래스 생성:

신뢰할 수 없는 런타임에서 각 신뢰할 수 있는 클래스에 대한 프록시 클래스 생성
신뢰할 수 있는 런타임에서 각 신뢰할 수 없는 클래스에 대한 프록시 클래스 생성
프록시 클래스는 원본 메서드 서명을 유지하지만 메서드 본문은 엔클레이브 간 호출로 대체됨

중계 메서드 주입:

// 원본 메서드를 중계 메서드로 변환
@CEntryPoint
public static void relayAccount(Isolate ctx, int hash, 
                               CCharPointer buf, int b) {
    String s = deserialize(buf);
    Account mirror = new Account(s, b);
    mirrorProxyRegistry.add(hash, mirror);
}

객체 매핑 메커니즘:

각 프록시 객체에 고유 해시값 할당
프록시-미러 객체 레지스트리 유지
해시값을 통한 엔클레이브 간 객체 참조 구현

3. 네이티브 이미지 분할

GraalVM의 정적 분석 활용:

신뢰할 수 있는 이미지: 신뢰할 수 있는 클래스 구체적 구현 + 신뢰할 수 없는 클래스 프록시 포함
신뢰할 수 없는 이미지: 신뢰할 수 없는 클래스 구체적 구현 + 신뢰할 수 있는 클래스 프록시 포함
포인트-투 분석이 도달 불가능한 코드를 자동으로 제거

4. SGX 애플리케이션 생성

Shim 라이브러리: 지원되지 않는 libc 호출을 가로채고 신뢰할 수 없는 런타임으로 중계하는 경량 라이브러리
EDL 생성: enclave 정의 언어 파일 자동 생성
최종 링크: 실행 가능한 SGX 애플리케이션 생성

기술 혁신 포인트

1. 클래스 수준 분할 전략

메서드 수준 또는 데이터 수준 분할과 비교:

객체 지향 프로그래밍 직관과 더 잘 맞음
복잡한 데이터 흐름 분석 회피
자연스러운 캡슐화 경계

2. 투명한 프록시 메커니즘

원래 프로그래밍 모델 유지
매개변수 직렬화/역직렬화 자동 처리
복잡한 객체 그래프의 엔클레이브 간 전달 지원

3. 분산 GC 설계

// 약한 참조 기반 GC 동기화
WeakReference<ProxyObject> weakRef = new WeakReference<>(proxy);
proxyWeakRefs.add(new ProxyWeakRefEntry(weakRef, proxy.getHash()));

// GC 헬퍼가 주기적으로 확인
if (weakRef.get() == null) {
    // 프록시 객체가 GC됨, 미러 객체 소멸 알림
    notifyMirrorDestruction(hash);
}

실험 설정

실험 환경

하드웨어: Intel Xeon E3-1270 CPU (3.80 GHz), 64GB RAM
SGX 구성: 128MB EPC (93.5MB 사용 가능), 최대 힙 4GB, 스택 8MB
소프트웨어: Ubuntu 18.04, SGX SDK v2.11, GraalVM CE v21.0.0
비교 기준: SCONE (엔클레이브 내 JVM 실행)

평가 지표

성능 지표: 애플리케이션 실행 시간, 작업 지연 시간
오버헤드 분석: 프록시 객체 생성 오버헤드, RMI 호출 오버헤드, GC 성능
가속 비율: 분할되지 않은 방식 및 SCONE 방식 대비 성능 향상

테스트 애플리케이션

합성 벤치마크: CPU 집약적 및 I/O 집약적 작업
PalDB: LinkedIn의 임베디드 키-값 저장소
GraphChi: 대규모 그래프 처리 프레임워크(PageRank 알고리즘)
SPECjvm2008: 표준 Java 마이크로 벤치마크 테스트

실험 결과

주요 성능 결과

1. 실제 애플리케이션 성능 향상

PalDB: SCONE 대비 6.6× 향상 (RTWU 방식), 2.8× 향상 (RUTW 방식)
GraphChi: SCONE 대비 2.2× 향상
SPECjvm2008: 6개 벤치마크 중 5개에서 상당한 향상(1.38×-2.66×)

2. 프록시 객체 오버헤드 분석

프록시 객체 생성은 구체적 객체보다 3-4 자릿수 느림
RMI 호출은 로컬 호출보다 3-4 자릿수 느림
직렬화된 매개변수는 10×(엔클레이브 내) ~ 3×(엔클레이브 외) 오버헤드 증가

3. GC 성능 영향

엔클레이브 내 GC는 엔클레이브 외 GC보다 1 자릿수 느림
GC 일관성 검증: 프록시 객체 소멸 시 미러 객체가 올바르게 정리됨

소거 실험

분할 전략 비교

합성 벤치마크를 통한 다양한 신뢰할 수 있는 클래스 비율 테스트:

CPU 집약적: 더 많은 클래스를 엔클레이브 외부로 이동 시 성능 향상 현저함
I/O 집약적: I/O 작업을 엔클레이브 외부로 이동 시 성능 향상 더 명확함

분할되지 않음 vs 분할됨 vs SCONE

모든 테스트에서 성능 순서:

네이티브 실행(SGX 없음) - 가장 빠르지만 안전하지 않음
분할된 네이티브 이미지 - 성능과 보안의 균형
분할되지 않은 네이티브 이미지 - 중간 성능
SCONE+JVM - 가장 느리지만 호환성 최고

사례 분석

PalDB 분할 전략

@Trusted class DBReader   // 민감한 읽기 작업 보호
@Untrusted class DBWriter // I/O 쓰기 작업을 엔클레이브 외부로

RTWU 방식이 더 우수한 성능을 보이는 이유는 비용이 많이 드는 쓰기 작업 엔클레이브 전환을 회피하기 때문입니다.

GraphChi 분할 전략

@Trusted class GraphChiEngine    // 핵심 계산 로직 보호
@Untrusted class FastSharder     // 그래프 분할 I/O 작업

분할 작업을 엔클레이브 외부로 이동 후 네이티브 성능에 가까워집니다.

결론 및 논의

주요 결론

실행 가능성 검증: 주석 기반 클래스 수준 분할 방안이 실행 가능하고 직관적임
성능 이점: 분할된 애플리케이션은 완전한 엔클레이브 방안 대비 상당한 성능 향상
TCB 감소: LibOS 대신 shim 라이브러리를 통해 신뢰할 수 있는 코드 기반 대폭 감소
개발 친화성: 주석 방식이 개발자에게 더 직관적

한계

캡슐화 요구사항: 모든 주석 클래스가 올바르게 캡슐화되어 있다고 가정(비공개 필드)
RMI 오버헤드: 엔클레이브 간 호출에 여전히 상당한 오버헤드 존재, 빈번한 상호작용 시나리오에 부적합
GraalVM 의존성: GraalVM 생태계로 제한됨
정적 분석 한계: 특정 동적 기능 지원 제한

향후 방향

무전환 호출: 비용이 많이 드는 RMI를 줄이는 기술 연구
다중 격리 지원: 다중 isolate 환경으로 확장
자동 분할: 정적 분석 기반 자동 분할 추천
기타 TEE 지원: AMD SME, ARM TrustZone으로 확장

심층 평가

장점

높은 혁신성: 클래스 수준의 Java 애플리케이션 분할 방안을 처음 제시하며 설계가 직관적이고 합리적
공학적 완성도: 주석에서 최종 SGX 애플리케이션까지의 완전한 도구 체인
우수한 성능: 실제 애플리케이션에서 상당한 성능 향상 입증
높은 실용 가치: Java 애플리케이션의 안전한 클라우드 배포 문제 해결

부족한 점

여전한 높은 오버헤드: RMI 호출 오버헤드가 여전히 3-4 자릿수로 적용 시나리오 제한
엄격한 가정 조건: 클래스 캡슐화에 대한 요구사항이 기존 코드의 적용성을 제한할 수 있음
평가 불충분: 대규모, 장기 실행 애플리케이션 평가 부족
보안 분석 부족: 측면 채널 공격 등 고급 위협에 대한 방어 분석 제한

영향력

학술 기여: TEE 환경에서 관리형 언어 애플리케이션 분할에 새로운 사고 제시
실용 가치: Java 클라우드 애플리케이션의 보안 강화에 직접 적용 가능
재현 가능성: 저자가 오픈소스 공개 약속으로 연구 재현 및 확장 용이

적용 시나리오

클라우드 Java 서비스: 민감한 비즈니스 로직 보호가 필요한 클라우드 애플리케이션
데이터 분석 플랫폼: 민감한 데이터를 처리하는 분석 프레임워크
금융 기술 애플리케이션: 높은 보안 보장이 필요한 금융 서비스
IoT 엣지 컴퓨팅: 리소스 제한 환경에서의 안전한 컴퓨팅

참고 문헌

본 논문은 SGX 기술, TEE 애플리케이션, Java 보안, 컴파일 최적화 등 여러 분야의 중요한 연구를 포함하는 60편의 관련 문헌을 인용하여 본 연구에 견고한 이론적 기초를 제공합니다.

종합 평가: 이는 Java 애플리케이션의 TEE 환경 실제 배포 문제를 해결하는 고품질의 시스템 연구 논문입니다. 방법 설계가 합리적이고 구현이 완전하며 실험이 충분하여 우수한 학술 가치와 실용적 의의를 갖고 있습니다. RMI 오버헤드 및 적용성 측면에서 개선의 여지가 있지만, 관련 분야 연구에 중요한 참고 자료를 제공합니다.