Context: Consistent requirements and system specifications are essential for the compliance of software systems towards the General Data Protection Regulation (GDPR). Both artefacts need to be grounded in the original text and conjointly assure the achievement of privacy by design (PbD). Objectives: There is little understanding of the perspectives of practitioners on specification objectives and goals to address PbD. Existing approaches do not account for the complex intersection between problem and solution space expressed in GDPR. In this study we explore the demand for conjoint requirements and system specification for PbD and suggest an approach to address this demand. Methods: We reviewed secondary and related primary studies and conducted interviews with practitioners to (1) investigate the state-of-practice and (2) understand the underlying specification objectives and goals (e.g., traceability). We developed and evaluated an approach for requirements and systems specification for PbD, and evaluated it against the specification objectives. Results: The relationship between problem and solution space, as expressed in GDPR, is instrumental in supporting PbD. We demonstrate how our approach, based on the modeling GDPR content with original legal concepts, contributes to specification objectives of capturing legal knowledge, supporting specification transparency, and traceability. Conclusion: GDPR demands need to be addressed throughout different levels of abstraction in the engineering lifecycle to achieve PbD. Legal knowledge specified in the GDPR text should be captured in specifications to address the demands of different stakeholders and ensure compliance. While our results confirm the suitability of our approach to address practical needs, we also revealed specific needs for the future effective operationalization of the approach.
- 논문 ID: 2510.21591
- 제목: Privacy by Design: Aligning GDPR and Software Engineering Specifications with a Requirements Engineering Approach
- 저자: Oleksandr Kosenkov, Ehsan Zabardast, Davide Fucci, Daniel Mendez, Michael Unterkalmsteiner
- 분류: cs.SE (소프트웨어 공학)
- 발표 시간: 2025년 10월 31일 (arXiv v2)
- 논문 링크: https://arxiv.org/abs/2510.21591
본 연구는 GDPR 준수에서 요구사항과 시스템 명세의 일관성 문제를 해결하기 위해 프라이버시 바이 디자인(Privacy by Design, PbD)의 요구사항 공학 방법을 탐색합니다. 문헌 검토와 실무자 인터뷰를 통해 명세 목표를 식별하고, GDPR 원본 법률 개념 모델링을 기반으로 한 통합 요구사항 및 시스템 명세 방법을 제안합니다. 결과는 이 방법이 법률 지식 포착, 명세 투명성 및 추적 가능성 지원에 효과적임을 보여줍니다.
- 핵심 문제: 기존 GDPR 준수 방법은 요구사항 공학(RE)과 소프트웨어 설계 아키텍처(SDA) 단계 간의 복잡한 상호작용을 체계적으로 처리하지 못하여, 프라이버시 설계 구현에서 일관성과 추적 가능성이 부족합니다.
- 문제의 중요성:
- GDPR 제25조는 "설계에 의한 프라이버시 보호"를 요구하며, 설계 단계에서 프라이버시 제어를 내장해야 함
- 규제 준수는 소프트웨어 개발 생명주기(SDLC)의 여러 단계에 영향을 미침
- GDPR은 이질적인 소프트웨어 측면(소프트웨어 품질 및 사용자 행동)을 포함함
- 기존 방법의 한계:
- 체계적인 요구사항 및 시스템(R&S) 명세 방법 부재
- 기존 연구는 주로 RE 또는 SDA의 단일 관점에 초점
- 규제 해석의 투명성 부족, 법률과 공학 관점 간의 연결 부재
- 연구 동기:
- GDPR 텍스트와 공학 명세 간의 추적 가능한 연결 구축
- 다양한 이해관계자의 협업 요구 지원
- 체계적인 법률 지식 포착 방법 제공
- PbD에 필요한 R&S 명세 방법을 특성화하기 위한 5가지 주요 R&S 명세 목표 식별
- 실무자 명세 목표 개요 제공, R&S 명세 방법 적용 시 실무자가 달성하려는 목표 공개
- 체계적인 R&S 명세 내용 모델링 방법 제안 및 초기 평가 수행
- 법률 영역 지식과 소프트웨어 명세 간의 체계적 연결 구축, PbD의 통합 요구사항 및 시스템 명세 체계화 촉진
본 연구는 문헌 검토(LR), 후보 방법 종합(CA), 반구조화 인터뷰(IN), 개념 평가(EV)의 4가지 주요 단계를 포함하는 혼합 방법을 채택합니다.
- 3단계 문헌 검토:
- 3차 연구: 2차 연구 검색 및 분석
- 2차 연구: 2차 연구에서 선정한 주요 연구 분석
- 임시 문헌 검토: 이전 두 단계의 결과 보완
- 연구 질문:
- RQ1: PbD 및 R&S 명세의 연구 현황
- RQ2: 기존 방법에서 도출된 요구사항 및 시스템 구성요소
- RQ3: R&S 명세가 달성해야 할 명세 목표
법률 개념을 기반으로 설계된 3계층 개념 모델:
- 법률 객체(Legal Object): 법률 관계 또는 행위에 참여하는 유형 또는 무형 실체
- 규제 대상(Target of Regulation): 기존 소프트웨어 시스템 구성요소, 규정에 포함된 조직 프로세스
- 준수 제어(Compliance Control): 규제 대상을 처리하기 위한 새로운 또는 기존 구성요소, 프로세스
- 기준(Criterion): 준수 제어 및/또는 규제 대상이 법률 관점에서 수용 가능한 속성
- 요구사항 명세 계층: 시스템 수준 명세에 특정하지 않은 추상 개념 포함, 추가 해석 필요
- 시스템 명세 계층: 시스템과 직접 관련된 개념 포함, 추가 해석 불필요
- 목적적 표본 추출 및 눈덩이 표본 추출 방법 사용
- 12명의 참여자, 8개 회사에서 다양한 규모 대표
- 기술 리더, 아키텍트, 데이터 엔지니어, 보안 관리자 등 역할 포함
목표-질문-지표(GQM) 방법을 사용한 구조화된 인터뷰:
- 개념 계층: 달성할 목표 정의
- 운영 계층: 목표 달성 평가 질문 정의
- 정량 계층: 질문 답변에 필요한 지표 또는 데이터 정의
- 검색 범위: Scopus 데이터베이스
- 검색 전략: 체계적 검색 및 눈덩이 표본 추출
- 선정 기준: RE 및 SDA 동시 고려, R&S 명세 보고, 영문, 동료 검토
- 인터뷰 시간: 평균 60-90분
- 인터뷰 방식: 온라인 및 오프라인 병행
- 데이터 분석: Taguette 도구를 사용한 코딩, 연역적 코딩 방법 사용
- 참여자: 인터뷰 참여자 중 9명 모집
- 작업 설계: GDPR 조항 주석 및 명세 내용 모델 구축
- 평가 기준: 저자가 구축한 기준 진실과 비교
문헌 검토를 통해 5가지 핵심 명세 목표(SO) 식별:
- SO1: 법률 영역 지식 및 목표 포착 (중요도 순위: 1, 중앙값 점수: 5)
- SO2: 명세의 추적 가능성 및 일관성 (중요도 순위: 2, 중앙값 점수: 4)
- SO3: 준수 및 비준수 관심사 분리 (중요도 순위: 5, 중앙값 점수: 1)
- SO4: 시스템 명세 투명성 및 개요 (중요도 순위: 3, 중앙값 점수: 4.5)
- SO5: 시스템 유연성을 지원하는 명세 (중요도 순위: 4, 중앙값 점수: 4)
- 현황 분석: 대부분의 실무자는 전문 PbD R&S 명세 방법을 사용하지 않으며, 임시 방법 및 기존 방법 재사용 채택
- 핵심 특성 요구사항:
- GDPR 준수 제어 구현 지원
- 규제 대상 데이터 유형의 분리 및 추적
- GDPR 명세의 구체화
- GDPR의 이해 가능성 및 해석 가능성 촉진
- 명세 목표 중요도: SO1(법률 지식 포착)이 가장 중요하며, 그 다음 SO2(추적 가능성) 및 SO4(투명성)
- 실무자는 제한된 정도로 후보 방법 사용 가능
- 90개 주석(9명 참여자 × 10개 기준 주석) 중 29개 미식별
- 61개 식별된 주석 중 19개만 완전히 정확하게 식별
각 명세 목표의 평가 결과(중앙값 점수):
- SO1(법률 지식 포착): 5(유용함)
- SO4(명세 투명성): 5(유용함)
- SO2(추적 가능성): 4(아마도 유용함)
- SO5(시스템 유연성): 4(아마도 유용함)
- SO3(관심사 분리): 2(아마도 유용하지 않음)
기존 방법과 비교하여 후보 방법이 더 많은 요구사항 및 시스템 구성요소 식별:
- 요구사항: 15개 vs 최대 13개(다른 방법)
- 시스템 구성요소: 13개 vs 최대 10개(다른 방법)
- 법률 지식 포착의 중요성: 실무자는 법률 지식 포착이 가장 중요한 명세 목표임을 일관되게 인정
- 추적 가능성의 복잡성: 다양한 역할이 추적 가능성에 대해 서로 다른 요구사항을 가지며, 기술 역할은 R&S 명세 간 추적 가능성에 더 초점
- 투명성과 소통: 명세 투명성은 모든 이해관계자에게 동일하게 중요하지만, 필요한 정보 세분화 수준이 다름
- 방법 적용 과제:
- GDPR 텍스트의 동의어 처리 어려움
- 관련 개념 식별의 복잡성
- 주석 및 모델링 결과에 대한 실무자의 불확실성
- 대부분의 연구는 비즈니스 프로세스 준수, 독립적 솔루션 또는 데이터 제어 메커니즘에 초점
- GDPR 준수를 전체 SDLC 단계에 통합하는 연구 부재
- 기존 연구는 주로 RE 또는 SDA 단일 관점에서 출발
- GDPR을 PbD 요구사항의 원천으로 체계적으로 처리하는 방법 부재
- R&S 명세를 동시에 고려하는 연구 극소수
- 기존 방법은 투명한 요구사항 및 시스템 명세 도출 프로세스 부재
- 대부분의 연구는 법률 정보학 및 RE 목적의 GDPR 모델링에 초점
- GDPR 텍스트를 체계적으로 처리하여 해당 모델을 도출하는 방법 부재
- 연합 명세의 필요성: 4가지 명세 목표(SO1, SO2, SO3, SO4)는 R&S 명세의 연합을 통해 달성 필요
- 추적 가능성의 핵심 역할: 추적 가능성은 PbD를 보장하는 핵심 명세 목표이지만, 명세 투명성 및 법률 영역 지식의 지원 필요
- 법률 지식 모델링의 효과성: GDPR 원본 법률 개념을 기반으로 한 모델링 방법은 법률 지식 포착 및 명세 투명성 촉진에 효과적
- 추상화 수준의 중요성: GDPR 요구사항은 PbD 달성을 위해 공학 생명주기의 다양한 추상화 수준에서 처리 필요
- 방법 적용 복잡성: 실무자가 개념 모델을 사용하여 GDPR 텍스트 주석 및 명세 내용 모델 구축을 효과적으로 적용하기 어려움
- 평가 범위 제한: 평가는 4개 GDPR 조항의 발췌만 포함하며, 실제 산업 환경에서 추가 검증 필요
- 운영화 과제: 산업 환경에서 제안된 방법을 효과적으로 운영화하는 방법에 대한 추가 연구 필요
- 참여자 대표성: 다양한 역할을 포함하지만 표본 규모가 상대적으로 제한적
- 방법 운영화: 다양한 조직 환경 및 공학 모델에서 방법 적용을 지원하기 위한 템플릿 또는 도구 개발
- 적용 범위 확대: 방법을 GDPR을 보완하는 보조 규제 자원 및 준수 설계를 요구하는 기타 규정에 적용
- 사례 평가: 산업 환경에서 사례 기반 평가 수행, 명세 목표 달성에 대한 방법의 지원 능력 검증
- 역할 특이성 연구: 특정 소프트웨어 공학 역할의 특정 명세 목표에 대한 중요도 인식 차이 조사
- 체계적 방법: GDPR 준수의 R&S 명세 관계를 처리하는 첫 번째 체계적 방법 제공, 중요한 연구 공백 해소
- 견고한 실증 기초: 문헌 검토, 실무자 인터뷰, 개념 평가를 결합한 혼합 방법으로 충분한 실증 지원 제공
- 높은 실용 가치: 식별된 명세 목표 및 실무자 통찰력은 실무에 구체적인 지침 제공
- 방법론 혁신: 법률 개념 기반 내용 모델링 방법은 혁신적이며 법률 텍스트와 공학 명세 간의 직접적 연결 가능
- 높은 투명성: 연구 프로세스 및 데이터 공개 투명, 결과의 재현 가능성 지원
- 방법 복잡성: 제안된 방법은 실무자에게 적용 난이도가 높으며, 법률 및 기술 이중 전문 지식 필요
- 평가 깊이 제한: 개념 평가는 주로 문서 필터링 및 단순 실험 기반, 실제 프로젝트 환경의 심층 검증 부족
- 표본 규모: 인터뷰 참여자 수 상대적으로 제한적(12명), 결과의 보편성에 영향 가능
- 규제 범위: 주로 GDPR 핵심 개념에 초점, 기타 중요 규제 조항의 범위 가능성 불충분
- 학술 기여: 프라이버시 공학 및 요구사항 공학 분야에 중요한 이론 프레임워크 및 실증 기초 제공
- 실무 지침: 소프트웨어 실무자에게 GDPR 준수의 구체적 명세 목표 및 방법 지침 제공
- 정책 영향: 연구 결과는 관련 정책 제정 및 표준 개발에 참고 자료 제공 가능
- 향후 연구: 후속 연구를 위한 견고한 기초 및 명확한 발전 방향 제공
- 소프트웨어 개발 조직: GDPR 준수를 구현해야 하는 소프트웨어 개발 팀 및 조직
- 요구사항 공학 실무: 규제 준수 요구사항을 포함하는 요구사항 공학 프로젝트
- 프라이버시 공학: 프라이버시 요구사항을 체계적으로 처리해야 하는 공학 프로젝트
- 규제 준수 컨설팅: 기업에 GDPR 준수 컨설팅 서비스를 제공하는 전문 기관
논문은 풍부한 관련 문헌을 인용하며, 주요 내용은 다음과 같습니다:
- GDPR 준수 연구: Leite et al. (2022), Kempe & Massey (2021)
- 프라이버시 설계 이론: Cavoukian (2012), Gürses et al. (2011)
- 요구사항 공학 방법: Kitchenham (2007), Runeson et al. (2009)
- 소프트웨어 아키텍처 연구: Bass et al. (2006), Galster et al. (2009)
- 법률 정보학: Palmirani et al. (2018), Robaldo et al. (2024)
본 논문은 프라이버시 공학 및 GDPR 준수 분야에서 중요한 기여를 하였으며, 체계적인 이론 프레임워크 및 실용 방법을 제공하여 해당 분야의 추가 발전을 위한 견고한 기초를 마련했습니다. 방법 운영화 측면에서 추가 개선이 필요하지만, 그 연구 가치와 실무 의의는 부인할 수 없습니다.