Context: Consistent requirements and system specifications are essential for the compliance of software systems towards the General Data Protection Regulation (GDPR). Both artefacts need to be grounded in the original text and conjointly assure the achievement of privacy by design (PbD). Objectives: There is little understanding of the perspectives of practitioners on specification objectives and goals to address PbD. Existing approaches do not account for the complex intersection between problem and solution space expressed in GDPR. In this study we explore the demand for conjoint requirements and system specification for PbD and suggest an approach to address this demand. Methods: We reviewed secondary and related primary studies and conducted interviews with practitioners to (1) investigate the state-of-practice and (2) understand the underlying specification objectives and goals (e.g., traceability). We developed and evaluated an approach for requirements and systems specification for PbD, and evaluated it against the specification objectives. Results: The relationship between problem and solution space, as expressed in GDPR, is instrumental in supporting PbD. We demonstrate how our approach, based on the modeling GDPR content with original legal concepts, contributes to specification objectives of capturing legal knowledge, supporting specification transparency, and traceability. Conclusion: GDPR demands need to be addressed throughout different levels of abstraction in the engineering lifecycle to achieve PbD. Legal knowledge specified in the GDPR text should be captured in specifications to address the demands of different stakeholders and ensure compliance. While our results confirm the suitability of our approach to address practical needs, we also revealed specific needs for the future effective operationalization of the approach.
- ID del Artículo: 2510.21591
- Título: Privacy by Design: Aligning GDPR and Software Engineering Specifications with a Requirements Engineering Approach
- Autores: Oleksandr Kosenkov, Ehsan Zabardast, Davide Fucci, Daniel Mendez, Michael Unterkalmsteiner
- Clasificación: cs.SE (Ingeniería de Software)
- Fecha de Publicación: 31 de octubre de 2025 (arXiv v2)
- Enlace del Artículo: https://arxiv.org/abs/2510.21591
Esta investigación aborda el problema de la consistencia entre requisitos y especificaciones del sistema en el cumplimiento del GDPR, explorando métodos de ingeniería de requisitos para la privacidad por diseño (Privacy by Design, PbD). A través de una revisión de literatura y entrevistas con profesionales, el estudio identifica objetivos de especificación y propone un método integrado de requisitos y especificaciones del sistema basado en el modelado de conceptos legales originales del GDPR. Los resultados demuestran la efectividad del método en la captura de conocimiento legal, el apoyo a la transparencia de especificaciones y la trazabilidad.
- Problema Central: Los métodos existentes de cumplimiento del GDPR carecen de un tratamiento sistemático de las relaciones complejas entre la ingeniería de requisitos (RE) y las fases de arquitectura de diseño de software (SDA), resultando en falta de consistencia y trazabilidad en la implementación del diseño de privacidad.
- Importancia del Problema:
- El Artículo 25 del GDPR requiere "privacidad por diseño", necesitando integrar controles de privacidad desde la fase de diseño
- El cumplimiento normativo afecta múltiples fases del ciclo de vida del desarrollo de software (SDLC)
- El GDPR involucra aspectos heterogéneos del software (calidad del software y comportamiento del usuario)
- Limitaciones de Métodos Existentes:
- Carencia de un método sistemático de especificación de requisitos y sistema (R&S)
- La investigación existente se enfoca principalmente en perspectivas únicas de RE o SDA
- Transparencia insuficiente en la interpretación normativa, falta de puentes entre perspectivas legales e ingenieriles
- Motivación de la Investigación:
- Establecer conexiones de trazabilidad entre el texto del GDPR y las especificaciones ingenieriles
- Apoyar las necesidades de colaboración de diferentes partes interesadas
- Proporcionar un método sistemático de captura de conocimiento legal
- Identificación de cinco objetivos principales de especificación R&S para caracterizar el método de especificación R&S requerido por PbD
- Provisión de una descripción general de objetivos de especificación de profesionales, revelando los objetivos que los profesionales buscan lograr al aplicar métodos de especificación R&S
- Propuesta de un método sistemático de modelado de contenido de especificación R&S con evaluación preliminar
- Establecimiento de conexiones sistemáticas entre conocimiento del dominio legal y especificaciones de software, promoviendo la sistematización de requisitos integrados y especificaciones del sistema para PbD
Esta investigación emplea un método mixto que incluye cuatro fases principales: revisión de literatura (LR), síntesis de método candidato (CA), entrevistas semiestructuradas (IN) y evaluación conceptual (EV).
- Revisión de Literatura en Tres Fases:
- Investigación de Tercer Nivel: búsqueda y análisis de investigación secundaria
- Investigación de Segundo Nivel: análisis de investigación principal seleccionada de investigación secundaria
- Revisión de Literatura Provisional: complementar los resultados de las dos fases anteriores
- Preguntas de Investigación:
- RQ1: Estado actual de la investigación en PbD y especificación R&S
- RQ2: Componentes de requisitos y sistema derivados de métodos existentes
- RQ3: Objetivos de especificación que necesita lograr la especificación R&S
Se diseñó un modelo conceptual de tres capas basado en conceptos legales:
- Objeto Legal (Legal Object): Entidades tangibles o intangibles que participan en relaciones o comportamientos legales
- Objetivo de Regulación (Target of Regulation): Componentes del sistema de software existentes, procesos organizacionales involucrados en la regulación
- Control de Cumplimiento (Compliance Control): Componentes o procesos nuevos o existentes utilizados para abordar objetivos de regulación
- Criterio (Criterion): Atributos de controles de cumplimiento y/u objetivos de regulación que son aceptables desde una perspectiva legal
- Capa de Especificación de Requisitos: Contiene conceptos abstractos no específicos de especificación a nivel de sistema, requiriendo interpretación adicional
- Capa de Especificación del Sistema: Contiene conceptos directamente relacionados con el sistema, sin necesidad de interpretación adicional
- Empleo de muestreo intencional y método de bola de nieve
- 12 participantes de 8 empresas de diferentes tamaños
- Cobertura de roles incluyendo directores técnicos, arquitectos, ingenieros de datos, administradores de seguridad, etc.
Empleo del método Goal-Question-Metric (GQM) para estructurar entrevistas:
- Nivel Conceptual: Definición de objetivos a lograr
- Nivel Operacional: Definición de preguntas para evaluar el logro de objetivos
- Nivel Cuantitativo: Definición de métricas o datos necesarios para responder preguntas
- Rango de Búsqueda: Base de datos Scopus
- Estrategia de Búsqueda: Búsqueda sistemática y muestreo de bola de nieve
- Criterios de Selección: Consideración simultánea de RE y SDA, reporte de especificación R&S, idioma inglés, revisión por pares
- Duración de Entrevistas: Promedio de 60-90 minutos
- Modalidad de Entrevistas: Combinación de en línea y presencial
- Análisis de Datos: Codificación utilizando herramienta Taguette, método de codificación deductiva
- Participantes: 9 participantes reclutados de entrevistadores
- Diseño de Tareas: Anotación de artículos del GDPR y construcción de modelo de contenido de especificación
- Criterios de Evaluación: Comparación con valor de verdad de referencia establecido por autores
Se identificaron cinco objetivos de especificación central (SO) a través de revisión de literatura:
- SO1: Captura de Conocimiento y Objetivos del Dominio Legal (Ranking de Importancia: 1, Puntuación Mediana: 5)
- SO2: Trazabilidad y Consistencia de Especificación (Ranking de Importancia: 2, Puntuación Mediana: 4)
- SO3: Separación de Preocupaciones de Cumplimiento y No Cumplimiento (Ranking de Importancia: 5, Puntuación Mediana: 1)
- SO4: Transparencia y Descripción General de Especificación del Sistema (Ranking de Importancia: 3, Puntuación Mediana: 4.5)
- SO5: Especificación que Apoye la Flexibilidad del Sistema (Ranking de Importancia: 4, Puntuación Mediana: 4)
- Análisis de Situación Actual: La mayoría de profesionales no utilizan métodos especializados de especificación R&S de PbD, sino que emplean métodos ad hoc y reutilización de métodos existentes
- Requisitos de Características Clave:
- Apoyo a la implementación de controles de cumplimiento del GDPR
- Separación y seguimiento de tipos de datos regulados
- Concretización de especificaciones del GDPR
- Promoción de comprensibilidad e interpretabilidad del GDPR
- Importancia de Objetivos de Especificación: SO1 (captura de conocimiento legal) fue evaluado como más importante, seguido por SO2 (trazabilidad) y SO4 (transparencia)
- Los profesionales pueden utilizar el método candidato en grado limitado
- De 90 anotaciones (9 participantes × 10 anotaciones de referencia), 29 no fueron identificadas
- De 61 anotaciones identificadas, solo 19 fueron identificadas completamente correctas
Resultados de evaluación de cada objetivo de especificación (puntuación mediana):
- SO1 (captura de conocimiento legal): 5 (útil)
- SO4 (transparencia de especificación): 5 (útil)
- SO2 (trazabilidad): 4 (posiblemente útil)
- SO5 (flexibilidad del sistema): 4 (posiblemente útil)
- SO3 (separación de preocupaciones): 2 (posiblemente no útil)
En comparación con métodos existentes, el método candidato identificó más requisitos y componentes del sistema:
- Requisitos: 15 vs máximo 13 (otros métodos)
- Componentes del sistema: 13 vs máximo 10 (otros métodos)
- Importancia de la Captura de Conocimiento Legal: Los profesionales coincidieron en que la captura de conocimiento legal es el objetivo de especificación más importante
- Complejidad de la Trazabilidad: Diferentes roles tienen diferentes necesidades de trazabilidad, con roles técnicos enfocándose más en trazabilidad entre especificaciones R&S
- Transparencia y Comunicación: La transparencia de especificación es igualmente importante para diferentes partes interesadas, pero con diferentes granularidades de información requerida
- Desafíos de Aplicación del Método:
- Dificultad en el manejo de sinónimos en texto del GDPR
- Complejidad en la identificación de conceptos relacionados
- Incertidumbre de profesionales sobre resultados de anotación y modelado
- La mayoría de investigaciones se enfoca en cumplimiento de procesos de negocio, soluciones independientes o mecanismos de control de datos
- Carencia de investigación que integre cumplimiento del GDPR en todas las fases del SDLC
- La investigación existente se enfoca principalmente en perspectivas únicas de RE o SDA
- Carencia de métodos sistemáticos para tratar el GDPR como fuente de requisitos de PbD
- Muy pocas investigaciones consideran simultáneamente especificación R&S
- Los métodos existentes carecen de procesos transparentes de derivación de requisitos y especificaciones del sistema
- La mayoría de investigaciones se enfoca en informática legal y modelado del GDPR para propósitos de RE
- Carencia de métodos sistemáticos para procesar texto del GDPR para derivar modelos correspondientes
- Necesidad de Especificación Conjunta: Cuatro objetivos de especificación (SO1, SO2, SO3, SO4) necesitan ser logrados a través de la realización conjunta de especificación R&S
- Papel Central de la Trazabilidad: La trazabilidad es un objetivo de especificación clave para asegurar PbD, pero requiere apoyo de transparencia de especificación y conocimiento del dominio legal
- Efectividad del Modelado de Conocimiento Legal: El método de modelado basado en conceptos legales originales del GDPR es efectivo en la captura de conocimiento legal y promoción de transparencia de especificación
- Importancia de Niveles de Abstracción: Los requisitos del GDPR necesitan ser tratados en diferentes niveles de abstracción del ciclo de vida ingenieril para lograr PbD
- Complejidad de Aplicación del Método: Los profesionales tienen dificultad para aplicar efectivamente el modelo conceptual en anotación de texto del GDPR y construcción de modelo de contenido de especificación
- Restricción del Rango de Evaluación: La evaluación solo cubre extractos de cuatro artículos del GDPR, requiriendo validación adicional en entornos industriales reales
- Desafíos de Operacionalización: Se requiere investigación adicional sobre cómo operacionalizar efectivamente el método propuesto en entornos industriales
- Representatividad de Participantes: Aunque cubre diferentes roles, el tamaño de muestra es relativamente limitado
- Operacionalización del Método: Desarrollo de plantillas o herramientas para apoyo de aplicación del método en diferentes entornos organizacionales y modelos ingenieriles
- Expansión del Rango de Aplicación: Aplicación del método a recursos regulatorios auxiliares que complementan el GDPR así como otras regulaciones que requieren diseño de cumplimiento
- Evaluación Basada en Casos: Realización de evaluación basada en casos en entornos industriales para validar la capacidad del método de apoyo al logro de objetivos de especificación
- Investigación Específica de Roles: Investigación de diferencias en percepciones de importancia de ciertos objetivos de especificación entre roles específicos de ingeniería de software
- Método Sistemático: Proporciona el primer método sistemático para tratar la relación de especificación R&S en cumplimiento del GDPR, llenando una brecha importante de investigación
- Base Empírica Sólida: El método mixto que combina revisión de literatura, entrevistas con profesionales y evaluación conceptual proporciona apoyo empírico suficiente
- Alto Valor Práctico: Los objetivos de especificación identificados e insights de profesionales proporcionan orientación concreta para la práctica
- Innovación Metodológica: El método de modelado de contenido basado en conceptos legales es innovador, capaz de establecer conexiones directas entre texto legal y especificaciones ingenieriles
- Alta Transparencia: El proceso de investigación y datos son públicos y transparentes, apoyando la reproducibilidad de resultados
- Complejidad del Método: El método propuesto tiene dificultad relativamente alta de aplicación para profesionales, requiriendo doble expertise en derecho y tecnología
- Profundidad de Evaluación Limitada: La evaluación conceptual se basa principalmente en filtrado de documentos y experimentos simples, careciendo de validación profunda en entornos de proyectos reales
- Tamaño de Muestra: El número de participantes en entrevistas es relativamente limitado (12 personas), lo que puede afectar la generalidad de resultados
- Rango de Cobertura Normativa: Se enfoca principalmente en conceptos centrales del GDPR, con posible cobertura insuficiente de otras cláusulas normativas importantes
- Contribución Académica: Proporciona marco teórico importante y base empírica para campos de ingeniería de privacidad e ingeniería de requisitos
- Orientación Práctica: Proporciona objetivos de especificación concretos y orientación de métodos para profesionales de software en cumplimiento del GDPR
- Impacto en Política: Los resultados de investigación pueden proporcionar referencias para desarrollo de políticas relacionadas y desarrollo de estándares
- Investigación Futura: Proporciona base sólida y direcciones de desarrollo claras para investigación posterior
- Organizaciones de Desarrollo de Software: Equipos de desarrollo de software y organizaciones que necesitan implementar cumplimiento del GDPR
- Práctica de Ingeniería de Requisitos: Proyectos de ingeniería de requisitos que involucran requisitos de cumplimiento normativo
- Ingeniería de Privacidad: Proyectos ingenieriles que necesitan tratar sistemáticamente requisitos de privacidad
- Consultoría de Cumplimiento Normativo: Instituciones profesionales que proporcionan servicios de consultoría de cumplimiento del GDPR a empresas
El artículo cita literatura relacionada abundante, incluyendo principalmente:
- Investigación de Cumplimiento del GDPR: Leite et al. (2022), Kempe & Massey (2021)
- Teoría de Diseño de Privacidad: Cavoukian (2012), Gürses et al. (2011)
- Métodos de Ingeniería de Requisitos: Kitchenham (2007), Runeson et al. (2009)
- Investigación de Arquitectura de Software: Bass et al. (2006), Galster et al. (2009)
- Informática Legal: Palmirani et al. (2018), Robaldo et al. (2024)
Este artículo realiza contribuciones importantes en los campos de ingeniería de privacidad y cumplimiento del GDPR, proporcionando un marco teórico sistemático y métodos prácticos, sentando una base sólida para el desarrollo futuro de este campo. Aunque requiere perfeccionamiento adicional en operacionalización del método, su valor de investigación e importancia práctica son innegables.