2025-11-11T16:58:09.760494

Privacy by Design: Aligning GDPR and Software Engineering Specifications with a Requirements Engineering Approach

Kosenkov, Zabardast, Fucci et al.
Context: Consistent requirements and system specifications are essential for the compliance of software systems towards the General Data Protection Regulation (GDPR). Both artefacts need to be grounded in the original text and conjointly assure the achievement of privacy by design (PbD). Objectives: There is little understanding of the perspectives of practitioners on specification objectives and goals to address PbD. Existing approaches do not account for the complex intersection between problem and solution space expressed in GDPR. In this study we explore the demand for conjoint requirements and system specification for PbD and suggest an approach to address this demand. Methods: We reviewed secondary and related primary studies and conducted interviews with practitioners to (1) investigate the state-of-practice and (2) understand the underlying specification objectives and goals (e.g., traceability). We developed and evaluated an approach for requirements and systems specification for PbD, and evaluated it against the specification objectives. Results: The relationship between problem and solution space, as expressed in GDPR, is instrumental in supporting PbD. We demonstrate how our approach, based on the modeling GDPR content with original legal concepts, contributes to specification objectives of capturing legal knowledge, supporting specification transparency, and traceability. Conclusion: GDPR demands need to be addressed throughout different levels of abstraction in the engineering lifecycle to achieve PbD. Legal knowledge specified in the GDPR text should be captured in specifications to address the demands of different stakeholders and ensure compliance. While our results confirm the suitability of our approach to address practical needs, we also revealed specific needs for the future effective operationalization of the approach.
academic

Privacidad por Diseño: Alineación de GDPR y Especificaciones de Ingeniería de Software con un Enfoque de Ingeniería de Requisitos

Información Básica

  • ID del Artículo: 2510.21591
  • Título: Privacy by Design: Aligning GDPR and Software Engineering Specifications with a Requirements Engineering Approach
  • Autores: Oleksandr Kosenkov, Ehsan Zabardast, Davide Fucci, Daniel Mendez, Michael Unterkalmsteiner
  • Clasificación: cs.SE (Ingeniería de Software)
  • Fecha de Publicación: 31 de octubre de 2025 (arXiv v2)
  • Enlace del Artículo: https://arxiv.org/abs/2510.21591

Resumen

Esta investigación aborda el problema de la consistencia entre requisitos y especificaciones del sistema en el cumplimiento del GDPR, explorando métodos de ingeniería de requisitos para la privacidad por diseño (Privacy by Design, PbD). A través de una revisión de literatura y entrevistas con profesionales, el estudio identifica objetivos de especificación y propone un método integrado de requisitos y especificaciones del sistema basado en el modelado de conceptos legales originales del GDPR. Los resultados demuestran la efectividad del método en la captura de conocimiento legal, el apoyo a la transparencia de especificaciones y la trazabilidad.

Antecedentes y Motivación de la Investigación

Definición del Problema

  1. Problema Central: Los métodos existentes de cumplimiento del GDPR carecen de un tratamiento sistemático de las relaciones complejas entre la ingeniería de requisitos (RE) y las fases de arquitectura de diseño de software (SDA), resultando en falta de consistencia y trazabilidad en la implementación del diseño de privacidad.
  2. Importancia del Problema:
    • El Artículo 25 del GDPR requiere "privacidad por diseño", necesitando integrar controles de privacidad desde la fase de diseño
    • El cumplimiento normativo afecta múltiples fases del ciclo de vida del desarrollo de software (SDLC)
    • El GDPR involucra aspectos heterogéneos del software (calidad del software y comportamiento del usuario)
  3. Limitaciones de Métodos Existentes:
    • Carencia de un método sistemático de especificación de requisitos y sistema (R&S)
    • La investigación existente se enfoca principalmente en perspectivas únicas de RE o SDA
    • Transparencia insuficiente en la interpretación normativa, falta de puentes entre perspectivas legales e ingenieriles
  4. Motivación de la Investigación:
    • Establecer conexiones de trazabilidad entre el texto del GDPR y las especificaciones ingenieriles
    • Apoyar las necesidades de colaboración de diferentes partes interesadas
    • Proporcionar un método sistemático de captura de conocimiento legal

Contribuciones Principales

  1. Identificación de cinco objetivos principales de especificación R&S para caracterizar el método de especificación R&S requerido por PbD
  2. Provisión de una descripción general de objetivos de especificación de profesionales, revelando los objetivos que los profesionales buscan lograr al aplicar métodos de especificación R&S
  3. Propuesta de un método sistemático de modelado de contenido de especificación R&S con evaluación preliminar
  4. Establecimiento de conexiones sistemáticas entre conocimiento del dominio legal y especificaciones de software, promoviendo la sistematización de requisitos integrados y especificaciones del sistema para PbD

Explicación Detallada de la Metodología

Marco de Metodología de Investigación

Esta investigación emplea un método mixto que incluye cuatro fases principales: revisión de literatura (LR), síntesis de método candidato (CA), entrevistas semiestructuradas (IN) y evaluación conceptual (EV).

Metodología de Revisión de Literatura

  1. Revisión de Literatura en Tres Fases:
    • Investigación de Tercer Nivel: búsqueda y análisis de investigación secundaria
    • Investigación de Segundo Nivel: análisis de investigación principal seleccionada de investigación secundaria
    • Revisión de Literatura Provisional: complementar los resultados de las dos fases anteriores
  2. Preguntas de Investigación:
    • RQ1: Estado actual de la investigación en PbD y especificación R&S
    • RQ2: Componentes de requisitos y sistema derivados de métodos existentes
    • RQ3: Objetivos de especificación que necesita lograr la especificación R&S

Diseño del Método Candidato

Modelo Conceptual

Se diseñó un modelo conceptual de tres capas basado en conceptos legales:

  1. Objeto Legal (Legal Object): Entidades tangibles o intangibles que participan en relaciones o comportamientos legales
  2. Objetivo de Regulación (Target of Regulation): Componentes del sistema de software existentes, procesos organizacionales involucrados en la regulación
  3. Control de Cumplimiento (Compliance Control): Componentes o procesos nuevos o existentes utilizados para abordar objetivos de regulación
  4. Criterio (Criterion): Atributos de controles de cumplimiento y/u objetivos de regulación que son aceptables desde una perspectiva legal

Niveles de Abstracción

  • Capa de Especificación de Requisitos: Contiene conceptos abstractos no específicos de especificación a nivel de sistema, requiriendo interpretación adicional
  • Capa de Especificación del Sistema: Contiene conceptos directamente relacionados con el sistema, sin necesidad de interpretación adicional

Diseño de Metodología de Entrevistas

Selección de Participantes

  • Empleo de muestreo intencional y método de bola de nieve
  • 12 participantes de 8 empresas de diferentes tamaños
  • Cobertura de roles incluyendo directores técnicos, arquitectos, ingenieros de datos, administradores de seguridad, etc.

Recopilación de Datos

Empleo del método Goal-Question-Metric (GQM) para estructurar entrevistas:

  • Nivel Conceptual: Definición de objetivos a lograr
  • Nivel Operacional: Definición de preguntas para evaluar el logro de objetivos
  • Nivel Cuantitativo: Definición de métricas o datos necesarios para responder preguntas

Configuración Experimental

Configuración de Revisión de Literatura

  • Rango de Búsqueda: Base de datos Scopus
  • Estrategia de Búsqueda: Búsqueda sistemática y muestreo de bola de nieve
  • Criterios de Selección: Consideración simultánea de RE y SDA, reporte de especificación R&S, idioma inglés, revisión por pares

Configuración de Entrevistas

  • Duración de Entrevistas: Promedio de 60-90 minutos
  • Modalidad de Entrevistas: Combinación de en línea y presencial
  • Análisis de Datos: Codificación utilizando herramienta Taguette, método de codificación deductiva

Configuración de Experimento de Evaluación

  • Participantes: 9 participantes reclutados de entrevistadores
  • Diseño de Tareas: Anotación de artículos del GDPR y construcción de modelo de contenido de especificación
  • Criterios de Evaluación: Comparación con valor de verdad de referencia establecido por autores

Resultados Experimentales

Resultados de Identificación de Objetivos de Especificación

Se identificaron cinco objetivos de especificación central (SO) a través de revisión de literatura:

  1. SO1: Captura de Conocimiento y Objetivos del Dominio Legal (Ranking de Importancia: 1, Puntuación Mediana: 5)
  2. SO2: Trazabilidad y Consistencia de Especificación (Ranking de Importancia: 2, Puntuación Mediana: 4)
  3. SO3: Separación de Preocupaciones de Cumplimiento y No Cumplimiento (Ranking de Importancia: 5, Puntuación Mediana: 1)
  4. SO4: Transparencia y Descripción General de Especificación del Sistema (Ranking de Importancia: 3, Puntuación Mediana: 4.5)
  5. SO5: Especificación que Apoye la Flexibilidad del Sistema (Ranking de Importancia: 4, Puntuación Mediana: 4)

Hallazgos Principales de Entrevistas con Profesionales

  1. Análisis de Situación Actual: La mayoría de profesionales no utilizan métodos especializados de especificación R&S de PbD, sino que emplean métodos ad hoc y reutilización de métodos existentes
  2. Requisitos de Características Clave:
    • Apoyo a la implementación de controles de cumplimiento del GDPR
    • Separación y seguimiento de tipos de datos regulados
    • Concretización de especificaciones del GDPR
    • Promoción de comprensibilidad e interpretabilidad del GDPR
  3. Importancia de Objetivos de Especificación: SO1 (captura de conocimiento legal) fue evaluado como más importante, seguido por SO2 (trazabilidad) y SO4 (transparencia)

Resultados de Evaluación del Método Candidato

Evaluación de Capacidad de Aplicación (RQ8)

  • Los profesionales pueden utilizar el método candidato en grado limitado
  • De 90 anotaciones (9 participantes × 10 anotaciones de referencia), 29 no fueron identificadas
  • De 61 anotaciones identificadas, solo 19 fueron identificadas completamente correctas

Evaluación de Utilidad del Método (RQ9)

Resultados de evaluación de cada objetivo de especificación (puntuación mediana):

  • SO1 (captura de conocimiento legal): 5 (útil)
  • SO4 (transparencia de especificación): 5 (útil)
  • SO2 (trazabilidad): 4 (posiblemente útil)
  • SO5 (flexibilidad del sistema): 4 (posiblemente útil)
  • SO3 (separación de preocupaciones): 2 (posiblemente no útil)

Resultados de Comparación de Componentes (RQ10)

En comparación con métodos existentes, el método candidato identificó más requisitos y componentes del sistema:

  • Requisitos: 15 vs máximo 13 (otros métodos)
  • Componentes del sistema: 13 vs máximo 10 (otros métodos)

Hallazgos Experimentales Clave

  1. Importancia de la Captura de Conocimiento Legal: Los profesionales coincidieron en que la captura de conocimiento legal es el objetivo de especificación más importante
  2. Complejidad de la Trazabilidad: Diferentes roles tienen diferentes necesidades de trazabilidad, con roles técnicos enfocándose más en trazabilidad entre especificaciones R&S
  3. Transparencia y Comunicación: La transparencia de especificación es igualmente importante para diferentes partes interesadas, pero con diferentes granularidades de información requerida
  4. Desafíos de Aplicación del Método:
    • Dificultad en el manejo de sinónimos en texto del GDPR
    • Complejidad en la identificación de conceptos relacionados
    • Incertidumbre de profesionales sobre resultados de anotación y modelado

Trabajo Relacionado

Investigación de Ingeniería de Software de Cumplimiento del GDPR

  • La mayoría de investigaciones se enfoca en cumplimiento de procesos de negocio, soluciones independientes o mecanismos de control de datos
  • Carencia de investigación que integre cumplimiento del GDPR en todas las fases del SDLC

Diseño de Privacidad en Ingeniería de Software

  • La investigación existente se enfoca principalmente en perspectivas únicas de RE o SDA
  • Carencia de métodos sistemáticos para tratar el GDPR como fuente de requisitos de PbD

Especificación de Requisitos y Sistema para Cumplimiento del GDPR

  • Muy pocas investigaciones consideran simultáneamente especificación R&S
  • Los métodos existentes carecen de procesos transparentes de derivación de requisitos y especificaciones del sistema

Modelado Normativo para Cumplimiento del GDPR

  • La mayoría de investigaciones se enfoca en informática legal y modelado del GDPR para propósitos de RE
  • Carencia de métodos sistemáticos para procesar texto del GDPR para derivar modelos correspondientes

Conclusiones y Discusión

Conclusiones Principales

  1. Necesidad de Especificación Conjunta: Cuatro objetivos de especificación (SO1, SO2, SO3, SO4) necesitan ser logrados a través de la realización conjunta de especificación R&S
  2. Papel Central de la Trazabilidad: La trazabilidad es un objetivo de especificación clave para asegurar PbD, pero requiere apoyo de transparencia de especificación y conocimiento del dominio legal
  3. Efectividad del Modelado de Conocimiento Legal: El método de modelado basado en conceptos legales originales del GDPR es efectivo en la captura de conocimiento legal y promoción de transparencia de especificación
  4. Importancia de Niveles de Abstracción: Los requisitos del GDPR necesitan ser tratados en diferentes niveles de abstracción del ciclo de vida ingenieril para lograr PbD

Limitaciones

  1. Complejidad de Aplicación del Método: Los profesionales tienen dificultad para aplicar efectivamente el modelo conceptual en anotación de texto del GDPR y construcción de modelo de contenido de especificación
  2. Restricción del Rango de Evaluación: La evaluación solo cubre extractos de cuatro artículos del GDPR, requiriendo validación adicional en entornos industriales reales
  3. Desafíos de Operacionalización: Se requiere investigación adicional sobre cómo operacionalizar efectivamente el método propuesto en entornos industriales
  4. Representatividad de Participantes: Aunque cubre diferentes roles, el tamaño de muestra es relativamente limitado

Direcciones Futuras

  1. Operacionalización del Método: Desarrollo de plantillas o herramientas para apoyo de aplicación del método en diferentes entornos organizacionales y modelos ingenieriles
  2. Expansión del Rango de Aplicación: Aplicación del método a recursos regulatorios auxiliares que complementan el GDPR así como otras regulaciones que requieren diseño de cumplimiento
  3. Evaluación Basada en Casos: Realización de evaluación basada en casos en entornos industriales para validar la capacidad del método de apoyo al logro de objetivos de especificación
  4. Investigación Específica de Roles: Investigación de diferencias en percepciones de importancia de ciertos objetivos de especificación entre roles específicos de ingeniería de software

Evaluación Profunda

Fortalezas

  1. Método Sistemático: Proporciona el primer método sistemático para tratar la relación de especificación R&S en cumplimiento del GDPR, llenando una brecha importante de investigación
  2. Base Empírica Sólida: El método mixto que combina revisión de literatura, entrevistas con profesionales y evaluación conceptual proporciona apoyo empírico suficiente
  3. Alto Valor Práctico: Los objetivos de especificación identificados e insights de profesionales proporcionan orientación concreta para la práctica
  4. Innovación Metodológica: El método de modelado de contenido basado en conceptos legales es innovador, capaz de establecer conexiones directas entre texto legal y especificaciones ingenieriles
  5. Alta Transparencia: El proceso de investigación y datos son públicos y transparentes, apoyando la reproducibilidad de resultados

Insuficiencias

  1. Complejidad del Método: El método propuesto tiene dificultad relativamente alta de aplicación para profesionales, requiriendo doble expertise en derecho y tecnología
  2. Profundidad de Evaluación Limitada: La evaluación conceptual se basa principalmente en filtrado de documentos y experimentos simples, careciendo de validación profunda en entornos de proyectos reales
  3. Tamaño de Muestra: El número de participantes en entrevistas es relativamente limitado (12 personas), lo que puede afectar la generalidad de resultados
  4. Rango de Cobertura Normativa: Se enfoca principalmente en conceptos centrales del GDPR, con posible cobertura insuficiente de otras cláusulas normativas importantes

Impacto

  1. Contribución Académica: Proporciona marco teórico importante y base empírica para campos de ingeniería de privacidad e ingeniería de requisitos
  2. Orientación Práctica: Proporciona objetivos de especificación concretos y orientación de métodos para profesionales de software en cumplimiento del GDPR
  3. Impacto en Política: Los resultados de investigación pueden proporcionar referencias para desarrollo de políticas relacionadas y desarrollo de estándares
  4. Investigación Futura: Proporciona base sólida y direcciones de desarrollo claras para investigación posterior

Escenarios de Aplicación

  1. Organizaciones de Desarrollo de Software: Equipos de desarrollo de software y organizaciones que necesitan implementar cumplimiento del GDPR
  2. Práctica de Ingeniería de Requisitos: Proyectos de ingeniería de requisitos que involucran requisitos de cumplimiento normativo
  3. Ingeniería de Privacidad: Proyectos ingenieriles que necesitan tratar sistemáticamente requisitos de privacidad
  4. Consultoría de Cumplimiento Normativo: Instituciones profesionales que proporcionan servicios de consultoría de cumplimiento del GDPR a empresas

Referencias Bibliográficas

El artículo cita literatura relacionada abundante, incluyendo principalmente:

  1. Investigación de Cumplimiento del GDPR: Leite et al. (2022), Kempe & Massey (2021)
  2. Teoría de Diseño de Privacidad: Cavoukian (2012), Gürses et al. (2011)
  3. Métodos de Ingeniería de Requisitos: Kitchenham (2007), Runeson et al. (2009)
  4. Investigación de Arquitectura de Software: Bass et al. (2006), Galster et al. (2009)
  5. Informática Legal: Palmirani et al. (2018), Robaldo et al. (2024)

Este artículo realiza contribuciones importantes en los campos de ingeniería de privacidad y cumplimiento del GDPR, proporcionando un marco teórico sistemático y métodos prácticos, sentando una base sólida para el desarrollo futuro de este campo. Aunque requiere perfeccionamiento adicional en operacionalización del método, su valor de investigación e importancia práctica son innegables.