An information theorist's tour of differential privacy
Sarwate, Calmon, Kosut et al.
Since being proposed in 2006, differential privacy has become a standard method for quantifying certain risks in publishing or sharing analyses of sensitive data. At its heart, differential privacy measures risk in terms of the differences between probability distributions, which is a central topic in information theory. A differentially private algorithm is a channel between the underlying data and the output of the analysis. Seen in this way, the guarantees made by differential privacy can be understood in terms of properties of this channel. In this article we examine a few of the key connections between information theory and the formulation/application of differential privacy, giving an ``operational significance'' for relevant information measures.
2006년 제안 이후, 차분 프라이버시는 민감한 데이터 공개 또는 분석 공유에서 특정 위험을 정량화하는 표준 방법이 되었다. 차분 프라이버시의 핵심은 확률분포 간의 차이를 통해 위험을 측정하는 것으로, 이는 정보이론의 핵심 주제이다. 차분 프라이버시 알고리즘은 기저 데이터와 분석 출력 사이의 채널이다. 이러한 관점에서 차분 프라이버시가 제공하는 보장은 해당 채널의 특성을 통해 이해될 수 있다. 본 논문은 정보이론과 차분 프라이버시의 공식화/적용 사이의 여러 핵심 연결고리를 조사하며, 관련 정보 척도에 대한 "작동 의미"를 제공한다.
본 논문은 차분 프라이버시에 대한 포괄적인 정보이론적 관점을 제공하며, 해당 분야의 중요한 이론적 기여이다. 차분 프라이버시 알고리즘을 채널로 간주함으로써 저자들은 정보이론 도구를 성공적으로 적용하여 프라이버시 메커니즘을 분석하고 최적화하였으며, 이론 연구와 실제 응용 모두에 가치 있는 통찰력을 제공한다.