2025-11-11T12:07:09.802097

Training data membership inference via Gaussian process meta-modeling: a post-hoc analysis approach

Huang, Zhang, Mumtaz
Membership inference attacks (MIAs) test whether a data point was part of a model's training set, posing serious privacy risks. Existing methods often depend on shadow models or heavy query access, which limits their practicality. We propose GP-MIA, an efficient and interpretable approach based on Gaussian process (GP) meta-modeling. Using post-hoc metrics such as accuracy, entropy, dataset statistics, and optional sensitivity features (e.g. gradients, NTK measures) from a single trained model, GP-MIA trains a GP classifier to distinguish members from non-members while providing calibrated uncertainty estimates. Experiments on synthetic data, real-world fraud detection data, CIFAR-10, and WikiText-2 show that GP-MIA achieves high accuracy and generalizability, offering a practical alternative to existing MIAs.
academic

๊ฐ€์šฐ์Šค ๊ณผ์ • ๋ฉ”ํƒ€ ๋ชจ๋ธ๋ง์„ ํ†ตํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก : ์‚ฌํ›„ ๋ถ„์„ ์ ‘๊ทผ๋ฒ•

๊ธฐ๋ณธ ์ •๋ณด

  • ๋…ผ๋ฌธ ID: 2510.21846
  • ์ œ๋ชฉ: Training data membership inference via Gaussian process meta-modeling: a post-hoc analysis approach
  • ์ €์ž: Yongchao Huang, Pengfei Zhang, Shahzad Mumtaz
  • ๋ถ„๋ฅ˜: cs.LG cs.AI
  • ๋ฐœํ‘œ ์‹œ๊ฐ„: 2025๋…„ 5์›” (arXiv ์‚ฌ์ „ ์ธ์‡„๋ณธ)
  • ๋…ผ๋ฌธ ๋งํฌ: https://arxiv.org/abs/2510.21846

์ดˆ๋ก

๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ(MIAs)์€ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๊ฐ€ ๋ชจ๋ธ ํ›ˆ๋ จ ์„ธํŠธ์˜ ์ผ๋ถ€์ธ์ง€ ์—ฌ๋ถ€๋ฅผ ํ…Œ์ŠคํŠธํ•˜๋ฉฐ, ์‹ฌ๊ฐํ•œ ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ์œ„ํ—˜์„ ๊ตฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ๋ฐฉ๋ฒ•์€ ์ผ๋ฐ˜์ ์œผ๋กœ ์„€๋„์šฐ ๋ชจ๋ธ์ด๋‚˜ ๋Œ€๋Ÿ‰์˜ ์ฟผ๋ฆฌ ์ ‘๊ทผ์— ์˜์กดํ•˜์—ฌ ์‹ค์šฉ์„ฑ์„ ์ œํ•œํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ ๊ฐ€์šฐ์Šค ๊ณผ์ •(GP) ๋ฉ”ํƒ€ ๋ชจ๋ธ๋ง์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ํšจ์œจ์ ์ด๊ณ  ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋ฐฉ๋ฒ•์ธ GP-MIA๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ผ ํ›ˆ๋ จ ๋ชจ๋ธ์˜ ์‚ฌํ›„ ์ง€ํ‘œ(์ •ํ™•๋„, ์—”ํŠธ๋กœํ”ผ, ๋ฐ์ดํ„ฐ์„ธํŠธ ํ†ต๊ณ„ ๋ฐ ๊ทธ๋ž˜๋””์–ธํŠธ, NTK ์ธก์ •๊ณผ ๊ฐ™์€ ์„ ํƒ์  ๋ฏผ๊ฐ๋„ ํŠน์ง•)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ, GP-MIA๋Š” GP ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ›ˆ๋ จํ•˜์—ฌ ๋ฉค๋ฒ„์™€ ๋น„๋ฉค๋ฒ„๋ฅผ ๊ตฌ๋ณ„ํ•˜๋ฉด์„œ ๋ณด์ •๋œ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ •์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ, ์‹ค์ œ ์‚ฌ๊ธฐ ํƒ์ง€ ๋ฐ์ดํ„ฐ, CIFAR-10 ๋ฐ WikiText-2์— ๋Œ€ํ•œ ์‹คํ—˜์€ GP-MIA๊ฐ€ ๋†’์€ ์ •ํ™•๋„์™€ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋‹ฌ์„ฑํ•˜์—ฌ ๊ธฐ์กด MIAs์— ๋Œ€ํ•œ ์‹ค์šฉ์ ์ธ ๋Œ€์•ˆ์„ ์ œ๊ณตํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋™๊ธฐ

๋ฌธ์ œ ์ •์˜

๋ณธ ์—ฐ๊ตฌ๋Š” ๊ธฐ๊ณ„ํ•™์Šต ๋ชจ๋ธ์˜ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ํ›ˆ๋ จ๋œ ๋ชจ๋ธ fฮธ์™€ ํ…Œ์ŠคํŠธ ์ƒ˜ํ”Œ ์Œ(x,y)์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ๋ชฉํ‘œ๋Š” ์ถ”๋ก  ๊ทœ์น™ M(fฮธ, x, y) โˆˆ {0,1}์„ ์„ค๊ณ„ํ•˜์—ฌ ํ•ด๋‹น ์ƒ˜ํ”Œ์ด ํ›ˆ๋ จ ์„ธํŠธ์— ์†ํ•˜๋Š”์ง€ ํŒ๋‹จํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋ฌธ์ œ์˜ ์ค‘์š”์„ฑ

๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ์€ ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ์— ์‹ฌ๊ฐํ•œ ์œ„ํ˜‘์„ ๊ตฌ์„ฑํ•˜๋ฉฐ, ํŠนํžˆ ์˜๋ฃŒ, ๊ธˆ์œต ๋˜๋Š” ๋ณด์•ˆ ๋“ฑ ๋ฏผ๊ฐํ•œ ๋ถ„์•ผ์—์„œ ๊ฐœ์ธ ๊ธฐ๋ก์ด ํ›ˆ๋ จ์— ์‚ฌ์šฉ๋˜์—ˆ๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ๊ณต๊ฐœํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋„ ๊ฐœ์ธ์ •๋ณด ์œ ์ถœ์„ ์•ผ๊ธฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์™€ ๋ฏธํ™•์ธ ๋ฐ์ดํ„ฐ์—์„œ ์ฒด๊ณ„์ ์ธ ํ–‰๋™ ์ฐจ์ด๋ฅผ ๋‚˜ํƒ€๋‚ด๊ธฐ ๋•Œ๋ฌธ์— ์ด๋Ÿฌํ•œ ๊ณต๊ฒฉ์— ์ทจ์•ฝํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์กด ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„

  1. ์„€๋„์šฐ ๋ชจ๋ธ ๋ฐฉ๋ฒ•: ๋ชฉํ‘œ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๋ณด์กฐ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ด์•ผ ํ•˜๋ฏ€๋กœ ๊ณ„์‚ฐ ๋น„์šฉ์ด ๋†’์Œ
  2. ์šฐ๋„๋น„ ๊ณต๊ฒฉ(LiRA): ๋ชจ๋ธ์— ๋Œ€ํ•œ ์—ฌ๋Ÿฌ ๋ฒˆ์˜ ์ฟผ๋ฆฌ์™€ ๋ณด์ •์„ ์œ„ํ•œ ๋Œ€๋Ÿ‰์˜ ๊ณ„์‚ฐ ์ž์› ํ•„์š”
  3. ์‹ค์šฉ์„ฑ ์ œํ•œ: ๊ธฐ์กด ๋ฐฉ๋ฒ•์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๋Œ€๋Ÿ‰์˜ ๊ณ„์‚ฐ ์ž์›, ์‹ ์ค‘ํ•˜๊ฒŒ ๊ณ„ํš๋œ ๋ณด์กฐ ๋ฐ์ดํ„ฐ ๋˜๋Š” ๋ชฉํ‘œ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์—ฌ๋Ÿฌ ๋ฒˆ์˜ ์ฟผ๋ฆฌ ํ•„์š”

์—ฐ๊ตฌ ๋™๊ธฐ

๋ณธ ๋…ผ๋ฌธ์€ ๋‹จ์ผ ํ›ˆ๋ จ ๋ชจ๋ธ์˜ ์‚ฌํ›„ ์ ‘๊ทผ๋งŒ ํ•„์š”ํ•˜๊ณ , ์žฌํ›ˆ๋ จ์ด๋‚˜ ๋‚ด๋ถ€ ์ ‘๊ทผ์„ ํ”ผํ•˜๋ฉด์„œ ๋ณด์ •๋œ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ •์„ ์ œ๊ณตํ•˜๋Š” ํšจ์œจ์ ์ธ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๊ธฐ์—ฌ

  1. GP-MIA ํ”„๋ ˆ์ž„์›Œํฌ ์ œ์•ˆ: ๊ฐ€์šฐ์Šค ๊ณผ์ • ๋ฉ”ํƒ€ ๋ชจ๋ธ๋ง์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์ƒˆ๋กœ์šด ์‚ฌํ›„ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ ๋ฐฉ๋ฒ•
  2. ๋‹ค์ธต ํŠน์ง• ์ฒด๊ณ„ ์„ค๊ณ„: ๊ธฐ๋ณธ ํŠน์ง•(์„ฑ๋Šฅ ์ง€ํ‘œ, ์‹ ๋ขฐ๋„), ๊ทธ๋ž˜๋””์–ธํŠธ ํŠน์ง• ๋ฐ NTK ํŠน์ง•์˜ ํ†ตํ•ฉ ํ‘œํ˜„ ํฌํ•จ
  3. ํšจ์œจ์ ์ธ ์ถ”๋ก  ๊ตฌํ˜„: ๋‹จ์ผ ์ „๋ฐฉ ์ „ํŒŒ(์„ ํƒ์  ์—ญ๋ฐฉ ์ „ํŒŒ)๋งŒ ํ•„์š”ํ•˜๋ฉฐ ์„€๋„์šฐ ๋ชจ๋ธ ํ›ˆ๋ จ ํšŒํ”ผ
  4. ๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™” ์ œ๊ณต: GP ๋ถ„๋ฅ˜๊ธฐ๋Š” ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ณด์ •๋œ ํ™•๋ฅ  ์˜ˆ์ธก ๋ฐ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ์ œ๊ณต
  5. ๋„๋ฉ”์ธ ๊ฐ„ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ๊ฒ€์ฆ: ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ, ์‚ฌ๊ธฐ ํƒ์ง€, ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๋ฐ ์–ธ์–ด ๋ชจ๋ธ๋ง์˜ ๋„ค ๊ฐ€์ง€ ์„œ๋กœ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์—์„œ ์œ ํšจ์„ฑ ๊ฒ€์ฆ

๋ฐฉ๋ฒ• ์ƒ์„ธ ์„ค๋ช…

์ž‘์—… ์ •์˜

ํ›ˆ๋ จ๋œ ๊ฐ๋… ๋ชจ๋ธ fฮธ*: Rd โ†’ Rm์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ์ž‘์—…์€ ํ…Œ์ŠคํŠธ ์ƒ˜ํ”Œ(x,y)์ด ํ›ˆ๋ จ ์„ธํŠธ X = {(xi, yi)}ni=1์— ์†ํ•˜๋Š”์ง€ ํŒ๋‹จํ•˜๋Š” ํ•จ์ˆ˜ M(fฮธ*, x, y)์„ ์„ค๊ณ„ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜

ํŠน์ง• ๊ตฌ์„ฑ

GP-MIA๋Š” ์„ธ ๊ฐ€์ง€ ์ง„๋‹จ ํŠน์ง•์„ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค:

  1. ๊ธฐ๋ณธ ํŠน์ง• ฯ•common(x):
    • ์„ฑ๋Šฅ ์ง€ํ‘œ: ๋ถ„๋ฅ˜ ์ •ํ™•๋„ ๋˜๋Š” ํšŒ๊ท€ MSE
    • ์‹ ๋ขฐ๋„ ์ธก์ •: ์˜ˆ์ธก ํ™•๋ฅ ์˜ ํ‰๊ท  ์—”ํŠธ๋กœํ”ผ
    • ์ž…๋ ฅ ํ†ต๊ณ„: ํŠน์ง• ํ‰๊ท  ๋ฐ ๋ถ„์‚ฐ
    • ์„ญ๋™ ํฌ๊ธฐ: ๋ฏธ์„ธ ์กฐ์ • ์ „ํ›„ ๋ชจ๋ธ ๊ฐ€์ค‘์น˜์˜ โ„“2 ๊ฑฐ๋ฆฌ
  2. ๊ทธ๋ž˜๋””์–ธํŠธ ํŠน์ง• ฯ•grad(x):
    ฯ•grad(x) = [โˆฅgฮธ(x)โˆฅF, โˆฅJx(x)โˆฅF, โ„“(fฮธ*(x), y), โˆฅgโ„“(x, y)โˆฅ2]
    

    ์—ฌ๊ธฐ์„œ gฮธ(x) = โˆ‡ฮธfฮธ*(x)๋Š” ๋งค๊ฐœ๋ณ€์ˆ˜ ์•ผ์ฝ”๋น„์•ˆ ํ–‰๋ ฌ์ด๊ณ , Jx(x) = โˆ‚fฮธ*(x)/โˆ‚x๋Š” ์ž…๋ ฅ ์•ผ์ฝ”๋น„์•ˆ ํ–‰๋ ฌ์ž…๋‹ˆ๋‹ค.
  3. NTK ํŠน์ง• ฯ•ntk(x):
    ฯ•ntk(x) = [ฯ„ฮป(x), โˆฅhฮป(x)โˆฅ2, maxi|hฮป(x)i|, smax(x), sฬ„(x)]
    

    ์‹ ๊ฒฝ ์ ‘์„  ์ปค๋„ kฮธ*(x, x') = gฮธ(x)gฮธ(x')โŠค์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋ ˆ๋ฒ„๋ฆฌ์ง€ ์ ์ˆ˜ ๋ฐ ํˆฌ์˜ ํ†ต๊ณ„

GP ๋ถ„๋ฅ˜๊ธฐ

RBF + ํ™”์ดํŠธ ๋…ธ์ด์ฆˆ ์ปค๋„์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฐ€์šฐ์Šค ๊ณผ์ • ๋ถ„๋ฅ˜๊ธฐ:

k(x,x') = ฯƒยฒ exp(-1/(2โ„“ยฒ) โˆฅx-x'โˆฅยฒ)

์ด์ง„ ๋ถ„๋ฅ˜์˜ ๊ฒฝ์šฐ, GP๋Š” ๋ฒ ๋ฅด๋ˆ„์ด ์šฐ๋„์™€ ๊ฒฐํ•ฉ๋ฉ๋‹ˆ๋‹ค:

p(y* = 1 | x*,D) = โˆซ ฯƒ(f(x*)) p(f(x*) | x*,D) df(x*)

๊ธฐ์ˆ ์  ํ˜์‹  ํฌ์ธํŠธ

  1. ์‚ฌํ›„ ๋ถ„์„ ํŒจ๋Ÿฌ๋‹ค์ž„: ์„€๋„์šฐ ๋ชจ๋ธ ํ›ˆ๋ จ ๋ฐ ๋ฐ˜๋ณต ์ฟผ๋ฆฌ์˜ ์˜ค๋ฒ„ํ—ค๋“œ ํšŒํ”ผ
  2. ๋‹ค์ค‘ ๋ชจ๋“œ ํŠน์ง• ์œตํ•ฉ: ์„ฑ๋Šฅ, ํ†ต๊ณ„ ๋ฐ ๋ฏผ๊ฐ๋„ ํŠน์ง•์„ ๊ฒฐํ•ฉํ•˜์—ฌ ํ’๋ถ€ํ•œ ๋ฉค๋ฒ„์‹ญ ์‹ ํ˜ธ ์ œ๊ณต
  3. ๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™”: GP ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ณด์ •๋œ ํ™•๋ฅ  ์˜ˆ์ธก ์ œ๊ณต
  4. ๋ชจ๋ธ ๋ฌด๊ด€์„ฑ: ๋‹ค์–‘ํ•œ ๊ฐ๋… ํ•™์Šต ๋ชจ๋ธ์— ์ ์šฉ ๊ฐ€๋Šฅ

์‹คํ—˜ ์„ค์ •

๋ฐ์ดํ„ฐ์„ธํŠธ

  1. ํ•ฉ์„ฑ ๋ถ„๋ฅ˜ ๋ฐ์ดํ„ฐ: scikit-learn์„ ์‚ฌ์šฉํ•˜์—ฌ ์ƒ์„ฑ๋œ 2,000๊ฐœ์˜ ๊ท ํ˜• ์ƒ˜ํ”Œ์„ ํฌํ•จํ•œ 2-ํด๋Ÿฌ์Šคํ„ฐ ๊ฐ€์šฐ์Šค ํ˜ผํ•ฉ
  2. ์‹ ์šฉ์นด๋“œ ์‚ฌ๊ธฐ ํƒ์ง€: OpenML ๊ณต๊ฐœ ๋ฐ์ดํ„ฐ์„ธํŠธ, 284,807๊ฑด์˜ ๊ฑฐ๋ž˜, 492๊ฐœ์˜ ์–‘์„ฑ ์‚ฌ๋ก€๋งŒ ํฌํ•จ
  3. CIFAR-10: ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜, CNN ๋ชจ๋ธ์„ 20 ์—ํฌํฌ ๋™์•ˆ ํ›ˆ๋ จ
  4. WikiText-2: ์–ธ์–ด ๋ชจ๋ธ๋ง, ์ปดํŒฉํŠธ GPT-2 ์Šคํƒ€์ผ ๋ชจ๋ธ ์‚ฌ์šฉ(3์ธต, 4ํ—ค๋“œ, 192์ฐจ์› ์ž„๋ฒ ๋”ฉ)

ํ‰๊ฐ€ ์ง€ํ‘œ

  • AUROC: ์ˆ˜์‹ ์ž ์ž‘๋™ ํŠน์„ฑ ๊ณก์„  ์•„๋ž˜ ๋ฉด์ 
  • AUPR: ์ •๋ฐ€๋„-์žฌํ˜„์œจ ๊ณก์„  ์•„๋ž˜ ๋ฉด์ 
  • TPR@1%FPR: 1% ๊ฑฐ์ง“์–‘์„ฑ์œจ์—์„œ์˜ ์ฐธ์–‘์„ฑ์œจ
  • ํ˜ผ๋™ ํ–‰๋ ฌ: ์ •๋ฐ€๋„ ๋ฐ ์žฌํ˜„์œจ

๋น„๊ต ๋ฐฉ๋ฒ•

์ฃผ๋กœ ๊ธฐ์กด ์„€๋„์šฐ ๋ชจ๋ธ ๋ฐฉ๋ฒ• ๋ฐ LiRA ๋ฐฉ๋ฒ•๊ณผ์˜ ๊ฐœ๋…์  ๋น„๊ต๋ฅผ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, GP-MIA์˜ ํšจ์œจ์„ฑ ์ด์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

๊ตฌํ˜„ ์„ธ๋ถ€์‚ฌํ•ญ

  • GP ํ›ˆ๋ จ์€ ๋ณ€๋ถ„ ์ถ”๋ก  ์‚ฌ์šฉ
  • RBF + ํ™”์ดํŠธ ๋…ธ์ด์ฆˆ ์ปค๋„
  • ํŠน์ง• ํ‘œ์ค€ํ™”
  • ํ›ˆ๋ จ ์„ธํŠธ 80%, ํ…Œ์ŠคํŠธ ์„ธํŠธ 20%

์‹คํ—˜ ๊ฒฐ๊ณผ

์ฃผ์š” ๊ฒฐ๊ณผ

  1. ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ: GP๋Š” ๋‹ค์–‘ํ•œ ๋ฉค๋ฒ„/๋น„๋ฉค๋ฒ„ ๋ถ„ํฌ์— ์ ์‘ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ฒฝ๊ณ„ ์‚ฌ๋ก€์—์„œ ์ ์ ˆํ•œ ๋ถˆํ™•์‹ค์„ฑ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  2. ์‚ฌ๊ธฐ ํƒ์ง€:
    • AUROC = 0.959
    • AUPR = 0.961
    • TPR@1%FPR = 0.60
    • ๋ฉค๋ฒ„ ํ™•๋ฅ  ํ‰๊ท  โ‰ˆ 0.81, ๋น„๋ฉค๋ฒ„ โ‰ˆ 0.25
  3. CIFAR-10:
    • ํ›ˆ๋ จ ๋ฉค๋ฒ„ ๋ฐ์ดํ„ฐ์„ธํŠธ: ํ™•๋ฅ  0.93
    • ์ƒˆ๋กœ์šด CIFAR-10 ๋ฐ์ดํ„ฐ์„ธํŠธ: ํ™•๋ฅ  0.84
    • SVHN/์ฆ๊ฐ• ๋ฐ์ดํ„ฐ์„ธํŠธ: ํ™•๋ฅ  โ‰ˆ 0.04
    • ๋ณด๊ฐ„ ๋ฐ์ดํ„ฐ์„ธํŠธ: ํ™•๋ฅ  0.37
  4. WikiText-2:
    • AUROC = 1.000
    • AUPR = 1.000
    • TPR@1%FPR = 1.000
    • ์˜๋ถ„๋ฅ˜ ์˜ค๋ฅ˜, ์™„๋ฒฝํ•œ ๋ถ„๋ฆฌ

์ ˆ์ œ ์‹คํ—˜

๋‘ ๊ฐ€์ง€ ํ•ฉ์„ฑ ์‹คํ—˜์„ ํ†ตํ•ด GP ๋ถ„๋ฅ˜๊ธฐ์˜ ์ ์‘์„ฑ์„ ๊ฒ€์ฆํ•ฉ๋‹ˆ๋‹ค:

  1. ํฐ ๋ถ„๋ฆฌ๋„ ์‹คํ—˜: ๋ฉค๋ฒ„์™€ ๋น„๋ฉค๋ฒ„ ๋ถ„ํฌ์˜ ์ฐจ์ด๊ฐ€ ํด ๋•Œ GP๋Š” ๋ช…ํ™•ํ•œ ๋ถ„๋ฅ˜ ๋Šฅ๋ ฅ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  2. ์ž‘์€ ๋ถ„๋ฆฌ๋„ ์‹คํ—˜: ๋ฉค๋ฒ„ ๋ถ„ํฌ์— ๋” ๊ฐ€๊นŒ์šด ๋น„๋ฉค๋ฒ„ ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ํ•œ ํ›„ GP๋Š” ๋ชจํ˜ธํ•œ ์‚ฌ๋ก€๋ฅผ ๋” ์ž˜ ๊ตฌ๋ณ„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์‚ฌ๋ก€ ๋ถ„์„

  • t-SNE ๋ฐ PCA ์‹œ๊ฐํ™”๋Š” ํŠน์ง• ๊ณต๊ฐ„์—์„œ ๋ฉค๋ฒ„์™€ ๋น„๋ฉค๋ฒ„์˜ ๋ถ„๋ฆฌ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
  • ํ™•๋ฅ  ๋ถ„ํฌ ๊ทธ๋ž˜ํ”„๋Š” GP ์˜ˆ์ธก์˜ ์ด์ค‘ ๋ด‰์šฐ๋ฆฌ ๋ถ„ํฌ ํŠน์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
  • ๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™”๋Š” ๊ฒฝ๊ณ„ ์‚ฌ๋ก€์—์„œ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

์‹คํ—˜ ๋ฐœ๊ฒฌ

  1. ๊ธฐ๋ณธ ํŠน์ง•๋งŒ์œผ๋กœ๋„ ๊ฐ•๋ ฅํ•œ ํŒ๋ณ„ ์‹ ํ˜ธ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  2. ๋ฏผ๊ฐ๋„ ํŠน์ง•์€ ๋ณต์žกํ•œ ๋ชจ๋ธ(์˜ˆ: ์–ธ์–ด ๋ชจ๋ธ)์—์„œ ์„ฑ๋Šฅ์„ ์ถ”๊ฐ€๋กœ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.
  3. GP ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋‹ค์–‘ํ•œ ๋ถ„ํฌ ํŽธ์ด ํ•˜์—์„œ ๊ฒฌ๊ณ ์„ฑ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.
  4. ์–ธ์–ด ๋ชจ๋ธ์€ ๊ฐ€์žฅ ๋ช…๋ฐฑํ•œ ๋ฉค๋ฒ„์‹ญ ์ •๋ณด ์œ ์ถœ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

๊ด€๋ จ ์—ฐ๊ตฌ

์ฃผ์š” ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

  1. ์„€๋„์šฐ ๋ชจ๋ธ ๋ฐฉ๋ฒ•(Shokri ๋“ฑ): ๋ชฉํ‘œ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๋ณด์กฐ ๋ชจ๋ธ ํ›ˆ๋ จ
  2. ์šฐ๋„๋น„ ๊ณต๊ฒฉ(Carlini ๋“ฑ): ๊ฐ€์„ค ๊ฒ€์ • ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฉค๋ฒ„/๋น„๋ฉค๋ฒ„ ์šฐ๋„ ๋น„๊ต
  3. ๊ฐ•ํ™” ๋ฐฉ๋ฒ•(Ye ๋“ฑ): ์†์‹ค ๋ถ„ํฌ ๋ฐ ์‹ ๋ขฐ๋„ ์ ์ˆ˜ ๊ฒฐํ•ฉ

๋ณธ ๋…ผ๋ฌธ์˜ ์ด์ 

  • ์„€๋„์šฐ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์˜์กด์„ฑ ์ œ๊ฑฐ
  • ๋Œ€๋Ÿ‰์˜ ์ฟผ๋ฆฌ ์ ‘๊ทผ ํšŒํ”ผ
  • ๋ณด์ •๋œ ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ์ œ๊ณต
  • ๋†’์€ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ, ๊ฐ•ํ•œ ์‹ค์šฉ์„ฑ

๊ฒฐ๋ก  ๋ฐ ๋…ผ์˜

์ฃผ์š” ๊ฒฐ๋ก 

GP-MIA๋Š” ์œ ์—ฐํ•˜๊ณ  ๋ฐ์ดํ„ฐ ํšจ์œจ์ ์ธ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์‚ฌํ›„ ๋ฐฉ์‹์—์„œ ์„€๋„์šฐ ๋ชจ๋ธ ์˜ค๋ฒ„ํ—ค๋“œ๋ฅผ ํšŒํ”ผํ•˜๋ฉด์„œ ์ •๋ณด๊ฐ€ ํ’๋ถ€ํ•œ ๋ถ„ํฌ ์‹ ํ˜ธ๋ฅผ ํฌ์ฐฉํ•ฉ๋‹ˆ๋‹ค.

ํ•œ๊ณ„

  1. ํ™•์žฅ์„ฑ: GP ํ›ˆ๋ จ ๋ณต์žก๋„๋Š” O(Nยณ)์ด๋ฏ€๋กœ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์„ธํŠธ์— ๋Œ€ํ•ด ๋„์ „ ๊ณผ์ œ๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ํŠน์ง• ์˜์กด์„ฑ: ์„ฑ๋Šฅ์€ ํŠน์ง• ์—”์ง€๋‹ˆ์–ด๋ง ํ’ˆ์งˆ์— ์˜์กดํ•ฉ๋‹ˆ๋‹ค.
  3. ๋ชจ๋ธ ์ ‘๊ทผ: ์—ฌ์ „ํžˆ ๋ชฉํ‘œ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ฟผ๋ฆฌ ์ ‘๊ทผ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
  4. ๋ฐฉ์–ด ๊ณ ๋ ค์‚ฌํ•ญ: ๋…ผ๋ฌธ์—์„œ ๋Œ€์  ๋ฐฉ์–ด ๋ฐฉ๋ฒ•์„ ๊นŠ์ด ์žˆ๊ฒŒ ํƒ๊ตฌํ•˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.

ํ–ฅํ›„ ๋ฐฉํ–ฅ

  1. ๋Œ€์ฒด ์ปค๋„ ์„ ํƒ ํƒ์ƒ‰
  2. ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ์„ ์œ„ํ•œ ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ๊ทผ์‚ฌ ๊ฐœ๋ฐœ
  3. ๋” ๊ด‘๋ฒ”์œ„ํ•œ ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ๋ฐฉ์–ด ํ”„๋ ˆ์ž„์›Œํฌ์— ํ†ตํ•ฉ
  4. ๋” ํ’๋ถ€ํ•œ ํŠน์ง• ๊ณต๊ฐ„ ์—ฐ๊ตฌ

์‹ฌ์ธต ํ‰๊ฐ€

์žฅ์ 

  1. ๋ฐฉ๋ฒ•์˜ ํ˜์‹ ์„ฑ: ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก ์— GP๋ฅผ ์ฒ˜์Œ ์ ์šฉํ•˜์—ฌ ์ƒˆ๋กœ์šด ๊ธฐ์ˆ  ๊ฒฝ๋กœ ์ œ๊ณต
  2. ์‹คํ—˜์˜ ์ถฉ๋ถ„์„ฑ: ๋„ค ๊ฐ€์ง€ ์„œ๋กœ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์—์„œ ๊ฒ€์ฆํ•˜์—ฌ ์ข‹์€ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ์ž…์ฆ
  3. ์‹ค์šฉ์  ๊ฐ€์น˜: ์„€๋„์šฐ ๋ชจ๋ธ ํ›ˆ๋ จ์„ ํšŒํ”ผํ•˜์—ฌ ๊ณต๊ฒฉ ๋น„์šฉ ๊ฐ์†Œ
  4. ๋ถˆํ™•์‹ค์„ฑ ์ •๋Ÿ‰ํ™”: GP ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํ™•๋ฅ  ์˜ˆ์ธก์„ ์ œ๊ณตํ•˜์—ฌ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ํ–ฅ์ƒ
  5. ๋ช…ํ™•ํ•œ ์ž‘๋ฌธ: ๋ฐฉ๋ฒ• ์„ค๋ช…์ด ๋ช…ํ™•ํ•˜๊ณ  ์‹คํ—˜ ์„ค๊ณ„๊ฐ€ ํ•ฉ๋ฆฌ์ 

๋ถ€์กฑํ•œ ์ 

  1. ์ด๋ก ์  ๋ถ„์„ ๋ถ€์กฑ: GP๊ฐ€ ์ด ์ž‘์—…์— ํŠนํžˆ ์ ํ•ฉํ•œ ์ด์œ ์— ๋Œ€ํ•œ ์ด๋ก ์  ์„ค๋ช… ๋ถ€์žฌ
  2. ๋ฐฉ์–ด ๋…ผ์˜ ์ œํ•œ: ์ด๋Ÿฌํ•œ ๊ณต๊ฒฉ์„ ๋ฐฉ์–ดํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์ถฉ๋ถ„ํžˆ ํƒ๊ตฌํ•˜์ง€ ์•Š์Œ
  3. ํ™•์žฅ์„ฑ ๋ฌธ์ œ: GP์˜ ์ž…๋ฐฉ ๋ณต์žก๋„๋Š” ๋Œ€๊ทœ๋ชจ ์‘์šฉ์„ ์ œํ•œํ•  ์ˆ˜ ์žˆ์Œ
  4. ํŠน์ง• ์„ ํƒ: ํŠน์ง• ์—”์ง€๋‹ˆ์–ด๋ง์€ ์—ฌ์ „ํžˆ ์ˆ˜๋™ ์„ค๊ณ„ ํ•„์š”, ์ž๋™ํ™” ์ •๋„ ์ œํ•œ
  5. ๋น„๊ต ์‹คํ—˜: ๊ธฐ์กด ์ตœ์ฒจ๋‹จ ๋ฐฉ๋ฒ•๊ณผ์˜ ์ง์ ‘์ ์ธ ์ˆ˜์น˜ ๋น„๊ต ๋ถ€์žฌ

์˜ํ–ฅ๋ ฅ

  1. ํ•™์ˆ ์  ๊ธฐ์—ฌ: ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ์— ์ƒˆ๋กœ์šด ๊ธฐ์ˆ  ๋ฐฉํ–ฅ ์ œ๊ณต
  2. ์‹ค์šฉ์  ๊ฐ€์น˜: ๋ฐฉ๋ฒ•์ด ๊ฐ„๋‹จํ•˜๊ณ  ํšจ์œจ์ ์ด๋ฉฐ ๊ตฌํ˜„ ๋ฐ ๋ฐฐํฌ๊ฐ€ ์šฉ์ด
  3. ์žฌํ˜„์„ฑ: ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ค๋ช…์ด ์ƒ์„ธํ•˜๊ณ  ์‹คํ—˜ ์„ค์ •์ด ๋ช…ํ™•
  4. ์˜๊ฐ: GP ๋ฉ”ํƒ€ ๋ชจ๋ธ๋ง ์‚ฌ์ƒ์ด ๋‹ค๋ฅธ ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ๊ณต๊ฒฉ ์—ฐ๊ตฌ์— ์˜๊ฐ์„ ์ค„ ์ˆ˜ ์žˆ์Œ

์ ์šฉ ์‹œ๋‚˜๋ฆฌ์˜ค

  1. ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ๊ฐ์‚ฌ: ๋ฐฐํฌ๋œ ๋ชจ๋ธ์˜ ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ์œ„ํ—˜ ํ‰๊ฐ€
  2. ๋ชจ๋ธ ์ง„๋‹จ: ๋ถ„ํฌ ํŽธ์ด ๋ฐ ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ ํƒ์ง€
  3. ๋ฐฉ์–ด ์—ฐ๊ตฌ: ๋ฐฉ์–ด ๋ฐฉ๋ฒ• ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ๊ณต๊ฒฉ ๋ฒค์น˜๋งˆํฌ๋กœ ์‚ฌ์šฉ
  4. ๋ธ”๋ž™๋ฐ•์Šค ์„ค์ •: ๋ชจ๋ธ ์ถœ๋ ฅ ์ ‘๊ทผ๋งŒ ํ•„์š”ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค

์ฐธ๊ณ ๋ฌธํ—Œ

  1. Shokri et al. (2017) - ์„€๋„์šฐ ๋ชจ๋ธ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ
  2. Carlini et al. (2022) - ์šฐ๋„๋น„ ๊ณต๊ฒฉ(LiRA)
  3. Rasmussen & Williams (2006) - ๊ฐ€์šฐ์Šค ๊ณผ์ • ๊ธฐ๊ณ„ํ•™์Šต
  4. Ye et al. (2022) - ๊ฐ•ํ™”๋œ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ
  5. Hu et al. (2022) - ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ ์ข…ํ•ฉ ์กฐ์‚ฌ

๋ณธ ๋…ผ๋ฌธ์€ ๊ฐ€์šฐ์Šค ๊ณผ์ •์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ํ˜์‹ ์ ์ธ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜๋ฉฐ, ๋†’์€ ์ •ํ™•๋„๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ ํšจ์œจ์„ฑ๊ณผ ์‹ค์šฉ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ์ผ๋ถ€ ์ด๋ก ์  ๋ฐ ์‹คํ—˜์  ๋ถ€์กฑ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ํ•ต์‹ฌ ์•„์ด๋””์–ด์™€ ์‹คํ—˜ ๊ฒฐ๊ณผ๋Š” ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ๊ณต๊ฒฉ ์—ฐ๊ตฌ์— ๊ฐ€์น˜ ์žˆ๋Š” ๊ธฐ์—ฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.