Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix
Levecque, Noirault, Pevný et al.
Steganographic schemes dedicated to generated images modify the seed vector in the latent space to embed a message, whereas most steganalysis methods attempt to detect the embedding in the image space. This paper proposes to perform steganalysis in the latent space by modeling the statistical distribution of the norm of the latent vector. Specifically, we analyze the practical security of a scheme proposed by Hu et. al. for latent diffusion models, which is both robust and practically undetectable when steganalysis is performed on generated images. We show that after embedding, the Stego (latent) vector is distributed on a hypersphere while the Cover vector is i.i.d. Gaussian. By going from the image space to the latent space, we show that it is possible to model the norm of the vector in the latent space under the Cover or Stego hypothesis as Gaussian distributions with different variances. A Likelihood Ratio Test is then derived to perform pooled steganalysis. The impact of the potential knowledge of the prompt and the number of diffusion steps, is also studied. Additionally, we also show how, by randomly sampling the norm of the latent vector before generation, the initial Stego scheme becomes undetectable in the latent space.
본 논문은 생성 이미지의 은닉글쓰기에 대한 새로운 은닉글쓰기분석 방법을 제안한다. 전통적인 은닉글쓰기분석은 주로 이미지 공간에서 검출을 수행하는 반면, 생성식 은닉글쓰기는 잠재공간에서 시드 벡터를 수정하여 메시지를 삽입한다. 본 논문은 잠재공간에서 은닉글쓰기분석을 수행하고, 잠재 벡터 노름의 통계적 분포를 모델링하여 은닉글쓰기를 검출한다. Hu 등이 제안한 잠재 확산 모델 은닉글쓰기 방식의 실제 보안성을 분석하며, 이 방식은 이미지 공간 은닉글쓰기분석에서 견고성과 검출 불가능성을 나타낸다. 연구에서 삽입 후 은닉글쓰기 잠재 벡터는 초구면에 분포하는 반면, 은폐 벡터는 독립동일분포 가우스 분포를 따른다는 것을 발견했다. 우도비 검정을 통한 풀링 은닉글쓰기분석을 수행하고, 프롬프트 단어 지식과 확산 단계의 영향을 연구한다. 또한 잠재 벡터 노름을 무작위로 샘플링하여 원래 은닉글쓰기 방식을 잠재공간에서 검출 불가능하게 만드는 방법을 제시한다.
생성식 은닉글쓰기는 새로운 활발한 연구 분야로, 대용량 페이로드를 삽입할 수 있으며 JPEG 압축 등의 작업에 견고하면서도 검출되지 않을 수 있다. 전통적인 은닉글쓰기가 이미지 노이즈 성분만 변경하는 것과 달리, 생성식 은닉글쓰기의 삽입 과정은 이미지의 의미론적 내용도 변경한다.