Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix
Levecque, Noirault, Pevný et al.
Steganographic schemes dedicated to generated images modify the seed vector in the latent space to embed a message, whereas most steganalysis methods attempt to detect the embedding in the image space. This paper proposes to perform steganalysis in the latent space by modeling the statistical distribution of the norm of the latent vector. Specifically, we analyze the practical security of a scheme proposed by Hu et. al. for latent diffusion models, which is both robust and practically undetectable when steganalysis is performed on generated images. We show that after embedding, the Stego (latent) vector is distributed on a hypersphere while the Cover vector is i.i.d. Gaussian. By going from the image space to the latent space, we show that it is possible to model the norm of the vector in the latent space under the Cover or Stego hypothesis as Gaussian distributions with different variances. A Likelihood Ratio Test is then derived to perform pooled steganalysis. The impact of the potential knowledge of the prompt and the number of diffusion steps, is also studied. Additionally, we also show how, by randomly sampling the norm of the latent vector before generation, the initial Stego scheme becomes undetectable in the latent space.
academic
Gezielte gepoolte Latent-Space-Steganalyse angewendet auf generative Steganographie mit einer Korrektur
Dieses Papier schlägt eine neue Steganalysemethode für generative Bilder vor. Während traditionelle Steganalyse hauptsächlich im Bildraum durchgeführt wird, modifiziert generative Steganographie Saatvektoren im latenten Raum zur Nachrichteneinbettung. Das Papier schlägt vor, Steganalyse im latenten Raum durchzuführen, indem die statistische Verteilung der Norm latenter Vektoren modelliert wird, um Steganographie zu erkennen. Die Forschung analysiert die praktische Sicherheit des von Hu et al. vorgeschlagenen latenten Diffusionsmodell-Steganographieschemas, das Robustheit und Unerkennbarkeit in der Bildraum-Steganalyse zeigt. Die Studie stellt fest, dass eingebettete steganographische latente Vektoren auf einer Hypersphäre verteilt sind, während Deckungsvektoren einer unabhängigen identischen Gaußverteilung folgen. Durch Likelihood-Ratio-Tests wird gepoolte Steganalyse durchgeführt, und die Auswirkungen von Prompt-Wissen und Diffusionsschritten werden untersucht. Darüber hinaus wird gezeigt, wie das ursprüngliche Steganographieschema durch zufälliges Sampling der latenten Vektornorm im latenten Raum unerkennbar gemacht werden kann.
Generative Steganographie ist ein aufstrebendes aktives Forschungsgebiet, das große Nutzlasten einbetten kann und robust gegenüber Operationen wie JPEG-Kompression ist, während es möglicherweise unerkannt bleibt. Im Gegensatz zur traditionellen Steganographie, die nur die Rauschkomponenten von Bildern ändert, modifiziert der Einbettungsprozess der generativen Steganographie auch den semantischen Inhalt des Bildes.
Einschränkungen bestehender Methoden: Die meisten Steganalysemethoden versuchen, Einbettungen im Bildraum zu erkennen, während generative Steganographie Saatvektoren im latenten Raum modifiziert
Unzureichende Sicherheitsanalyse: Viele veröffentlichte Schemata haben Blindstellen bei der Sicherheitsanalyse im latenten Raum
Erkennungsherausforderungen: Das Schema von Hu et al. ist in der Bildbereich-Steganalyse sowohl robust als auch unerkennbar und erfordert neue Analysemethoden
Generative Steganographie ist besonders beliebt bei latenten Diffusionsmodellen, da diese Modelle hochwertige Bilder liefern können. Das Verständnis und die Analyse der Sicherheit solcher Schemata ist für das Informationssicherheitsfeld von großer Bedeutung.
Vorschlag einer Latent-Space-Steganalysemethode: Erstmals Steganalyse im latenten Raum statt im Bildraum oder Randverteilungen durchgeführt
Etablierung eines statistischen Erkennungsmodells: Modellierung der Verteilung von Latentvektornormen, wobei Deck- und Steganographie-Hypothesen als Gaußverteilungen mit unterschiedlichen Varianzen modelliert werden
Entwicklung von Likelihood-Ratio-Tests: Gepoolter Detektor basierend auf Likelihood-Ratio-Tests (LRT), leicht erweiterbar auf Batch-Bilderkennung
Bereitstellung eines Sicherheitskorrekturschemas: Vorschlag der Scaled Spread Spectrum (Scaled SS)-Codierungsmethode, die das Steganographieschema durch zufälliges Sampling der Latentvektornorm im latenten Raum unerkennbar macht
Umfassende experimentelle Analyse: Untersuchung der Auswirkungen von Prompt-Wissen und Diffusionsschritten auf die Erkennungsleistung
Eingabe: Von einem latenten Diffusionsmodell generierte Bilder und ihre entsprechenden latenten Vektoren
Ausgabe: Bestimmung, ob ein Bild ein Deckungsbild oder ein steganographisches Bild ist
Einschränkungen: Einhaltung des Kerckhoffs-Prinzips; der Angreifer kennt den L2L-Kanal und feste Parameter α, aber nicht den Schlüssel
Die skalierte SS-Codierung eliminiert effektiv die Erkennungsdifferenz, wodurch alle Normwahrscheinlichkeitsverhältnisse nahe bei 1 liegen und die Erkennungsleistung randomisiert wird.
Im Vergleich zu bestehenden Arbeiten führt dieses Papier erstmals eine Analyse der gemeinsamen Verteilung im latenten Raum statt der Randverteilung durch und bietet eine tiefere Sicherheitsbewertung.
Das Papier zitiert mehrere wichtige verwandte Arbeiten, darunter:
Hu et al. (2024): Das analysierte ursprüngliche Steganographieschema
Rombach et al. (2022): Grundlegende Arbeiten zu latenten Diffusionsmodellen
Cox et al. (2008): Klassisches Lehrbuch zum digitalen Watermarking
Fridrich (2009): Klassisches Lehrbuch zur Steganographie
Sowie mehrere verwandte Arbeiten zur Steganalyse mit tiefem Lernen
Dieses Papier leistet wichtige Beiträge zur Sicherheitsanalyse generativer Steganographie, schlägt neue Analyseperspektiven und effektive Erkennungsmethoden vor und bietet gleichzeitig entsprechende Sicherheitsverbesserungsschemata, die eine wichtige Rolle für die Entwicklung dieses Feldes spielen.