Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix
Levecque, Noirault, Pevný et al.
Steganographic schemes dedicated to generated images modify the seed vector in the latent space to embed a message, whereas most steganalysis methods attempt to detect the embedding in the image space. This paper proposes to perform steganalysis in the latent space by modeling the statistical distribution of the norm of the latent vector. Specifically, we analyze the practical security of a scheme proposed by Hu et. al. for latent diffusion models, which is both robust and practically undetectable when steganalysis is performed on generated images. We show that after embedding, the Stego (latent) vector is distributed on a hypersphere while the Cover vector is i.i.d. Gaussian. By going from the image space to the latent space, we show that it is possible to model the norm of the vector in the latent space under the Cover or Stego hypothesis as Gaussian distributions with different variances. A Likelihood Ratio Test is then derived to perform pooled steganalysis. The impact of the potential knowledge of the prompt and the number of diffusion steps, is also studied. Additionally, we also show how, by randomly sampling the norm of the latent vector before generation, the initial Stego scheme becomes undetectable in the latent space.
academic
Stéganalyse Ciblée en Espace Latent Groupée Appliquée à la Stéganographie Générative, avec une Correction
Cet article propose une nouvelle méthode de stéganalyse ciblée sur la stéganographie d'images génératives. Alors que la stéganalyse traditionnelle effectue la détection dans l'espace image, la stéganographie générative modifie les vecteurs de semence dans l'espace latent pour intégrer des messages. Cet article propose une stéganalyse dans l'espace latent, en modélisant la distribution statistique de la norme des vecteurs latents pour détecter la stéganographie. L'étude analyse la sécurité pratique du schéma de stéganographie par modèle de diffusion latente proposé par Hu et al., qui présente une robustesse et une indétectabilité dans la stéganalyse de l'espace image. L'étude révèle que les vecteurs latents stéganographiés sont distribués sur une hypersphère, tandis que les vecteurs de couverture suivent une distribution gaussienne indépendante et identiquement distribuée. Une stéganalyse groupée par test du rapport de vraisemblance est effectuée, et l'impact de la connaissance des invites et du nombre d'étapes de diffusion est étudié. De plus, une méthode pour rendre le schéma de stéganographie original indétectable dans l'espace latent par échantillonnage aléatoire de la norme des vecteurs latents est présentée.
La stéganographie générative est un domaine de recherche actif et émergent capable d'intégrer des charges utiles de grande capacité et d'être robuste aux opérations telles que la compression JPEG, tout en restant potentiellement indétectable. Contrairement à la stéganographie traditionnelle qui modifie uniquement la composante bruit de l'image, le processus d'intégration de la stéganographie générative modifie également le contenu sémantique de l'image.
Limitations des méthodes existantes: La plupart des méthodes de stéganalyse tentent de détecter l'intégration dans l'espace image, alors que la stéganographie générative modifie les vecteurs de semence dans l'espace latent
Analyse de sécurité insuffisante: De nombreux schémas publiés présentent des lacunes dans l'analyse de sécurité dans l'espace latent
Défis de détection: Le schéma de Hu et al. est à la fois robuste et indétectable dans la stéganalyse du domaine image, nécessitant de nouvelles méthodes d'analyse
La stéganographie générative est particulièrement populaire dans les modèles de diffusion latente, car ces modèles peuvent fournir des images de haute qualité. Comprendre et analyser la sécurité de tels schémas est d'une importance capitale pour le domaine de la sécurité de l'information.
Proposition d'une méthode de stéganalyse en espace latent: Première stéganalyse effectuée dans l'espace latent plutôt que dans l'espace image ou les distributions marginales
Établissement d'un modèle de détection statistique: Modélisation de la distribution statistique de la norme des vecteurs latents, avec les distributions sous les hypothèses de couverture et de stéganographie modélisées comme des distributions gaussiennes de variances différentes
Développement d'un test du rapport de vraisemblance: Détecteur groupé basé sur le test du rapport de vraisemblance (TRV), facile à étendre à la détection d'images en lot
Fourniture d'un plan de correction de sécurité: Proposition d'une méthode de codage par étalement spectral échelonné (Scaled SS) qui rend le schéma de stéganographie indétectable dans l'espace latent par échantillonnage aléatoire de la norme des vecteurs latents
Analyse expérimentale complète: Étude de l'impact de la connaissance des invites et du nombre d'étapes de diffusion sur les performances de détection
Entrée: Images générées par un modèle de diffusion latente et leurs vecteurs latents correspondants
Sortie: Déterminer si l'image est une image de couverture ou une image stéganographiée
Contraintes: Conformité au principe de Kerckhoffs, l'attaquant connaît le canal L2L et les paramètres fixes α, mais ne connaît pas la clé
Le codage SS échelonné élimine efficacement la différence de détection, rendant le rapport de vraisemblance de toutes les normes proche de 1, randomisant les performances de détection.
Par rapport aux travaux existants, cet article effectue pour la première fois une analyse sur la distribution conjointe plutôt que marginale de l'espace latent, fournissant une évaluation de sécurité plus approfondie.
Stéganalyse en espace latent réalisable: Même si indétectable dans l'espace image, des différences statistiques peuvent exister dans l'espace latent
Distribution de la norme est clé: La différence de distribution de norme entre les vecteurs stéganographiés et de couverture est la base de la détection
Plan de correction efficace: L'indétectabilité véritable peut être réalisée par un appariement approprié des distributions
Impact des paramètres réels: Les paramètres tels que le nombre d'étapes de diffusion affectent les performances de détection, mais l'impact des invites est limité
L'article cite plusieurs travaux connexes importants, notamment:
Hu et al. (2024): Le schéma de stéganographie original analysé
Rombach et al. (2022): Travaux fondamentaux sur les modèles de diffusion latente
Cox et al. (2008): Manuel classique sur le filigrane numérique
Fridrich (2009): Manuel classique sur la stéganographie
Ainsi que plusieurs travaux connexes sur la stéganalyse par apprentissage profond
Cet article apporte des contributions importantes à l'analyse de sécurité de la stéganographie générative, proposant une nouvelle perspective d'analyse et une méthode de détection efficace, tout en fournissant également un plan d'amélioration de la sécurité correspondant, jouant un rôle important dans l'avancement du domaine.