Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix
Levecque, Noirault, Pevný et al.
Steganographic schemes dedicated to generated images modify the seed vector in the latent space to embed a message, whereas most steganalysis methods attempt to detect the embedding in the image space. This paper proposes to perform steganalysis in the latent space by modeling the statistical distribution of the norm of the latent vector. Specifically, we analyze the practical security of a scheme proposed by Hu et. al. for latent diffusion models, which is both robust and practically undetectable when steganalysis is performed on generated images. We show that after embedding, the Stego (latent) vector is distributed on a hypersphere while the Cover vector is i.i.d. Gaussian. By going from the image space to the latent space, we show that it is possible to model the norm of the vector in the latent space under the Cover or Stego hypothesis as Gaussian distributions with different variances. A Likelihood Ratio Test is then derived to perform pooled steganalysis. The impact of the potential knowledge of the prompt and the number of diffusion steps, is also studied. Additionally, we also show how, by randomly sampling the norm of the latent vector before generation, the initial Stego scheme becomes undetectable in the latent space.
academic
Analisi Steganalitiche Mirata nello Spazio Latente Raggruppato Applicata alla Steganografia Generativa, con una Correzione
Questo articolo propone un nuovo metodo di analisi steganalitiche per la steganografia di immagini generate. Mentre l'analisi steganalitiche tradizionale esegue il rilevamento nello spazio dell'immagine, la steganografia generativa modifica i vettori seed nello spazio latente per incorporare messaggi. L'articolo propone di condurre l'analisi steganalitiche nello spazio latente, modellando la distribuzione statistica delle norme dei vettori latenti per rilevare la steganografia. La ricerca analizza la sicurezza pratica dello schema di steganografia del modello di diffusione latente proposto da Hu et al., che dimostra robustezza e non rilevabilità nell'analisi steganalitiche dello spazio dell'immagine. Lo studio scopre che i vettori latenti steganografici incorporati si distribuiscono su un'ipersfera, mentre i vettori di copertura seguono una distribuzione gaussiana indipendente e identicamente distribuita. Attraverso il test del rapporto di verosimiglianza viene condotta un'analisi steganalitiche raggruppata, e viene studiato l'impatto della conoscenza del prompt e dei passi di diffusione. Inoltre, viene dimostrato come rendere il metodo di steganografia originale non rilevabile nello spazio latente attraverso il campionamento casuale delle norme dei vettori latenti.
La steganografia generativa è un campo di ricerca emergente e attivo che consente l'incorporamento di carichi di grande capacità e la robustezza a operazioni come la compressione JPEG, rimanendo potenzialmente non rilevata. A differenza della steganografia tradizionale che modifica solo le componenti di rumore dell'immagine, il processo di incorporamento della steganografia generativa altera anche il contenuto semantico dell'immagine.
Limitazioni dei Metodi Esistenti: La maggior parte dei metodi di analisi steganalitiche tenta il rilevamento nello spazio dell'immagine, mentre la steganografia generativa modifica i vettori seed nello spazio latente
Analisi di Sicurezza Insufficiente: Molti schemi pubblicati presentano punti ciechi nell'analisi della sicurezza nello spazio latente
Sfide di Rilevamento: Lo schema di Hu et al. è sia robusto che non rilevabile nell'analisi steganalitiche del dominio dell'immagine, richiedendo nuovi metodi di analisi
La steganografia generativa è particolarmente popolare nei modelli di diffusione latente, poiché questi modelli forniscono immagini di alta qualità. Comprendere e analizzare la sicurezza di tali schemi è di grande importanza per il campo della sicurezza dell'informazione.
Propone un Metodo di Analisi Steganalitiche nello Spazio Latente: Per la prima volta conduce l'analisi steganalitiche nello spazio latente piuttosto che nello spazio dell'immagine o nelle distribuzioni marginali
Stabilisce un Modello di Rilevamento Statistico: Modella la distribuzione statistica delle norme dei vettori latenti, modellando le distribuzioni sotto le ipotesi di copertura e steganografia come distribuzioni gaussiane con varianze diverse
Sviluppa un Test del Rapporto di Verosimiglianza: Un rilevatore raggruppato basato sul test del rapporto di verosimiglianza (LRT), facilmente estendibile al rilevamento di batch di immagini
Fornisce uno Schema di Correzione della Sicurezza: Propone il metodo di codifica Scaled Spread Spectrum (Scaled SS), rendendo lo schema di steganografia non rilevabile nello spazio latente attraverso il campionamento casuale delle norme dei vettori latenti
Analisi Sperimentale Completa: Studia l'impatto della conoscenza del prompt e dei passi di diffusione sulle prestazioni di rilevamento
Input: Immagini generate dal modello di diffusione latente e i corrispondenti vettori latenti
Output: Determinare se un'immagine è un'immagine di copertura o steganografica
Vincoli: Seguire il principio di Kerckhoffs; l'attaccante conosce il canale L2L e i parametri fissi α, ma non conosce la chiave
La codifica Scaled SS elimina efficacemente la differenza di rilevamento, rendendo il rapporto di verosimiglianza di tutte le norme prossimo a 1, randomizzando le prestazioni di rilevamento.
Rilevamento nello Spazio Latente Fattibile: Anche gli schemi di steganografia non rilevabili nello spazio dell'immagine possono essere rilevati nello spazio latente
Rilevamento su Batch Più Efficace: Il raggruppamento di più immagini migliora significativamente le prestazioni di rilevamento
Schema di Correzione Efficace: Il campionamento della norma elimina efficacemente la differenza statistica
Impatto Limitato del Prompt: L'ignoranza del prompt esatto non influisce sull'efficacia del rilevamento
Rispetto ai lavori esistenti, questo articolo conduce per la prima volta l'analisi sulla distribuzione congiunta nello spazio latente piuttosto che sulla distribuzione marginale, fornendo una valutazione della sicurezza più approfondita.
Analisi Steganalitiche nello Spazio Latente Fattibile: Anche se non rilevabile nello spazio dell'immagine, possono esistere differenze statistiche nello spazio latente
Distribuzione della Norma è Cruciale: La differenza nella distribuzione della norma tra vettori steganografici e di copertura è la base del rilevamento
Schema di Correzione Efficace: Attraverso l'appropriato abbinamento della distribuzione è possibile ottenere una vera non rilevabilità
Impatto dei Parametri Pratici: I parametri come i passi di diffusione influenzano le prestazioni di rilevamento, ma l'impatto del prompt è limitato
L'articolo cita numerosi lavori correlati importanti, inclusi:
Hu et al. (2024): Lo schema di steganografia originale analizzato
Rombach et al. (2022): Lavoro fondamentale sul modello di diffusione latente
Cox et al. (2008): Testo classico sulla filigrana digitale
Fridrich (2009): Testo classico sulla steganografia
E numerosi lavori correlati sull'analisi steganalitiche dell'apprendimento profondo
Questo articolo ha fornito importanti contributi all'analisi della sicurezza della steganografia generativa, proponendo una nuova prospettiva di analisi e un metodo di rilevamento efficace, fornendo al contempo uno schema corrispondente di miglioramento della sicurezza, che ha un ruolo importante nella promozione dello sviluppo di questo campo.