2025-11-14T09:49:10.731774

Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix

Levecque, Noirault, Pevný et al.
Steganographic schemes dedicated to generated images modify the seed vector in the latent space to embed a message, whereas most steganalysis methods attempt to detect the embedding in the image space. This paper proposes to perform steganalysis in the latent space by modeling the statistical distribution of the norm of the latent vector. Specifically, we analyze the practical security of a scheme proposed by Hu et. al. for latent diffusion models, which is both robust and practically undetectable when steganalysis is performed on generated images. We show that after embedding, the Stego (latent) vector is distributed on a hypersphere while the Cover vector is i.i.d. Gaussian. By going from the image space to the latent space, we show that it is possible to model the norm of the vector in the latent space under the Cover or Stego hypothesis as Gaussian distributions with different variances. A Likelihood Ratio Test is then derived to perform pooled steganalysis. The impact of the potential knowledge of the prompt and the number of diffusion steps, is also studied. Additionally, we also show how, by randomly sampling the norm of the latent vector before generation, the initial Stego scheme becomes undetectable in the latent space.
academic

Целевой анализ стеганографии в объединённом латентном пространстве, применённый к генеративной стеганографии, с исправлением

Основная информация

  • ID статьи: 2510.12414
  • Название: Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix
  • Авторы: Etienne Levecque, Aurelien Noirault, Tomas Pevny, Jan Butora, Patrick Bas, Rémi Cogranne
  • Категория: cs.CR (криптография и безопасность), eess.IV (обработка изображений и видео)
  • Дата публикации: 14 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.12414

Аннотация

В данной работе предлагается новый метод стегоанализа для генеративной стеганографии. Традиционный стегоанализ проводится в пространстве изображений, тогда как генеративная стеганография модифицирует векторы-семена в латентном пространстве для встраивания сообщений. В работе предлагается проводить стегоанализ в латентном пространстве путём моделирования статистического распределения норм латентных векторов для обнаружения стеганографии. Исследуется практическая безопасность схемы стеганографии на основе диффузионных моделей, предложенной Ху и соавторами, которая демонстрирует устойчивость и необнаруживаемость при стегоанализе в пространстве изображений. Установлено, что встроенные стеганографические латентные векторы распределены на гиперсфере, тогда как векторы-носители подчиняются независимому и одинаково распределённому гауссовскому распределению. Проводится объединённый стегоанализ с использованием теста отношения правдоподобия и исследуется влияние знания подсказок и количества шагов диффузии. Кроме того, демонстрируется способ сделать исходную схему стеганографии необнаруживаемой в латентном пространстве путём случайной выборки норм латентных векторов.

Исследовательский контекст и мотивация

Определение проблемы

Генеративная стеганография — это новая активная область исследований, которая позволяет встраивать большие объёмы данных и обладает устойчивостью к операциям, таким как сжатие JPEG, при этом оставаясь необнаруживаемой. В отличие от традиционной стеганографии, которая изменяет только компоненты шума изображения, процесс встраивания генеративной стеганографии также изменяет семантическое содержание изображения.

Исследовательская мотивация

  1. Ограничения существующих методов: Большинство методов стегоанализа пытаются обнаружить встраивание в пространстве изображений, тогда как генеративная стеганография модифицирует векторы-семена в латентном пространстве
  2. Недостаточный анализ безопасности: Многие опубликованные схемы имеют слепые пятна в анализе безопасности в латентном пространстве
  3. Проблемы обнаружения: Схема Ху и соавторов одновременно устойчива и необнаруживаема при стегоанализе в пространстве изображений, требуя новых методов анализа

Значимость

Генеративная стеганография особенно популярна в диффузионных моделях, поскольку эти модели обеспечивают высокое качество изображений. Понимание и анализ безопасности таких схем имеет важное значение для области информационной безопасности.

Основные вклады

  1. Предложение метода стегоанализа в латентном пространстве: Впервые проводится стегоанализ в латентном пространстве, а не в пространстве изображений или маргинальных распределениях
  2. Установление модели статистического обнаружения: Моделирование статистического распределения норм латентных векторов путём представления распределений при гипотезах носителя и стеганографии как гауссовских распределений с разными дисперсиями
  3. Разработка теста отношения правдоподобия: Объединённый детектор на основе теста отношения правдоподобия (LRT), легко расширяемый для обнаружения пакетов изображений
  4. Предоставление схемы исправления безопасности: Предложение метода кодирования с масштабированием расширения спектра (Scaled SS), который делает схему стеганографии необнаруживаемой в латентном пространстве путём случайной выборки норм латентных векторов
  5. Комплексный экспериментальный анализ: Исследование влияния знания подсказок и количества шагов диффузии на производительность обнаружения

Подробное описание методологии

Определение задачи

Входные данные: Изображения, генерируемые диффузионной моделью, и соответствующие им латентные векторы Выходные данные: Определение, является ли изображение носителем или стеганографическим изображением Ограничения: Соответствие принципу Керкхоффса; атакующий знает канал L2L и фиксированные параметры α, но не знает ключ

Анализ схемы стеганографии

Схема встраивания Ху и соавторов

Использует принцип расширения спектра с модуляцией ортонормированной матрицей псевдослучайных чисел Q, связанной с ключом:

X=QMQTX = Q \cdot M \cdot Q^T

где M — это переформатированное в размер латентного пространства секретное сообщение ±1.

Модель канала L2L

Канал от латентного пространства к латентному пространству (L2L) состоит из трёх частей:

  1. Процесс генерации: отображение семени в изображение
  2. Операции искажения: например, сжатие
  3. Обратная генерация: отображение изображения обратно в вектор латентного пространства Y

Представляется как: Y=f(X,α)Y = f(X, α)

Модель статистического обнаружения

Моделирование норм перед встраиванием

  • Нулевая гипотеза (носитель): XN(0,In)X \sim N(0, I_n), норма RXχnR_X \sim χ_n
  • Альтернативная гипотеза (стеганография): X=QMQTX = Q \cdot M \cdot Q^T, норма RX=nR_X = \sqrt{n} (константа)

При больших n при нулевой гипотезе: RXdN(n,12)R_X \xrightarrow{d} N(\sqrt{n}, \frac{1}{2})

Моделирование норм после встраивания

Предполагается, что канал L2L вводит гауссовский шум на норму ε(α)N(0,σ2(α))\varepsilon(α) \sim N(0, σ^2(α)):

H0:RYN(n,12+σ2(α))H_0: R_Y \sim N(\sqrt{n}, \frac{1}{2} + σ^2(α))H1:RYN(n,σ2(α))H_1: R_Y \sim N(\sqrt{n}, σ^2(α))

Две гипотезы различаются только дисперсией, что является ключом к обнаружению.

Тест отношения правдоподобия

Тест для одного изображения

Λ(rY)=N(rY;μ^1,σ^12)N(rY;μ^0,σ^02)Λ(r_Y) = \frac{N(r_Y; \hat{μ}_1, \hat{σ}^2_1)}{N(r_Y; \hat{μ}_0, \hat{σ}^2_0)}

Нулевая гипотеза отклоняется при Λ(rY)>τΛ(r_Y) > τ, изображение классифицируется как стеганографическое.

Объединённый тест

Для пакета изображений B, предполагая, что все изображения принадлежат одному классу: Λ(B)=iN(rYi;μ^1,σ^12)N(rYi;μ^0,σ^02)Λ(B) = \prod_i \frac{N(r_{Y_i}; \hat{μ}_1, \hat{σ}^2_1)}{N(r_{Y_i}; \hat{μ}_0, \hat{σ}^2_0)}

Схема исправления безопасности

Кодирование с масштабированием расширения спектра

Для исправления различия распределений предлагается выборка норм s согласно распределению χ_n, затем масштабирование:

X=snQMQTX = \frac{s}{\sqrt{n}} Q \cdot M \cdot Q^T

Это обеспечивает, чтобы норма стеганографического вектора также подчинялась распределению χ_n, устраняя статистическое различие.

Экспериментальная установка

Набор данных

  • Модель: Stable Diffusion 1.5
  • Параметры: guidance=5.0, количество шагов диффузии=20
  • Подсказки: Случайно выбраны из базы данных DiffusionDB
  • Масштаб: Каждый эксперимент использует 20k подсказок, генерируя 20k изображений-носителей и 20k стеганографических изображений
  • Размерность латентного пространства: (4, 64, 64), длина сообщения n=16384 бит

Метрики оценки

  • Вероятность ошибки (PE): PE=minPFAPFA+PMD(PFA)2PE = \min_{P_{FA}} \frac{P_{FA} + P_{MD}(P_{FA})}{2}
  • Коэффициент ошибок по битам (BER): Доля правильно декодированных бит
  • Перекрёстная проверка: 20-кратная перекрёстная проверка

Детали реализации

  • Использование 1k изображений-носителей и 1k стеганографических изображений для оценки среднего значения и дисперсии
  • Оставшиеся 19k изображений используются для расчёта PE
  • Пороговое значение теста отношения правдоподобия τ=1

Результаты экспериментов

Основные результаты

Производительность обнаружения

  • Обнаружение одного изображения: PE ≈ 48%
  • Объединённое обнаружение: PE значительно снижается с увеличением размера пакета
    • Размер пакета 10: PE=45.3%
    • Размер пакета 100: PE=33.4%

Влияние количества шагов диффузии

Размер пакета20 шагов50 шагов
148.5%47.2%
1045.3%41.6%
10033.4%30.0%

Большее количество шагов диффузии снижает искажение канала L2L, повышая эффективность атаки.

Влияние знания подсказок

BER остаётся практически неизменным независимо от знания подсказок:

  • Кодирование SS: 97.53% против 97.56%
  • Кодирование с масштабированием SS: 97.53% против 97.52%

Эффективность схемы исправления

Кодирование с масштабированием SS эффективно устраняет различие обнаружения, делая отношение правдоподобия для всех норм близким к 1, рандомизируя производительность обнаружения.

Экспериментальные выводы

  1. Обнаружение в латентном пространстве осуществимо: Даже схемы стеганографии, необнаруживаемые в пространстве изображений, могут быть обнаружены в латентном пространстве
  2. Объединённое обнаружение более эффективно: Объединение нескольких изображений значительно повышает производительность обнаружения
  3. Схема исправления эффективна: Выборка норм может устранить статистическое различие
  4. Влияние подсказок ограничено: Незнание точной подсказки не влияет на эффективность обнаружения

Связанные работы

Традиционный стегоанализ

Подразделяется на две категории:

  1. На основе глубокого обучения: Обучение классификационной сети для различения изображений-носителей и стеганографических изображений
  2. На основе статистического анализа: Расчёт расхождения Кульбака-Лейблера маргинальных распределений латентного пространства

Генеративная стеганография

  • Стеганография на основе диффузионных моделей: Использование способности диффузионных моделей генерировать высокачественные изображения
  • Расширение спектра водяного знака: Распространение каждого встраиваемого бита по секретному носителю
  • Рассмотрение устойчивости: Необходимость учёта шума в процессах генерации, сжатия и обратного преобразования

Инновация данной работы

По сравнению с существующими работами, данная работа впервые проводит анализ на основе совместного распределения в латентном пространстве, а не маргинальных распределений, обеспечивая более глубокую оценку безопасности.

Заключение и обсуждение

Основные выводы

  1. Стегоанализ в латентном пространстве осуществим: Даже если обнаружение невозможно в пространстве изображений, в латентном пространстве могут существовать статистические различия
  2. Распределение норм является ключевым: Различие в распределении норм между стеганографическими и носительными векторами является основой для обнаружения
  3. Схема исправления эффективна: Надлежащее согласование распределений может обеспечить истинную необнаруживаемость
  4. Влияние практических параметров: Параметры, такие как количество шагов диффузии, влияют на производительность обнаружения, но влияние подсказок ограничено

Ограничения

  1. Предположения модели: Предположение о гауссовском шуме канала L2L может быть чрезмерно упрощённым
  2. Вычислительная сложность: Требуется выполнение процесса обратного преобразования изображения для получения латентного вектора
  3. Область применения: Главным образом ориентирована на конкретные схемы расширения спектра
  4. Чувствительность параметров: Производительность обнаружения зависит от конкретных параметров диффузионной модели

Направления будущих исследований

  1. Более сложное моделирование L2L: Рассмотрение более реалистичных моделей каналов
  2. Другие статистические признаки: Исследование других статистических признаков латентного пространства для обнаружения
  3. Адаптивные атаки: Исследование противодействующих стратегий против данного метода обнаружения
  4. Обнаружение в реальном времени: Разработка более эффективных алгоритмов обнаружения

Глубокая оценка

Преимущества

  1. Высокая инновационность: Впервые предлагается стегоанализ в латентном пространстве с новой перспективой
  2. Прочная теоретическая база: Основана на строгих статистических моделях и теории теста отношения правдоподобия
  3. Достаточные эксперименты: Комплексная экспериментальная проверка с различными параметрами и исследованиями абляции
  4. Высокая практическая ценность: Предоставляет полное решение, которое одновременно обнаруживает и исправляет проблемы
  5. Глубокий анализ: Ясное теоретическое объяснение как принципов обнаружения, так и механизмов отказа

Недостатки

  1. Упрощение модели: Моделирование канала L2L относительно простое, реальная ситуация может быть более сложной
  2. Вычислительные затраты: Требуется выполнение процесса обратного преобразования изображения, что требует значительных вычислительных ресурсов
  3. Обобщаемость: Главным образом ориентирована на конкретные схемы стеганографии, применимость к другим схемам требует проверки
  4. Практическое развёртывание: Операционность и эффективность при практическом применении требуют оценки

Влияние

  1. Академический вклад: Предоставляет новую перспективу для анализа безопасности генеративной стеганографии
  2. Практическая ценность: Имеет важное значение для оценки практической безопасности существующих схем стеганографии
  3. Вдохновляющее значение: Может вдохновить больше исследований по анализу безопасности на основе латентного пространства
  4. Воспроизводимость: Ясная экспериментальная установка облегчает воспроизведение и расширение

Применимые сценарии

  1. Оценка безопасности: Оценка практической безопасности схем генеративной стеганографии
  2. Улучшение схемы: Руководство по улучшению безопасности схем стеганографии
  3. Система обнаружения: Построение систем обнаружения для генеративной стеганографии
  4. Исследовательский инструмент: Использование в качестве инструмента исследования для анализа безопасности латентного пространства

Библиография

Статья цитирует множество важных связанных работ, включая:

  • Hu et al. (2024): Исходная анализируемая схема стеганографии
  • Rombach et al. (2022): Фундаментальная работа по диффузионным моделям
  • Cox et al. (2008): Классический учебник по цифровым водяным знакам
  • Fridrich (2009): Классический учебник по стеганографии
  • А также множество связанных работ по стегоанализу на основе глубокого обучения

Данная статья вносит важный вклад в анализ безопасности генеративной стеганографии, предлагая новую перспективу анализа и эффективный метод обнаружения, а также предоставляя соответствующую схему улучшения безопасности, что имеет важное значение для развития данной области.