Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix
Levecque, Noirault, Pevný et al.
Steganographic schemes dedicated to generated images modify the seed vector in the latent space to embed a message, whereas most steganalysis methods attempt to detect the embedding in the image space. This paper proposes to perform steganalysis in the latent space by modeling the statistical distribution of the norm of the latent vector. Specifically, we analyze the practical security of a scheme proposed by Hu et. al. for latent diffusion models, which is both robust and practically undetectable when steganalysis is performed on generated images. We show that after embedding, the Stego (latent) vector is distributed on a hypersphere while the Cover vector is i.i.d. Gaussian. By going from the image space to the latent space, we show that it is possible to model the norm of the vector in the latent space under the Cover or Stego hypothesis as Gaussian distributions with different variances. A Likelihood Ratio Test is then derived to perform pooled steganalysis. The impact of the potential knowledge of the prompt and the number of diffusion steps, is also studied. Additionally, we also show how, by randomly sampling the norm of the latent vector before generation, the initial Stego scheme becomes undetectable in the latent space.
تقدم هذه الورقة طريقة جديدة لتحليل التخفي المطبق على الصور المولدة. بينما يركز تحليل التخفي التقليدي على الكشف في فضاء الصورة، يعدل التخفي التوليدي متجهات البذور في الفضاء الكامن لتضمين الرسائل. تقترح الورقة إجراء تحليل التخفي في الفضاء الكامن من خلال نمذجة التوزيع الإحصائي لمعايير المتجهات الكامنة للكشف عن التخفي. يحلل البحث الأمان العملي لمخطط التخفي في نموذج الانتشار الكامن الذي اقترحه هو وآخرون، والذي أظهر قوة وعدم قابلية للكشف في تحليل التخفي في فضاء الصورة. يكتشف البحث أن المتجهات الكامنة المضمنة بالتخفي توزع على فرط كرة، بينما تتبع المتجهات الغطاء توزيع غاوسي مستقل وموزع بشكل متطابق. يتم إجراء تحليل التخفي المجمع من خلال اختبار نسبة الاحتمالية، مع دراسة تأثير معرفة الموجه والخطوات الانتشارية. بالإضافة إلى ذلك، يتم عرض طريقة لجعل مخطط التخفي الأصلي غير قابل للكشف في الفضاء الكامن من خلال أخذ عينات عشوائية من معايير المتجهات الكامنة.
التخفي التوليدي هو مجال بحث نشط وناشئ يمكنه تضمين حمولات كبيرة والقدرة على تحمل العمليات مثل ضغط JPEG، مع احتمال عدم الكشف عنه. بخلاف التخفي التقليدي الذي يغير فقط مكون الضوضاء في الصورة، تعدل عملية التضمين في التخفي التوليدي أيضاً المحتوى الدلالي للصورة.
يحظى التخفي التوليدي بشعبية خاصة في نماذج الانتشار الكامن لأن هذه النماذج توفر صوراً عالية الجودة. يعتبر فهم وتحليل أمان هذه الأنواع من المخططات ذا أهمية كبيرة لمجال أمان المعلومات.
اقتراح طريقة تحليل التخفي في الفضاء الكامن: أول مرة يتم إجراء تحليل التخفي في الفضاء الكامن بدلاً من فضاء الصورة أو التوزيعات الهامشية
بناء نموذج كشف إحصائي: من خلال نمذجة التوزيع الإحصائي لمعايير المتجهات الكامنة، يتم نمذجة التوزيعات تحت فرضيات الغطاء والتخفي كتوزيعات غاوسية بتباينات مختلفة
تطوير اختبار نسبة الاحتمالية: كاشف مجمع قائم على اختبار نسبة الاحتمالية (LRT)، يسهل توسيعه للكشف عن دفعات من الصور
توفير خطة إصلاح الأمان: اقتراح طريقة ترميز الفرقعة المقاسة (Scaled SS)، من خلال أخذ عينات عشوائية من معايير المتجهات الكامنة لجعل مخطط التخفي غير قابل للكشف في الفضاء الكامن
تحليل تجريبي شامل: دراسة تأثير معرفة الموجه وخطوات الانتشار على أداء الكشف
الإدخال: الصور المولدة من نموذج الانتشار الكامن والمتجهات الكامنة المقابلة لها
الإخراج: تحديد ما إذا كانت الصورة صورة غطاء أم صورة مخفية
القيود: الامتثال لمبدأ كيرشوفس، يعرف المهاجم قناة L2L والمعاملات الثابتة α، لكنه لا يعرف المفتاح
تستشهد الورقة بعدة أعمال مهمة ذات صلة، بما في ذلك:
Hu et al. (2024): مخطط التخفي الأصلي الذي تم تحليله
Rombach et al. (2022): العمل الأساسي لنموذج الانتشار الكامن
Cox et al. (2008): الكتاب الكلاسيكي للعلامات المائية الرقمية
Fridrich (2009): الكتاب الكلاسيكي لتحليل التخفي
وعدة أعمال ذات صلة بتحليل التخفي بالتعلم العميق
تقدم هذه الورقة مساهمات مهمة في تحليل أمان التخفي التوليدي، وتقترح منظوراً تحليلياً جديداً وطريقة كشف فعالة، وتوفر أيضاً خطة تحسين أمان مقابلة، مما يلعب دوراً مهماً في دفع تطور هذا المجال.