2025-11-23T13:58:16.869352

Multi-Message Secure Aggregation with Demand Privacy

Sun, Zhang, Wan et al.

This paper considers a multi-message secure aggregation with privacy problem, in which a server aims to compute $\sf K_c\geq 1$ linear combinations of local inputs from $\sf K$ distributed users. The problem addresses two tasks: (1) security, ensuring that the server can only obtain the desired linear combinations without any else information about the users' inputs, and (2) privacy, preventing users from learning about the server's computation task. In addition, the effect of user dropouts is considered, where at most $\sf{K-U}$ users can drop out and the identity of these users cannot be predicted in advance. We propose two schemes for $\sf K_c$ is equal to (1) and $\sf 2\leq K_c\leq U-1$, respectively. For $\sf K_c$ is equal to (1), we introduce multiplicative encryption of the server's demand using a random variable, where users share coded keys offline and transmit masked models in the first round, followed by aggregated coded keys in the second round for task recovery. For $\sf{2\leq K_c \leq U-1}$, we use robust symmetric private computation to recover linear combinations of keys in the second round. The objective is to minimize the number of symbols sent by each user during the two rounds. Our proposed schemes have achieved the optimal rate region when $ \sf K_c $ is equal to (1) and the order optimal rate (within 2) when $\sf{2\leq K_c \leq U-1}$.

academic

التجميع الآمن متعدد الرسائل مع خصوصية الطلب

المعلومات الأساسية

معرّف الورقة: 2504.20639
العنوان: Multi-Message Secure Aggregation with Demand Privacy
المؤلفون: Chenyi Sun, Ziting Zhang, Kai Wan (جامعة هوازونغ للعلوم والتكنولوجيا)، Giuseppe Caire (جامعة برلين التقنية)
التصنيف: cs.IT math.IT
تاريخ النشر: 13 أكتوبر 2025 (arXiv v2)
رابط الورقة: https://arxiv.org/abs/2504.20639

الملخص

تدرس هذه الورقة مشكلة التجميع الآمن متعدد الرسائل مع خصوصية الطلب، حيث يهدف الخادم إلى حساب Kc≥1 من التركيبات الخطية للمدخلات المحلية من K مستخدم موزع. تعالج المشكلة مهمتين: (1) الأمان، مما يضمن أن الخادم يمكنه الحصول فقط على التركيبات الخطية المطلوبة دون الكشف عن أي معلومات أخرى عن مدخلات المستخدم؛ (2) الخصوصية، مما يمنع المستخدمين من معرفة مهام الحساب للخادم. بالإضافة إلى ذلك، يتم النظر في تأثير انقطاع الاتصال بالمستخدمين، حيث قد ينقطع اتصال ما يصل إلى K-U مستخدمين ولا يمكن التنبؤ بهويتهم مسبقاً. يقترح المؤلفون مخططين منفصلين للحالتين Kc=1 و 2≤Kc<U. بالنسبة لـ Kc=1، يتم تقديم طريقة استخدام متغيرات عشوائية لتشفير طلبات الخادم بشكل ضربي؛ بالنسبة لـ 2≤Kc<U، يتم استخدام الحساب الخاص المتماثل القوي لاستعادة التركيبات الخطية للمفاتيح في الجولة الثانية.

الخلفية البحثية والدافع

تعريف المشكلة

يسمح التعلم الفيدرالي للمستخدمين الموزعين بالتعاون في تدريب نموذج عام تحت تنسيق خادم مركزي، لكن تحديثات النموذج قد تكشف معلومات عن بيانات المستخدم المحلية. لتعزيز الأمان بشكل أكبر، تم إدخال التجميع الآمن لضمان أن الخادم يمكنه الحصول فقط على التحديثات المجمعة دون الحصول على أي معلومات إضافية عن بيانات المستخدم.

دافع البحث

احتياجات التعلم متعدد المهام: بالمقارنة مع التعلم أحادي المهمة، يمكن للتعلم متعدد المهام الاستفادة من نتائج متعددة لتحسين الأداء الكلية لتدريب النموذج، من خلال مشاركة المعلومات والموارد لتحسين كفاءة التعلم.
قيود الطرق الموجودة:
- تركز مشاكل التجميع الآمن ذات الأساس النظري المعلوماتي بشكل أساسي على حالة Kc=1
- تفتقر إلى الحماية من الكشف عن مهام الحساب للخادم
- تحتاج إلى ضمان الأمان والخصوصية في حالة انقطاع الاتصال بالمستخدمين
متطلبات التطبيق العملي: في سيناريوهات التعلم الفيدرالي الفعلية، قد يحتاج الخادم إلى حساب عدة تركيبات خطية مختلفة، وفي الوقت نفسه، لا يجب أن يعرف المستخدمون احتياجات الحساب المحددة للخادم.

المساهمات الأساسية

صياغة مشكلة جديدة: تقديم مشكلة التجميع الآمن متعدد الرسائل مع خصوصية الطلب للمرة الأولى، مما يوسع نطاق البحث في التجميع الآمن التقليدي.
مخطط أمثل (Kc=1): اقتراح مخطط تجميع آمن يجمع بين التشفير الضربي للطلب والتشفير الإضافي للنموذج، مما يحقق منطقة معدل الاتصال الأمثل، والتي تساوي سعة مشكلة التجميع الآمن بدون قيود الخصوصية.
مخطط قريب من الأمثل (2≤Kc<U): استخدام مخطط الحساب الخاص المتماثل، مما يحسن بشكل كبير من طريقة الأساس المتمثلة في تكرار المخطط الأول Kc مرات، مع معدل الجولة الأولى الأمثل ومعدل الجولة الثانية الأمثل ضمن عامل 2.
التحليل النظري: توفير إثبات الوصول الكامل وتحليل الحدود العكسية، مما يؤسس الأساس النظري للمشكلة.

شرح الطريقة

نموذج النظام

المشاركون:

خادم واحد و K مستخدمين غير متواطئين (K≥2)
يحتفظ المستخدم i بمتجه الإدخال Wi والمفتاح Pi
يحتوي Wi على L رموز موزعة بشكل مستقل وموحد، معرّفة على الحقل المحدود Fq

دالة الهدف: يحسب الخادم الخريطة الخطية: $g(W_1, \cdots, W_K) = F[W_1, \cdots, W_K]^T$

حيث F هي مصفوفة المعاملات بحجم Kc×K: