2025-11-23T19:40:17.292793

Learning the Structure of Connection Graphs

Di Nino, D'Acunto, Barbarossa et al.
Connection graphs (CGs) extend traditional graph models by coupling network topology with orthogonal transformations, enabling the representation of global geometric consistency. They play a key role in applications such as synchronization, Riemannian signal processing, and neural sheaf diffusion. In this work, we address the inverse problem of learning CGs directly from observed signals. We propose a principled framework based on maximum pseudo-likelihood under a consistency assumption, which enforces spectral properties linking the connection Laplacian to the underlying combinatorial Laplacian. Based on this formulation, we introduce the Structured Connection Graph Learning (SCGL) algorithm, a block-optimization procedure over Riemannian manifolds that jointly infers network topology, edge weights, and geometric structure. Our experiments show that SCGL consistently outperforms existing baselines in both topological recovery and geometric fidelity, while remaining computationally efficient.
academic

تعلم بنية رسوم البيانات الاتصالية

المعلومات الأساسية

  • معرّف الورقة: 2510.11245
  • العنوان: تعلم بنية رسوم البيانات الاتصالية
  • المؤلفون: Leonardo Di Nino, Gabriele D'Acunto, Sergio Barbarossa, Paolo Di Lorenzo (جامعة Sapienza بروما و CNIT)
  • التصنيف: cs.LG (التعلم الآلي)، eess.SP (معالجة الإشارات)
  • تاريخ النشر: تم تقديمه إلى arXiv في 13 أكتوبر 2025
  • رابط الورقة: https://arxiv.org/abs/2510.11245v1

الملخص

تعمل رسوم البيانات الاتصالية (Connection Graphs, CGs) على توسيع نطاق نماذج الرسوم البيانية التقليدية من خلال ربط طوبولوجيا الشبكة بالتحويلات المتعامدة، مما يتيح تمثيل الاتساق الهندسي العام. تلعب دوراً حاسماً في التطبيقات مثل المزامنة ومعالجة الإشارات الريمانية وانتشار الحزم العصبية. يعالج هذا البحث مشكلة عكسية تتمثل في تعلم رسوم البيانات الاتصالية مباشرة من الإشارات المرصودة. يقترح المؤلفون إطار عمل مبدئي يعتمد على الاحتمالية الزائفة القصوى تحت افتراض الاتساق، والذي يفرض ارتباطات الخصائص الطيفية بين مؤثر لابلاس الاتصالي ومؤثر لابلاس التوليفي الأساسي. بناءً على هذه الصيغة، يتم تقديم خوارزمية تعلم رسوم البيانات الاتصالية المنظمة (SCGL)، وهي عملية تحسين كتلية على متشعبات ريمانية قادرة على الاستدلال المشترك لطوبولوجيا الشبكة وأوزان الحواف والبنية الهندسية.

خلفية البحث والدافع

تعريف المشكلة

تتمحور المشكلة الأساسية التي يعالجها هذا البحث حول مشكلة عكسية لتعلم بنية رسوم البيانات الاتصالية من الإشارات المرصودة. وتشمل بشكل محدد:

  1. كيفية الاستدلال المتزامن لبنية طوبولوجيا الشبكة من بيانات الإشارات ذات القيم المتجهة
  2. كيفية تعلم مصفوفات التحويل المتعامد على الحواف
  3. كيفية ضمان أن رسم البيانات الاتصالي المتعلم يحقق الاتساق الهندسي

أهمية المشكلة

معالجة الإشارات على الرسوم البيانية التقليدية (GSP) تقتصر على التقاط التفاعلات المحلية والثنائية بين العقد، مما يحد من القدرة على نمذجة الاتساق العام للشبكة. تتمكن رسوم البيانات الاتصالية من خلال إدخال التحويلات المتعامدة من:

  • تمثيل تكوينات مزامنة أكثر ثراءً من الرسوم البيانية التقليدية
  • نمذجة الاتساق الهندسي العام
  • دعم معالجة الإشارات الريمانية وانتشار الحزم العصبية والتطبيقات المتقدمة الأخرى

قيود الطرق الموجودة

  1. خرائط انتشار المتجهات (VDM): تستخدم مبادئ هندسية لتقريب مؤثر لابلاس الاتصالي، لكنها طريقة أمامية غير مناسبة للمشاكل العكسية
  2. طرق البرمجة شبه المحددة (SDP): تستخدم البرمجة شبه المحددة لتوسيع نطاق تعلم مؤثر لابلاس الحزم، لكنها لا تستطيع استرجاع الخصائص الهندسية غير الإقليدية لرسم البيانات الاتصالي بشكل صحيح
  3. تعلم الرسوم البيانية التقليدي: يركز فقط على الطوبولوجيا وسلاسة الإشارات، ولا يمكنه التعامل مع البنية الهندسية

الدافع للبحث

الطرق الموجودة لا تتعامل بفعالية مع التحديات الرئيسية في تعلم رسوم البيانات الاتصالية:

  • قيود الهندسة غير الإقليدية على المتشعبات المتعامدة
  • التحسين المشترك للبنية الطوبولوجية والهندسية
  • فرض شروط الاتساق

المساهمات الأساسية

  1. الإطار النظري: يقترح صيغة مشكلة الاحتمالية الزائفة القصوى بناءً على افتراض الاتساق، مما يوسع نطاق التحكم الطيفي من الرسوم البيانية التقليدية إلى رسوم البيانات الاتصالية
  2. الابتكار الخوارزمي: تطوير خوارزمية SCGL التي تستفيد من التحسين بالنزول الكتلي على متشعبات ريمانية لاسترجاع الطوبولوجيا والأنماط الهندسية بشكل مشترك
  3. التحقق التجريبي: إثبات التحسينات الكبيرة لـ SCGL مقارنة بالطرق الأساسية الموجودة في تعلم رسوم البيانات الاتصالية في التجارب الاصطناعية على الرسوم البيانية العشوائية والهندسية
  4. الكفاءة الحسابية: تحقيق معاملات أكثر كفاءة من طرق البرمجة المخروطية، مما يقلل التعقيد المكاني من O(V²n²) إلى O(Vn²)

شرح الطريقة

تعريف المهمة

الإدخال: مجموعة الإشارات المرصودة X = {x₁, ..., xₘ}، حيث تكون كل إشارة xᵢ ∈ ℝⁿᵛ مكونة من قياسات محلية للعقد xᵥ ∈ ℝⁿ مكدسة معاً الإخراج: مؤثر لابلاس الاتصالي L، يتضمن:

  • مؤثر لابلاس التوليفي للرسم البياني الأساسي L
  • أوزان الحواف w
  • القواعس المتعامدة للعقد O = blkdiag({Oᵥ}ᵥ∈V)

الأساس النظري

تعريف رسم البيانات الاتصالي

يتكون رسم البيانات الاتصالي G = ⟨G,ℝⁿ,w,O(n)⟩ من المكونات التالية:

  • الرسم البياني الأساسي G := (V,E)
  • فضاء متجه إقليدي n-بعدي ℝⁿ على كل عقدة v ∈ V
  • وزن غير سالب wₑ ومصفوفة متعامدة Oₑ ∈ O(n) على كل حافة e ∈ E

شروط الاتساق

تبين النظرية 1 أن اتساق رسم البيانات الاتصالي يكافئ الشروط التالية:

  1. التركيب المتعامد للتعيينات على طول كل حلقة في الرسم البياني يساوي التعيين المتطابق
  2. القيم الذاتية لمؤثر لابلاس الاتصالي هي n-أضعاف القيم الذاتية لمؤثر لابلاس التوليفي
  3. وجود مصفوفات متعامدة للعقد بحيث يمكن تحليل تعيينات الحواف كـ Oᵢⱼ = Oᵢᵀ Oⱼ

صيغة مشكلة التحسين

مشكلة الاحتمالية الزائفة القصوى

بافتراض أن الإشارات تتبع توزيعاً غاوسياً N_nv(0,L†)، تكون المشكلة الأصلية:

min_{L∈CL} -log gdet(L) + Tr(SL)     (P1)

إعادة الصيغة تحت قيود الاتساق

باستخدام شرط الاتساق L = Oᵀ(L⊗Iₙ)O، تتحول المشكلة إلى:

min_{L∈GL, O∈O} -log gdet{Oᵀ(L⊗Iₙ)O} + Tr{SOᵀ(L⊗Iₙ)O}     (P2)

مشكلة التحسين النهائية

من خلال إدخال مؤثر لابلاس كرونيكر المنظم والاسترخاء اللاغرانجي:

min_{O,w,U,Λ} -n log gdet(Λ) + Tr{SOᵀL_K(w)O} + αΨ(w)
             + β/2 ||OᵀL_K(w)O - U(Λ⊗Iₙ)Uᵀ||²_F     (P3)

خوارزمية SCGL

تحسين النزول الكتلي المتناسق

تستخدم SCGL استراتيجية تقليل كتلي متناوب، مع تحسين أربع كتل متغيرة بشكل منفصل:

  1. تحديث أوزان الحواف (w):
    w^{t+1} = P^+_{α/β Ψ}{w^t - 1/τ L*_K[f(w^t)]}
    

    باستخدام طريقة التقليل والتعظيم (MM)
  2. تحديث القواعس المتعامدة (O): استخدام النزول الريماني على المتشعب الضربي SO(n)^v
  3. تحديث المتجهات الذاتية (U): من خلال حساب المتجهات الذاتية الرئيسية:
    U^{t+1} = [Eigenvecs{OᵀL_K(w)O}]_{:,(n+1):}
    
  4. تحديث القيم الذاتية (Λ): مشكلة الانحدار متساوي الشكل، مع حل KKT بصيغة مغلقة

التعقيد الحسابي

يبلغ التعقيد الحسابي للخوارزمية O(V³n³)، ويرجع ذلك بشكل أساسي إلى تحليل القيم الذاتية في خطوات تحسين القواعس المتعامدة والمتجهات الذاتية، مما يزيد فقط بعامل البعد n مقارنة بتعلم الرسوم البيانية المنظمة.

إعداد التجارب

مجموعات البيانات

  1. رسوم البيانات الاتصالية لـ Erdős–Rényi (ER):
    • عدد العقد: |V| = 30
    • احتمالية الحافة: p_ER = 1.1 log V / V
    • بعد فضاء المتجه: n = 2
    • أوزان الحواف: Unif(0.2, 3)
  2. رسم البيانات الاتصالي للهندسة الكروية:
    • كرة في R³، مع تقطيع باستخدام شبكة فيبوناتشي
    • 50 نقطة، رسم بياني k-NN مع k=4
    • استخدام خرائط انتشار المتجهات لبناء مؤثر لابلاس الاتصالي

مؤشرات التقييم

  1. استرجاع الطوبولوجيا: درجة F1 (استرجاع النمط المتناثر)، MSE لأوزان الحواف
  2. الدقة الهندسية:
    • التباين الكلي التجريبي ÊL(Y) = M⁻¹ Tr(L̂YYᵀ)
    • متوسط المسافة الطيفية σ(L,L̂) = 1/(nv) Σᵢ|Λᵢ(L)-Λᵢ(L̂)|
    • مسافة انتشار الحرارة المتكاملة ξ(L,L̂)

طرق المقارنة

  1. KRON: نسخة مبسطة من SCGL، مع تثبيت القواعس المحلية كمصفوفات الهوية
  2. SDP: طريقة التعلم السلس القائمة على البرمجة شبه المحددة
  3. SLGP: عمل سابق للمؤلفين، التعلم السلس باستخدام الأولويات الهندسية

سيناريوهات توفر البيانات

يتم تحديد ثلاثة سيناريوهات بناءً على نسبة الأخذ r = M/(2|V|):

  • منخفض: r = 1.5
  • متوسط: r = 5
  • عالي: r = 15

نتائج التجارب

نتائج رسم البيانات الاتصالي لـ ER

  • استرجاع الطوبولوجيا: مع زيادة كمية البيانات، تتفوق SCGL بشكل كبير على جميع الطرق الأساسية في درجة F1
  • الدقة الهندسية: تكون SCGL الأقرب إلى القيمة المتوقعة نظرياً في التباين الكلي التجريبي، مما يشير إلى اتساق أفضل
  • تقدير أوزان الحواف: تقدر SCGL أوزان الحواف بدقة، مع إسناد أوزان مهملة لمعظم الحواف الموجبة الخاطئة

نتائج رسم البيانات الاتصالي للكرة

  • درجة F1: SCGL = 0.995 (الأعلى)، SLGP = 0.927، SDP = 0.620، KRON = 0.425
  • المسافة الطيفية: SCGL = 0.90 (الأقل)، تتفوق بشكل كبير على الطرق الأخرى
  • مسافة انتشار الحرارة: SCGL = 1.19 (الأقل)
  • بعد النواة: تحافظ SCGL بشكل صحيح على dim(ker(L)) = 2، مما يضمن الاتساق

النتائج الرئيسية

  1. تحقق SCGL أفضل أداء عندما تكون البيانات كافية، وتتطابق مع أداء SLGP عندما تكون البيانات نادرة
  2. يؤدي تحسين القواعس المتعامدة للعقد إلى تحسينات كبيرة مقارنة بتثبيت مصفوفات الهوية
  3. تحقق SCGL أفضل استرجاع للطوبولوجيا والدقة الهندسية في نفس الوقت
  4. تحافظ الخوارزمية على اتساق رسم البيانات الاتصالي، وهو أمر حاسم للمعنى الهندسي

الأعمال ذات الصلة

مجال تعلم الرسوم البيانية

يسعى تعلم الرسوم البيانية التقليدي بشكل أساسي إلى تحقيق هدفين:

  1. فرض الطوبولوجيا المرغوبة (الموازنة بين الندرة والاتصال)
  2. تعزيز سلاسة الإشارات (التباين المنخفض بين العقد المتصلة)

طرق نظرية الحزم

  • حزم الشبكة: ربط البيانات المنظمة على العقد والحواف من خلال تعيينات تحافظ على البنية
  • رسوم البيانات الاتصالية: حالة خاصة من نظرية الحزم، باستخدام التحويلات المتعامدة كتعيينات تحافظ على البنية
  • التطبيقات: مشاكل المزامنة، معالجة الإشارات الريمانية، انتشار الحزم العصبية

طرق تعلم رسوم البيانات الاتصالية الموجودة

  1. خرائط انتشار المتجهات: تقريب مؤثر لابلاس الاتصالي من خلال مبادئ هندسية
  2. طريقة SDP: توسيع نطاق تعلم الرسوم البيانية السلسة إلى مؤثر لابلاس الحزم
  3. طرق البرمجة المخروطية: استخدام محاذاة Procrustes وأخذ عينات الحواف الثنائية

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. تقديم أول إطار عمل مبدئي لتعلم رسوم البيانات الاتصالية بناءً على افتراض الاتساق
  2. خوارزمية SCGL قادرة على استرجاع طوبولوجيا الشبكة وأوزان الحواف والبنية الهندسية بشكل مشترك
  3. تثبت التجارب تفوق SCGL على الطرق الموجودة في كل من استرجاع الطوبولوجيا والدقة الهندسية
  4. تحقق الخوارزمية معاملات أفضل مع الحفاظ على الكفاءة الحسابية

القيود

  1. افتراض الاتساق: تفترض الطريقة أن رسم البيانات الاتصالي متسق، وهو قد لا يكون صحيحاً دائماً في الواقع
  2. افتراض التوزيع الغاوسي: قد يكون نموذج الإشارة مبسطاً جداً
  3. البيانات الاصطناعية: تجري التجارب بشكل أساسي على بيانات اصطناعية، مع نقص التحقق على بيانات العالم الحقيقي
  4. المتانة تجاه الضوضاء: لم يتم تقييم الأداء بشكل كافٍ في ظل الضوضاء وانتهاكات النموذج

الاتجاهات المستقبلية

  1. توسيع نطاق SCGL للتعامل مع الضوضاء وانتهاكات النموذج
  2. دمج الأولويات الطوبولوجية والهندسية المرنة
  3. التعامل مع رسوم البيانات الاتصالية غير المتسقة
  4. التحقق من الإطار على بيانات العالم الحقيقي

التقييم المتعمق

المزايا

  1. المساهمة النظرية: توسيع نطاق تعلم الرسوم البيانية المنظمة إلى رسوم البيانات الاتصالية، مع توفير أساس نظري متين
  2. الابتكار الخوارزمي: دمج ذكي للتحسين الريماني والنزول الكتلي المتناسق، مع التعامل مع قيود المتشعبات المعقدة
  3. التقييم الشامل: تقييم شامل على أنواع مختلفة من رسوم البيانات الاتصالية
  4. الكفاءة الحسابية: تحقيق معاملات أكثر كفاءة مقارنة بالطرق الموجودة

أوجه القصور

  1. قيود التطبيق: قد يحد افتراض الاتساق من نطاق التطبيقات العملية للطريقة
  2. قيود التجارب: نقص التحقق على مجموعات البيانات الحقيقية
  3. تحليل المتانة: التحليل غير الكافي لمتانة الضوضاء
  4. قيود الحجم: حجم التجارب نسبياً صغير (أقصى 50 عقدة)

التأثير

  1. القيمة الأكاديمية: توفير أدوات جديدة للاستدلال الطوبولوجي للشبكات الحساسة هندسياً
  2. إمكانيات التطبيق: آفاق تطبيق مهمة في مجالات المزامنة ومعالجة الإشارات الريمانية وغيرها
  3. المساهمة المنهجية: توفير نموذج تحسين جديد لتعلم الحزم

السيناريوهات المناسبة

  1. شبكات المزامنة: مشاكل المزامنة التي تتطلب تعلم العلاقات الدورانية بين العقد
  2. معالجة الإشارات الريمانية: مهام معالجة الإشارات على المتشعبات
  3. الشبكات العصبية: تعلم البنية للشبكات العصبية للحزم
  4. الروبوتات: التنسيق والتحديد الموضعي في أنظمة الروبوتات متعددة الوحدات

المراجع

تستشهد الورقة بـ 29 مرجعاً ذا صلة، تغطي مجالات متعددة مثل معالجة الإشارات على الرسوم البيانية ونظرية الحزم والتحسين الريماني، مما يوفر أساساً نظرياً متيناً للبحث.


التقييم الإجمالي: هذه ورقة عالية الجودة ذات مساهمات مهمة في مجال تعلم رسوم البيانات الاتصالية. يتمتع الإطار المقترح من قبل المؤلفين بابتكار نظري، وتثبت نتائج التجارب فعاليته. على الرغم من وجود بعض القيود، فإنها تفتح اتجاهات بحثية جديدة لتعلم الرسوم البيانية الحساسة هندسياً، وتتمتع بقيمة أكاديمية وإمكانيات تطبيقية مهمة.