2025-11-14T01:22:11.048448

Symmetry-Aware GFlowNets

Kim, Lee, Oh
Generative Flow Networks (GFlowNets) offer a powerful framework for sampling graphs in proportion to their rewards. However, existing approaches suffer from systematic biases due to inaccuracies in state transition probability computations. These biases, rooted in the inherent symmetries of graphs, impact both atom-based and fragment-based generation schemes. To address this challenge, we introduce Symmetry-Aware GFlowNets (SA-GFN), a method that incorporates symmetry corrections into the learning process through reward scaling. By integrating bias correction directly into the reward structure, SA-GFN eliminates the need for explicit state transition computations. Empirical results show that SA-GFN enables unbiased sampling while enhancing diversity and consistently generating high-reward graphs that closely match the target distribution.
academic

شبكات التدفق العام الواعية بالتماثل (Symmetry-Aware GFlowNets)

المعلومات الأساسية

  • معرّف الورقة: 2506.02685
  • العنوان: Symmetry-Aware GFlowNets
  • المؤلفون: Hohyun Kim, Seunggeun Lee, Min-hwan Oh (جامعة سيول الوطنية)
  • التصنيف: stat.ML cs.LG
  • المؤتمر: ICML 2025 (المؤتمر الدولي الثاني والأربعون للتعلم الآلي)
  • رابط الورقة: https://arxiv.org/abs/2506.02685

الملخص

توفر شبكات التدفق العام (GFlowNets) إطار عمل قوي لأخذ عينات من الرسوم البيانية بما يتناسب مع المكافآت. ومع ذلك، تعاني الطرق الموجودة من انحيازات منهجية بسبب عدم دقة حسابات احتمالية الانتقال بين الحالات. تتجذر هذه الانحيازات في التماثلات الجوهرية للرسوم البيانية، مما يؤثر على مخططات التوليد القائمة على الذرات والقائمة على الأجزاء. لمعالجة هذا التحدي، تقدم هذه الورقة شبكات التدفق العام الواعية بالتماثل (SA-GFN)، والتي تدمج تصحيحات التماثل في عملية التعلم من خلال تحجيم المكافآت. بدمج تصحيح الانحياز مباشرة في هيكل المكافآت، تلغي SA-GFN الحاجة إلى حسابات الانتقال بين الحالات الصريحة. تُظهر النتائج التجريبية أن SA-GFN تحقق أخذ عينات غير منحاز، مع تعزيز التنوع وتوليد رسوم بيانية عالية المكافآت بشكل مستمر تتطابق بشكل وثيق مع التوزيع المستهدف.

الخلفية البحثية والدافع

المشكلة الأساسية

تواجه شبكات GFlowNets في مهام توليد الرسوم البيانية مشكلة الإجراءات المتكافئة (equivalent action problem): قد تؤدي إجراءات مختلفة إلى رسوم بيانية بنفس البنية. على سبيل المثال، عند إضافة عقدة جديدة إلى رسم بياني، قد تؤدي الإجراءات المتعلقة بالاتصال بعقدتين متماثلتين، على الرغم من اختلافها، إلى رسوم بيانية متماثلة. في هذه الحالة، يجب أن تأخذ احتمالية الانتقال بين الحالات في الاعتبار جميع الإجراءات المتكافئة، لكن الحساب مكلف للغاية.

أهمية المشكلة

  1. الانحياز في توليد الجزيئات: في اكتشاف الأدوية، يمتلك أكثر من 50% من الجزيئات تماثلات متعددة، و18% تحتوي على 4 تماثلات أو أكثر. يؤدي تجاهل التماثل إلى نمذجة غير صحيحة وانخفاض دقة توليد البنية الجزيئية.
  2. الانحياز المنهجي: الانحياز منهجي، حيث يميل نحو الرسوم البيانية ذات التماثل الأقل في توليد العقد، وتجاه مكونات التماثل في توليد الأجزاء.
  3. التعقيد الحسابي: يتطلب حساب احتمالية الانتقال بين الحالات بدقة اختبارات تماثل الرسوم البيانية المكلفة.

قيود الطرق الموجودة

  • Ma et al. (2024): اقترح استخدام ترميز الموضع لتقريب الكشف عن الإجراءات المتكافئة، لكن يتطلب التطبيق عند كل انتقال، مما يؤدي إلى تكاليف حسابية كبيرة وهو حل تقريبي فقط.
  • وظائف GFlowNet التقليدية (TB، DB، وغيرها): جميعها غير قادرة على تجنب مشكلة الإجراءات المتكافئة لأنها تعتمد على صيغة الانتقال بين الحالات.

المساهمات الأساسية

  1. المساهمة النظرية: توفير صيغة صارمة لتوليد الرسوم البيانية الانحدارية الذاتية في إطار GFlowNets، مع معالجة صريحة لمشكلة الإجراءات المتكافئة
  2. حل بسيط وفعال: اقتراح طريقة تحجيم المكافآت بناءً على حجم مجموعة الذاتية التماثل، مما يتطلب تعديلات بسيطة فقط على خوارزميات التدريب الموجودة
  3. مقدر غير منحاز: اشتقاق مقدر غير منحاز لاحتمالية النموذج
  4. التحقق التجريبي: التحقق من النتائج النظرية من خلال التجارب، مما يثبت فعالية الطريقة في توليد عينات متنوعة وعالية المكافآت

شرح الطريقة

تعريف المهمة

بالنظر إلى دالة المكافآت R(x)، الهدف من شبكات GFlowNets هو تدريب سياسة pA بحيث تكون احتمالية أخذ عينات من الحالة النهائية متناسبة مع مكافآتها: p̄A(x) = R(x)/Z، حيث Z هو ثابت التطبيع.

الإطار النظري الأساسي

1. تماثل الرسوم البيانية والعلاقات المتكافئة

  • تماثل الرسوم البيانية: يكون الرسمان البيانيان G و G' متماثلين (G ≅ G')، إذا كان هناك تبديل π بحيث π(E) = E'
  • مجموعة الذاتية التماثل: مجموعة الذاتية التماثل للرسم البياني G هي Aut(G)، وهي مجموعة جميع التبديلات التي تحافظ على بنية الرسم البياني
  • المدار: مدار العقدة u هو Orb(G,u) = {v ∈ V : ∃π ∈ Aut(G), π(u) = v}

2. صيغة الإجراءات المتكافئة

التعريف 4.1 (تكافؤ الانتقال): إذا كان G₁ ≅ G₂ و G'₁ ≅ G'₂، فإن انتقالات الرسم البياني (G₁,G'₁) و (G₂,G'₂) متكافئة في الانتقال.

التعريف 4.2 (تكافؤ المدار): إذا كان نوع الإجراء متطابقاً وكان هناك تبديل π بحيث π(G₁) = G₂ و π(u₁) = u₂، فإن إجراءات الرسم البياني (G₁,t₁,u₁) و (G₂,t₂,u₂) متكافئة في المدار.

النظرية 4.3: الإجراءات المتكافئة في المدار تؤدي إلى انتقالات متكافئة.

3. النتائج النظرية الرئيسية

اللمة 4.5: بالنسبة لإجراء AddEdge، لدينا Orb(G,u,v)Orb(G,u,v)=Aut(G)Aut(G)\frac{|\text{Orb}(G,u,v)|}{|\text{Orb}(G',u,v)|} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|}

النظرية 4.6 (تصحيح الذاتية التماثل): إذا تم استخدام دالة متساوية التبديل، فإن pAˉ(as)qAˉ(as)=Aut(G)Aut(G)pE(GG)qE(GG)\frac{p_{\bar{A}}(a|s)}{q_{\bar{A}}(a|s')} = \frac{|\text{Aut}(G)|}{|\text{Aut}(G')|} \cdot \frac{p_E(G'|G)}{q_E(G|G')}

طريقة التصحيح الواعية بالتماثل

1. تحجيم المكافآت في توليد العقد

النتيجة 5.1 (تصحيح TB): يجب أن تكون خسارة توازن المسار LTB(τ)=(logZt=0n1pE(Gt+1Gt)Aut(Gn)R(Gn)t=0n1qE(GtGt+1))2L_{TB}(\tau) = \left(\log \frac{Z\prod_{t=0}^{n-1} p_E(G_{t+1}|G_t)}{|\text{Aut}(G_n)|R(G_n)\prod_{t=0}^{n-1} q_E(G_t|G_{t+1})}\right)^2

الحل: تحجيم المكافآت إلى R~(G)=Aut(G)R(G)\tilde{R}(G) = |\text{Aut}(G)|R(G)

2. التصحيح في توليد الأجزاء

النظرية 5.3 (تصحيح الأجزاء): بالنسبة للحالة النهائية G المُنشأة بربط k جزء {C₁,...,Cₖ}: R~(G)=Aut(G)R(G)i=1kAut(Ci)\tilde{R}(G) = \frac{|\text{Aut}(G)|R(G)}{\prod_{i=1}^k |\text{Aut}(C_i)|}

3. مقدر غير منحاز لاحتمالية النموذج

pˉA(x)=EτqE(τGn)[pE(τ)Aut(Gn)qE(τGn)]\bar{p}_A(x) = \mathbb{E}_{\tau \sim q_E(\tau|G_n)}\left[\frac{p_E(\tau)}{|\text{Aut}(G_n)|q_E(\tau|G_n)}\right]

نقاط الابتكار التقني

  1. الأناقة النظرية: تبسيط التصحيحات المعقدة على مستوى الانتقال إلى تحجيم المكافآت للحالة النهائية
  2. الكفاءة الحسابية: تجنب اختبارات تماثل الرسوم البيانية المكلفة عند كل خطوة، مع حساب حجم مجموعة الذاتية التماثل مرة واحدة فقط
  3. العمومية: قابلة للتطبيق على أهداف GFlowNets المتعددة (TB، DB، FM، وغيرها)
  4. الدقة: توفير حل دقيق بدلاً من حل تقريبي

إعداد التجارب

مجموعات البيانات

  1. أمثلة توضيحية: حالة أولية بـ 6 عقد منفصلة، 112 حالة نهائية
  2. رسوم بيانية اصطناعية: رسوم بيانية غير متجانسة بما يصل إلى 7 عقد، 72,296 حالة نهائية
  3. توليد الجزيئات:
    • على مستوى الذرة: مهمة التنبؤ بفجوة HOMO-LUMO
    • على مستوى الأجزاء: مهمة التنبؤ بطاقة الربط لهدف sEH

مقاييس التقييم

  • خطأ L1: خطأ L1 بين احتمالية الهدف واحتمالية الحالة النهائية للنموذج
  • التنوع: متوسط مسافة Tanimoto بين الجزيئات
  • مؤشرات Top K: تنوع ومكافآت أفضل K جزيء عالي المكافآت
  • الفرادة: نسبة الجزيئات الفريدة في العينات المُنتجة

الطرق المقارنة

  1. Vanilla GFlowNets: لا تأخذ في الاعتبار تماثل الرسم البياني
  2. تصحيح الانتقال: تحديد إجراءات الانتقال المتكافئة من خلال اختبارات التماثل المتعددة
  3. PE (Ma et al., 2024): استخدام ترميز الموضع لتقريب تحديد إجراءات المدار المتكافئة
  4. تحجيم المكافآت (هذه الورقة): تحقيق التصحيح من خلال تعديل إشارة المكافآت
  5. تحجيم التدفق (هذه الورقة): الضرب بنسبة التماثل عند كل انتقال

النتائج التجريبية

النتائج الرئيسية

1. التجارب التوضيحية

  • احتمالية النموذج Vanilla تتجمع حسب |x|، مع انحياز واضح
  • تحجيم المكافآت يحقق نفس تأثير تصحيح الانتقال
  • ثابت التطبيع المقدر Z: تحجيم المكافآت = 112 (القيمة الحقيقية)، Vanilla = 26,706

2. تجارب الرسوم البيانية الاصطناعية

  • هدف TB: تحجيم المكافآت يقلل بشكل كبير من خطأ L1، مع أداء مماثلة لتصحيح الانتقال
  • هدف DB: تحجيم المكافآت يتقارب بشكل أبطأ، لكنه يحقق نفس الدقة في النهاية
  • طريقة PE: كحل تقريبي، تقع الأداء بين Vanilla والطرق الدقيقة

3. تجارب توليد الجزيئات

نتائج التوليد على مستوى الذرة:

  • التنوع: 0.929→0.959 (Vanilla→تحجيم المكافآت)
  • الفرادة: 0.93→1.0

نتائج التوليد على مستوى الأجزاء:

  • مكافآت Top K: 0.941→0.952 (Vanilla→تحجيم المكافآت الدقيق)
  • استخدام أجزاء السيكلوهكسان: 5220→1042 (انخفاض كبير في الاستخدام المفرط للأجزاء المتماثلة)

التجارب الاستئصالية

  • التصحيح التقريبي مقابل الدقيق: الطرق التقريبية تحسن الأداء بشكل كبير بالفعل
  • أهداف مختلفة: يمكن لـ TB و DB تحقيق تصحيح فعال من خلال تحجيم المكافآت

تحليل الكفاءة الحسابية

  • وقت حساب الذاتية التماثل: 0.010ms لمجموعة بيانات QM9، 0.022ms لمجموعة بيانات ZINC250k
  • مقارنة بالانتشار الأمامي للشبكة العصبية لأخذ العينات من المسار، التكلفة الحسابية مهملة
  • مقارنة وقت التدريب: تحجيم المكافآت أسرع بحوالي 15% من تصحيح الانتقال

الأعمال ذات الصلة

توليد الرسوم البيانية الانحدارية الذاتية

  • طرق مصفوفة الجوار: تحتفظ بمعلومات ترتيب العقد، أقل عرضة لمشكلة الإجراءات المتكافئة
  • طرق تسلسل الرسوم البيانية: تنتج بسهولة إجراءات متكافئة، تصبح المشكلة بارزة عند الحاجة إلى احتمالية الانتقال بين الحالات

شبكات GFlowNets

  • جميع الأهداف الموجودة (مطابقة التدفق، التوازن التفصيلي، توازن المسار، وغيرها) غير قادرة على تجنب مشكلة الإجراءات المتكافئة
  • Ma et al. (2024) كانوا أول من حدد المشكلة لكن قدموا حلاً تقريبياً فقط

قوة التعبير في شبكات الرسوم البيانية العصبية

  • التساوي مع التبديل يؤدي إلى تمثيلات متطابقة للعقد في نفس المدار
  • قد تؤدي قوة التعبير المحدودة إلى تداخل التمثيلات بين الإجراءات المختلفة للمدارات

الخلاصة والنقاش

الاستنتاجات الرئيسية

  1. المساهمة النظرية: أول تحليل صارم لمشكلة الإجراءات المتكافئة في شبكات GFlowNets، مما يثبت أنها تؤدي إلى انحيازات منهجية
  2. حل عملي: تحجيم المكافآت يوفر طريقة بسيطة ودقيقة وفعالة للتصحيح
  3. قابلية التطبيق الواسعة: الطريقة قابلة للتطبيق على التوليد على مستوى الذرة والأجزاء، وكذلك على أهداف تدريب متعددة

القيود

  1. اعتماد تصميم الإجراء: الضمانات النظرية تعتمد على مجموعة محددة مسبقاً من إجراءات الرسم البياني
  2. الخصوصية المتعلقة بالمهمة: تم التحقق بشكل أساسي على مجموعات بيانات متعلقة باكتشاف الأدوية
  3. قوة التعبير في شبكات الرسوم البيانية العصبية: قد تؤدي قوة التعبير المحدودة إلى انحيازات إضافية

الاتجاهات المستقبلية

  1. استكشاف مهام بأنماط تماثل مختلفة وهياكل مكافآت متنوعة
  2. تصميم معماريات شبكات رسوم بيانية عصبية بقوة تعبير أقوى
  3. التوسع إلى سيناريوهات توليد رسوم بيانية أكثر تعقيداً

التقييم المتعمق

المزايا

  1. الصرامة النظرية: توفير إطار عمل رياضي شامل وتحليل نظري صارم
  2. بساطة الطريقة: الحل بسيط للغاية وسهل التنفيذ والتكامل
  3. القيمة العملية: إظهار تأثيرات فعلية في تطبيقات مهمة مثل توليد الجزيئات
  4. الكفاءة الحسابية: تجنب اختبارات تماثل الرسوم البيانية المكلفة على الإنترنت
  5. القوة العامة: قابلة للتطبيق على أهداف تدريب GFlowNets المتعددة

أوجه القصور

  1. نطاق التجارب: تركز بشكل أساسي على مهام توليد الجزيئات، مع تحقق محدود من مهام توليد الرسوم البيانية الأخرى
  2. الافتراضات النظرية: تعتمد على تصميم إجراء محدد وافتراضات معمارية لشبكات الرسوم البيانية العصبية
  3. الطرق التقريبية: التصحيح التقريبي لتوليد الأجزاء يفتقر إلى ضمانات نظرية
  4. قابلية التوسع: بالنسبة للرسوم البيانية الكبيرة جداً، قد يصبح حساب الذاتية التماثل اختناقاً

التأثير

  1. القيمة الأكاديمية: توفير ملحق مهم للنظرية الأساسية لشبكات GFlowNets، حل مشكلة أساسية
  2. القيمة العملية: مساهمة مباشرة في مجالات التطبيق مثل اكتشاف الأدوية
  3. إمكانية التكرار: الطريقة بسيطة وسهلة التكرار والتطبيق
  4. الإلهام: توفير أفكار لمعالجة التماثل في نماذج توليدية أخرى

السيناريوهات المناسبة

  1. تصميم الجزيئات: اكتشاف الأدوية وتصميم المواد وتطبيقات المعلوماتية الحيوية الكيميائية
  2. توليد الرسوم البيانية: مهام توليد الرسوم البيانية التي تتطلب مراعاة تماثل البنية
  3. التحسين التوافقي: مشاكل التحسين التوافقي ذات قيود التماثل
  4. التعلم المعزز: مهام التعلم المعزز مع فضاء حالة متماثل

المراجع

  1. Bengio et al. (2021) - أسس GFlowNets
  2. Ma et al. (2024) - أول من حدد مشكلة الإجراءات المتكافئة
  3. Malkin et al. (2022) - هدف توازن المسار
  4. Jain et al. (2023) - تطبيقات GFlowNets متعددة الأهداف

التقييم الشامل: هذه ورقة ممتازة تجمع بين النظرية والممارسة، وتحل مشكلة أساسية مهمة لكن مهملة في شبكات GFlowNets. الطريقة بسيطة وأنيقة، والتحليل النظري صارم، والتحقق التجريبي شامل. لها مساهمات مهمة في كل من تطور نظرية شبكات GFlowNets والتطبيقات العملية، ومن المتوقع أن يكون لها تأثير مستمر على المجالات ذات الصلة.