Generative Flow Networks (GFlowNets) offer a powerful framework for sampling graphs in proportion to their rewards. However, existing approaches suffer from systematic biases due to inaccuracies in state transition probability computations. These biases, rooted in the inherent symmetries of graphs, impact both atom-based and fragment-based generation schemes. To address this challenge, we introduce Symmetry-Aware GFlowNets (SA-GFN), a method that incorporates symmetry corrections into the learning process through reward scaling. By integrating bias correction directly into the reward structure, SA-GFN eliminates the need for explicit state transition computations. Empirical results show that SA-GFN enables unbiased sampling while enhancing diversity and consistently generating high-reward graphs that closely match the target distribution.
- معرّف الورقة: 2506.02685
- العنوان: Symmetry-Aware GFlowNets
- المؤلفون: Hohyun Kim, Seunggeun Lee, Min-hwan Oh (جامعة سيول الوطنية)
- التصنيف: stat.ML cs.LG
- المؤتمر: ICML 2025 (المؤتمر الدولي الثاني والأربعون للتعلم الآلي)
- رابط الورقة: https://arxiv.org/abs/2506.02685
توفر شبكات التدفق العام (GFlowNets) إطار عمل قوي لأخذ عينات من الرسوم البيانية بما يتناسب مع المكافآت. ومع ذلك، تعاني الطرق الموجودة من انحيازات منهجية بسبب عدم دقة حسابات احتمالية الانتقال بين الحالات. تتجذر هذه الانحيازات في التماثلات الجوهرية للرسوم البيانية، مما يؤثر على مخططات التوليد القائمة على الذرات والقائمة على الأجزاء. لمعالجة هذا التحدي، تقدم هذه الورقة شبكات التدفق العام الواعية بالتماثل (SA-GFN)، والتي تدمج تصحيحات التماثل في عملية التعلم من خلال تحجيم المكافآت. بدمج تصحيح الانحياز مباشرة في هيكل المكافآت، تلغي SA-GFN الحاجة إلى حسابات الانتقال بين الحالات الصريحة. تُظهر النتائج التجريبية أن SA-GFN تحقق أخذ عينات غير منحاز، مع تعزيز التنوع وتوليد رسوم بيانية عالية المكافآت بشكل مستمر تتطابق بشكل وثيق مع التوزيع المستهدف.
تواجه شبكات GFlowNets في مهام توليد الرسوم البيانية مشكلة الإجراءات المتكافئة (equivalent action problem): قد تؤدي إجراءات مختلفة إلى رسوم بيانية بنفس البنية. على سبيل المثال، عند إضافة عقدة جديدة إلى رسم بياني، قد تؤدي الإجراءات المتعلقة بالاتصال بعقدتين متماثلتين، على الرغم من اختلافها، إلى رسوم بيانية متماثلة. في هذه الحالة، يجب أن تأخذ احتمالية الانتقال بين الحالات في الاعتبار جميع الإجراءات المتكافئة، لكن الحساب مكلف للغاية.
- الانحياز في توليد الجزيئات: في اكتشاف الأدوية، يمتلك أكثر من 50% من الجزيئات تماثلات متعددة، و18% تحتوي على 4 تماثلات أو أكثر. يؤدي تجاهل التماثل إلى نمذجة غير صحيحة وانخفاض دقة توليد البنية الجزيئية.
- الانحياز المنهجي: الانحياز منهجي، حيث يميل نحو الرسوم البيانية ذات التماثل الأقل في توليد العقد، وتجاه مكونات التماثل في توليد الأجزاء.
- التعقيد الحسابي: يتطلب حساب احتمالية الانتقال بين الحالات بدقة اختبارات تماثل الرسوم البيانية المكلفة.
- Ma et al. (2024): اقترح استخدام ترميز الموضع لتقريب الكشف عن الإجراءات المتكافئة، لكن يتطلب التطبيق عند كل انتقال، مما يؤدي إلى تكاليف حسابية كبيرة وهو حل تقريبي فقط.
- وظائف GFlowNet التقليدية (TB، DB، وغيرها): جميعها غير قادرة على تجنب مشكلة الإجراءات المتكافئة لأنها تعتمد على صيغة الانتقال بين الحالات.
- المساهمة النظرية: توفير صيغة صارمة لتوليد الرسوم البيانية الانحدارية الذاتية في إطار GFlowNets، مع معالجة صريحة لمشكلة الإجراءات المتكافئة
- حل بسيط وفعال: اقتراح طريقة تحجيم المكافآت بناءً على حجم مجموعة الذاتية التماثل، مما يتطلب تعديلات بسيطة فقط على خوارزميات التدريب الموجودة
- مقدر غير منحاز: اشتقاق مقدر غير منحاز لاحتمالية النموذج
- التحقق التجريبي: التحقق من النتائج النظرية من خلال التجارب، مما يثبت فعالية الطريقة في توليد عينات متنوعة وعالية المكافآت
بالنظر إلى دالة المكافآت R(x)، الهدف من شبكات GFlowNets هو تدريب سياسة pA بحيث تكون احتمالية أخذ عينات من الحالة النهائية متناسبة مع مكافآتها: p̄A(x) = R(x)/Z، حيث Z هو ثابت التطبيع.
- تماثل الرسوم البيانية: يكون الرسمان البيانيان G و G' متماثلين (G ≅ G')، إذا كان هناك تبديل π بحيث π(E) = E'
- مجموعة الذاتية التماثل: مجموعة الذاتية التماثل للرسم البياني G هي Aut(G)، وهي مجموعة جميع التبديلات التي تحافظ على بنية الرسم البياني
- المدار: مدار العقدة u هو Orb(G,u) = {v ∈ V : ∃π ∈ Aut(G), π(u) = v}
التعريف 4.1 (تكافؤ الانتقال): إذا كان G₁ ≅ G₂ و G'₁ ≅ G'₂، فإن انتقالات الرسم البياني (G₁,G'₁) و (G₂,G'₂) متكافئة في الانتقال.
التعريف 4.2 (تكافؤ المدار): إذا كان نوع الإجراء متطابقاً وكان هناك تبديل π بحيث π(G₁) = G₂ و π(u₁) = u₂، فإن إجراءات الرسم البياني (G₁,t₁,u₁) و (G₂,t₂,u₂) متكافئة في المدار.
النظرية 4.3: الإجراءات المتكافئة في المدار تؤدي إلى انتقالات متكافئة.
اللمة 4.5: بالنسبة لإجراء AddEdge، لدينا
∣Orb(G′,u,v)∣∣Orb(G,u,v)∣=∣Aut(G′)∣∣Aut(G)∣
النظرية 4.6 (تصحيح الذاتية التماثل): إذا تم استخدام دالة متساوية التبديل، فإن
qAˉ(a∣s′)pAˉ(a∣s)=∣Aut(G′)∣∣Aut(G)∣⋅qE(G∣G′)pE(G′∣G)
النتيجة 5.1 (تصحيح TB): يجب أن تكون خسارة توازن المسار
LTB(τ)=(log∣Aut(Gn)∣R(Gn)∏t=0n−1qE(Gt∣Gt+1)Z∏t=0n−1pE(Gt+1∣Gt))2
الحل: تحجيم المكافآت إلى R~(G)=∣Aut(G)∣R(G)
النظرية 5.3 (تصحيح الأجزاء): بالنسبة للحالة النهائية G المُنشأة بربط k جزء {C₁,...,Cₖ}:
R~(G)=∏i=1k∣Aut(Ci)∣∣Aut(G)∣R(G)
pˉA(x)=Eτ∼qE(τ∣Gn)[∣Aut(Gn)∣qE(τ∣Gn)pE(τ)]
- الأناقة النظرية: تبسيط التصحيحات المعقدة على مستوى الانتقال إلى تحجيم المكافآت للحالة النهائية
- الكفاءة الحسابية: تجنب اختبارات تماثل الرسوم البيانية المكلفة عند كل خطوة، مع حساب حجم مجموعة الذاتية التماثل مرة واحدة فقط
- العمومية: قابلة للتطبيق على أهداف GFlowNets المتعددة (TB، DB، FM، وغيرها)
- الدقة: توفير حل دقيق بدلاً من حل تقريبي
- أمثلة توضيحية: حالة أولية بـ 6 عقد منفصلة، 112 حالة نهائية
- رسوم بيانية اصطناعية: رسوم بيانية غير متجانسة بما يصل إلى 7 عقد، 72,296 حالة نهائية
- توليد الجزيئات:
- على مستوى الذرة: مهمة التنبؤ بفجوة HOMO-LUMO
- على مستوى الأجزاء: مهمة التنبؤ بطاقة الربط لهدف sEH
- خطأ L1: خطأ L1 بين احتمالية الهدف واحتمالية الحالة النهائية للنموذج
- التنوع: متوسط مسافة Tanimoto بين الجزيئات
- مؤشرات Top K: تنوع ومكافآت أفضل K جزيء عالي المكافآت
- الفرادة: نسبة الجزيئات الفريدة في العينات المُنتجة
- Vanilla GFlowNets: لا تأخذ في الاعتبار تماثل الرسم البياني
- تصحيح الانتقال: تحديد إجراءات الانتقال المتكافئة من خلال اختبارات التماثل المتعددة
- PE (Ma et al., 2024): استخدام ترميز الموضع لتقريب تحديد إجراءات المدار المتكافئة
- تحجيم المكافآت (هذه الورقة): تحقيق التصحيح من خلال تعديل إشارة المكافآت
- تحجيم التدفق (هذه الورقة): الضرب بنسبة التماثل عند كل انتقال
- احتمالية النموذج Vanilla تتجمع حسب |x|، مع انحياز واضح
- تحجيم المكافآت يحقق نفس تأثير تصحيح الانتقال
- ثابت التطبيع المقدر Z: تحجيم المكافآت = 112 (القيمة الحقيقية)، Vanilla = 26,706
- هدف TB: تحجيم المكافآت يقلل بشكل كبير من خطأ L1، مع أداء مماثلة لتصحيح الانتقال
- هدف DB: تحجيم المكافآت يتقارب بشكل أبطأ، لكنه يحقق نفس الدقة في النهاية
- طريقة PE: كحل تقريبي، تقع الأداء بين Vanilla والطرق الدقيقة
نتائج التوليد على مستوى الذرة:
- التنوع: 0.929→0.959 (Vanilla→تحجيم المكافآت)
- الفرادة: 0.93→1.0
نتائج التوليد على مستوى الأجزاء:
- مكافآت Top K: 0.941→0.952 (Vanilla→تحجيم المكافآت الدقيق)
- استخدام أجزاء السيكلوهكسان: 5220→1042 (انخفاض كبير في الاستخدام المفرط للأجزاء المتماثلة)
- التصحيح التقريبي مقابل الدقيق: الطرق التقريبية تحسن الأداء بشكل كبير بالفعل
- أهداف مختلفة: يمكن لـ TB و DB تحقيق تصحيح فعال من خلال تحجيم المكافآت
- وقت حساب الذاتية التماثل: 0.010ms لمجموعة بيانات QM9، 0.022ms لمجموعة بيانات ZINC250k
- مقارنة بالانتشار الأمامي للشبكة العصبية لأخذ العينات من المسار، التكلفة الحسابية مهملة
- مقارنة وقت التدريب: تحجيم المكافآت أسرع بحوالي 15% من تصحيح الانتقال
- طرق مصفوفة الجوار: تحتفظ بمعلومات ترتيب العقد، أقل عرضة لمشكلة الإجراءات المتكافئة
- طرق تسلسل الرسوم البيانية: تنتج بسهولة إجراءات متكافئة، تصبح المشكلة بارزة عند الحاجة إلى احتمالية الانتقال بين الحالات
- جميع الأهداف الموجودة (مطابقة التدفق، التوازن التفصيلي، توازن المسار، وغيرها) غير قادرة على تجنب مشكلة الإجراءات المتكافئة
- Ma et al. (2024) كانوا أول من حدد المشكلة لكن قدموا حلاً تقريبياً فقط
- التساوي مع التبديل يؤدي إلى تمثيلات متطابقة للعقد في نفس المدار
- قد تؤدي قوة التعبير المحدودة إلى تداخل التمثيلات بين الإجراءات المختلفة للمدارات
- المساهمة النظرية: أول تحليل صارم لمشكلة الإجراءات المتكافئة في شبكات GFlowNets، مما يثبت أنها تؤدي إلى انحيازات منهجية
- حل عملي: تحجيم المكافآت يوفر طريقة بسيطة ودقيقة وفعالة للتصحيح
- قابلية التطبيق الواسعة: الطريقة قابلة للتطبيق على التوليد على مستوى الذرة والأجزاء، وكذلك على أهداف تدريب متعددة
- اعتماد تصميم الإجراء: الضمانات النظرية تعتمد على مجموعة محددة مسبقاً من إجراءات الرسم البياني
- الخصوصية المتعلقة بالمهمة: تم التحقق بشكل أساسي على مجموعات بيانات متعلقة باكتشاف الأدوية
- قوة التعبير في شبكات الرسوم البيانية العصبية: قد تؤدي قوة التعبير المحدودة إلى انحيازات إضافية
- استكشاف مهام بأنماط تماثل مختلفة وهياكل مكافآت متنوعة
- تصميم معماريات شبكات رسوم بيانية عصبية بقوة تعبير أقوى
- التوسع إلى سيناريوهات توليد رسوم بيانية أكثر تعقيداً
- الصرامة النظرية: توفير إطار عمل رياضي شامل وتحليل نظري صارم
- بساطة الطريقة: الحل بسيط للغاية وسهل التنفيذ والتكامل
- القيمة العملية: إظهار تأثيرات فعلية في تطبيقات مهمة مثل توليد الجزيئات
- الكفاءة الحسابية: تجنب اختبارات تماثل الرسوم البيانية المكلفة على الإنترنت
- القوة العامة: قابلة للتطبيق على أهداف تدريب GFlowNets المتعددة
- نطاق التجارب: تركز بشكل أساسي على مهام توليد الجزيئات، مع تحقق محدود من مهام توليد الرسوم البيانية الأخرى
- الافتراضات النظرية: تعتمد على تصميم إجراء محدد وافتراضات معمارية لشبكات الرسوم البيانية العصبية
- الطرق التقريبية: التصحيح التقريبي لتوليد الأجزاء يفتقر إلى ضمانات نظرية
- قابلية التوسع: بالنسبة للرسوم البيانية الكبيرة جداً، قد يصبح حساب الذاتية التماثل اختناقاً
- القيمة الأكاديمية: توفير ملحق مهم للنظرية الأساسية لشبكات GFlowNets، حل مشكلة أساسية
- القيمة العملية: مساهمة مباشرة في مجالات التطبيق مثل اكتشاف الأدوية
- إمكانية التكرار: الطريقة بسيطة وسهلة التكرار والتطبيق
- الإلهام: توفير أفكار لمعالجة التماثل في نماذج توليدية أخرى
- تصميم الجزيئات: اكتشاف الأدوية وتصميم المواد وتطبيقات المعلوماتية الحيوية الكيميائية
- توليد الرسوم البيانية: مهام توليد الرسوم البيانية التي تتطلب مراعاة تماثل البنية
- التحسين التوافقي: مشاكل التحسين التوافقي ذات قيود التماثل
- التعلم المعزز: مهام التعلم المعزز مع فضاء حالة متماثل
- Bengio et al. (2021) - أسس GFlowNets
- Ma et al. (2024) - أول من حدد مشكلة الإجراءات المتكافئة
- Malkin et al. (2022) - هدف توازن المسار
- Jain et al. (2023) - تطبيقات GFlowNets متعددة الأهداف
التقييم الشامل: هذه ورقة ممتازة تجمع بين النظرية والممارسة، وتحل مشكلة أساسية مهمة لكن مهملة في شبكات GFlowNets. الطريقة بسيطة وأنيقة، والتحليل النظري صارم، والتحقق التجريبي شامل. لها مساهمات مهمة في كل من تطور نظرية شبكات GFlowNets والتطبيقات العملية، ومن المتوقع أن يكون لها تأثير مستمر على المجالات ذات الصلة.