يعتبر تعلم الموجهات الرسومية (Graph Prompt Learning, GPL) نموذجاً فعالاً يربط بين النماذج الرسومية المدربة مسبقاً والمهام النهائية، مما يخفف من الاعتماد على التسميات وعدم التطابق بين المهام العليا والدنيا. على الرغم من أن الأبحاث الحالية في GPL استكشفت استراتيجيات موجهة متعددة، إلا أن فعاليتها والآليات الكامنة وراءها لا تزال غير واضحة. تحدد هذه الورقة حدين رئيسيين: (1) الافتقار إلى إجماع حول الآليات الكامنة: تتدخل الاستراتيجيات المختلفة في مساحات مختلفة من النموذج (مستوى الإدخال، مستوى الطبقة، مستوى التمثيل)؛ (2) التكيف المحدود مع السيناريوهات: تواجه معظم الطرق صعوبة في التعميم عند حدوث تحول في توزيع البيانات. تكشف هذه الورقة من خلال التحليل النظري أن موجهات مستوى التمثيل تعادل بشكل أساسي ضبط دقيق لمصنف بسيط نهائي، وتقترح أن تركز موجهات التعلم الرسومي على تحرير قدرات النموذج المدرب مسبقاً، بينما يتكيف المصنف مع السيناريوهات النهائية. بناءً على هذا الاكتشاف، يتم اقتراح طريقة UniPrompt التي يمكنها التكيف مع أي نموذج مدرب مسبقاً وتحقيق أداء ممتازة في السيناريوهات داخل وخارج المجال.
يهدف تعلم الموجهات الرسومية إلى حل مشكلة عدم التطابق بين نماذج الرسوم البيانية المدربة مسبقاً والمهام النهائية، لكن الطرق الحالية تواجه تحديين رئيسيين:
من خلال تجارب الدافع، يتم اكتشاف أن طرق الموجهات على مستوى التمثيل الحالية (مثل GPPT و GraphPrompt) تظهر أداءً غير مستقر عند التبديل بين النماذج المدربة مسبقاً، وقد تكون أسوأ من طرق الاستكشاف الخطي البسيطة. يشير هذا إلى أن الطرق الحالية قد تقع في فخ "التكيف الزائف".
بالنظر إلى الرسم البياني ، حيث هي مجموعة العقد، هي مجموعة الحواف، هي مصفوفة الميزات، و هي مجموعة التسميات. الهدف هو تحسين دالة التنبؤ من خلال معاملات موجهة قابلة للتعلم مع تجميد المشفر المدرب مسبقاً :
النظرية 4.1: بالنظر إلى دالة موجهة خطية ومصنف ، يوجد مصنف خطي معادل بحيث .
تشير هذه النتيجة النظرية إلى أن موجهات مستوى التمثيل تعادل الاستكشاف الخطي في كل من فضاء الدالة والهدف الأمثل، وبالتالي يجب نقل التركيز نحو موجهات مستوى الإدخال.
استخدام kNN لبناء رسم بياني موجه أولي:
S_{ij}, & \text{if } S_{ij} \in \text{top-k}\{S_{i \cdot}\} \\ 0, & \text{otherwise} \end{cases}$$ حيث يتم حساب التشابه كالتالي: $S_{ij} = \frac{x_i x_j^T}{\|x_i\|_2 \|x_j\|_2}$ #### 2. آلية البارامترية إدخال أوزان قابلة للتعلم $w_{ij}$ لكل حافة، باستخدام آلية البوابة: $$\tilde{A}_{ij} = \text{ELU}(w_{ij} \cdot \alpha - \alpha) + 1$$ #### 3. التجميع الذاتي اعتماد استراتيجية التحديث التكراري لتجنب انهيار النموذج: $$\hat{A}^{(t)} = \tau \hat{A}^{(t-1)} + (1-\tau) \tilde{A}$$ حيث $\hat{A}^{(0)} = A$، و $\tau \in [0,1]$ يتحكم في التوازن بين الرسم البياني الأصلي والرسم البياني الموجه. #### 4. الهدف الأمثل تحسين معاملات الموجهات والمصنف بشكل مشترك: $$\min_{\phi, \Psi} \frac{1}{|V_L|} \sum_{v_i \in V_L} \ell_D(g_\phi(f_\theta(p_\Psi(A,X))_i), y_i)$$ ## إعداد التجارب ### مجموعات البيانات استخدام 9 مجموعات بيانات لتصنيف العقد: - **الرسوم البيانية المتجانسة**: Cora و CiteSeer و PubMed - **الرسوم البيانية غير المتجانسة**: Cornell و Texas و Wisconsin و Chameleon و Actor و Squirrel ### مقاييس التقييم - **الدقة**: دقة تصنيف العقد - **إعدادات قليلة العينات**: تعلم 1-shot و 3-shot و 5-shot ### طرق المقارنة - **الطرق الأساسية**: Fine-tune و Linear-probe - **طرق GPL**: GPPT و GraphPrompt و All-in-one و GPF/GPF+ و EdgePrompt/EdgePrompt+ - **النماذج المدربة مسبقاً**: DGI و GRACE و GraphMAE ### تفاصيل التنفيذ - استخدام GCN/GAT بطبقتين كشبكة عمود فقري - التدريب لمدة 2000 جولة، مع إيقاف مبكر بصبر = 20 - 5 بذور عشوائية × 20 تكرار تجربة ## نتائج التجارب ### النتائج الرئيسية #### تصنيف العقد داخل المجال بـ 1-shot تحقيق تحسينات كبيرة على الرسوم البيانية غير المتجانسة مثل Cornell و Texas و Wisconsin: - Cornell: تحسن من أفضل خط أساس 34.56% إلى 51.13% - Texas: تحسن من أفضل خط أساس 37.50% إلى 48.21% - Wisconsin: تحسن من أفضل خط أساس 33.91% إلى 58.75% #### تصنيف العقد عبر المجالات في إعداد 1-shot عبر المجالات: - PubMed: تحسن من 46.84% إلى 55.01% - Cornell: تحسن من 40.77% إلى 51.58% ### تجارب الاستبدال التحقق من المكونات الرئيسية من خلال تجارب الاستبدال: - **Random_Topo**: استبدال الطوبولوجيا العشوائية بـ kNN، انخفاض الأداء - **Simple_Add**: استبدال الإضافة البسيطة بالاستراتيجية الذاتية، مما يؤدي إلى الإفراط في التدريب - **Discard_Topo**: التخلص الكامل من الرسم البياني الأصلي، انخفاض كبير في الأداء على الرسوم البيانية المتجانسة ### تحليل المعاملات الفائقة - **معامل τ**: تتطلب الرسوم البيانية غير المتجانسة قيم τ أصغر (0.999-0.9999)، والرسوم البيانية المتجانسة مستقرة عند τ≥0.9999 - **معامل k**: تستفيد الرسوم البيانية غير المتجانسة الخفيفة بشكل أكبر، والرسوم البيانية الكثيفة والمتجانسة نسبياً مستقرة ### التكلفة الحسابية - وقت المعالجة المسبقة: حوالي 1.3 ثانية - زيادة طفيفة في وقت التدريب لكل جولة - استخدام ذاكرة GPU ضمن النطاق المقبول ## الأعمال ذات الصلة ### التدريب المسبق للرسوم البيانية - **طرق التعلم المتناقض**: DGI و GRACE و GraphCL وغيرها تتعلم التمثيلات من خلال تعظيم المعلومات المتبادلة - **الطرق التوليدية**: GraphMAE وغيرها تتعلم التمثيلات من خلال إعادة البناء المقنعة ### تعلم الموجهات الرسومية - **موجهات مستوى الإدخال**: طرق سلسلة GPF تضيف متجهات موجهة في فضاء الميزات - **موجهات مستوى التمثيل**: GPPT و GraphPrompt وغيرها تضيف موجهات في الطبقة الناتجة - **موجهات مستوى الطبقة**: دمج معلومات الموجهات في جميع طبقات GNN ### نماذج الرسوم البيانية الأساسية يوفر التطور الأخير لنماذج الرسوم البيانية الأساسية سيناريوهات تطبيق جديدة وتحديات لـ GPL. ## الخلاصة والمناقشة ### الاستنتاجات الرئيسية 1. **الرؤى النظرية**: موجهات مستوى التمثيل تعادل مصنف خطي، يجب التركيز على موجهات مستوى الإدخال 2. **مبادئ التصميم**: يجب أن تحرر الموجهات قدرات النموذج المدرب مسبقاً، والمصنف مسؤول عن التكيف مع المهام النهائية 3. **الطريقة العملية**: تحقق UniPrompt من خلال موجهات طوبولوجية تكيفية تكيفاً عاماً مع أي نموذج مدرب مسبقاً ### القيود 1. **قيود التكامل مع نماذج اللغة الكبيرة**: لم يتم استكشاف التكامل مع نماذج اللغة الكبيرة 2. **الاعتماد على المعاملات الفائقة**: تتطلب معاملات τ و k تحسيناً لأنواع مجموعات بيانات مختلفة 3. **تغطية محدودة للمهام**: التقييم الرئيسي لتصنيف العقد، والمهام الرسومية الأخرى تحتاج إلى التحقق 4. **الحساسية للضوضاء**: حساسة نسبياً لضوضاء الميزات ### الاتجاهات المستقبلية 1. التوسع إلى تصنيف الرسوم البيانية والتنبؤ بالروابط والمهام الأخرى 2. الدمج مع نماذج اللغة الكبيرة لبناء نماذج رسوم بيانية أساسية أقوى 3. تحسين الثبات تجاه الضوضاء وتحول التوزيع 4. استكشاف آليات اختيار المعاملات الفائقة التلقائية ## التقييم المتعمق ### المزايا 1. **المساهمة النظرية بارزة**: توحيد فهم آليات الموجهات المختلفة من منظور نظري لأول مرة، توفير رؤى مهمة 2. **تصميم الطريقة ماهر**: استراتيجية التجميع الذاتي تتجنب بفعالية انهيار النموذج، وتهيئة kNN تستفيد بشكل معقول من التشابه في الميزات 3. **التجارب شاملة**: تغطي نماذج مدربة مسبقاً متعددة وأنواع مجموعات بيانات وإعدادات تقييم 4. **القيمة العملية عالية**: الطريقة بسيطة وفعالة، سهلة التنفيذ والنشر ### أوجه القصور 1. **قيود التحليل النظري**: يركز بشكل أساسي على الحالة الخطية، التحليل للموجهات غير الخطية غير كافٍ 2. **التكلفة الحسابية**: بناء kNN والتحديث التكراري يزيد من التكلفة الحسابية 3. **حساسية المعاملات**: تتطلب المعاملات الرئيسية ضبطاً دقيقاً، درجة الأتمتة منخفضة 4. **ثبات الضوضاء**: انخفاض كبير في الأداء تحت ضوضاء الميزات ### التأثير 1. **القيمة الأكاديمية**: توفير أساس نظري مهم وتصميم مبادئ لتعلم الموجهات الرسومية 2. **الأهمية العملية**: تحسين التكيف والقدرة على التعميم لنماذج الرسوم البيانية المدربة مسبقاً 3. **الإلهام البحثي**: توجيه الأبحاث اللاحقة، خاصة أهمية موجهات مستوى الإدخال ### السيناريوهات المعمول بها 1. **التعلم قليل العينات**: مهام تعلم الرسوم البيانية حيث تكون البيانات المسماة نادرة 2. **النقل عبر المجالات**: السيناريوهات حيث يختلف توزيع المهام المدربة مسبقاً والنهائية 3. **معالجة الرسوم البيانية غير المتجانسة**: بيانات الرسوم البيانية حيث لا تنطبق الافتراضات المتجانسة التقليدية 4. **التكيف السريع**: التطبيقات التي تتطلب نشراً سريعاً للنماذج المدربة مسبقاً ## المراجع تستشهد الورقة بـ 91 مرجعاً ذا صلة، تغطي شبكات الرسوم البيانية العصبية والتعلم الذاتي الإشرافي للرسوم البيانية وتعلم الموجهات الرسومية وغيرها من المجالات المهمة، مما يوفر أساساً نظرياً قوياً للبحث. --- **الملخص**: من خلال التحليل النظري العميق والتحقق التجريبي الواسع، توفر هذه الورقة رؤى نظرية مهمة وطريقة عملية لمجال تعلم الموجهات الرسومية. طريقة UniPrompt بسيطة وفعالة، مع عمومية وقابلية تكيف جيدة، مما يساهم بقيمة في تطور نماذج الرسوم البيانية الأساسية.