Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification
Malialis, Li, Panayiotou et al.
Data stream mining aims at extracting meaningful knowledge from continually evolving data streams, addressing the challenges posed by nonstationary environments, particularly, concept drift which refers to a change in the underlying data distribution over time. Graph structures offer a powerful modelling tool to represent complex systems, such as, critical infrastructure systems and social networks. Learning from graph streams becomes a necessity to understand the dynamics of graph structures and to facilitate informed decision-making. This work introduces a novel method for graph stream classification which operates under the general setting where a data generating process produces graphs with varying nodes and edges over time. The method uses incremental learning for continual model adaptation, selecting representative graphs (prototypes) for each class, and creating graph embeddings. Additionally, it incorporates a loss-based concept drift detection mechanism to recalculate graph prototypes when drift is detected.
academic
التعلم الإضافي مع كشف انجراف المفهوم والتضمينات القائمة على النماذج الأولية لتصنيف تدفقات الرسوم البيانية
يهدف التنقيب في تدفقات البيانات إلى استخراج معرفة ذات مغزى من تدفقات بيانات متطورة بشكل مستمر، مع معالجة التحديات الناشئة عن البيئات غير المستقرة، وخاصة انجراف المفهوم (concept drift)، أي التغيير في التوزيع الاحتمالي الأساسي للبيانات عبر الزمن. توفر الهياكل الرسومية أداة نمذجة قوية لتمثيل الأنظمة المعقدة مثل أنظمة البنية التحتية الحرجة والشبكات الاجتماعية. أصبح التعلم من تدفقات الرسوم البيانية ضرورياً لفهم الديناميكيات الهيكلية للرسوم البيانية وتعزيز اتخاذ القرارات المستنيرة. تقترح هذه الدراسة طريقة جديدة لتصنيف تدفقات الرسوم البيانية، قابلة للتطبيق على الإعدادات العامة حيث تنتج عملية توليد البيانات رسوماً بيانية ذات عقد وحواف متغيرة عبر الزمن. تستخدم الطريقة التعلم الإضافي للتكيف المستمر للنموذج، واختيار رسوم بيانية تمثيلية (نماذج أولية) لكل فئة، وإنشاء تضمينات رسومية. علاوة على ذلك، تدمج آلية كشف انجراف المفهوم القائمة على الخسارة، وإعادة حساب النماذج الأولية للرسوم البيانية عند اكتشاف الانجراف.
تتمثل المشكلة الأساسية التي تعالجها هذه الدراسة في مهام التصنيف في بيئات تدفقات الرسوم البيانية الديناميكية، حيث يتغير عدد العقد والحواف في الرسم البياني عبر الزمن، مع وجود ظاهرة انجراف المفهوم.
اقتراح إطار عمل جديد لتصنيف تدفقات الرسوم البيانية: قابل للتطبيق على الإعدادات العامة للرسوم البيانية ذات الأعداد المتغيرة من العقد والحواف، مع دعم مهام التصنيف متعدد الفئات
تصميم طريقة تضمين رسومية قائمة على النماذج الأولية: من خلال اختيار رسوم بيانية تمثيلية لكل فئة كنماذج أولية، وتحويل الرسوم البيانية إلى تمثيلات متجهة ذات بُعد ثابت
دمج آلية كشف انجراف مفهوم هجينة: تجمع بين التعلم الإضافي وكشف الانجراف القائم على الخسارة، لتحقيق استراتيجية تكيف هجينة نشطة-سلبية
توفير التحقق التجريبي الشامل: التحقق من فعالية الطريقة على مجموعات بيانات معيارية متعددة، مع إجراء دراسات استبدال تفصيلية
تصنيف الرسوم البيانية التقليدي: يركز بشكل أساسي على الرسوم البيانية الثابتة، مع طرق غنية لكن غير مناسبة للسيناريوهات الدفقية
طرق تدفقات الرسوم البيانية الموجودة: تركز بشكل أساسي على كشف الشذوذ، مع بحث محدود في التصنيف متعدد الفئات
تضمين الرسوم البيانية: استخدام طرق مثل المشفرات التلقائية لتعلم تمثيلات الرسوم البيانية
يكمن الابتكار في هذه الورقة في دمج تضمين النموذج الأولي والتعلم الإضافي وكشف انجراف المفهوم، مع التركيز على مهام التصنيف متعدد الفئات لتدفقات الرسوم البيانية.
تعلم تضمينات الرسوم البيانية: البحث عن طرق لتعلم تضمينات الرسوم البيانية من طرف إلى طرف، للتطبيق على مشاكل تدفقات الرسوم البيانية على نطاق واسع
التعلم مع التسميات المحدودة: النظر في نماذج التعلم غير الموجه والموجه جزئياً والتعلم النشط، بالإضافة إلى تقنيات التعلم من عدد قليل من الأمثلة وتعزيز البيانات
تستشهد الورقة بـ 37 مرجعاً ذا صلة، تغطي كشف انجراف المفهوم والشبكات العصبية الرسومية والتعلم الإضافي وغيرها من المجالات ذات الصلة، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الإجمالي: هذه ورقة عالية الجودة ذات مساهمة مهمة في مجال تصنيف تدفقات الرسوم البيانية. يتمتع تصميم الطريقة بعقلانية، والتحقق التجريبي بكفاية، والكتابة بوضوح، مما يوفر رؤى وحلولاً قيمة لتطور هذا المجال. على الرغم من وجود بعض القيود، فإن ابتكاريتها وقيمتها العملية تمنحها أهمية أكاديمية وتطبيقية كبيرة.