Learning Weighted Automata over Number Rings, Concretely and Categorically
Aristote, van Gool, PetriÅan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic
تعلم الأتمتة الموزونة على حلقات الأعداد، بشكل ملموس وفئوي
تطور هذه الورقة إجراء اختزال موحد لمشاكل التعلم النشط. يستلهم هذا النهج من العمل الحديث لـ Buna-Marginean وآخرين (2024) الذي اقترح اختزالاً متعدد الحدود لمشكلة تعلم الأتمتة الموزونة على الأعداد الصحيحة إلى تعلم الأتمتة الموزونة على الأعداد النسبية. يحسّن الإجراء كفاءة خوارزميات التعلم الفئوية للأتمتة، ويطرح أسئلة جديدة حول تعقيد التنفيذ عند التجسيد في حالات فئوية ملموسة. كمساهمة ثانية رئيسية، يعالج المؤلفون هذه أسئلة التعقيد في الإعداد الملموس لتعلم الأتمتة الموزونة على حلقات الأعداد (حلقات الأعداد الصحيحة في حقول الأعداد الجبرية). بافتراض تمثيل كامل لحلقة الأعداد OK، تم الحصول على خوارزمية تعلم دقيقة للأتمتة الموزونة على OK بتعقيد زمني متعدد الحدود فيما يتعلق بحجم الأتمتة المستهدفة، واللوغاريتم لطول أطول مثال معاكس، ودرجة حقل الأعداد، واللوغاريتم للمميز. تنتج الخوارزمية أتمتة بحد أقصى حالة واحدة أكثر من الأتمتة الدنيا، ويثبت أن تحقيق نتيجة أفضل يتطلب حل مشكلة المثالية الرئيسية، حيث أفضل خوارزمية معروفة حالياً هي زمن متعدد الحدود الكمي.
تعلم الأتمتة الكلاسيكي: خوارزمية L* لـ Angluin تتعلم بكفاءة الأتمتة الحتمية المحدودة تحت إطار المعلم الكافي الأدنى (MAT)، وهي نتيجة كلاسيكية في نظرية التعلم الحسابي.
تحديات تعلم الأتمتة الموزونة: يواجه توسيع خوارزميات التعلم إلى نماذج أكثر تعبيراً (مثل الأتمتة الموزونة) تحديات، خاصة عندما تكون الأوزان في حلقة بدلاً من حقل.
قيود الطرق الموجودة:
بالنسبة للأتمتة الموزونة على الحقول، توجد خوارزميات تعلم متعددة الحدود
بالنسبة للأتمتة الموزونة على الحلقات العامة، الطرق الموجودة إما أن يكون لها تعقيد مرتفع جداً أو نطاق تطبيق محدود
الطرق الفئوية، على الرغم من عموميتها، قد تؤدي إلى تعقيد أسي عند التنفيذ الملموس
المدخل: لغة موزونة مجهولة على OK: L: Σ* → OK (يتم الوصول إليها عبر oracle)
المخرج: أتمتة موزونة على OK تحسب L
القيود: تعقيد الخوارزمية متعدد الحدود في حجم الأتمتة المستهدفة، واللوغاريتم لطول أطول مثال معاكس، ودرجة حقل الأعداد، واللوغاريتم للمميز
فكرة الخوارزمية:
1. تعلم الأتمتة في فئة "سهلة المعالجة" D
2. إنشاء ارتباط عبر دالة F: C → D
3. استخدام الملحق الأيمن G: D → C لسحب النتيجة إلى الفئة المستهدفة C
حساب أساس الفضاء الخلفي للأتمتة A وهو B
اقتران A بالمصفوفة B للحصول على A'
الخطوة 2: توليد الوحدة الأمامية
استدعاء Algorithm 5 لحساب مجموعة توليد الوحدة OK الأمامية لـ A'
استخدام استراتيجية ثنائية المراحل:
- المرحلة الأولى: البحث عن كلمات تزيد الرتبة في K
- المرحلة الثانية: إكمال توليد الوحدة في OK
الخطوة 3: حساب الأساس الزائف
استخدام الشكل الزائف لـ Hermite (pseudo-HNF) لحساب الأساس الزائف من مجموعة التوليد
شكل الأساس الزائف: {(ai, vi) | 1 ≤ i ≤ ℓ}، حيث ai هي مثاليات كسرية
الخطوة 4: مجموعة التوليد شبه الدنيا
تحويل الأساس الزائف إلى مجموعة توليد بحجم على الأكثر ℓ+1 عبر Algorithm 6
استخدام تحسين عامل المثالية والنظرية الصينية للبواقي
حساب pseudo-HNF: زمن متعدد الحدود (Biasse-Fieker-Hofmann)
طول السلسلة المتزايدة بشكل صارم: محدود بواسطة Lemma 24 بـ log(N(d))
عمليات المثاليات: زمن متعدد الحدود في CK
تقدم هذه الورقة مساهمة مهمة في مجال علوم الحاسوب النظرية، خاصة في مجال التقاطع بين تعلم الأتمتة والحساب الجبري. على الرغم من أن الجدوى العملية تحتاج إلى التحقق، فإن قيمتها النظرية ومعنى منهجيتها كبيران جداً.