Learning Weighted Automata over Number Rings, Concretely and Categorically
Aristote, van Gool, PetriÅan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic
Lernen gewichteter Automaten über Zahlringe, konkret und kategorietheoretisch
In diesem Artikel wird ein universelles Reduktionsverfahren für aktive Lernprobleme entwickelt. Die Methode wurde durch die kürzliche Arbeit von Buna-Marginean et al. (2024) inspiriert, die das Problem des exakten Lernens gewichteter Automaten über den ganzen Zahlen polynomiell auf das Lernproblem gewichteter Automaten über den rationalen Zahlen reduziert. Das Verfahren verbessert die Effizienz kategorietheoretischer Automaten-Lernalgorithmen und wirft bei konkreten kategorialen Instanziierungen neue Fragen zur Implementierungskomplexität auf. Als zweiter Hauptbeitrag werden diese Komplexitätsfragen in der konkreten Einstellung des Lernens gewichteter Automaten über Zahlringen (Ganzzahlringe in algebraischen Zahlkörpern) gelöst. Unter der Annahme einer vollständigen Darstellung des Zahlrings OK wird ein exakter Lernalgorithmus für OK-gewichtete Automaten erhalten, der polynomielle Zeitkomplexität in der Größe des Zielautomaten, dem Logarithmus der längsten Gegenbeispielänge, dem Grad des Zahlkörpers und dem Logarithmus der Diskriminante aufweist. Der vom Algorithmus produzierte Automat hat höchstens einen Zustand mehr als der minimale Automat, und es wird bewiesen, dass bessere Ergebnisse die Lösung des Hauptidealproblems erfordern, für das der derzeit beste bekannte Algorithmus quantenpolynomielle Zeit benötigt.
Klassisches Automatenlernen: Angluins L*-Algorithmus lernt effizient deterministische endliche Automaten im Rahmen des minimalen ausreichenden Lehrers (MAT), ein klassisches Ergebnis der Computational Learning Theory.
Herausforderungen beim Lernen gewichteter Automaten: Die Erweiterung von Lernalgorithmen auf ausdrucksstärkere Modelle (wie gewichtete Automaten) ist herausfordernd, besonders wenn die Gewichte nicht in einem Körper sondern in einem Ring liegen.
Einschränkungen bestehender Methoden:
Für gewichtete Automaten über Körpern existieren polynomielle Lernalgorithmen
Für gewichtete Automaten über allgemeinen Ringen haben bestehende Methoden entweder zu hohe Komplexität oder begrenzte Anwendbarkeit
Kategorietheoretische Methoden sind zwar universell, können aber bei konkreter Implementierung zu exponentieller Komplexität führen
Theoretischer Bedarf: Ein Rahmen ist erforderlich, der sowohl die Allgemeinheit der kategorietheoretischen Methode bewahrt als auch in konkreten Fällen polynomielle Komplexität aufweist
Praktische Anwendungen: Zahlringe haben wichtige Anwendungen in der Kryptographie; effizientes Lernen gewichteter Automaten über ihnen hat praktischen Wert
Theoretische Grenzen: Erforschung der theoretischen Grenzen der Minimierung gewichteter Automaten, insbesondere Verallgemeinerungen der Fatou-Eigenschaft
Universelles Reduktionsverfahren: Präsentation von Algorithmus 3, einem universellen Reduktionsverfahren im kategorietheoretischen Rahmen, das eine Klasse von Lernproblemen auf eine leichter handhabbare Klasse reduziert
Konkreter Algorithmus für Zahlringe: Entwicklung von Algorithmus 4, ein spezialisierter polynomieller Zeitalgorithmus zum Lernen gewichteter Automaten über Zahlringen OK
Quasi-Optimalitätsergebnisse: Beweis, dass der vom Algorithmus produzierte Automat höchstens einen Zustand mehr als der minimale Automat hat (quasi-Minimalität)
Theoretische Komplexitätsgrenzen: Beweis, dass das Erreichen eines vollständig minimalen Automaten äquivalent zur Lösung des Hauptidealproblems (PIP-hart) ist, wodurch eine theoretische Untergrenze etabliert wird
Verallgemeinerung der Fatou-Eigenschaft: Beweis, dass Dedekind-Bereiche "quasi-stark Fatou-Ringe" sind, was die klassische Fatou-Eigenschaft verallgemeinert
Eingabe: Eine unbekannte OK-gewichtete Sprache L: Σ* → OK (über ein Orakel zugänglich)
Ausgabe: Ein OK-gewichteter Automat, der L berechnet
Einschränkung: Algorithmuskomplexität ist polynomiell in der Größe des Zielautomaten, dem Logarithmus der längsten Gegenbeispielänge, dem Grad des Zahlkörpers und dem Logarithmus der Diskriminante
Algorithmische Idee:
1. Lernen eines Automaten in der "leicht handhabbaren" Kategorie D
2. Etablierung einer Verbindung durch einen Funktor F: C → D
3. Verwendung des rechtsadjungierten Funktors G: D → C
zum Zurückziehen des Ergebnisses in die Zielkategorie C
Schlüsselannahme (Annahme 12):
F bewahrt bestimmte Morphismusklassen
F hat einen Rechtsadjungierten G
Unit- und Counit-Morphismen haben spezifische Eigenschaften
Berechnung einer Basis B des rückwärtigen Raums des Automaten A
Konjugation von A durch Matrix B zur Erzeugung von A'
Schritt 2: Vordere Modulgenerierung
Aufruf von Algorithmus 5 zur Berechnung einer Generatorenmenge
des vorderen OK-Moduls von A'
Verwendung einer zweistufigen Strategie:
- Erste Stufe: Finden von Wörtern, die den Rang in K erhöhen
- Zweite Stufe: Vervollständigung der Modulgenerierung in OK
Schritt 3: Pseudobasis-Berechnung
Verwendung der Pseudo-Hermite-Normalform (pseudo-HNF)
zur Berechnung einer Pseudobasis aus der Generatorenmenge
Pseudobasis-Form: {(ai, vi) | 1 ≤ i ≤ ℓ}, wobei ai Bruchideale sind
Schritt 4: Quasi-minimale Generatorenmenge
Umwandlung der Pseudobasis durch Algorithmus 6
in eine Generatorenmenge der Größe höchstens ℓ+1
Verwendung von Idealfaktor-Verfeinerung und Chinesischem Restsatz
Zweistufige Generierungsstrategie: Zuerst wird der Rang in dem Körper K bestimmt, dann wird die Modulstruktur in OK vervollständigt, wodurch exponentielle Komplexität vermieden wird
Pseudobasis-Technik: Nutzung der Strukturtheorie von Dedekind-Bereichen zur Behandlung von Fällen mit nicht-Hauptidealdomänen durch Pseudobasen
Kombination von Kategorientheorie und konkretem Algorithmus: Konkretisierung des abstrakten kategorietheoretischen Rahmens zu einem implementierbaren polynomiellen Algorithmus
Theorem 2: Gegeben eine vollständige Darstellung von OK ist das exakte Lernen OK-gewichteter Automaten in polynomieller Zeit in den folgenden Parametern lösbar:
Quasi-Optimalität (Proposition 10): Für einen Dedekind-Bereich R existiert für jede R-gewichtete Sprache L vom Rang n ein R-gewichteter Automat mit höchstens n+1 Zuständen, der L berechnet
Komplexitätsuntergrenze (Proposition 26): Die Bestimmung, ob ein OK-gewichteter Automat zustandsminimal ist, ist PIP-hart
Verallgemeinerung der Fatou-Eigenschaft (Korollar 16): Dedekind-Bereiche sind quasi-stark Fatou-Ringe
Pseudo-HNF-Berechnung: Polynomielle Zeit (Biasse-Fieker-Hofmann)
Länge streng aufsteigender Ketten: Durch Lemma 24 begrenzt durch log(N(d))
Idealoperationen: Polynomielle Zeit in CK
Dieser Artikel leistet einen wichtigen Beitrag zur theoretischen Informatik, besonders im Schnittbereich von Automatenlernen und algebraischer Berechnung. Obwohl die praktische Anwendbarkeit noch zu überprüfen ist, sind sein theoretischer Wert und seine methodologische Bedeutung erheblich.