2025-11-19T16:52:14.243866

Learning Weighted Automata over Number Rings, Concretely and Categorically

Aristote, van Gool, PetriÅan et al.

We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.

academic

Lernen gewichteter Automaten über Zahlringe, konkret und kategorietheoretisch

Grundinformationen

Paper-ID: 2504.16596
Titel: Learning Weighted Automata over Number Rings, Concretely and Categorically
Autoren: Quentin Aristote, Sam van Gool, Daniela Petrişan, Mahsa Shirmohammadi
Klassifikation: cs.FL (Formale Sprachen und Automatentheorie)
Veröffentlichungsdatum: 23. April 2025 (arXiv-Preprint)
Paper-Link: https://arxiv.org/abs/2504.16596

Zusammenfassung

In diesem Artikel wird ein universelles Reduktionsverfahren für aktive Lernprobleme entwickelt. Die Methode wurde durch die kürzliche Arbeit von Buna-Marginean et al. (2024) inspiriert, die das Problem des exakten Lernens gewichteter Automaten über den ganzen Zahlen polynomiell auf das Lernproblem gewichteter Automaten über den rationalen Zahlen reduziert. Das Verfahren verbessert die Effizienz kategorietheoretischer Automaten-Lernalgorithmen und wirft bei konkreten kategorialen Instanziierungen neue Fragen zur Implementierungskomplexität auf. Als zweiter Hauptbeitrag werden diese Komplexitätsfragen in der konkreten Einstellung des Lernens gewichteter Automaten über Zahlringen (Ganzzahlringe in algebraischen Zahlkörpern) gelöst. Unter der Annahme einer vollständigen Darstellung des Zahlrings OK wird ein exakter Lernalgorithmus für OK-gewichtete Automaten erhalten, der polynomielle Zeitkomplexität in der Größe des Zielautomaten, dem Logarithmus der längsten Gegenbeispielänge, dem Grad des Zahlkörpers und dem Logarithmus der Diskriminante aufweist. Der vom Algorithmus produzierte Automat hat höchstens einen Zustand mehr als der minimale Automat, und es wird bewiesen, dass bessere Ergebnisse die Lösung des Hauptidealproblems erfordern, für das der derzeit beste bekannte Algorithmus quantenpolynomielle Zeit benötigt.

Forschungshintergrund und Motivation

Problemhintergrund

Klassisches Automatenlernen: Angluins L*-Algorithmus lernt effizient deterministische endliche Automaten im Rahmen des minimalen ausreichenden Lehrers (MAT), ein klassisches Ergebnis der Computational Learning Theory.
Herausforderungen beim Lernen gewichteter Automaten: Die Erweiterung von Lernalgorithmen auf ausdrucksstärkere Modelle (wie gewichtete Automaten) ist herausfordernd, besonders wenn die Gewichte nicht in einem Körper sondern in einem Ring liegen.
Einschränkungen bestehender Methoden:
- Für gewichtete Automaten über Körpern existieren polynomielle Lernalgorithmen
- Für gewichtete Automaten über allgemeinen Ringen haben bestehende Methoden entweder zu hohe Komplexität oder begrenzte Anwendbarkeit
- Kategorietheoretische Methoden sind zwar universell, können aber bei konkreter Implementierung zu exponentieller Komplexität führen

Forschungsmotivation

Theoretischer Bedarf: Ein Rahmen ist erforderlich, der sowohl die Allgemeinheit der kategorietheoretischen Methode bewahrt als auch in konkreten Fällen polynomielle Komplexität aufweist
Praktische Anwendungen: Zahlringe haben wichtige Anwendungen in der Kryptographie; effizientes Lernen gewichteter Automaten über ihnen hat praktischen Wert
Theoretische Grenzen: Erforschung der theoretischen Grenzen der Minimierung gewichteter Automaten, insbesondere Verallgemeinerungen der Fatou-Eigenschaft

Kernbeiträge

Universelles Reduktionsverfahren: Präsentation von Algorithmus 3, einem universellen Reduktionsverfahren im kategorietheoretischen Rahmen, das eine Klasse von Lernproblemen auf eine leichter handhabbare Klasse reduziert
Konkreter Algorithmus für Zahlringe: Entwicklung von Algorithmus 4, ein spezialisierter polynomieller Zeitalgorithmus zum Lernen gewichteter Automaten über Zahlringen OK
Quasi-Optimalitätsergebnisse: Beweis, dass der vom Algorithmus produzierte Automat höchstens einen Zustand mehr als der minimale Automat hat (quasi-Minimalität)
Theoretische Komplexitätsgrenzen: Beweis, dass das Erreichen eines vollständig minimalen Automaten äquivalent zur Lösung des Hauptidealproblems (PIP-hart) ist, wodurch eine theoretische Untergrenze etabliert wird
Verallgemeinerung der Fatou-Eigenschaft: Beweis, dass Dedekind-Bereiche "quasi-stark Fatou-Ringe" sind, was die klassische Fatou-Eigenschaft verallgemeinert

Methodische Details

Aufgabendefinition

Eingabe: Eine unbekannte OK-gewichtete Sprache L: Σ* → OK (über ein Orakel zugänglich) Ausgabe: Ein OK-gewichteter Automat, der L berechnet Einschränkung: Algorithmuskomplexität ist polynomiell in der Größe des Zielautomaten, dem Logarithmus der längsten Gegenbeispielänge, dem Grad des Zahlkörpers und dem Logarithmus der Diskriminante

Kernmethodischer Rahmen

1. Kategorietheoretische Grundlagen

Der Artikel verwendet eine Funktorsicht, wobei Automaten als Funktoren A: I → C betrachtet werden, wobei:

I die von dem Alphabet Σ erzeugte freie Kategorie ist
C die Ausgabekategorie ist (z.B. Modulkategorie ModR)

2. Universelles Reduktionsverfahren (Algorithmus 3)

Algorithmische Idee:
1. Lernen eines Automaten in der "leicht handhabbaren" Kategorie D
2. Etablierung einer Verbindung durch einen Funktor F: C → D
3. Verwendung des rechtsadjungierten Funktors G: D → C 
   zum Zurückziehen des Ergebnisses in die Zielkategorie C

Schlüsselannahme (Annahme 12):

F bewahrt bestimmte Morphismusklassen
F hat einen Rechtsadjungierten G
Unit- und Counit-Morphismen haben spezifische Eigenschaften

3. Konkrete Implementierung über Zahlringen (Algorithmus 4)

Schritt 1: Rückwärtige Konjugation

Berechnung einer Basis B des rückwärtigen Raums des Automaten A
Konjugation von A durch Matrix B zur Erzeugung von A'

Schritt 2: Vordere Modulgenerierung

Aufruf von Algorithmus 5 zur Berechnung einer Generatorenmenge 
des vorderen OK-Moduls von A'
Verwendung einer zweistufigen Strategie:
- Erste Stufe: Finden von Wörtern, die den Rang in K erhöhen
- Zweite Stufe: Vervollständigung der Modulgenerierung in OK

Schritt 3: Pseudobasis-Berechnung

Verwendung der Pseudo-Hermite-Normalform (pseudo-HNF) 
zur Berechnung einer Pseudobasis aus der Generatorenmenge
Pseudobasis-Form: {(ai, vi) | 1 ≤ i ≤ ℓ}, wobei ai Bruchideale sind

Schritt 4: Quasi-minimale Generatorenmenge

Umwandlung der Pseudobasis durch Algorithmus 6 
in eine Generatorenmenge der Größe höchstens ℓ+1
Verwendung von Idealfaktor-Verfeinerung und Chinesischem Restsatz

Technische Innovationen

Zweistufige Generierungsstrategie: Zuerst wird der Rang in dem Körper K bestimmt, dann wird die Modulstruktur in OK vervollständigt, wodurch exponentielle Komplexität vermieden wird
Pseudobasis-Technik: Nutzung der Strukturtheorie von Dedekind-Bereichen zur Behandlung von Fällen mit nicht-Hauptidealdomänen durch Pseudobasen
Kombination von Kategorientheorie und konkretem Algorithmus: Konkretisierung des abstrakten kategorietheoretischen Rahmens zu einem implementierbaren polynomiellen Algorithmus

Experimentelle Einrichtung

Theoretische Verifikation

Der Artikel ist hauptsächlich eine theoretische Arbeit, verifiziert durch:

Komplexitätsanalyse: Detaillierte Analyse der Zeitkomplexität von Algorithmus 4 und Algorithmus 5
Korrektheitsbeweise: Beweis der Korrektheit des universellen Algorithmus durch Theorem 18
Konkrete Beispiele: Bereitstellung von Beispielen (z.B. Beispiel 1) zur Illustration der Situation über Zi√5

Komplexitätsgrenzen

Theorem 2: Gegeben eine vollständige Darstellung von OK ist das exakte Lernen OK-gewichteter Automaten in polynomieller Zeit in den folgenden Parametern lösbar:

Größe des Zielautomaten
Logarithmus der längsten Gegenbeispielänge
Grad d des Zahlkörpers
Logarithmus der Diskriminante ΔK

Experimentelle Ergebnisse

Haupttheoretische Ergebnisse

Quasi-Optimalität (Proposition 10): Für einen Dedekind-Bereich R existiert für jede R-gewichtete Sprache L vom Rang n ein R-gewichteter Automat mit höchstens n+1 Zuständen, der L berechnet
Komplexitätsuntergrenze (Proposition 26): Die Bestimmung, ob ein OK-gewichteter Automat zustandsminimal ist, ist PIP-hart
Verallgemeinerung der Fatou-Eigenschaft (Korollar 16): Dedekind-Bereiche sind quasi-stark Fatou-Ringe

Analyse konkreter Beispiele

Beispiel 1: Im Zahlring R = Zi√5:

Konstruktion eines 3-Zustands-R-gewichteten Automaten
Existenz eines äquivalenten 2-Zustands-K-gewichteten Automaten (K = Q(i√5))
Illustration, dass die starke Fatou-Eigenschaft nicht immer gilt, aber die quasi-starke Fatou-Eigenschaft erfüllt ist

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Entwicklung des ersten polynomiellen Zeitalgorithmus zum Lernen gewichteter Automaten über Zahlringen
Beweis der Schwierigkeit, vollständig minimale Automaten zu erhalten (PIP-hart)
Etablierung einer Brücke zwischen Kategorientheorie und konkreten Algorithmen

Einschränkungen

Darstellungsanforderungen: Erfordert eine "vollständige Darstellung" des Zahlrings OK, was in der Praxis schwierig sein kann
Quasi-Optimalität: Der vom Algorithmus produzierte Automat kann einen Zustand mehr als der minimale haben
Spezifische Struktur: Die Methode ist spezialisiert auf Dedekind-Bereiche; Verallgemeinerungen auf allgemeine Ringe sind unklar

Zukünftige Richtungen

Andere Ringklassen: Untersuchung von Verallgemeinerungen auf nicht-Dedekind-Bereiche
Praktische Implementierung: Entwicklung konkreter Softwareimplementierungen und experimentelle Verifikation
Anwendungsforschung: Konkrete Anwendungen in der Kryptographie und anderen Bereichen

Tiefgreifende Bewertung

Stärken

Theoretische Tiefe: Geschickte Kombination von Kategorientheorie, algebraischer Zahlentheorie und Rechenkomplexitätstheorie
Technische Innovation: Kreative Verwendung der zweistufigen Lernstrategie und Pseudobasis-Technik
Vollständigkeit: Bereitstellung sowohl von Algorithmen als auch von Untergrenzen bietet ein vollständiges Bild des Problems
Strenge: Mathematische Beweise sind rigoros, Komplexitätsanalyse ist detailliert

Schwächen

Praktische Anwendbarkeit: Mangel an praktischer Implementierung und experimenteller Verifikation
Lesbarkeit: Der kategorietheoretische Teil kann für Nicht-Experten schwierig zu verstehen sein
Anwendungsbereich: Die Anwendbarkeit der Methode ist auf spezifische algebraische Strukturen beschränkt

Auswirkungen

Theoretischer Beitrag: Wichtiger Beitrag zur Theorie des Lernens gewichteter Automaten
Methodologie: Demonstration, wie abstrakte kategorietheoretische Methoden konkretisiert werden können
Interdisziplinarität: Verbindung von Automatentheorie, algebraischer Zahlentheorie und Rechenkomplexität

Anwendungsszenarien

Kryptographie: Anwendungen von Zahlringen in der Gitterkryptographie
Symbolische Berechnung: Rechenproblemen über algebraischen Zahlkörpern
Theoretische Forschung: Grundlagen für weitere Forschung zum Lernen von Automaten

Ergänzende technische Details

Darstellung von Zahlringen

Der Artikel erfordert eine "vollständige Darstellung" von OK, einschließlich:

Integrale Basis Ω = {ω1,...,ωd}
Primitives Element θ und sein Minimalpolynom
Komplexitätsmaß CK = d⁴(log d + log ΔK)

Algorithmuskomplexität

Wichtige Komplexitätsgrenzen stammen aus:

Pseudo-HNF-Berechnung: Polynomielle Zeit (Biasse-Fieker-Hofmann)
Länge streng aufsteigender Ketten: Durch Lemma 24 begrenzt durch log(N(d))
Idealoperationen: Polynomielle Zeit in CK

Dieser Artikel leistet einen wichtigen Beitrag zur theoretischen Informatik, besonders im Schnittbereich von Automatenlernen und algebraischer Berechnung. Obwohl die praktische Anwendbarkeit noch zu überprüfen ist, sind sein theoretischer Wert und seine methodologische Bedeutung erheblich.