Active Learning of Deterministic Transducers with Outputs in Arbitrary Monoids
Aristote
We study monoidal transducers, transition systems arising as deterministic automata whose transitions also produce outputs in an arbitrary monoid, for instance allowing outputs to commute or to cancel out. We use the categorical framework for minimization and learning of Colcombet, PetriÅan and Stabile to recover the notion of minimal transducer recognizing a language, and give necessary and sufficient conditions on the output monoid for this minimal transducer to exist and be unique (up to isomorphism). The categorical framework then provides an abstract algorithm for learning it using membership and equivalence queries, and we discuss practical aspects of this algorithm's implementation.
academic
Aktives Lernen von deterministischen Transducern mit Ausgaben in beliebigen Monoiden
Diese Arbeit untersucht monoide Transducer, eine Klasse von deterministischen Automaten-Transduktionssystemen, deren Transduktionsprozess Ausgaben in beliebigen Monoiden erzeugt, beispielsweise mit kommutativen oder sich gegenseitig aufhebenden Ausgaben. Der Autor verwendet das kategorientheoretische Rahmenwerk von Colcombet, Petrişan und Stabile, um das Konzept minimaler Transducer zur Spracherkennung zu verallgemeinern, und gibt notwendige und hinreichende Bedingungen auf dem Ausgabemonoiden an, unter denen solche minimalen Transducer existieren und eindeutig (bis auf Isomorphie) sind. Das kategorientheoretische Rahmenwerk liefert ferner einen abstrakten Algorithmus zum Lernen minimaler Transducer mittels Mitgliedschaftsabfragen und Äquivalenzabfragen und diskutiert praktische Aspekte der Algorithmusimplementierung.
Traditionelle Transducer erzeugen Ausgaben typischerweise in freien Monoiden (wie Zeichenketten), aber in bestimmten Anwendungsszenarien müssen Ausgaben algebraische Eigenschaften wie Kommutativität oder Kürzbarkeit erfüllen. Beispiele:
Trace-Monoide in der Nebenläufigkeitstheorie: Modellierung von Ausführungssequenzen unabhängiger Aufträge, wobei bestimmte Aufträge asynchron ausgeführt werden können
Programmplanung: Transducer können zur programmgesteuerten Auftragsplanung verwendet werden
Verarbeitung natürlicher Sprache: Bestimmte Ausgabesymbole können kommutative Eigenschaften aufweisen
Bestehende Transducer-Lernalgorithmen (wie der Vilar-Algorithmus) sind hauptsächlich für freie Monoide konzipiert. Die direkte Anwendung auf nicht-freie Monoide führt zu folgenden Problemen:
Nicht-Terminierung: Wie in Lemma 1.1 gezeigt, kann der Vilar-Algorithmus auf bestimmten Monoiden möglicherweise nie terminieren
Effizienzprobleme: Der Ansatz, zuerst Transducer im freien Monoiden zu lernen und dann zu minimieren, führt zu unnötigen Zuständen
Theoretische Lücken: Fehlender systematischer theoretischer Rahmen für beliebige Monoide
Theoretische Rahmenwerkerweiterung: Erweiterung des kategorientheoretischen Lernrahmenwerks von Colcombet-Petrişan-Stabile auf monoide Transducer
Existenzbedingungen: Angabe notwendiger und hinreichender Bedingungen auf dem Ausgabemonoiden, um Existenz und Eindeutigkeit minimaler monoider Transducer zu sichern
Bedingungsoptimierung: Erweiterung der Minimierungsbedingungen von Gerdjikov, wobei die Komplexitätsgrenzen möglicherweise schlechter sind
Praktischer Algorithmus: Bereitstellung konkreter Implementierungsdetails für den abstrakten Monoiden-Transducer-Lernalgorithmus
Zerlegungssysteme: Erklärung verschiedener Konsistenzprobleme im Lernalgorithmus durch quaternäre Zerlegungssysteme
Linker größter gemeinsamer Teiler (left-gcd): Für eine Familie w = (wi)i∈I ist ihr linker gcd der linke Teiler, der von allen anderen linken Teilern geteilt wird.
Reduktionsfunktion: Wenn Kl(TM) alle abzählbaren 1-Potenzen besitzt, existieren Funktionen:
lgcd: (M + 1)^N* → M (berechnet linken gcd)
red: (M + 1)^N* → (M + 1)^N* (Reduktionsfunktion)
die erfüllen:
Λ = lgcd(Λ) ⊗ red(Λ)
Eindeutigkeit: Wenn υ ⊗ red(Γ) = ν ⊗ red(Λ), dann υ = ν und red(Γ) = red(Λ)
Eingabe: EvalL, EquivL
Ausgabe: Minimaler Transducer MinL
1. Initialisiere Q = T = {ε}
2. Schleife bis Konvergenz:
- Überprüfe Abschlussbedingung: Existiert qa ∈ QA, so dass R(q,a,·)
nicht als invertierbares Vielfaches bestehender Zustände dargestellt werden kann
- Überprüfe Konsistenzbedingungen: Überprüfe drei Arten von Konsistenzproblemen
- Konstruiere hypothetischen Transducer H(Q,T)
- Reiche Äquivalenzabfrage ein, verarbeite Gegenbeispiele
Satz 4.3: Der Algorithmus ist korrekt und terminiert, wenn MinL eine endliche Zustandsmenge besitzt und M rechts-Noethersch ist. Grenze für Aktualisierungen:
Aktualisierungen von Q: Höchstens 3|MinL|st + rk(MinL) mal
Aktualisierungen von T: Höchstens rk(MinL) + |MinL|st mal
Die Arbeit zitiert wichtige Literatur aus mehreren Bereichen einschließlich formaler Sprachen, Kategorientheorie und Monoidentheorie:
Angluin (1987): Learning regular sets from queries and counterexamples
Colcombet, Petrişan, Stabile (2020-2021): Originalarbeiten zum kategorientheoretischen Lernrahmenwerk
Gerdjikov (2018): Wichtige Arbeiten zur Minimierung monoider Transducer
Mac Lane (1978): Categories for the Working Mathematician
Gesamtbewertung: Dies ist eine hochwertige theoretische Arbeit, die das wichtige kategorientheoretische Lernrahmenwerk erfolgreich auf die allgemeinere Einstellung monoider Transducer erweitert. Obwohl experimentelle Verifikation fehlt, sind die theoretischen Beiträge erheblich und legen eine solide Grundlage für weitere Entwicklungen in verwandten Bereichen. Die mathematische Strenge und methodische Innovation der Arbeit verdienen Anerkennung.