Active Learning of Deterministic Transducers with Outputs in Arbitrary Monoids
Aristote
We study monoidal transducers, transition systems arising as deterministic automata whose transitions also produce outputs in an arbitrary monoid, for instance allowing outputs to commute or to cancel out. We use the categorical framework for minimization and learning of Colcombet, PetriÅan and Stabile to recover the notion of minimal transducer recognizing a language, and give necessary and sufficient conditions on the output monoid for this minimal transducer to exist and be unique (up to isomorphism). The categorical framework then provides an abstract algorithm for learning it using membership and equivalence queries, and we discuss practical aspects of this algorithm's implementation.
academic
Apprendimento Attivo di Trasduttori Deterministici con Uscite in Monoidi Arbitrari
Questo articolo studia i trasduttori monoidi (monoidal transducers), una classe di sistemi di trasformazione di automi deterministici che producono uscite in monoidi arbitrari, ad esempio consentendo uscite commutative o mutuamente annullabili. L'autore utilizza il framework categoriale di Colcombet, Petrişan e Stabile per recuperare il concetto di trasduttore minimo che riconosce linguaggi, e fornisce condizioni necessarie e sufficienti sul monoide di uscita affinché questo trasduttore minimo esista e sia unico (a meno di isomorfismo). Il framework categoriale fornisce inoltre un algoritmo astratto per imparare trasduttori minimi utilizzando query di appartenenza e query di equivalenza, e discute gli aspetti pratici dell'implementazione dell'algoritmo.
I trasduttori tradizionali (transducers) di solito producono uscite in monoidi liberi (come stringhe), ma in alcuni scenari applicativi, le uscite potrebbero dover soddisfare proprietà algebriche come la commutatività o l'annullamento. Ad esempio:
Monoide trace nella teoria della concorrenza: utilizzato per modellare sequenze di esecuzione di lavori indipendenti, dove alcuni lavori possono essere eseguiti in modo asincrono
Programmazione di processi: i trasduttori possono essere utilizzati per programmare sistematicamente i lavori
Elaborazione del linguaggio naturale: alcuni simboli di uscita potrebbero avere proprietà commutative
Gli algoritmi di apprendimento di trasduttori esistenti (come l'algoritmo di Vilar) sono principalmente progettati per monoidi liberi, e l'applicazione diretta a monoidi non liberi incontra i seguenti problemi:
Non-terminazione: come mostrato nel Lemma 1.1, l'algoritmo di Vilar potrebbe non terminare mai su certi monoidi
Problemi di efficienza: il metodo di imparare prima il trasduttore sul monoide libero e poi minimizzarlo introduce stati non necessari
Mancanza di teoria: assenza di un framework teorico sistematico per monoidi arbitrari
Estensione del Framework Teorico: estensione del framework di apprendimento categoriale di Colcombet-Petrişan-Stabile ai trasduttori monoidi
Condizioni di Esistenza: fornisce condizioni necessarie e sufficienti sul monoide di uscita per garantire l'esistenza e l'unicità del trasduttore minimo monoide
Ottimizzazione delle Condizioni: estensione della categoria di condizioni di minimizzazione di Gerdjikov, sebbene i limiti di complessità potrebbero essere peggiori
Algoritmo Pratico: fornisce dettagli concreti di implementazione dell'algoritmo astratto di apprendimento di trasduttori monoidi
Sistemi di Decomposizione: interpretazione dei diversi tipi di problemi di coerenza nell'algoritmo di apprendimento attraverso sistemi di decomposizione quaternari
Massimo Comune Divisore Sinistro (left-gcd): per una famiglia w = (wi)i∈I, il suo left-gcd è il divisore sinistro che divide tutti gli altri divisori sinistri.
Funzione di Riduzione: quando Kl(TM) possiede tutte le potenze numerabili di 1, esiste una funzione:
Input: EvalL, EquivL
Output: trasduttore minimo MinL
1. Inizializza Q = T = {ε}
2. Cicla fino alla convergenza:
- Verifica condizione di chiusura: esiste qa ∈ QA tale che R(q,a,·)
non può essere rappresentato come multiplo invertibile di stati esistenti
- Verifica condizioni di coerenza: controlla tre problemi di coerenza
- Costruisce trasduttore ipotesi H(Q,T)
- Sottomette query di equivalenza, elabora controesempi
Teorema 4.3: L'algoritmo è corretto e termina quando MinL possiede un insieme di stati finito e M è right-Noetherian. Il limite del numero di aggiornamenti è:
Aggiornamenti di Q: al massimo 3|MinL|st + rk(MinL) volte
Aggiornamenti di T: al massimo rk(MinL) + |MinL|st volte
L'articolo cita importanti letteratura da molteplici campi, inclusa la teoria dei linguaggi formali, la teoria categoriale, la teoria dei monoidi, tra cui:
Angluin (1987): Learning regular sets from queries and counterexamples
Colcombet, Petrişan, Stabile (2020-2021): articoli originali del framework di apprendimento categoriale
Gerdjikov (2018): importante lavoro sulla minimizzazione di trasduttori monoidi
Mac Lane (1978): Categories for the Working Mathematician
Valutazione Complessiva: Questo è un articolo teorico di alta qualità che estende con successo un importante framework di apprendimento categoriale all'impostazione più generale dei trasduttori monoidi. Sebbene manchi di verifica sperimentale, il contributo teorico è significativo e fornisce una base solida per lo sviluppo futuro di campi correlati. La rigore matematico e l'innovazione metodologica dell'articolo sono degni di lode.