Active Learning of Deterministic Transducers with Outputs in Arbitrary Monoids
Aristote
We study monoidal transducers, transition systems arising as deterministic automata whose transitions also produce outputs in an arbitrary monoid, for instance allowing outputs to commute or to cancel out. We use the categorical framework for minimization and learning of Colcombet, PetriÅan and Stabile to recover the notion of minimal transducer recognizing a language, and give necessary and sufficient conditions on the output monoid for this minimal transducer to exist and be unique (up to isomorphism). The categorical framework then provides an abstract algorithm for learning it using membership and equivalence queries, and we discuss practical aspects of this algorithm's implementation.
academic
Apprentissage Actif des Transducteurs Déterministes avec Sorties dans des Monoïdes Arbitraires
Cet article étudie les transducteurs monoïdaux (monoidal transducers), une classe de systèmes de transduction d'automates déterministes qui produisent des sorties dans des monoïdes arbitraires, par exemple permettant aux sorties d'être commutatives ou de s'annuler mutuellement. L'auteur utilise le cadre catégorique de Colcombet, Petrişan et Stabile pour récupérer la notion de transducteur minimal reconnaissant un langage, et fournit des conditions nécessaires et suffisantes sur le monoïde de sortie garantissant l'existence et l'unicité (à isomorphisme près) de ce transducteur minimal. Le cadre catégorique fournit ensuite un algorithme abstrait pour apprendre le transducteur minimal en utilisant des requêtes d'appartenance et des requêtes d'équivalence, et discute des aspects pratiques de l'implémentation de cet algorithme.
Les transducteurs traditionnels produisent généralement des sorties sur des monoïdes libres (comme les chaînes de caractères), mais dans certains scénarios d'application, les sorties peuvent nécessiter de satisfaire des propriétés algébriques telles que la commutativité ou l'annulation. Par exemple:
Monoïde de traces en théorie de la concurrence: utilisé pour modéliser les séquences d'exécution de tâches indépendantes, certaines tâches pouvant s'exécuter de manière asynchrone
Ordonnancement de programmes: les transducteurs peuvent être utilisés pour ordonnancer programmatiquement des tâches
Traitement du langage naturel: certains symboles de sortie peuvent posséder des propriétés commutatives
Les algorithmes d'apprentissage de transducteurs existants (comme l'algorithme de Vilar) sont principalement conçus pour les monoïdes libres, et leur application directe aux monoïdes non libres rencontre les problèmes suivants:
Non-terminaison: comme le montre le Lemme 1.1, l'algorithme de Vilar peut ne jamais se terminer sur certains monoïdes
Problèmes d'efficacité: la méthode consistant à d'abord apprendre un transducteur sur le monoïde libre puis à le minimiser introduit des états inutiles
Absence de théorie: manque d'un cadre théorique systématique pour les monoïdes arbitraires
Extension du cadre théorique: extension du cadre d'apprentissage catégorique de Colcombet-Petrişan-Stabile aux transducteurs monoïdaux
Conditions d'existence: fournit des conditions nécessaires et suffisantes sur le monoïde de sortie garantissant l'existence et l'unicité du transducteur monoïdal minimal
Optimisation des conditions: extension de la catégorie des conditions de minimisation de Gerdjikov, bien que les bornes de complexité puissent être pires
Algorithme pratique: fournit des détails d'implémentation concrets pour l'algorithme abstrait d'apprentissage de transducteurs monoïdaux
Systèmes de décomposition: explication des différents types de problèmes de cohérence dans l'algorithme d'apprentissage via des systèmes de décomposition quaternaires
Plus grand commun diviseur gauche (left-gcd): pour une famille w = (wi)i∈I, son left-gcd est le diviseur gauche qui est divisible par tous les autres diviseurs gauches.
Fonction de réduction: lorsque Kl(TM) possède toutes les puissances dénombrables de 1, il existe une fonction:
Entrée: EvalL, EquivL
Sortie: Transducteur minimal MinL
1. Initialiser Q = T = {ε}
2. Boucler jusqu'à convergence:
- Vérifier la condition de fermeture: existe-t-il qa ∈ QA tel que R(q,a,·)
ne peut pas être exprimé comme un multiple inversible d'états existants
- Vérifier les conditions de cohérence: vérifier trois problèmes de cohérence
- Construire le transducteur hypothétique H(Q,T)
- Soumettre une requête d'équivalence, traiter les contre-exemples
Théorème 4.3: L'algorithme est correct et se termine lorsque MinL possède un ensemble d'états fini et M est droit Noethérien. La borne sur le nombre de mises à jour est:
L'article cite des travaux importants de plusieurs domaines incluant la théorie des langages formels, la théorie des catégories, la théorie des monoïdes, notamment:
Angluin (1987): Learning regular sets from queries and counterexamples
Colcombet, Petrişan, Stabile (2020-2021): articles originaux du cadre d'apprentissage catégorique
Gerdjikov (2018): travail important sur la minimisation des transducteurs monoïdaux
Mac Lane (1978): Categories for the Working Mathematician
Évaluation Globale: Ceci est un article théorique de haute qualité qui étend avec succès un important cadre d'apprentissage catégorique au contexte plus général des transducteurs monoïdaux. Bien que manquant de vérification expérimentale, les contributions théoriques sont significatives et jettent une base solide pour le développement ultérieur du domaine. La rigueur mathématique et l'innovation méthodologique de l'article sont dignes d'éloges.