Learning Weighted Automata over Number Rings, Concretely and Categorically
Aristote, van Gool, PetriÅan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic
Apprentissage d'Automates Pondérés sur les Anneaux de Nombres, Concrètement et Catégoriquement
Cet article développe une procédure générale de réduction pour les problèmes d'apprentissage actif. La méthode s'inspire des travaux récents de Buna-Marginean et al. (2024) qui ont proposé une réduction en temps polynomial du problème d'apprentissage exact d'automates pondérés sur les entiers au problème d'apprentissage d'automates pondérés sur les rationnels. Cette procédure améliore l'efficacité des algorithmes d'apprentissage d'automates catégoriques et soulève de nouvelles questions concernant la complexité de mise en œuvre lors de l'instanciation dans des catégories concrètes. En tant que deuxième contribution majeure, les auteurs résolvent ces problèmes de complexité dans le cadre concret de l'apprentissage d'automates pondérés sur les anneaux de nombres (anneaux d'entiers dans les corps de nombres algébriques). En supposant une représentation complète de l'anneau de nombres OK, un algorithme d'apprentissage exact pour les automates pondérés OK est obtenu, avec une complexité en temps polynomial en fonction de la taille de l'automate cible, du logarithme de la longueur de la plus longue contre-exemple, du degré du corps de nombres et du logarithme du discriminant. L'automate produit par l'algorithme possède au plus un état de plus que l'automate minimal, et il est démontré que faire mieux nécessiterait de résoudre le problème des idéaux principaux, pour lequel le meilleur algorithme connu actuellement s'exécute en temps polynomial quantique.
Apprentissage classique d'automates: L'algorithme L* d'Angluin apprend efficacement les automates finis déterministes dans le cadre du maître d'apprentissage minimal (MAT), ce qui constitue un résultat classique de la théorie de l'apprentissage computationnel.
Défis de l'apprentissage d'automates pondérés: L'extension des algorithmes d'apprentissage à des modèles plus expressifs (comme les automates pondérés) présente des défis, en particulier lorsque les poids ne se situent pas dans un corps mais dans un anneau.
Limitations des approches existantes:
Pour les automates pondérés sur les corps, des algorithmes d'apprentissage en temps polynomial existent
Pour les automates pondérés sur les anneaux généraux, les méthodes existantes présentent soit une complexité excessive, soit une applicabilité limitée
Les approches catégoriques, bien que générales, peuvent conduire à une complexité exponentielle lors de la mise en œuvre concrète
Besoin théorique: Nécessité d'un cadre qui préserve la généralité de l'approche catégorique tout en maintenant une complexité polynomiale dans les cas concrets
Applications pratiques: Les anneaux de nombres ont des applications importantes en cryptographie, et l'apprentissage efficace d'automates pondérés sur ces anneaux a une valeur pratique
Frontières théoriques: Exploration des limites théoriques de la minimisation d'automates pondérés, en particulier la généralisation de la propriété de Fatou
Algorithme de réduction générale: Proposition de l'Algorithme 3, une procédure générale de réduction dans le cadre catégorique, réduisant une classe de problèmes d'apprentissage à une autre classe plus facile à traiter
Algorithme concret sur les anneaux de nombres: Développement de l'Algorithme 4, un algorithme d'apprentissage en temps polynomial spécialisé pour les automates pondérés OK sur les anneaux de nombres
Résultats de quasi-optimalité: Démonstration que l'automate produit par l'algorithme possède au plus un état de plus que l'automate minimal (quasi-minimalité)
Bornes de complexité théorique: Démonstration que l'obtention d'un automate complètement minimal est équivalente à la résolution du problème des idéaux principaux (PIP-difficile), établissant une borne inférieure théorique du problème
Généralisation de la propriété de Fatou: Démonstration que les domaines de Dedekind sont des « anneaux quasi-fortement Fatou », généralisant la propriété classique de Fatou
Entrée: Un langage pondéré OK inconnu L: Σ* → OK (accessible via un oracle)
Sortie: Un automate pondéré OK calculant L
Contrainte: La complexité de l'algorithme est polynomiale en fonction de la taille de l'automate cible, du logarithme de la longueur de la plus longue contre-exemple, du degré du corps de nombres et du logarithme du discriminant
Idée de l'algorithme:
1. Apprendre l'automate dans la catégorie « facile » D
2. Établir une connexion via le foncteur F: C → D
3. Utiliser l'adjoint droit G: D → C pour ramener le résultat à la catégorie cible C
Hypothèse clé (Hypothèse 12):
F préserve certaines classes de morphismes
F possède un adjoint droit G
Les morphismes unité et counité possèdent des propriétés spécifiques
Calcul de la base B de l'espace arrière de l'automate A
Conjugaison de A par la matrice B pour obtenir A'
Étape 2: Génération de Module Avant
Appel de l'Algorithme 5 pour calculer l'ensemble générateur du module OK avant de A'
Utilisation d'une stratégie en deux phases:
- Phase 1: Trouver des mots augmentant le rang dans K
- Phase 2: Compléter la génération du module dans OK
Étape 3: Calcul de Pseudo-base
Utilisation de la forme pseudo-Hermite normale (pseudo-HNF) pour calculer la pseudo-base à partir de l'ensemble générateur
Forme de pseudo-base: {(ai, vi) | 1 ≤ i ≤ ℓ}, où ai sont des idéaux fractionnaires
Étape 4: Ensemble Générateur Quasi-Minimal
Conversion de la pseudo-base en ensemble générateur de taille au plus ℓ+1 via l'Algorithme 6
Utilisation du raffinement de factorisation d'idéaux et du théorème des restes chinois
Stratégie de génération en deux phases: Déterminer d'abord le rang dans le corps K, puis compléter la structure du module dans l'anneau OK, évitant ainsi une complexité exponentielle
Technique de pseudo-base: Exploitation de la théorie structurelle des domaines de Dedekind, traitement des domaines non-principaux via la pseudo-base
Combinaison de la théorie catégorique et des algorithmes concrets: Concrétisation du cadre catégorique abstrait en un algorithme polynomial réalisable
Théorème 2: Étant donné une représentation complète de OK, l'apprentissage exact d'automates pondérés OK est résoluble en temps polynomial en fonction des paramètres suivants:
Taille de l'automate cible
Logarithme de la longueur de la plus longue contre-exemple
Quasi-optimalité (Proposition 10): Pour un domaine de Dedekind R, si L est un langage pondéré R de rang n, alors il existe un automate pondéré R calculant L avec au plus n+1 états
Borne inférieure de complexité (Proposition 26): Déterminer si un automate pondéré OK est minimal en nombre d'états est PIP-difficile
Généralisation de la propriété de Fatou (Corollaire 16): Les domaines de Dedekind sont des anneaux quasi-fortement Fatou
Profondeur théorique: Combinaison ingénieuse de la théorie catégorique, de la théorie algébrique des nombres et de la théorie de la complexité computationnelle
Innovation technique: Utilisation créative de la stratégie d'apprentissage en deux phases et de la technique de pseudo-base
Complétude: Fourniture à la fois d'algorithmes et de preuves de bornes inférieures, offrant une image complète du problème
Rigueur: Preuves mathématiques rigoureuses et analyse de complexité détaillée
Calcul de pseudo-HNF: Temps polynomial (Biasse-Fieker-Hofmann)
Longueur de chaîne strictement croissante: Bornée par Lemme 24 comme log(N(d))
Opérations sur les idéaux: Temps polynomial en CK
Cet article apporte une contribution importante au domaine de l'informatique théorique, en particulier à l'intersection de l'apprentissage d'automates et du calcul algébrique. Bien que sa praticité reste à vérifier, sa valeur théorique et sa signification méthodologique sont remarquables.