2025-11-19T16:52:14.243866

Learning Weighted Automata over Number Rings, Concretely and Categorically

Aristote, van Gool, PetriÅan et al.

We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.

academic

Apprentissage d'Automates Pondérés sur les Anneaux de Nombres, Concrètement et Catégoriquement

Informations Fondamentales

ID de l'article: 2504.16596
Titre: Learning Weighted Automata over Number Rings, Concretely and Categorically
Auteurs: Quentin Aristote, Sam van Gool, Daniela Petrişan, Mahsa Shirmohammadi
Classification: cs.FL (Théorie des Langages Formels et Automates)
Date de publication: 23 avril 2025 (prépublication arXiv)
Lien de l'article: https://arxiv.org/abs/2504.16596

Résumé

Cet article développe une procédure générale de réduction pour les problèmes d'apprentissage actif. La méthode s'inspire des travaux récents de Buna-Marginean et al. (2024) qui ont proposé une réduction en temps polynomial du problème d'apprentissage exact d'automates pondérés sur les entiers au problème d'apprentissage d'automates pondérés sur les rationnels. Cette procédure améliore l'efficacité des algorithmes d'apprentissage d'automates catégoriques et soulève de nouvelles questions concernant la complexité de mise en œuvre lors de l'instanciation dans des catégories concrètes. En tant que deuxième contribution majeure, les auteurs résolvent ces problèmes de complexité dans le cadre concret de l'apprentissage d'automates pondérés sur les anneaux de nombres (anneaux d'entiers dans les corps de nombres algébriques). En supposant une représentation complète de l'anneau de nombres OK, un algorithme d'apprentissage exact pour les automates pondérés OK est obtenu, avec une complexité en temps polynomial en fonction de la taille de l'automate cible, du logarithme de la longueur de la plus longue contre-exemple, du degré du corps de nombres et du logarithme du discriminant. L'automate produit par l'algorithme possède au plus un état de plus que l'automate minimal, et il est démontré que faire mieux nécessiterait de résoudre le problème des idéaux principaux, pour lequel le meilleur algorithme connu actuellement s'exécute en temps polynomial quantique.

Contexte et Motivation de la Recherche

Contexte du Problème

Apprentissage classique d'automates: L'algorithme L* d'Angluin apprend efficacement les automates finis déterministes dans le cadre du maître d'apprentissage minimal (MAT), ce qui constitue un résultat classique de la théorie de l'apprentissage computationnel.
Défis de l'apprentissage d'automates pondérés: L'extension des algorithmes d'apprentissage à des modèles plus expressifs (comme les automates pondérés) présente des défis, en particulier lorsque les poids ne se situent pas dans un corps mais dans un anneau.
Limitations des approches existantes:
- Pour les automates pondérés sur les corps, des algorithmes d'apprentissage en temps polynomial existent
- Pour les automates pondérés sur les anneaux généraux, les méthodes existantes présentent soit une complexité excessive, soit une applicabilité limitée
- Les approches catégoriques, bien que générales, peuvent conduire à une complexité exponentielle lors de la mise en œuvre concrète

Motivation de la Recherche

Besoin théorique: Nécessité d'un cadre qui préserve la généralité de l'approche catégorique tout en maintenant une complexité polynomiale dans les cas concrets
Applications pratiques: Les anneaux de nombres ont des applications importantes en cryptographie, et l'apprentissage efficace d'automates pondérés sur ces anneaux a une valeur pratique
Frontières théoriques: Exploration des limites théoriques de la minimisation d'automates pondérés, en particulier la généralisation de la propriété de Fatou

Contributions Principales

Algorithme de réduction générale: Proposition de l'Algorithme 3, une procédure générale de réduction dans le cadre catégorique, réduisant une classe de problèmes d'apprentissage à une autre classe plus facile à traiter
Algorithme concret sur les anneaux de nombres: Développement de l'Algorithme 4, un algorithme d'apprentissage en temps polynomial spécialisé pour les automates pondérés OK sur les anneaux de nombres
Résultats de quasi-optimalité: Démonstration que l'automate produit par l'algorithme possède au plus un état de plus que l'automate minimal (quasi-minimalité)
Bornes de complexité théorique: Démonstration que l'obtention d'un automate complètement minimal est équivalente à la résolution du problème des idéaux principaux (PIP-difficile), établissant une borne inférieure théorique du problème
Généralisation de la propriété de Fatou: Démonstration que les domaines de Dedekind sont des « anneaux quasi-fortement Fatou », généralisant la propriété classique de Fatou

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée: Un langage pondéré OK inconnu L: Σ* → OK (accessible via un oracle) Sortie: Un automate pondéré OK calculant L Contrainte: La complexité de l'algorithme est polynomiale en fonction de la taille de l'automate cible, du logarithme de la longueur de la plus longue contre-exemple, du degré du corps de nombres et du logarithme du discriminant

Cadre Technique Principal

1. Fondations Catégoriques

L'article adopte une perspective fonctorielle, considérant les automates comme des foncteurs A: I → C, où:

I est la catégorie libre générée par l'alphabet Σ
C est la catégorie de sortie (par exemple, la catégorie des modules ModR)

2. Algorithme de Réduction Générale (Algorithme 3)

Idée de l'algorithme:
1. Apprendre l'automate dans la catégorie « facile » D
2. Établir une connexion via le foncteur F: C → D
3. Utiliser l'adjoint droit G: D → C pour ramener le résultat à la catégorie cible C

Hypothèse clé (Hypothèse 12):

F préserve certaines classes de morphismes
F possède un adjoint droit G
Les morphismes unité et counité possèdent des propriétés spécifiques

3. Implémentation Concrète sur les Anneaux de Nombres (Algorithme 4)

Étape 1: Conjugaison Arrière

Calcul de la base B de l'espace arrière de l'automate A
Conjugaison de A par la matrice B pour obtenir A'

Étape 2: Génération de Module Avant

Appel de l'Algorithme 5 pour calculer l'ensemble générateur du module OK avant de A'
Utilisation d'une stratégie en deux phases:
- Phase 1: Trouver des mots augmentant le rang dans K
- Phase 2: Compléter la génération du module dans OK

Étape 3: Calcul de Pseudo-base

Utilisation de la forme pseudo-Hermite normale (pseudo-HNF) pour calculer la pseudo-base à partir de l'ensemble générateur
Forme de pseudo-base: {(ai, vi) | 1 ≤ i ≤ ℓ}, où ai sont des idéaux fractionnaires

Étape 4: Ensemble Générateur Quasi-Minimal

Conversion de la pseudo-base en ensemble générateur de taille au plus ℓ+1 via l'Algorithme 6
Utilisation du raffinement de factorisation d'idéaux et du théorème des restes chinois

Points d'Innovation Technique

Stratégie de génération en deux phases: Déterminer d'abord le rang dans le corps K, puis compléter la structure du module dans l'anneau OK, évitant ainsi une complexité exponentielle
Technique de pseudo-base: Exploitation de la théorie structurelle des domaines de Dedekind, traitement des domaines non-principaux via la pseudo-base
Combinaison de la théorie catégorique et des algorithmes concrets: Concrétisation du cadre catégorique abstrait en un algorithme polynomial réalisable

Configuration Expérimentale

Vérification Théorique

L'article est principalement un travail théorique, vérifié par:

Analyse de complexité: Analyse détaillée de la complexité temporelle des Algorithmes 4 et 5
Preuves de correction: Démonstration de la correction de l'algorithme général via le Théorème 18
Vérification par exemple: Fourniture d'exemples concrets (comme l'Exemple 1) illustrant la situation sur Zi√5

Bornes de Complexité

Théorème 2: Étant donné une représentation complète de OK, l'apprentissage exact d'automates pondérés OK est résoluble en temps polynomial en fonction des paramètres suivants:

Taille de l'automate cible
Logarithme de la longueur de la plus longue contre-exemple
Degré du corps de nombres d
Logarithme du discriminant ΔK

Résultats Expérimentaux

Résultats Théoriques Principaux

Quasi-optimalité (Proposition 10): Pour un domaine de Dedekind R, si L est un langage pondéré R de rang n, alors il existe un automate pondéré R calculant L avec au plus n+1 états
Borne inférieure de complexité (Proposition 26): Déterminer si un automate pondéré OK est minimal en nombre d'états est PIP-difficile
Généralisation de la propriété de Fatou (Corollaire 16): Les domaines de Dedekind sont des anneaux quasi-fortement Fatou

Analyse d'Exemple Concret

Exemple 1: Dans l'anneau de nombres R = Zi√5:

Construction d'un automate pondéré R à 3 états
Existence d'un automate pondéré K équivalent à 2 états (K = Q(i√5))
Illustration que la propriété fortement Fatou ne s'applique pas toujours, mais la propriété quasi-fortement Fatou s'applique

Travaux Connexes

Apprentissage Classique d'Automates

Algorithme L* d'Angluin: Apprentissage polynomial des automates finis déterministes
Beimel et al.: Algorithmes d'apprentissage pour automates pondérés sur les corps

Automates Pondérés sur les Anneaux

van Heerdt et al.: Apprentissage sur les domaines principaux, mais sans bornes de complexité
Buna-Marginean et al.: Réduction de Z à Q, inspiration directe de cet article

Approches Catégoriques

Colcombet-Petrişan: Approche fonctorielle de la minimisation d'automates
Urbat-Schröder et al.: Approches algébriques de l'apprentissage

Conclusion et Discussion

Conclusions Principales

Développement du premier algorithme en temps polynomial pour l'apprentissage d'automates pondérés sur les anneaux de nombres
Démonstration de la difficulté d'obtenir des automates complètement minimaux (PIP-difficile)
Établissement d'un pont entre la théorie catégorique et les algorithmes concrets

Limitations

Exigences de représentation: Nécessité d'une « représentation complète » de l'anneau OK, ce qui peut être difficile à obtenir en pratique
Quasi-optimalité: L'automate produit par l'algorithme peut avoir un état de plus que le minimum
Structure spécifique: La méthode est spécialisée pour les domaines de Dedekind, la généralisation à des anneaux arbitraires n'est pas claire

Directions Futures

Autres classes d'anneaux: Recherche de généralisations à des domaines non-Dedekind
Implémentation pratique: Développement d'implémentations logicielles concrètes et vérification expérimentale
Exploration d'applications: Applications concrètes en cryptographie et autres domaines

Évaluation Approfondie

Avantages

Profondeur théorique: Combinaison ingénieuse de la théorie catégorique, de la théorie algébrique des nombres et de la théorie de la complexité computationnelle
Innovation technique: Utilisation créative de la stratégie d'apprentissage en deux phases et de la technique de pseudo-base
Complétude: Fourniture à la fois d'algorithmes et de preuves de bornes inférieures, offrant une image complète du problème
Rigueur: Preuves mathématiques rigoureuses et analyse de complexité détaillée

Insuffisances

Praticité: Absence d'implémentation pratique et de vérification expérimentale
Lisibilité: La partie théorie catégorique peut être difficile à comprendre pour les non-spécialistes
Portée d'application: L'applicabilité de la méthode est limitée à des structures algébriques spécifiques

Impact

Contribution théorique: Apport important à la théorie de l'apprentissage d'automates pondérés
Méthodologie: Démonstration de comment concrétiser les méthodes catégoriques abstraites
Interdisciplinarité: Connexion entre la théorie des automates, la théorie algébrique des nombres et la théorie de la complexité computationnelle

Scénarios d'Application

Cryptographie: Applications des anneaux de nombres en cryptographie sur les réseaux
Calcul symbolique: Problèmes de calcul sur les corps de nombres algébriques
Recherche théorique: Fondation pour des recherches ultérieures sur l'apprentissage d'automates

Complément de Détails Techniques

Représentation des Anneaux de Nombres

L'article exige une « représentation complète » de OK incluant:

Base intégrale Ω = {ω1,...,ωd}
Élément primitif θ et son polynôme minimal
Mesure de complexité CK = d⁴(log d + log ΔK)

Complexité de l'Algorithme

Les bornes de complexité clés proviennent de:

Calcul de pseudo-HNF: Temps polynomial (Biasse-Fieker-Hofmann)
Longueur de chaîne strictement croissante: Bornée par Lemme 24 comme log(N(d))
Opérations sur les idéaux: Temps polynomial en CK

Cet article apporte une contribution importante au domaine de l'informatique théorique, en particulier à l'intersection de l'apprentissage d'automates et du calcul algébrique. Bien que sa praticité reste à vérifier, sa valeur théorique et sa signification méthodologique sont remarquables.