Learning Weighted Automata over Number Rings, Concretely and Categorically
Aristote, van Gool, PetriÅan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic
Apprendimento di Automi Ponderati su Anelli Numerici, Concretamente e Categoricamente
Questo articolo sviluppa una procedura di riduzione generale per problemi di apprendimento attivo. L'approccio è ispirato dal recente lavoro di Buna-Marginean et al. (2024), che ha ridotto in tempo polinomiale il problema dell'apprendimento esatto di automi ponderati su interi al problema dell'apprendimento di automi ponderati su razionali. La procedura migliora l'efficienza degli algoritmi di apprendimento di automi categorici e pone nuove questioni sulla complessità di implementazione quando istanziata in categorie concrete. Come secondo contributo principale, gli autori affrontano questi problemi di complessità nel contesto concreto dell'apprendimento di automi ponderati su anelli numerici (anelli di interi in campi di numeri algebrici). Assumendo una rappresentazione completa dell'anello numerico OK, viene ottenuto un algoritmo di apprendimento esatto per automi ponderati su OK con complessità temporale polinomiale rispetto alla dimensione dell'automa target, al logaritmo della lunghezza massima del controesempio, al grado del campo numerico e al logaritmo del discriminante. L'automa prodotto dall'algoritmo ha al massimo uno stato in più rispetto all'automa minimo, e si dimostra che fare meglio richiede risolvere il problema dell'ideale principale, per il quale l'algoritmo migliore noto è in tempo polinomiale quantistico.
Apprendimento Classico di Automi: L'algoritmo L* di Angluin apprende efficientemente automi a stati finiti deterministici nel framework del maestro minimo sufficiente (MAT), un risultato classico della teoria dell'apprendimento computazionale.
Sfide nell'Apprendimento di Automi Ponderati: L'estensione degli algoritmi di apprendimento a modelli più espressivi (come gli automi ponderati) presenta sfide, in particolare quando i pesi non appartengono a un campo ma a un anello.
Limitazioni dei Metodi Esistenti:
Per automi ponderati su campi, esistono algoritmi di apprendimento in tempo polinomiale
Per automi ponderati su anelli generali, i metodi esistenti hanno complessità eccessiva o applicabilità limitata
I metodi categorici, sebbene generali, possono portare a complessità esponenziale nell'implementazione concreta
Necessità Teorica: È necessario un framework che mantenga la generalità dell'approccio categorico e al contempo abbia complessità polinomiale nei casi concreti
Applicazioni Pratiche: Gli anelli numerici hanno importanti applicazioni in crittografia, rendendo l'apprendimento efficiente di automi ponderati su di essi di valore pratico
Confini Teorici: Esplorare i limiti teorici della minimizzazione di automi ponderati, in particolare l'estensione della proprietà di Fatou
Algoritmo di Riduzione Generale: Propone l'Algoritmo 3, una procedura di riduzione generale nel framework categorico che riduce una classe di problemi di apprendimento a un'altra classe più trattabile
Algoritmo Concreto su Anelli Numerici: Sviluppa l'Algoritmo 4, un algoritmo di apprendimento in tempo polinomiale specificamente per automi ponderati su anelli numerici OK
Risultati di Quasi-Optimalità: Dimostra che l'automa prodotto dall'algoritmo ha al massimo uno stato in più rispetto all'automa minimo (quasi-minimalità)
Confini di Complessità Teorica: Dimostra che ottenere un automa completamente minimo è equivalente a risolvere il problema dell'ideale principale (PIP-hard), stabilendo un limite inferiore teorico
Estensione della Proprietà di Fatou: Dimostra che i domini di Dedekind sono "anelli quasi fortemente Fatou", estendendo la proprietà classica di Fatou
Input: Un linguaggio ponderato OK sconosciuto L: Σ* → OK (accessibile tramite oracolo)
Output: Un automa ponderato OK che calcola L
Vincoli: La complessità dell'algoritmo è polinomiale rispetto alla dimensione dell'automa target, al logaritmo della lunghezza massima del controesempio, al grado del campo numerico e al logaritmo del discriminante
Idea dell'Algoritmo:
1. Apprendere l'automa nella categoria "trattabile" D
2. Stabilire una connessione tramite il funtore F: C → D
3. Utilizzare l'aggiunto destro G: D → C per riportare il risultato
nella categoria target C
Assunzione Chiave (Assunzione 12):
F preserva certe classi di morfismi
F ha un aggiunto destro G
I morfismi unitari e counità hanno proprietà specifiche
Calcolare una base B dello spazio posteriore dell'automa A
Coniugare A tramite la matrice B per ottenere A'
Passo 2: Generazione del Modulo Anteriore
Invocare l'Algoritmo 5 per calcolare l'insieme generatore del modulo
OK anteriore di A'
Utilizzare una strategia a due fasi:
- Prima fase: trovare parole che aumentano il rango in K
- Seconda fase: completare la generazione del modulo in OK
Passo 3: Calcolo della Pseudo-Base
Utilizzare la forma pseudo-Hermite normale (pseudo-HNF) per calcolare
la pseudo-base dall'insieme generatore
Forma della pseudo-base: {(ai, vi) | 1 ≤ i ≤ ℓ}, dove ai sono ideali frazionari
Passo 4: Insieme Generatore Quasi-Minimo
Convertire la pseudo-base in un insieme generatore di dimensione al massimo ℓ+1
tramite l'Algoritmo 6
Utilizzare il raffinamento dei fattori ideali e il teorema cinese dei resti
Strategia di Generazione a Due Fasi: Determinare prima il rango nel campo K, poi completare la struttura del modulo in OK, evitando complessità esponenziale
Tecnica della Pseudo-Base: Sfruttare la teoria strutturale dei domini di Dedekind per gestire il caso di domini non a ideali principali
Combinazione di Teoria Categorica e Algoritmi Concreti: Concretizzare il framework categorico astratto in algoritmi polinomiali implementabili
Teorema 2: Data una rappresentazione completa di OK, l'apprendimento esatto di automi ponderati su OK è risolvibile in tempo polinomiale rispetto ai seguenti parametri:
Dimensione dell'automa target
Logaritmo della lunghezza massima del controesempio
Quasi-Optimalità (Proposizione 10): Per un dominio di Dedekind R, se L è un linguaggio ponderato su R di rango n, allora esiste un automa ponderato su R con al massimo n+1 stati che calcola L
Limite Inferiore di Complessità (Proposizione 26): Determinare se un automa ponderato su OK è minimo in termini di stati è PIP-difficile
Estensione della Proprietà di Fatou (Corollario 16): I domini di Dedekind sono anelli quasi fortemente Fatou
Calcolo della pseudo-HNF: tempo polinomiale (Biasse-Fieker-Hofmann)
Lunghezza della catena strettamente crescente: limitata da Lemma 24 a log(N(d))
Operazioni su ideali: tempo polinomiale in CK
Questo articolo fornisce un contributo importante nel campo dell'informatica teorica, in particolare nell'intersezione tra l'apprendimento di automi e il calcolo algebrico. Sebbene la praticità rimanga da verificare, il suo valore teorico e il significato metodologico sono notevoli.