2025-11-19T16:52:14.243866

Learning Weighted Automata over Number Rings, Concretely and Categorically

Aristote, van Gool, PetriÅan et al.

We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.

academic

Apprendimento di Automi Ponderati su Anelli Numerici, Concretamente e Categoricamente

Informazioni Fondamentali

ID Articolo: 2504.16596
Titolo: Learning Weighted Automata over Number Rings, Concretely and Categorically
Autori: Quentin Aristote, Sam van Gool, Daniela Petrişan, Mahsa Shirmohammadi
Classificazione: cs.FL (Formal Languages and Automata Theory)
Data di Pubblicazione: 23 aprile 2025 (preprint arXiv)
Link Articolo: https://arxiv.org/abs/2504.16596

Riassunto

Questo articolo sviluppa una procedura di riduzione generale per problemi di apprendimento attivo. L'approccio è ispirato dal recente lavoro di Buna-Marginean et al. (2024), che ha ridotto in tempo polinomiale il problema dell'apprendimento esatto di automi ponderati su interi al problema dell'apprendimento di automi ponderati su razionali. La procedura migliora l'efficienza degli algoritmi di apprendimento di automi categorici e pone nuove questioni sulla complessità di implementazione quando istanziata in categorie concrete. Come secondo contributo principale, gli autori affrontano questi problemi di complessità nel contesto concreto dell'apprendimento di automi ponderati su anelli numerici (anelli di interi in campi di numeri algebrici). Assumendo una rappresentazione completa dell'anello numerico OK, viene ottenuto un algoritmo di apprendimento esatto per automi ponderati su OK con complessità temporale polinomiale rispetto alla dimensione dell'automa target, al logaritmo della lunghezza massima del controesempio, al grado del campo numerico e al logaritmo del discriminante. L'automa prodotto dall'algoritmo ha al massimo uno stato in più rispetto all'automa minimo, e si dimostra che fare meglio richiede risolvere il problema dell'ideale principale, per il quale l'algoritmo migliore noto è in tempo polinomiale quantistico.

Contesto di Ricerca e Motivazione

Contesto del Problema

Apprendimento Classico di Automi: L'algoritmo L* di Angluin apprende efficientemente automi a stati finiti deterministici nel framework del maestro minimo sufficiente (MAT), un risultato classico della teoria dell'apprendimento computazionale.
Sfide nell'Apprendimento di Automi Ponderati: L'estensione degli algoritmi di apprendimento a modelli più espressivi (come gli automi ponderati) presenta sfide, in particolare quando i pesi non appartengono a un campo ma a un anello.
Limitazioni dei Metodi Esistenti:
- Per automi ponderati su campi, esistono algoritmi di apprendimento in tempo polinomiale
- Per automi ponderati su anelli generali, i metodi esistenti hanno complessità eccessiva o applicabilità limitata
- I metodi categorici, sebbene generali, possono portare a complessità esponenziale nell'implementazione concreta

Motivazione della Ricerca

Necessità Teorica: È necessario un framework che mantenga la generalità dell'approccio categorico e al contempo abbia complessità polinomiale nei casi concreti
Applicazioni Pratiche: Gli anelli numerici hanno importanti applicazioni in crittografia, rendendo l'apprendimento efficiente di automi ponderati su di essi di valore pratico
Confini Teorici: Esplorare i limiti teorici della minimizzazione di automi ponderati, in particolare l'estensione della proprietà di Fatou

Contributi Principali

Algoritmo di Riduzione Generale: Propone l'Algoritmo 3, una procedura di riduzione generale nel framework categorico che riduce una classe di problemi di apprendimento a un'altra classe più trattabile
Algoritmo Concreto su Anelli Numerici: Sviluppa l'Algoritmo 4, un algoritmo di apprendimento in tempo polinomiale specificamente per automi ponderati su anelli numerici OK
Risultati di Quasi-Optimalità: Dimostra che l'automa prodotto dall'algoritmo ha al massimo uno stato in più rispetto all'automa minimo (quasi-minimalità)
Confini di Complessità Teorica: Dimostra che ottenere un automa completamente minimo è equivalente a risolvere il problema dell'ideale principale (PIP-hard), stabilendo un limite inferiore teorico
Estensione della Proprietà di Fatou: Dimostra che i domini di Dedekind sono "anelli quasi fortemente Fatou", estendendo la proprietà classica di Fatou

Spiegazione Dettagliata dei Metodi

Definizione del Compito

Input: Un linguaggio ponderato OK sconosciuto L: Σ* → OK (accessibile tramite oracolo) Output: Un automa ponderato OK che calcola L Vincoli: La complessità dell'algoritmo è polinomiale rispetto alla dimensione dell'automa target, al logaritmo della lunghezza massima del controesempio, al grado del campo numerico e al logaritmo del discriminante

Framework Tecnico Principale

1. Fondamenti Categorici

L'articolo adotta una prospettiva funtoriale, visualizzando gli automi come funtori A: I → C, dove:

I è la categoria libera generata dall'alfabeto Σ
C è la categoria di output (come la categoria dei moduli ModR)

2. Algoritmo di Riduzione Generale (Algoritmo 3)

Idea dell'Algoritmo:
1. Apprendere l'automa nella categoria "trattabile" D
2. Stabilire una connessione tramite il funtore F: C → D
3. Utilizzare l'aggiunto destro G: D → C per riportare il risultato 
   nella categoria target C

Assunzione Chiave (Assunzione 12):

F preserva certe classi di morfismi
F ha un aggiunto destro G
I morfismi unitari e counità hanno proprietà specifiche

3. Implementazione Concreta su Anelli Numerici (Algoritmo 4)

Passo 1: Coniugazione Posteriore

Calcolare una base B dello spazio posteriore dell'automa A
Coniugare A tramite la matrice B per ottenere A'

Passo 2: Generazione del Modulo Anteriore

Invocare l'Algoritmo 5 per calcolare l'insieme generatore del modulo 
OK anteriore di A'
Utilizzare una strategia a due fasi:
- Prima fase: trovare parole che aumentano il rango in K
- Seconda fase: completare la generazione del modulo in OK

Passo 3: Calcolo della Pseudo-Base

Utilizzare la forma pseudo-Hermite normale (pseudo-HNF) per calcolare 
la pseudo-base dall'insieme generatore
Forma della pseudo-base: {(ai, vi) | 1 ≤ i ≤ ℓ}, dove ai sono ideali frazionari

Passo 4: Insieme Generatore Quasi-Minimo

Convertire la pseudo-base in un insieme generatore di dimensione al massimo ℓ+1 
tramite l'Algoritmo 6
Utilizzare il raffinamento dei fattori ideali e il teorema cinese dei resti

Punti di Innovazione Tecnica

Strategia di Generazione a Due Fasi: Determinare prima il rango nel campo K, poi completare la struttura del modulo in OK, evitando complessità esponenziale
Tecnica della Pseudo-Base: Sfruttare la teoria strutturale dei domini di Dedekind per gestire il caso di domini non a ideali principali
Combinazione di Teoria Categorica e Algoritmi Concreti: Concretizzare il framework categorico astratto in algoritmi polinomiali implementabili

Configurazione Sperimentale

Verifica Teorica

L'articolo è principalmente un lavoro teorico, verificato attraverso:

Analisi di Complessità: Analisi dettagliata della complessità temporale degli Algoritmi 4 e 5
Prove di Correttezza: Tramite il Teorema 18 si dimostra la correttezza dell'algoritmo generale
Verifica con Esempi: Fornisce esempi concreti (come l'Esempio 1) che illustrano il caso su Zi√5

Limiti di Complessità

Teorema 2: Data una rappresentazione completa di OK, l'apprendimento esatto di automi ponderati su OK è risolvibile in tempo polinomiale rispetto ai seguenti parametri:

Dimensione dell'automa target
Logaritmo della lunghezza massima del controesempio
Grado del campo numerico d
Logaritmo del discriminante ΔK

Risultati Sperimentali

Risultati Teorici Principali

Quasi-Optimalità (Proposizione 10): Per un dominio di Dedekind R, se L è un linguaggio ponderato su R di rango n, allora esiste un automa ponderato su R con al massimo n+1 stati che calcola L
Limite Inferiore di Complessità (Proposizione 26): Determinare se un automa ponderato su OK è minimo in termini di stati è PIP-difficile
Estensione della Proprietà di Fatou (Corollario 16): I domini di Dedekind sono anelli quasi fortemente Fatou

Analisi di Esempi Concreti

Esempio 1: Nell'anello numerico R = Zi√5:

Costruzione di un automa ponderato su R con 3 stati
Esistenza di un automa ponderato su K equivalente con 2 stati (K = Q(i√5))
Illustra che la proprietà fortemente Fatou non sempre vale, ma la proprietà quasi fortemente Fatou sì

Lavori Correlati

Apprendimento Classico di Automi

Algoritmo L* di Angluin: apprendimento polinomiale di automi a stati finiti deterministici
Beimel et al.: algoritmi di apprendimento per automi ponderati su campi

Automi Ponderati su Anelli

van Heerdt et al.: apprendimento su domini a ideali principali, ma senza limiti di complessità
Buna-Marginean et al.: riduzione da Z a Q, ispirazione diretta di questo lavoro

Metodi Categorici

Colcombet-Petrişan: approccio funtoriale alla minimizzazione di automi
Urbat-Schröder et al.: metodi algebrici per l'apprendimento

Conclusioni e Discussione

Conclusioni Principali

Sviluppo del primo algoritmo in tempo polinomiale per l'apprendimento di automi ponderati su anelli numerici
Dimostrazione della difficoltà di ottenere automi completamente minimi (PIP-hard)
Stabilimento di un ponte tra la teoria categorica e gli algoritmi concreti

Limitazioni

Requisiti di Rappresentazione: Necessità di una "rappresentazione completa" di OK, che potrebbe essere difficile da ottenere in pratica
Quasi-Optimalità: L'automa prodotto dall'algoritmo potrebbe avere uno stato in più rispetto al minimo
Strutture Specifiche: Il metodo è specificamente per domini di Dedekind, l'estensione a anelli generali non è chiara

Direzioni Future

Altre Classi di Anelli: Ricerca di estensioni a campi non-Dedekind
Implementazione Pratica: Sviluppo di implementazioni software concrete e verifica sperimentale
Esplorazione di Applicazioni: Applicazioni concrete in crittografia e altri campi

Valutazione Approfondita

Punti di Forza

Profondità Teorica: Combinazione abile di teoria categorica, teoria algebrica dei numeri e complessità computazionale
Innovazione Tecnica: L'uso della strategia di apprendimento a due fasi e della tecnica della pseudo-base è molto creativo
Completezza: Fornisce sia l'algoritmo che i limiti inferiori, offrendo un quadro completo del problema
Rigore: Dimostrazioni matematiche rigorose e analisi di complessità dettagliata

Punti Deboli

Praticità: Mancanza di implementazione pratica e verifica sperimentale
Leggibilità: La parte sulla teoria categorica potrebbe essere difficile da comprendere per i non specialisti
Ambito di Applicabilità: L'applicabilità del metodo è limitata a strutture algebriche specifiche

Impatto

Contributo Teorico: Contributo significativo alla teoria dell'apprendimento di automi ponderati
Metodologia: Dimostra come concretizzare metodi categorici astratti
Interdisciplinarità: Connette la teoria degli automi, la teoria algebrica dei numeri e la complessità computazionale

Scenari di Applicazione

Crittografia: Applicazioni degli anelli numerici nella crittografia su reticoli
Calcolo Simbolico: Problemi computazionali su campi di numeri algebrici
Ricerca Teorica: Fornisce fondamenti per ulteriori ricerche sull'apprendimento di automi

Dettagli Tecnici Supplementari

Rappresentazione di Anelli Numerici

L'articolo richiede una "rappresentazione completa" di OK che include:

Base integrale Ω = {ω1,...,ωd}
Elemento primitivo θ e suo polinomio minimo
Misura di complessità CK = d⁴(log d + log ΔK)

Complessità dell'Algoritmo

I limiti di complessità chiave derivano da:

Calcolo della pseudo-HNF: tempo polinomiale (Biasse-Fieker-Hofmann)
Lunghezza della catena strettamente crescente: limitata da Lemma 24 a log(N(d))
Operazioni su ideali: tempo polinomiale in CK

Questo articolo fornisce un contributo importante nel campo dell'informatica teorica, in particolare nell'intersezione tra l'apprendimento di automi e il calcolo algebrico. Sebbene la praticità rimanga da verificare, il suo valore teorico e il significato metodologico sono notevoli.