Learning Weighted Automata over Number Rings, Concretely and Categorically
Aristote, van Gool, PetriÅan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic
Aprendizaje de Autómatas Ponderados sobre Anillos Numéricos, Concreta y Categóricamente
Este artículo desarrolla un procedimiento de reducción de problemas de aprendizaje activo de propósito general. El método está inspirado en el trabajo reciente de Buna-Marginean et al. (2024), que propone una reducción en tiempo polinomial del problema de aprendizaje exacto de autómatas ponderados sobre enteros al problema de aprendizaje de autómatas ponderados sobre racionales. El procedimiento mejora la eficiencia de los algoritmos de aprendizaje de autómatas categóricos y plantea nuevas cuestiones sobre la complejidad de implementación cuando se instancia en categorías concretas. Como segunda contribución principal, los autores resuelven estos problemas de complejidad en el contexto concreto del aprendizaje de autómatas ponderados sobre anillos numéricos (anillos de enteros en cuerpos de números algebraicos). Asumiendo una representación completa del anillo numérico OK, se obtiene un algoritmo de aprendizaje exacto para autómatas ponderados sobre OK con complejidad en tiempo polinomial respecto al tamaño del autómata objetivo, el logaritmo de la longitud del contraejemplo más largo, el grado del cuerpo numérico y el logaritmo del discriminante. El autómata producido por el algoritmo tiene como máximo un estado más que el autómata mínimo, y se demuestra que mejorar esto requiere resolver el problema del ideal principal, cuyo mejor algoritmo conocido es de tiempo polinomial cuántico.
Aprendizaje Clásico de Autómatas: El algoritmo L* de Angluin aprende eficientemente autómatas finitos deterministas en el marco del maestro de enseñanza mínima suficiente (MAT), un resultado clásico de la teoría del aprendizaje computacional.
Desafíos en el Aprendizaje de Autómatas Ponderados: Extender algoritmos de aprendizaje a modelos más expresivos (como autómatas ponderados) presenta desafíos, particularmente cuando los pesos no están en un cuerpo sino en un anillo.
Limitaciones de Métodos Existentes:
Para autómatas ponderados sobre cuerpos, existen algoritmos de aprendizaje en tiempo polinomial
Para autómatas ponderados sobre anillos generales, los métodos existentes tienen complejidad excesiva o aplicabilidad limitada
Los métodos categóricos, aunque generales, pueden conducir a complejidad exponencial en implementaciones concretas
Necesidad Teórica: Se requiere un marco que mantenga la generalidad del método categórico y tenga complejidad polinomial en casos concretos
Aplicaciones Prácticas: Los anillos numéricos tienen aplicaciones importantes en criptografía, por lo que el aprendizaje eficiente de autómatas ponderados sobre estos anillos tiene valor práctico
Límites Teóricos: Explorar los límites teóricos de la minimización de autómatas ponderados, particularmente la generalización de la propiedad de Fatou
Algoritmo de Reducción General: Se propone el Algoritmo 3, un procedimiento de reducción general en el marco categórico que reduce una clase de problemas de aprendizaje a otra clase más manejable
Algoritmo Concreto sobre Anillos Numéricos: Se desarrolla el Algoritmo 4, un algoritmo de aprendizaje en tiempo polinomial especializado para autómatas ponderados sobre anillos numéricos OK
Resultados de Casi Optimalidad: Se demuestra que el autómata producido por el algoritmo tiene como máximo un estado más que el autómata mínimo (casi minimalidad)
Límites de Complejidad Teórica: Se demuestra que obtener un autómata completamente mínimo es equivalente a resolver el problema del ideal principal (PIP-difícil), estableciendo un límite inferior teórico del problema
Generalización de la Propiedad de Fatou: Se demuestra que los dominios de Dedekind son "anillos casi fuertemente Fatou", generalizando la propiedad clásica de Fatou
Entrada: Un lenguaje ponderado OK desconocido L: Σ* → OK (accesible mediante oráculo)
Salida: Un autómata ponderado OK que calcula L
Restricción: La complejidad del algoritmo es polinomial en el tamaño del autómata objetivo, el logaritmo de la longitud del contraejemplo más largo, el grado del cuerpo numérico y el logaritmo del discriminante
Idea del Algoritmo:
1. Aprender un autómata en la categoría "manejable" D
2. Establecer conexión mediante el funtor F: C → D
3. Usar el adjunto derecho G: D → C para devolver el resultado a la categoría objetivo C
Suposición Clave (Suposición 12):
F preserva ciertas clases de morfismos
F tiene adjunto derecho G
Los morfismos unitarios y coununitarios tienen propiedades específicas
Calcular una base B del espacio hacia atrás del autómata A
Conjugar A mediante la matriz B para obtener A'
Paso 2: Generación de Módulos Hacia Adelante
Invocar el Algoritmo 5 para calcular el conjunto generador del módulo OK hacia adelante de A'
Usar estrategia de dos fases:
- Primera fase: Encontrar palabras que aumentan el rango en K
- Segunda fase: Completar la generación del módulo en OK
Paso 3: Cálculo de Pseudobase
Usar forma normal pseudo-Hermite (pseudo-HNF) para calcular pseudobase del conjunto generador
Forma de pseudobase: {(ai, vi) | 1 ≤ i ≤ ℓ}, donde ai son ideales fraccionarios
Paso 4: Conjunto Generador Casi Mínimo
Convertir la pseudobase en conjunto generador de tamaño como máximo ℓ+1 mediante el Algoritmo 6
Usar refinamiento de factorización de ideales y teorema chino del residuo
Estrategia de Generación en Dos Fases: Primero determinar el rango en el cuerpo K, luego completar la estructura del módulo en el anillo OK, evitando complejidad exponencial
Técnica de Pseudobase: Utilizar la teoría de estructura de dominios de Dedekind para manejar dominios con ideales no principales mediante pseudobases
Integración de Teoría Categórica y Algoritmos Concretos: Concretizar el marco categórico abstracto en algoritmos polinomiales implementables
Teorema 2: Dada una representación completa de OK, el aprendizaje exacto de autómatas ponderados sobre OK es resoluble en tiempo polinomial en los siguientes parámetros:
Tamaño del autómata objetivo
Logaritmo de la longitud del contraejemplo más largo
Casi Optimalidad (Proposición 10): Para un dominio de Dedekind R, si L es un lenguaje ponderado R de rango n, entonces existe un autómata ponderado R que calcula L con como máximo n+1 estados
Límite Inferior de Complejidad (Proposición 26): Determinar si un autómata ponderado sobre OK es mínimo en estados es PIP-difícil
Generalización de la Propiedad de Fatou (Corolario 16): Los dominios de Dedekind son anillos casi fuertemente Fatou
Cálculo de pseudo-HNF: Tiempo polinomial (Biasse-Fieker-Hofmann)
Longitud de cadenas estrictamente crecientes: Acotada por Lemma 24 como log(N(d))
Operaciones de ideales: Tiempo polinomial en CK
Este artículo hace una contribución importante en el campo de la informática teórica, particularmente en la intersección del aprendizaje de autómatas y la computación algebraica. Aunque su practicidad requiere verificación, su valor teórico y significado metodológico son notables.