2025-11-19T16:52:14.243866

Learning Weighted Automata over Number Rings, Concretely and Categorically

Aristote, van Gool, PetriÅan et al.

We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.

academic

Aprendizaje de Autómatas Ponderados sobre Anillos Numéricos, Concreta y Categóricamente

Información Básica

ID del Artículo: 2504.16596
Título: Learning Weighted Automata over Number Rings, Concretely and Categorically
Autores: Quentin Aristote, Sam van Gool, Daniela Petrişan, Mahsa Shirmohammadi
Clasificación: cs.FL (Teoría de Lenguajes Formales y Autómatas)
Fecha de Publicación: 23 de abril de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2504.16596

Resumen

Este artículo desarrolla un procedimiento de reducción de problemas de aprendizaje activo de propósito general. El método está inspirado en el trabajo reciente de Buna-Marginean et al. (2024), que propone una reducción en tiempo polinomial del problema de aprendizaje exacto de autómatas ponderados sobre enteros al problema de aprendizaje de autómatas ponderados sobre racionales. El procedimiento mejora la eficiencia de los algoritmos de aprendizaje de autómatas categóricos y plantea nuevas cuestiones sobre la complejidad de implementación cuando se instancia en categorías concretas. Como segunda contribución principal, los autores resuelven estos problemas de complejidad en el contexto concreto del aprendizaje de autómatas ponderados sobre anillos numéricos (anillos de enteros en cuerpos de números algebraicos). Asumiendo una representación completa del anillo numérico OK, se obtiene un algoritmo de aprendizaje exacto para autómatas ponderados sobre OK con complejidad en tiempo polinomial respecto al tamaño del autómata objetivo, el logaritmo de la longitud del contraejemplo más largo, el grado del cuerpo numérico y el logaritmo del discriminante. El autómata producido por el algoritmo tiene como máximo un estado más que el autómata mínimo, y se demuestra que mejorar esto requiere resolver el problema del ideal principal, cuyo mejor algoritmo conocido es de tiempo polinomial cuántico.

Contexto de Investigación y Motivación

Contexto del Problema

Aprendizaje Clásico de Autómatas: El algoritmo L* de Angluin aprende eficientemente autómatas finitos deterministas en el marco del maestro de enseñanza mínima suficiente (MAT), un resultado clásico de la teoría del aprendizaje computacional.
Desafíos en el Aprendizaje de Autómatas Ponderados: Extender algoritmos de aprendizaje a modelos más expresivos (como autómatas ponderados) presenta desafíos, particularmente cuando los pesos no están en un cuerpo sino en un anillo.
Limitaciones de Métodos Existentes:
- Para autómatas ponderados sobre cuerpos, existen algoritmos de aprendizaje en tiempo polinomial
- Para autómatas ponderados sobre anillos generales, los métodos existentes tienen complejidad excesiva o aplicabilidad limitada
- Los métodos categóricos, aunque generales, pueden conducir a complejidad exponencial en implementaciones concretas

Motivación de la Investigación

Necesidad Teórica: Se requiere un marco que mantenga la generalidad del método categórico y tenga complejidad polinomial en casos concretos
Aplicaciones Prácticas: Los anillos numéricos tienen aplicaciones importantes en criptografía, por lo que el aprendizaje eficiente de autómatas ponderados sobre estos anillos tiene valor práctico
Límites Teóricos: Explorar los límites teóricos de la minimización de autómatas ponderados, particularmente la generalización de la propiedad de Fatou

Contribuciones Principales

Algoritmo de Reducción General: Se propone el Algoritmo 3, un procedimiento de reducción general en el marco categórico que reduce una clase de problemas de aprendizaje a otra clase más manejable
Algoritmo Concreto sobre Anillos Numéricos: Se desarrolla el Algoritmo 4, un algoritmo de aprendizaje en tiempo polinomial especializado para autómatas ponderados sobre anillos numéricos OK
Resultados de Casi Optimalidad: Se demuestra que el autómata producido por el algoritmo tiene como máximo un estado más que el autómata mínimo (casi minimalidad)
Límites de Complejidad Teórica: Se demuestra que obtener un autómata completamente mínimo es equivalente a resolver el problema del ideal principal (PIP-difícil), estableciendo un límite inferior teórico del problema
Generalización de la Propiedad de Fatou: Se demuestra que los dominios de Dedekind son "anillos casi fuertemente Fatou", generalizando la propiedad clásica de Fatou

Explicación Detallada de Métodos

Definición de la Tarea

Entrada: Un lenguaje ponderado OK desconocido L: Σ* → OK (accesible mediante oráculo) Salida: Un autómata ponderado OK que calcula L Restricción: La complejidad del algoritmo es polinomial en el tamaño del autómata objetivo, el logaritmo de la longitud del contraejemplo más largo, el grado del cuerpo numérico y el logaritmo del discriminante

Marco Técnico Principal

1. Fundamentos Categóricos

El artículo adopta una perspectiva de funtores, viendo autómatas como funtores A: I → C, donde:

I es la categoría libre generada por el alfabeto Σ
C es la categoría de salida (como la categoría de módulos ModR)

2. Algoritmo de Reducción General (Algoritmo 3)

Idea del Algoritmo:
1. Aprender un autómata en la categoría "manejable" D
2. Establecer conexión mediante el funtor F: C → D
3. Usar el adjunto derecho G: D → C para devolver el resultado a la categoría objetivo C

Suposición Clave (Suposición 12):

F preserva ciertas clases de morfismos
F tiene adjunto derecho G
Los morfismos unitarios y coununitarios tienen propiedades específicas

3. Implementación Concreta sobre Anillos Numéricos (Algoritmo 4)

Paso 1: Conjugación Hacia Atrás

Calcular una base B del espacio hacia atrás del autómata A
Conjugar A mediante la matriz B para obtener A'

Paso 2: Generación de Módulos Hacia Adelante

Invocar el Algoritmo 5 para calcular el conjunto generador del módulo OK hacia adelante de A'
Usar estrategia de dos fases:
- Primera fase: Encontrar palabras que aumentan el rango en K
- Segunda fase: Completar la generación del módulo en OK

Paso 3: Cálculo de Pseudobase

Usar forma normal pseudo-Hermite (pseudo-HNF) para calcular pseudobase del conjunto generador
Forma de pseudobase: {(ai, vi) | 1 ≤ i ≤ ℓ}, donde ai son ideales fraccionarios

Paso 4: Conjunto Generador Casi Mínimo

Convertir la pseudobase en conjunto generador de tamaño como máximo ℓ+1 mediante el Algoritmo 6
Usar refinamiento de factorización de ideales y teorema chino del residuo

Puntos de Innovación Técnica

Estrategia de Generación en Dos Fases: Primero determinar el rango en el cuerpo K, luego completar la estructura del módulo en el anillo OK, evitando complejidad exponencial
Técnica de Pseudobase: Utilizar la teoría de estructura de dominios de Dedekind para manejar dominios con ideales no principales mediante pseudobases
Integración de Teoría Categórica y Algoritmos Concretos: Concretizar el marco categórico abstracto en algoritmos polinomiales implementables

Configuración Experimental

Verificación Teórica

El artículo es principalmente un trabajo teórico, verificado mediante:

Análisis de Complejidad: Análisis detallado de la complejidad temporal de los Algoritmos 4 y 5
Pruebas de Corrección: Mediante el Teorema 18 se demuestra la corrección del algoritmo general
Verificación de Ejemplos: Se proporcionan ejemplos concretos (como el Ejemplo 1) ilustrando la situación en Zi√5

Límites de Complejidad

Teorema 2: Dada una representación completa de OK, el aprendizaje exacto de autómatas ponderados sobre OK es resoluble en tiempo polinomial en los siguientes parámetros:

Tamaño del autómata objetivo
Logaritmo de la longitud del contraejemplo más largo
Grado d del cuerpo numérico
Logaritmo del discriminante ΔK

Resultados Experimentales

Resultados Teóricos Principales

Casi Optimalidad (Proposición 10): Para un dominio de Dedekind R, si L es un lenguaje ponderado R de rango n, entonces existe un autómata ponderado R que calcula L con como máximo n+1 estados
Límite Inferior de Complejidad (Proposición 26): Determinar si un autómata ponderado sobre OK es mínimo en estados es PIP-difícil
Generalización de la Propiedad de Fatou (Corolario 16): Los dominios de Dedekind son anillos casi fuertemente Fatou

Análisis de Ejemplos Concretos

Ejemplo 1: En el anillo numérico R = Zi√5:

Se construye un autómata ponderado R de 3 estados
Existe un autómata ponderado K equivalente de 2 estados (K = Q(i√5))
Ilustra que la propiedad fuertemente Fatou no siempre se cumple, pero la propiedad casi fuertemente Fatou sí

Trabajo Relacionado

Aprendizaje Clásico de Autómatas

Algoritmo L* de Angluin: Aprendizaje polinomial de autómatas finitos deterministas
Beimel et al.: Algoritmos de aprendizaje para autómatas ponderados sobre cuerpos

Autómatas Ponderados sobre Anillos

van Heerdt et al.: Aprendizaje sobre dominios de ideales principales, pero sin límites de complejidad
Buna-Marginean et al.: Reducción de Z a Q, inspiración directa de este trabajo

Métodos Categóricos

Colcombet-Petrişan: Enfoque funtorial para minimización de autómatas
Urbat-Schröder et al.: Métodos algebraicos para aprendizaje

Conclusiones y Discusión

Conclusiones Principales

Se desarrolló el primer algoritmo en tiempo polinomial para aprendizaje de autómatas ponderados sobre anillos numéricos
Se demostró la dificultad de obtener autómatas completamente mínimos (PIP-difícil)
Se estableció un puente entre la teoría categórica y los algoritmos concretos

Limitaciones

Requisitos de Representación: Se requiere una "representación completa" del anillo OK, lo que puede ser difícil de obtener en la práctica
Casi Optimalidad: El autómata producido por el algoritmo puede tener un estado más que el mínimo
Estructura Específica: El método está especializado para dominios de Dedekind, y la generalización a anillos generales no es clara

Direcciones Futuras

Otras Clases de Anillos: Investigar generalizaciones a cuerpos no-Dedekind
Implementación Práctica: Desarrollar implementaciones de software concretas y verificación experimental
Exploración de Aplicaciones: Aplicaciones concretas en criptografía y otros campos

Evaluación Profunda

Fortalezas

Profundidad Teórica: Combinación ingeniosa de teoría categórica, teoría de números algebraicos y teoría de complejidad computacional
Innovación Técnica: El uso de la estrategia de aprendizaje en dos fases y la técnica de pseudobase es muy creativo
Completitud: Proporciona tanto el algoritmo como pruebas de límites inferiores, ofreciendo una imagen completa del problema
Rigor: Las pruebas matemáticas son rigurosas y el análisis de complejidad es detallado

Deficiencias

Practicidad: Carece de implementación práctica y verificación experimental
Legibilidad: Para no especialistas, la parte de teoría categórica puede ser difícil de entender
Rango de Aplicabilidad: La aplicabilidad del método está limitada a estructuras algebraicas específicas

Impacto

Contribución Teórica: Hace una contribución importante a la teoría del aprendizaje de autómatas ponderados
Metodología: Demuestra cómo concretizar métodos categóricos abstractos
Interdisciplinariedad: Conecta teoría de autómatas, teoría de números algebraicos y complejidad computacional

Escenarios de Aplicación

Criptografía: Aplicaciones de anillos numéricos en criptografía de retículos
Computación Simbólica: Problemas computacionales sobre cuerpos de números algebraicos
Investigación Teórica: Proporciona base para investigación futura en aprendizaje de autómatas

Detalles Técnicos Adicionales

Representación de Anillos Numéricos

El artículo requiere una "representación completa" de OK que incluya:

Base integral Ω = {ω1,...,ωd}
Elemento primitivo θ y su polinomio mínimo
Medida de complejidad CK = d⁴(log d + log ΔK)

Complejidad del Algoritmo

Los límites de complejidad clave provienen de:

Cálculo de pseudo-HNF: Tiempo polinomial (Biasse-Fieker-Hofmann)
Longitud de cadenas estrictamente crecientes: Acotada por Lemma 24 como log(N(d))
Operaciones de ideales: Tiempo polinomial en CK

Este artículo hace una contribución importante en el campo de la informática teórica, particularmente en la intersección del aprendizaje de autómatas y la computación algebraica. Aunque su practicidad requiere verificación, su valor teórico y significado metodológico son notables.