2025-11-19T16:52:14.243866

Learning Weighted Automata over Number Rings, Concretely and Categorically

Aristote, van Gool, Petrişan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic

Aprendizaje de Autómatas Ponderados sobre Anillos Numéricos, Concreta y Categóricamente

Información Básica

  • ID del Artículo: 2504.16596
  • Título: Learning Weighted Automata over Number Rings, Concretely and Categorically
  • Autores: Quentin Aristote, Sam van Gool, Daniela Petrişan, Mahsa Shirmohammadi
  • Clasificación: cs.FL (Teoría de Lenguajes Formales y Autómatas)
  • Fecha de Publicación: 23 de abril de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2504.16596

Resumen

Este artículo desarrolla un procedimiento de reducción de problemas de aprendizaje activo de propósito general. El método está inspirado en el trabajo reciente de Buna-Marginean et al. (2024), que propone una reducción en tiempo polinomial del problema de aprendizaje exacto de autómatas ponderados sobre enteros al problema de aprendizaje de autómatas ponderados sobre racionales. El procedimiento mejora la eficiencia de los algoritmos de aprendizaje de autómatas categóricos y plantea nuevas cuestiones sobre la complejidad de implementación cuando se instancia en categorías concretas. Como segunda contribución principal, los autores resuelven estos problemas de complejidad en el contexto concreto del aprendizaje de autómatas ponderados sobre anillos numéricos (anillos de enteros en cuerpos de números algebraicos). Asumiendo una representación completa del anillo numérico OK, se obtiene un algoritmo de aprendizaje exacto para autómatas ponderados sobre OK con complejidad en tiempo polinomial respecto al tamaño del autómata objetivo, el logaritmo de la longitud del contraejemplo más largo, el grado del cuerpo numérico y el logaritmo del discriminante. El autómata producido por el algoritmo tiene como máximo un estado más que el autómata mínimo, y se demuestra que mejorar esto requiere resolver el problema del ideal principal, cuyo mejor algoritmo conocido es de tiempo polinomial cuántico.

Contexto de Investigación y Motivación

Contexto del Problema

  1. Aprendizaje Clásico de Autómatas: El algoritmo L* de Angluin aprende eficientemente autómatas finitos deterministas en el marco del maestro de enseñanza mínima suficiente (MAT), un resultado clásico de la teoría del aprendizaje computacional.
  2. Desafíos en el Aprendizaje de Autómatas Ponderados: Extender algoritmos de aprendizaje a modelos más expresivos (como autómatas ponderados) presenta desafíos, particularmente cuando los pesos no están en un cuerpo sino en un anillo.
  3. Limitaciones de Métodos Existentes:
    • Para autómatas ponderados sobre cuerpos, existen algoritmos de aprendizaje en tiempo polinomial
    • Para autómatas ponderados sobre anillos generales, los métodos existentes tienen complejidad excesiva o aplicabilidad limitada
    • Los métodos categóricos, aunque generales, pueden conducir a complejidad exponencial en implementaciones concretas

Motivación de la Investigación

  1. Necesidad Teórica: Se requiere un marco que mantenga la generalidad del método categórico y tenga complejidad polinomial en casos concretos
  2. Aplicaciones Prácticas: Los anillos numéricos tienen aplicaciones importantes en criptografía, por lo que el aprendizaje eficiente de autómatas ponderados sobre estos anillos tiene valor práctico
  3. Límites Teóricos: Explorar los límites teóricos de la minimización de autómatas ponderados, particularmente la generalización de la propiedad de Fatou

Contribuciones Principales

  1. Algoritmo de Reducción General: Se propone el Algoritmo 3, un procedimiento de reducción general en el marco categórico que reduce una clase de problemas de aprendizaje a otra clase más manejable
  2. Algoritmo Concreto sobre Anillos Numéricos: Se desarrolla el Algoritmo 4, un algoritmo de aprendizaje en tiempo polinomial especializado para autómatas ponderados sobre anillos numéricos OK
  3. Resultados de Casi Optimalidad: Se demuestra que el autómata producido por el algoritmo tiene como máximo un estado más que el autómata mínimo (casi minimalidad)
  4. Límites de Complejidad Teórica: Se demuestra que obtener un autómata completamente mínimo es equivalente a resolver el problema del ideal principal (PIP-difícil), estableciendo un límite inferior teórico del problema
  5. Generalización de la Propiedad de Fatou: Se demuestra que los dominios de Dedekind son "anillos casi fuertemente Fatou", generalizando la propiedad clásica de Fatou

Explicación Detallada de Métodos

Definición de la Tarea

Entrada: Un lenguaje ponderado OK desconocido L: Σ* → OK (accesible mediante oráculo) Salida: Un autómata ponderado OK que calcula L Restricción: La complejidad del algoritmo es polinomial en el tamaño del autómata objetivo, el logaritmo de la longitud del contraejemplo más largo, el grado del cuerpo numérico y el logaritmo del discriminante

Marco Técnico Principal

1. Fundamentos Categóricos

El artículo adopta una perspectiva de funtores, viendo autómatas como funtores A: I → C, donde:

  • I es la categoría libre generada por el alfabeto Σ
  • C es la categoría de salida (como la categoría de módulos ModR)

2. Algoritmo de Reducción General (Algoritmo 3)

Idea del Algoritmo:
1. Aprender un autómata en la categoría "manejable" D
2. Establecer conexión mediante el funtor F: C → D
3. Usar el adjunto derecho G: D → C para devolver el resultado a la categoría objetivo C

Suposición Clave (Suposición 12):

  • F preserva ciertas clases de morfismos
  • F tiene adjunto derecho G
  • Los morfismos unitarios y coununitarios tienen propiedades específicas

3. Implementación Concreta sobre Anillos Numéricos (Algoritmo 4)

Paso 1: Conjugación Hacia Atrás

Calcular una base B del espacio hacia atrás del autómata A
Conjugar A mediante la matriz B para obtener A'

Paso 2: Generación de Módulos Hacia Adelante

Invocar el Algoritmo 5 para calcular el conjunto generador del módulo OK hacia adelante de A'
Usar estrategia de dos fases:
- Primera fase: Encontrar palabras que aumentan el rango en K
- Segunda fase: Completar la generación del módulo en OK

Paso 3: Cálculo de Pseudobase

Usar forma normal pseudo-Hermite (pseudo-HNF) para calcular pseudobase del conjunto generador
Forma de pseudobase: {(ai, vi) | 1 ≤ i ≤ ℓ}, donde ai son ideales fraccionarios

Paso 4: Conjunto Generador Casi Mínimo

Convertir la pseudobase en conjunto generador de tamaño como máximo ℓ+1 mediante el Algoritmo 6
Usar refinamiento de factorización de ideales y teorema chino del residuo

Puntos de Innovación Técnica

  1. Estrategia de Generación en Dos Fases: Primero determinar el rango en el cuerpo K, luego completar la estructura del módulo en el anillo OK, evitando complejidad exponencial
  2. Técnica de Pseudobase: Utilizar la teoría de estructura de dominios de Dedekind para manejar dominios con ideales no principales mediante pseudobases
  3. Integración de Teoría Categórica y Algoritmos Concretos: Concretizar el marco categórico abstracto en algoritmos polinomiales implementables

Configuración Experimental

Verificación Teórica

El artículo es principalmente un trabajo teórico, verificado mediante:

  1. Análisis de Complejidad: Análisis detallado de la complejidad temporal de los Algoritmos 4 y 5
  2. Pruebas de Corrección: Mediante el Teorema 18 se demuestra la corrección del algoritmo general
  3. Verificación de Ejemplos: Se proporcionan ejemplos concretos (como el Ejemplo 1) ilustrando la situación en Zi√5

Límites de Complejidad

Teorema 2: Dada una representación completa de OK, el aprendizaje exacto de autómatas ponderados sobre OK es resoluble en tiempo polinomial en los siguientes parámetros:

  • Tamaño del autómata objetivo
  • Logaritmo de la longitud del contraejemplo más largo
  • Grado d del cuerpo numérico
  • Logaritmo del discriminante ΔK

Resultados Experimentales

Resultados Teóricos Principales

  1. Casi Optimalidad (Proposición 10): Para un dominio de Dedekind R, si L es un lenguaje ponderado R de rango n, entonces existe un autómata ponderado R que calcula L con como máximo n+1 estados
  2. Límite Inferior de Complejidad (Proposición 26): Determinar si un autómata ponderado sobre OK es mínimo en estados es PIP-difícil
  3. Generalización de la Propiedad de Fatou (Corolario 16): Los dominios de Dedekind son anillos casi fuertemente Fatou

Análisis de Ejemplos Concretos

Ejemplo 1: En el anillo numérico R = Zi√5:

  • Se construye un autómata ponderado R de 3 estados
  • Existe un autómata ponderado K equivalente de 2 estados (K = Q(i√5))
  • Ilustra que la propiedad fuertemente Fatou no siempre se cumple, pero la propiedad casi fuertemente Fatou sí

Trabajo Relacionado

Aprendizaje Clásico de Autómatas

  • Algoritmo L* de Angluin: Aprendizaje polinomial de autómatas finitos deterministas
  • Beimel et al.: Algoritmos de aprendizaje para autómatas ponderados sobre cuerpos

Autómatas Ponderados sobre Anillos

  • van Heerdt et al.: Aprendizaje sobre dominios de ideales principales, pero sin límites de complejidad
  • Buna-Marginean et al.: Reducción de Z a Q, inspiración directa de este trabajo

Métodos Categóricos

  • Colcombet-Petrişan: Enfoque funtorial para minimización de autómatas
  • Urbat-Schröder et al.: Métodos algebraicos para aprendizaje

Conclusiones y Discusión

Conclusiones Principales

  1. Se desarrolló el primer algoritmo en tiempo polinomial para aprendizaje de autómatas ponderados sobre anillos numéricos
  2. Se demostró la dificultad de obtener autómatas completamente mínimos (PIP-difícil)
  3. Se estableció un puente entre la teoría categórica y los algoritmos concretos

Limitaciones

  1. Requisitos de Representación: Se requiere una "representación completa" del anillo OK, lo que puede ser difícil de obtener en la práctica
  2. Casi Optimalidad: El autómata producido por el algoritmo puede tener un estado más que el mínimo
  3. Estructura Específica: El método está especializado para dominios de Dedekind, y la generalización a anillos generales no es clara

Direcciones Futuras

  1. Otras Clases de Anillos: Investigar generalizaciones a cuerpos no-Dedekind
  2. Implementación Práctica: Desarrollar implementaciones de software concretas y verificación experimental
  3. Exploración de Aplicaciones: Aplicaciones concretas en criptografía y otros campos

Evaluación Profunda

Fortalezas

  1. Profundidad Teórica: Combinación ingeniosa de teoría categórica, teoría de números algebraicos y teoría de complejidad computacional
  2. Innovación Técnica: El uso de la estrategia de aprendizaje en dos fases y la técnica de pseudobase es muy creativo
  3. Completitud: Proporciona tanto el algoritmo como pruebas de límites inferiores, ofreciendo una imagen completa del problema
  4. Rigor: Las pruebas matemáticas son rigurosas y el análisis de complejidad es detallado

Deficiencias

  1. Practicidad: Carece de implementación práctica y verificación experimental
  2. Legibilidad: Para no especialistas, la parte de teoría categórica puede ser difícil de entender
  3. Rango de Aplicabilidad: La aplicabilidad del método está limitada a estructuras algebraicas específicas

Impacto

  1. Contribución Teórica: Hace una contribución importante a la teoría del aprendizaje de autómatas ponderados
  2. Metodología: Demuestra cómo concretizar métodos categóricos abstractos
  3. Interdisciplinariedad: Conecta teoría de autómatas, teoría de números algebraicos y complejidad computacional

Escenarios de Aplicación

  1. Criptografía: Aplicaciones de anillos numéricos en criptografía de retículos
  2. Computación Simbólica: Problemas computacionales sobre cuerpos de números algebraicos
  3. Investigación Teórica: Proporciona base para investigación futura en aprendizaje de autómatas

Detalles Técnicos Adicionales

Representación de Anillos Numéricos

El artículo requiere una "representación completa" de OK que incluya:

  • Base integral Ω = {ω1,...,ωd}
  • Elemento primitivo θ y su polinomio mínimo
  • Medida de complejidad CK = d⁴(log d + log ΔK)

Complejidad del Algoritmo

Los límites de complejidad clave provienen de:

  • Cálculo de pseudo-HNF: Tiempo polinomial (Biasse-Fieker-Hofmann)
  • Longitud de cadenas estrictamente crecientes: Acotada por Lemma 24 como log(N(d))
  • Operaciones de ideales: Tiempo polinomial en CK

Este artículo hace una contribución importante en el campo de la informática teórica, particularmente en la intersección del aprendizaje de autómatas y la computación algebraica. Aunque su practicidad requiere verificación, su valor teórico y significado metodológico son notables.