2025-11-19T16:52:14.243866

Learning Weighted Automata over Number Rings, Concretely and Categorically

Aristote, van Gool, Petrişan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic

Обучение взвешенным автоматам над кольцами чисел: конкретно и категорически

Основная информация

  • ID статьи: 2504.16596
  • Название: Learning Weighted Automata over Number Rings, Concretely and Categorically
  • Авторы: Quentin Aristote, Sam van Gool, Daniela Petrişan, Mahsa Shirmohammadi
  • Классификация: cs.FL (Теория формальных языков и автоматов)
  • Дата публикации: 23 апреля 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2504.16596

Аннотация

В данной работе разработана универсальная процедура редукции задач активного обучения. Метод вдохновлен недавней работой Buna-Marginean и соавторов (2024), которые предложили полиномиальную редукцию задачи точного обучения взвешенных автоматов над целыми числами к задаче обучения взвешенных автоматов над рациональными числами. Процедура повышает эффективность категорных алгоритмов обучения автоматов и при конкретизации в категориях ставит новые вопросы о сложности реализации. В качестве второго основного вклада авторы решают эти проблемы сложности в конкретной постановке обучения взвешенным автоматам над кольцами чисел (кольцами целых чисел в полях алгебраических чисел). При наличии полного представления кольца чисел OK получен алгоритм точного обучения OK-взвешенных автоматов с полиномиальной временной сложностью по размеру целевого автомата, логарифму длины самого длинного контрпримера, степени числового поля и логарифму дискриминанта. Автомат, выдаваемый алгоритмом, содержит не более чем на одно состояние больше, чем минимальный автомат, и доказано, что улучшение этого результата требует решения задачи главного идеала, для которой известный лучший алгоритм имеет квантовую полиномиальную сложность.

Исследовательский контекст и мотивация

Предпосылки проблемы

  1. Классическое обучение автоматам: Алгоритм L* Angluin эффективно обучает детерминированные конечные автоматы в рамках минимального достаточного учителя (MAT), что является классическим результатом вычислительной теории обучения.
  2. Вызовы при обучении взвешенным автоматам: Расширение алгоритмов обучения на более выразительные модели (такие как взвешенные автоматы) сталкивается с трудностями, особенно когда веса находятся в кольце, а не в поле.
  3. Ограничения существующих методов:
    • Для взвешенных автоматов над полями существуют алгоритмы полиномиального времени
    • Для взвешенных автоматов над общими кольцами существующие методы либо имеют чрезмерно высокую сложность, либо ограничены в применимости
    • Категорные методы, хотя и универсальны, могут привести к экспоненциальной сложности при конкретной реализации

Исследовательская мотивация

  1. Теоретическая необходимость: Требуется структура, которая сохраняет универсальность категорного подхода и одновременно имеет полиномиальную сложность в конкретных случаях
  2. Практическое применение: Кольца чисел имеют важное применение в криптографии и других областях; эффективное обучение взвешенных автоматов над ними имеет практическую ценность
  3. Теоретические границы: Исследование теоретических пределов минимизации взвешенных автоматов, в частности обобщение свойства Фату

Основные вклады

  1. Универсальный алгоритм редукции: Предложен Алгоритм 3 — универсальная процедура редукции в категорной структуре, которая редуцирует один класс задач обучения к другому, более управляемому классу
  2. Конкретный алгоритм для колец чисел: Разработан Алгоритм 4, специализированный алгоритм полиномиального времени для обучения взвешенным автоматам над кольцами чисел OK
  3. Результаты почти оптимальности: Доказано, что автомат, выдаваемый алгоритмом, содержит не более чем на одно состояние больше, чем минимальный автомат (почти минимальность)
  4. Теоретические границы сложности: Доказано, что получение полностью минимального автомата эквивалентно решению задачи главного идеала (PIP-hard), установлены теоретические нижние границы
  5. Обобщение свойства Фату: Доказано, что дедекиндовы области являются «почти сильно Фату-кольцами», обобщено классическое свойство Фату

Детальное описание методов

Определение задачи

Вход: Неизвестный OK-взвешенный язык L: Σ* → OK (доступ через оракул) Выход: OK-взвешенный автомат, вычисляющий L Ограничение: Сложность алгоритма полиномиальна по размеру целевого автомата, логарифму длины самого длинного контрпримера, степени числового поля и логарифму дискриминанта

Основная техническая структура

1. Категорные основы

Статья использует функторный подход, рассматривая автоматы как функторы A: I → C, где:

  • I — свободная категория, порожденная алфавитом Σ
  • C — выходная категория (например, категория модулей ModR)

2. Универсальный алгоритм редукции (Алгоритм 3)

Идея алгоритма:
1. Обучить автомат в «управляемой» категории D
2. Установить связь через функтор F: C → D
3. Использовать правый сопряженный G: D → C для возврата результата в целевую категорию C

Ключевые предположения (Assumption 12):

  • F сохраняет определенные классы морфизмов
  • F имеет правый сопряженный G
  • Единица и коединица имеют специфические свойства

3. Конкретная реализация для колец чисел (Алгоритм 4)

Шаг 1: Обратная сопряженность

Вычислить базис B пространства обратных состояний автомата A
Получить A' путем сопряжения A матрицей B

Шаг 2: Генерирование переднего модуля

Вызвать Алгоритм 5 для вычисления порождающего множества переднего OK-модуля A'
Использовать двухэтапную стратегию:
- Первый этап: найти слова, увеличивающие ранг в K
- Второй этап: завершить генерирование модуля в OK

Шаг 3: Вычисление псевдобазиса

Использовать псевдо-нормальную форму Эрмита (pseudo-HNF) для вычисления псевдобазиса из порождающего множества
Форма псевдобазиса: {(ai, vi) | 1 ≤ i ≤ ℓ}, где ai — дробные идеалы

Шаг 4: Почти минимальное порождающее множество

Преобразовать псевдобазис в порождающее множество размера не более ℓ+1 через Алгоритм 6
Использовать уточнение факторизации идеалов и китайскую теорему об остатках

Технические инновации

  1. Двухэтапная стратегия генерирования: Сначала определить ранг в поле K, затем завершить структуру модуля в кольце OK, избегая экспоненциальной сложности
  2. Техника псевдобазиса: Использование структурной теории дедекиндовых областей для обработки случаев неглавных идеальных областей
  3. Объединение категорной теории и конкретных алгоритмов: Конкретизация абстрактной категорной структуры в реализуемый полиномиальный алгоритм

Экспериментальная установка

Теоретическая верификация

Статья в основном является теоретической работой, верифицируемой следующим образом:

  1. Анализ сложности: Детальный анализ временной сложности Алгоритмов 4 и 5
  2. Доказательства корректности: Через Теорему 18 доказана корректность универсального алгоритма
  3. Примеры: Приведены конкретные примеры (например, Example 1) для случая Zi√5

Границы сложности

Теорема 2: При наличии полного представления OK точное обучение OK-взвешенных автоматов решается за полиномиальное время по следующим параметрам:

  • Размер целевого автомата
  • Логарифм длины самого длинного контрпримера
  • Степень числового поля d
  • Логарифм дискриминанта ΔK

Результаты экспериментов

Основные теоретические результаты

  1. Почти оптимальность (Proposition 10): Для дедекиндовой области R, если L — R-взвешенный язык ранга n, то существует R-взвешенный автомат с не более чем n+1 состояниями, вычисляющий L
  2. Нижняя граница сложности (Proposition 26): Определение минимальности по состояниям OK-взвешенного автомата является PIP-трудным
  3. Обобщение свойства Фату (Corollary 16): Дедекиндовы области являются почти сильно Фату-кольцами

Анализ конкретных примеров

Пример 1: В кольце чисел R = Zi√5:

  • Построен 3-состояний R-взвешенный автомат
  • Существует эквивалентный 2-состояний K-взвешенный автомат (K = Q(i√5))
  • Показано, что сильное свойство Фату не всегда выполняется, но почти сильное свойство Фату выполняется

Связанные работы

Классическое обучение автоматам

  • Алгоритм L* Angluin: полиномиальное обучение детерминированных конечных автоматов
  • Beimel и соавторы: алгоритмы обучения взвешенным автоматам над полями

Взвешенные автоматы над кольцами

  • van Heerdt и соавторы: обучение над главными идеальными областями, но без границ сложности
  • Buna-Marginean и соавторы: редукция от Z к Q, прямое вдохновение для данной работы

Категорные методы

  • Colcombet-Petrişan: функторный подход к минимизации автоматов
  • Urbat-Schröder и соавторы: алгебраические методы обучения

Заключение и обсуждение

Основные выводы

  1. Разработан первый алгоритм полиномиального времени для обучения взвешенным автоматам над кольцами чисел
  2. Доказана сложность получения полностью минимального автомата (PIP-hard)
  3. Установлена связь между категорной теорией и конкретными алгоритмами

Ограничения

  1. Требования к представлению: Требуется «полное представление» кольца OK, что может быть трудно получить на практике
  2. Почти оптимальность: Автомат, выдаваемый алгоритмом, может содержать на одно состояние больше, чем минимальный
  3. Специфическая структура: Метод специализирован для дедекиндовых областей; обобщение на общие кольца неясно

Направления будущих исследований

  1. Другие классы колец: Исследование обобщений на недедекиндовы области
  2. Практическая реализация: Разработка конкретных программных реализаций и экспериментальная верификация
  3. Исследование приложений: Конкретные приложения в криптографии и других областях

Глубокая оценка

Преимущества

  1. Теоретическая глубина: Искусное объединение категорной теории, алгебраической теории чисел и вычислительной сложности
  2. Технические инновации: Творческое использование двухэтапной стратегии обучения и техники псевдобазиса
  3. Полнота: Предоставлены как алгоритм, так и нижние границы, дающие полную картину проблемы
  4. Строгость: Математические доказательства строги, анализ сложности детален

Недостатки

  1. Практичность: Отсутствуют практические реализации и экспериментальная верификация
  2. Читаемость: Категорная часть может быть сложна для понимания неспециалистами
  3. Область применимости: Применимость метода ограничена специфическими алгебраическими структурами

Влияние

  1. Теоретический вклад: Значительный вклад в теорию обучения взвешенных автоматов
  2. Методология: Демонстрирует, как конкретизировать абстрактные категорные методы
  3. Междисциплинарность: Связывает теорию автоматов, алгебраическую теорию чисел и вычислительную сложность

Сценарии применения

  1. Криптография: Применение колец чисел в криптографии на решетках
  2. Символические вычисления: Вычислительные задачи над полями алгебраических чисел
  3. Теоретические исследования: Основа для дальнейших исследований в области обучения автоматов

Дополнительные технические детали

Представление колец чисел

«Полное представление» OK включает:

  • Интегральный базис Ω = {ω1,...,ωd}
  • Примитивный элемент θ и его минимальный полином
  • Мера сложности CK = d⁴(log d + log ΔK)

Сложность алгоритма

Ключевые границы сложности получены из:

  • Вычисление псевдо-HNF: полиномиальное время (Biasse-Fieker-Hofmann)
  • Длина строго возрастающей цепи: ограничена Леммой 24 как log(N(d))
  • Операции с идеалами: полиномиальное время в CK

Данная статья вносит значительный вклад в теоретическую информатику, особенно в области пересечения теории обучения автоматов и алгебраических вычислений. Хотя практическая применимость требует дальнейшей верификации, её теоретическая ценность и методологическое значение являются существенными.