Learning Weighted Automata over Number Rings, Concretely and Categorically
Aristote, van Gool, PetriÅan et al.
We develop a generic reduction procedure for active learning problems. Our approach is inspired by a recent polynomial-time reduction of the exact learning problem for weighted automata over integers to that for weighted automata over rationals (Buna-Marginean et al. 2024). Our procedure improves the efficiency of a category-theoretic automata learning algorithm, and poses new questions about the complexity of its implementation when instantiated to concrete categories. As our second main contribution, we address these complexity aspects in the concrete setting of learning weighted automata over number rings, that is, rings of integers in an algebraic number field. Assuming a full representation of a number ring OK, we obtain an exact learning algorithm of OK-weighted automata that runs in polynomial time in the size of the target automaton, the logarithm of the length of the longest counterexample, the degree of the number field, and the logarithm of its discriminant. Our algorithm produces an automaton that has at most one more state than the minimal one, and we prove that doing better requires solving the principal ideal problem, for which the best currently known algorithm is in quantum polynomial time.
academic
Обучение взвешенным автоматам над кольцами чисел: конкретно и категорически
В данной работе разработана универсальная процедура редукции задач активного обучения. Метод вдохновлен недавней работой Buna-Marginean и соавторов (2024), которые предложили полиномиальную редукцию задачи точного обучения взвешенных автоматов над целыми числами к задаче обучения взвешенных автоматов над рациональными числами. Процедура повышает эффективность категорных алгоритмов обучения автоматов и при конкретизации в категориях ставит новые вопросы о сложности реализации. В качестве второго основного вклада авторы решают эти проблемы сложности в конкретной постановке обучения взвешенным автоматам над кольцами чисел (кольцами целых чисел в полях алгебраических чисел). При наличии полного представления кольца чисел OK получен алгоритм точного обучения OK-взвешенных автоматов с полиномиальной временной сложностью по размеру целевого автомата, логарифму длины самого длинного контрпримера, степени числового поля и логарифму дискриминанта. Автомат, выдаваемый алгоритмом, содержит не более чем на одно состояние больше, чем минимальный автомат, и доказано, что улучшение этого результата требует решения задачи главного идеала, для которой известный лучший алгоритм имеет квантовую полиномиальную сложность.
Классическое обучение автоматам: Алгоритм L* Angluin эффективно обучает детерминированные конечные автоматы в рамках минимального достаточного учителя (MAT), что является классическим результатом вычислительной теории обучения.
Вызовы при обучении взвешенным автоматам: Расширение алгоритмов обучения на более выразительные модели (такие как взвешенные автоматы) сталкивается с трудностями, особенно когда веса находятся в кольце, а не в поле.
Ограничения существующих методов:
Для взвешенных автоматов над полями существуют алгоритмы полиномиального времени
Для взвешенных автоматов над общими кольцами существующие методы либо имеют чрезмерно высокую сложность, либо ограничены в применимости
Категорные методы, хотя и универсальны, могут привести к экспоненциальной сложности при конкретной реализации
Теоретическая необходимость: Требуется структура, которая сохраняет универсальность категорного подхода и одновременно имеет полиномиальную сложность в конкретных случаях
Практическое применение: Кольца чисел имеют важное применение в криптографии и других областях; эффективное обучение взвешенных автоматов над ними имеет практическую ценность
Теоретические границы: Исследование теоретических пределов минимизации взвешенных автоматов, в частности обобщение свойства Фату
Универсальный алгоритм редукции: Предложен Алгоритм 3 — универсальная процедура редукции в категорной структуре, которая редуцирует один класс задач обучения к другому, более управляемому классу
Конкретный алгоритм для колец чисел: Разработан Алгоритм 4, специализированный алгоритм полиномиального времени для обучения взвешенным автоматам над кольцами чисел OK
Результаты почти оптимальности: Доказано, что автомат, выдаваемый алгоритмом, содержит не более чем на одно состояние больше, чем минимальный автомат (почти минимальность)
Теоретические границы сложности: Доказано, что получение полностью минимального автомата эквивалентно решению задачи главного идеала (PIP-hard), установлены теоретические нижние границы
Обобщение свойства Фату: Доказано, что дедекиндовы области являются «почти сильно Фату-кольцами», обобщено классическое свойство Фату
Вход: Неизвестный OK-взвешенный язык L: Σ* → OK (доступ через оракул)
Выход: OK-взвешенный автомат, вычисляющий L
Ограничение: Сложность алгоритма полиномиальна по размеру целевого автомата, логарифму длины самого длинного контрпримера, степени числового поля и логарифму дискриминанта
Идея алгоритма:
1. Обучить автомат в «управляемой» категории D
2. Установить связь через функтор F: C → D
3. Использовать правый сопряженный G: D → C для возврата результата в целевую категорию C
Вычислить базис B пространства обратных состояний автомата A
Получить A' путем сопряжения A матрицей B
Шаг 2: Генерирование переднего модуля
Вызвать Алгоритм 5 для вычисления порождающего множества переднего OK-модуля A'
Использовать двухэтапную стратегию:
- Первый этап: найти слова, увеличивающие ранг в K
- Второй этап: завершить генерирование модуля в OK
Шаг 3: Вычисление псевдобазиса
Использовать псевдо-нормальную форму Эрмита (pseudo-HNF) для вычисления псевдобазиса из порождающего множества
Форма псевдобазиса: {(ai, vi) | 1 ≤ i ≤ ℓ}, где ai — дробные идеалы
Шаг 4: Почти минимальное порождающее множество
Преобразовать псевдобазис в порождающее множество размера не более ℓ+1 через Алгоритм 6
Использовать уточнение факторизации идеалов и китайскую теорему об остатках
Двухэтапная стратегия генерирования: Сначала определить ранг в поле K, затем завершить структуру модуля в кольце OK, избегая экспоненциальной сложности
Техника псевдобазиса: Использование структурной теории дедекиндовых областей для обработки случаев неглавных идеальных областей
Объединение категорной теории и конкретных алгоритмов: Конкретизация абстрактной категорной структуры в реализуемый полиномиальный алгоритм
Почти оптимальность (Proposition 10): Для дедекиндовой области R, если L — R-взвешенный язык ранга n, то существует R-взвешенный автомат с не более чем n+1 состояниями, вычисляющий L
Нижняя граница сложности (Proposition 26): Определение минимальности по состояниям OK-взвешенного автомата является PIP-трудным
Обобщение свойства Фату (Corollary 16): Дедекиндовы области являются почти сильно Фату-кольцами
Вычисление псевдо-HNF: полиномиальное время (Biasse-Fieker-Hofmann)
Длина строго возрастающей цепи: ограничена Леммой 24 как log(N(d))
Операции с идеалами: полиномиальное время в CK
Данная статья вносит значительный вклад в теоретическую информатику, особенно в области пересечения теории обучения автоматов и алгебраических вычислений. Хотя практическая применимость требует дальнейшей верификации, её теоретическая ценность и методологическое значение являются существенными.