Active Learning of Deterministic Transducers with Outputs in Arbitrary Monoids
Aristote
We study monoidal transducers, transition systems arising as deterministic automata whose transitions also produce outputs in an arbitrary monoid, for instance allowing outputs to commute or to cancel out. We use the categorical framework for minimization and learning of Colcombet, PetriÅan and Stabile to recover the notion of minimal transducer recognizing a language, and give necessary and sufficient conditions on the output monoid for this minimal transducer to exist and be unique (up to isomorphism). The categorical framework then provides an abstract algorithm for learning it using membership and equivalence queries, and we discuss practical aspects of this algorithm's implementation.
academic
Активное обучение детерминированных преобразователей с выходами в произвольных моноидах
В данной работе исследуются моноидальные преобразователи — класс систем преобразования детерминированных автоматов, которые генерируют выходные данные в произвольных моноидах, например позволяя выходам быть коммутативными или взаимно сокращаться. Автор использует категориальную структуру Colcombet, Petrişan и Stabile для восстановления концепции минимального преобразователя, распознающего язык, и приводит необходимые и достаточные условия на выходном моноиде, при которых такой минимальный преобразователь существует и единственен (с точностью до изоморфизма). Категориальная структура далее предоставляет абстрактный алгоритм для обучения минимальному преобразователю с использованием запросов принадлежности и запросов эквивалентности, а также обсуждаются практические аспекты реализации этого алгоритма.
Традиционные преобразователи обычно генерируют выходные данные в свободных моноидах (таких как строки), но в некоторых приложениях выходные данные могут требовать алгебраических свойств, таких как коммутативность или сокращаемость. Примеры:
Моноид трасс в теории параллелизма: используется для моделирования последовательностей выполнения независимых задач, некоторые из которых могут выполняться асинхронно
Планирование программ: преобразователи могут использоваться для программного планирования задач
Обработка естественного языка: некоторые выходные символы могут обладать коммутативными свойствами
Существующие алгоритмы обучения преобразователей (такие как алгоритм Vilara) разработаны в основном для свободных моноидов. Прямое применение к несвободным моноидам встречает следующие проблемы:
Отсутствие завершения: как показано в Лемме 1.1, алгоритм Vilara может никогда не завершиться на некоторых моноидах
Проблемы эффективности: подход обучения преобразователю на свободном моноиде с последующей минимизацией вводит ненужные состояния
Отсутствие теории: отсутствует систематическая теоретическая структура для работы с произвольными моноидами
Расширение теоретической структуры: расширение категориальной структуры обучения Colcombet-Petrişan-Stabile на моноидальные преобразователи
Условия существования: предоставление необходимых и достаточных условий на выходном моноиде, обеспечивающих существование и единственность минимального моноидального преобразователя
Оптимизация условий: расширение класса условий минимизации Gerdjikov, хотя границы сложности могут быть хуже
Практический алгоритм: предоставление конкретных деталей реализации абстрактного алгоритма обучения моноидальных преобразователей
Системы разложения: интерпретация различных типов проблем согласованности в алгоритме обучения через четырёхэлементные системы разложения
Левый наибольший общий делитель (left-gcd): для семейства w = (wi)i∈I его левый gcd — это левый делитель, на который делятся все остальные левые делители.
Функция редукции: когда Kl(TM) имеет все счётные степени 1, существуют функции:
lgcd: (M + 1)^N* → M (вычисление левого gcd)
red: (M + 1)^N* → (M + 1)^N* (функция редукции)
удовлетворяющие условиям:
Λ = lgcd(Λ) ⊗ red(Λ)
Единственность: если υ ⊗ red(Γ) = ν ⊗ red(Λ), то υ = ν и red(Γ) = red(Λ)
Входные данные: EvalL, EquivL
Выходные данные: минимальный преобразователь MinL
1. Инициализация Q = T = {ε}
2. Цикл до сходимости:
- Проверка условия замкнутости: существует ли qa ∈ QA такой, что R(q,a,·)
не может быть представлено как обратимое кратное уже имеющихся состояний
- Проверка условий согласованности: проверка трёх типов проблем согласованности
- Построение гипотетического преобразователя H(Q,T)
- Отправка запроса эквивалентности, обработка контрпримеров
Теорема 4.3: алгоритм корректен и завершается, когда MinL имеет конечное множество состояний и M является правым нётеровым. Граница количества обновлений:
Статья цитирует важные работы из нескольких областей, включая теорию формальных языков, теорию категорий, теорию моноидов:
Angluin (1987): Learning regular sets from queries and counterexamples
Colcombet, Petrişan, Stabile (2020-2021): оригинальные работы по категориальной структуре обучения
Gerdjikov (2018): важная работа по минимизации моноидальных преобразователей
Mac Lane (1978): Categories for the Working Mathematician
Общая оценка: это высококачественная теоретическая работа, успешно расширившая важную категориальную структуру обучения на более общий случай моноидальных преобразователей. Хотя экспериментальная верификация отсутствует, теоретический вклад значителен и создаёт прочную основу для дальнейшего развития смежных областей. Математическая строгость и методологическая инновативность работы заслуживают похвалы.