2025-11-25T19:49:18.778457

Active Learning of Deterministic Transducers with Outputs in Arbitrary Monoids

Aristote
We study monoidal transducers, transition systems arising as deterministic automata whose transitions also produce outputs in an arbitrary monoid, for instance allowing outputs to commute or to cancel out. We use the categorical framework for minimization and learning of Colcombet, Petrişan and Stabile to recover the notion of minimal transducer recognizing a language, and give necessary and sufficient conditions on the output monoid for this minimal transducer to exist and be unique (up to isomorphism). The categorical framework then provides an abstract algorithm for learning it using membership and equivalence queries, and we discuss practical aspects of this algorithm's implementation.
academic

Активное обучение детерминированных преобразователей с выходами в произвольных моноидах

Основная информация

  • ID статьи: 2410.01590
  • Название: Active Learning of Deterministic Transducers with Outputs in Arbitrary Monoids
  • Автор: Quentin Aristote (Université Paris Cité, CNRS, Inria, IRIF)
  • Классификация: cs.FL (Формальные языки и теория автоматов)
  • Время публикации/конференция: Logical Methods in Computer Science, Volume 21, Issue 4, 2025 (принята, подана в октябре 2024)
  • Ссылка на статью: https://arxiv.org/abs/2410.01590

Аннотация

В данной работе исследуются моноидальные преобразователи — класс систем преобразования детерминированных автоматов, которые генерируют выходные данные в произвольных моноидах, например позволяя выходам быть коммутативными или взаимно сокращаться. Автор использует категориальную структуру Colcombet, Petrişan и Stabile для восстановления концепции минимального преобразователя, распознающего язык, и приводит необходимые и достаточные условия на выходном моноиде, при которых такой минимальный преобразователь существует и единственен (с точностью до изоморфизма). Категориальная структура далее предоставляет абстрактный алгоритм для обучения минимальному преобразователю с использованием запросов принадлежности и запросов эквивалентности, а также обсуждаются практические аспекты реализации этого алгоритма.

Исследовательский контекст и мотивация

Определение проблемы

Традиционные преобразователи обычно генерируют выходные данные в свободных моноидах (таких как строки), но в некоторых приложениях выходные данные могут требовать алгебраических свойств, таких как коммутативность или сокращаемость. Примеры:

  1. Моноид трасс в теории параллелизма: используется для моделирования последовательностей выполнения независимых задач, некоторые из которых могут выполняться асинхронно
  2. Планирование программ: преобразователи могут использоваться для программного планирования задач
  3. Обработка естественного языка: некоторые выходные символы могут обладать коммутативными свойствами

Исследовательская мотивация

Существующие алгоритмы обучения преобразователей (такие как алгоритм Vilara) разработаны в основном для свободных моноидов. Прямое применение к несвободным моноидам встречает следующие проблемы:

  1. Отсутствие завершения: как показано в Лемме 1.1, алгоритм Vilara может никогда не завершиться на некоторых моноидах
  2. Проблемы эффективности: подход обучения преобразователю на свободном моноиде с последующей минимизацией вводит ненужные состояния
  3. Отсутствие теории: отсутствует систематическая теоретическая структура для работы с произвольными моноидами

Ограничения существующих методов

  • Работа Gerdjikov предоставляет условия минимизации, но не касается проблемы обучения
  • Существующие алгоритмы обучения предполагают, что выходные данные находятся в свободном моноиде
  • Отсутствует единая теоретическая структура для работы с произвольными моноидами

Основные вклады

  1. Расширение теоретической структуры: расширение категориальной структуры обучения Colcombet-Petrişan-Stabile на моноидальные преобразователи
  2. Условия существования: предоставление необходимых и достаточных условий на выходном моноиде, обеспечивающих существование и единственность минимального моноидального преобразователя
  3. Оптимизация условий: расширение класса условий минимизации Gerdjikov, хотя границы сложности могут быть хуже
  4. Практический алгоритм: предоставление конкретных деталей реализации абстрактного алгоритма обучения моноидальных преобразователей
  5. Системы разложения: интерпретация различных типов проблем согласованности в алгоритме обучения через четырёхэлементные системы разложения

Подробное описание методов

Определение задачи

Входные данные:

  • Входной алфавит A (счётный)
  • Выходной моноид M = (M, ε, ⊗)
  • Целевая функция L: A* → M + 1 (частичная функция)

Выходные данные: минимальный моноидальный преобразователь, распознающий L

Типы запросов:

  • Запрос принадлежности EvalL: для заданного входного слова w возвращает L(w)
  • Запрос эквивалентности EquivL: для заданного гипотетического преобразователя определяет, является ли он корректным, или возвращает контрпример

Теоретические основы

Моделирование моноидальных преобразователей

Моноидальные преобразователи моделируются как функторы A: I → Kl(TM), где:

  • I — входная категория, представляющая базовую структуру преобразователя
  • Kl(TM) — категория Клейсли монады TM
  • TM X = M × X + 1 = (M × X) ⊔ {⊥}

Ключевые математические структуры

Левый наибольший общий делитель (left-gcd): для семейства w = (wi)i∈I его левый gcd — это левый делитель, на который делятся все остальные левые делители.

Функция редукции: когда Kl(TM) имеет все счётные степени 1, существуют функции:

  • lgcd: (M + 1)^N* → M (вычисление левого gcd)
  • red: (M + 1)^N* → (M + 1)^N* (функция редукции)

удовлетворяющие условиям:

  • Λ = lgcd(Λ) ⊗ red(Λ)
  • Единственность: если υ ⊗ red(Γ) = ν ⊗ red(Λ), то υ = ν и red(Γ) = red(Λ)

Условия существования

Теорема: Kl(TM) имеет все счётные степени 1 тогда и только тогда, когда M удовлетворяет:

  1. Левая сократимость: сократимость до левообратимых элементов
  2. Правая взаимная простота сократимости: правая взаимная простота сократимости для левовзаимно простых семейств
  3. Уникальный левый gcd: все непустые счётные семейства имеют уникальный левый gcd (в смысле правообратимости)

Системы разложения

Статья определяет три системы разложения:

  • (E₁,M₁) = (Surj ∩ Inj ∩ Inv, Tot)
  • (E₂,M₂) = (Surj ∩ Inj, Inv ∩ Tot)
  • (E₃,M₃) = (Surj, Inj ∩ Inv ∩ Tot)

Основное внимание уделяется (E₃,M₃) для определения минимального преобразователя, что обобщает систему разложения в случае свободного моноида.

Алгоритм обучения

Структура алгоритма (Алгоритм 2)

Входные данные: EvalL, EquivL
Выходные данные: минимальный преобразователь MinL

1. Инициализация Q = T = {ε}
2. Цикл до сходимости:
   - Проверка условия замкнутости: существует ли qa ∈ QA такой, что R(q,a,·) 
     не может быть представлено как обратимое кратное уже имеющихся состояний
   - Проверка условий согласованности: проверка трёх типов проблем согласованности
   - Построение гипотетического преобразователя H(Q,T)
   - Отправка запроса эквивалентности, обработка контрпримеров

Условия согласованности

Алгоритм проверяет три типа проблем согласованности:

  1. Полнота: R(q,a,t) ≠ ⊥ но R(q,e,T) = ⊥T
  2. Делимость: Λ(q,e) не может быть левым делителем Λ(q,a)R(q,a,t)
  3. Совместимость: несогласованность выходов преобразователя при слиянии состояний

Экспериментальная установка

Теоретическая верификация

Статья в основном проводит теоретический анализ, проверяя результаты следующим образом:

  1. Анализ сложности: доказательство ограниченности количества обновлений алгоритма
  2. Доказательство завершения: завершение алгоритма на правых нётеровых моноидах
  3. Доказательство корректности: выходные данные алгоритма действительно являются минимальным преобразователем

Анализ примеров

Статья демонстрирует через конкретные примеры:

  • Процесс обучения на свободном моноиде {α,β}*
  • Различия на свободном коммутативном моноиде {α,β}⊛
  • Потенциальные приложения на моноиде трасс

Результаты экспериментов

Границы сложности

Теорема 4.3: алгоритм корректен и завершается, когда MinL имеет конечное множество состояний и M является правым нётеровым. Граница количества обновлений:

  • Обновления Q: не более 3|MinL|st + rk(MinL) раз
  • Обновления T: не более rk(MinL) + |MinL|st раз

где rk(v) — ранг v в M.

Сравнение с условиями Gerdjikov

  • Расширяемость: условия данной работы охватывают более широкий класс моноидов
  • Сложность: условие GCLF Gerdjikov обеспечивает лучшие границы сложности
  • Применимость: метод данной работы применим к некоторым моноидам, где метод Gerdjikov неприменим

Верификация примеров

Через конкретные преобразователи на рисунках 1 и 2 демонстрируются:

  1. Подробные шаги процесса обучения
  2. Влияние различных структур моноидов на результаты
  3. Четырёхшаговый процесс минимизации (Reach→Total→Prefix→Obs)

Связанные работы

Теория преобразователей

  • Choffrut (2003): классическая минимизация преобразователей
  • Vilar (1996): алгоритм активного обучения преобразователей
  • Gerdjikov (2018): условия минимизации моноидальных преобразователей

Категориальная структура обучения

  • Colcombet-Petrişan-Stabile (2020): категориальный метод обучения автоматов
  • Angluin (1987): алгоритм L*
  • Обучение взвешенных автоматов: Bergadano-Varricchio и др.

Теория моноидов

  • Моноид трасс: приложения в теории параллелизма
  • Тропические моноиды: (ℝ₊, 0, +) и другие нестандартные моноиды
  • Группы: моноиды, где все элементы обратимы

Заключение и обсуждение

Основные выводы

  1. Успешное расширение категориальной структуры обучения на моноидальные преобразователи
  2. Предоставление необходимых и достаточных условий существования минимального преобразователя
  3. Предоставление практического алгоритма обучения и анализа его сложности
  4. Четырёхэлементная система разложения обеспечивает глубокое понимание шагов алгоритма

Ограничения

  1. Недостаточная практическая верификация: отсутствие верификации в реальных сценариях приложений
  2. Границы сложности: возможно худшие границы сложности по сравнению с методом Gerdjikov
  3. Вычислительные требования: требуется вычислимость операций моноида, вычисления левого gcd и т.д.
  4. Предположение о конечности: завершение алгоритма требует конечности MinL и правой нётеровости M

Направления будущих исследований

  1. Практические приложения: исследование приложений моноида трасс в планировании задач
  2. n-элементные системы разложения: обобщение на более общие системы разложения
  3. Конечные подклассы: исследование подкатегорий хорошо сформированных преобразователей
  4. Оптимизация сложности: поиск лучших границ сложности

Глубокая оценка

Преимущества

  1. Теоретическая глубина: предоставление строгого математического основания и полной теоретической структуры
  2. Методологическая инновация: успешное расширение важной категориальной структуры обучения
  3. Оптимизация условий: расширение известного класса условий минимизации
  4. Практичность алгоритма: предоставление конкретного описания реализуемого алгоритма
  5. Структурное понимание: четырёхэлементная система разложения обеспечивает глубокое понимание алгоритма

Недостатки

  1. Отсутствие экспериментальной верификации: в основном теоретическая работа, недостаточная экспериментальная верификация
  2. Неясные сценарии приложений: хотя упоминаются потенциальные приложения, отсутствуют конкретные практические примеры
  3. Компромисс в сложности: при расширении области применимости возможно ухудшение сложности
  4. Сильные предположения о вычислимости: высокие требования к вычислимости операций моноида

Влияние

  1. Теоретический вклад: важное теоретическое расширение для теории формальных языков
  2. Методологическая ценность: успешное применение категориального метода может вдохновить другие области
  3. Практический потенциал: предоставление теоретического основания для параллельных систем, планирования программ и других областей
  4. Расширяемость: структура имеет потенциал для дальнейшего расширения

Применимые сценарии

  1. Параллельные системы: приложения моноида трасс в анализе параллельных программ
  2. Планирование программ: автоматизированное проектирование систем планирования задач
  3. Символические вычисления: системы символической обработки, требующие алгебраических свойств
  4. Теоретические исследования: дальнейшее развитие теории формальных языков и автоматов

Библиография

Статья цитирует важные работы из нескольких областей, включая теорию формальных языков, теорию категорий, теорию моноидов:

  • Angluin (1987): Learning regular sets from queries and counterexamples
  • Colcombet, Petrişan, Stabile (2020-2021): оригинальные работы по категориальной структуре обучения
  • Gerdjikov (2018): важная работа по минимизации моноидальных преобразователей
  • Mac Lane (1978): Categories for the Working Mathematician

Общая оценка: это высококачественная теоретическая работа, успешно расширившая важную категориальную структуру обучения на более общий случай моноидальных преобразователей. Хотя экспериментальная верификация отсутствует, теоретический вклад значителен и создаёт прочную основу для дальнейшего развития смежных областей. Математическая строгость и методологическая инновативность работы заслуживают похвалы.