2025-11-14T18:28:10.300710

On the conjugates of Christoffel words

Bugeaud, Reutenauer
We introduce a parametrization of the conjugates of Christoffel words based on the integer Ostrowski numeration system. We use it to give a precise description of the borders (prefixes which are also suffixes) of the conjugates of Christoffel words and to revisit the notion of Sturmian graph introduced by Epifanio et al.
academic

О сопряженных словах Кристоффеля

Основная информация

  • ID статьи: 2202.05486
  • Название: On the conjugates of Christoffel words
  • Авторы: Янн Бюжо (Université de Strasbourg et CNRS, Institut universitaire de France), Кристоф Реутенауэр (Université du Québec à Montréal)
  • Классификация: math.CO (Комбинаторика)
  • Журнал/конференция: Discrete Mathematics and Theoretical Computer Science, vol. 27:3 #20 (2025)
  • Дата получения: 23 октября 2025 г.
  • Ссылка на статью: https://arxiv.org/abs/2202.05486

Аннотация

В данной работе на основе целочисленной системы счисления Островского введена параметризация классов сопряженности слов Кристоффеля. Используя эту параметризацию, авторы дают точную характеризацию границ (подслов, являющихся одновременно префиксом и суффиксом) сопряженных элементов слов Кристоффеля и пересматривают концепцию графов Штурма, введенную Эпифанио и др.

Исследовательский контекст и мотивация

Исследуемая проблема

В работе изучается структура и свойства классов сопряженности (conjugation class) слов Кристоффеля. Слова Кристоффеля — это специальный класс слов над двухбуквенным алфавитом, введенный Кристоффелем в 1875 году, а их сопряженные получаются циклическими сдвигами.

Значимость проблемы

Слова Кристоффеля и их сопряженные имеют важное значение в нескольких областях математики:

  1. Теория свободных групп: они соответствуют положительным, циклически приведенным элементам, образующим базис в свободной группе с двумя образующими
  2. Сжатие данных: это «совершенно кластеризующие слова» над двухбуквенным алфавитом, появляющиеся в теории преобразования Барроуза-Уилера
  3. Теория слов Штурма: они являются конечными версиями бесконечных слов Штурма, связанные с дискретизацией плоских прямых
  4. Теория квадратичных форм: они кодируют квадратичные формы Маркова и их минимумы

Ограничения существующих методов

Хотя параметризация самих слов Кристоффеля неотрицательными рациональными числами является известным результатом, систематический метод параметризации их классов сопряженности ранее был неполным. В частности:

  • отсутствовал единый параметризационный фреймворк для описания всех сопряженных элементов
  • точная характеризация границ и периодов сопряженных элементов слов Кристоффеля была неполной
  • связь между графами Штурма и представлением Островского требовала более глубокого понимания

Исследовательская мотивация

Данная работа направлена на установление систематического фреймворка на основе целочисленной системы счисления Островского для полной характеризации классов сопряженности слов Кристоффеля и применение этого фреймворка к решению проблем границ и структуры графов Штурма.

Основные вклады

  1. Параметризационная конструкция: на основе целочисленной системы счисления Островского введен полный метод параметризации классов сопряженности слов Кристоффеля (теорема 7.3), являющийся обобщением правила Рози и конструкции стандартных слов
  2. Некоммутативный подъем: доказано, что результат Фрида о префиксах стандартных слов следует как следствие (следствие 7.6), что можно рассматривать как некоммутативный подъем системы счисления Островского
  3. Характеризация границ: дано точное описание наибольших границ сопряженных элементов слов Кристоффеля (теорема 8.1) и доказано, что любая граница является степенью некоторого сопряженного элемента слова Кристоффеля (следствие 8.2)
  4. Вложение графов Штурма: доказано, что компактные графы и графы Штурма естественно вкладываются в дерево центральных слов и дерево Штерна-Брокота (следствие 9.5) с использованием теории итерированной палиндромизации де Люка
  5. Единый фреймворк: установлены глубокие связи между представлением Островского, классами сопряженности, границами и структурами теории графов

Подробное описание методов

Определение задачи

Для положительной целочисленной последовательности a1,,ama_1, \ldots, a_m определим:

  • Сопутствующие многочлены: qi=K(a1,,ai)q_i = K(a_1, \ldots, a_i), где KK — многочлен continuant
  • Параметры: bi=ai1b_i = a_i - 1 (если i=1i=1), bi=aib_i = a_i (если i2i \geq 2)

Цель: для каждого целого числа N=i=1mdiqi1N = \sum_{i=1}^m d_i q_{i-1} (представление Островского) построить соответствующий сопряженный элемент слова Кристоффеля.

Основной метод конструкции

Рекурсивное определение (формула 11)

Определим последовательность слов Vi=Vi(d1,,dm)F(A)V_i = V_i(d_1, \ldots, d_m) \in F(A) (свободная группа):

V1=b,V0=aV_{-1} = b, \quad V_0 = a

Vi=Vi1bidiVi2Vi1di,i=1,,mV_i = V_{i-1}^{b_i - d_i} V_{i-2} V_{i-1}^{d_i}, \quad i = 1, \ldots, m

где A={a,b}A = \{a, b\} — двухбуквенный алфавит.

Ключевые свойства:

  • При 0dibi0 \leq d_i \leq b_i имеем ViAV_i \in A^* (положительное слово)
  • Длина ViV_i равна qi=K(a1,,ai)q_i = K(a_1, \ldots, a_i)
  • Наклон (slope) ViV_i равен [0,a1,,ai][0, a_1, \ldots, a_i] (цепная дробь)

Представление через морфизмы (лемма 7.1)

Слово ViV_i может быть представлено через композицию морфизмов:

(Vi,Vi1)=π(b1d1,d1)π(bidi,di)(V_i, V_{i-1}) = \pi(b_1 - d_1, d_1) \circ \cdots \circ \pi(b_i - d_i, d_i)

где π(i,j)=(aibaj,a)\pi(i, j) = (a^i b a^j, a) — специфический эндоморфизм алфавита.

Теорема параметризации (теорема 7.3)

Основной результат:

  1. Все Vm(d1,,dm)V_m(d_1, \ldots, d_m) (где 0dibi0 \leq d_i \leq b_i) сопряжены в свободной группе с Mm=Vm(0,,0)M_m = V_m(0, \ldots, 0)
  2. Класс сопряженности в смысле слов состоит ровно из всех слов, соответствующих представлениям Островского, удовлетворяющим условиям законности
  3. Точная формула: Vm=CN(Mm)V_m = C^N(M_m), где CC — оператор сопряжения, N=diqi1N = \sum d_i q_{i-1}

Схема доказательства:

  • Использование леммы 5.1 (о соотношениях сопряженности автоморфизмов)
  • Конструкция сопрягающего элемента hh такого, что Vm=h1MmhV_m = h^{-1} M_m h
  • Вычисление алгебраической длины hh, равной ровно NN
  • Использование единственности представления Островского для доказательства полноты покрытия класса сопряженности

Технические инновации

  1. Единый фреймворк: объединение правила Рози, конструкции стандартных слов и системы счисления Островского в рекурсивном определении (11)
  2. Алгебраический метод: использование теории сопряженности свободной группы и вычисления матриц абелианизации морфизмов для определения длины
  3. Двойное представление:
    • Жадное представление: i2,di=bidi1=0\forall i \geq 2, d_i = b_i \Rightarrow d_{i-1} = 0
    • Ленивое представление: i,2ik,di=0di1=bi1\forall i, 2 \leq i \leq k, d_i = 0 \Rightarrow d_{i-1} = b_{i-1}
  4. Зеркальная симметрия (предложение 7.8): Vm(d1,,dm)~=Vm(b1d1,,bmdm)\widetilde{V_m(d_1, \ldots, d_m)} = V_m(b_1 - d_1, \ldots, b_m - d_m)
    Это устанавливает двойственность между жадным и ленивым представлениями.

Теория границ (раздел 8)

Основная теорема (теорема 8.1)

Для Vm(d1,,dm)V_m(d_1, \ldots, d_m), не являющегося словом Кристоффеля (жадное представление), его наибольшая граница BB определяется следующим образом:

Классификация случаев:

  • (i) Если dm=bmd_m = b_m: B=Vm1B = V_{m-1}
  • (ii) Если 1dmbm11 \leq d_m \leq b_m - 1 и 1dm1bm111 \leq d_{m-1} \leq b_{m-1} - 1: B=Vm1B = V_{m-1}^\ell, где =min{bmdm,dm}\ell = \min\{b_m - d_m, d_m\}
  • (iii)-(vii) Другие случаи имеют аналогичные, но более сложные описания

Ключевая лемма (лемма 8.14): В Vm=Vm1bmdmVm2Vm1dmV_m = V_{m-1}^{b_m - d_m} V_{m-2} V_{m-1}^{d_m} количество вхождений Vm1V_{m-1} не превышает bm+2b_m + 2, дополнительные вхождения могут появиться только вблизи Vm2V_{m-2}.

Следствие (следствие 8.2)

Любая граница сопряженного элемента слова Кристоффеля является степенью некоторого сопряженного элемента слова Кристоффеля.

Схема доказательства:

  • Если uu — граница слова Кристоффеля ww, то uuuu — фактор wwww
  • wwww — слово Штурма, следовательно, все сопряженные uu также являются словами Штурма
  • Среди них существует степень слова Линдона, это слово Линдона необходимо является словом Кристоффеля

Теория графов Штурма (раздел 9)

Конструкция компактного графа

Определение:

  • Множество вершин VV: все префиксы центрального палиндрома p=L0c1L1c2Lm1cmp = L_0^{c_1} L_1^{c_2} \cdots L_{m-1}^{c_m} (как слова над LiL_i)
  • Ребра: два типа
    1. Горизонтальные ребра: ULiULiU \xrightarrow{L_i} UL_i
    2. Прыгающие ребра: ULi+1ULikLi+1U \xrightarrow{L_{i+1}} UL_i^k L_{i+1} (k1k \geq 1)

Основной результат (следствие 9.2)

Теорема: для каждого суффикса ss центрального палиндрома pp существует единственный путь из начала, метка которого равна ss.

Ключевые моменты доказательства:

  1. Детерминированность графа: из каждой вершины выходит не более двух ребер, первые буквы меток различны
  2. Метки путей соответствуют ленивому представлению Островского
  3. Использование следствия 9.1: s=L0d1L1d2Lm1dms = L_0^{d_1} L_1^{d_2} \cdots L_{m-1}^{d_m}

Вложение в дерево Штерна-Брокота (следствие 9.5)

Предложение 9.4: направляющее слово центрального слова pp имеет вид v=ac1bc2ac3v = a^{c_1} b^{c_2} a^{c_3} \cdots

Результат вложения:

  • Компактные графы и графы Штурма естественно вкладываются в дерево центральных слов
  • Через соответствие в дереве Штерна-Брокота также вкладываются в это дерево
  • Использована теория итерированного оператора палиндромизации де Люка Pal\text{Pal}

Экспериментальная проверка и верификация

Пример вычисления (конец раздела 9)

Параметры: m=3,a1=2,a2=1,a3=3m = 3, a_1 = 2, a_2 = 1, a_3 = 3

Результаты вычисления:

  • M0=a,M1=ab,M2=aba,M3=abaabaabaabM_0 = a, M_1 = ab, M_2 = aba, M_3 = abaabaabaab
  • M3=pabM_3 = pab, центральное слово p=aba2ba2bap = aba^2ba^2ba
  • Палиндромные префиксы: 1,a,aba,abaaba,p1, a, aba, abaaba, p
  • Направляющее слово: v=abaav = abaa
  • L0=a,L1=ba,L2=abaL_0 = a, L_1 = ba, L_2 = aba

Верификация:

  • p=L0L12L2=a(ba)2aba=aba2ba2bap = L_0 L_1^2 L_2 = a \cdot (ba)^2 \cdot aba = aba^2ba^2ba
  • Пути компактного графа согласуются с ленивым представлением ✓

Теоретическая верификация

В приложении (раздел 10) дано полное доказательство существования и единственности представления Островского:

Лемма 10.1: чередующиеся последовательности соответствуют qk1q_k - 1

Лемма 10.2:

  • Жадное представление: Nqk1N \leq q_k - 1
  • Ленивое представление: Nqk+qk12N \leq q_k + q_{k-1} - 2

Эти результаты гарантируют полноту параметризации.

Связанные работы

Исторический контекст

  1. Кристоффель (1875) и Смит (1876): независимо введены слова Кристоффеля
  2. Марков (1879, 1880): применение к конструкции квадратичных форм, хотя связь с Кристоффелем не была осознана
  3. Фробениус (1913): явное установление связи, формулировка знаменитой гипотезы Маркова

Современная теория

  1. Рози (1985): «правило Рози», основание конструкции стандартных слов
  2. де Люка и Миньози (1994, 1997): теория стандартных слов и итерированная палиндромизация
  3. Островский (1922): система счисления Островского
  4. Эпифанио и др. (2007, 2012): графы Штурма и ленивое представление

Инновации данной работы

  1. vs Рози/де Люка: рекурсивная конструкция (11) в данной работе — более общий фреймворк, включающий стандартные слова как частный случай
  2. vs Фрид (2018): следствие 7.6 обобщает результат Фрида на весь класс сопряженности
  3. vs Лапуант (2017): данная работа переоказывает результаты о периодах совершенно другим методом (параметризация Островского)
  4. vs Эпифанио и др.: новая перспектива вложения графов Штурма в структуры деревьев

Заключение и обсуждение

Основные выводы

  1. Полная параметризация: установлена биекция между классами сопряженности слов Кристоффеля и представлениями Островского
  2. Полная характеризация границ: все границы являются степенями сопряженных элементов слов Кристоффеля, даны явные формулы для наибольших границ
  3. Единая теория графов: графы Штурма и компактные графы естественно вкладываются в классические структуры деревьев
  4. Углубление теории: объединены комбинаторная теория слов, теория чисел (цепные дроби), теория свободных групп и теория графов в единый фреймворк

Ограничения

  1. Вычислительная сложность: работа не обсуждает сложность параметризационной конструкции
  2. Обобщаемость: методы ограничены двухбуквенным алфавитом, обобщение на большие алфавиты не очевидно
  3. Приложения: хотя теория элегантна, обсуждение практических приложений ограничено
  4. Реализация алгоритмов: отсутствуют конкретные псевдокоды и детали реализации

Направления будущих исследований

  1. Алгоритмизация: разработка эффективных алгоритмов вычисления сопряженных элементов и границ
  2. Обобщение: исследование аналогичной теории для больших алфавитов или бесконечных слов
  3. Приложения: изучение применений в сжатии данных, поиске образцов
  4. Связи: дальнейшее исследование глубоких связей с теорией Маркова и квадратичными формами

Глубокая оценка

Преимущества

  1. Теоретическая глубина:
    • Установлены глубокие связи между несколькими областями математики (комбинаторика, теория чисел, алгебра)
    • Доказательства строгие и полные, логика ясна
  2. Методологические инновации:
    • Параметризация Островского — совершенно новая перспектива
    • Рекурсивная конструкция (11) элегантна и универсальна
    • Зеркальная симметрия (предложение 7.8) раскрывает глубокую структуру
  3. Полнота результатов:
    • Не только доказаны существование, но и единственность и явная конструкция
    • Теорема о границах охватывает все случаи
    • Обобщены и объединены несколько известных результатов
  4. Качество изложения:
    • Структура ясна, от базовых определений к продвинутым результатам
    • Леммы и теоремы хорошо организованы
    • Приведены конкретные примеры (раздел 9)

Недостатки

  1. Вызовы читаемости:
    • Требуется сильный фон в комбинаторной теории слов и теории свободных групп
    • Система обозначений сложна (Vi,Mi,Li,qi,biV_i, M_i, L_i, q_i, b_i и т.д.)
    • Теорема 8.1 с семью случаями чрезмерно громоздка
  2. Экспериментальная верификация:
    • Только один небольшой пример
    • Отсутствует крупномасштабная численная верификация
    • Нет кода или вычислительных инструментов
  3. Ориентация на приложения:
    • Сильная теоретическая направленность, но обсуждение приложений недостаточно
    • Не ясно, как применить к практическим задачам
    • Вычислительная эффективность не проанализирована
  4. Технические детали:
    • Некоторые доказательства (например, теорема 8.1) длинны и технически сложны
    • Доказательство представления Островского в приложении полно, но плохо читается

Влияние

  1. Научный вклад:
    • Предоставлен новый единый фреймворк для теории слов Кристоффеля
    • Решена важная проблема характеризации границ
    • Установлена связь между системой счисления Островского и комбинаторикой слов
  2. Потенциальные приложения:
    • Алгоритмы сжатия данных (преобразование Барроуза-Уилера)
    • Символическая динамика
    • Диофантовы приближения в теории чисел
  3. Воспроизводимость:
    • Теоретические результаты хорошо воспроизводимы
    • Отсутствие программной реализации ограничивает практическое применение
    • Примеры вычислений можно проверить вручную
  4. Последующие исследования:
    • Предоставлена теоретическая база для алгоритмических исследований
    • Может вдохновить исследования для больших алфавитов
    • Связь с теорией Маркова заслуживает глубокого изучения

Области применения

  1. Теоретические исследования:
    • Дальнейшие исследования в комбинаторной теории слов
    • Изучение свойств слов Штурма и Кристоффеля
    • Теория свободных групп и свободных полугрупп
  2. Разработка алгоритмов:
    • Поиск строк и распознавание образцов
    • Алгоритмы обнаружения периодов
    • Оптимизация сжатия данных
  3. Обучение:
    • Продвинутые курсы по комбинаторной математике и комбинаторике слов
    • Примеры применения теории цепных дробей
    • Конкретные примеры теории свободных групп
  4. Междисциплинарные приложения:
    • Разложение в цепные дроби в теории чисел
    • Дискретизация прямых в дискретной геометрии
    • Теория квадратичных форм

Резюме технических достижений

Основные математические инструменты

  1. Многочлен continuant: K(n1,,nk)=Kk1(n1,,nk1)nk+Kk2(n1,,nk2)K(n_1, \ldots, n_k) = K_{k-1}(n_1, \ldots, n_{k-1})n_k + K_{k-2}(n_1, \ldots, n_{k-2}) связывает рекурсивное определение и цепные дроби
  2. Композиция морфизмов: M(π(i,j))=P(i+j)=(i+j110)M(\pi(i,j)) = P(i+j) = \begin{pmatrix} i+j & 1 \\ 1 & 0 \end{pmatrix} вычисление длины через матрицы абелианизации
  3. Оператор сопряжения: C(au)=ua,Cn(w)=циклический сдвигC(au) = ua, \quad C^n(w) = \text{циклический сдвиг} связь между алгебраической длиной и сопряженностью слов

Ключевые неравенства

Жадное представление (лемма 10.2(i)): qk11<Nqk1q_{k-1} - 1 < N \leq q_k - 1

Ленивое представление (лемма 10.2(ii)): qk1+qk22<Nqk+qk12q_{k-1} + q_{k-2} - 2 < N \leq q_k + q_{k-1} - 2

Эти неравенства гарантируют единственность представления и полноту параметризации.

Ключевые ссылки

  1. Christoffel, E. B. (1875): Observatio arithmetica — исходное определение
  2. Rauzy, G. (1985): Mots infinis en arithmétique — правило Рози
  3. de Luca, A. (1997): Sturmian words: structure, combinatorics — теория стандартных слов
  4. Epifanio et al. (2007, 2012): On Sturmian graphs — графы Штурма
  5. Frid, A. E. (2018): Sturmian numeration systems — обобщаемый результат
  6. Lapointe, M. (2017): Study of Christoffel classes — периоды и нормальная форма
  7. Bugeaud & Laurent (2023): Combinatorial structure of Sturmian words — версия для бесконечных слов

Общая оценка: Это статья исключительной теоретической глубины, вносящая важный вклад в теорию слов Кристоффеля. Введением параметризации Островского авторы создали элегантный единый фреймворк, решающий проблемы характеризации классов сопряженности и границ. Главная ценность работы заключается в теоретических инновациях и связях между различными областями, однако существует потенциал для расширения в направлении алгоритмической реализации и практических приложений. Для исследователей в области комбинаторной теории слов и смежных дисциплин это обязательная к прочтению важная работа.