2025-11-15T04:52:11.684179

Dyck Words, Pattern Avoidance, and Automatic Sequences

Mol, Rampersad, Shallit
We study various aspects of Dyck words appearing in binary sequences, where $0$ is treated as a left parenthesis and $1$ as a right parenthesis. We show that binary words that are $7/3$-power-free have bounded nesting level, but this no longer holds for larger repetition exponents. We give an explicit characterization of the factors of the Thue-Morse word that are Dyck, and show how to count them. We also prove tight upper and lower bounds on $f(n)$, the number of Dyck factors of Thue-Morse of length $2n$.
academic

Parole di Dyck, Evitamento di Motivi e Sequenze Automatiche

Informazioni Fondamentali

  • ID Articolo: 2301.06145
  • Titolo: Dyck Words, Pattern Avoidance, and Automatic Sequences
  • Autori: Lucas Mol (Thompson Rivers University), Narad Rampersad (University of Winnipeg), Jeffrey Shallit (University of Waterloo)
  • Classificazione: cs.DM (Matematica Discreta), cs.FL (Linguaggi Formali), math.CO (Combinatoria)
  • Rivista di Pubblicazione: Communications in Mathematics 33 (2025), no. 2, Paper no. 5
  • Collegamento Articolo: https://arxiv.org/abs/2301.06145

Riassunto

Il presente articolo esamina varie proprietà delle parole di Dyck in sequenze binarie, dove 0 è interpretato come parentesi sinistra e 1 come parentesi destra. La ricerca dimostra che le parole binarie 7/3-libere da potenze possiedono un livello di annidamento limitato, mentre questa proprietà non sussiste per esponenti di ripetizione maggiori. L'articolo fornisce una caratterizzazione esplicita dei fattori di Dyck nella parola di Thue-Morse e illustra come calcolarne la quantità. Inoltre, vengono provati limiti superiori e inferiori ristretti per il numero f(n) di fattori di Dyck di Thue-Morse di lunghezza 2n.

Contesto di Ricerca e Motivazione

Definizione del Problema

La ricerca affronta il problema centrale di comprendere la struttura e le proprietà dei fattori di parole di Dyck in infinite sequenze binarie. Le parole di Dyck costituiscono un concetto fondamentale nella teoria dei linguaggi formali, rappresentando stringhe di parentesi bilanciate, con importanti applicazioni nell'informatica e nella matematica.

Importanza della Ricerca

  1. Significato Teorico: Il linguaggio di Dyck è un esempio paradigmatico di linguaggio context-free; lo studio della sua distribuzione nelle sequenze automatiche contribuisce a comprendere i legami profondi tra la teoria dei linguaggi formali e la teoria degli automi
  2. Valore Combinatorio: L'evitamento di motivi e l'evitamento di potenze rappresentano direzioni di ricerca centrali nella combinatoria delle parole; il presente studio combina questi concetti con le parole di Dyck
  3. Applicazioni Computazionali: Le sequenze automatiche trovano ampia applicazione nella teoria degli algoritmi e della complessità computazionale; la comprensione delle proprietà dei loro fattori di Dyck possiede significato pratico

Limitazioni della Ricerca Esistente

  • Mancanza di una caratterizzazione sistematica dei fattori di Dyck in sequenze automatiche specifiche
  • Analisi quantitativa insufficiente della relazione tra evitamento di potenze e livello di annidamento
  • Assenza di algoritmi efficienti per il conteggio dei fattori di Dyck in sequenze automatiche

Contributi Fondamentali

  1. Relazione tra Evitamento di Potenze e Livello di Annidamento: Si dimostra che il livello di annidamento delle parole di Dyck 7/3-libere da potenze è al massimo 3, mentre esistono parole di Dyck 7/3⁺-libere da potenze con livello di annidamento arbitrariamente grande
  2. Caratterizzazione dei Fattori di Dyck di Thue-Morse: Si fornisce una caratterizzazione completa di tutti i fattori di Dyck nella sequenza di Thue-Morse: forma h(x), dove x è un fattore di una certa sequenza ternaria s
  3. Teoria Generale per Sequenze Automatiche: Si stabilisce un quadro teorico di decidibilità per i fattori di Dyck di sequenze automatiche sincrone e run-length
  4. Risultati di Conteggio Precisi: Si provano limiti superiori e inferiori ristretti per il numero d(n) di fattori di Dyck di lunghezza 2n nella sequenza di Thue-Morse: d(n) ≤ n e d(n) ≥ n/2

Spiegazione Dettagliata dei Metodi

Definizione del Compito

Data una parola binaria w = w1..n, si dice che w è una parola di Dyck se, interpretando 0 come parentesi sinistra e 1 come parentesi destra, w rappresenta una stringa di parentesi bilanciate. Formalmente, w è una parola di Dyck se e solo se:

  • B(w) = |w|₀ - |w|₁ = 0 (condizione di bilancio)
  • Per tutti i prefissi w', B(w') ≥ 0 (condizione di non-negatività)

Il livello di annidamento N(w) è definito come il valore massimo di B(w') su tutti i prefissi.

Metodi Fondamentali

1. Metodo di Analisi dell'Evitamento di Potenze

Utilizzo del metodo induttivo e della dimostrazione costruttiva:

  • Teorema 2.1: Attraverso l'analisi della struttura delle parole di Dyck 7/3-libere da potenze, si dimostra che il loro livello di annidamento ≤ 3
  • Teorema 2.9: Costruzione di morfismi speciali f e g tali che f(gᵗ(2)) produca parole di Dyck 7/3⁺-libere da potenze con livello di annidamento arbitrariamente grande

2. Metodo della Teoria degli Automi

Utilizzo del provatore di teoremi Walnut per la verifica computazionale:

morphism f "0->00100110100110010110010011001011001101
           1->00101100110100110110011010010110011011
           2->00101101001101001011001101001011010011"
morphism g "0->022012 1->022112 2->202101"

3. Teoria della Rappresentazione Lineare

Per sequenze k-automatiche sincrone e run-length, costruzione di formule logiche del primo ordine:

  • Funzione di bilancio: Bal(i,n,x) ≡ ∃y,z N₀(i,n,y) ∧ N₁(i,n,z) ∧ ((y<z ∧ x=0) | (y≥z ∧ y=x+z))
  • Decisione di Dyck: Dyck(i,n) ≡ bilancio ∧ condizioni di non-negatività

Punti di Innovazione Tecnica

  1. Tecnica di Costruzione di Morfismi: Progettazione di morfismi speciali 6-uniformi g e 38-uniformi f, realizzando il controllo preciso del livello di annidamento
  2. Teoria delle Sequenze Sincrone: Estensione dei concetti di run-length e sincronizzazione all'analisi del linguaggio di Dyck, stabilendo un quadro di decidibilità
  3. Minimizzazione della Rappresentazione Lineare: Utilizzo dell'algoritmo di Schützenberger per ridurre il rango della rappresentazione lineare del conteggio dei fattori di Dyck di Thue-Morse da 29 a 7

Configurazione Sperimentale

Strumenti Computazionali

  • Provatore di Teoremi Walnut: Utilizzato per la verifica logica del primo ordine di sequenze automatiche
  • Sistema di Algebra Lineare: Esecuzione di operazioni matriciali e calcoli di rappresentazione lineare
  • Calcolo Simbolico: Verifica di relazioni di ricorrenza e comportamento asintotico

Metodi di Verifica

  1. Verifica a Piccola Scala: Calcolo diretto per i casi n < 29
  2. Dimostrazione Induttiva: Utilizzo dell'induzione matematica per provare risultati generali
  3. Assistenza Computazionale: Sfruttamento di Walnut per verifiche computazionali su larga scala (ad esempio, 130 GB di memoria, 20321 secondi di tempo CPU)

Risultati Sperimentali

Risultati Quantitativi Principali

1. Limiti del Livello di Annidamento

  • Limite Superiore: Il livello di annidamento delle parole di Dyck 7/3-libere da potenze ≤ 3
  • Limite Inferiore: Esistono parole di Dyck 7/3⁺-libere da potenze con livello di annidamento arbitrariamente grande

2. Conteggio dei Fattori di Dyck di Thue-Morse

Relazioni di ricorrenza precise:

  • d(2n) = 2d(n)
  • d(4n+3) = 2d(n) + d(2n+1) + q(n)
  • d(8n+1) = 2d(2n+1) + d(4n+1) - q(n)
  • d(8n+5) = 2d(n) + d(2n+1) + 2d(2n+2)

dove q(n) è una sequenza 2-automatica con 1 ≤ q(n) ≤ 2.

3. Teorema dei Limiti Ristretti

  • Limite Superiore: d(n) ≤ n, con uguaglianza quando n = 3·2ⁱ
  • Limite Inferiore: d(n) ≥ n/2, con uguaglianza quando n = 2ⁱ
  • Caso Dispari: Quando n è dispari, d(n) ≥ (n+3)/2

4. Valore Medio Asintotico

∑₀≤ᵢ<₂ₙ d(i) = 19·4ⁿ/48 - 2ⁿ/4 + 5/3, con valore medio (19/24)n

Risultati Numerici Specifici

Valori di d(n) per i primi 21 termini:

n01234567891011121314151617181920
d(n)1123246648881291213814161416

Risultati per Altre Sequenze

  • Sequenza di Fibonacci: Contiene solo i fattori di Dyck 01 e 0101
  • Sequenza di Raddoppio di Periodo: Contiene solo i fattori di Dyck 01, 0101, 010101
  • Sequenza di Rudin-Shapiro: Contiene fattori di Dyck con livello di annidamento arbitrariamente grande

Lavori Correlati

Teoria dei Linguaggi Formali

La presente ricerca si basa sulla teoria dei linguaggi context-free di Chomsky e Schützenberger, in particolare sulla teoria algebrica del linguaggio di Dyck.

Combinatoria delle Parole

  • Teoria dell'Evitamento di Potenze: Eredita il lavoro pioneristico di Thue sulle parole prive di sovrapposizioni
  • Sequenze Automatiche: Si fonda sulla teoria delle sequenze k-automatiche di Cobham e sui concetti recenti di sequenze sincrone

Metodi Computazionali

  • Sistema Walnut: Sfrutta lo strumento di dimostrazione automatica di teoremi sviluppato da Mousavi e Shallit
  • Rappresentazione Lineare: Applica la teoria delle serie razionali non commutative di Berstel e Reutenauer

Conclusioni e Discussione

Conclusioni Principali

  1. Fenomeno dell'Indice Critico: 7/3 è l'indice critico per la limitatezza del livello di annidamento delle parole di Dyck, riflettendo il profondo legame tra evitamento di potenze e complessità strutturale
  2. Universalità delle Sequenze Automatiche: Le proprietà di sincronizzazione e run-length forniscono un quadro unificato per lo studio dei fattori di Dyck in sequenze automatiche
  3. Teoria del Conteggio Preciso: Il conteggio dei fattori di Dyck della sequenza di Thue-Morse rivela la ricca struttura delle sequenze k-regolari

Limitazioni

  1. Complessità Computazionale: I calcoli Walnut su larga scala richiedono risorse enormi (130 GB di memoria)
  2. Dipendenza da Sequenze Specifiche: Alcuni risultati (come la sincronizzazione e run-length) dipendono dalle proprietà specifiche della sequenza
  3. Grado di Generalizzazione: Alcuni risultati si applicano solo a categorie specifiche di sequenze automatiche

Direzioni Future

  1. Generalizzazione a Dimensioni Superiori: Studio della distribuzione dei linguaggi di Dyck multidimensionali in sequenze automatiche
  2. Altri Motivi: Estensione a problemi di evitamento di altri motivi context-free
  3. Ottimizzazione Algoritmica: Sviluppo di algoritmi più efficienti per il conteggio dei fattori di Dyck

Valutazione Approfondita

Punti di Forza

  1. Profondità Teorica: Combinazione organica della teoria dell'evitamento di potenze, delle sequenze automatiche e della teoria dei linguaggi formali, dimostrando una solida base teorica
  2. Innovazione Metodologica: Applicazione ingegnosa delle tecniche di costruzione di morfismi e della teoria della rappresentazione lineare, in particolare il controllo preciso del livello di annidamento
  3. Rigore Computazionale: Ampio utilizzo della verifica assistita da computer, rafforzando l'affidabilità dei risultati
  4. Completezza dei Risultati: Fornisce un quadro teorico completo dall'esistenza al conteggio

Carenze

  1. Risorse Computazionali: Alcune dimostrazioni dipendono da calcoli su larga scala, il che potrebbe limitare la verificabilità dei risultati
  2. Generalizzabilità: Alcuni metodi tecnici potrebbero essere difficili da generalizzare a categorie di sequenze più generali
  3. Orientamento Applicativo: Il valore pratico dei risultati teorici richiede ulteriore esplorazione

Impatto

  1. Interdisciplinarità: Promuove lo sviluppo incrociato della combinatoria, della teoria dei linguaggi formali e della teoria degli automi
  2. Contributo Metodologico: Fornisce un nuovo quadro analitico per lo studio dei motivi strutturali nelle sequenze automatiche
  3. Strumenti Computazionali: Dimostra il potente potenziale degli strumenti moderni di dimostrazione di teoremi nelle applicazioni a problemi combinatori

Scenari Applicabili

  1. Ricerca Teorica: Appropriato per la ricerca approfondita nella combinatoria delle parole e nella teoria dei linguaggi formali
  2. Progettazione di Algoritmi: Fornisce fondamenti teorici per la progettazione di algoritmi che elaborano sequenze strutturate
  3. Applicazioni Didattiche: Può servire come eccellente caso di studio per dimostrare i moderni metodi computazionali matematici

Bibliografia

Il presente articolo cita importanti letteratura nella teoria dei linguaggi formali, nella combinatoria e nella teoria degli automi, includendo:

  • Teoria dei linguaggi context-free di Chomsky & Schützenberger
  • Lavoro pioneristico di Thue sulle parole prive di sovrapposizioni
  • Teoria delle sequenze k-regolari di Allouche & Shallit
  • Serie razionali non commutative di Berstel & Reutenauer
  • Letteratura correlata dello strumento computazionale moderno Walnut

Valutazione Complessiva: Questo è un articolo che dimostra eccellenza sia nella profondità teorica che nell'innovazione tecnica, combinando con successo concetti e metodi di molteplici rami della matematica, fornendo importanti contributi alla comprensione dei motivi strutturali nelle sequenze automatiche. Sebbene presenti alcune limitazioni nella complessità computazionale e nella generalizzabilità, il suo valore teorico e il significato metodologico sono considerevoli.