2025-11-25T12:22:17.840833

From Numbers to Ur-Strings

Visser
In this paper we examine two ways of coding sequences in arithmetical theories. We investigate under what conditions they work. To be more precise, we study the creation of objects of a data-type that we call ur-strings, roughly sequences where the components are ordered but where we do not have an explicitly given projection function. First, we have a brief look at the beta-function which was already carefully studied by Emil Jeřábek. We study in detail our two target constructions. These constructions both employ theories of strings. The first is based on Smullyan coding and the second on the representation of binary strings in the special linear monoid of the non-negative part of discretely ordered commutative rings as introduced by Markov. We use the Markov coding to obtain an alternative proof that ${\sf PA}^{-}$ is sequential.
academic

Des Nombres aux Ur-Chaînes

Informations Fondamentales

  • ID de l'article : 2411.15873
  • Titre : From Numbers to Ur-Strings
  • Auteur : Albert Visser
  • Classification : math.LO (Logique Mathématique)
  • Date de Publication : 17 octobre 2025
  • Lien de l'article : https://arxiv.org/abs/2411.15873

Résumé

Cet article étudie deux méthodes de codage de séquences dans les théories arithmétiques et explore les conditions de leur fonctionnement. Plus précisément, il examine la création d'objets de type données appelés « ur-chaînes », analogues à des séquences dont les composants sont ordonnés mais sans fonctions de projection explicites. L'article commence par un bref examen de la fonction β étudiée en détail par Emil Jeřábek, puis examine en profondeur deux constructions cibles : la première basée sur le codage de Smullyan, la seconde basée sur la représentation de chaînes binaires dans le semi-groupe linéaire spécial de la partie non-négative d'un anneau commutatif ordonné discret introduit par Markov. En utilisant le codage de Markov, une preuve alternative du fait que PA⁻ est sérialisable a été obtenue.

Contexte de Recherche et Motivation

Problème Central

L'article aborde le problème central de la construction de codages de séquences dans les théories arithmétiques faibles. Plus précisément :

  1. Nécessité du codage de séquences : Le codage de séquences est la première étape de l'arithmétisation ; une fois le codage de séquences obtenu, les phénomènes d'indécidabilité et d'incomplétude en découlent.
  2. Importance des séquences globales : Bien que seules les séquences de sous-domaines soient nécessaires pour l'arithmétisation, les séquences globales permettent de construire des prédicats de satisfaction partiels dans la théorie donnée et d'étendre les modèles pour obtenir des prédicats de satisfaction complets.
  3. Défis des théories faibles : Construire des codages de séquences dans des théories très faibles afin de mieux comprendre les principes mathématiques impliqués dans la construction de séquences.

Motivation de la Recherche

  1. Maximiser la portée : Construire des méthodes qui fonctionnent dans la catégorie la plus large possible de théories
  2. Simplicité : Rendre les constructions et les résultats aussi simples que possible, minimisant l'utilisation de raccourcissements de coupures définissables de style Solovay
  3. Éviter la croissance exponentielle : Considérer la complétude de la fonction exponentielle comme « interdite », en privilégiant une croissance lente

Contributions Principales

  1. Introduction du concept d'ur-chaînes : Un concept affaibli de séquence où les éléments sont ordonnés mais ne nécessitent pas de fonction de longueur et de projection
  2. Développement de deux stratégies de codage :
    • Méthode basée sur le codage de Smullyan (fonctionnant dans la théorie PA⁻_smu)
    • Méthode basée sur le codage de Markov (fonctionnant dans la théorie PA⁻)
  3. Établissement de la théorie des chaînes comme intermédiaire : Utilisation de la théorie des chaînes comme étape intermédiaire dans la construction des ur-chaînes à partir des nombres
  4. Nouvelle preuve de la sérialisation de PA⁻ : Obtention d'une preuve alternative du fait que PA⁻ est sérialisable en utilisant le codage de Markov
  5. Analyse théorique des modèles approfondie : Analyse des caractéristiques et propriétés des chaînes de Markov dans différents modèles

Détails de la Méthodologie

Définition de la Tâche

Étude du problème de construction d'ur-chaînes dans les théories arithmétiques faibles, où :

  • Entrée : Théorie arithmétique faible (comme PA⁻, PA⁻_smu)
  • Sortie : Interprétation directe d'ur-chaînes, rendant la théorie sérialisable
  • Contraintes : Éviter l'utilisation de la fonction exponentielle, travailler dans la théorie la plus faible possible

Concepts Fondamentaux

Ur-chaînes vs Séquences

  • Séquences : Nécessitent une fonction de longueur explicite et des fonctions de projection
  • Ur-chaînes : Chaînes où tous les éléments d'un type spécifié sont intégrés dans l'alphabet, avec une opération de concaténation et un ordre d'apparition des éléments, mais sans nécessiter de fonction de longueur et de projection

Théorie Sérialisable

Une théorie est sérialisable si et seulement si elle interprète directement la théorie AS (ou sa version bicatégorique FAC) :

  • AS contient un prédicat binaire ∈ satisfaisant les axiomes d'existence d'ensemble vide et d'opération d'adjacence
  • FAC est la version bicatégorique, contenant des types d'objets o et des types de classe/concept c

Méthode 1 : Codage de Smullyan

Idée Fondamentale

Codage de chaînes binaires utilisant l'ordre lexicographique par longueur :

0: ε    5: ba   10: abb   15: aaaa
1: a    6: bb   11: baa   16: aaab
2: b    7: aaa  12: bab   17: aaba
3: aa   8: aab  13: bba   18: aabb
4: ab   9: aba  14: bbb   19: abaa

Définitions Clés

  • ℓ(n) := la plus grande puissance de 2 inférieure ou égale à n+1
  • m⊛n := m·ℓ(n) + n
  • Concaténation de chaînes : σ⊛τ = (σ∗τ)^sm

Implémentation Technique

  1. Théorie de base : PA⁻_smu = PA⁻ + Principe d'existence de puissance + Principe de divisibilité de puissance
  2. Extension de théorie des chaînes : TCΛ^c_1, avec fonction de longueur Λ ajoutée
  3. Construction d'ur-chaînes : Utilisation de l'appairage ⟨Λ(w₀)...bΛ(wₖ₋₁), bw₀...bwₖ₋₁⟩

Méthode 2 : Codage de Markov

Idée Fondamentale

Utilisation de l'isomorphisme entre le semi-groupe linéaire spécial SL₂(ℕ) et le semi-groupe libre avec deux générateurs :

  • Matrice A = (1 1; 0 1) correspond à la lettre a
  • Matrice B = (1 0; 1 1) correspond à la lettre b
  • Propriété clé : A^n = (1 n; 0 1), c'est-à-dire croissance linéaire de chaîne de comptage

Implémentation Technique

  1. Théorie de base : PA⁻ (théorie d'anneau commutatif ordonné discret non-négatif)
  2. Représentation matricielle : Utilisation de matrices 2×2 avec déterminant 1
  3. Stratégie de codage : ur-chaîne n₀...nₖ₋₁ codée comme BA^n₀...BA^nₖ₋₁

Théorème Clé

Théorème 8.21 : La traduction θ supporte l'interprétation de TCFU1 dans PA⁻, où :

  • Domaine d'objets : Tous les nombres
  • Domaine de chaînes : ⊘ plus toutes les matrices de la forme Bα
  • n_θ := BA^n = (1 n; 1 n+1)

Configuration Expérimentale

Cadre Théorique

Cet article procède principalement à une analyse théorique, vérifiant la faisabilité des méthodes de codage dans différentes théories arithmétiques :

  1. PA⁻_jer : PA⁻ de Jeřábek, semi-anneau commutatif ordonné discret
  2. PA⁻ : PA⁻_jer + Principe de soustraction
  3. PA⁻_euc : PA⁻ + Division euclidienne
  4. PA⁻_smu : PA⁻ + Principe d'existence de puissance + Principe de divisibilité de puissance

Analyse des Modèles

Étude de plusieurs modèles clés :

  • M₀ := ℤX≥0
  • M₁ := Int(ℤ)≥0 (partie non-négative des polynômes à valeurs entières)
  • M₂ := (ℚX·X + ℤ)≥0 (« deuxième modèle standard »)

Résultats Expérimentaux

Résultats Principaux

Résultats du Codage de Smullyan

  1. Théorème 7.21 : β dans PA⁻_smu supporte l'interprétation directe de TCΛ^c_1
  2. Interprétabilité : TCΛ^c_1 interprète directement TCFU1
  3. Résultat combiné : PA⁻_smu est sérialisable

Résultats du Codage de Markov

  1. Théorème 8.21 : θ dans PA⁻ supporte l'interprétation de TCFU1
  2. Résultat plus fort : Support de TCFU2 (incluant le principe de pile) dans PA⁻_euc
  3. Nouvelle preuve : Fourniture d'une nouvelle méthode de preuve que PA⁻ est sérialisable

Découvertes Théorico-Modèles

Caractérisation du Modèle M₂

Théorème 8.34 : Toute chaîne de Markov dans M₂ peut être écrite de manière unique comme un produit fini d'alternances de formes A^P et B^Q.

Construction de Contre-exemples

Construction de contre-exemples dans M₀ et M₁ ne satisfaisant pas le principe de pile tcu7 :

  • Théorème 8.39 : L'élément A = (9, 3X+2; 3X+4, X²+2X+1) n'est ni de la forme A^P ni de la forme βP
  • Théorème 8.42 : De même, B est une chaîne-A mais pas de la forme A^P

Résultats de Mathématiques Inverses

Théorème 8.26 : Le principe pa17⁻ est équivalent au fait que chaque α dans le semi-groupe linéaire spécial est de la forme A^n ou βn.

Travaux Connexes

Contexte Historique

  1. Fonction β de Gödel : Méthode classique de codage de séquences utilisant le théorème des restes chinois
  2. Travaux de Jeřábek : Développement du traitement moderne de la fonction β dans PA⁻_jer
  3. Contribution de Markov : Observation originale de l'isomorphisme entre groupe linéaire spécial et semi-groupe libre
  4. Recherche de Murwanashyaka : Utilisation d'interprétations de style Markov dans les théories faibles

Comparaison Technique

  • Fonction β : Portée la plus large, mais nécessite des techniques de raccourcissement complexes
  • Codage de Smullyan : Connexion directe, mais nécessite une théorie de base plus forte
  • Codage de Markov : Fonctionne dans PA⁻, connexion simple et intuitive

Conclusion et Discussion

Conclusions Principales

  1. Complémentarité des méthodes : Les deux méthodes de codage ont chacune leurs avantages ; le codage de Smullyan est plus intuitif mais nécessite une théorie plus forte, tandis que le codage de Markov fonctionne dans une théorie plus faible
  2. Optimalité théorique : PA⁻_smu est la base naturelle pour la méthode de Smullyan, PA⁻ est la base naturelle pour la méthode de Markov
  3. Approche modulaire : La théorie des chaînes comme intermédiaire fournit une construction modulaire claire

Limitations

  1. Force théorique : Le codage de Smullyan nécessite PA⁻_smu, non inclus dans IOpen
  2. Restriction de croissance : L'évitement de la croissance exponentielle limite la directivité de certaines constructions
  3. Dépendance du modèle : Certaines propriétés (comme le principe de pile) dépendent de principes arithmétiques spécifiques

Directions Futures

L'article propose plusieurs problèmes ouverts :

  1. Mathématiques inverses : Peut-on effectuer une analyse complète de mathématiques inverses sur les codages
  2. Théorie des modèles : Développement de la théorie des modèles de PA⁻_smu
  3. Autres codages : Hypothèses précises pour les autres stratégies de codage décrites à la section 7.1.1
  4. Problèmes de caractérisation : Caractérisation de forme normale des chaînes de Markov de M₀ dans M₂

Évaluation Approfondie

Points Forts

  1. Profondeur théorique : Fournit une analyse approfondie du codage de séquences dans les théories arithmétiques faibles
  2. Innovation méthodologique : Le concept d'ur-chaînes fournit un affaiblissement utile des séquences
  3. Rigueur technique : Toutes les constructions sont accompagnées de preuves mathématiques complètes
  4. Conception modulaire : La méthode utilisant la théorie des chaînes comme intermédiaire est claire et réutilisable

Insuffisances

  1. Applications limitées : Contributions principalement théoriques, applications pratiques peu évidentes
  2. Complexité : Certaines constructions sont assez techniques et potentiellement difficiles à comprendre
  3. Nombreux problèmes ouverts : Laisse de nombreuses questions non résolues

Impact

  1. Contribution théorique : Fournit de nouveaux outils pour l'étude des théories arithmétiques faibles
  2. Valeur méthodologique : L'approche modulaire peut s'appliquer à d'autres constructions
  3. Recherche fondamentale : Offre une nouvelle perspective pour comprendre la nature de l'arithmétisation

Scénarios d'Application

  1. Recherche en logique mathématique : Théories arithmétiques faibles et théorie de la prouvabilité
  2. Théorie des modèles : Étude des modèles non-standards
  3. Théorie du calcul : Recherche sur l'arithmétisation des systèmes formels

Références Bibliographiques

L'article contient 76 références couvrant plusieurs domaines de la logique mathématique, théorie des modèles, algèbre et autres, notamment :

  • Travaux de Jeřábek sur les théories arithmétiques faibles
  • Ouvrages classiques de Markov sur la théorie algorithmique
  • Recherches connexes sur la théorie des chaînes et théorie de la concaténation
  • Études sur les théories essentiellement indécidables faibles

Cet article représente une avancée importante dans l'étude des théories arithmétiques faibles. En introduisant le concept d'ur-chaînes et deux méthodes de codage concrètes, il offre une nouvelle perspective pour comprendre la nature du codage de séquences. Bien que principalement un travail théorique, son traitement mathématique rigoureux et son analyse approfondie en font une contribution importante à ce domaine.