Machine Learning (ML) is applicable to scientific problems, i.e. to those which have a well defined answer, only if this answer can be brought to a peculiar form ${\cal G}: X\longrightarrow Z$ with ${\cal G}(\vec x)$ expressed as a combination of iterated Heaviside functions. At present it is far from obvious, if and when such representations exist, what are the obstacles and, if they are absent, what are the ways to convert the known formulas into this form. This gives rise to a program of reformulation of ordinary science in such terms -- which sounds like a strong enhancement of the constructive mathematics approach, only this time it concerns all natural sciences. We describe the first steps on this long way.
L'apprentissage automatique (AA) ne peut s'appliquer aux problèmes scientifiques que si la question scientifique possède une réponse explicite, et si cette réponse peut être exprimée sous la forme G:X→Z (où G(x) peut s'exprimer comme une combinaison de fonctions de Heaviside itérées). Il reste actuellement peu clair quand cette représentation existe, quels obstacles se présentent, et comment convertir les formules connues en cette forme en l'absence d'obstacles. Cela conduit à une procédure de reformulation des sciences ordinaires en ces termes — ce qui ressemble à une version renforcée des méthodes mathématiques constructives, mais cette fois impliquant toutes les sciences naturelles. Cet article décrit les premiers pas sur cette longue route.
Le problème fondamental que cet article cherche à résoudre est : Comment appliquer efficacement les méthodes d'apprentissage automatique aux problèmes scientifiques possédant une réponse explicite. Les auteurs soulignent que l'apprentissage automatique traditionnel est principalement utilisé pour les problèmes de classification (reconnaissance d'images, problèmes de décision), mais l'extension à de véritables problèmes scientifiques se heurte à des obstacles fondamentaux.
Besoin révolutionnaire du calcul scientifique : Étendre l'apprentissage automatique de l'analyse de grandes données et des expériences informatiques à la véritable découverte scientifique
Renforcement des mathématiques constructives : Fournir un cadre pour reformuler toutes les sciences naturelles de manière constructive
Pont entre l'intelligence artificielle et la science : Explorer si les machines peuvent découvrir et comprendre les lois scientifiques
Limitations des méthodes de descente de gradient : Les méthodes actuelles d'AA ne s'appliquent qu'à des formes spécifiques de représentation de fonctions
Particularités des problèmes scientifiques : Les problèmes scientifiques ont des réponses « objectives », différentes des problèmes généraux de reconnaissance de motifs
Contraintes de représentation : Nécessité de convertir les formules scientifiques en formes de fonctions de Heaviside itérées
Introduction du concept d'« Heavisidisation » : Méthode systématique pour représenter les réponses aux problèmes scientifiques comme des combinaisons de fonctions de Heaviside itérées
Établissement des représentations Heaviside des opérations fondamentales : Incluant les opérations logiques, arithmétiques, détection de zéros et autres blocs de construction élémentaires
Exploration de l'Heavisidisation des nombres algébriques : Tentative de conversion de problèmes tels que la résolution d'équations quadratiques en représentations de Heaviside
Analyse de l'applicabilité des méthodes de descente de gradient : Étude de la convergence des algorithmes d'apprentissage automatique sous représentation Heaviside
Révélation des problèmes d'invariance de jauge : Découverte et analyse des degrés de liberté de jauge dans le processus d'Heavisidisation
Entrée : Problème scientifique possédant une réponse explicite, exprimé comme une application G:X→Z Sortie : Représentation par fonctions de Heaviside itérées de cette application Contraintes : Doit utiliser une forme paramétrée optimisable par méthodes de descente de gradient
L'expérience a vérifié que le réseau peut apprendre la représentation Heaviside de la fonction identité. La Figure 1 montre la convergence des valeurs de biais de l'état initial (points bleus) vers l'arrangement linéaire souhaité (points orange).
Les expériences ont révélé que l'utilisation de la fonction sigmoïde lisse pour l'entraînement, même lorsque les paramètres sont appliqués à la véritable fonction de Heaviside, produit des différences significatives, particulièrement dans le réseau de deuxième couche.
Faisabilité de l'Heavisidisation : Démonstration que de nombreuses opérations mathématiques fondamentales peuvent être exprimées comme des itérations de fonctions de Heaviside
Trois catégories de problèmes fondamentaux :
A) Heavisidisation de divers problèmes (constructive)
B) Découverte de formules algébriques (conceptuelle)
C) Distinction entre réponses raisonnables et déraisonnables (conceptuelle)
Originalité conceptuelle : Introduction du concept novateur d'« Heavisidisation », ouvrant de nouvelles perspectives pour l'application de l'apprentissage automatique à la science
Profondeur théorique : Construction systématique d'un système d'opérations de fonctions de Heaviside à partir de fondations mathématiques
Perspective interdisciplinaire : Intégration organique de l'apprentissage automatique, de la physique mathématique et des mathématiques constructives
Validation pratique : Vérification de la faisabilité théorique par expériences TensorFlow
Limitations de la portée d'application : Actuellement capable de traiter uniquement des problèmes mathématiques relativement simples, loin de la véritable découverte scientifique
Complexité informatique : Les représentations Heaviside nécessitent souvent des séries infinies, nécessitant une troncature en calcul pratique
Absence de garanties de convergence : Pas de garanties théoriques que la descente de gradient converge vers la solution correcte
Frontière homme-machine floue : Les expériences nécessitent toujours une intervention humaine considérable, sans réaliser une véritable automatisation
L'article cite les références importantes suivantes :
Gelfand, Kapranov, Zelevinsky: "Discriminants, Resultants, and Multidimensional Determinants"
Dolotin, Morozov: "Introduction to Non-Linear Algebra"
Morozov, Shakirov: "New and Old Results in Resultant Theory"
Ruelle: "Post-human Mathematics"
Évaluation Générale : Ceci est un article hautement original et théoriquement profond qui tente d'établir de nouvelles fondations mathématiques pour l'application de l'apprentissage automatique à la science. Bien que les résultats actuels soient encore préliminaires, le concept d'Heavisidisation proposé et la méthodologie possèdent une valeur théorique importante et une signification inspirante. La nature interdisciplinaire de l'article et sa réflexion sur les questions philosophiques de l'intelligence artificielle lui confèrent une valeur académique transcendant le niveau technique.