Machine Learning (ML) is applicable to scientific problems, i.e. to those which have a well defined answer, only if this answer can be brought to a peculiar form ${\cal G}: X\longrightarrow Z$ with ${\cal G}(\vec x)$ expressed as a combination of iterated Heaviside functions. At present it is far from obvious, if and when such representations exist, what are the obstacles and, if they are absent, what are the ways to convert the known formulas into this form. This gives rise to a program of reformulation of ordinary science in such terms -- which sounds like a strong enhancement of the constructive mathematics approach, only this time it concerns all natural sciences. We describe the first steps on this long way.
Maschinelles Lernen (ML) kann nur auf wissenschaftliche Probleme angewendet werden, wenn diese eine eindeutige Antwort haben und diese Antwort als G:X→Z dargestellt werden kann (wobei G(x) als Kombination iterierter Heaviside-Funktionen ausdrückbar ist). Es ist unklar, wann solche Darstellungen existieren, welche Hindernisse auftreten und wie bekannte Formeln ohne Hindernisse in diese Form umgewandelt werden können. Dies führt zu einem Verfahren zur Umformulierung der gewöhnlichen Wissenschaft in diesen Begriffen – was wie eine verstärkte Version konstruktiver mathematischer Methoden klingt, aber diesmal alle Naturwissenschaften einbezieht. Dieses Papier beschreibt die ersten Schritte auf diesem langen Weg.
Das Kernproblem, das dieses Papier lösen soll, ist: Wie können Methoden des maschinellen Lernens effektiv auf wissenschaftliche Probleme mit eindeutigen Antworten angewendet werden. Die Autoren weisen darauf hin, dass traditionelles maschinelles Lernen hauptsächlich für Klassifizierungsprobleme (wie Bilderkennung, Entscheidungsprobleme) verwendet wird, aber die Erweiterung auf echte wissenschaftliche Probleme stößt auf grundlegende Hindernisse.
Revolutionäre Anforderungen der wissenschaftlichen Berechnung: Erweiterung des maschinellen Lernens von Big-Data-Analyse und Computerexperimenten auf echte wissenschaftliche Entdeckungen
Verstärkung der konstruktiven Mathematik: Bereitstellung eines Rahmens zur konstruktiven Umformulierung aller Naturwissenschaften
Brücke zwischen künstlicher Intelligenz und Wissenschaft: Erforschung, ob Maschinen wissenschaftliche Gesetze entdecken und verstehen können
Beschränkungen von Gradientenabstiegsmethoden: Aktuelle ML-Methoden sind nur für spezifische Funktionsdarstellungsformen geeignet
Besonderheiten wissenschaftlicher Probleme: Wissenschaftliche Probleme haben "objektive" Antworten, die sich von allgemeinen Mustererkennungsproblemen unterscheiden
Einschränkungen der Darstellungsform: Wissenschaftliche Formeln müssen in die Form iterierter Heaviside-Funktionen umgewandelt werden
Einführung des Konzepts der "Heavisidisation": Systematische Methode zur Darstellung von Antworten auf wissenschaftliche Probleme als Kombinationen iterierter Heaviside-Funktionen
Etablierung von Heaviside-Darstellungen grundlegender Operationen: Einschließlich logischer Operationen, arithmetischer Operationen, Nullstellenerkennung und anderer grundlegender Bausteine
Erforschung der Heavisidisation algebraischer Zahlen: Versuch, Probleme wie die Lösung quadratischer Gleichungen in Heaviside-Funktionsdarstellung umzuwandeln
Analyse der Anwendbarkeit von Gradientenabstiegsmethoden: Untersuchung der Konvergenz von Algorithmen des maschinellen Lernens unter Heaviside-Darstellung
Aufdeckung von Eichunvarianz-Problemen: Entdeckung und Analyse von Eichfreiheitsgraden im Heavisidisationsprozess
Eingabe: Wissenschaftliches Problem mit eindeutiger Antwort, dargestellt als Abbildung G:X→Z Ausgabe: Heaviside-Funktionsdarstellung dieser Abbildung Nebenbedingungen: Muss parametrisierte Form verwenden, die mit Gradientenabstiegsmethoden optimierbar ist
Das Experiment bestätigt, dass das Netzwerk die Heaviside-Darstellung der Identitätsfunktion erlernen kann. Abbildung 1 zeigt die Konvergenz der Bias-Werte vom Anfangszustand (blaue Punkte) zur erwarteten linearen Anordnung (orange Punkte).
Experimente zeigen, dass selbst nach dem Training mit glatten Sigmoid-Funktionen erhebliche Unterschiede auftreten, wenn die Parameter auf echte Heaviside-Funktionen angewendet werden, besonders im zweiten Netzwerk-Layer.
Machbarkeit der Heavisidisation: Nachweis, dass viele grundlegende mathematische Operationen als Iterationen von Heaviside-Funktionen dargestellt werden können
Drei Klassen von Kernproblemen:
A) Heavisidisation verschiedener Probleme (konstruktiv)
B) Entdeckung algebraischer Formeln (konzeptionell)
C) Unterscheidung zwischen vernünftigen und unvernünftigen Antworten (konzeptionell)
Konzeptionelle Innovativität: Einführung des völlig neuen Konzepts der "Heavisidisation", das neue Perspektiven für die Anwendung maschinellen Lernens in der Wissenschaft eröffnet
Theoretische Tiefe: Systematischer Aufbau eines Heaviside-Funktions-Operationssystems ausgehend von mathematischen Grundlagen
Interdisziplinäre Perspektive: Organische Verbindung von maschinellem Lernen, mathematischer Physik und konstruktiver Mathematik
Praktische Validierung: Verifizierung der theoretischen Machbarkeit durch TensorFlow-Experimente
Begrenzte Anwendungsbereiche: Derzeit können nur relativ einfache mathematische Probleme behandelt werden, echte wissenschaftliche Entdeckungen sind noch weit entfernt
Rechenkomplexität: Heaviside-Darstellungen erfordern oft unendliche Reihen, die in praktischen Berechnungen gekürzt werden müssen
Fehlende Konvergenzgarantien: Keine theoretischen Garantien für die Konvergenz des Gradientenabstiegs zur richtigen Lösung
Verschwommene Mensch-Maschine-Grenze: Experimente erfordern immer noch umfangreiche menschliche Intervention, echte Automatisierung wurde nicht erreicht
Das Papier etabliert eine vollständige hierarchische Struktur von grundlegenden Heaviside-Funktionen zu komplexen mathematischen Operationen:
Heaviside→Logische Operationen→Arithmetische Operationen→Algebraische Operationen→Wissenschaftliche Probleme
Diese geschichtete Konstruktion bietet eine systematische mathematische Grundlage für die Verarbeitung wissenschaftlicher Probleme durch maschinelles Lernen.
Gelfand, Kapranov, Zelevinsky: "Discriminants, Resultants, and Multidimensional Determinants"
Dolotin, Morozov: "Introduction to Non-Linear Algebra"
Morozov, Shakirov: "New and Old Results in Resultant Theory"
Ruelle: "Post-human Mathematics"
Gesamtbewertung: Dies ist ein hochgradig originelles und theoretisch tiefgründiges Papier, das versucht, neue mathematische Grundlagen für die Anwendung maschinellen Lernens in der Wissenschaft zu etablieren. Obwohl die bisherigen Ergebnisse noch relativ vorläufig sind, haben das vorgeschlagene Heavisidisations-Konzept und die Methodik wichtigen theoretischen Wert und Inspirationspotenzial. Die interdisziplinäre Natur des Papiers und seine Überlegungen zu philosophischen Fragen der künstlichen Intelligenz verleihen ihm akademischen Wert, der über die technische Ebene hinausgeht.