Machine Learning (ML) is applicable to scientific problems, i.e. to those which have a well defined answer, only if this answer can be brought to a peculiar form ${\cal G}: X\longrightarrow Z$ with ${\cal G}(\vec x)$ expressed as a combination of iterated Heaviside functions. At present it is far from obvious, if and when such representations exist, what are the obstacles and, if they are absent, what are the ways to convert the known formulas into this form. This gives rise to a program of reformulation of ordinary science in such terms -- which sounds like a strong enhancement of the constructive mathematics approach, only this time it concerns all natural sciences. We describe the first steps on this long way.
論文ID : 2205.07377タイトル : The Splendors and Miseries of Heavisidisation著者 : V. Dolotin, A. Morozov所属機関 : MIPT, ITEP & IITP, Moscow, Russia分類 : hep-th(高エネルギー物理理論)、cs.LG(機械学習)発表日 : 2022年5月15日論文リンク : https://arxiv.org/abs/2205.07377 機械学習(ML)が科学問題に適用可能となるのは、その問題が明確な答えを持ち、その答えが G : X → Z G: X \rightarrow Z G : X → Z の形式で表現できる場合のみである。ここで G ( x ⃗ ) G(\vec{x}) G ( x ) は反復ヘヴィサイド関数の組み合わせとして表現可能である。現在のところ、このような表現がいつ存在するのか、どのような障害があるのか、そして障害がない場合に既知の公式をこの形式に変換する方法が明確ではない。これは通常の科学を当該用語で再定式化する手続きへと導く。これは構成的数学の方法の強化版を構築することに似ているが、今回はすべての自然科学が関わっている。本論文は、この長い道のりにおける最初のステップを記述している。
本論文が解決しようとする核心的な問題は、明確な答えを持つ科学問題に対して機械学習方法をいかに効果的に適用するか である。著者は、従来の機械学習が主に分類問題(画像認識、判定問題など)に用いられてきたが、これを真の科学問題へ拡張する際に根本的な障害が存在することを指摘している。
この問題の重要性は以下の点にある:
科学計算の革命的需要 :機械学習をビッグデータ分析と計算実験から真の科学発見へ拡張すること構成的数学の強化 :すべての自然科学を構成的方法で再定式化するための枠組みを提供すること人工知能と科学の架け橋 :機械が科学法則を発見し理解できるかどうかを探索すること勾配降下法の制限 :現在のML方法論における勾配降下法は特定の関数表現形式にのみ適用可能である科学問題の特殊性 :科学問題は「客観的な」答えを持ち、一般的なパターン認識問題とは異なる表現形式の制約 :科学公式をヘヴィサイド関数の反復形式に変換する必要がある「ヘヴィサイド化」概念の提案 :科学問題の答えを反復ヘヴィサイド関数の組み合わせとして表現する体系的方法の確立基本演算のヘヴィサイド表現の構築 :論理演算、算術演算、零点検出などの基礎的構成要素を含む代数数のヘヴィサイド化の探索 :二次方程式の求解などの問題をヘヴィサイド関数表現に変換する試み勾配降下法の適用可能性の分析 :ヘヴィサイド表現下での機械学習アルゴリズムの収束性の研究ゲージ不変性問題の解明 :ヘヴィサイド化過程における規範的自由度の問題の発見と分析入力 :明確な答えを持つ科学問題、写像 G : X → Z G: X \rightarrow Z G : X → Z として表現出力 :当該写像のヘヴィサイド関数反復表現制約条件 :勾配降下法で最適化可能なパラメータ化形式を使用する必要がある
著者はヘヴィサイド関数を以下のように定義している:
θ ( x ) = { 1 if x > 0 0 if x ≤ 0 \theta(x) = \begin{cases} 1 & \text{if } x > 0 \\ 0 & \text{if } x \leq 0 \end{cases} θ ( x ) = { 1 0 if x > 0 if x ≤ 0
主要な性質:
冪等性 :θ ( θ ( x ) ) = θ ( x ) \theta(\theta(x)) = \theta(x) θ ( θ ( x )) = θ ( x ) 論理演算の実装 :
AND: ∧ ( a , b ) : = θ ( θ ( a ) + θ ( b ) − 1 ) \wedge(a,b) := \theta(\theta(a) + \theta(b) - 1) ∧ ( a , b ) := θ ( θ ( a ) + θ ( b ) − 1 ) OR: ∨ ( a , b ) : = θ ( θ ( a ) + θ ( b ) ) \vee(a,b) := \theta(\theta(a) + \theta(b)) ∨ ( a , b ) := θ ( θ ( a ) + θ ( b )) 整数 x x x に対して:
x = I ( x ) : = ∑ i = 0 ∞ θ ( x − i ) − ∑ i = 0 ∞ θ ( − x − i ) x = I(x) := \sum_{i=0}^{\infty} \theta(x-i) - \sum_{i=0}^{\infty} \theta(-x-i) x = I ( x ) := ∑ i = 0 ∞ θ ( x − i ) − ∑ i = 0 ∞ θ ( − x − i )
x + y = I ( x ) + I ( y ) = ∑ i = 0 ∞ θ ( x − i ) + ∑ j = 0 ∞ θ ( y − j ) x + y = I(x) + I(y) = \sum_{i=0}^{\infty} \theta(x-i) + \sum_{j=0}^{\infty} \theta(y-j) x + y = I ( x ) + I ( y ) = ∑ i = 0 ∞ θ ( x − i ) + ∑ j = 0 ∞ θ ( y − j )
x ⋅ y = ∑ i , j θ ( θ ( x − i ) + θ ( y − j ) − 1 ) = ∑ i , j ∧ ( x − i , y − j ) x \cdot y = \sum_{i,j} \theta(\theta(x-i) + \theta(y-j) - 1) = \sum_{i,j} \wedge(x-i, y-j) x ⋅ y = ∑ i , j θ ( θ ( x − i ) + θ ( y − j ) − 1 ) = ∑ i , j ∧ ( x − i , y − j )
x 1 / n = ∑ i = 0 ∞ θ ( x − i n ) x^{1/n} = \sum_{i=0}^{\infty} \theta(x - i^n) x 1/ n = ∑ i = 0 ∞ θ ( x − i n )
関数 f ( x ) f(x) f ( x ) の格子点 i i i と i + 1 i+1 i + 1 の間の零点検出:
δ i ( f ) : = ∨ ( θ ( f i + 1 ) − θ ( f i ) , θ ( f i ) − θ ( f i + 1 ) ) \delta_i(f) := \vee(\theta(f_{i+1}) - \theta(f_i), \theta(f_i) - \theta(f_{i+1})) δ i ( f ) := ∨ ( θ ( f i + 1 ) − θ ( f i ) , θ ( f i ) − θ ( f i + 1 ))
関数 f , g f,g f , g の正方形領域内の共通零点検出:
δ i , j ( f , g ) = ∧ ( δ i j ( f ) , δ i j ( g ) ) \delta_{i,j}(f,g) = \wedge(\delta_{ij}(f), \delta_{ij}(g)) δ i , j ( f , g ) = ∧ ( δ ij ( f ) , δ ij ( g ))
零点位置の近似:
( ∑ i j i N δ i , j ( f , g ) , ∑ i j j N δ i , j ( f , g ) ) \left(\sum_{ij} \frac{i}{N}\delta_{i,j}(f,g), \sum_{ij} \frac{j}{N}\delta_{i,j}(f,g)\right) ( ∑ ij N i δ i , j ( f , g ) , ∑ ij N j δ i , j ( f , g ) )
区間 [ 2 , 3 ] [2,3] [ 2 , 3 ] の特性関数:
G ( x ) = θ ( x − 2 ) − θ ( x − 3 ) G(x) = \theta(x-2) - \theta(x-3) G ( x ) = θ ( x − 2 ) − θ ( x − 3 )
第一象限の特性関数:
G ( x 1 , x 2 ) = − θ ( θ ( − x 1 ) + θ ( − x 2 ) − 1 ) + 1 G(x_1,x_2) = -\theta(\theta(-x_1) + \theta(-x_2) - 1) + 1 G ( x 1 , x 2 ) = − θ ( θ ( − x 1 ) + θ ( − x 2 ) − 1 ) + 1
G ( x ) = θ ( ∑ i = 0 n θ ( x i ) − n ) G(x) = \theta\left(\sum_{i=0}^n \theta(x_i) - n\right) G ( x ) = θ ( ∑ i = 0 n θ ( x i ) − n )
著者はTensorFlowを用いた実際の計算を行ったが、理論と実践のギャップを指摘している:
活性化関数の選択 :シグモイド関数 1 1 + exp ( − 20 x ) \frac{1}{1+\exp(-20x)} 1 + e x p ( − 20 x ) 1 を用いてヘヴィサイド関数を近似訓練戦略 :確率的勾配降下法を採用し、各ステップで1つの訓練サンプルのみを使用ネットワーク構造 :1層および2層ネットワーク構造をテストネットワークノード数 :10個ノードの単層ネットワーク訓練エポック数 :2000 epochs最適化器 :Adam最適化器損失関数 :平均絶対パーセント誤差実験により、ネットワークがヘヴィサイド表現の恒等関数を学習できることが確認された。図1は、バイアス値が初期状態(青点)から期待される線形配列(オレンジ点)へ収束する過程を示している。
f ( b , c ) = b 2 + c f(b,c) = b^2 + c f ( b , c ) = b 2 + c の写像学習において:
2層ネットワーク(3個および30個ノード) 40個の訓練サンプル、定義域 [ 0 , 2 ] × [ 0 , 2 ] [0,2] \times [0,2] [ 0 , 2 ] × [ 0 , 2 ] 4000エポック訓練後に良好な一致を達成 実験により、平滑なシグモイド関数で訓練した後、パラメータを真のヘヴィサイド関数に適用しても、特に第二層ネットワークにおいて顕著な差異が生じることが判明した。
論文は以下の関連研究分野を引用している:
構成的数学 :ヘヴィサイド化を構成的数学方法の強化版として位置付け計算物理学 :ビッグデータ分析および計算実験との区別結式理論 :代数数および判別式計算との関連性機械学習理論 :勾配降下法の数学的基礎ヘヴィサイド化の実現可能性 :多くの基本的な数学演算がヘヴィサイド関数の反復として表現可能であることを証明3つの核心的問題カテゴリー :
A) 各種問題のヘヴィサイド化(構成的) B) 代数公式の発見(概念的) C) 合理的答えと不合理的答えの区別(概念的) ゲージ不変性問題 :複数の等価なヘヴィサイド表現が存在し、適切な規範の選択が必要収束性問題 :勾配降下法がヘヴィサイド表現の存在下でも正解を見つけるとは限らない人的介入の必要性 :実際の応用では依然として多くの人的経験と技巧が必要平滑化の影響 :数値計算における関数の平滑化が結果の正確性に影響を与える高次方程式のヘヴィサイド化 :3次、4次およびそれ以上の方程式への拡張より複雑な代数構造 :判別式、結式などのヘヴィサイド表現の探索科学的趣味の機械化 :機械が人間のような科学的美意識を発展させることができるかどうかの研究概念的革新性 :「ヘヴィサイド化」という全く新しい概念を提案し、科学における機械学習の応用に新たな道を開く理論的深さ :数学的基礎から出発し、ヘヴィサイド関数の演算体系を体系的に構築学際的視点 :機械学習、数学物理学、構成的数学を有機的に結合実践的検証 :TensorFlow実験を通じて理論の実現可能性を検証応用範囲の制限 :現在のところ相対的に単純な数学問題のみ処理可能であり、真の科学発見にはまだ遠い計算複雑性 :ヘヴィサイド表現はしばしば無限級数を必要とし、実際の計算では打ち切りが必要収束保証の欠如 :勾配降下法が正解に収束することの理論的保証がない人機界限の曖昧性 :実験では依然として多くの人的介入が必要であり、真の自動化を実現していない理論的貢献 :機械学習の数学的基礎に新たな視点を提供方法論的価値 :ヘヴィサイド化方法は他の科学計算問題の解決に着想を与える可能性哲学的意義 :人工知能が科学的創造力を持ちうるかという深層的問題に触れている記号計算 :精密な記号表現が必要な数学問題に適切構成的証明 :構成的方法を必要とする数学証明に利用可能科学教育 :機械学習の数学的基礎を理解するための教育ツールとして活用可能反復ヘヴィサイド表現 :複雑な関数を単純な階段関数の組み合わせに分解演算のネットワーク化 :従来の数学演算をニューラルネットワークが処理可能な形式に変換零点検出アルゴリズム :離散格子上で関数の零点を検出する体系的方法を提供ゲージ理論の応用 :物理学における規範不変性の概念を機械学習に導入論文は基本的なヘヴィサイド関数から複雑な数学演算への完全な階層構造を確立している:
ヘヴィサイド → 論理演算 → 算術演算 → 代数演算 → 科学問題 \text{ヘヴィサイド} \rightarrow \text{論理演算} \rightarrow \text{算術演算} \rightarrow \text{代数演算} \rightarrow \text{科学問題} ヘヴィサイド → 論理演算 → 算術演算 → 代数演算 → 科学問題
この階層的構成は、科学問題を処理する機械学習に対して体系的な数学的基礎を提供している。
論文は以下の重要な文献を引用している:
Gelfand, Kapranov, Zelevinsky: "Discriminants, Resultants, and Multidimensional Determinants" Dolotin, Morozov: "Introduction to Non-Linear Algebra" Morozov, Shakirov: "New and Old Results in Resultant Theory" Ruelle: "Post-human Mathematics" 総合評価 :これは高度な独創性と理論的深さを備えた論文であり、科学における機械学習の応用のための新しい数学的基礎の確立を試みている。現在の結果はまだ初期段階ではあるが、提案されたヘヴィサイド化の概念と方法論は重要な理論的価値と示唆的意義を持つ。論文の学際的特性と人工知能の哲学的問題に対する思考は、技術的レベルを超えた学術的価値を有している。