機器之心編輯部
僅用一個簡單二元運算符加上常數 1,就能推導出現代科學計算器上的所有基本函數了?
最近,計算機科學領域被一個新研究打破了認知。
人們認為,這種能將復雜數學系統極度簡化的底層突破極具革命性。該論文的作者 Andrzej Odrzywo?ek 來自波蘭雅蓋隆大學(Uniwersytet Jagielloński)。
![]()
- 論文標題:All elementary functions from a single operator
- 論文鏈接:https://arxiv.org/pdf/2603.21852v2
在數字電路的世界里,有一個廣為人知的奇跡:NAND 門。只需要這一種雙輸入邏輯門,就能搭建出任何布爾電路。整個計算機的底層邏輯,全部可以由同一種基本單元堆疊而成。
1913 年 Henry Sheffer 發現的「Sheffer 豎線」,揭示了一個令人震撼的事實:看似紛繁復雜的數字邏輯世界,本質上只有一個原子。
那數學呢?
論文作者 Andrzej Odrzywo?ek 嘗試將繁雜的數學運算符徹底拆解,并且成功找到了數學的「上帝粒子」
![]()
![]()
![]()
這可能是解構現有數學運算的開始。
嘗試「拆解計算器」
論文的方法是:從一張標準的科學計算器功能清單出發 —— 包含 36 個原語(命名常量、一元函數和二元運算符),然后逐一進行「消融測試」:每次移除一個元素,檢驗剩余集合是否仍能重建所有原始功能。
這個過程并非一帆風順。論文將縮減過程記錄為一個遞減序列:
- Calc 3:6 個原語(取反、倒數、exp、ln、加法),首次超越了 Wolfram Language 的指令集
- Calc 2:進一步縮減至 3 個原語(exp、ln、減法)
- Calc 1:換了一條路,使用二元冪運算及其逆(二元對數)作為基礎,需要 e 或 π 作為終端常量
- Calc 0:將常數 e 吸收進 exp 函數本身,僅剩 3 個原語
每一步縮減都讓「單一運算符可能存在」的猜想變得更加可信。最終,在 Calc 0 的啟發下,研究者開始枚舉初等二元函數作為候選單運算符,配合同樣生成的常數逐一測試。
經過大量失敗和若干誤報之后,他找到了答案:
![]()
這個被命名為EML(Exp-Minus-Log)的雙輸入運算符,配合常數 1,構成了完整的初等函數基礎
換句話說,一臺只有兩個按鈕 ——EML 和 1—— 的計算器,能完成今天任何科學計算器所能做的一切。
EML 并非唯一解。論文還報告了它的兩個「近親」:
![]()
EML 生萬物
理解 EML 的威力,關鍵在于看它如何逐層構建出那些我們熟悉的數學對象。
![]()
![]()
![]()
![]()
上圖展示了完整的「系統發育樹」(phylogenetic tree):從 EML 這個「最后共同祖先」(LUCA)出發,螺旋展開,每一個箭頭代表一次 EML 組合操作,逐步衍生出全部 36 個原語。粗箭頭標記的是直接由 EML 和 1 構成的表達式,細箭頭則依賴中間產物。
在形式語言層面,EML 表達式的文法簡潔到令人難以置信:
![]()
這意味著每一個初等函數表達式,本質上都是一棵由完全相同的節點構成的滿二叉樹
![]()
不同函數所需的樹深度差異很大:指數函數只需深度 1,而乘法則需要深度 8。大多數常用數學函數落在深度 5–9 的區間。這種深度的參差反映了不同函數在 EML 表示下的「編碼距離」。
從數學到機器學習
EML 可能在機器學習領域有著影響力巨大的潛在應用。
現代符號回歸(Symbolic Regression)方法試圖從數據中發現閉式表達式(closed-form formula),但其搜索空間通常涉及多種異構算子,包含加減乘除、三角函數、指數對數等等。算子集選少了可能不完備,選多了又會讓搜索空間爆炸。
EML 提供了一種全新的思路:既然所有初等函數都可以用同一種節點表示,那么搜索空間就變成了統一的二叉樹結構
![]()
實驗結果:
- 深度 2:100% 成功率,隨機初始化即可精確恢復目標函數
- 深度 3–4:約 25% 成功率
- 深度 5:低于 1%(448 次嘗試中未見成功)
- 深度 6:未觀察到成功恢復
但當權重從正確值附近加入高斯噪聲時,優化器在 100% 的運行中都能收斂回精確值,即使對于深度 5–6 的樹也是如此。這說明 EML 樹的正確參數盆地(basin of attraction)確實存在,但問題在于隨機初始化很難進入這一范圍。
一旦訓練成功,權重的「硬化」(hardening)過程會將浮點參數 snap 到精確的二進制值(0 或 1),此時均方誤差降至機器精度量級(~10?32),意味著模型精確恢復了閉式表達式。
這帶來了一種可能性:可解釋的符號發現
傳統神經網絡的內部機制是不透明的黑箱,而 EML 樹在訓練成功后可以直接被「讀」出來,每一棵訓練好的樹都對應一個人類可讀的數學公式。
論文作者在文章結尾坦言,EML 可能只是冰山一角。初等函數這個看似龐雜的家族,其內部的統一性遠超我們的想象。
這一只有兩個按鈕的計算器,也許比我們以為的要強大得多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.