機(jī)器之心編輯部
僅用一個簡單二元運(yùn)算符加上常數(shù) 1,就能推導(dǎo)出現(xiàn)代科學(xué)計算器上的所有基本函數(shù)了?
最近,計算機(jī)科學(xué)領(lǐng)域被一個新研究打破了認(rèn)知。
人們認(rèn)為,這種能將復(fù)雜數(shù)學(xué)系統(tǒng)極度簡化的底層突破極具革命性。該論文的作者 Andrzej Odrzywo?ek 來自波蘭雅蓋隆大學(xué)(Uniwersytet Jagielloński)。
![]()
- 論文標(biāo)題:All elementary functions from a single operator
- 論文鏈接:https://arxiv.org/pdf/2603.21852v2
在數(shù)字電路的世界里,有一個廣為人知的奇跡:NAND 門。只需要這一種雙輸入邏輯門,就能搭建出任何布爾電路。整個計算機(jī)的底層邏輯,全部可以由同一種基本單元堆疊而成。
1913 年 Henry Sheffer 發(fā)現(xiàn)的「Sheffer 豎線」,揭示了一個令人震撼的事實:看似紛繁復(fù)雜的數(shù)字邏輯世界,本質(zhì)上只有一個原子。
那數(shù)學(xué)呢?
論文作者 Andrzej Odrzywo?ek 嘗試將繁雜的數(shù)學(xué)運(yùn)算符徹底拆解,并且成功找到了數(shù)學(xué)的「上帝粒子」
![]()
![]()
![]()
這可能是解構(gòu)現(xiàn)有數(shù)學(xué)運(yùn)算的開始。
嘗試「拆解計算器」
論文的方法是:從一張標(biāo)準(zhǔn)的科學(xué)計算器功能清單出發(fā) —— 包含 36 個原語(命名常量、一元函數(shù)和二元運(yùn)算符),然后逐一進(jìn)行「消融測試」:每次移除一個元素,檢驗剩余集合是否仍能重建所有原始功能。
這個過程并非一帆風(fēng)順。論文將縮減過程記錄為一個遞減序列:
- Calc 3:6 個原語(取反、倒數(shù)、exp、ln、加法),首次超越了 Wolfram Language 的指令集
- Calc 2:進(jìn)一步縮減至 3 個原語(exp、ln、減法)
- Calc 1:換了一條路,使用二元冪運(yùn)算及其逆(二元對數(shù))作為基礎(chǔ),需要 e 或 π 作為終端常量
- Calc 0:將常數(shù) e 吸收進(jìn) exp 函數(shù)本身,僅剩 3 個原語
每一步縮減都讓「單一運(yùn)算符可能存在」的猜想變得更加可信。最終,在 Calc 0 的啟發(fā)下,研究者開始枚舉初等二元函數(shù)作為候選單運(yùn)算符,配合同樣生成的常數(shù)逐一測試。
經(jīng)過大量失敗和若干誤報之后,他找到了答案:
![]()
這個被命名為EML(Exp-Minus-Log)的雙輸入運(yùn)算符,配合常數(shù) 1,構(gòu)成了完整的初等函數(shù)基礎(chǔ)
換句話說,一臺只有兩個按鈕 ——EML 和 1—— 的計算器,能完成今天任何科學(xué)計算器所能做的一切。
EML 并非唯一解。論文還報告了它的兩個「近親」:
![]()
EML 生萬物
理解 EML 的威力,關(guān)鍵在于看它如何逐層構(gòu)建出那些我們熟悉的數(shù)學(xué)對象。
![]()
![]()
![]()
![]()
上圖展示了完整的「系統(tǒng)發(fā)育樹」(phylogenetic tree):從 EML 這個「最后共同祖先」(LUCA)出發(fā),螺旋展開,每一個箭頭代表一次 EML 組合操作,逐步衍生出全部 36 個原語。粗箭頭標(biāo)記的是直接由 EML 和 1 構(gòu)成的表達(dá)式,細(xì)箭頭則依賴中間產(chǎn)物。
在形式語言層面,EML 表達(dá)式的文法簡潔到令人難以置信:
![]()
這意味著每一個初等函數(shù)表達(dá)式,本質(zhì)上都是一棵由完全相同的節(jié)點構(gòu)成的滿二叉樹
![]()
不同函數(shù)所需的樹深度差異很大:指數(shù)函數(shù)只需深度 1,而乘法則需要深度 8。大多數(shù)常用數(shù)學(xué)函數(shù)落在深度 5–9 的區(qū)間。這種深度的參差反映了不同函數(shù)在 EML 表示下的「編碼距離」。
從數(shù)學(xué)到機(jī)器學(xué)習(xí)
EML 可能在機(jī)器學(xué)習(xí)領(lǐng)域有著影響力巨大的潛在應(yīng)用。
現(xiàn)代符號回歸(Symbolic Regression)方法試圖從數(shù)據(jù)中發(fā)現(xiàn)閉式表達(dá)式(closed-form formula),但其搜索空間通常涉及多種異構(gòu)算子,包含加減乘除、三角函數(shù)、指數(shù)對數(shù)等等。算子集選少了可能不完備,選多了又會讓搜索空間爆炸。
EML 提供了一種全新的思路:既然所有初等函數(shù)都可以用同一種節(jié)點表示,那么搜索空間就變成了統(tǒng)一的二叉樹結(jié)構(gòu)
![]()
實驗結(jié)果:
- 深度 2:100% 成功率,隨機(jī)初始化即可精確恢復(fù)目標(biāo)函數(shù)
- 深度 3–4:約 25% 成功率
- 深度 5:低于 1%(448 次嘗試中未見成功)
- 深度 6:未觀察到成功恢復(fù)
但當(dāng)權(quán)重從正確值附近加入高斯噪聲時,優(yōu)化器在 100% 的運(yùn)行中都能收斂回精確值,即使對于深度 5–6 的樹也是如此。這說明 EML 樹的正確參數(shù)盆地(basin of attraction)確實存在,但問題在于隨機(jī)初始化很難進(jìn)入這一范圍。
一旦訓(xùn)練成功,權(quán)重的「硬化」(hardening)過程會將浮點參數(shù) snap 到精確的二進(jìn)制值(0 或 1),此時均方誤差降至機(jī)器精度量級(~10?32),意味著模型精確恢復(fù)了閉式表達(dá)式。
這帶來了一種可能性:可解釋的符號發(fā)現(xiàn)
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的內(nèi)部機(jī)制是不透明的黑箱,而 EML 樹在訓(xùn)練成功后可以直接被「讀」出來,每一棵訓(xùn)練好的樹都對應(yīng)一個人類可讀的數(shù)學(xué)公式。
論文作者在文章結(jié)尾坦言,EML 可能只是冰山一角。初等函數(shù)這個看似龐雜的家族,其內(nèi)部的統(tǒng)一性遠(yuǎn)超我們的想象。
這一只有兩個按鈕的計算器,也許比我們以為的要強(qiáng)大得多。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.