數(shù)學(xué)的上帝粒子！一個運(yùn)算符能導(dǎo)出所有基本函數(shù)

2026-04-14 18:56:42　來源: 機(jī)器之心Pro

河北舉報

分享至

機(jī)器之心編輯部

僅用一個簡單二元運(yùn)算符加上常數(shù) 1，就能推導(dǎo)出現(xiàn)代科學(xué)計算器上的所有基本函數(shù)了？

最近，計算機(jī)科學(xué)領(lǐng)域被一個新研究打破了認(rèn)知。

人們認(rèn)為，這種能將復(fù)雜數(shù)學(xué)系統(tǒng)極度簡化的底層突破極具革命性。該論文的作者 Andrzej Odrzywo?ek 來自波蘭雅蓋隆大學(xué)（Uniwersytet Jagielloński）。

論文標(biāo)題：All elementary functions from a single operator
論文鏈接：https://arxiv.org/pdf/2603.21852v2

在數(shù)字電路的世界里，有一個廣為人知的奇跡：NAND 門。只需要這一種雙輸入邏輯門，就能搭建出任何布爾電路。整個計算機(jī)的底層邏輯，全部可以由同一種基本單元堆疊而成。

1913 年 Henry Sheffer 發(fā)現(xiàn)的「Sheffer 豎線」，揭示了一個令人震撼的事實：看似紛繁復(fù)雜的數(shù)字邏輯世界，本質(zhì)上只有一個原子。

那數(shù)學(xué)呢？

論文作者 Andrzej Odrzywo?ek 嘗試將繁雜的數(shù)學(xué)運(yùn)算符徹底拆解，并且成功找到了數(shù)學(xué)的「上帝粒子」

這可能是解構(gòu)現(xiàn)有數(shù)學(xué)運(yùn)算的開始。

嘗試「拆解計算器」

論文的方法是：從一張標(biāo)準(zhǔn)的科學(xué)計算器功能清單出發(fā) —— 包含 36 個原語（命名常量、一元函數(shù)和二元運(yùn)算符），然后逐一進(jìn)行「消融測試」：每次移除一個元素，檢驗剩余集合是否仍能重建所有原始功能。

這個過程并非一帆風(fēng)順。論文將縮減過程記錄為一個遞減序列：

Calc 3：6 個原語（取反、倒數(shù)、exp、ln、加法），首次超越了 Wolfram Language 的指令集
Calc 2：進(jìn)一步縮減至 3 個原語（exp、ln、減法）
Calc 1：換了一條路，使用二元冪運(yùn)算及其逆（二元對數(shù)）作為基礎(chǔ)，需要 e 或 π 作為終端常量
Calc 0：將常數(shù) e 吸收進(jìn) exp 函數(shù)本身，僅剩 3 個原語

每一步縮減都讓「單一運(yùn)算符可能存在」的猜想變得更加可信。最終，在 Calc 0 的啟發(fā)下，研究者開始枚舉初等二元函數(shù)作為候選單運(yùn)算符，配合同樣生成的常數(shù)逐一測試。

經(jīng)過大量失敗和若干誤報之后，他找到了答案：

這個被命名為EML（Exp-Minus-Log）的雙輸入運(yùn)算符，配合常數(shù) 1，構(gòu)成了完整的初等函數(shù)基礎(chǔ)

換句話說，一臺只有兩個按鈕 ——EML 和 1—— 的計算器，能完成今天任何科學(xué)計算器所能做的一切。

EML 并非唯一解。論文還報告了它的兩個「近親」：

EML 生萬物

理解 EML 的威力，關(guān)鍵在于看它如何逐層構(gòu)建出那些我們熟悉的數(shù)學(xué)對象。

上圖展示了完整的「系統(tǒng)發(fā)育樹」（phylogenetic tree）：從 EML 這個「最后共同祖先」（LUCA）出發(fā)，螺旋展開，每一個箭頭代表一次 EML 組合操作，逐步衍生出全部 36 個原語。粗箭頭標(biāo)記的是直接由 EML 和 1 構(gòu)成的表達(dá)式，細(xì)箭頭則依賴中間產(chǎn)物。

在形式語言層面，EML 表達(dá)式的文法簡潔到令人難以置信：

這意味著每一個初等函數(shù)表達(dá)式，本質(zhì)上都是一棵由完全相同的節(jié)點構(gòu)成的滿二叉樹

不同函數(shù)所需的樹深度差異很大：指數(shù)函數(shù)只需深度 1，而乘法則需要深度 8。大多數(shù)常用數(shù)學(xué)函數(shù)落在深度 5–9 的區(qū)間。這種深度的參差反映了不同函數(shù)在 EML 表示下的「編碼距離」。

從數(shù)學(xué)到機(jī)器學(xué)習(xí)

EML 可能在機(jī)器學(xué)習(xí)領(lǐng)域有著影響力巨大的潛在應(yīng)用。

現(xiàn)代符號回歸（Symbolic Regression）方法試圖從數(shù)據(jù)中發(fā)現(xiàn)閉式表達(dá)式（closed-form formula），但其搜索空間通常涉及多種異構(gòu)算子，包含加減乘除、三角函數(shù)、指數(shù)對數(shù)等等。算子集選少了可能不完備，選多了又會讓搜索空間爆炸。

EML 提供了一種全新的思路：既然所有初等函數(shù)都可以用同一種節(jié)點表示，那么搜索空間就變成了統(tǒng)一的二叉樹結(jié)構(gòu)

實驗結(jié)果：

深度 2：100% 成功率，隨機(jī)初始化即可精確恢復(fù)目標(biāo)函數(shù)
深度 3–4：約 25% 成功率
深度 5：低于 1%（448 次嘗試中未見成功）
深度 6：未觀察到成功恢復(fù)

但當(dāng)權(quán)重從正確值附近加入高斯噪聲時，優(yōu)化器在 100% 的運(yùn)行中都能收斂回精確值，即使對于深度 5–6 的樹也是如此。這說明 EML 樹的正確參數(shù)盆地（basin of attraction）確實存在，但問題在于隨機(jī)初始化很難進(jìn)入這一范圍。

一旦訓(xùn)練成功，權(quán)重的「硬化」（hardening）過程會將浮點參數(shù) snap 到精確的二進(jìn)制值（0 或 1），此時均方誤差降至機(jī)器精度量級（~10?32），意味著模型精確恢復(fù)了閉式表達(dá)式。

這帶來了一種可能性：可解釋的符號發(fā)現(xiàn)

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的內(nèi)部機(jī)制是不透明的黑箱，而 EML 樹在訓(xùn)練成功后可以直接被「讀」出來，每一棵訓(xùn)練好的樹都對應(yīng)一個人類可讀的數(shù)學(xué)公式。

論文作者在文章結(jié)尾坦言，EML 可能只是冰山一角。初等函數(shù)這個看似龐雜的家族，其內(nèi)部的統(tǒng)一性遠(yuǎn)超我們的想象。

這一只有兩個按鈕的計算器，也許比我們以為的要強(qiáng)大得多。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.