網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

蘋(píng)果渴求的端側(cè)AI殺出黑馬：首個(gè)認(rèn)知模型誕生，4B打平GPT-5.4！

2026-06-09 19:21:28　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

【新智元導(dǎo)讀】在剛過(guò)去的 WWDC 上，蘋(píng)果 Siri 借 AI 重生成為關(guān)鍵詞，「端側(cè)模型」已成趨勢(shì)！更早些時(shí)候，Andrej Karpathy 呼吁把模型的知識(shí)剝離、只保留「認(rèn)知核心」。一家中國(guó)公司稱(chēng)已將這一方向落地——4B 參數(shù)，在群體智能任務(wù)中打出千億級(jí)大模型的效果。端側(cè)認(rèn)知模型到底能改變什么？

昨晚，Siri 借谷歌的 1.2 萬(wàn)億參數(shù) Gemini 重生了。

但另一頭，亞馬遜卻關(guān)停了引發(fā)巨大爭(zhēng)議的內(nèi)部 AI 排行榜——員工大量使用 AI 工具，算力開(kāi)銷(xiāo)飆升到管理層坐不住的地步。

Token 成本成為 AI 大規(guī)模落地最硬的一道門(mén)檻。

Andrej Karpathy 之前在訪談中給出了一個(gè)方向：把模型里的海量知識(shí)剝離掉，只保留一個(gè)會(huì)思考、會(huì)規(guī)劃、知道自己不知道什么的「認(rèn)知核心」，1B 級(jí)別的參數(shù)就夠。

https://www.youtube.com/watch?v=lXUZvyajciY

這個(gè)方向正在被驗(yàn)證。

一個(gè) 4B 參數(shù)的模型，在群體智能任務(wù)中打出了與 GPT-5.4 等千億級(jí)大模型等效的結(jié)果，且支持端側(cè)部署。

它來(lái)自一家創(chuàng)始團(tuán)隊(duì)，曾以 3.6B 參數(shù)擊敗 65B Llama、登頂日本 Hugging Face 排行榜。

這次，他們做出了行業(yè)首個(gè)端側(cè)認(rèn)知模型。

Karpathy 的預(yù)言與算力的賬單

算力成本的壓力已經(jīng)從技術(shù)議題變成財(cái)務(wù)議題，亞馬遜的案例只是縮影。

亞馬遜員工通過(guò)內(nèi)部 AI 工具頻繁調(diào)用大模型推理能力，推高了整體算力支出，管理層不得不緊急叫停排行榜機(jī)制以遏制用量。

https://www.ft.com/content/b1a62a7f-6df5-4c90-94ce-64ce9c9961b6?syn-25a6b1a6=1

行業(yè)正在經(jīng)歷第一次「Token 大撤退」，部分公司的單日算力消耗已觸及億元量級(jí)。

大模型的商業(yè)模型正撞上一堵結(jié)構(gòu)性的墻：能力越強(qiáng)、推理鏈越深，單次調(diào)用的成本越高。

GPU 成本營(yíng)收比（GPU Cost / Revenue）是所有 AI 公司的命門(mén)指標(biāo)，模型參數(shù)持續(xù)膨脹的趨勢(shì)只會(huì)讓這個(gè)指標(biāo)更難看。

Karpathy 的思路指向了另一條路：他提出需要把模型中的「記憶 / 知識(shí)」剝離掉，保留他所說(shuō)的「認(rèn)知核心」——

一個(gè)被剝離了海量事實(shí)、知識(shí)，但保留了思考算法、智能魔力、問(wèn)題解決策略的實(shí)體。

他判斷，即便是 10 億參數(shù)的規(guī)模，也能實(shí)現(xiàn)高效的類(lèi)人思考：

它會(huì)像人類(lèi)一樣思考……如果你問(wèn)它一個(gè)事實(shí)性問(wèn)題，它可能需要查閱——它知道自己不知道，并且會(huì)去查。

這段話在技術(shù)社區(qū)引發(fā)廣泛討論。

方向上的共識(shí)正在形成，但能將「認(rèn)知核心」從概念推到可部署產(chǎn)品的團(tuán)隊(duì)，才是真正的變量。

4B 打平千億級(jí)

新程 Alpha 做了什么

把 Karpathy 描述的「認(rèn)知核心」從概念推到產(chǎn)品的，是明日新程（Nextie）。

這家公司對(duì)開(kāi)源推理模型進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練，將知識(shí)與認(rèn)知解耦——?jiǎng)冸x模型中記憶性的知識(shí)儲(chǔ)備，強(qiáng)化泛化和抽象思考能力。

產(chǎn)出的模型被命名為新程 Alpha，參數(shù)規(guī)模 4B，已完成訓(xùn)練并部署上線，是行業(yè)中首個(gè)被定義為「認(rèn)知模型」的產(chǎn)品。

具體到其訓(xùn)練方法，其實(shí)是一個(gè)不常見(jiàn)的起點(diǎn)。

明日新程團(tuán)隊(duì)整理了 1800 年至 2020 年、跨越 220 年的人類(lèi)學(xué)術(shù)論文，試圖梳理出群體智能的演化脈絡(luò)，為技術(shù)路線提供參照系。

在這套研究的基礎(chǔ)上對(duì)開(kāi)源推理模型做強(qiáng)化學(xué)習(xí)，專(zhuān)注于提升泛化和抽象能力。

舉一個(gè)直觀的例子：經(jīng)過(guò)訓(xùn)練的模型能將圍棋選手的決策模式遷移到日常生活場(chǎng)景——Karpathy 所說(shuō)的「保留思考算法」，在這里有了具體的技術(shù)實(shí)現(xiàn)。

效果層面，新程 Alpha 在群體智能任務(wù)（辯論、反思、挑戰(zhàn)、投票等環(huán)節(jié)）中，4B 參數(shù)達(dá)到了與 GPT-5.4 等大模型等效的輸出質(zhì)量，算力消耗和推理速度優(yōu)勢(shì)顯著。

更值得關(guān)注的是這個(gè)模型解鎖的場(chǎng)景空間，有三層遞進(jìn)的意義。

第一層，多智能體決策質(zhì)量提升。

在 Harness 決策框架中，使用認(rèn)知模型的輸出效果優(yōu)于推理模型。

底層模型從「推理」升級(jí)為「認(rèn)知」，帶來(lái)的是多智能體協(xié)作系統(tǒng)中決策鏈條整體質(zhì)量的躍升。

第二層，算力成本量級(jí)縮減。

4B 相較于千億參數(shù)模型，云端部署的算力開(kāi)銷(xiāo)大幅降低。

新程 Alpha 同時(shí)支持端側(cè)部署——MacBook、具身智能設(shè)備均可直接運(yùn)行，算力成本由此轉(zhuǎn)化為電力成本。

這對(duì)具身智能領(lǐng)域意義尤為突出：用千億參數(shù)大模型驅(qū)動(dòng)一個(gè)家務(wù)機(jī)器人，每一次「思考」都在消耗大量 Token，綜合成本可能比請(qǐng)人做家務(wù)還貴。

4B 端側(cè)部署，從根本上改寫(xiě)了這筆賬。

第三層，主動(dòng)式（Proactive）場(chǎng)景解鎖。

當(dāng)前絕大多數(shù) AI 產(chǎn)品運(yùn)行在響應(yīng)式（Reactive）模式下——用戶發(fā)指令，模型響應(yīng)。

Proactive 模式意味著智能體自主決策和執(zhí)行任務(wù)，無(wú)需等待命令，商業(yè)規(guī)模遠(yuǎn)超 Reactive，但過(guò)去始終被算力成本擋在門(mén)外。

新程 Alpha 支持 24 小時(shí)不間斷運(yùn)行，成本可控，讓此前因?yàn)樘F而擱置的主動(dòng)式智能體成為可能。

團(tuán)隊(duì)底牌與賽道卡位

明日新程由微軟小冰創(chuàng)始團(tuán)隊(duì)創(chuàng)立。

這個(gè)團(tuán)隊(duì)的標(biāo)簽是「用小參數(shù)贏大參數(shù)」——此前訓(xùn)練的開(kāi)源模型 rinna（日本小冰）以 3.6B 參數(shù)登頂日本 Hugging Face 排行榜第一名，擊敗了 65B 參數(shù)的 Llama。

新程 Alpha 用 4B 打平千億級(jí)大模型的效果，延續(xù)的是同一套技術(shù)基因。

明日新程重倉(cāng)布局的賽道是——Harness 群體多智能體。

這條賽道正在獲得頭部資本的確認(rèn)——2026 年 3 月，OpenAI 投資了初創(chuàng)公司 Isara，直接將其估值推至 6.5 億美元，Isara 的研究方向正是多智能體協(xié)同與群體智能。

https://www.wsj.com/tech/ai/openai-backs-new-ai-startup-seeking-bot-army-breakthroughs-a0b1fedc

在該領(lǐng)域的智能深度評(píng)測(cè)（IDI）中，明日新程的綜合表現(xiàn)顯著高于任何單一大模型。

資本驗(yàn)證了賽道價(jià)值，評(píng)測(cè)數(shù)據(jù)則標(biāo)定了明日新程在賽道內(nèi)的位置。

兩個(gè)信號(hào)疊加，指向同一個(gè)判斷：群體多智能體是 AI 應(yīng)用層的下一個(gè)高價(jià)值方向，認(rèn)知模型是驅(qū)動(dòng)它的關(guān)鍵基礎(chǔ)設(shè)施。

認(rèn)知模型改變的

不只是參數(shù)，更是賬本

GPU 成本營(yíng)收比（GPU Cost / Revenue）是懸在所有 AI 公司頭上的達(dá)摩克利斯之劍。

認(rèn)知模型提供的解法，核心指向經(jīng)濟(jì)模型的重構(gòu)——用 4B 達(dá)到千億級(jí)才能達(dá)到的效果，意味著同樣的輸出質(zhì)量對(duì)應(yīng)一套完全不同的成本結(jié)構(gòu)。

明日新程在采訪中透露，團(tuán)隊(duì)正在訓(xùn)練泛化能力更強(qiáng)的 8B 認(rèn)知模型。

如果 4B 已經(jīng)能在群體智能任務(wù)中對(duì)標(biāo) GPT-5.4，8B 的能力邊界值得期待。

一個(gè)更深遠(yuǎn)的問(wèn)題留給整個(gè)行業(yè)：當(dāng)端側(cè)全天候運(yùn)行一個(gè)認(rèn)知模型的成本降至可忽略的水平，今天所有基于「用戶發(fā)指令、模型響應(yīng)」的響應(yīng)式（Reactive）模式設(shè)計(jì)的 AI 產(chǎn)品，可能都需要重新審視自己的產(chǎn)品形態(tài)。

主動(dòng)式（Proactive）智能體的商業(yè)想象空間，遠(yuǎn)超當(dāng)前響應(yīng)式（Reactive）智能體下的一切。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.