![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】在剛過(guò)去的 WWDC 上,蘋(píng)果 Siri 借 AI 重生成為關(guān)鍵詞,「端側(cè)模型」已成趨勢(shì)!更早些時(shí)候,Andrej Karpathy 呼吁把模型的知識(shí)剝離、只保留「認(rèn)知核心」。一家中國(guó)公司稱(chēng)已將這一方向落地——4B 參數(shù),在群體智能任務(wù)中打出千億級(jí)大模型的效果。端側(cè)認(rèn)知模型到底能改變什么?
昨晚,Siri 借谷歌的 1.2 萬(wàn)億參數(shù) Gemini 重生了。
但另一頭,亞馬遜卻關(guān)停了引發(fā)巨大爭(zhēng)議的內(nèi)部 AI 排行榜——員工大量使用 AI 工具,算力開(kāi)銷(xiāo)飆升到管理層坐不住的地步。
Token 成本成為 AI 大規(guī)模落地最硬的一道門(mén)檻。
Andrej Karpathy 之前在訪談中給出了一個(gè)方向:把模型里的海量知識(shí)剝離掉,只保留一個(gè)會(huì)思考、會(huì)規(guī)劃、知道自己不知道什么的「認(rèn)知核心」,1B 級(jí)別的參數(shù)就夠。
![]()
https://www.youtube.com/watch?v=lXUZvyajciY
這個(gè)方向正在被驗(yàn)證。
一個(gè) 4B 參數(shù)的模型,在群體智能任務(wù)中打出了與 GPT-5.4 等千億級(jí)大模型等效的結(jié)果,且支持端側(cè)部署。
它來(lái)自一家創(chuàng)始團(tuán)隊(duì),曾以 3.6B 參數(shù)擊敗 65B Llama、登頂日本 Hugging Face 排行榜。
這次,他們做出了行業(yè)首個(gè)端側(cè)認(rèn)知模型。
Karpathy 的預(yù)言與算力的賬單
算力成本的壓力已經(jīng)從技術(shù)議題變成財(cái)務(wù)議題,亞馬遜的案例只是縮影。
亞馬遜員工通過(guò)內(nèi)部 AI 工具頻繁調(diào)用大模型推理能力,推高了整體算力支出,管理層不得不緊急叫停排行榜機(jī)制以遏制用量。
![]()
https://www.ft.com/content/b1a62a7f-6df5-4c90-94ce-64ce9c9961b6?syn-25a6b1a6=1
行業(yè)正在經(jīng)歷第一次「Token 大撤退」,部分公司的單日算力消耗已觸及億元量級(jí)。
大模型的商業(yè)模型正撞上一堵結(jié)構(gòu)性的墻:能力越強(qiáng)、推理鏈越深,單次調(diào)用的成本越高。
GPU 成本營(yíng)收比(GPU Cost / Revenue)是所有 AI 公司的命門(mén)指標(biāo),模型參數(shù)持續(xù)膨脹的趨勢(shì)只會(huì)讓這個(gè)指標(biāo)更難看。
Karpathy 的思路指向了另一條路:他提出需要把模型中的「記憶 / 知識(shí)」剝離掉,保留他所說(shuō)的「認(rèn)知核心」——
一個(gè)被剝離了海量事實(shí)、知識(shí),但保留了思考算法、智能魔力、問(wèn)題解決策略的實(shí)體。
他判斷,即便是 10 億參數(shù)的規(guī)模,也能實(shí)現(xiàn)高效的類(lèi)人思考:
它會(huì)像人類(lèi)一樣思考……如果你問(wèn)它一個(gè)事實(shí)性問(wèn)題,它可能需要查閱——它知道自己不知道,并且會(huì)去查。
這段話在技術(shù)社區(qū)引發(fā)廣泛討論。
方向上的共識(shí)正在形成,但能將「認(rèn)知核心」從概念推到可部署產(chǎn)品的團(tuán)隊(duì),才是真正的變量。
![]()
4B 打平千億級(jí)
新程 Alpha 做了什么
把 Karpathy 描述的「認(rèn)知核心」從概念推到產(chǎn)品的,是明日新程(Nextie)。
這家公司對(duì)開(kāi)源推理模型進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,將知識(shí)與認(rèn)知解耦——?jiǎng)冸x模型中記憶性的知識(shí)儲(chǔ)備,強(qiáng)化泛化和抽象思考能力。
產(chǎn)出的模型被命名為新程 Alpha,參數(shù)規(guī)模 4B,已完成訓(xùn)練并部署上線,是行業(yè)中首個(gè)被定義為「認(rèn)知模型」的產(chǎn)品。
具體到其訓(xùn)練方法,其實(shí)是一個(gè)不常見(jiàn)的起點(diǎn)。
明日新程團(tuán)隊(duì)整理了 1800 年至 2020 年、跨越 220 年的人類(lèi)學(xué)術(shù)論文,試圖梳理出群體智能的演化脈絡(luò),為技術(shù)路線提供參照系。
在這套研究的基礎(chǔ)上對(duì)開(kāi)源推理模型做強(qiáng)化學(xué)習(xí),專(zhuān)注于提升泛化和抽象能力。
舉一個(gè)直觀的例子:經(jīng)過(guò)訓(xùn)練的模型能將圍棋選手的決策模式遷移到日常生活場(chǎng)景——Karpathy 所說(shuō)的「保留思考算法」,在這里有了具體的技術(shù)實(shí)現(xiàn)。
效果層面,新程 Alpha 在群體智能任務(wù)(辯論、反思、挑戰(zhàn)、投票等環(huán)節(jié))中,4B 參數(shù)達(dá)到了與 GPT-5.4 等大模型等效的輸出質(zhì)量,算力消耗和推理速度優(yōu)勢(shì)顯著。
更值得關(guān)注的是這個(gè)模型解鎖的場(chǎng)景空間,有三層遞進(jìn)的意義。
第一層,多智能體決策質(zhì)量提升。
在 Harness 決策框架中,使用認(rèn)知模型的輸出效果優(yōu)于推理模型。
底層模型從「推理」升級(jí)為「認(rèn)知」,帶來(lái)的是多智能體協(xié)作系統(tǒng)中決策鏈條整體質(zhì)量的躍升。
第二層,算力成本量級(jí)縮減。
4B 相較于千億參數(shù)模型,云端部署的算力開(kāi)銷(xiāo)大幅降低。
新程 Alpha 同時(shí)支持端側(cè)部署——MacBook、具身智能設(shè)備均可直接運(yùn)行,算力成本由此轉(zhuǎn)化為電力成本。
這對(duì)具身智能領(lǐng)域意義尤為突出:用千億參數(shù)大模型驅(qū)動(dòng)一個(gè)家務(wù)機(jī)器人,每一次「思考」都在消耗大量 Token,綜合成本可能比請(qǐng)人做家務(wù)還貴。
4B 端側(cè)部署,從根本上改寫(xiě)了這筆賬。
第三層,主動(dòng)式(Proactive)場(chǎng)景解鎖。
當(dāng)前絕大多數(shù) AI 產(chǎn)品運(yùn)行在響應(yīng)式(Reactive)模式下——用戶發(fā)指令,模型響應(yīng)。
Proactive 模式意味著智能體自主決策和執(zhí)行任務(wù),無(wú)需等待命令,商業(yè)規(guī)模遠(yuǎn)超 Reactive,但過(guò)去始終被算力成本擋在門(mén)外。
新程 Alpha 支持 24 小時(shí)不間斷運(yùn)行,成本可控,讓此前因?yàn)樘F而擱置的主動(dòng)式智能體成為可能。
![]()
團(tuán)隊(duì)底牌與賽道卡位
明日新程由微軟小冰創(chuàng)始團(tuán)隊(duì)創(chuàng)立。
這個(gè)團(tuán)隊(duì)的標(biāo)簽是「用小參數(shù)贏大參數(shù)」——此前訓(xùn)練的開(kāi)源模型 rinna(日本小冰)以 3.6B 參數(shù)登頂日本 Hugging Face 排行榜第一名,擊敗了 65B 參數(shù)的 Llama。
新程 Alpha 用 4B 打平千億級(jí)大模型的效果,延續(xù)的是同一套技術(shù)基因。
![]()
明日新程重倉(cāng)布局的賽道是——Harness 群體多智能體。
這條賽道正在獲得頭部資本的確認(rèn)——2026 年 3 月,OpenAI 投資了初創(chuàng)公司 Isara,直接將其估值推至 6.5 億美元,Isara 的研究方向正是多智能體協(xié)同與群體智能。
![]()
https://www.wsj.com/tech/ai/openai-backs-new-ai-startup-seeking-bot-army-breakthroughs-a0b1fedc
在該領(lǐng)域的智能深度評(píng)測(cè)(IDI)中,明日新程的綜合表現(xiàn)顯著高于任何單一大模型。
![]()
資本驗(yàn)證了賽道價(jià)值,評(píng)測(cè)數(shù)據(jù)則標(biāo)定了明日新程在賽道內(nèi)的位置。
兩個(gè)信號(hào)疊加,指向同一個(gè)判斷:群體多智能體是 AI 應(yīng)用層的下一個(gè)高價(jià)值方向,認(rèn)知模型是驅(qū)動(dòng)它的關(guān)鍵基礎(chǔ)設(shè)施。
認(rèn)知模型改變的
不只是參數(shù),更是賬本
GPU 成本營(yíng)收比(GPU Cost / Revenue)是懸在所有 AI 公司頭上的達(dá)摩克利斯之劍。
認(rèn)知模型提供的解法,核心指向經(jīng)濟(jì)模型的重構(gòu)——用 4B 達(dá)到千億級(jí)才能達(dá)到的效果,意味著同樣的輸出質(zhì)量對(duì)應(yīng)一套完全不同的成本結(jié)構(gòu)。
明日新程在采訪中透露,團(tuán)隊(duì)正在訓(xùn)練泛化能力更強(qiáng)的 8B 認(rèn)知模型。
如果 4B 已經(jīng)能在群體智能任務(wù)中對(duì)標(biāo) GPT-5.4,8B 的能力邊界值得期待。
一個(gè)更深遠(yuǎn)的問(wèn)題留給整個(gè)行業(yè):當(dāng)端側(cè)全天候運(yùn)行一個(gè)認(rèn)知模型的成本降至可忽略的水平,今天所有基于「用戶發(fā)指令、模型響應(yīng)」的響應(yīng)式(Reactive)模式設(shè)計(jì)的 AI 產(chǎn)品,可能都需要重新審視自己的產(chǎn)品形態(tài)。
主動(dòng)式(Proactive)智能體的商業(yè)想象空間,遠(yuǎn)超當(dāng)前響應(yīng)式(Reactive)智能體下的一切。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.