无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

蘋(píng)果渴求的端側(cè)AI殺出黑馬:首個(gè)認(rèn)知模型誕生,4B打平GPT-5.4!

0
分享至


新智元報(bào)道


【新智元導(dǎo)讀】在剛過(guò)去的 WWDC 上,蘋(píng)果 Siri 借 AI 重生成為關(guān)鍵詞,「端側(cè)模型」已成趨勢(shì)!更早些時(shí)候,Andrej Karpathy 呼吁把模型的知識(shí)剝離、只保留「認(rèn)知核心」。一家中國(guó)公司稱(chēng)已將這一方向落地——4B 參數(shù),在群體智能任務(wù)中打出千億級(jí)大模型的效果。端側(cè)認(rèn)知模型到底能改變什么?

昨晚,Siri 借谷歌的 1.2 萬(wàn)億參數(shù) Gemini 重生了。

但另一頭,亞馬遜卻關(guān)停了引發(fā)巨大爭(zhēng)議的內(nèi)部 AI 排行榜——員工大量使用 AI 工具,算力開(kāi)銷(xiāo)飆升到管理層坐不住的地步。

Token 成本成為 AI 大規(guī)模落地最硬的一道門(mén)檻。

Andrej Karpathy 之前在訪談中給出了一個(gè)方向:把模型里的海量知識(shí)剝離掉,只保留一個(gè)會(huì)思考、會(huì)規(guī)劃、知道自己不知道什么的「認(rèn)知核心」,1B 級(jí)別的參數(shù)就夠。


https://www.youtube.com/watch?v=lXUZvyajciY

這個(gè)方向正在被驗(yàn)證。

一個(gè) 4B 參數(shù)的模型,在群體智能任務(wù)中打出了與 GPT-5.4 等千億級(jí)大模型等效的結(jié)果,且支持端側(cè)部署。

它來(lái)自一家創(chuàng)始團(tuán)隊(duì),曾以 3.6B 參數(shù)擊敗 65B Llama、登頂日本 Hugging Face 排行榜。

這次,他們做出了行業(yè)首個(gè)端側(cè)認(rèn)知模型

Karpathy 的預(yù)言與算力的賬單

算力成本的壓力已經(jīng)從技術(shù)議題變成財(cái)務(wù)議題,亞馬遜的案例只是縮影。

亞馬遜員工通過(guò)內(nèi)部 AI 工具頻繁調(diào)用大模型推理能力,推高了整體算力支出,管理層不得不緊急叫停排行榜機(jī)制以遏制用量。


https://www.ft.com/content/b1a62a7f-6df5-4c90-94ce-64ce9c9961b6?syn-25a6b1a6=1

行業(yè)正在經(jīng)歷第一次「Token 大撤退」,部分公司的單日算力消耗已觸及億元量級(jí)。

大模型的商業(yè)模型正撞上一堵結(jié)構(gòu)性的墻:能力越強(qiáng)、推理鏈越深,單次調(diào)用的成本越高。

GPU 成本營(yíng)收比(GPU Cost / Revenue)是所有 AI 公司的命門(mén)指標(biāo),模型參數(shù)持續(xù)膨脹的趨勢(shì)只會(huì)讓這個(gè)指標(biāo)更難看。

Karpathy 的思路指向了另一條路:他提出需要把模型中的「記憶 / 知識(shí)」剝離掉,保留他所說(shuō)的「認(rèn)知核心」——

一個(gè)被剝離了海量事實(shí)、知識(shí),但保留了思考算法、智能魔力、問(wèn)題解決策略的實(shí)體。

他判斷,即便是 10 億參數(shù)的規(guī)模,也能實(shí)現(xiàn)高效的類(lèi)人思考:

它會(huì)像人類(lèi)一樣思考……如果你問(wèn)它一個(gè)事實(shí)性問(wèn)題,它可能需要查閱——它知道自己不知道,并且會(huì)去查。

這段話在技術(shù)社區(qū)引發(fā)廣泛討論。

方向上的共識(shí)正在形成,但能將「認(rèn)知核心」從概念推到可部署產(chǎn)品的團(tuán)隊(duì),才是真正的變量。


4B 打平千億級(jí)

新程 Alpha 做了什么

把 Karpathy 描述的「認(rèn)知核心」從概念推到產(chǎn)品的,是明日新程(Nextie)。

這家公司對(duì)開(kāi)源推理模型進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,將知識(shí)與認(rèn)知解耦——?jiǎng)冸x模型中記憶性的知識(shí)儲(chǔ)備,強(qiáng)化泛化和抽象思考能力。

產(chǎn)出的模型被命名為新程 Alpha,參數(shù)規(guī)模 4B,已完成訓(xùn)練并部署上線,是行業(yè)中首個(gè)被定義為「認(rèn)知模型」的產(chǎn)品。

具體到其訓(xùn)練方法,其實(shí)是一個(gè)不常見(jiàn)的起點(diǎn)。

明日新程團(tuán)隊(duì)整理了 1800 年至 2020 年、跨越 220 年的人類(lèi)學(xué)術(shù)論文,試圖梳理出群體智能的演化脈絡(luò),為技術(shù)路線提供參照系。

在這套研究的基礎(chǔ)上對(duì)開(kāi)源推理模型做強(qiáng)化學(xué)習(xí),專(zhuān)注于提升泛化和抽象能力。

舉一個(gè)直觀的例子:經(jīng)過(guò)訓(xùn)練的模型能將圍棋選手的決策模式遷移到日常生活場(chǎng)景——Karpathy 所說(shuō)的「保留思考算法」,在這里有了具體的技術(shù)實(shí)現(xiàn)。

效果層面,新程 Alpha 在群體智能任務(wù)(辯論、反思、挑戰(zhàn)、投票等環(huán)節(jié))中,4B 參數(shù)達(dá)到了與 GPT-5.4 等大模型等效的輸出質(zhì)量,算力消耗和推理速度優(yōu)勢(shì)顯著。

更值得關(guān)注的是這個(gè)模型解鎖的場(chǎng)景空間,有三層遞進(jìn)的意義。

第一層,多智能體決策質(zhì)量提升。

在 Harness 決策框架中,使用認(rèn)知模型的輸出效果優(yōu)于推理模型。

底層模型從「推理」升級(jí)為「認(rèn)知」,帶來(lái)的是多智能體協(xié)作系統(tǒng)中決策鏈條整體質(zhì)量的躍升。

第二層,算力成本量級(jí)縮減。

4B 相較于千億參數(shù)模型,云端部署的算力開(kāi)銷(xiāo)大幅降低。

新程 Alpha 同時(shí)支持端側(cè)部署——MacBook、具身智能設(shè)備均可直接運(yùn)行,算力成本由此轉(zhuǎn)化為電力成本。

這對(duì)具身智能領(lǐng)域意義尤為突出:用千億參數(shù)大模型驅(qū)動(dòng)一個(gè)家務(wù)機(jī)器人,每一次「思考」都在消耗大量 Token,綜合成本可能比請(qǐng)人做家務(wù)還貴。

4B 端側(cè)部署,從根本上改寫(xiě)了這筆賬。

第三層,主動(dòng)式(Proactive)場(chǎng)景解鎖。

當(dāng)前絕大多數(shù) AI 產(chǎn)品運(yùn)行在響應(yīng)式(Reactive)模式下——用戶發(fā)指令,模型響應(yīng)。

Proactive 模式意味著智能體自主決策和執(zhí)行任務(wù),無(wú)需等待命令,商業(yè)規(guī)模遠(yuǎn)超 Reactive,但過(guò)去始終被算力成本擋在門(mén)外。

新程 Alpha 支持 24 小時(shí)不間斷運(yùn)行,成本可控,讓此前因?yàn)樘F而擱置的主動(dòng)式智能體成為可能。


團(tuán)隊(duì)底牌與賽道卡位

明日新程由微軟小冰創(chuàng)始團(tuán)隊(duì)創(chuàng)立。

這個(gè)團(tuán)隊(duì)的標(biāo)簽是「用小參數(shù)贏大參數(shù)」——此前訓(xùn)練的開(kāi)源模型 rinna(日本小冰)以 3.6B 參數(shù)登頂日本 Hugging Face 排行榜第一名,擊敗了 65B 參數(shù)的 Llama。

新程 Alpha 用 4B 打平千億級(jí)大模型的效果,延續(xù)的是同一套技術(shù)基因。


明日新程重倉(cāng)布局的賽道是——Harness 群體多智能體。

這條賽道正在獲得頭部資本的確認(rèn)——2026 年 3 月,OpenAI 投資了初創(chuàng)公司 Isara,直接將其估值推至 6.5 億美元,Isara 的研究方向正是多智能體協(xié)同與群體智能。


https://www.wsj.com/tech/ai/openai-backs-new-ai-startup-seeking-bot-army-breakthroughs-a0b1fedc

在該領(lǐng)域的智能深度評(píng)測(cè)(IDI)中,明日新程的綜合表現(xiàn)顯著高于任何單一大模型。


資本驗(yàn)證了賽道價(jià)值,評(píng)測(cè)數(shù)據(jù)則標(biāo)定了明日新程在賽道內(nèi)的位置。

兩個(gè)信號(hào)疊加,指向同一個(gè)判斷:群體多智能體是 AI 應(yīng)用層的下一個(gè)高價(jià)值方向,認(rèn)知模型是驅(qū)動(dòng)它的關(guān)鍵基礎(chǔ)設(shè)施。

認(rèn)知模型改變的

不只是參數(shù),更是賬本

GPU 成本營(yíng)收比(GPU Cost / Revenue)是懸在所有 AI 公司頭上的達(dá)摩克利斯之劍。

認(rèn)知模型提供的解法,核心指向經(jīng)濟(jì)模型的重構(gòu)——用 4B 達(dá)到千億級(jí)才能達(dá)到的效果,意味著同樣的輸出質(zhì)量對(duì)應(yīng)一套完全不同的成本結(jié)構(gòu)。

明日新程在采訪中透露,團(tuán)隊(duì)正在訓(xùn)練泛化能力更強(qiáng)的 8B 認(rèn)知模型。

如果 4B 已經(jīng)能在群體智能任務(wù)中對(duì)標(biāo) GPT-5.4,8B 的能力邊界值得期待。

一個(gè)更深遠(yuǎn)的問(wèn)題留給整個(gè)行業(yè):當(dāng)端側(cè)全天候運(yùn)行一個(gè)認(rèn)知模型的成本降至可忽略的水平,今天所有基于「用戶發(fā)指令、模型響應(yīng)」的響應(yīng)式(Reactive)模式設(shè)計(jì)的 AI 產(chǎn)品,可能都需要重新審視自己的產(chǎn)品形態(tài)。

主動(dòng)式(Proactive)智能體的商業(yè)想象空間,遠(yuǎn)超當(dāng)前響應(yīng)式(Reactive)智能體下的一切。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
羅伊-基恩:如果英格蘭世界杯奪冠,我就直接移民澳大利亞

羅伊-基恩:如果英格蘭世界杯奪冠,我就直接移民澳大利亞

懂球帝
2026-06-09 16:30:09
43歲傅明成世界杯史上第一位中國(guó)籍VAR裁判

43歲傅明成世界杯史上第一位中國(guó)籍VAR裁判

極目新聞
2026-06-09 16:10:26
英格蘭隊(duì)內(nèi)訌!阿森納王牌質(zhì)疑隊(duì)友能力,歐洲杯黃金搭檔徹底鬧掰

英格蘭隊(duì)內(nèi)訌!阿森納王牌質(zhì)疑隊(duì)友能力,歐洲杯黃金搭檔徹底鬧掰

瀾歸序
2026-06-10 06:17:04
劉大錘再曝頂流開(kāi)車(chē)玩手機(jī),觸碰紅線恐遭嚴(yán)懲

劉大錘再曝頂流開(kāi)車(chē)玩手機(jī),觸碰紅線恐遭嚴(yán)懲

科學(xué)發(fā)掘
2026-06-09 14:41:48
被傳與印度塔塔牽手,奇瑞不得不發(fā)聲明,塔塔是個(gè)什么物種?

被傳與印度塔塔牽手,奇瑞不得不發(fā)聲明,塔塔是個(gè)什么物種?

反做空一線
2026-06-10 00:09:09
大學(xué)3年啃饅頭咸菜,爸爸來(lái)電:每月2萬(wàn)不夠花?我看著榨菜愣住了

大學(xué)3年啃饅頭咸菜,爸爸來(lái)電:每月2萬(wàn)不夠花?我看著榨菜愣住了

曉艾故事匯
2026-06-09 09:26:17
有性生活和沒(méi)性生活,身體會(huì)出賣(mài)你!第三個(gè)區(qū)別,很多人沒(méi)想到

有性生活和沒(méi)性生活,身體會(huì)出賣(mài)你!第三個(gè)區(qū)別,很多人沒(méi)想到

健康科普365
2026-05-30 16:30:29
太諷刺了!“我有點(diǎn)慢熱”,男生相親邀約到拉黑對(duì)方,僅用幾分鐘

太諷刺了!“我有點(diǎn)慢熱”,男生相親邀約到拉黑對(duì)方,僅用幾分鐘

火山詩(shī)話
2026-06-09 08:04:45
總決賽分水嶺?裁判漏判,聯(lián)盟調(diào)查!若追加二級(jí)惡犯,馬刺就完了

總決賽分水嶺?裁判漏判,聯(lián)盟調(diào)查!若追加二級(jí)惡犯,馬刺就完了

你的籃球頻道
2026-06-10 07:12:44
女性偷腥后當(dāng)晚與丈夫同房是什么感覺(jué)?一位39歲的女人說(shuō)出實(shí)情

女性偷腥后當(dāng)晚與丈夫同房是什么感覺(jué)?一位39歲的女人說(shuō)出實(shí)情

混音情感
2026-06-09 09:13:58
成本14億,三天票房只有3.66億,好萊塢年度最慘電影誕生了

成本14億,三天票房只有3.66億,好萊塢年度最慘電影誕生了

影視高原說(shuō)
2026-06-09 15:32:38
“摸奶子”再惹爭(zhēng)議,OPPO的流量反噬開(kāi)始了

“摸奶子”再惹爭(zhēng)議,OPPO的流量反噬開(kāi)始了

品牌頭版
2026-05-13 10:18:15
“家長(zhǎng)都是白發(fā)蒼蒼!”人大附中出考場(chǎng)視頻,有錢(qián)晚婚晚育具象化

“家長(zhǎng)都是白發(fā)蒼蒼!”人大附中出考場(chǎng)視頻,有錢(qián)晚婚晚育具象化

熙熙說(shuō)教
2026-06-08 19:01:11
小米正式回應(yīng)SU7 Ultra起火事故!

小米正式回應(yīng)SU7 Ultra起火事故!

新浪財(cái)經(jīng)
2026-06-09 13:42:50
廣東女子每周啃一個(gè)豬蹄,連續(xù)吃了半年,去醫(yī)院檢查,結(jié)果如何

廣東女子每周啃一個(gè)豬蹄,連續(xù)吃了半年,去醫(yī)院檢查,結(jié)果如何

芹姐說(shuō)生活
2026-06-09 19:08:06
吳千語(yǔ)施伯雄在上海新家拍大片,4層別墅公開(kāi),老錢(qián)風(fēng)裝修真高級(jí)

吳千語(yǔ)施伯雄在上海新家拍大片,4層別墅公開(kāi),老錢(qián)風(fēng)裝修真高級(jí)

八怪娛
2026-06-09 11:03:36
62歲布拉德·皮特與33歲女友觀看法網(wǎng),網(wǎng)友:看不出近30歲年齡差

62歲布拉德·皮特與33歲女友觀看法網(wǎng),網(wǎng)友:看不出近30歲年齡差

韓小娛
2026-06-08 18:01:55
亞美尼亞親俄派敗選,更多“小弟”不看俄臉色

亞美尼亞親俄派敗選,更多“小弟”不看俄臉色

名人茍或
2026-06-09 07:03:45
演都不演!鄭欽文再次一輪游,炸出一群牛鬼蛇神,李娜早把話說(shuō)透

演都不演!鄭欽文再次一輪游,炸出一群牛鬼蛇神,李娜早把話說(shuō)透

圓夢(mèng)的小老頭
2026-06-09 19:54:22
鬧大了!鄰居充電線橫跨他人車(chē)位,車(chē)主倒車(chē)入庫(kù)壓斷被索賠500元

鬧大了!鄰居充電線橫跨他人車(chē)位,車(chē)主倒車(chē)入庫(kù)壓斷被索賠500元

火山詩(shī)話
2026-06-09 08:23:04
2026-06-10 07:51:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15428文章數(shù) 66920關(guān)注度
往期回顧 全部

科技要聞

一文看懂蘋(píng)果WWDC26:庫(kù)克告別,Siri重生

頭條要聞

德國(guó)迷奸案主犯因名字公開(kāi)請(qǐng)求輕判:以后在國(guó)內(nèi)不好混

頭條要聞

德國(guó)迷奸案主犯因名字公開(kāi)請(qǐng)求輕判:以后在國(guó)內(nèi)不好混

體育要聞

誰(shuí)會(huì)花400萬(wàn),去看一場(chǎng)尼克斯的比賽?

娛樂(lè)要聞

吳文忻因癌癥惡化離世,女兒哭泣不舍

財(cái)經(jīng)要聞

從日韓分銷(xiāo)商到英國(guó)教育圈 誰(shuí)在買(mǎi)宇樹(shù)?

汽車(chē)要聞

賽豆科技AIVA品牌發(fā)布 全系產(chǎn)品覆蓋20萬(wàn)級(jí)市場(chǎng)/量產(chǎn)車(chē)年內(nèi)亮相

態(tài)度原創(chuàng)

時(shí)尚
健康
本地
手機(jī)
游戲

高考前一天,偷偷吃避孕藥的女孩們

粽子、湯圓……常見(jiàn)粘食大盤(pán)點(diǎn)!

本地新聞

用楊柳青年畫(huà)的方式,打開(kāi)天津

手機(jī)要聞

研究認(rèn)為iPhone的普及顯著拉低了美國(guó)30歲以下女性的生育率

光榮《信長(zhǎng)之野望》新作官宣!2026年冬發(fā)售

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版