網易首頁 > 網易號 > 正文 申請入駐

13小時編碼、5天自主運行!Kimi K2.6開源“硬剛”閉源巨頭,長程戰力能否撕開AGI工業化新賽道?

0
分享至

月之暗面(Moonshot AI)Kimi再次出招。

4月20日深夜,Kimi發布并開源Kimi K2.6模型。據其介紹,該模型具備行業領先(state-of-the-art)的代碼能力、長程任務執行能力與Agent(智能體)集群能力。

K2.6延續了上一代K2.5的技術路線,在編碼與智能體能力上進一步升級。其Agent集群調度能力實現量級突破,最高可支持300個子Agent并行完成4000個協作步驟,大幅提升了在復雜長流程任務中的處理效率。

當前,大模型產業的競爭焦點正從“通用對話能力”轉向長周期、多工具協同的真實工作流落地,模型的長時間穩定工作能力正成為核心賽點。

此前3月,月之暗面創始人楊植麟在2026年中關村論壇年會全體會議上指出,大模型的本質是將能源轉化為智能,規模化是AI發展的核心基礎,但規模化并非暴力堆砌算力與能源,而是以提升效率為核心。對此,Kimi圍繞三大方向構建規模化策略:Token(詞元)效率、長上下文、Agent集群,力求在有限資源下實現智能最大化。

支持13小時不間斷編碼,5天自主運行,深度檢索能力超越GPT-5.4

從多項權威基準測試結果來看,K2.6在通用智能體、編程、視覺智能三大方向上均有提升。

在博士級難度的“人類最后的考試(Humanity's Last Exam)”全工具測試中,K2.6以54.0%的得分登頂。在評估Agent深度檢索能力的DeepSearchQA測評中,以92.5%的得分領先GPT-5.4、Gemini 3.1 Pro以及Claude Opus 4.6。此外,在BrowseComp、OSWorld-Verified等智能體測評中,Kimi K2.6均展現出行業前列的成績。


圖片來源:月之暗面官方微信號

但與此同時,K2.6仍在部分維度與頭部閉源模型存在一定差距。SWE-bench多語言測試中,其得分略低于Claude Opus 4.6與Gemini 3.1 Pro。Toolathlon工具調度任務以及MathVision等視覺智能測評中,其表現與GPT-5.4也存在略微差距。

從本次K2.6能力提升的方向來看,其核心價值更多體現在:開源生態中正演進出能夠勝任長周期、復雜任務的能力。而這一技術方向,也已成為當下國產大模型行業的共同選擇。

近月來,OpenClaw(俗稱“小龍蝦”)等自主Agent應用快速崛起。區別于傳統對話式交互,這類場景要求AI跨應用不間斷自主運行,主動完成任務規劃、代碼執行、跨平臺協同操作,對模型上下文承載、長期記憶連續性、多步驟推理穩定性均提出了更高要求。

針對自主Agent賽道,Kimi K2.6也增強了Agent的自主化執行能力,在OpenClaw、Hermes Agent等自動化任務場景表現突出。官方披露,其RL(Reinforcement Learning,強化學習)基礎設施團隊已基于K2.6 Agent實現連續5天不間斷自主穩定運行,充分驗證了長時工作可靠性。

楊植麟曾在發布K2.5時介紹其Agent集群能力:“在K2.5上,我們從單個Agent進化到了Agent集群,從單個專家進化成了一個專業團隊。”他具體解釋道:K2.5會創建并協調一大群專項Agent并行工作,這些專項Agent本質上都是K2.5的分身,各自承擔不同的角色和子任務,沒有任何預設規則,所有的角色分配和任務拆解都是由K2.5現場即時決定。

迭代至K2.6,Agent集群架構完成全面擴容升級:支持調度不同技能特長的Agent進行互補協作、組合各項能力。架構上擴展至最多300個子Agent并行完成4000個協作步驟(K2.5為最多100個分身,并行處理1500個步驟),實現了更大規模的并行化。

代碼能力作為本次迭代核心亮點,本次更新中,長程編碼能力的提升是主要突破:K2.6支持不間斷編碼13小時,完成超過4000行代碼的編寫或修改,覆蓋Rust、Go、Python等編程語言,以及前端、運維、性能優化等場景。通過代碼與視覺能力的深度融合,K2.6能夠交付專業級Web應用。


圖片來源:每經媒資庫

Kimi估值3個月已翻4倍 楊植麟能否開辟AGI工業化新賽道?

在2026年中關村論壇年會后,楊植麟表達了他對Agent的發展洞察。他認為,與傳統對話式AI“即時問答”不同,真正受用戶信賴的Agent必須具備長時間持續工作的能力,能夠承接更復雜的任務。這背后需要突破訓練難度、數據積累、上下文承載等多重技術瓶頸。

楊植麟指出,這種能力的突破將帶來生產力的指數級提升,Agent或將成為生產力的核心載體,其產生的Token(詞元)在一定程度上等價于GDP(國內生產總值),長期甚至可能讓現有GDP實現數倍增長。

《每日經濟新聞》記者(以下簡稱“每經記者”)注意到,這一技術洞察直接體現在Kimi近期的迭代節奏中。繼K2.5首次引入Agent集群概念后,Kimi開始在更基礎的架構層面展開探索。

今年3月發布的技術報告中,團隊對大模型核心結構的殘差連接進行了重新設計,讓每一層可選擇性關注此前各層的輸出。這一改進獲得了美國企業家馬斯克“令人印象深刻”的評價,以及OpenAI前研究副總裁Jerry Tworek“深度學習2.0要來了”的點評。

此外,楊植麟在中關村論壇年會上預測了大模型訓練的下一階段:“越來越多的研究工作將由AI主導。未來每個研究員將配備海量的Token,由AI自動合成新任務、構建新環境、定義最優獎勵函數,甚至自主探索全新網絡架構。在這一趨勢下,整個AI領域的研發速度將進一步加快。”

在技術快速演進的同時,Kimi在資本市場上得到了同步反饋。

市場知情人士此前向每經記者透露,3月14日Kimi估值已攀升至180億美元,3個月內翻了4倍,且新一輪10億美元融資正在推進中。不到3個月完成3輪融資,創下國內大模型連續融資紀錄,也讓Kimi成為國內估值最快突破百億美元的獨角獸企業。

估值上升的原因有兩方面。一方面,產品迭代與付費收入出現較快增長:2026年開年以來,K2.5模型、Kimi Claw先后上線并升級,適配多辦公平臺,帶動1月底以來20天收入超過2025年全年;Stripe數據顯示,其個人訂閱訂單1月環比增長8280%,2月再增長123.8%,進入全球榜單前十。另一方面,AGI賽道整體升溫,智譜、MiniMax港股上市后市值的上漲也為行業頭部玩家提供了估值支撐。

當前,AGI行業已從參數競賽轉向技術效率與落地能力的競爭,Agent時代的競爭規則正在被重新書寫,轉向如何做得更久、更穩、更完整。Kimi以技術演進為主線,在這一過程中逐步確立自身定位。而大模型競爭格局是否因此生變,仍有待觀察各廠商后續的迭代節奏與生態建設能力。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

小撇說事
2026-04-23 14:20:05
5月1日新規落地!煙酒禮品全面管控,公職人員迎來全面約束

5月1日新規落地!煙酒禮品全面管控,公職人員迎來全面約束

罐頭告訴貓迷
2026-04-24 03:40:10
23勝1負仍傷退!薩巴倫卡:身體反復出問題,我真的很難過

23勝1負仍傷退!薩巴倫卡:身體反復出問題,我真的很難過

網球之家
2026-04-24 15:33:32
伊朗較量陷入強撐困境,外媒:伊朗還能再撐兩個月,美官員:美國未必撐得住

伊朗較量陷入強撐困境,外媒:伊朗還能再撐兩個月,美官員:美國未必撐得住

極目新聞
2026-04-22 14:02:57
老公偷偷給小姑子轉賬12萬,我取光存款回娘家,半小時后婆婆來電

老公偷偷給小姑子轉賬12萬,我取光存款回娘家,半小時后婆婆來電

阿凱銷售場
2026-04-25 00:20:57
最高院:當事人提供與債務人的通話記錄用于證明訴訟時效中斷的,須同時證明該通話所涉內容系追索案涉債務

最高院:當事人提供與債務人的通話記錄用于證明訴訟時效中斷的,須同時證明該通話所涉內容系追索案涉債務

創作者_1514561867966
2026-04-24 18:48:08
女子因遲遲沒懷孕被懷疑身體有問題,女子直接去醫院檢查自證清白

女子因遲遲沒懷孕被懷疑身體有問題,女子直接去醫院檢查自證清白

張曉磊
2026-04-24 11:46:36
美駐日大使:如果中國不按美國的意愿行事,就讓十四億人陷入饑荒

美駐日大使:如果中國不按美國的意愿行事,就讓十四億人陷入饑荒

荊楚寰宇文樞
2025-09-28 21:58:22
酒店里,擠滿了偷偷開房的已婚女性

酒店里,擠滿了偷偷開房的已婚女性

二胡的歲月如歌
2026-04-22 19:03:26
八段錦這場“騙局”,到底忽悠了多少人

八段錦這場“騙局”,到底忽悠了多少人

林中木白
2026-04-24 12:06:14
新冠后遺癥的長期侵襲,無數人在不知不覺中深陷困境

新冠后遺癥的長期侵襲,無數人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
離婚后只字不提李琳!輸給了經超后才發現,原來他們不是同類人

離婚后只字不提李琳!輸給了經超后才發現,原來他們不是同類人

手工制作阿殲
2026-04-24 18:05:02
馬蘇:我和孔令輝同居多年后分手,如今都沒結婚,卻只能做朋友

馬蘇:我和孔令輝同居多年后分手,如今都沒結婚,卻只能做朋友

林輕吟
2026-04-24 14:47:43
三歲萌娃閃閃受邀國際時裝周,黃一鳴直言女兒是來報恩的!

三歲萌娃閃閃受邀國際時裝周,黃一鳴直言女兒是來報恩的!

喜歡歷史的阿繁
2026-04-24 16:54:50
繼《人民日報》發聲后,官媒三問董宇輝,言辭犀利,字字揭他老底

繼《人民日報》發聲后,官媒三問董宇輝,言辭犀利,字字揭他老底

苗苗情感說
2026-04-24 17:23:53
黃仁勛沒料到,中國安徽芯片崛起!竟成英偉達最強對手

黃仁勛沒料到,中國安徽芯片崛起!竟成英偉達最強對手

墜入二次元的海洋
2026-04-25 00:48:53
博士再讀碩士,本科回爐技校,純屬病急亂投醫

博士再讀碩士,本科回爐技校,純屬病急亂投醫

賽格大道
2026-04-22 12:45:46
749局退休人員自述:秦嶺惡龍事件,從發現到斬殺僅用了三天

749局退休人員自述:秦嶺惡龍事件,從發現到斬殺僅用了三天

千秋文化
2026-04-10 20:03:43
100MB到消失:Zip驅動器的五年泡沫

100MB到消失:Zip驅動器的五年泡沫

碼上閑敘
2026-04-24 10:17:58
扎心了!21歲大一女生月開銷曝光!網友驚問:畢業后能掙這么多嗎

扎心了!21歲大一女生月開銷曝光!網友驚問:畢業后能掙這么多嗎

慧翔百科
2026-04-24 08:58:31
2026-04-25 05:12:49
每日經濟新聞 incentive-icons
每日經濟新聞
中國主流財經全媒體平臺。
1550280文章數 2725506關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

航班提前起飛10分鐘 大學生把海航告了

頭條要聞

航班提前起飛10分鐘 大學生把海航告了

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

LG財閥內斗:百億美元商業帝國爭奪戰

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

游戲
教育
時尚
房產
軍事航空

《光與影:33號遠征隊》發售一周年 銷量破800萬

教育要聞

帝國理工IC相當于國內什么大學?

今日熱點:愛奇藝回應暫停頁面廣告爭議;經紀公司否認THEBOYZ解約成功……

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進入關懷版