網易首頁 > 網易號 > 正文 申請入駐

單Agent時代正式結束:一個干不過,就上300個

0
分享至



編輯|杜偉、冷貓

Agent 終于要告別「單打獨斗」,迎來二階段進化了嗎?

就在今天凌晨,月之暗面正式發布并開源了 Kimi 系列最新一代旗艦模型 ——Kimi K2.6,距離上個版本 K2.5 推出還不到 3 個月的時間。發出來之后熱度非常高,官推瀏覽量已經達到 400 萬。



當前的 Agent 在處理復雜工程項目時往往力不從心,雖然它們擅長獨立完成特定任務,但團隊協作還有所欠缺。如何突破這一局限,成為 Kimi K2.6 的核心目標。

新版本探索了如何激發 Agent 的團隊協作能力:進一步加強 K2.5 引入的 Agent Swarm(Agent 集群)功能,通過對 OpenClaw 等框架的適配強化 Agent 主動式工作,全新的 Claw Group(Claw 群組)又補上了組織協作這一能力。這一整套能力的系統性疊加,構建起了一個更接近人類團隊的 AI 系統。

要實現這一切,底層模型必須足夠強大。此次,Kimi K2.6 在通用 Agent、代碼、看圖理解這些核心能力上都有明顯進步。像人類最后的考試(Humanity's Last Exam)、貼近真實開發場景的 SWE-Bench Pro 以及考察 Agent 深度檢索能力的 DeepSearchQA 測試,K2.6 都穩穩領先競爭對手。

即使將 K2.6 與 GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro 這些閉源模型放在一起看,它也完全不虛,甚至有些指標還能壓一頭。



大模型評測平臺 Artificial Analysis 給出最新結果,「Kimi K2.6 成為開源模型新王」!



在上線 Kimi K2.6 之后,大模型聚合平臺 OpenRouter 給出了頗高評價,認為月之暗面新一代模型主打長時序編程能力,專為需要持續執行的 Agent 場景打造。相比傳統聊天機器人,它更像一個「系統工程師」,能把復雜任務拆解開來,一步步執行,并在過程中不斷優化。



有網友感嘆,這代 Kimi 旗艦模型強到離譜,寫代碼這塊已經可以跟 GPT-5.4 掰手腕了,價格又比 Opus 4.7 低一大截,還是開源、免費用。現在基本每隔幾個月,都會有一個新的開源模型逼近閉源 GPT 和 Claude。「感覺開源模型真的追上來了,而且都是中國在推進節奏。」



12 個小時連軸轉、300 個 Agent 同時開工

Agent 終極形態來了?

此次,Kimi K2.6 在編程領域繼續發力。幾天前,海外還在熱議低調上線的 Kimi K2.6-Code-Preview,并對 K2.6 正式版充滿期待。



作為 Kimi 系列編程能力迄今最強的模型,Kimi K2.6 的長程編碼能力實現了突破,有助于將軟件開發的自動化推向更深層次的工程環節。

比如,Kimi K2.6 可以在 Mac 本地順利下載 Qwen3.5-0.8B 并跑起來。它沒有走常見技術棧,直接用小眾的 Zig 語言重寫推理流程并持續優化,這一步本身就體現了模型的泛化能力。

整個過程持續了 12 個多小時,期間調用工具超過 4000 次,前后迭代 14 輪。隨著不斷調參和重構,推理速度從最初的約 15 tokens/s 一路躍升到約 193 tokens/s,最終比本地大模型聊天應用 LM Studio 還快了大約 20%。



接下來到了 Kimi K2.6 此次升級的重心,其延續并進一步強化了 Agent 集群的協同輸出能力。簡單來說,該功能是要把「Agent 怎么一起干活」這件事理順。

現在能做到什么程度呢?K2.6 把一個復雜任務自動拆開,分配給不同專長的 Agent,讓它們各自處理搜索、深度調研、文檔分析、長文寫作等環節,再把結果拼接起來繼續往下推進。

在這樣一套機制下,一次運行就能完成整條鏈路:從原始資料、網頁內容,再到 PPT 和表格,全部自動生成,中間不需要來回切工具,也不需要人手動接力。

同時,Agent 集群的底層架構也做了擴展,最多可以同時調度 300 個子 Agent,完成 4000 步協作,并行能力直接被拉到了一個新量級。規模上來之后,AI 的角色也變了:開始接管整個流程,并直接給出成體系的結果。



Agent 集群將一篇高密度視覺數據的天體物理論文拆解復用,生成了約 7000 字研究報告、2 萬條數據集和 14 張圖表。

為了讓 AI 進化為一個全天候不間斷、無需人工干預的賽博員工,Kimi K2.6 對 OpenClaw、Hermes Agent 等框架做了更加深入的適配

為此,Kimi K2.6 進一步壓榨模型的自主執行能力:無論是 API 調用的精準度、長時間運行的穩定性,還是執行復雜研究任務時的安全防護,K2.6 都表現得可圈可點。

在 Vibe Coding 方面,Kimi K2.6 的網站設計更加出彩。K2.6 生成的網站尤其是首屏區,一眼望上去有很大的視覺沖擊力,風格的一致性也保持得不錯。并且,各種交互元素與滾動特效等細節的加入,也能吸引用戶停留更長時間。

除了前端設計,此次 Kimi K2.6 還給后端開發人員帶來了驚喜,它上線了 Kimi 賬戶登錄和表單信息收集功能。你可以用它創建一個活動報名頁面,并輕松查看后端報名信息。如此一來,前后端銜接更加順暢。



目前,Kimi K2.6 已成為 Kimi 網頁版、App 和 Kimi Code 編程助手的默認模型,趕緊用起來。

一手實測,秀翻全場

話不多說,我們直接上手實測一些案例,看看效果如何。

測試第一 Part 選用「K2.6 Agent」,從實用和美學兩個維度出發,看看它能不能做出一些足夠抓眼的前端效果。



有人喜歡《女神異聞錄 5》嗎?

這是一種極具辨識度的藝術風格,是一場披著漫畫外衣的視覺暴力美學。它用極度不規整的設計挑戰審美慣性,將「反抗社會平庸」的主題直接刻進了像素和線條里。完美融合了平面設計與 3D 空間,讓漫畫符號和視覺表達深度融合。

如果,我們開一家 P5 風格的小酒館,主頁會是什么樣的呢?



Demo鏈接:https://umxz7lursh26i.beta-ok.kimi.link/

我們發現,在構建前端網頁的過程中,Kimi K2.6 智能體會進行充分的測試,甚至模擬點擊操作:



另外,我們做了個小彩蛋,讓 Kimi K2.6 參考《女神異聞錄 5 皇家版》的開場視頻,完全不提供任何素材,做了一小段動畫效果。





我們繼續提需求,這次是另一種風格的前端設計:「為電商平臺設計一個富有視覺沖擊力的首頁,頂部導航欄包含品牌標識、搜索框、購物車、登錄 / 注冊按鈕,主橫幅(Hero Section)展示平臺的主要促銷活動、熱銷商品或季節性優惠,在 Hero Section 下方展示推薦商品或類別,在首頁底部或者某個顯眼區域展示一些精選商品的用戶評價。」

一次生成,就實現了超高完成度的首頁。雖說略有些瑕疵,但我們相信一些小問題經過一次迭代就能修復,瑕不掩瑜。



我們接著實測了 K2.6 Agent 集群的功能,為斯坦福大學《2026 年人工智能指數報告》制作了宣傳冊,要求其交付網頁、表格和 PPT,并且完全沒有給予任何附加信息和文檔,考驗智能體集群相互寫作的性能。

我們注意到,每個智能體有各自的工牌、職能說明和簡介。使用 Agent 集群的時候,你真的會像一個運籌帷幄的董事長,調動手下一切人力資源,知人善任,瞬間打造一個工作小組,為你全自動地執行任務。就差把「靠譜」寫在工牌上了。



最終輸出了我們需要的全部內容,金光閃閃的網頁,高效排版的 PPT,以及嚴肅的數據表。







多智能體協作的未來已來?

上述一系列測試,讓我們看到了 Kimi K2.6 作為 Agent 時代「基座模型」的強大實力。

在 OpenClaw 掀起的「龍蝦熱」持續升溫的當下,全新登場的 Claw 群組又為智能體下一階段的演進指出了一種清晰的路徑。



目前,Claw 群組已經開啟小范圍內測。

這一功能標志著智能體協作進入了一個全新的時代。你可以接入運行在本地、手機或云端的各種 Agent,它們各自帶著工具、技能和記憶進場,在一個「群組」里共同推進任務。

在這里面,K2.6 更像一個調度的人:誰擅長檢索、誰負責分析、誰來產出內容,它會按能力去分工。如果哪個環節卡住了,它也能及時發現,重新拆任務、換人接手,讓流程繼續走下去。

想象一下,當你需要準備一份復雜的匯報或是開發一個多層次的項目,Claw 群組的智能體們將像一群專業人士一樣,在群聊中討論、對接、調整,最終呈現給你一份精準、完備的成果。

這一創新不僅突破了傳統的個體智能體執行模式,更推動了組織智能的前進。它的出現,讓「多個 AI 智能體一起干活」這件事更接近現實。

文中視頻鏈接:https://mp.weixin.qq.com/s/LlVYoy1As2Zl7py_MqlBpQ

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
105歲才能取本金“隨用隨取”成空話 保險公司算欺詐嗎?法院判了

105歲才能取本金“隨用隨取”成空話 保險公司算欺詐嗎?法院判了

環球網資訊
2026-04-21 15:08:47
三國取消飛航許可,賴清德無法竄訪斯威士蘭

三國取消飛航許可,賴清德無法竄訪斯威士蘭

參考消息
2026-04-21 21:20:14
特朗普不演了,警告中國有大麻煩,話音剛落,美國人推動罷免總統

特朗普不演了,警告中國有大麻煩,話音剛落,美國人推動罷免總統

混沌錄
2026-04-21 21:10:15
歐盟擬周三向烏克蘭提供900億貸款,法德提議讓烏象征性加入歐盟

歐盟擬周三向烏克蘭提供900億貸款,法德提議讓烏象征性加入歐盟

史政先鋒
2026-04-21 17:04:19
四年暴跌120億,微信是怎么“殺死”口香糖行業的?

四年暴跌120億,微信是怎么“殺死”口香糖行業的?

流蘇晚晴
2026-04-19 20:34:47
拼多多暴力抗法震驚全網,市值萬億巨頭為何如此囂張

拼多多暴力抗法震驚全網,市值萬億巨頭為何如此囂張

燕梳樓頻道
2026-04-20 21:12:04
河北一地用“冰紅茶”澆灌農作物 已持續幾年 自己不吃售賣

河北一地用“冰紅茶”澆灌農作物 已持續幾年 自己不吃售賣

原某報記者
2026-04-21 17:49:54
電梯安裝違規操作致3人墜亡,事故調查報告公布

電梯安裝違規操作致3人墜亡,事故調查報告公布

極目新聞
2026-04-21 11:25:37
憤怒啊!5000元、月休2天招做飯阿姨,網友:竟要干7個人的工作量

憤怒啊!5000元、月休2天招做飯阿姨,網友:竟要干7個人的工作量

火山詩話
2026-04-21 18:56:19
睡一覺5萬沒了!全國多地爆發新型盜刷,睡前必查手機這4處

睡一覺5萬沒了!全國多地爆發新型盜刷,睡前必查手機這4處

洞見小能手
2026-04-20 16:03:26
NBL歷史首次3連冠!香港金牛3-0橫掃上海玄鳥 成沖CBA大熱

NBL歷史首次3連冠!香港金牛3-0橫掃上海玄鳥 成沖CBA大熱

醉臥浮生
2026-04-21 21:03:58
細思極恐!某國產大模型泄露用戶隱私,并隨意將隱私信息發給其他人

細思極恐!某國產大模型泄露用戶隱私,并隨意將隱私信息發給其他人

可達鴨面面觀
2026-04-21 16:24:39
震驚!濟南一國企總工的優質男,將未接種新冠疫苗列為擇偶硬條件

震驚!濟南一國企總工的優質男,將未接種新冠疫苗列為擇偶硬條件

火山詩話
2026-04-21 08:54:26
中國高校只剩7年窗口期 學生數量斷崖式塌方后一半高校都得死

中國高校只剩7年窗口期 學生數量斷崖式塌方后一半高校都得死

六子吃涼粉
2026-04-20 19:10:49
黃大發等涉黑案一審宣判:黃大發等12人組織、領導、參加黑社會性質組織,判處黃大發死刑,其他11名被告人分別判處13年至2年2個月不等刑罰

黃大發等涉黑案一審宣判:黃大發等12人組織、領導、參加黑社會性質組織,判處黃大發死刑,其他11名被告人分別判處13年至2年2個月不等刑罰

揚子晚報
2026-04-21 15:07:17
中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

芳姐侃社會
2026-04-21 16:37:18
湖北松滋市教育局通報“某學校要求走讀生將背包改為透明書袋”:已責令涉事學校立即糾正、認真整改

湖北松滋市教育局通報“某學校要求走讀生將背包改為透明書袋”:已責令涉事學校立即糾正、認真整改

環球網資訊
2026-04-21 12:17:57
近四成中國網民手機裝AI,豆包月活逼近3.5億,元寶跌出前三,Kimi、智譜為何“掉隊”?|2026年一季度AI應用價值榜

近四成中國網民手機裝AI,豆包月活逼近3.5億,元寶跌出前三,Kimi、智譜為何“掉隊”?|2026年一季度AI應用價值榜

每日經濟新聞
2026-04-21 23:08:15
世錦賽戰報:中國4勝3負2落后!吳宜澤10-2,下輪對手也基本確定

世錦賽戰報:中國4勝3負2落后!吳宜澤10-2,下輪對手也基本確定

小火箭愛體育
2026-04-21 22:52:59
巴基斯坦消息人士:美方談判相關人員陸續抵達巴基斯坦

巴基斯坦消息人士:美方談判相關人員陸續抵達巴基斯坦

財聯社
2026-04-21 23:39:45
2026-04-22 01:08:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12822文章數 142633關注度
往期回顧 全部

科技要聞

創造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財經要聞

現實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

藝術
房產
旅游
教育
本地

藝術要聞

任伯年寫竹,真帶勁

房產要聞

年薪40-50萬!海南地產圈還在猛招人

旅游要聞

京城今春“濱水+”玩法迭代

教育要聞

對不起,我有點“摳”

本地新聞

春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

無障礙瀏覽 進入關懷版