網易首頁 > 網易號 > 正文 申請入駐

單Agent時代結束,AI們開始組團上班

0
分享至

  • 克雷西 發自 凹非寺
    量子位 | 公眾號 QbitAI

現在,大模型的密集更新實在是讓人看得眼花繚亂,但整體看來,方向也無非那么幾個——更大、更強、更快。

但是,Kimi這次的更新,走的方向不太一樣。

昨晚,月之暗面發布并開源了旗下最新模型——K2.6。

這次更新有兩個重點,一是代碼能力,包括硬核的軟件工程能力和前端設計水準的提升,二是多Agent協作的“Agent集群”能力升級。

先說榜單,Kimi K2.6在Artificial Analysis上取得了全球開源第一的成績,僅次于閉源的全球“御三家”。



咱就是說,在御三家新模型輪流上線的這張梗圖里,也是能有Kimi的一個位置了。



聊聊這個Agent集群的升級

K2.5時,Kimi提出了“Agent集群”這個概念,但那時候更像是一個方向:能調度不同專長的Agent互相補位,廣度搜索、深度研究、文檔分析、長文撰寫一起上,并行處理。

到了K2.6,這件事變得真正有意思了:最多支持300個子Agent并行完成4000個協作步驟。

放在實際場景里,你說一次需求,一次運行就能同時拿到文檔、網站、PPT、表格。

那必須給它一個任務實測一下,看它能不能一次運行、多格式并行交付,提示詞如下:

  • 幫我做一份“2026年國內AI編程助手”的報告,需要同時給我三份產出:
  • 一篇完整的調研報告,包含各產品功能對比、定價策略、優劣勢分析,以及你的選型建議;
    一張結構化的對比表格,維度包括:支持IDE、補全能力、對話能力、聯網能力、價格、適合人群;
    一份可以直接拿去匯報的PPT,10頁左右,有結論和建議頁。

三份東西格式完全不同,看它是真的并行在跑、還是按順序一個個出來,以及最后交付的質量夠不夠直接用。

首先,Agent集群進行了初步的掃描,并對問題的維度進行拆解,然后劃分出了12個維度。



這12個維度,交給了12位不同的專家來負責,每個人都只調研自己的一個子問題。



每個專家的工作進度條和階段性成果,都能實時監控。



到了正式撰稿階段,同樣有不同的人負責各自的Chapter。



最終,在數十位“專家”的接力之下,K2.6交付的報告長達55頁,字數超3.5萬,而且圖文并茂、結構清晰、引文標注明確。



其中覆蓋了八款主流產品,每款都有定位、核心能力和局限性的完整拆解,引用了來自IDC、Gartner、信通院等機構的數據,SWE-bench評分、中文理解準確率、定價對比一應俱全,最后還附了選型建議矩陣和企業Checklist。



篇幅和數據密度,已經超出單個對話窗口能合理完成的范疇。

表格整理得也很干凈,七個維度、八款產品,支持IDE、補全能力、對話能力、聯網能力、定價、適合人群一列不少,格式規整,可以直接拿來用。



PPT同樣交出來了,10頁,有目錄、市場數據、競品卡片、功能對比表、定價可視化、SWOT分析和選型建議,最后一頁還附了行動建議。

結構完整,可以直接拿去匯報。



從一個AI,到一群AI

從K2開始,感覺Kimi模型的進化脈絡更清晰了:

K2是萬億參數規模的基座,代表的是“把模型做大、做強”這件事。

K2 Thinking在此基礎上引入了推理層,讓模型開始能把一個復雜任務一步步想清楚,自己推導、自己驗證。

到了K2.5/2.6,問題變了,Kimi團隊開始把目光從專注于讓單個模型變得更聰明,轉向了讓一群模型真正分工協作,各自發揮專長,一起做成更大的事。




這是一個本質的跨越。

道理很好理解,單個模型再強,也有天花板。

就像一個天才程序員,寫代碼可以很快,但如果讓他一個人同時搞定產品設計、寫代碼、跑數據、出文檔、做演示,那他大概率無法招架。

但一個組織可以。

從互聯網的建立,到大模型的訓練,乃至人類登月……靠的從來都不是某一個天才,而是一群各有專長的人,在一套分工體系下協同推進。

AI走到今天,也到了需要學這件事的時候了。

為了實現這個目標,最需要的就是一個好的協作框架。

所以,K2.6不只是在提升模型本身的參數,也在同步打磨它作為“協調者”的能力——

在任務里動態分配、在出錯時自動修復、在整個交付鏈條上主動管理。

這是K2.6和K2.5最根本的差別之一。

不過,Kimi沒打算停在“Agent集群”這一步。“Agent集群”解決的是AI之間怎么分工的問題,但還有一個問題沒答——人和AI放在同一個群組里,能一起完成什么?

看到Kimi已經開始測試“Claw群組”了,支持把各種蝦加入到一個群里,用K2.6做協調員,組織不同能力的蝦一起干活……

不過我們目前還沒收到測試邀請,要測試之后再給大家分享實際體驗了(Kimi你如果看到這篇文章的話要不給我們安排一個.doge)。



One More Thing

這不是下個月量子位AIGC大會就要召開了嗎,聽說這次K2.6能寫更精美的網頁,也能支持簡單后端了,我順手就讓Kimi幫忙寫了個報名系統。

不過我測試的時候活動官宣還沒來,所以暫時沒輸入具體的活動信息,先讓它把功能跑通。

提示詞是醬嬸兒的:

  • 幫我做一個「量子位讀者交流會」的活動報名網站。要求:
  • 首頁有活動介紹、時間地點、嘉賓陣容;
    有報名表單,收集:姓名、郵箱、公司、職位、「你最想聊的AI話題」;
    支持提交報名,提交成功后顯示報名成功頁;
    有一個設有密碼的管理后臺頁面,可以查看所有報名信息并導出。

這個任務專門卡K2.6新增的后端和數據庫能力,看它交出的到底是一個真的能跑的全棧應用,還是只是一個花瓶。

K2.6沒有直接開始寫代碼。它先讀了項目構建的技能文件,把任務拆成前端初始化、設計文檔、后端架構、數據庫schema等任務線,然后才開始動手。



值得一提的是設計決策。

我們提示詞里沒有說要什么風格,它自己判斷“這是一個AI主題活動”,選了純黑純白為主色調、亮檸檬黃作為點睛色的“清晰未來主義”風格,還順手調用圖像生成工具做了五張黑白藝術風格的配套視覺素材。

首屏則是用Three.js做了3D交互式圖片卡片集群,鼠標移動時卡片會翻轉漂浮,還加了一套雙層自定義光標系統。

技術棧它也自己選定了:前端React + TypeScript + Tailwind + shadcn/ui,后端tRPC + Drizzle ORM + Hono + MySQL。

管理后臺也做了密碼驗證,登錄后可查看報名信息并導出CSV。



最終交付的成品長這樣:



我們再來驗證下報名功能,看看到底是真收集到了信息,還是只有靜態動畫。

結果,我們填寫的報名表單成功出現在了后臺記錄當中,說明Kimi K2.6真的把這套報名系統的前后端和數據庫開發跑通了。



最后插播一條最新消息,大會的報名帖不久前剛剛發布了,大家記得多多關注,到時候來參會哦~



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
印尼豪賭大潰敗,再次證明了:中國行,但你真不行

印尼豪賭大潰敗,再次證明了:中國行,但你真不行

閱微札記
2026-04-21 11:52:23
連車企的名字都不敢報道,這樣的新聞有什么意義

連車企的名字都不敢報道,這樣的新聞有什么意義

林中木白
2026-04-21 15:51:28
注意!6月1日起大醫院不再隨意接診,看病不按規矩可能白跑

注意!6月1日起大醫院不再隨意接診,看病不按規矩可能白跑

夜深愛雜談
2026-04-21 07:45:20
只為演好春麗!《街霸》女演員狂吃牛排"增肌大腿"

只為演好春麗!《街霸》女演員狂吃牛排"增肌大腿"

游民星空
2026-04-21 11:51:12
中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

中國游客暴跌55.9%,日本361萬游客擠爆櫻花季,缺口被全球填平

芳姐侃社會
2026-04-21 16:37:18
多米尼加發現世界最大稀土礦,儲量是我國的三倍多,有何影響?

多米尼加發現世界最大稀土礦,儲量是我國的三倍多,有何影響?

科普大世界
2026-04-21 13:14:21
退休人員速查!1992年前干過這4類工作,每月多領一筆錢,別吃虧

退休人員速查!1992年前干過這4類工作,每月多領一筆錢,別吃虧

夜深愛雜談
2026-04-22 07:30:42
“挪用父親公司1700萬”女孩發聲:一次打賞10萬沒感覺,現實中買包都嫌貴;把女主播推上位有成就感,后來她有了更多大姐,就去刷男團……

“挪用父親公司1700萬”女孩發聲:一次打賞10萬沒感覺,現實中買包都嫌貴;把女主播推上位有成就感,后來她有了更多大姐,就去刷男團……

都市快報橙柿互動
2026-04-21 23:46:41
SpaceX宣布有權以600億美元收購AI編程初創公司CursorCursor

SpaceX宣布有權以600億美元收購AI編程初創公司CursorCursor

財聯社
2026-04-22 08:22:04
美軍扣船不到48小時,中美在安理會大吵一架,孫磊對各國作出表率

美軍扣船不到48小時,中美在安理會大吵一架,孫磊對各國作出表率

基斯默默
2026-04-22 10:19:14
網盤禁止傳播存儲國外影視劇,這意味著什么?

網盤禁止傳播存儲國外影視劇,這意味著什么?

十柱
2026-04-21 14:04:56
貴州網紅曉浪哥去世,僅34歲,愛在墓地拍視頻,早給自己選好墓地

貴州網紅曉浪哥去世,僅34歲,愛在墓地拍視頻,早給自己選好墓地

奇思妙想草葉君
2026-04-21 16:24:04
編造“大蔥免費拿”謠言造成種植戶財產損失,多人被處罰

編造“大蔥免費拿”謠言造成種植戶財產損失,多人被處罰

界面新聞
2026-04-22 10:01:16
復婚無望!baby黃曉明同框陪兒子零交流,分別后黃曉明忙去找葉柯

復婚無望!baby黃曉明同框陪兒子零交流,分別后黃曉明忙去找葉柯

八卦王者
2026-04-22 10:02:11
伊朗公開展示導彈,武裝部隊警告美國:已做好百分之百戰斗準備,將給侵略者更嚴厲的教訓

伊朗公開展示導彈,武裝部隊警告美國:已做好百分之百戰斗準備,將給侵略者更嚴厲的教訓

極目新聞
2026-04-22 10:49:52
白宮:萬斯巴基斯坦之行已被取消

白宮:萬斯巴基斯坦之行已被取消

新華社
2026-04-22 06:26:43
細思極恐!某國產大模型泄露用戶隱私,并隨意將隱私信息發給其他人

細思極恐!某國產大模型泄露用戶隱私,并隨意將隱私信息發給其他人

可達鴨面面觀
2026-04-21 16:24:39
B站最無聊的UP主,拋了十萬次硬幣證明正反面概率不是1比1

B站最無聊的UP主,拋了十萬次硬幣證明正反面概率不是1比1

17173游戲網
2026-04-21 13:44:24
一線城市房價開始上漲!網友:這就是趨勢,接下來會一發不可收拾

一線城市房價開始上漲!網友:這就是趨勢,接下來會一發不可收拾

火山詩話
2026-04-22 06:48:46
長沙拄拐老兵借個廁所被保安刁難,不服從領導安排,官方回應來了

長沙拄拐老兵借個廁所被保安刁難,不服從領導安排,官方回應來了

奇思妙想草葉君
2026-04-21 16:13:05
2026-04-22 11:48:49
量子位 incentive-icons
量子位
追蹤人工智能動態
12509文章數 176457關注度
往期回顧 全部

科技要聞

凌晨突發!ChatGPT Images 2.0發布

頭條要聞

柬埔寨國王在京手術 洪森攜子看望:感謝中方

頭條要聞

柬埔寨國王在京手術 洪森攜子看望:感謝中方

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席 特朗普宣布延長停火期限

汽車要聞

四款全球首秀+AI落地 大眾汽車集團在華轉型全面提速

態度原創

健康
旅游
手機
時尚
軍事航空

干細胞抗衰4大誤區,90%的人都中招

旅游要聞

赴東阿之約 品千年膠香——解鎖寶藏小城春日限定美好

手機要聞

REDMI K90 Max首銷4小時奪冠!刷新近一年3K-4K新機紀錄

頂流復工,已判若兩人

軍事要聞

特朗普宣布延長停火 伊朗表態

無障礙瀏覽 進入關懷版