无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Kimi K2.6 開源:一個人,和他的 300 Agents

0
分享至

ESSAY


《企鵝月下追 Kimi》,的封面

之前畫過一張圖,叫「企鵝月下追 Kimi」... Moonshot 也是月下,但在看完 Kimi 的最新發(fā)布后,覺得下半句有了

Kimi 點兵,多多益善

Kimi 今天發(fā)了 K2.6,開源在 HuggingFace:


K2.6 對外的全面 benchmark,對手是 GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro

橫向看,Humanity's Last Exam、DeepSearchQA、SWE-Bench Pro 三項跑贏三家旗艦。其余多數(shù) benchmark 也貼在第一檔

除此之外,還帶來了這些東西,是我想重點說的:

→ Agent 集群

→ Claw 群組

→ 一篇叫 Attention Residuals 的論文

合在一起,指向了群體智能

先說 K2.6 的 Agent 集群

先看 K2.6 本身。代碼能力比 K2.5 提升近 20%,任務(wù)步驟數(shù)平均少了 35%。跨語言泛化也在漲,Rust、Go、Python、前端、DevOps 都更穩(wěn)

作為全天候 Agent 的底層模型,K2.6 的內(nèi)部 Claw-bench 比 K2.5 漲了 10%。長程任務(wù)里,指令遵循和自我糾錯的表現(xiàn)都上來了

按 Kimi 自己的定位,K2.6 在 Agent 場景對標(biāo) Claude Opus 4.6,價格是 Opus 的 1/8

但集群的重點不在單兵,過去調(diào) AI 干活,一次只能要一個東西。要 PPT 換 prompt 重開,要 Excel 再換一次

K2.6 的集群改了這條規(guī)則,一次跑完,一整套產(chǎn)物同時出。Kimi 給這套起名 AgentSwarm,一次能拉 100 個不同專長的分身。分身用的都是 K2.6 底座,掛不同的 Skill 就分化出不同的專長


一個 Coordinator 在上面派活,下面掛幾個各有專長的 subagent

比如我讓 Kimi 給 Anthropic CEO 阿莫迪做一本畫冊,記錄他從普林斯頓物理博士一路到 2021 帶人分叉出 Anthropic 的全過程。Kimi 把任務(wù)拆成九個階段,研究的子代理扒 Dario 的全部公開資料,排版的子代理把 PDF 做成畫冊,做表的子代理整理出他每一次離開和加入的決策節(jié)點 Excel,寫稿的子代理用第一人稱寫一封《Dear 2008》。同時跑完


九個分身各管一段時間。慎思這只,專研 Dario 的 OpenAI 那幾年

在這個集群里,常駐一個 Coordinator,拆任務(wù)、派角色、審成果都歸它

而在這里,Skill 是給 AI 的工作說明書。把一份你認可的產(chǎn)物丟給 Kimi,研報、論文、商業(yè)計劃書都行,它會把里面的分析框架、語言風(fēng)格、排版結(jié)構(gòu)學(xué)下來,存成一個 Skill

比如你找到一份 20 年前高盛寫的并購白皮書,扔給 Kimi,20 分鐘后你有一個「高盛并購方法論」的 Skill。下次 Agent 集群做并購分析,掛上就行

集群解決產(chǎn)能,Skill 解決標(biāo)準

這里,我讓他幫我去給阿莫迪來寫一個深度研究,


然后他給我做出了一份 80 頁的 PPT,還有各種深度材料



這里,Kimi 以 Agent 集群點專長


AgentSwarm 跑出的交易系統(tǒng)多目標(biāo)性能優(yōu)化路徑圖

再看 Claw 群組

Kimi Claw 是 Kimi 的龍蝦 Agent:

Claw 群組,則是讓這些龍蝦進同一個群聊一起干活,組織協(xié)作,一鍵出道


建群入口,Kimi 自己來當(dāng)群聊協(xié)調(diào)員。十三香進簋街美食群,決定蝦生的下一步

作為用戶,可以新建一個群,能把自己的龍蝦、朋友的龍蝦、阿里騰訊 MiniMax 別家模型的龍蝦都拉進來。自己訓(xùn)過的 OpenClaw 關(guān)聯(lián)到 Kimi 賬戶后也能拉進群。單群最多 50 個成員,人和蝦合起來算

過去的 Agent 框架,解決的是人怎么指揮 Agent。Agent 之間怎么說話、怎么分工、怎么互相引用對方的結(jié)果,沒人管過

你來旁觀一支 AI 隊伍為你干活


簋街美食群里,Kimi 當(dāng)協(xié)調(diào)員,十三香開始做市場調(diào)研。這只蝦正在認真討論自己的下一步

集群是并行分工,一個用戶派 N 個 subagent 干活。群聊是多實體對話,N 個用戶、N 只蝦,里面有對抗、有信息不對稱、有涌現(xiàn)

一個新聞拋進群,幾只不同角色的蝦同時給判斷。審計的挑風(fēng)險,風(fēng)控的算回撤,分析師的拉歷史對比。用戶最后決定聽哪一只

AI 到這一步第一次有了社交關(guān)系

你的蝦可以借給朋友,朋友的蝦也可以進你的群。比如你朋友是會計,他訓(xùn)過的會計蝦拉進來用一次就好

連訂閱額度也跟著一起流轉(zhuǎn)。你沒買 Kimi Pro,朋友的蝦進你群,他的 Pro 能力自然帶過來

專家把自己訓(xùn)過的蝦開放給付費用戶,知識付費就從「買內(nèi)容」變成「租一個專家助手」

這里,Kimi 拿 Claw 群組點人脈

第三件藏得最深


https://arxiv.org/abs/2603.15031

Kimi 在 arXiv 掛了一篇論文,叫 Attention Residuals:把所有 LLM 都在用的殘差連接,從每一層按固定方式往后傳,改成每一層自己學(xué)一個權(quán)重,決定前面哪些層該聽、哪些少聽

這里先說殘差連接這個老結(jié)構(gòu),是 2015 年何愷明提出,之后被所有 LLM 繼承。在它之前,深度學(xué)習(xí)訓(xùn)不動超過 30 層,有了它,百層也能訓(xùn)

殘差的默認做法是加。第 1 層的輸出、第 2 層的輸出、一直到第 29 層的輸出,到了第 30 層,全部等權(quán)相加。每一層對后面層的貢獻是固定的,模型訓(xùn)練過程中調(diào)整不了

問題就出在這個等權(quán)。第 30 層收到的是一鍋端進來的 29 層總和,哪一層對當(dāng)前任務(wù)關(guān)鍵、哪一層是雜音,它自己分不出來

還有一個副作用,論文里叫 dilution。深層要想讓自己的信號不被前面幾十層蓋過去,只能把輸出幅度寫大。訓(xùn)練到后期,PreNorm 架構(gòu)的 LLM 各層輸出的數(shù)值量級會隨著深度線性漲,這一現(xiàn)象在多個開源模型上被觀察到過

Kimi 的做法,是給每一層加一組可學(xué)習(xí)的權(quán)重,用 softmax 歸一。訓(xùn)練時,第 30 層會學(xué)出一個分布,告訴自己前面 29 層里哪些該多聽、哪些少聽。dilution 跟著消失,深層的輸出量級有界,反向傳播的梯度在各層分布也更均勻


論文 Figure 1:Standard Residuals / Full AttnRes / Block AttnRes

論文里把這個對應(yīng)關(guān)系叫 sequence-depth duality。時間維度上 Transformer 替代了 RNN,深度維度上 AttnRes 替代殘差,是同構(gòu)的兩步

論文附錄里有張權(quán)重?zé)崃D,每一個深色格子,都是一次學(xué)會的選擇


訓(xùn)練完之后,每一層聽前面哪些層、分別聽多重

Attention 層和 MLP 層的風(fēng)格不一樣。Attention 層分布更散,會跨幾層往早期借信息,有的甚至繞回最早那一層。MLP 層幾乎只看上一層

論文里的 Block AttnRes 是工程折中。理論上最理想的,是每一層注意到前面所有層。但大規(guī)模分布式訓(xùn)練下通信量會爆炸。Block 把層打成 8 個 block,只傳 block 級的表示,通信量從 O(Ld) 降到 O(Nd)

工程效果直給:Block AttnRes 的 8 塊方案,在同樣算力下,驗證 loss 等價于基線的 1.25 倍算力。Kimi 把這組實驗在不同模型規(guī)模上都跑了一遍,每一檔都成立。這套已經(jīng)合進 Kimi Linear 的 48B 總參 / 3B 激活模型,跑了 1.4T token,下游任務(wù)全面漲點

而在這里,Kimi 用 AttnRes 點的推理

同一個指向

任務(wù)層的點兵是 Agent 集群,社交層的點兵是 Claw 群組,模型內(nèi)部的點兵是 AttnRes

群體智能的關(guān)鍵詞落在智能上:每個兵長什么樣、該派去哪,模型得看得清

Kimi 點兵,能多多,更益善

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為何取消美國總統(tǒng)任期限制是件好事?(中英雙語)

為何取消美國總統(tǒng)任期限制是件好事?(中英雙語)

朝廷心腹
2026-06-12 20:44:46
“明亮紅色球體”、“等離子體狀球體”懸浮空中……美國防部公布第三批涉UFO檔案

“明亮紅色球體”、“等離子體狀球體”懸浮空中……美國防部公布第三批涉UFO檔案

環(huán)球網(wǎng)資訊
2026-06-12 22:38:17
大量上市!鉀是蘋果的7倍,中老年多吃它,手腳麻利,精神好!

大量上市!鉀是蘋果的7倍,中老年多吃它,手腳麻利,精神好!

普陀動物世界
2026-06-13 01:08:13
2026世界杯48隊FIFA排名:前30僅3隊缺席 新西蘭第85墊底

2026世界杯48隊FIFA排名:前30僅3隊缺席 新西蘭第85墊底

智道足球
2026-06-12 15:03:19
1929年,他扛兩挺重機槍加入紅軍,1955年授銜時羅榮桓卻左右為難

1929年,他扛兩挺重機槍加入紅軍,1955年授銜時羅榮桓卻左右為難

磊子講史
2026-06-02 17:46:53
他主政臺州,力推股份合作制激活民營經(jīng)濟,離任時留下工業(yè)品之都

他主政臺州,力推股份合作制激活民營經(jīng)濟,離任時留下工業(yè)品之都

叮當(dāng)當(dāng)科技
2026-06-12 15:00:33
為什么中國女排沒有朱婷的位置,真相大白了,她不會回來了

為什么中國女排沒有朱婷的位置,真相大白了,她不會回來了

體育快遞小哥哥
2026-05-11 16:32:52
藏不住了!人民日報言辭犀利評董路,范志毅早把真相說透了

藏不住了!人民日報言辭犀利評董路,范志毅早把真相說透了

阿訊說天下
2026-06-10 12:28:31
婚后才發(fā)現(xiàn)性生活不和諧,網(wǎng)友直呼:這不是搞笑嗎

婚后才發(fā)現(xiàn)性生活不和諧,網(wǎng)友直呼:這不是搞笑嗎

追星雷達站
2026-06-12 01:45:17
13日凌晨WTT曝出大冷門,林詩棟2-3出局,這5點讓人難以理解

13日凌晨WTT曝出大冷門,林詩棟2-3出局,這5點讓人難以理解

等等talk
2026-06-13 02:09:12
上海夫妻“離婚大戰(zhàn)”牽扯出來的大瓜,把我看得目瞪口呆

上海夫妻“離婚大戰(zhàn)”牽扯出來的大瓜,把我看得目瞪口呆

品讀時刻
2026-06-12 09:04:53
丈夫抱回男嬰讓我先喂,我偷偷做親子鑒定,結(jié)果出來全家傻眼了

丈夫抱回男嬰讓我先喂,我偷偷做親子鑒定,結(jié)果出來全家傻眼了

曉艾故事匯
2026-06-08 08:19:26
劉濤攜17女兒游意大利,一個成熟一個端莊,母女同框宛如姐妹花

劉濤攜17女兒游意大利,一個成熟一個端莊,母女同框宛如姐妹花

青杉依舊啊啊
2026-06-13 02:45:31
2026NBA快船五號簽選情生變

2026NBA快船五號簽選情生變

體壇周報
2026-06-13 03:59:14
黃仁勛分享浪漫戀愛史 大學(xué)靠輔導(dǎo)功課追到妻子 臺下女兒當(dāng)場被甜到

黃仁勛分享浪漫戀愛史 大學(xué)靠輔導(dǎo)功課追到妻子 臺下女兒當(dāng)場被甜到

快科技
2026-06-12 18:02:46
WTT薩格勒布賽爆大冷!世界冠軍出局,中日男單差距懸殊

WTT薩格勒布賽爆大冷!世界冠軍出局,中日男單差距懸殊

youyou喜歡你
2026-06-12 18:49:51
杭州一咖啡館邀4000人看世界杯,結(jié)果空無一人,網(wǎng)友評價一針見血

杭州一咖啡館邀4000人看世界杯,結(jié)果空無一人,網(wǎng)友評價一針見血

Mr王的飯后茶
2026-06-12 16:28:23
人的一生,要闖三關(guān)。第一關(guān),送父母終老;第三關(guān),守好自己的命

人的一生,要闖三關(guān)。第一關(guān),送父母終老;第三關(guān),守好自己的命

富書
2026-05-31 21:32:50
“滴滴出行”突然改名

“滴滴出行”突然改名

浙江之聲
2026-06-12 14:35:12
煤層厚達1千米,綿延上千公里!世界最大煤田真的是植物形成的?

煤層厚達1千米,綿延上千公里!世界最大煤田真的是植物形成的?

離離言幾許
2026-06-08 18:21:06
2026-06-13 05:27:00
賽博禪心
賽博禪心
拜AI古佛,修賽博禪心
466文章數(shù) 53關(guān)注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

SpaceX上市首日收漲19% 總市值報2.1萬億美元

頭條要聞

SpaceX上市首日收漲19% 總市值報2.1萬億美元

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰(zhàn)熱巴最意外

財經(jīng)要聞

萬億美元順差背后,透露這些信號

汽車要聞

標(biāo)配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態(tài)度原創(chuàng)

游戲
手機
家居
本地
公開課

索尼PS國區(qū)運營神了!玩梗《黑袍》:我會玩你的游戲

手機要聞

vivo X Fold6再預(yù)熱:天璣9500超能版+OriginOS 6 Fold

家居要聞

空間微調(diào) 移形換境

本地新聞

AK劉彰邂逅河北南大港濕地

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版