无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Kimi K2 Thinking 模型發(fā)布并開源,全面提升 Agent 和推理能力|Z News

0
分享至

11 月 6 日,Kimi 發(fā)布 Kimi K2 Thinking,已在網(wǎng)頁端與最新版 App 上線,同時(shí)其 API 也正式登陸 Kimi 開放平臺(tái)。

Kimi K2 是基于「模型即 Agent」理念訓(xùn)練的新一代 Thinking Agent。在 OpenAI 評(píng)估 AI Agent 網(wǎng)絡(luò)瀏覽能力的基準(zhǔn)測(cè)試 BrowseComp 中,Kimi K2 以 60.2% 的成績(jī)成為新的 SOTA 模型。

真格基金于 2023 年天使輪投資月之暗面。自 2023 年 10 月發(fā)布以來,Kimi 持續(xù)升級(jí)基礎(chǔ)模型能力,拓展產(chǎn)品功能與交互體驗(yàn)。Kimi K2 模型最初發(fā)布于 7 月 11 日。目前,包括 Cursor、Genspark、Perplexity、YouWare 等多款產(chǎn)品已接入或使用 Kimi K2 模型。

我們期待在未來與 Kimi 和更多用戶一起共創(chuàng)智能。

今天,我們發(fā)布 Kimi K2 Thinking——Kimi 迄今能力最強(qiáng)的開源思考模型。


Kimi K2 Thinking 是我們基于「模型即 Agent」理念訓(xùn)練的新一代 Thinking Agent,它原生掌握「邊思考,邊使用工具」的能力。在人類最后的考試(Humanity's Last Exam)、自主網(wǎng)絡(luò)瀏覽能力(BrowseComp)、復(fù)雜信息收集推理(SEAL-0)等多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)達(dá)到 SOTA 水平,并在 Agentic 搜索、Agentic 編程、寫作和綜合推理能力等方面取得全面提升。

Kimi K2 Thinking 模型無需人類干預(yù),即可憑借持續(xù)穩(wěn)定的深度思考能力自主實(shí)現(xiàn)高達(dá) 300 步的工具調(diào)用,從而幫助用戶解決更復(fù)雜的問題。這是我們?cè)?Test-Time Scaling(測(cè)試時(shí)擴(kuò)展)領(lǐng)域的最新進(jìn)展,通過同時(shí)擴(kuò)展思考 Token 和工具調(diào)用的步數(shù),實(shí)現(xiàn)更強(qiáng)的 Agent 和推理性能。


Kimi K2 Thinking 模型已上線 kimi.com 和最新版 Kimi 手機(jī)應(yīng)用的常規(guī)對(duì)話模式。Kimi Agent 模式的底層模型后續(xù)也將升級(jí)為 Kimi K2 Thinking 模型,帶來完整的多步思考和工具調(diào)用能力。


Kimi K2 Thinking 模型的 API 可通過 Kimi 開放平臺(tái)(platform.moonshot.cn)訪問。如需自行部署,請(qǐng)?jiān)?Hugging Face、ModelScope 等平臺(tái)下載模型。

推理性能全面提升

我們來看一個(gè)人類最后的考試中人文類題目推理過程示例。在這個(gè)示例中,Kimi K2 Thinking 經(jīng)過 5 次搜索和推理,結(jié)合每步搜索到的新信息,層層深入,最終推理出了答案:

上下滾動(dòng)查看完整推理過程

自主搜索與瀏覽能力全面提升

在復(fù)雜搜索和瀏覽場(chǎng)景中,Kimi K2 Thinking 模型也表現(xiàn)出色。BrowseComp 是由 OpenAI 發(fā)布的一個(gè)專門評(píng)估 AI Agent 網(wǎng)絡(luò)瀏覽能力的基準(zhǔn)測(cè)試,這項(xiàng)測(cè)試的初衷是衡量 AI Agent 在信息過載環(huán)境中展現(xiàn)出的堅(jiān)持性與創(chuàng)造力,即能否像人類研究員一樣「刨根問底」。在這項(xiàng)極具挑戰(zhàn)的任務(wù)上,人類平均只能達(dá)到 29.2% 的成績(jī)。Kimi K2 Thinking 在這項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出極強(qiáng)的鉆研能力,以 60.2% 的成績(jī)成為新的 SOTA 模型。

在長(zhǎng)程規(guī)劃和自主搜索能力的驅(qū)動(dòng)下,Kimi K2 Thinking 可借助多達(dá)上百步的「思考 → 搜索→ 瀏覽網(wǎng)頁 → 思考 → 編程」動(dòng)態(tài)循環(huán),持續(xù)地提出并完善假設(shè)、驗(yàn)證證據(jù)、進(jìn)行推理,并構(gòu)建出邏輯一致的答案。這種邊主動(dòng)搜索邊持續(xù)思考的能力,使 Kimi K2 Thinking 能夠?qū)⒛:议_放式的問題分解為清晰、可執(zhí)行的子任務(wù)。


我們來看一個(gè)示例,在這個(gè)例子中,Kimi K2 Thinking 經(jīng)過兩次搜索和思考,先根據(jù)股票回購(gòu)的已知信息找到了這家制造快艇的公司,然后在美國(guó)證券交易委員會(huì)(SEC)的官網(wǎng)上找到了股票回購(gòu)公告信息,得出了準(zhǔn)確的答案:

上下滾動(dòng)查看完整推理過程

Agentic 編程能力持續(xù)精進(jìn)

Kimi K2 Thinking 模型的編碼能力也得到了增強(qiáng),在多語言軟件工程基準(zhǔn) SWE-Multilingual、SWE-bench 驗(yàn)證集和 Terminal 終端使用等基準(zhǔn)測(cè)試中的表現(xiàn)有了進(jìn)一步提升。


我們觀察到 Kimi K2 Thinking 在處理 HTML、React 以及組件豐富的前端任務(wù)時(shí)性能有明顯提升,能將創(chuàng)意轉(zhuǎn)變?yōu)楣δ荦R全、響應(yīng)式的產(chǎn)品。在 Agentic Coding 場(chǎng)景中,Kimi K2 Thinking 能在調(diào)用各種工具的同時(shí)進(jìn)行思考,靈活地融入 software agents 中,處理更復(fù)雜、多步驟的開發(fā)工作流。


我們來看兩個(gè)例子:


現(xiàn)在,Kimi K2 Thinking 可以幫你復(fù)刻一個(gè)真實(shí)可用的 Word 文字編輯器。

Kimi K2 Thinking 也可以幫你創(chuàng)造一個(gè)華麗風(fēng)格的體素藝術(shù)(voxel art)作品:

通用基礎(chǔ)能力升級(jí)

創(chuàng)意寫作:Kimi K2 Thinking 顯著提升了寫作能力,它能將粗略的靈感轉(zhuǎn)化為清晰、動(dòng)人且意圖明確的敘述,使其兼具韻律感和深度。它能輕松駕馭微妙的文風(fēng)差異和模糊的結(jié)構(gòu),并在長(zhǎng)篇大論中保持風(fēng)格的連貫性。在創(chuàng)意寫作方面,它筆下的意象更生動(dòng),情感共鳴更強(qiáng)烈,將精準(zhǔn)的表達(dá)與豐富的表現(xiàn)力融為一體。


學(xué)術(shù)與研究:在學(xué)術(shù)研究和專業(yè)領(lǐng)域,Kimi K2 Thinking 在分析深度、信息準(zhǔn)確性和邏輯結(jié)構(gòu)方面均有顯著提升。它能有條不紊地剖析復(fù)雜的指令,并以清晰嚴(yán)謹(jǐn)?shù)姆绞酵卣顾悸贰_@使其尤其擅長(zhǎng)處理學(xué)術(shù)論文、技術(shù)摘要,以及那些對(duì)信息完整性和推理質(zhì)量要求極高的長(zhǎng)篇報(bào)告。


個(gè)人與情感:在回應(yīng)個(gè)人或情感類問題時(shí),Kimi K2 Thinking 的回答更富同理心,立場(chǎng)也更中正平和。它的思考深入周到且具體明確,能提供細(xì)致入微的觀點(diǎn)和切實(shí)可行的后續(xù)建議。它能清晰并關(guān)切地幫助用戶梳理復(fù)雜的決策,其語氣既腳踏實(shí)地又切實(shí)中肯,更有人情味。


我們來看一個(gè)輔助閱讀英文技術(shù)論文的例子:

上下滾動(dòng)查看完整分析過程

原生 INT4 量化提升推理效率

低比特量化是降低大規(guī)模推理服務(wù)器的延遲和 GPU 顯存占用的有效方法。我們的測(cè)試發(fā)現(xiàn),因?yàn)樗伎寄P蜁?huì)產(chǎn)生極長(zhǎng)的解碼長(zhǎng)度,常規(guī)的量化手段往往會(huì)導(dǎo)致模型性能大幅下降。為了克服這一挑戰(zhàn),我們?cè)诤笥?xùn)練(post-training)階段采用了量化感知訓(xùn)練(QAT),并對(duì) MoE 組件應(yīng)用了 INT4 純權(quán)重(weight-only)量化。


這使得 Kimi K2 Thinking 模型能夠在復(fù)雜推理和 Agentic 任務(wù)中支持原生的 INT4 推理,并將生成速度提升了約 2 倍。INT4 對(duì)推理硬件的兼容性更強(qiáng),對(duì)國(guó)產(chǎn)加速計(jì)算芯片也更加友好。值得注意的是,Kimi 所有的基準(zhǔn)測(cè)試成績(jī)都是在 INT4 精度下取得的。

現(xiàn)在開始使用

前往 kimi.com 或更新到最新版 Kimi App,從「工具箱」中打開 K2 模型的「長(zhǎng)思考」開關(guān),即可把你遇到的復(fù)雜任務(wù)丟給 Kimi 一起思考。

Kimi K2 Thinking 模型 API 已上架 Kimi 開放平臺(tái)(platform.moonshot.cn),支持 256K 上下文,價(jià)格與 Kimi K2-0905 相同,每百萬 Token 輸入 4 元,輸出 16 元,命中緩存的輸入為 1 元。速度高達(dá) 100 Token/s 的 Turbo API 也同步上架,每百萬 Token 輸入 8 元,輸出 58 元,命中緩存的輸入為 1 元。歡迎開發(fā)者測(cè)試反饋新模型 API。

關(guān)于 Kimi K2 模型


Kimi K2 模型最初發(fā)布于 7 月 11 日,它是一款混合專家架構(gòu)(MoE)的開源基礎(chǔ)模型,總參數(shù) 10,000 億,激活參數(shù) 320 億。9 月 5 日,Kimi K2-0905 版更新,進(jìn)一步提升了代碼能力,并且將上下文窗口從 128K 升級(jí)到 256K。截止目前,包括 Cline、Cursor、flowith、Genspark、Kilo Code、Kortix Suna、OpenRouter、Perplexity、RooCode、TRAE、Trickle、Vercel、Windsurf 、YouWare 等在內(nèi)的產(chǎn)品都接入或在使用 Kimi K2 模型。11 月 6 日,Kimi K2 Thinking 模型發(fā)布,全面提升 Agent 和推理能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中甲最新積分榜:長(zhǎng)春亞泰2-1逆襲,廣州豹登頂,南京城市被逆轉(zhuǎn)

中甲最新積分榜:長(zhǎng)春亞泰2-1逆襲,廣州豹登頂,南京城市被逆轉(zhuǎn)

足球狗說
2026-06-13 21:58:49
偷雞不成蝕把米!以為能“毀掉”董路,沒成想自己先被扒個(gè)底朝天

偷雞不成蝕把米!以為能“毀掉”董路,沒成想自己先被扒個(gè)底朝天

社會(huì)日日鮮
2026-06-13 09:38:13
你信嗎?有些事被迫終止,其實(shí)是老天在救你!網(wǎng)友:想想都后怕

你信嗎?有些事被迫終止,其實(shí)是老天在救你!網(wǎng)友:想想都后怕

另子維愛讀史
2026-06-12 19:50:24
高考后手機(jī)店被擠爆:孩子你要明白,分?jǐn)?shù)不是你和父母之間的交易

高考后手機(jī)店被擠爆:孩子你要明白,分?jǐn)?shù)不是你和父母之間的交易

洞見
2026-06-12 21:22:37
中國(guó)斷供稀土5個(gè)多月,日本工廠無一停產(chǎn),是真擺脫了還是在硬撐

中國(guó)斷供稀土5個(gè)多月,日本工廠無一停產(chǎn),是真擺脫了還是在硬撐

次元君情感
2026-06-01 14:27:53
比賽還剩4天開打 阿根廷隊(duì)卻先迎致命壞消息 取勝阿爾及利亞懸了

比賽還剩4天開打 阿根廷隊(duì)卻先迎致命壞消息 取勝阿爾及利亞懸了

零度眼看球
2026-06-13 11:06:19
韓國(guó)隊(duì)贏球,戳破中國(guó)足球借口!東亞人不行,那為何日韓能贏?

韓國(guó)隊(duì)贏球,戳破中國(guó)足球借口!東亞人不行,那為何日韓能贏?

傲傲講歷史
2026-06-14 04:57:33
大量蘋果“無頭騎士”流入閑魚!頂配32G+1TB組合,二手賣半價(jià)

大量蘋果“無頭騎士”流入閑魚!頂配32G+1TB組合,二手賣半價(jià)

閑搞機(jī)
2026-06-13 11:07:02
加拿大世界杯首秀,多倫多體育場(chǎng)外紅白海洋

加拿大世界杯首秀,多倫多體育場(chǎng)外紅白海洋

溫柔且自由
2026-06-13 01:10:57
浪姐萬千惠終于發(fā)賣老頭了!網(wǎng)友:三百多分沒白挨

浪姐萬千惠終于發(fā)賣老頭了!網(wǎng)友:三百多分沒白挨

TVB的四小花
2026-06-13 02:06:49
韓國(guó)芯片專家:最快到2030年,將會(huì)出現(xiàn)“中國(guó)版ASML”!

韓國(guó)芯片專家:最快到2030年,將會(huì)出現(xiàn)“中國(guó)版ASML”!

步論天下事
2026-06-13 18:57:37
外媒:沙特王儲(chǔ)“婉拒”馬克龍邀其出席G7峰會(huì),并就因事先已有安排而無法出席表示歉意

外媒:沙特王儲(chǔ)“婉拒”馬克龍邀其出席G7峰會(huì),并就因事先已有安排而無法出席表示歉意

環(huán)球網(wǎng)資訊
2026-06-13 19:00:21
導(dǎo)演王晶回應(yīng)與周星馳不和:很難跟他做朋友,他也不出來社交,鬧翻后在公共場(chǎng)合比較少見面,但周星馳的戲首映會(huì)請(qǐng)自己去

導(dǎo)演王晶回應(yīng)與周星馳不和:很難跟他做朋友,他也不出來社交,鬧翻后在公共場(chǎng)合比較少見面,但周星馳的戲首映會(huì)請(qǐng)自己去

極目新聞
2026-06-12 08:41:26
美專家曾說:若中國(guó)武統(tǒng),西方可凍結(jié)3.2萬億中國(guó)資產(chǎn)!

美專家曾說:若中國(guó)武統(tǒng),西方可凍結(jié)3.2萬億中國(guó)資產(chǎn)!

果媽聊娛樂
2026-05-28 18:57:51
活塞2026選秀應(yīng)避開三名球員

活塞2026選秀應(yīng)避開三名球員

體壇周報(bào)
2026-06-14 05:17:18
南美球隊(duì)1-4首敗!14日賽程:巴西VS摩洛哥+亞洲2隊(duì)出戰(zhàn) 央視直播

南美球隊(duì)1-4首敗!14日賽程:巴西VS摩洛哥+亞洲2隊(duì)出戰(zhàn) 央視直播

何老師呀
2026-06-13 14:32:32
世界杯觀感:沒吹牛!上半場(chǎng)的美國(guó)能奪冠,下半場(chǎng)的美國(guó)只能出線

世界杯觀感:沒吹牛!上半場(chǎng)的美國(guó)能奪冠,下半場(chǎng)的美國(guó)只能出線

濤哥侃球
2026-06-13 15:33:45
全球最深鯨類大墓地被發(fā)現(xiàn):超1000萬頭鯨長(zhǎng)眠 最早可追溯到530萬年前

全球最深鯨類大墓地被發(fā)現(xiàn):超1000萬頭鯨長(zhǎng)眠 最早可追溯到530萬年前

快科技
2026-06-12 07:57:04
穿瑜伽褲跑步,不尷尬嗎?

穿瑜伽褲跑步,不尷尬嗎?

馬拉松跑步健身
2026-06-13 21:32:16
A股:股民做好準(zhǔn)備,信號(hào)很強(qiáng)烈,下周6.15將迎更大的暴風(fēng)雨?

A股:股民做好準(zhǔn)備,信號(hào)很強(qiáng)烈,下周6.15將迎更大的暴風(fēng)雨?

夜深愛雜談
2026-06-13 21:18:02
2026-06-14 05:43:00
真格基金 incentive-icons
真格基金
創(chuàng)業(yè),來真格的。
1558文章數(shù) 3678關(guān)注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協(xié)議計(jì)劃周日簽署 如不順利還有終極手段

頭條要聞

特朗普:美伊協(xié)議計(jì)劃周日簽署 如不順利還有終極手段

體育要聞

美國(guó)4比1巴拉圭:這統(tǒng)治力真是美國(guó)隊(duì)?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋?cè)W(wǎng)!

財(cái)經(jīng)要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍(lán)S07華為乾崑激光版增程車型上市 限時(shí)15.49萬元起

態(tài)度原創(chuàng)

藝術(shù)
家居
時(shí)尚
旅游
公開課

藝術(shù)要聞

廣州再建一座“小蠻腰”?190米,頂著個(gè)球,2027年見!

家居要聞

空間微調(diào) 移形換境

夏天穿衣要杜絕土氣感!試試精致的小香風(fēng),優(yōu)雅與俏皮并存

旅游要聞

夏天就該這樣過!大別山的夏天,從霍山大峽谷漂流的第一聲尖叫開始。

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版