大家好,我是冷逸。
在Gemini 3發布后,我很早就說過,我們急需要一個。
現在,似乎有答案了。剛剛,Kimi發布并開源了全新的基座模型K2.5,文字/圖片/視頻理解能力Max。
![]()
K2.5模型在huggingface上開源
感覺Kimi這次,是帶著大殺器傾巢而來。
我趕緊體驗了一番,先說結論:這可能是目前最強的開源視覺Agentic模型。特別是前端方面,直追Gemini 3 Pro。
![]()
快速了解K2.5
簡單介紹一下這個模型。
K2.5最大的特點是全能:
原生的多模態架構:天生具備視覺能力,理解圖片、視頻就像讀文字一樣自然。
超全的能力&性價比:K2.5同步提供快速版、思考版、Agent版和Agent集群。
基于K2.5,Kimi帶來了全新的體驗:
![]()
1)超級視覺
不僅能看,更能推理,具備Visual Reasoning和Agentic Tool Call。
256k上下文,能吃得下2小時長視頻 /100MB文件,支持視覺版“大海撈針”。
2)Visual Coding
支持Image/Video to Code,所見即所得。
上傳一張圖片或視頻(<100MB),Kimi能秒懂你的意圖,像素級復刻一個網頁。
比如,復刻一個交互超級牛逼的網站。
![]()
3)Agent Swarm
Agent集群,能同時調度多個Agent協作,可一口氣獨立完成1500+步驟。
比如,幫我們一次性調研100家上市公司,一次下載100篇學術論文,生成100張素材圖。
4)Office Agent
Office三件套全新升級,可以幫助用戶直接交付準專業水平的辦公文檔。
![]()
5)Kimi Code
以上所有功能,現在已可以在kimi.com直接體驗。
同步,Kimi還推出了全新的編程工具:Kimi Code。
Kimi Code不僅能在終端里直接運行,也能無縫集成到VSCode、Cursor、JetBrains和Zed等主流編輯器中。
![]()
體驗地址:www.kimi.com/code
![]()
一手實測
K2.5上線后,我也趕緊體驗了一番。
1)前端復刻
之前,Gemini 3 Pro的前端復刻,被很多人玩壞了。
我用K2.5,也來試一下。
給《流浪地球》的行星發動機做一個動畫演示網頁。
![]()
參考這張圖片設計一個教學演示網頁。
復刻這個網頁,讓眼珠子跟著鼠標移動。
![]()
復刻OpenAI News。
![]()
復刻Moonshot官網。
![]()
更有意思的是,K2.5支持視頻復刻。可以把你喜歡的APP錄屏,然后發給K2.5,讓它設計一個類似的產品。
![]()
體驗下來,前端這塊,我覺得K2.5和Gemini 3 Pro已經沒什么區別了。頂級審美,頂級動效,以及頂級的視覺理解能力。
2)網站開發
體驗完前端,我們來讓它做一個真正的網站。
上周,北京不是下雪了,我找了一張故宮雪景的圖片,打開K2.5 Agent模式,讓它幫我設計一個網站。
![]()
![]()
它會自己理解這張圖的美學意境,包括設計元素、視覺效果等。
![]()
然后,調用Agent給我們進行開發,并部署上線。
![]()
給大家看下最終的成品(一次輸出,沒有抽卡)。
特別是1-3屏,這排版、布局和交互真的太棒了,這就是我們的東方美學。
![]()
讓它復刻網站wodniack.dev,完成效果非常nice,超級酷炫。
![]()
也可以做漢堡的分層拆解動畫。
![]()
3)批量work
如果說前面的體驗,大家覺得“嗯,好像還不錯”。
那Agent Swarm(Agent集群),相信我,你一定會被這個功能給驚訝到的。
![]()
體驗地址:https://www.kimi.com/agent-swarm
最近,不是全民都在學Skills嘛,那我想讓「Agent集群」幫我整理50個高Star的Skills,于是就問它:
幫我從GitHub上搜集50個熱門的Claude Code Skills,按照Star數從高到低排列。
初次體驗,會提示消耗3次Agent額度。想象這個工程量,只消耗3次額度似乎還是很劃算的,讓它繼續干吧。
![]()
然后,它就招來了3個助手幫我干活。每個助手的工作內容,各不相同。
![]()
活干到一半,只收集到39個skills,還沒完成。kimi又繼續拉了小北、海明威兩位替補助手,繼續給我干活。
![]()
最終,集齊了50個skills,一次性給到了我。
![]()
不得不說,這個“批量work”的效果太贊了,就是速度有點慢(大部分時間因為耗在GitHub訪問失敗的地方)。
不過沒關系,它是在K2.5 Agent自己的后臺運行。在Agent工作期間,我完全可以去做其他事情,等有結果了再來驗收。
所以,我又用它跑了一些其他的case。
比如,我讓它用我頭像做一系列連續性的打斗動畫。
![]()
![]()
批量下載論文。
![]()
![]()
召集專家建言獻策,如何讓1歲孩子上北大。
![]()
以及,批量生圖。
![]()
不得不說,Kimi這次是真的把并發拉滿了。
從K1.5卷長度,到K2卷深度思考,再到今天K2.5卷并發。每次新模型的發布,Kimi都總能給我們新的答案,而且一次比一次猛。
并發拉滿,考驗的不只是模型本身,而是工程、調度、成本、穩定性的一整套系統能力。
這次Kimi能夠把這個產品做出來,是真的。
4)視覺理解與推理
最后,我們考驗一下模型基本的視覺理解和推理能力。
隨手拍了張照片(圖中大樓標志已被抹除),問問它這是哪里。
![]()
沒錯,這里是北京的京東科技大廈,Kimi正是在這里辦公。
又問了一張圖,這是什么雪山,推測一下我拍攝時的海拔高度。
![]()
非常準確,玉龍雪山,海拔9,000-11,000米。
接著,我又問了一個問題。
![]()
其實,一開始我都不抱希望。
![]()
但是看到結果,有點被驚訝到了。除了航線外(實際為“四川成都-云南芒市”),它差一點就全部推理出了。
給大家看下真實的Exif信息。
![]()
K2.5也能做這樣的行測題,反正我是看不懂。
![]()
實測下來,像推理地理位置、樓層高度、人物身高、作品名稱這些,K2.5基本能猜個八九不離十,當然還做不到100%的準確。
但如果拿來分析一些股票圖、科研圖、行測題、Puzzle題、幾何題等,基本都能得到靠譜的答案,準確率很高。
![]()
所以,整個體驗下來,才會有了開篇那句話“感覺Kimi這次是帶著大殺器傾巢而來。”
K2.5快速、K2.5思考、K2.5 Agent、K2.5 Agent集群,以及新上線的office三件套、Kimi Code,量大管飽,應有盡有。
![]()
這種“傾巢而來”并非雜亂無章的堆料,而是生態級的All IN,且誠意滿滿。
快速版負責效率(日常夠用),思考版兜底復雜問題,Agent負責把模型能力變成生產力,Agent集群則專門解決規模化問題……
很高興,今天終于能夠有國產模型在多模態理解和Coding能力上追平海外頂尖模型。
而且還是開源的。
正是,潮平兩岸闊,風正一帆懸。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.