誰懂啊家人們??
Agent時代,大公司都在把“燒多少token”當KPI了,本小小員工還深陷另一個泥沼:
聰明的模型用不起,便宜的模型不夠聰明。
想找一個又能打又不貴、還能在主流Agent環境里即插即用的模型?過去基本沒有。
![]()
然而就在剛剛,我發現有一位國產玩家,悄悄打破了這個“不可能三角”。
其新發布的Agent模型,性能已經站到全球第一梯隊——甭管對面是開源還是閉源,凡是你能叫得上名字的頂尖選手,它都能與之掰一掰手腕。
而且價格確實驚到我了,只有主流頂尖模型的一半甚至更低。
更關鍵的是,模型深度適配了OpenClaw、Claude Code、Hermes、Nanobot等主流Agent框架,還兼容OpenAI接口。開發者幾乎不用改架構和代碼,很多時候換個baseURL和API Key就能直接跑。
說了這么多,想必你已十分好奇來者何人了?⊙.☉
答案這就揭曉:昆侖萬維。具體模型則是SkyClaw-v1.0及其輕量版SkyClaw-v1.0-lite。
悄咪咪透露,兩款模型現在都限時免費開放。
不過我還是好奇,同一款模型憑什么能同時做到聰明、便宜、好用?這不得狠狠扒一扒。
發布了什么?一次性上新兩個Agent模型
要搞懂昆侖萬維SkyClaw系列模型為什么能打,得先理解一個很多人忽略的區別。
現在市面上大多數模型的Agent能力,本質上是后天加的buff——先訓一個通用大模型,再套一層工具調用的殼。
省事確實省事,但由于模型本身并不是按“完成任務”來訓練的,而是按“生成語言”來訓練的,所以簡單任務還行,一復雜就容易掉鏈子。
而SkyClaw走的是完全不同的路。從訓練的第一天起,它的目標就不是聊天,而是干活。工具怎么調、參數怎么傳、多步任務怎么拆解和執行,這些能力不是后天補課補出來的,是從“娘胎”里帶的。
這個起點上的差異,直接決定了后面的上限。
實際上,行業里已經有不少玩家意識到這個問題,開始從“通用模型+工具殼”轉向專門為Agent場景設計的模型。
而昆侖萬維這次發布的SkyClaw-v1.0和SkyClaw-v1.0-lite,正是這條新路線的產物。
兩款模型,一重一輕,各有分工。
![]()
先說旗艦版SkyClaw-v1.0,吃復雜任務的主力。
它針對OpenClaw相關任務做了深度優化,適用于企業級的多步驟、強工具依賴場景。
在Claw相關任務上,據了解SkyClaw-v1.0已經可以和Claude Opus 4.6這個級別的閉源頂流模型正面過招。
能和Opus 4.6相提并論,我實在忍不住先去官網翻了幾個demo,一看還真繃不住了。
一眼掃過去,SkyClaw-v1.0是真愛玩游戲(bushi,頁面上全是它生成的各種“經典款”。
隨手打開水管工馬里奧,結果我直接通過電腦鍵盤就這么玩起來了——
前進、后退、跳高拿金幣,全程絲滑不卡頓。
![]()
覺得游戲只是炫技?再來一個正經干活的。
看看這個金融終端的完成度,頂部滾全球指數,左邊是頻道導航,中間新聞流帶著來源和關聯股票,右邊自選股帶迷你K線圖,連突發新聞彈窗都做了。
這種多個模塊聯動的界面,以前前端團隊至少搞好幾天,而SkyClaw-v1.0很快就自己搞定了。
![]()
當然,這些行情數據是模型自己模擬生成的,不是真實數據。
但這反而是重點。SkyClaw-v1.0干的活是從零搭架子——界面、組件、交互邏輯,一次性把代碼給你寫完。開發者只需要接上真實數據,就能讓頁面真正跑起來。
從馬里奧到金融終端,從娛樂到生產力,復雜度差了好幾個量級,而SkyClaw-v1.0都能一口氣吃下來。
或許這就是傳說中的,原生Agent模型和通用模型順手做Agent之間的差距。
再說輕量版SkyClaw-v1.0-lite,Agent核心能力沒打折,但速度更快、價格更便宜。
它面向的是高頻、成本敏感的場景,比如批量API調用、輕量級自動化流程。
發現沒,自從模型進入Agent時代后,大部分玩家在推主力模型時都會附帶一個輕量版,這也很好理解,就像前段時間Snapchat前機器學習工程師說的那樣:
如果你用AI開發時,始終默認使用成本最高的模型來完成每一項任務,那么你80%的工作都是在浪費錢。
經常用Agent跑任務的人,估計都對此深表認同。
有了這兩個模型,一個負責性能天花板,一個負責守成本底線,是誰又被AI穩穩地接住了(doge)。
不過說實話,這款模型更讓我心動的,還是它的價格。
SkyClaw-v1.0輸入0.5元/百萬tokens,輸出4元/百萬tokens;輕量版輸入僅0.3元,輸出2元。
悄悄對比了一下,這個價格僅為主流頂尖模型的一半甚至更低。
而且發布期還疊加了限時免費,對,你沒看錯,免費。
![]()
更離譜的是后手——試用期結束后,昆侖萬維計劃逐步開源每個模型版本。
性能夠到了閉源頂流,價格砍到了行業腰部,后面還有開源兜底。
這套組合拳打完,我只想說一句:這是要把Agent模型的落地門檻狠狠打下來啊。
怎么上手?就這么開箱即用
到這里,本“既要又要黨”已經心中大致有譜了,接下來只干一件事:
自己跑一把,畢竟是騾子是馬總得要拉出來遛遛。
怎么試呢?總結起來目前有兩條路:
最快的方式,就是直接去天工Skywork平臺(tiangong.cn)。SkyClaw-v1.0已經在5月22日接入了天工Skywork,不用裝任何東西,不用配環境,瀏覽器打開就能用。
而且現在正值限時特惠,價格超低,感覺很適合想先試試Agent能力再決定是否深度接入的人。
![]()
想深度集成的,那就走API(API目前免費中)。免費注冊一個APIFree賬號,拿到API Key就能調用,接口兼容OpenAI格式,支持流式輸出、工具調用、多輪對話。對已經在用OpenAI接口的開發者來說,基本就是換個baseURL和model名的事。
(P.S. APIFree是昆侖萬維自家的模型聚合平臺,支持調用國內外多種主流模型。)
![]()
話不多說,我這就選兩個比較典型的Agent場景跑一跑。
第一個我想試試給自己“養”一只電子桌寵,既能打工還能陪我摸魚那種。需求大概是這樣的:
一只小貓,能在屏幕上隨機溜達,點擊會說打工人語錄,右鍵能切工作模式和摸魚模式,工作模式帶番茄鐘倒計時,還要有喝水提醒、遠眺提醒、拉伸提醒這些健康功能。
只見提完需求后,SkyClaw-v1.0就直接在Skywork平臺里開干了,等我刷完短視頻回來,發現它已經把整套源代碼文件全部生成完畢。
再一看成品,小貓是SVG漸變繪制的,粉色身體、三角形耳朵、大眼睛,還挺可愛。
右鍵打開Focus Mode面板,番茄鐘支持25/45/60分鐘三檔,下面是任務清單和健康提醒模塊。倒計時結束后小貓自動切到摸魚模式,彈出氣泡:我不是在摸魚,我是在給公司省電……
![]()
當然,為了快速看效果,我先讓它生成了HTML版本,瀏覽器打開就能玩。如果想做成真正的原生桌寵,還可以繼續讓它生成Electron打包方案,終端跑幾行命令就能變成常駐任務欄的桌面應用。
![]()
而更讓我驚喜的是,做完之后它主動彈出了一個IM連接面板,支持Skywork App、飛書、Slack、Discord、Telegram等七種聊天工具直連。
也就是說,后續如果做進一步的開發對接,這只小貓理論上可以直接在我日常使用的聊天窗口里和我互動。
![]()
好,摸魚測完了,老規矩再來個正經的。
我們編輯部每周都有例會,其中一項就是總結上周的AI趨勢。
為了避免會前還在抓耳撓腮,這次我打算弄一個AI行業周報自動生成系統。需求很簡單也很貪心:
自動抓取過去一周的AI熱點,按主題分類,提煉趨勢信號,最后生成一份可交互的周報頁面。
結果你猜怎么著?這事兒還真讓SkyClaw-v1.0干成了。
前端就不用多說了,UI和功能布局一目了然。
![]()
關鍵是后端,看了SkyClaw-v1.0的工作過程才發現,它不光用FastAPI搭了一套完整API,還自己整出了一條信息處理流水線。
前面從RSS、GitHub、HuggingFace、網頁四個渠道自動抓數據,中間做清洗、分類和趨勢分析,后面自動生成周報,最后用SQLite存起來。
而我核心要的,就是那個周報Tab頁——頂部三句話總結本周趨勢,中間是一些值得關注的板塊,最后是按分類展開的詳細報告。
我試了下,分類中的每條鏈接都可以打開并跳轉,這說明數據是真實抓取的,不是模擬生成的。
當然最讓我心動的依舊是最后一步。做完之后,它提示我可以把這個系統設置為定時任務,比如每周一早晨自動運行抓取和分析腳本,生成最新一期周報。
![]()
兩個任務跑下來,一個感覺特別明顯:SkyClaw-v1.0已經不是那種需要你一步步喂指令的模型了。
桌寵那個,從理解需求、寫代碼到打包,全自己搞定,甚至還主動推薦了IM直連的方式。
周報那個更狠,直接給了一套完整的產品原型——后端、數據庫、信息抓取、分析、前端面板全都有,理論上還能定時自動運行。
而且有一個細節必須提一下,如今Agent時代都講究可復用的工作流,SkyClaw-v1.0這一點也做得很好,像上面那個周報系統,它就會彈窗提醒你要不要設置成Skill。
![]()
從開發到復用,能看到昆侖萬維已經有意在Agent模型中構建完整的工作流閉環。
再疊加前面說的價格,說白了就一句:
SkyClaw-v1.0已經能用,而且真用得起了。
怎么做到的?原生為Agent設計的訓練范式
至于SkyClaw-v1.0模型到底怎么做到的?
昆侖萬維這次也沒藏著掖著,項目主頁上直接清晰列出了幾點理由:
![]()
總結起來就是,不靠堆參數,靠針對Agent核心痛點進行系統性優化。
最典型的就是工具調用,現在很多模型聊天挺聰明,但一到真干活就開始掉鏈子——
參數傳錯、步驟漏掉、格式寫崩,一個失誤后面全亂套。
SkyClaw-v1.0就想了,既然Agent天天要調工具,那干脆從訓練階段就把模型泡在Agent環境里。
于是它在mid-training階段就塞進了大量復雜Agent任務,讓模型從底層開始適應“調用工具”這件事,而不是后面再臨時補課。后面再用針對OpenClaw任務的高質量數據繼續強化,多步驟工具調用的穩定性一下就上來了。
但Agent還有另一個經典問題:聊著聊著就“失憶”。
一說到記憶問題,很多人可能下意識認為“把上下文窗口做大就好了”。
確實,SkyClaw-v1.0也沒落下這一點,直接把上下文拉到了前沿玩家的百萬級水準。
但重點其實不只是“窗口夠大”,而是它在強化學習階段直接扔進真實Agent環境里反復訓練,讓模型學會在超長任務鏈里穩住狀態。
說白了,不是實驗室里刷benchmark,而是真拿去干活練出來的。
![]()
還有一點也挺關鍵。
很多Agent模型在自己熟悉的框架里猛得不行,一換環境立刻拉胯。
于是SkyClaw-v1.0干脆在訓練階段就把OpenClaw、Claude Code、Hermes、Nanobot這些主流環境全覆蓋了,相當于提前做了一遍“大規模適配”,開發者不用被某個框架綁死。
當然,最關鍵、可能也是最容易被忽略的一點是:昆侖萬維沒把模型做成一個巨無霸。
過去想要頂級Agent能力,默認就得接受大參數、高成本、慢推理這套組合。而SkyClaw-v1.0換了個方向,不是把參數往上堆,而是把訓練流程做成Agent專項特訓,在更小的參數量上把能力頂上去。
參數小了,推理自然快,成本自然低,這也是它價格能打到主流一半的底層邏輯。
所以回頭再看,真正拉開差距的,可能早就不只是參數規模了。
一個模型從第一天開始,到底有沒有圍著Agent場景去訓練,很多時候才決定了它最終能不能真正干活。
起點不同,終點自然不同。
Agent落地的“不可能三角”,被國產玩家打破了
老實說,SkyClaw-v1.0系列模型的出現,剛好踩在一個很微妙的節點上。
Agent賽道喊了一整年,大家都知道這是方向,但真正能用、用得起、還好接入的模型,一直沒幾個。
而它填補的,恰恰是高性能Agent能力與低成本落地之間長期空著的那塊地。
而且它還不是突然冒出來的。
早在今年2月,昆侖萬維就上線了SkyClaw產品,基于開源架構OpenClaw重構,做的是全天候云端AI助理。
隨后的3月,它又在GitHub和Clawhub鋪了首批6個官方Skill:PPT、文檔、表格、設計、搜索、音樂,基本把辦公場景的核心環節覆蓋了。
![]()
現在SkyClaw-v1.0一出,回頭看這條線就很清楚了:
先搭平臺,再鋪Skill生態,最后把底層模型的性能和成本一并解決。
就像我在實測中感受到的那樣,做完桌寵它問你要不要存成Skill,做完周報它提醒你設成定時任務,昆侖萬維瞄準的顯然不只是一個模型,而是一整套Agent工作生態。
這背后的邏輯其實也不難理解,因為一個顯而易見的大趨勢是——
生產力正在從單一工具時代,邁向可持續運轉的AI工作流時代。
單個模型再強,如果沒有平臺承接、沒有Skill沉淀、沒有工作流串聯,能力就是一次性的,而一次性顯然不是這個時代大家所追求的。
![]()
其實回看昆侖萬維這幾年做的事,有一條線挺清晰的:把AI技術盡可能帶給更多人。
先不說早期開源和價格下壓那些大動作,你注意到一個產品細節沒?
天工Skywork上不只有自家模型,Claude、GPT這些也能直接用;APIFree更干脆,直接做成模型聚合平臺,國內外主流模型一個賬號全搞定。
說實話,這種做法在行業頭部玩家里的確不多見。畢竟大部分平臺,本質上還是希望把用戶圈在自己生態里。
而這次SkyClaw-v1.0,某種程度上走的也是同一條路。
限時免費、價格直接壓到主流一半、繼續鋪Skill和工作流生態,說到底都是在讓Agent能力真正走出實驗室。
因為只有當價格開始降下來、工作流開始普及,頂級Agent能力才不會只是大廠內部才能長期“消費”的東西。
從高端實驗到全民落地,至少昆侖萬維先給大家打開了一扇門。
項目主頁:
https://skyworkai.github.io/skyclaw/
模型介紹與完整評測數據:
https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=info
API文檔:
https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
https://www.apifree.ai/model/skywork-ai/skyclaw-v1-lite?tab=api
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.