无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

首個OpenClaw龍蝦大模型排行榜來了!兩個國產(chǎn)?AI?殺進(jìn)全球前三,最省錢養(yǎng)蝦方案來了。

0
分享至

我的創(chuàng)業(yè)故事:《

大家好,我是微笑哥。

龍蝦(OpenClaw)好用,Token 太貴!

這可不是我一個人的感覺,這是全世界人民的普遍體驗,這兩天有很多朋友讓我推薦一些免費的模型。

其實很多 API 廠商都有一些免費的額度,或者說有一些免費的 API 可以使用的,我都寫到了這個文檔中,想領(lǐng)取文檔的直接拉到文末。


大家都知道 Claude、ChatGpt 的 API 是最好用的,但是實在是太貴了,龍蝦又非常消耗 Token。

在群里很多深度玩小龍蝦的朋友,一天消耗幾百刀是太普遍了,這普通人誰玩得起,國外用戶也消耗不起呀。

于是很多性價比高的,中國大模型API成為了大家的首選,在全球世界上也是這樣子的,最新的排行榜也能證明。

這兩天,OpenClaw 的創(chuàng)始人,發(fā)布了一個最適合 OpenClaw 的大模型排行榜。


專門針對 OpenClaw 的基準(zhǔn)測試 PinchBench,用于評估大語言模型在 OpenClaw 任務(wù)中的表現(xiàn)。


PinchBench是專門針對OpenClaw生態(tài)設(shè)計的一套AI Agent 基準(zhǔn)測試(benchmark),主 要用來評估不同大模型在真實 Agent 自動化任務(wù)中的能力,而不僅僅是聊天能力。

它通過一系列真實任務(wù)(如工具調(diào)用、內(nèi)容生成、文件操作、多步驟任務(wù)執(zhí)行、記憶能力),評估不同大模型在自動化任務(wù)和 Agent 執(zhí)行能力上的表現(xiàn)。

簡單說:

PinchBench 就是給 OpenClaw AI Agent “跑分”的測試,用來比較不同模型誰更適合做 Agent。

從新的跑分成績來看MiniMax-m2.1 和 kimi-k2.5 進(jìn)入了前三


第一名:Gemini 3 Flash (Google)

沒錯,又是那個主打“又快又便宜”的 Flash。它以95.1%的成功率拿下了冠軍。

這說明在 Agent(智能體)賽道,模型不需要很大,但腦子必須靈光。

第二、三名:MiniMax M2.1 & Kimi K2.5

這是最讓我熱血沸騰的地方!國產(chǎn)大模型MiniMax月之暗面(Kimi)直接包攬了全球前三的剩下兩個席位。

什么 GPT-4o、Claude 4.5,在這次的“龍蝦”任務(wù)實測中,居然都被咱們國產(chǎn)模型甩在了身后。

說實話這個成績比我想象中要好太多了。完整的排名可以從這里看:https://pinchbench.com/

在 OpenClaw 的 Agent 任務(wù)中,模型需要頻繁進(jìn)行“思考-執(zhí)行-反饋”的循環(huán),所以首字延遲(TTFT)和生成速度(TPS)至關(guān)重要。

在模型速度 minimax-m2.5 排第一;谷歌排名第二;Meta 排名第三。


在花錢這個指標(biāo)上面,我估計大家關(guān)注最多了。

如果你打算讓“小龍蝦”幫你掛機(jī)干活,API 的花費可能直接勸退。這次國產(chǎn)模型表現(xiàn)出了極高的性價比。

最省錢:gpt-5-nanoGemini 3 Flash (谷歌的輕量版也很能打呀),輸入約 $0.1/1M tokens,輸出約 $0.4/1M tokens。

谷歌在打價格戰(zhàn),目前的單價幾乎是所有大廠里最低的。如果你是重度使用者,它是首選。

高性價比(國產(chǎn)):MiniMax M2.1 / 2.5;價格: 輸入約 ¥0.2/1M tokens(約 $0.03)。

MiniMax 的 M2 系列采用了更小規(guī)模的參數(shù)優(yōu)化,價格比 GPT-4o 便宜了接近 90%,但任務(wù)成功率卻能進(jìn)全球前三,簡直是“性價比狂魔”。

最貴的是:Claude 4.5 Opus價格: 高達(dá) $15/1M tokens 以上,雖然聰明,但成本是 Flash 模型的150 倍

在“養(yǎng)蝦”圈,一般只把它當(dāng)成“大腦”處理極難的問題,日常跑腿(比如搜網(wǎng)頁、點外賣)用它簡直是燒錢。


在“養(yǎng)蝦”圈,一般只把它當(dāng)成“大腦”處理極難的問題,日常跑腿(比如搜網(wǎng)頁、點外賣)用它簡直是燒錢。

總和對比下來:

國外來看Gemini 3 Flash 是綜合贏家,不管是能力、速度、價格,都排在第一梯隊,養(yǎng)蝦首選。

國內(nèi)來看 miniMax 成為最大贏家,不管是能力、還是速度、價格都不差,國內(nèi)用戶養(yǎng)蝦首選。

綜合對比,怎么養(yǎng)蝦最劃算?

  • 高頻任務(wù) → minimax 或 z-ai,速度快+成本低

  • 批量非實時任務(wù) →Gemini 3 Flash或 gpt-5-nano,成本更低,耐心等待即可

總結(jié):日常自動化用速度快、成本低的國產(chǎn)模型,關(guān)鍵高精度任務(wù)則用理解能力強但成本高的國外模型,平時以國產(chǎn)模型為主,必要時調(diào)用高端模型,這樣既保證效率,又控制賬單開支。

我創(chuàng)建了一個 OpenClaw 交流群,專門交流:

1、小龍蝦怎么玩

2、可以做哪些自動化

3、有哪些賺錢思路

4、最新玩法案例

5、進(jìn)群就送OpenClaw 中文學(xué)習(xí)指南(已經(jīng)寫了上萬字了,還在增加)

群 完全免費,但有一個規(guī)矩:禁止發(fā)廣告,發(fā)廣告直接永久拉黑。

如果你對 AI自動賺錢 / AI自動干活 / AI效率工具 感興趣,可以進(jìn)來一起研究。

① 添加下方微信

② 通過后回復(fù):小龍蝦

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
WC!勇士!史詩級三巨頭...

WC!勇士!史詩級三巨頭...

技巧君侃球
2026-06-12 18:11:51
比電子布還猛?PCB核心材料—PPO樹脂缺口70%  6大產(chǎn)能龍量價齊升

比電子布還猛?PCB核心材料—PPO樹脂缺口70% 6大產(chǎn)能龍量價齊升

元芳說投資
2026-06-13 06:30:21
把厚臉皮當(dāng)成了本事?閃閃生父被曝不到1月,黃一鳴終于不藏了

把厚臉皮當(dāng)成了本事?閃閃生父被曝不到1月,黃一鳴終于不藏了

笑飲孤鴻非
2026-06-12 02:46:10
董路回應(yīng)孫繼海:你有什么資格評價我 我做的事你沒做過 不是對手

董路回應(yīng)孫繼海:你有什么資格評價我 我做的事你沒做過 不是對手

念洲
2026-06-13 11:22:39
宋珍珍自曝,富豪用一袋冷凍水餃約了她纏綿,還有個給她20打車費

宋珍珍自曝,富豪用一袋冷凍水餃約了她纏綿,還有個給她20打車費

江山揮筆
2026-06-11 19:43:45
正式確定!內(nèi)線新星離開廣東宏遠(yuǎn),加入遼寧男籃

正式確定!內(nèi)線新星離開廣東宏遠(yuǎn),加入遼寧男籃

體壇瞎白話
2026-06-13 07:38:22
因凡蒂諾親口承認(rèn)!世界杯擴(kuò)到 64 支還不夠,為讓一支球隊晉級

因凡蒂諾親口承認(rèn)!世界杯擴(kuò)到 64 支還不夠,為讓一支球隊晉級

酷侃體壇
2026-06-13 12:52:38
53歲裴勇浚帶娃近照太震撼!零皺紋還是帥 韓網(wǎng)熱議:保養(yǎng)很好

53歲裴勇浚帶娃近照太震撼!零皺紋還是帥 韓網(wǎng)熱議:保養(yǎng)很好

ETtoday星光云
2026-06-12 13:06:08
梅西新廣告回應(yīng)“慌得一批”表情包,梗圖迎來結(jié)局

梅西新廣告回應(yīng)“慌得一批”表情包,梗圖迎來結(jié)局

娛樂嗑學(xué)家.
2026-06-12 16:57:23
外媒終于發(fā)現(xiàn)不對勁:平壤街頭大變樣,朝鮮靠著中國偷偷干件大事

外媒終于發(fā)現(xiàn)不對勁:平壤街頭大變樣,朝鮮靠著中國偷偷干件大事

舊窗老街
2026-06-13 03:11:21
斯皮爾伯格科幻新作首日全球票房突破1200萬美元

斯皮爾伯格科幻新作首日全球票房突破1200萬美元

追星雷達(dá)站
2026-06-13 01:19:09
對于后天周一A股,我只說4句話:第一,3927點大概率是嬰兒底!

對于后天周一A股,我只說4句話:第一,3927點大概率是嬰兒底!

趨勢清風(fēng)俠
2026-06-13 10:42:56
NBA“全民公敵”出爐!第一名果然是他!

NBA“全民公敵”出爐!第一名果然是他!

柚子說球
2026-06-12 15:29:01
創(chuàng)業(yè)失敗負(fù)債5億,日本男子綁26個氣球欲飛往美國,至今下落不明

創(chuàng)業(yè)失敗負(fù)債5億,日本男子綁26個氣球欲飛往美國,至今下落不明

怪羅
2026-06-12 17:36:07
杭州一咖啡館邀4000人看世界杯,結(jié)果空無一人,網(wǎng)友評價一針見血

杭州一咖啡館邀4000人看世界杯,結(jié)果空無一人,網(wǎng)友評價一針見血

Mr王的飯后茶
2026-06-12 16:28:23
成本13億,首日票房僅400多萬,世界第一導(dǎo)演新片被謝苗打懵了

成本13億,首日票房僅400多萬,世界第一導(dǎo)演新片被謝苗打懵了

影視高原說
2026-06-12 17:28:16
王傳福挖來的女人,把比亞迪賣到全球

王傳福挖來的女人,把比亞迪賣到全球

快刀財經(jīng)
2026-06-13 11:05:39
39歲毛林林近況曝光!出道20年還是單身,年紀(jì)輕輕卻成媽媽專業(yè)戶

39歲毛林林近況曝光!出道20年還是單身,年紀(jì)輕輕卻成媽媽專業(yè)戶

代軍哥哥談娛樂
2026-06-12 11:53:39
重磅!中超第1身價突然加盟,球迷:偉大的簽約,城市集團(tuán)太猛了

重磅!中超第1身價突然加盟,球迷:偉大的簽約,城市集團(tuán)太猛了

足球大腕
2026-06-12 23:25:25
釘釘CEO無招被開除,一切都結(jié)束了

釘釘CEO無招被開除,一切都結(jié)束了

科技頭版Pro
2026-06-12 14:15:22
2026-06-13 14:28:49
純潔的微笑 incentive-icons
純潔的微笑
12年程序員經(jīng)歷,6年副業(yè)經(jīng)歷,喜歡像寫代碼一樣寫文章,現(xiàn)在一名程序員創(chuàng)業(yè)者
506文章數(shù) 312關(guān)注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

美國4比1大勝 美國主導(dǎo)比賽巴拉圭疲于奔命讓人意外

頭條要聞

美國4比1大勝 美國主導(dǎo)比賽巴拉圭疲于奔命讓人意外

體育要聞

東道主三戰(zhàn)不敗!美墨開門紅加拿大零的突破

娛樂要聞

12年情懷碎一地!跑男接連翻車

財經(jīng)要聞

梁文鋒向左,楊植麟向右

汽車要聞

2026重慶車展 長城炮Hi4-T正式上市售14.98萬起

態(tài)度原創(chuàng)

家居
教育
旅游
公開課
軍事航空

家居要聞

空間微調(diào) 移形換境

教育要聞

“連天氣都這么配合,肯定能發(fā)揮好!”2026成都中考今日開考

旅游要聞

夏天就該這樣過!大別山的夏天,從霍山大峽谷漂流的第一聲尖叫開始。

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊外長披露伊美諒解備忘錄草案部分內(nèi)容

無障礙瀏覽 進(jìn)入關(guān)懷版