无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Cursor新模型，你怎么還在套Kimi？馬斯克你怎么還吆喝上了？？

2026-05-19 14:02:57　來源: 量子位

北京舉報

0

分享至

Cursor模型更新，最新版本已來到Composer 2.5。

稍微一翻Cursor公告，兩件事挺有意思：

一是Cursor這回學老實了，新模型“套”了Kimi不再藏著掖著，連具體用了多少都標的清清楚楚。

（Cursor：Kimi打底，自家額外訓練+RL占了85%的總算力）

二是馬斯克原地上演變臉，之前Cursor陷入“套殼風波”時他在旁邊煽風點火，現在卻十分賣力地幫忙站臺：

都給我去用Cursor新模型。

網友：老馬你讓我感到陌生(doge）。

別想多了，其實這是因為Cursor和馬斯克達成了算力合作——

Composer 2.5部分訓練是在Colossus 2上完成的，以及Cursor正在和SpaceXAI合作，從零開始訓練一個規模明顯更大的模型。

好好好，新模型剛來，下一代模型的“餅”又吃上了，看來Cursor真是鉚足了勁想搞自研（具體原因下文詳聊）。

不過遠的咱是夠不著了，先看眼前這個實在的——Composer 2.5本身亮點也很足。

1/10成本、Opus 4.7級表現，而且發布后首周還給你雙倍用量。

好家伙，這幾個詞一甩出來，經常用模型的朋友誰不沸騰了。

但問題是，Cursor新模型真有這么頂嗎？？

1/10成本、Opus 4.7級表現

頂不頂目前咱不好說，反正測評成績挺亮眼。

據Cursor介紹，“它更擅長在長時間運行的任務中持續工作，更可靠地遵循復雜指令，協作體驗也更加順暢”。

這些表現反映到具體數字上就是，其性能水平整體接近Claude Opus 4.7。

Terminal-Bench 2.0（終端/命令行任務）：69.3% VS 69.4%，幾乎持平；
SWE-Bench Multilingual（多語言工程問題）：79.8% VS 80.5%，差距微弱；
CursorBench v3.1（高難度編程任務）：63.2% VS 最高配64.8%，差距微弱。

能和Opus 4.7相提并論，常用模型的人都知道這里頭的含金量了。

而且除了在更高難度的任務上訓練之外，他們還改進了模型在溝通風格和投入級別校準（什么時候該出多大力）等行為層面的表現。

聽起來有點抽象，但Cursor表示：

這些維度很難通過現有基準充分反映，但我們發現，它們對實際使用效果非常重要。

那么，Composer 2.5真實能力如何呢？

鑒于目前Cursor免費用戶只能體驗Auto模式（雖然上架了但是選不了），所以咱先看一波網友的反饋。

先插一嘴，Composer模型速度是真快啊，甭管是哪一個版本，用起來歘歘歘的。

OK，回歸正題。

目前一圈扒下來，感覺Composer 2.5反饋還不錯？？

Snapchat前機器學習工程師激情發帖稱，自從Composer 2發布后，她就把絕大多數開發工作搬到了Cursor上面。

而且還甩出了一句頗有暴論味道的話：

如果你在使用AI進行開發，卻仍然默認使用成本最高的模型來完成每一項任務，那么你80%的工作都是在浪費錢。

圖像生成初創公司LetzAI的CEO也有類似感受，他在體驗新模型幾小時后表示：

以前可能會對AI的方案挑三揀四、反復修改，但這次因為Composer 2.5做得太好太快，自己直接“躺平認了”。

沒什么可挑剔的，就這么辦吧。

想必你也發現了，除了模型能力之外，他們提到了另一個重要關鍵詞：價格。

Composer 2.5的價格為每百萬輸入token 0.50美元、每百萬輸出token 2.50美元。

此外，還有一個智能水平相同但速度更快的變體，價格為每百萬輸入token 3.00美元、每百萬輸出token 15.00美元。

p.s. 與Composer 2一樣，fast是默認選項。

這個價格怎么說呢？也就是Opus 4.7的1/10吧。

1/10成本、Opus 4.7級表現，如果效果真如測評和網友所言，那絕對是真香了。

Kimi打底，還做了這些訓練改進

那么Composer 2.5這次是如何實現性能“飛躍”（至少是表面上）的呢？

雖說是有Kimi打底，但好歹貼的是“Cursor自研模型”的標簽，這背后多多少少總得有自研吧。

Cursor：別說我還真有。

回到模型本身，Cursor這回在訓練棧上做了不少改進，主要圍繞兩個方向：

模型智能和易用性。

具體則有三點：

第一，給RL訓練加了“定向反饋”

以前RL獎勵是基于整條軌跡算的，rollout動輒幾十萬token，模型很難知道自己究竟是哪一步搞砸了——最終獎勵只能告訴你“出問題了”，但具體錯哪兒，信號噪聲特別大。

Cursor的解法是：哪里不對就在哪里直接喂反饋。

舉個例子，模型在某一輪調用了一個不存在的工具，收到報錯后繼續干別的。幾百次調用里就這一次錯，對最終獎勵基本沒影響。

但Cursor會在出錯那一輪的上下文里插一句“Reminder: Available tools…”并附上可用工具列表，由此得到一個新的“教師”概率分布。

如此一來，錯誤工具的概率被壓下去，有效替代項的概率被抬上來，然后讓學生模型向這個分布靠攏就行。

這套方法在Composer 2.5里被用在了多種行為上，從編碼風格到溝通方式都有。

第二，合成數據規模翻了25倍

RL訓練幾輪下來，Composer已經能解決大部分訓練題了，怎么繼續提升？

答案是動態生成更難的任務。

其中一個玩法叫“功能刪除”——給智能體一個帶測試的代碼庫，讓它刪掉某個特定功能但保證代碼庫還能跑，然后任務就是把這個功能重新實現出來，測試就是獎勵信號。

不過任務一多，獎勵作弊也跟著來了。

Cursor發現Composer 2.5會整一些離譜操作，比如逆向Python類型檢查緩存找出被刪的函數簽名，甚至反編譯Java字節碼重建第三方API。

好在都被監控工具抓到了，但也算提了個醒——大規模RL得更小心。

第三，底層訓練做了優化

Cursor用的是帶分布式正交化的Muon，并把通信做成異步——一個任務等通信時，優化器接著推進其他任務，讓網絡和計算重疊起來。

最終在1T模型上，優化器每步只要0.2秒。

另外針對MoE模型，他們把非專家權重和專家權重的HSDP布局拆開了：非專家權重小，FSDP組就窄一點，單節點內搞定；專家權重大，就用更寬的分片網格。

這樣彼此獨立的并行維度也能重疊，比如CP=2和EP=8可以在8個GPU上跑，而不用占16個。

總之，從訓練信號到數據規模再到底層并行，Cursor這次是全棧都動了一遍。

One More Thing

Cursor為啥這么拼搞自研？其實從它和Anthropic的微妙關系里就能管中窺豹。

剛好最近看了姚順宇（不是騰訊那個）做客張小珺播客的那期節目，這位Anthropic前員工的觀察，正好能說明問題：

Cursor最早是踩著Claude的肩膀火起來的。開發者社區里口口相傳的好用，背后很大一部分功勞來自Claude模型本身。那段時間Cursor和Anthropic是典型的“魚水關系”，一個出模型一個出產品，各賺各的錢。

但Claude Code一出來，畫風就變了。

Anthropic自己下場做編程產品，等于直接殺進了Cursor的腹地。原本的“上游供應商”瞬間變成了“正面對手”，再繼續把身家性命押在對方的API上，顯然不是個安全的選擇。

所以Cursor走上自研這條路，與其說是想成為下一個Anthropic，不如說是被推著不得不走——

模型握在自己手里，命才在自己手里。

說到這里我很好奇一個問題：在自研模型成功之前，Cursor現在的模式難道真的不具有護城河嗎？

至少對我這種非專業開發者而言，聽起來好像Cursor還不錯——有多款前沿模型可選，價格還更便宜。

帶著好奇，我看到X上有人給出了一種解讀，挺有意思：

Cursor的護城河從來都不是基礎模型，而是RL訓練流程+開發者工作流數據。現在他們正在證明：只要經過足夠的微調，開源基礎模型在特定任務上也能與前沿模型相媲美。

仔細想想這話也不算太夸張。

Composer 2.5的訓練里，85%的算力都花在了Kimi基模之外的后訓練和RL上——Kimi K2.5只是個起點，真正讓它在編程任務上能打的，是Cursor自己那套圍繞真實IDE場景做出來的訓練管線。

這個打法也解釋了為啥它能把價格壓到Opus的十分之一。因為，開源基模省掉了從零預訓練那筆最貴的錢，剩下的全砸在編程這一件事上做精細化訓練。

模型只為Cursor的IDE場景服務，沒必要為通用能力買單。

至于為啥這次牽手的是馬斯克的SpaceXAI（畢竟老馬上次表現得并不友好），邏輯貌似也不復雜。

OpenAI有Codex、Anthropic有Claude Code、Google有Gemini Code Assist，這幾家自己都在做編程產品，跟Cursor都是潛在對手，算力上指望不上。

剩下能拿出世界級算力集群、又不跟Cursor在編程賽道正面沖突的玩家，掰著指頭數也沒幾個了——

老馬的Colossus 2剛好是現成的。

而且如果把時間線拉長看，你會發現馬斯克和Cursor之間，已經遠不只是單純的“算力合作”。

今年3月，xAI內部動蕩之際，馬斯克先從Cursor挖走了兩位核心工程負責人。

緊接著4月，更大的動作來了。SpaceX宣布與Cursor達成合作，由Colossus超算為Cursor訓練模型。

但真正關鍵的不是算力，而是協議本身。

按照網上披露的條款，SpaceX獲得了未來以600億美元收購Cursor的優先權。即便最終不收購，Cursor也需要支付100億美元“合作費”。

耐人尋味的是，據TechCrunch披露，這份協議官宣前幾小時，Cursor原本正要敲定一輪20億美元、估值500億的融資，參投方包括a16z、英偉達、Thrive等一線機構。

結果老馬一腳插進來，把這單給截胡了。

所以某種程度上而言，這其實是一次非常典型的“馬斯克式綁定”：

要么賣給我，要么給我100億，不管怎樣先提前把Cursor的命運鎖進了自己的版圖。

至于他前腳煽風點火、后腳賣力站臺的變臉速度嘛——硅谷的故事，向來如此。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

馬斯克花 100 億想清楚一件事，不做 coding agent 就是等死

愛范兒 2026-05-18 22:19:15
1 跟貼 1
早報｜蘋果開啟WWDC邀請，將公布蘋果AI新進展/問界M9設計師點贊理想L9內飾/國家反詐中心App上線「AI內容鑒定」

愛范兒 2026-05-19 08:15:32
0 跟貼 0

黃仁勛GTC直言：現在是OpenClaw的時代，SaaS都將變AgaaS

機器之心Pro 2026-03-17 17:22:21
0 跟貼 0

編程新王Composer 2.5來了，逼近Opus 4.7！成本僅為1/10

新智元 2026-05-19 15:10:56
0 跟貼 0
馬斯克：轉發和雷軍的合影，網友們吵翻天了！

正哥說 2026-05-18 18:36:33
0 跟貼 0

這次，馬斯克敗了！

智東西 2026-05-19 11:06:44
8 跟貼 8

馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
30 跟貼 30
國產GPU開始造世界！國內首個全棧具身智能仿真平臺來了

量子位 2026-05-19 14:58:44
0 跟貼 0

馬斯克的小目標：星艦10000發/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
1 跟貼 1
openJiuwen社區開源新招：發布JiuwenSwarm，拉開群體智能序幕

量子位 2026-05-18 18:19:46
0 跟貼 0
5年后手機就會消失？馬斯克最新預言來了！

慢歌輕步謠 2026-05-18 15:56:20
1 跟貼 1
外網熱議：馬斯克自己都轉發了這個視頻

鄭凱倫倫倫 2026-05-18 10:48:54
0 跟貼 0
799元寵語翻譯器被質疑是智商稅

極目新聞 2026-05-18 22:47:24
1606 跟貼 1606
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0
馬斯克：激光雷達技術對于自動駕駛汽車來說是一條死路！

抽象老謝 2026-05-17 00:45:06
124 跟貼 124
貝佐斯創業，馬斯克嘲笑，兩人的恩怨糾葛20年

量子位 2025-11-22 12:44:22
0 跟貼 0
谷歌I/O大會今夜揭幕： Gemini 4.0懸念、全棧智能體與AI購物

華爾街見聞官方 2026-05-19 15:16:04
0 跟貼 0
你的AI Agent越用越蠢？港中大、浙大戳破「記憶」的謊言

新智元 2026-05-19 12:37:30
0 跟貼 0
在四五年內，在太空運行大規模AI將比地面更劃算

每日經濟新聞 2026-01-22 12:48:26
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
好時押注 Agentic AI：一場圍繞20億美元營銷預算的“測量革命”

經濟觀察報 2026-05-19 14:50:07
0 跟貼 0
馬斯克兒子遭爸爸單手摟著一臉無奈張嘴中國女子：看小寶寶表情

火煉樹 2026-05-18 21:36:32
10 跟貼 10
馬斯克幼子穿的新中式，老外都愛！店鋪銷量翻了十幾倍

究竟視頻 2026-05-17 15:16:47
0 跟貼 0
特朗普訪華行程一幕：馬斯克小兒子先坐父親肩膀，又坐上總統專車

車馬點兵V 2026-05-17 10:49:17
0 跟貼 0
武漢一公司推出“包車送學”服務，一個月398元另需承擔實時打車費

南陽日報 2026-05-18 18:21:29
218 跟貼 218
【崔哥天天侃5/18】今日雷軍，馬斯克可不敢小看

北美崔哥 2026-05-18 02:10:22
0 跟貼 0
特朗普帶了十幾個企業家來中國，只有馬斯克最悠閑，他也最有底氣

熱心市民謠淼 2026-05-17 12:52:12
0 跟貼 0
雷總拍照前和馬斯克互動了一下，有點像小迷弟！

長安一片月 2026-05-15 00:02:27
305 跟貼 305
二層樓高！馬斯克德州廠新機器炸場：特斯拉把造車時間干到10秒內

Agnostic失格 2026-05-17 02:22:08
418 跟貼 418
馬斯克黃仁勛空軍一號熱聊照曝光，喝可樂穿皮衣疑似用三星

侃侃世界之最 2026-05-18 17:36:20
0 跟貼 0
淚目！馬斯克讓癱瘓20年女孩，靠腦機接口重拾畫筆，改變人生！

極客小冷 2026-05-16 10:24:10
1296 跟貼 1296
這個庫讓Excel的"智能重算"進化了

報錯免疫體 2026-05-18 03:32:05
0 跟貼 0
Claude殺入華爾街，10個智能體接入Office全家桶，爆改分析師桌面

新智元 2026-05-17 15:32:10
5 跟貼 5
世界首富馬斯克雖然很忙，但一點都不耽誤他談戀愛和生孩子！

隨風 2026-05-16 01:55:40
246 跟貼 246
馬斯克在國宴上的表現，值得我們大家深思

俞濤不光會做九轉大腸 2026-05-17 02:02:57
39 跟貼 39
馬斯克剛分享視頻：中國如何修建世界上最大的火車站「重慶東站」

臺海大林 2026-05-19 08:04:41
83 跟貼 83
世界首富馬斯克在國宴，第一次品嘗中國美食，忍不住先偷吃！

奇怪小萌新 2026-05-18 13:51:14
1 跟貼 1
花了1000倍的token，效果卻沒有更好：AI Agent隱性賬單長什么樣

機器之心Pro 2026-05-18 12:09:04
0 跟貼 0
一報告顯示：逾八成中俄青年認為中俄關系友好

中國青年報 2026-05-18 16:33:06
5319 跟貼 5319

外媒議論“懂王他們在中國彬彬有禮”，日網民也看到了

外媒議論“懂王他們在中國彬彬有禮”，日網民也看到了

這里是東京

2026-05-18 17:48:37

李冰冰自曝與妹妹李雪因工作吵架：刪除微信、最長3個多月不說話......

李冰冰自曝與妹妹李雪因工作吵架：刪除微信、最長3個多月不說話......

魯中晨報

2026-05-19 11:30:04

母子同床15年？狄鶯終于將寶貝兒子送進了監獄！

母子同床15年？狄鶯終于將寶貝兒子送進了監獄！

新民周刊

2026-05-18 14:05:28

前車頂住后車后續，央媒點贊，司機身份曝光，東風日產贈車主新車

前車頂住后車后續，央媒點贊，司機身份曝光，東風日產贈車主新車

小蘭聊歷史

2026-05-19 08:35:47

非要如此？主場告別戰險勝降級隊，槍手奪冠末輪已是非勝不可

非要如此？主場告別戰險勝降級隊，槍手奪冠末輪已是非勝不可

濤哥侃球

2026-05-19 15:38:10

央視直播乒乓球時間表：5月19日CCTV播國乒！大滿貫名單正式出爐

央視直播乒乓球時間表：5月19日CCTV播國乒！大滿貫名單正式出爐

八斗小先生

2026-05-19 10:42:24

馬斯克坦言：到上海就像回家,母親早已定居,身價萬億仍拍視頻帶貨

馬斯克坦言：到上海就像回家,母親早已定居,身價萬億仍拍視頻帶貨

青橘罐頭

2026-05-18 14:29:28

離京即反轉！中方清單一出，500架波音落空，美方大單縮水

離京即反轉！中方清單一出，500架波音落空，美方大單縮水

墨羽怪談

2026-05-18 23:08:23

蔡卓妍：全部都是假的！

都市快報橙柿互動

2026-05-19 14:19:37

降價2000元后蘋果iPhone 17系列拿下618單品銷量前三

降價2000元后蘋果iPhone 17系列拿下618單品銷量前三

CNMO科技

2026-05-19 10:23:33

攔不下特朗普，門縫外面一怨婦

南風窗

2026-05-19 13:43:52

逆天續命！39歲瓦爾迪2場2球搶6分，克雷莫內塞1分之差末輪決生死

逆天續命！39歲瓦爾迪2場2球搶6分，克雷莫內塞1分之差末輪決生死

懂個球

2026-05-18 23:59:47

突然爆發，半導體龍頭“20cm”漲停

突然爆發，半導體龍頭“20cm”漲停

數據寶

2026-05-19 15:07:23

被抓、家中金條堆成山，原來王麗坤和車曉是同類人

被抓、家中金條堆成山，原來王麗坤和車曉是同類人

阿傖說事

2026-05-16 15:46:45

Shams：福克斯腳踝扭傷將缺席西決G1馬刺客戰雷霆

Shams：福克斯腳踝扭傷將缺席西決G1馬刺客戰雷霆

懂球帝

2026-05-19 07:46:31

新華鮮報|持續賦能千行百業中國衛星導航產業產值超6000億元

新華鮮報|持續賦能千行百業中國衛星導航產業產值超6000億元

新華社

2026-05-18 09:29:27

被嘲諷了50年的弦理論，被科學家用一種近乎“玄學”的方式證明了

被嘲諷了50年的弦理論，被科學家用一種近乎“玄學”的方式證明了

質子視界

2026-05-18 19:54:19

“落后”咋了？捂了大半年，特斯拉用70ms，給國產電動車上了一課

“落后”咋了？捂了大半年，特斯拉用70ms，給國產電動車上了一課

小李車評李建紅

2026-05-17 17:40:03

不能二次加熱的6種食物！醫生提醒：吃不完或倒掉，別亂節儉

不能二次加熱的6種食物！醫生提醒：吃不完或倒掉，別亂節儉

冷眼看世界728

2026-05-12 20:46:26

演員王寧：這輩子我做的最錯誤決定，就是眼紅沈騰，離開開心麻花

演員王寧：這輩子我做的最錯誤決定，就是眼紅沈騰，離開開心麻花

草莓信箱

2026-05-18 22:24:19

追蹤人工智能動態

12655文章數 176465關注度

往期回顧全部

科技要聞

馬斯克敗訴，法院判他起訴OpenAI太晚了

頭條要聞

賴清德"偷渡式"竄訪非洲國家被中國"踢出群" 大使發聲

頭條要聞

賴清德"偷渡式"竄訪非洲國家被中國"踢出群" 大使發聲

體育要聞

文班亞馬1比0雷霆：凌駕MVP的史詩價值

娛樂要聞

姚晨刪博難平眾怒，為什么她還能蹦噠

財經要聞

從賣流量到賣Token，運營商算力生意破局

汽車要聞

德味操控+聰明大腦，與眾07不輸新勢力

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

游戲

本地

親子

公開課

藝術要聞

蔣萬安手寫賀卡成焦點！網友：字軟人弱！練書法3年，該如何提高

520反向送驚喜！索尼PS+再度漲價引發玩家強烈不滿

本地新聞

別搜晉江小說了，去看真的晉江

親子要聞

帶娃復查鼻炎腺樣體肥大，還好一切安然無恙，孩子身體無小事早發

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版