網易首頁 > 網易號 > 正文 申請入駐

從現在開始,得像研究DeepSeek一樣嚴肅研究Kimi

0
分享至

我研究過世界上絕大多數的主流AI大模型公司,試用過它們的產品。我是ChatGPT, Gemini以及Grok的長期付費用戶,也經常使用國產的DeepSeek, Qwen, 混元和豆包。雖然我日常較少編程或使用Agent,但是對于文本會話以及圖片、視頻等多模態功能,我可是不折不扣的重度用戶,經常在新版本模型發布之后一口氣聊到大半夜。至于編程與應用開發,我在朋友圈密切關注幾位程序員朋友的分享,對于Claude Gode和ChatGPT Codex之類的工具應該算不上文盲。

直到上個星期,我還對朋友說:“對于AI行業,我應該沒有錯過什么值得深入了解的東西吧。”然而接下來的幾天,我先是在社交媒體,然后在自己加入的微信群,注意到了一件出乎意料的事情——Kimi的冉冉升起(盡管以前的地位就不低了)。3月16日和20日,馬斯克兩次贊揚了Kimi,第一次是為了一篇關于大模型注意力殘差(Attention Residuals)技術的論文,;第二次則是為了Cursor發布的新模型被證實是基于Kimi K2.5微調的成果。尤其是第二件事情,影響巨大,震動了全球的AI圈子,我們不妨先把此事的來龍去脈回顧一下:

  • Cursor是全球最流行的AI編程IDE,沒有之一。不過它主要是一個應用界面和工具箱,通過接入第三方大模型完成任務,例如Claude.
  • 今年3月初,Cursor發布了原生編程模型Composer 2,效果極佳,推理成本極低,立即引發了高度關注;但是一開始,Cursor并未提及外部合作伙伴,很多人都以為是完全自研。
  • 接下來兩個星期,很多開發者發現,Composer 2的API和模型ID含有Kimi K2.5的痕跡,很可能是基于K2.5開發的;互聯網口碑迅速反轉,媒體轉而指責Cursor抄襲Kimi。
  • 3月20日,Cursor創始人道歉并承認Composer 2是基于Kimi K2.5二次開發的結果,感謝了Kimi的貢獻;Kimi也大度的表示該模型通過合作伙伴獲得了授權。至此,這一風波基本圓滿解決。

說實話,這件事情給我帶來的震動很大。此前我一直認為,Claude Opus 4.6和GPT-5.4是全球最擅長編程的大模型;在國內,我對DeepSeek的新版本寄予厚望,因為梁文鋒此前發表的論文明顯很關注編程方向。我對Kimi以及月之暗面這家公司的認知,主要還停留在當年“擅長超長文本分析”的階段。我的那些資深程序員朋友比我還要震動——當Kimi K2.5成為全世界最流行編程工具的最受關注的“原生大模型”的基礎時,稍有技術常識的人就該明白其背后的分量。

Kimi K2.5的競爭力,不僅在于其推理能力強、成本低,還在于它是開源的。因此它成為了Cursor二次開發的基礎,還驅動了Cloudflare旗下新業務Workers AI的上線。在公告中,Cloudflare特別強調了K2.5的成本優勢,稱其為“性價比甜區”(Price-Performance Sweet Spot):“我們提供Kimi K2.5服務,一開始是個試驗,但是當我們看到它的表現以及性價比之后,這個試驗馬上就變得十分重要了。”

做個背景解釋:Workers AI是一個大模型聚合平臺,旨在為企業和個人客戶提供統一API,客戶不必擁有自己的硬件算力,就能選擇不同的大模型完成任務。Workers AI接入的主要是開源模型,包括Meta的LLaMA、阿里的Qwen、谷歌的Gemma以及DeepSeek,等等。然而,直到不久前,它提供的模型幾乎全是“小版本”,參數規模從幾十億到一兩百億,一般無法承擔深度推理、長文本以及高強度的Agent工作流任務。Kimi K2.5是它接入的第一個大規模(總參數1萬億)前沿模型,從現在開始,它可以驕傲地宣稱:“我們能幫助客戶完成各種復雜的高強度任務啦!”

這個世界上,有的是能力強、跑分高的大模型,但它們往往不具備推理成本優勢;具備成本優勢的,往往又不開源。此時此刻,我們遺憾地看到,硅谷的那些最先進的大模型生態,基本建立在閉源基礎上:

  • OpenAI的名字就代表著“開源”,但是自從GPT-3開始,前沿大模型就不再開源。2025年,才羞答答地發布了兩個GPT-OSS開源模型,顯然無法代表其最高水平。
  • 谷歌在2021年之前也秉承開源路線,但是目前的旗艦大模型Gemini從不開源,只有參數規模明顯較小的Gemma大模型是開源的。
  • Anthropic從成立之日起就沒有發布過任何開源模型,Claude系列是完全閉源的。
  • Grok最初的幾個版本曾經開源,但是自從Grok 3以來就不再開源。在連續兩次點贊Kimi之后,不知道馬斯克會不會重新考慮加入開源生態?

放眼全球,對開源生態最執著、貢獻最大的,早已變成了中國廠商。DeepSeek, Kimi, Qwen……各有擅長的領域,都在某個時期成為過人類最前沿的開源模型。我覺得Kimi尤其難得,其融資、估值和消耗的資源只有OpenAI等硅谷大廠的2%左右,而且也遠遠小于國內互聯網大廠的大模型部門。用這么少的資源,這么迅速的開拓AI基礎研發的邊疆,并毫不吝嗇地將前沿成果開源,不禁讓我想起了很多很多年以前的OpenAI。

除了中國之外,開源生態的旗手,基本僅剩LLaMA和Mistral了。LLaMA 1-3都是全球領先的開源模型,為生成式AI技術的傳播做出了不可磨滅的貢獻,奇怪的是LLaMA-4水平遠遠低于預期,扎克伯格若想重新接過火炬,恐怕得付出更多的努力。Mistral是法國乃至整個歐洲的獨苗,成立之初僅以幾十人的團隊規模就做出了當時世界上“第三先進”的大模型(前兩個是GPT和Claude),但是2024年以后其發展速度明顯放緩,從基礎模型的技術水平看,已經掉入了第二梯隊。這其實是AI創業公司的常態,畢竟誰都無法保證在資源有限的情況下一直保持在潮流前列。所以,我反而更加佩服月之暗面——從2024年初因為長文本功能而走紅,到現在以Kimi K2.5震驚世界,事實證明它絕不是曇花一現。



附帶說一句,Mistral的技術進步放緩,并沒有妨礙它在2025年9月完成估值140億美元的新一輪融資;微軟、Salesforce以及ASML(沒錯,就是荷蘭那家光刻機巨頭)都是它的重要股東。看到這一幕,你還覺得Kimi的180億美元估值太高了嗎?要知道,短短十幾天前,馬斯克的xAI剛剛以高達2500億美元的估值與SpaceX完成了合并。就算我是Grok的深度用戶,面對這個估值水平也得吐舌頭。馬斯克描繪的把數據中心發射到太空中的宏大愿景,讓我深感激動;不過我得公允地說,Grok離世界最前沿水平還是略遜一籌。

X平臺(原名推特)的著名AI博主、被諸多硅谷大佬關注的Tuki (TukiFromKL)說得好:“兩家中國實驗室的旗艦模型(注:DeepSeek和Kimi)都開源了,都用更少的資源做了更多的事情,挑戰美國公司收費數十億美元的產品。AI競賽不再是美國vs中國,而是閉源vs開源,而開源正在迅速跟上。”

Tuki的這段評論或許有點武斷,不過我贊成它的精神:在歷次計算機技術革命中,開源生態都發揮了舉足輕重的作用,AI革命也不例外。硅谷巨頭仍然掌握著可觀的技術和資源優勢,但是拒絕擁抱開源生態只會讓路子越走越窄。一個開源的、低成本的、持續更新的大模型,對應用層的意義怎么估計都不過分。就拿Kimi K2.5來說,Cursor用它做出了強大的Composer 2, Workers AI用它邁出了提供前沿大模型服務的第一步,我相信還有更多的應用商正在琢磨如何最大限度地利用它。這樣的技術進步會讓全人類受益,形成基礎研發層與應用層互相促進的良性循環。

或許會有人擔憂:“前沿技術開源了,那開發商怎么賺錢呢?”事實上這是最不需要擔心的問題。我們不妨看看全球最大的開源軟件生態——Linux,它從來不曾閉源,但是其生態系統每年創造著200-300億美元的收入,近年來還呈現攀升的態勢。這個數字還沒有包括從Linux基礎上生長出來的Android, 后者讓智能手機真正走進了千家萬戶,谷歌在盡力維持開源社區的同時,成功地從附加服務上賺到了很多錢。

生成式AI對人類社會的影響才走出了第一步。所有人最應該關心的話題是如何盡快把蛋糕做大、把門檻做低,AI技術的普惠效應越強,AI基礎模型及應用開發商的地位反而會越穩固。在這方面,以DeepSeek、Kimi為代表的中國廠商,反而比很多硅谷巨頭想的更清楚一點。我想這就是楊植麟成為在今年英偉達GTC上面唯一受邀演講的獨立大模型公司CEO的原因:老黃的眼光十分精準,一再證明了自己能在紛繁復雜的競爭格局中,看清真正有競爭力的路線。

我迫不及待想看到更多像DeepSeek和Kimi這樣的AI創業公司:開放的態度、短小精悍的團隊、銳意進取的精神;它們應該與大廠形成你追我趕的長期競爭格局。在這個過程中,誰能獲勝、誰受益最大,反而成了不太重要的事情,因為無論怎樣,最終受益的都是全人類。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

西方媒體:哪怕中國全力以赴,也不可能按時建成這樣龐大的工程

讓心靈得以棲息
2026-04-22 02:52:55
震驚!濟南一國企總工的優質男,將未接種新冠疫苗列為擇偶硬條件

震驚!濟南一國企總工的優質男,將未接種新冠疫苗列為擇偶硬條件

火山詩話
2026-04-21 08:54:26
剛剛!直線跳水

剛剛!直線跳水

中國基金報
2026-04-21 23:50:53
國務院免去他國務院副秘書長職務,已“空降”廈門任市委書記

國務院免去他國務院副秘書長職務,已“空降”廈門任市委書記

上觀新聞
2026-04-21 12:28:10
美方已與古巴會談,要求古巴引入“星鏈”、賠償被沒收資產的美國個人與企業、釋放政治犯等;此前特朗普多次威脅稱“解決”伊朗之后是古巴

美方已與古巴會談,要求古巴引入“星鏈”、賠償被沒收資產的美國個人與企業、釋放政治犯等;此前特朗普多次威脅稱“解決”伊朗之后是古巴

魯中晨報
2026-04-21 09:56:06
媒體:中國國民黨主席鄭麗文或將于6月訪美

媒體:中國國民黨主席鄭麗文或將于6月訪美

俄羅斯衛星通訊社
2026-04-21 15:11:12
河北一地用“冰紅茶”澆灌農作物 已持續幾年 自己不吃售賣

河北一地用“冰紅茶”澆灌農作物 已持續幾年 自己不吃售賣

原某報記者
2026-04-21 17:49:54
解決掉提問的人,問題就解決了?北師大“神操作”火了

解決掉提問的人,問題就解決了?北師大“神操作”火了

虔青
2026-04-20 14:07:53
祭拜鬼社當天,日本發出崩潰預警,美歐視而不見,中國不再伸援手

祭拜鬼社當天,日本發出崩潰預警,美歐視而不見,中國不再伸援手

離離言幾許
2026-04-21 23:24:09
日艦闖臺海三日,高市辭職,岸田接任,052D抵近奄美大島

日艦闖臺海三日,高市辭職,岸田接任,052D抵近奄美大島

我是李小七23
2026-04-22 00:45:18
格力回應鋁線電機爭議:相關工程機已停產,海信稱靠多三兩銅多500元時代已終結

格力回應鋁線電機爭議:相關工程機已停產,海信稱靠多三兩銅多500元時代已終結

紅星資本局
2026-04-21 20:40:16
伊朗方面稱霍爾木茲海峽進出通道仍處于封鎖狀態 任何船只都無權通行

伊朗方面稱霍爾木茲海峽進出通道仍處于封鎖狀態 任何船只都無權通行

財聯社
2026-04-21 19:33:20
情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

新歐洲
2026-04-21 19:37:05
笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

火山詩話
2026-04-21 09:46:21
新一輪的一地雞毛,正在上演

新一輪的一地雞毛,正在上演

黑噪音
2026-04-21 14:40:02
憤怒啊!5000元、月休2天招做飯阿姨,網友:竟要干7個人的工作量

憤怒啊!5000元、月休2天招做飯阿姨,網友:竟要干7個人的工作量

火山詩話
2026-04-21 18:56:19
大快人心!張敬軒復出泡湯,霍汶希被拖下水,英皇如坐針氈

大快人心!張敬軒復出泡湯,霍汶希被拖下水,英皇如坐針氈

一盅情懷
2026-04-21 19:20:32
雷神山院長落馬,最揪心的是無數女醫護背后的家庭

雷神山院長落馬,最揪心的是無數女醫護背后的家庭

社會日日鮮
2026-04-21 08:34:40
拼多多暴力抗法震驚全網,市值萬億巨頭為何如此囂張

拼多多暴力抗法震驚全網,市值萬億巨頭為何如此囂張

燕梳樓頻道
2026-04-20 21:12:04
四年暴跌120億,微信是怎么“殺死”口香糖行業的?

四年暴跌120億,微信是怎么“殺死”口香糖行業的?

流蘇晚晴
2026-04-19 20:34:47
2026-04-22 04:11:00
互聯網怪盜團丶 incentive-icons
互聯網怪盜團丶
互聯網行業觀察者
406文章數 375關注度
往期回顧 全部

科技要聞

創造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財經要聞

現實是最大的荒誕:千億平臺的沖突始末

汽車要聞

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

教育
時尚
健康
藝術
數碼

教育要聞

對不起,我有點“摳”

頂流復工,已判若兩人

干細胞抗衰4大誤區,90%的人都中招

藝術要聞

任伯年寫竹,真帶勁

數碼要聞

大疆發布Osmo Mobile 8P:售899元 分體式遙控器設計

無障礙瀏覽 進入關懷版