我研究過世界上絕大多數的主流AI大模型公司,試用過它們的產品。我是ChatGPT, Gemini以及Grok的長期付費用戶,也經常使用國產的DeepSeek, Qwen, 混元和豆包。雖然我日常較少編程或使用Agent,但是對于文本會話以及圖片、視頻等多模態功能,我可是不折不扣的重度用戶,經常在新版本模型發布之后一口氣聊到大半夜。至于編程與應用開發,我在朋友圈密切關注幾位程序員朋友的分享,對于Claude Gode和ChatGPT Codex之類的工具應該算不上文盲。
直到上個星期,我還對朋友說:“對于AI行業,我應該沒有錯過什么值得深入了解的東西吧。”然而接下來的幾天,我先是在社交媒體,然后在自己加入的微信群,注意到了一件出乎意料的事情——Kimi的冉冉升起(盡管以前的地位就不低了)。3月16日和20日,馬斯克兩次贊揚了Kimi,第一次是為了一篇關于大模型注意力殘差(Attention Residuals)技術的論文,;第二次則是為了Cursor發布的新模型被證實是基于Kimi K2.5微調的成果。尤其是第二件事情,影響巨大,震動了全球的AI圈子,我們不妨先把此事的來龍去脈回顧一下:
- Cursor是全球最流行的AI編程IDE,沒有之一。不過它主要是一個應用界面和工具箱,通過接入第三方大模型完成任務,例如Claude.
- 今年3月初,Cursor發布了原生編程模型Composer 2,效果極佳,推理成本極低,立即引發了高度關注;但是一開始,Cursor并未提及外部合作伙伴,很多人都以為是完全自研。
- 接下來兩個星期,很多開發者發現,Composer 2的API和模型ID含有Kimi K2.5的痕跡,很可能是基于K2.5開發的;互聯網口碑迅速反轉,媒體轉而指責Cursor抄襲Kimi。
- 3月20日,Cursor創始人道歉并承認Composer 2是基于Kimi K2.5二次開發的結果,感謝了Kimi的貢獻;Kimi也大度的表示該模型通過合作伙伴獲得了授權。至此,這一風波基本圓滿解決。
說實話,這件事情給我帶來的震動很大。此前我一直認為,Claude Opus 4.6和GPT-5.4是全球最擅長編程的大模型;在國內,我對DeepSeek的新版本寄予厚望,因為梁文鋒此前發表的論文明顯很關注編程方向。我對Kimi以及月之暗面這家公司的認知,主要還停留在當年“擅長超長文本分析”的階段。我的那些資深程序員朋友比我還要震動——當Kimi K2.5成為全世界最流行編程工具的最受關注的“原生大模型”的基礎時,稍有技術常識的人就該明白其背后的分量。
Kimi K2.5的競爭力,不僅在于其推理能力強、成本低,還在于它是開源的。因此它成為了Cursor二次開發的基礎,還驅動了Cloudflare旗下新業務Workers AI的上線。在公告中,Cloudflare特別強調了K2.5的成本優勢,稱其為“性價比甜區”(Price-Performance Sweet Spot):“我們提供Kimi K2.5服務,一開始是個試驗,但是當我們看到它的表現以及性價比之后,這個試驗馬上就變得十分重要了。”
做個背景解釋:Workers AI是一個大模型聚合平臺,旨在為企業和個人客戶提供統一API,客戶不必擁有自己的硬件算力,就能選擇不同的大模型完成任務。Workers AI接入的主要是開源模型,包括Meta的LLaMA、阿里的Qwen、谷歌的Gemma以及DeepSeek,等等。然而,直到不久前,它提供的模型幾乎全是“小版本”,參數規模從幾十億到一兩百億,一般無法承擔深度推理、長文本以及高強度的Agent工作流任務。Kimi K2.5是它接入的第一個大規模(總參數1萬億)前沿模型,從現在開始,它可以驕傲地宣稱:“我們能幫助客戶完成各種復雜的高強度任務啦!”
這個世界上,有的是能力強、跑分高的大模型,但它們往往不具備推理成本優勢;具備成本優勢的,往往又不開源。此時此刻,我們遺憾地看到,硅谷的那些最先進的大模型生態,基本建立在閉源基礎上:
- OpenAI的名字就代表著“開源”,但是自從GPT-3開始,前沿大模型就不再開源。2025年,才羞答答地發布了兩個GPT-OSS開源模型,顯然無法代表其最高水平。
- 谷歌在2021年之前也秉承開源路線,但是目前的旗艦大模型Gemini從不開源,只有參數規模明顯較小的Gemma大模型是開源的。
- Anthropic從成立之日起就沒有發布過任何開源模型,Claude系列是完全閉源的。
- Grok最初的幾個版本曾經開源,但是自從Grok 3以來就不再開源。在連續兩次點贊Kimi之后,不知道馬斯克會不會重新考慮加入開源生態?
放眼全球,對開源生態最執著、貢獻最大的,早已變成了中國廠商。DeepSeek, Kimi, Qwen……各有擅長的領域,都在某個時期成為過人類最前沿的開源模型。我覺得Kimi尤其難得,其融資、估值和消耗的資源只有OpenAI等硅谷大廠的2%左右,而且也遠遠小于國內互聯網大廠的大模型部門。用這么少的資源,這么迅速的開拓AI基礎研發的邊疆,并毫不吝嗇地將前沿成果開源,不禁讓我想起了很多很多年以前的OpenAI。
除了中國之外,開源生態的旗手,基本僅剩LLaMA和Mistral了。LLaMA 1-3都是全球領先的開源模型,為生成式AI技術的傳播做出了不可磨滅的貢獻,奇怪的是LLaMA-4水平遠遠低于預期,扎克伯格若想重新接過火炬,恐怕得付出更多的努力。Mistral是法國乃至整個歐洲的獨苗,成立之初僅以幾十人的團隊規模就做出了當時世界上“第三先進”的大模型(前兩個是GPT和Claude),但是2024年以后其發展速度明顯放緩,從基礎模型的技術水平看,已經掉入了第二梯隊。這其實是AI創業公司的常態,畢竟誰都無法保證在資源有限的情況下一直保持在潮流前列。所以,我反而更加佩服月之暗面——從2024年初因為長文本功能而走紅,到現在以Kimi K2.5震驚世界,事實證明它絕不是曇花一現。
![]()
附帶說一句,Mistral的技術進步放緩,并沒有妨礙它在2025年9月完成估值140億美元的新一輪融資;微軟、Salesforce以及ASML(沒錯,就是荷蘭那家光刻機巨頭)都是它的重要股東。看到這一幕,你還覺得Kimi的180億美元估值太高了嗎?要知道,短短十幾天前,馬斯克的xAI剛剛以高達2500億美元的估值與SpaceX完成了合并。就算我是Grok的深度用戶,面對這個估值水平也得吐舌頭。馬斯克描繪的把數據中心發射到太空中的宏大愿景,讓我深感激動;不過我得公允地說,Grok離世界最前沿水平還是略遜一籌。
X平臺(原名推特)的著名AI博主、被諸多硅谷大佬關注的Tuki (TukiFromKL)說得好:“兩家中國實驗室的旗艦模型(注:DeepSeek和Kimi)都開源了,都用更少的資源做了更多的事情,挑戰美國公司收費數十億美元的產品。AI競賽不再是美國vs中國,而是閉源vs開源,而開源正在迅速跟上。”
Tuki的這段評論或許有點武斷,不過我贊成它的精神:在歷次計算機技術革命中,開源生態都發揮了舉足輕重的作用,AI革命也不例外。硅谷巨頭仍然掌握著可觀的技術和資源優勢,但是拒絕擁抱開源生態只會讓路子越走越窄。一個開源的、低成本的、持續更新的大模型,對應用層的意義怎么估計都不過分。就拿Kimi K2.5來說,Cursor用它做出了強大的Composer 2, Workers AI用它邁出了提供前沿大模型服務的第一步,我相信還有更多的應用商正在琢磨如何最大限度地利用它。這樣的技術進步會讓全人類受益,形成基礎研發層與應用層互相促進的良性循環。
或許會有人擔憂:“前沿技術開源了,那開發商怎么賺錢呢?”事實上這是最不需要擔心的問題。我們不妨看看全球最大的開源軟件生態——Linux,它從來不曾閉源,但是其生態系統每年創造著200-300億美元的收入,近年來還呈現攀升的態勢。這個數字還沒有包括從Linux基礎上生長出來的Android, 后者讓智能手機真正走進了千家萬戶,谷歌在盡力維持開源社區的同時,成功地從附加服務上賺到了很多錢。
生成式AI對人類社會的影響才走出了第一步。所有人最應該關心的話題是如何盡快把蛋糕做大、把門檻做低,AI技術的普惠效應越強,AI基礎模型及應用開發商的地位反而會越穩固。在這方面,以DeepSeek、Kimi為代表的中國廠商,反而比很多硅谷巨頭想的更清楚一點。我想這就是楊植麟成為在今年英偉達GTC上面唯一受邀演講的獨立大模型公司CEO的原因:老黃的眼光十分精準,一再證明了自己能在紛繁復雜的競爭格局中,看清真正有競爭力的路線。
我迫不及待想看到更多像DeepSeek和Kimi這樣的AI創業公司:開放的態度、短小精悍的團隊、銳意進取的精神;它們應該與大廠形成你追我趕的長期競爭格局。在這個過程中,誰能獲勝、誰受益最大,反而成了不太重要的事情,因為無論怎樣,最終受益的都是全人類。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.