網易首頁 > 網易號 > 正文申請入駐

從現在開始，得像研究DeepSeek一樣嚴肅研究Kimi

2026-03-25 17:04:00　來源: 互聯網怪盜團丶

甘肅舉報

分享至

我研究過世界上絕大多數的主流AI大模型公司，試用過它們的產品。我是ChatGPT, Gemini以及Grok的長期付費用戶，也經常使用國產的DeepSeek, Qwen, 混元和豆包。雖然我日常較少編程或使用Agent，但是對于文本會話以及圖片、視頻等多模態功能，我可是不折不扣的重度用戶，經常在新版本模型發布之后一口氣聊到大半夜。至于編程與應用開發，我在朋友圈密切關注幾位程序員朋友的分享，對于Claude Gode和ChatGPT Codex之類的工具應該算不上文盲。

直到上個星期，我還對朋友說：“對于AI行業，我應該沒有錯過什么值得深入了解的東西吧。”然而接下來的幾天，我先是在社交媒體，然后在自己加入的微信群，注意到了一件出乎意料的事情——Kimi的冉冉升起（盡管以前的地位就不低了）。3月16日和20日，馬斯克兩次贊揚了Kimi，第一次是為了一篇關于大模型注意力殘差(Attention Residuals)技術的論文，；第二次則是為了Cursor發布的新模型被證實是基于Kimi K2.5微調的成果。尤其是第二件事情，影響巨大，震動了全球的AI圈子，我們不妨先把此事的來龍去脈回顧一下：

Cursor是全球最流行的AI編程IDE，沒有之一。不過它主要是一個應用界面和工具箱，通過接入第三方大模型完成任務，例如Claude.
今年3月初，Cursor發布了原生編程模型Composer 2，效果極佳，推理成本極低，立即引發了高度關注；但是一開始，Cursor并未提及外部合作伙伴，很多人都以為是完全自研。
接下來兩個星期，很多開發者發現，Composer 2的API和模型ID含有Kimi K2.5的痕跡，很可能是基于K2.5開發的；互聯網口碑迅速反轉，媒體轉而指責Cursor抄襲Kimi。
3月20日，Cursor創始人道歉并承認Composer 2是基于Kimi K2.5二次開發的結果，感謝了Kimi的貢獻；Kimi也大度的表示該模型通過合作伙伴獲得了授權。至此，這一風波基本圓滿解決。

說實話，這件事情給我帶來的震動很大。此前我一直認為，Claude Opus 4.6和GPT-5.4是全球最擅長編程的大模型；在國內，我對DeepSeek的新版本寄予厚望，因為梁文鋒此前發表的論文明顯很關注編程方向。我對Kimi以及月之暗面這家公司的認知，主要還停留在當年“擅長超長文本分析”的階段。我的那些資深程序員朋友比我還要震動——當Kimi K2.5成為全世界最流行編程工具的最受關注的“原生大模型”的基礎時，稍有技術常識的人就該明白其背后的分量。

Kimi K2.5的競爭力，不僅在于其推理能力強、成本低，還在于它是開源的。因此它成為了Cursor二次開發的基礎，還驅動了Cloudflare旗下新業務Workers AI的上線。在公告中，Cloudflare特別強調了K2.5的成本優勢，稱其為“性價比甜區”(Price-Performance Sweet Spot)：“我們提供Kimi K2.5服務，一開始是個試驗，但是當我們看到它的表現以及性價比之后，這個試驗馬上就變得十分重要了。”

做個背景解釋：Workers AI是一個大模型聚合平臺，旨在為企業和個人客戶提供統一API，客戶不必擁有自己的硬件算力，就能選擇不同的大模型完成任務。Workers AI接入的主要是開源模型，包括Meta的LLaMA、阿里的Qwen、谷歌的Gemma以及DeepSeek，等等。然而，直到不久前，它提供的模型幾乎全是“小版本”，參數規模從幾十億到一兩百億，一般無法承擔深度推理、長文本以及高強度的Agent工作流任務。Kimi K2.5是它接入的第一個大規模（總參數1萬億）前沿模型，從現在開始，它可以驕傲地宣稱：“我們能幫助客戶完成各種復雜的高強度任務啦！”

這個世界上，有的是能力強、跑分高的大模型，但它們往往不具備推理成本優勢；具備成本優勢的，往往又不開源。此時此刻，我們遺憾地看到，硅谷的那些最先進的大模型生態，基本建立在閉源基礎上：

OpenAI的名字就代表著“開源”，但是自從GPT-3開始，前沿大模型就不再開源。2025年，才羞答答地發布了兩個GPT-OSS開源模型，顯然無法代表其最高水平。
谷歌在2021年之前也秉承開源路線，但是目前的旗艦大模型Gemini從不開源，只有參數規模明顯較小的Gemma大模型是開源的。
Anthropic從成立之日起就沒有發布過任何開源模型，Claude系列是完全閉源的。
Grok最初的幾個版本曾經開源，但是自從Grok 3以來就不再開源。在連續兩次點贊Kimi之后，不知道馬斯克會不會重新考慮加入開源生態？

放眼全球，對開源生態最執著、貢獻最大的，早已變成了中國廠商。DeepSeek, Kimi, Qwen……各有擅長的領域，都在某個時期成為過人類最前沿的開源模型。我覺得Kimi尤其難得，其融資、估值和消耗的資源只有OpenAI等硅谷大廠的2%左右，而且也遠遠小于國內互聯網大廠的大模型部門。用這么少的資源，這么迅速的開拓AI基礎研發的邊疆，并毫不吝嗇地將前沿成果開源，不禁讓我想起了很多很多年以前的OpenAI。

除了中國之外，開源生態的旗手，基本僅剩LLaMA和Mistral了。LLaMA 1-3都是全球領先的開源模型，為生成式AI技術的傳播做出了不可磨滅的貢獻，奇怪的是LLaMA-4水平遠遠低于預期，扎克伯格若想重新接過火炬，恐怕得付出更多的努力。Mistral是法國乃至整個歐洲的獨苗，成立之初僅以幾十人的團隊規模就做出了當時世界上“第三先進”的大模型（前兩個是GPT和Claude），但是2024年以后其發展速度明顯放緩，從基礎模型的技術水平看，已經掉入了第二梯隊。這其實是AI創業公司的常態，畢竟誰都無法保證在資源有限的情況下一直保持在潮流前列。所以，我反而更加佩服月之暗面——從2024年初因為長文本功能而走紅，到現在以Kimi K2.5震驚世界，事實證明它絕不是曇花一現。

附帶說一句，Mistral的技術進步放緩，并沒有妨礙它在2025年9月完成估值140億美元的新一輪融資；微軟、Salesforce以及ASML（沒錯，就是荷蘭那家光刻機巨頭）都是它的重要股東。看到這一幕，你還覺得Kimi的180億美元估值太高了嗎？要知道，短短十幾天前，馬斯克的xAI剛剛以高達2500億美元的估值與SpaceX完成了合并。就算我是Grok的深度用戶，面對這個估值水平也得吐舌頭。馬斯克描繪的把數據中心發射到太空中的宏大愿景，讓我深感激動；不過我得公允地說，Grok離世界最前沿水平還是略遜一籌。

X平臺（原名推特）的著名AI博主、被諸多硅谷大佬關注的Tuki (TukiFromKL)說得好：“兩家中國實驗室的旗艦模型（注：DeepSeek和Kimi）都開源了，都用更少的資源做了更多的事情，挑戰美國公司收費數十億美元的產品。AI競賽不再是美國vs中國，而是閉源vs開源，而開源正在迅速跟上。”

Tuki的這段評論或許有點武斷，不過我贊成它的精神：在歷次計算機技術革命中，開源生態都發揮了舉足輕重的作用，AI革命也不例外。硅谷巨頭仍然掌握著可觀的技術和資源優勢，但是拒絕擁抱開源生態只會讓路子越走越窄。一個開源的、低成本的、持續更新的大模型，對應用層的意義怎么估計都不過分。就拿Kimi K2.5來說，Cursor用它做出了強大的Composer 2, Workers AI用它邁出了提供前沿大模型服務的第一步，我相信還有更多的應用商正在琢磨如何最大限度地利用它。這樣的技術進步會讓全人類受益，形成基礎研發層與應用層互相促進的良性循環。

或許會有人擔憂：“前沿技術開源了，那開發商怎么賺錢呢？”事實上這是最不需要擔心的問題。我們不妨看看全球最大的開源軟件生態——Linux，它從來不曾閉源，但是其生態系統每年創造著200-300億美元的收入，近年來還呈現攀升的態勢。這個數字還沒有包括從Linux基礎上生長出來的Android, 后者讓智能手機真正走進了千家萬戶，谷歌在盡力維持開源社區的同時，成功地從附加服務上賺到了很多錢。

生成式AI對人類社會的影響才走出了第一步。所有人最應該關心的話題是如何盡快把蛋糕做大、把門檻做低，AI技術的普惠效應越強，AI基礎模型及應用開發商的地位反而會越穩固。在這方面，以DeepSeek、Kimi為代表的中國廠商，反而比很多硅谷巨頭想的更清楚一點。我想這就是楊植麟成為在今年英偉達GTC上面唯一受邀演講的獨立大模型公司CEO的原因：老黃的眼光十分精準，一再證明了自己能在紛繁復雜的競爭格局中，看清真正有競爭力的路線。

我迫不及待想看到更多像DeepSeek和Kimi這樣的AI創業公司：開放的態度、短小精悍的團隊、銳意進取的精神；它們應該與大廠形成你追我趕的長期競爭格局。在這個過程中，誰能獲勝、誰受益最大，反而成了不太重要的事情，因為無論怎樣，最終受益的都是全人類。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.