網易首頁 > 網易號 > 正文 申請入駐

Kimi 逆襲,硅谷紙貴

0
分享至

Fast Reading

月之暗面發布了新一代模型Kimi K2 Thinking。與之同時引發熱議的,不僅是它在數學推理、代碼理解上的進步,還有它背后的一個數字——460萬美元的訓練成本。

在估值5000億美元的“AI獨角獸之王”OpenAI面前,糧草彈藥薄弱的中國初創公司要想突圍,硬剛顯然不現實,只能另辟蹊徑、彎道超車。

月之暗面正代表一種新型的AI力量——它不一定最豪華,卻可能最高效;不一定擁有最多資源,卻更懂得如何讓資源發揮最大價值。



10月的最后一個工作日,雪豹財經社拜訪了月之暗面的北京辦公室。我們注意到,月之暗面的會議室都以樂隊命名:Pink Floyd、The Rolling Stone、Queen、The Beatles、Radiohead......

阿里有“光明頂”,百度有“昆侖”,它們講秩序與修煉;月之暗面卻更像一支正在排練的樂隊,崇尚自由、創新和反叛。搖滾樂在誕生之初,就是一種“低投入門檻”的音樂:它不需要復雜的錄音室或昂貴的樂器,一把破吉他、一套架子鼓就能表達強大的力量。

就在那次拜訪后一周,11月6日,月之暗面發布了新一代模型“Kimi K2 Thinking”。與之同時引發熱議的,不僅是它在數學推理、代碼理解上的進步,還有它背后的一個數字——460萬美元的訓練成本。

在一個大型AI模型動輒要花幾千萬美元、幾億算力小時的時代,這個數字顯得幾乎不真實。但它確實發生了——而且,類似的故事正在中國反復上演,它們共同指向一個事實:中國的AI產業正在進入一個高效期:模型越來越強,但花的錢越來越少。

問題是,這意味著什么?

中國效率再次震撼硅谷

CNBC一則有關KimiK2 Thinking訓練成本的報道,猶如巨石投入水面,業界一片嘩然。

460萬美元,還不到GPT-4訓練成本的8%,甚至比DeepSeek披露的V3訓練成本(租賃價,正式訓練階段)560萬美元還要低。

而在性能上,Kimi K2 Thinking在Humanity‘s Last Exam、BrowseComp等部分權威基準測試中,取得了媲美甚至超越GPT-5和Claude 4.5等頂級模型的表現。

長期以來,在人們的印象中,AI能力與天價資本支出之間似乎已形成了線性關系:更強大的模型,理應對應著更龐大的投入。

但Kimi K2和DeepSeek的出現都打破了這個邏輯,重建了一套新的敘事,徹底顛覆了傳統認知。

雖然此后月之暗面創始團隊出面回應:“這不是官方數據。訓練成本很難計算,因為其中很大一部分用于研究和實驗。”但在巨大的成本差異面前,這個解釋并沒有稀釋業界的驚嘆。

Hugging Face聯合創始人Thomas Wolf 甚至發出靈魂拷問:“我們是否每隔幾個月就要經歷一次‘DeepSeek 時刻’?”

與之形成鮮明對比的是,今年8月,OpenAI首席執行官山姆?奧爾特曼(SamAltman)表示,未來公司將投入數萬億美元夯實AI基建,用于支持各項人工智能服務。而就在Kimi K2發布后兩天,甲骨文一筆高達180億美元的數據中心融資交易的消息公布。

兩相對比,海外媒體開始反思中美兩國在AI基礎設施投入和發展模式的差異。

CNBC預計,到2027年,美國將在數據中心上投入近7000億美元,而相比之下,中國的主要玩家,包括阿里巴巴、騰訊、字節跳動和百度,合計預期投入不到800億美元。也就是說,資本支出差距高達10:1,但系統性能卻基本相當。

當美國玩家在通過私人信貸和債券市場為龐大的數據中心融資時,中國同行正在靠效率取勝——使用更便宜的芯片、開源模型,以及需要更少資本投入的精簡基礎設施。

據一家國際媒體估算,Kimi K2 Thinking的API價格比OpenAI和Anthropic的同類模型便宜6到10倍,可能對企業的采用模式造成沖擊。

Thomas Wolf表示,Kimi K2 Thinking發布后,已成為該平臺上最受開發者歡迎的模型。

進一步的質疑在于,AI領域的游戲規則是否正在被改寫?

Interconnected Capital 創始人兼首席投資官Kevin Xu在接受CNBC采訪時表示,此前,人工智能領域幾乎所有的事情都是由硬件主導的,這就是為什么OpenAI、Anthropic能夠做它們所做的事情。但DeepSeek的進化提供了在中國發展人工智能的另一種方式,即軟件主導。

如今,從DeepSeek、阿里巴巴的通義大模型,再到Kimi K2 Thinking,中國的大模型,正在通過開源策略和極致的成本效率,改變人工智能領域的競爭態勢和格局。

Kimi K2 Thinking 為何炸場

Kimi K2 Thinking之所以大受歡迎,原因很簡單:更聰明,但價格更低。

以每百萬Token的API調用成本來對比,K2 Thinking的輸入和輸出成本分別為0.15和2.5美元 ,GPT-5分別為1.25和10美元。

市場的認知已經被重塑:最實用的模型≠最貴的模型。

在過去很長一段時間,資金算力決定論是美國模式主導下的敘事邏輯。OpenAI、Anthropic、Google DeepMind們爭相掀起大模型“軍備競賽”,但錢燒得越來越快,模型進步卻越來越慢。據美國投行摩根士丹利的估算,訓練GPT-4的成本超過6000萬美元。

而在中國,我們看到的恰好相反:Kimi用幾十分之一的成本,達到了接近GPT的能力。

估值5000億美元的“AI獨角獸之王”OpenA,技術團隊規模幾千人,其中大部分是高薪挖來的專家,已部署超過10 萬塊NVIDIA H100 GPU,接下來還有1萬億美元的算力擴張計劃。而月之暗面估值33億美元,不及前者的1%,技術團隊只有200余人。

在這場完全不對等的對決面前,糧草彈藥薄弱的中國初創公司要想突破OpenAI們的銅墻鐵壁,“硬剛”顯然不現實,只能另辟蹊徑、彎道超車。

Kimi現階段的重點是:“充分壓榨每一張卡”,通過架構優化和成本控制換取最佳性能。

從燒錢競賽轉向效率競賽,這并非“中國效率”第一次給硅谷帶來“億點點”小小的震撼。

自去年年底DeepSeek R1橫空出世,在大幅降低推理成本的達到了與o1并肩的表現,國產大模型多次貢獻令人驚喜的表現。Qwen躋身Hugging Face模型下載榜單的Top 10,智譜(Z.ai)的GLM系列模型、MiniMax等也頗受海外用戶關注。

換句話說,中國AI創新在資源限制中不斷涌現。

“小米加步槍”的突圍邏輯

如果說 2022 年 ChatGPT 的發布標志著“AI 啟蒙”,那么進入2025年,中國AI在有限資源下涌現出的創新,用有限的算力榨出的極限性能,一次次向世界展示了中國團隊的技術實力。

AI創新不僅是算力競賽,也是效率競爭;AI的競爭不僅是“有多少錢”,也是“怎么用好每一分錢”。

Kimi和DeepSeek的崛起,讓全球觀察者重新審視一個老問題:為什么那些沒有寵大資金支撐的中國團隊,能在AI領域接連跑出黑馬?

答案或許可以概括為三點:技術哲學、資源稟賦、算法策略。

美國的大模型往往帶著“科研理想主義”的浪漫色彩——先設想一個理想系統,再投入海量資源去逼近。而中國的團隊更像是“工程現實主義者”——現有資源下的最優解是什么。

DeepSeek 在去年引入了被稱為“稀疏激活”的技術,即模型在推理時并非激活所有神經元,而是根據任務動態選擇部分網絡參與,從而將推理成本壓縮至原來的幾分之一。

Kimi K2模型第一次在超大規模的模型上采用了全新一代的優化器,實現了2倍左右的效率提升。

11月5日,就在Kimi K2 Thinking發布的前一天,英偉達CEO黃仁勛在一場閉門會中斷言:“中國將贏下這場人工智能的全球競賽”。

重估中國AI基模的三重邏輯

是時候給月之暗面們重新估值了。因為,資本市場正在慢慢意識到:AI公司的真正壁壘,或許不再是參數規模,而是單位算力產出價值(Compute Efficiency)。

對月之暗面們的價值重估至少有三重邏輯:

第一重,從“資本密集型”轉向“智力密集型”。不到500萬美元訓練出能與GPT-4相抗的模型,意味著這家公司擁有一種新型技術杠桿,能在低成本條件下保持高速創新。這種能力本身就是資本市場最稀缺的資產——即高ROI的研發能力。

第二重,成本結構可復制,商業化可預期。與那些動輒上億美元的模型不同,Kimi的成本意味著它的更新頻率更高、風險更可控。這讓月之暗面具備了可持續迭代的模型。有點類似于服裝行業為應對快速變化的市場需求而建立的柔性生產體系。

第三重,戰略位置:處于中國AI生態的關鍵節點。中國的AI產業正處在“算力去中心化”的關鍵階段。以阿里、字節為代表的巨頭,以Deepseek、月之暗面為代表的模型公司,正在形成一條從底層框架到應用的“內生循環”。DeepSeek和Kimi的出現,不僅補全了“高性價比模型”這一生態空白,也成為中國AI產業全球化的新樣板。它證明了,不依賴巨額算力投入,也能在技術上正面對標國際頂級模型。

過去三年,AI 競爭的關鍵詞是“大”:參數更大、語料更大、訓練集群更大。

但接下來,它會變成另一種邏輯:誰能以最少的資源,創造出最強的智能。

未來的AI競爭將不再是“硬件戰爭”,而是四個維度的綜合較量:數據效率——誰能用更少的數據訓練出更通用的模型;算法創新——誰能讓模型學得更快、想得更深;推理成本——誰能讓AI的使用成本降到人人可負擔;場景融合——誰能最快把AI變成真實生產力。

中國的機會正在于此:在硬件上雖有短板,但在成本結構、產業整合、場景落地上具備極強的實踐能力。

而像月之暗面這樣的公司,正代表著這種新型AI力量——它不一定最豪華,卻可能最高效;不一定擁有最多資源,卻更懂得如何讓資源發揮最大價值。

在這一新的周期里,決定勝負的不只是誰擁有更多芯片,還有誰能用有限的芯片做出最聰明的模型和應用。

DeepSeek和 Kimi的幾百萬美元,也許不僅是一筆訓練預算的數字,更是中國人在限制中也能持續創新的生動注腳。

作者 | 陳序寧

編輯 | 黃運濤

封面來源:kimi官網

End

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
交通部官宣:6月1日起,私家車跑順風車全面合法,不用辦證

交通部官宣:6月1日起,私家車跑順風車全面合法,不用辦證

記錄生活日常阿蜴
2026-04-24 08:12:12
小香玉生活難自理,離婚失藝名終自討苦吃

小香玉生活難自理,離婚失藝名終自討苦吃

悅君兮君不知
2026-04-24 00:29:39
套現238億元!江蘇富豪完成寧德時代1.27%股份減持

套現238億元!江蘇富豪完成寧德時代1.27%股份減持

界面新聞
2026-04-24 10:48:55
特魯多突然炮轟美國:把加拿大推向中國

特魯多突然炮轟美國:把加拿大推向中國

觀察者網
2026-04-23 18:39:18
美國巨星黛博拉,這大體格真壯實,在街頭與人交流的場景

美國巨星黛博拉,這大體格真壯實,在街頭與人交流的場景

手工制作阿殲
2026-04-24 08:16:32
王志文后事細節曝光!骨灰撒大海背后真相,一生遺憾讓無數人破防

王志文后事細節曝光!骨灰撒大海背后真相,一生遺憾讓無數人破防

夢想的旅途照進現實
2026-04-24 09:24:10
從丑陋者的兇相畢露,到某些教授的樂觀高論!

從丑陋者的兇相畢露,到某些教授的樂觀高論!

胖胖說他不胖
2026-04-24 11:50:11
太浪費了!原深汕高速鲘門廢棄路段上熱搜,不少摩旅騎手前往打卡

太浪費了!原深汕高速鲘門廢棄路段上熱搜,不少摩旅騎手前往打卡

火山詩話
2026-04-24 10:16:22
大理民宿市場涼透了!7000家民宿廝殺,有人虧百萬仍沒賣出去…

大理民宿市場涼透了!7000家民宿廝殺,有人虧百萬仍沒賣出去…

火山詩話
2026-04-23 09:14:07
局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

書紀文譚
2026-04-23 23:08:56
女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

李晚書
2026-04-24 10:39:33
張雪機車召回事件升級!63歲技術專家:O型圈不是裝反 是位置裝錯

張雪機車召回事件升級!63歲技術專家:O型圈不是裝反 是位置裝錯

火山詩話
2026-04-24 06:56:24
芬蘭空軍學員駕飛機空中畫巨型不雅圖案 遭軍方譴責、網友抨擊

芬蘭空軍學員駕飛機空中畫巨型不雅圖案 遭軍方譴責、網友抨擊

環球趣聞分享
2026-04-24 13:10:17
別把寄生于系統的繁榮當財富!亞馬遜雨林減少80萬平方公里,只因一個錯誤決策

別把寄生于系統的繁榮當財富!亞馬遜雨林減少80萬平方公里,只因一個錯誤決策

三言四拍
2026-04-24 08:22:31
蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

蔣萬安發出強硬警告,"中國臺灣省"走向國際,10國選擇明智應對

影孖看世界
2026-04-24 11:59:09
眼紅啊!從年薪20萬到125萬,一上海交大碩士特斯拉6年收入345萬

眼紅啊!從年薪20萬到125萬,一上海交大碩士特斯拉6年收入345萬

火山詩話
2026-04-23 07:11:53
明確了:放寬至38周歲!

明確了:放寬至38周歲!

新牛城
2026-04-23 17:18:51
演員脫掉和服才向觀眾鞠躬致謝,本人回應:撕掉這層皮,做回真真正正中國人

演員脫掉和服才向觀眾鞠躬致謝,本人回應:撕掉這層皮,做回真真正正中國人

臺州交通廣播
2026-04-23 22:50:01
“兩高”最新司法解釋引巨大爭議,網友:有些內容太可怕了!

“兩高”最新司法解釋引巨大爭議,網友:有些內容太可怕了!

娛樂圈見解說
2026-04-24 08:11:57
布倫森絕殺失誤登全美熱搜!迷之操作遭諷 布朗:為他畫絕殺戰術

布倫森絕殺失誤登全美熱搜!迷之操作遭諷 布朗:為他畫絕殺戰術

顏小白的籃球夢
2026-04-24 10:53:39
2026-04-24 14:56:49
雪豹財經社 incentive-icons
雪豹財經社
用真實筆觸呈現商業社會的切片
674文章數 11890關注度
往期回顧 全部

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

頭條要聞

女子乘高鐵被掉落行李箱砸到 向箱子主人索賠6百無果

頭條要聞

女子乘高鐵被掉落行李箱砸到 向箱子主人索賠6百無果

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

本地
親子
數碼
公開課
軍事航空

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

親子要聞

一秒鐘都不敢離開的,倆牛牛 你們信不信

數碼要聞

SSD全系上調10%!三星金士頓同時出手:4月第二波漲價潮殺到

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美伊陷入互相封鎖僵局

無障礙瀏覽 進入關懷版