![]()
這幾天,DeepSeek將在春節(jié)前推出新一代旗艦AI模型的消息,刷屏了。
其實(shí)這事兒爆料非常早,開年就有風(fēng)聲,1月9日英國(guó)“路透社”還專門做了報(bào)道。
為啥最近才發(fā)酵?主要DeepSeek最新發(fā)布的FlashMLA代碼里,出現(xiàn)了新模型的架構(gòu),相當(dāng)于官方實(shí)錘。
這個(gè)時(shí)間點(diǎn)挺微妙的。
記得去年,也是1月20日,DeepSeek帶著R1橫空出世,那時(shí)候?yàn)榱四茼槙秤蒙纤恢卸嗌偃朔榱俗圆渴鸾坛蹋€有人上淘寶花錢買所謂的“滿血版”應(yīng)用。
幾乎是瞬間,DeepSeek就屠榜了各類應(yīng)用下載榜單,而且是長(zhǎng)時(shí)間霸榜,無(wú)人可望其項(xiàng)背。
那時(shí)候,文心一言和豆包打得正歡,大有兩分天下之勢(shì),而DeepSeek的出現(xiàn),則直接殺死了比賽。甚至,元寶僅靠著接入DeepSeek的操作,就硬生生地?cái)D上了國(guó)內(nèi)AI競(jìng)爭(zhēng)的牌桌。
有人給這場(chǎng)顛覆起了一個(gè)名字叫:
DeepSeek時(shí)刻。
一年后的今天,在一部分人的眼里,DeepSeek似乎已經(jīng)掉隊(duì)了。
它不追熱點(diǎn),不搞宣發(fā),雖然有幾次更新,但皆不如R1震撼,在一眾恨不得把全能、多模態(tài)、AI搜索寫在臉上的競(jìng)品里,DeepSeek顯得有些格格不入。
如今的App Store的排行榜,免費(fèi)應(yīng)用下載榜的前三名,已經(jīng)被豆包、千問(wèn)、元寶牢牢占據(jù),而DeepSeek排在:
第七。
但這正是最有意思的地方。
即便在今天,國(guó)外一眾AI巨頭聊起中國(guó)AI的競(jìng)爭(zhēng)力時(shí),提到最多的名字,依舊是DeepSeek。
開年,微軟發(fā)布了《2025 全球 AI 普及報(bào)告》,將 DeepSeek 的崛起列為 2025 年“最意想不到的發(fā)展之一”。
目前,DeepSeek相關(guān)的模型調(diào)用,仍是多數(shù)平臺(tái)的首選。
在國(guó)外,出現(xiàn)了反向“套殼”,許多美國(guó)AI初創(chuàng)公司,已經(jīng)默認(rèn)使用DeepSeek模型作為基座,比如Cogito v2.1,其實(shí)就是V3的微調(diào)版。
歐洲科技界甚至還掀起了“打造歐洲版 DeepSeek”的競(jìng)賽。
問(wèn)題來(lái)了,為什么?
因?yàn)镈eepSeek直接掀了桌子。
在硅谷的邏輯里,要做出頂級(jí)模型,得燒掉一個(gè)中等國(guó)家的GDP。馬斯克的xAI前幾天剛剛?cè)诹?00億美元,用來(lái)維系昂貴的算力競(jìng)賽。
但在DeepSeek這里,邏輯完全變了。
根據(jù)技術(shù)社區(qū)和公開報(bào)告的測(cè)算,DeepSeek-V3的研發(fā)與訓(xùn)練成本僅在600萬(wàn)美元左右。對(duì)比之下,像Llama 3或GPT-4這類同量級(jí)的美國(guó)模型,其訓(xùn)練開銷保守估計(jì)都在十倍以上。
相當(dāng)于用攛摩托車的錢,造了輛頂級(jí)超跑。
珠玉在前,這讓過(guò)去那些拿著PPT,去華爾街動(dòng)輒融資數(shù)億美金的AI大廠們,怎么辦?
這種邏輯的崩塌是致命的。
同時(shí),這種成本結(jié)構(gòu)上的代差,直接導(dǎo)致了API端的價(jià)格血戰(zhàn),當(dāng)美國(guó)頂級(jí)模型的百萬(wàn)Token定價(jià)還在幾美金徘徊時(shí),DeepSeek直接給出了0.1到0.2美元的“地價(jià)”。
在老外眼里,DeepSeek就是AI版的拼多多,關(guān)鍵這個(gè)拼多多,還能給出京東的品質(zhì)。
低價(jià)兼具高效。
數(shù)據(jù)顯示,在所有發(fā)布不滿一年的新模型中,中國(guó)模型的總下載量已經(jīng)超越了美國(guó)。
在那些被西方巨頭忽略的全球南方市場(chǎng),開發(fā)者正成群結(jié)隊(duì)投向DeepSeek的懷抱。
數(shù)據(jù)顯示,在非洲,其使用率是其他地區(qū)的2到4倍;在白俄羅斯和古巴,其市場(chǎng)份額分別高達(dá)56%和49%
在被西方忽略的角落,DeepSeek 幾乎成了唯一選擇。微軟總裁布拉德·史密斯直言:
在非西方國(guó)家,中國(guó)DeepSeek已經(jīng)贏了。
這是農(nóng)村包圍城市的勝利。
這種滲透,也為中國(guó)AI爭(zhēng)取到了最寶貴的發(fā)展時(shí)間。
關(guān)鍵,還在于DeepSeek的“沉默”。
平時(shí)一聲不吭,沒(méi)事就甩出兩篇頂級(jí)學(xué)術(shù)論文,不玩騷操作,基本功扎實(shí),還有創(chuàng)新能力,老外最怕這種。
什么下載榜單排名,人家根本不care,就是埋頭搞技術(shù)。
為啥,不缺票子。
在這個(gè)所有人都急著向投資人交作業(yè)、急著變現(xiàn)的時(shí)代,DeepSeek至今保持著零外部融資的紀(jì)錄,它的母公司幻方量化,大A的股東朋友們都熟。
2025年幻方量化的收入超過(guò)7億美元,也就是約50億元人民幣。
創(chuàng)始人梁文鋒直接用這筆錢供養(yǎng)AI夢(mèng)。
前段時(shí)間,DeepSeek又開始悄悄發(fā)論文了,還把之前的R1論文更新了,一年里所有的訓(xùn)練細(xì)節(jié)、失敗嘗試,甚至那些不為人知的坑,全部補(bǔ)齊。
兩篇新論文,一篇講最新的模型訓(xùn)練方法,另一篇,探究如何用便宜內(nèi)存,取代昂貴的HBM。
這一次,它想顛覆現(xiàn)在大模型訓(xùn)練的底層基石。
這才是DeepSeek的底色,在所有人都在卷資源的時(shí)候,它在卷效率;在所有人都在追逐商業(yè)化的時(shí)候,它在追逐技術(shù)極限。
當(dāng)然,DeepSeek的模式可能很難復(fù)制,畢竟既是創(chuàng)始人團(tuán)隊(duì)、技術(shù)團(tuán)隊(duì),又是金主爸爸的情況太少了,但這種愿意沉淀下來(lái)的心態(tài),一定是未來(lái)AI發(fā)展需要的。
大家都在討論,中國(guó)AI的下個(gè)“DeepSeek時(shí)刻”會(huì)出現(xiàn)在誰(shuí)的身上?
也許,還是DeepSeek。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.