衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
也是神奇,價(jià)格屠夫DeepSeek,破天荒要漲價(jià)了!
這兩天不少開發(fā)者收到了DeepSeek官方郵件,說(shuō)DeepSeek V4正式版會(huì)在下個(gè)月(7月)上線。
但事情突然不對(duì)勁起來(lái)——高峰時(shí)段,API的輸入token(緩存命中)、輸入token(緩存未命中)、輸出token,價(jià)格統(tǒng)統(tǒng)x2。
![]()
不過,價(jià)格屠夫的地位畢竟擺在那兒,哪怕是高峰時(shí)段漲價(jià),大家也還是連連感嘆,真便宜啊真便宜。
大多人都和0xSupergemma的創(chuàng)始人Jun Song一樣:
![]()
真·反常,DeepSeek V4正式版高峰期價(jià)格x2
DeepSeek模型漲價(jià),這還真是大姑娘上轎頭一回。
它過去留給大家的印象太鮮明了:便宜。
甚至是會(huì)把同行價(jià)格體系打出一個(gè)坑的便宜。
從V3到R1再到預(yù)覽版V4,不斷破圈的DeepSeek每次讓人眼前一亮又一亮,一方面是模型能力本身出色,與此同時(shí),價(jià)格也是它最鋒利的一把刀。
今年4月,V4預(yù)覽版本身就已經(jīng)很便宜。
而且當(dāng)時(shí)發(fā)布后僅2天,DeepSeek就宣布了一次降價(jià)。
輸入輸出2.5折的基礎(chǔ)上,命中緩存的輸入折上折再打1折,且輸入緩存的折扣沒有規(guī)定時(shí)限。
當(dāng)時(shí),DeepSeek研究員陳德里在上發(fā)帖稱,“輸入緩存是永久降價(jià)”。
![]()
所以,這次乍一看郵件,很多人還是發(fā)出了意料之外的“咦”的聲音。
不過僅是高峰時(shí)段漲價(jià),即凌晨1:00至4:00和上午6:00至10:00(均為世界協(xié)調(diào)時(shí))。
其它時(shí)段價(jià)格還是維持原有的地板價(jià)。
DeepSeek這種沒有直接把日常價(jià)格整體抬上去,而是通過高峰期調(diào)價(jià)來(lái)做負(fù)載管理的辦法,給人一種“我也想便宜,但家人們我真的有點(diǎn)扛不住”的feel。
以及回頭看DeepSeek最近的一系列動(dòng)作,就會(huì)發(fā)現(xiàn)一些蛛絲馬跡,覺得這次漲價(jià)也不是那么突然。
算力是真緊張,自建數(shù)據(jù)中心那是相當(dāng)迫在眉睫。
4月,他家放出新的招聘崗位,開招數(shù)據(jù)中心高級(jí)運(yùn)維工程師、數(shù)據(jù)中心高級(jí)交付經(jīng)理,“負(fù)責(zé)數(shù)據(jù)中心從立項(xiàng)、建設(shè)、交付至運(yùn)營(yíng)的全流程項(xiàng)目管理”。
數(shù)據(jù)中心選擇的落點(diǎn)是烏蘭察布,國(guó)家”東數(shù)西算”工程八大樞紐節(jié)點(diǎn)之一,內(nèi)蒙古算力集群的核心組成部分。
從那個(gè)時(shí)候起,這家以“低成本算法奇跡”著稱的公司幾乎從那個(gè)時(shí)候起就把數(shù)據(jù)中心這事兒擺在了很重要的位置上。
本月月初,DeepSeek又開了“IDC設(shè)計(jì)規(guī)劃工程師”崗位招土木老哥。
這屬于算力基建、通信基建核心技術(shù)崗,負(fù)責(zé)數(shù)據(jù)中心從前期選址、方案、布局到施工圖、落地配套的全流程規(guī)劃設(shè)計(jì),是機(jī)房建設(shè)前期核心技術(shù)負(fù)責(zé)人。
前兩天它的大規(guī)模招聘帖里,也能看到超算集群研發(fā)工程師等相關(guān)崗位。
![]()
DeepSeek V4預(yù)覽版的這幾個(gè)問題常被提及
但漲價(jià)不是白漲的!
DeepSeek在郵件里明明白白說(shuō)了:
此次更新將帶來(lái)更多的功能優(yōu)化和性能提升。
![]()
比如推特網(wǎng)友@teortaxesTex就發(fā)現(xiàn)了一些端倪:
![]()
除了這一點(diǎn)外,跑了兩個(gè)多月,V4預(yù)覽版其實(shí)已經(jīng)積累了不少用戶反饋。
被提得比較多希望有改進(jìn)的,主要有以下幾個(gè)。
一個(gè)是幻覺率偏高。
V4預(yù)覽版在一些任務(wù)里會(huì)較為高頻地給出很自信但不太靠譜的回答。
普通聊天還好,但對(duì)寫代碼、查資料、做研究的人來(lái)說(shuō),就會(huì)比較難受。
一個(gè)是超長(zhǎng)上下文的實(shí)際穩(wěn)定性還不夠收斂。
V4是“百萬(wàn)上下文窗口”,但實(shí)際體驗(yàn)并不盡如人意。
上下文堆積、復(fù)雜推理或多輪工具調(diào)用疊加時(shí)容易不穩(wěn)定或直接炸掉,這類問題在agent workflow(多工具調(diào)用、多輪決策)中更明顯。
不過這也是MoE模型的通病了……
第三個(gè)是希望復(fù)雜代碼任務(wù)能表現(xiàn)更好。
一方面,面對(duì)復(fù)雜代碼任務(wù),V4的回答有時(shí)會(huì)顯得過度保守。
另一方面有開發(fā)者反饋,在真實(shí)代碼審查類測(cè)試?yán)铮琕4會(huì)出現(xiàn)明顯的“過度標(biāo)記問題”,也就是把大量正常邏輯當(dāng)成潛在bug來(lái)提示。
以及DeepSeek在文本和推理上已經(jīng)足夠有存在感,大家一直都在期待D家模型來(lái)點(diǎn)原生多模態(tài),一刀把價(jià)格砍下去!
綜上所述,大概大家的要求也就一點(diǎn)點(diǎn),無(wú)非是能力要強(qiáng)、價(jià)格要低、速度要快、上下文要長(zhǎng)、代碼要準(zhǔn)。
最好多模態(tài)也補(bǔ)上。
你看,我們也沒有很貪心,就是一丟丟樸實(shí)的小愿望而已。
挺好的,也是推著DeepSeek往前走的一股力量~
參考鏈接:
[1]
https://x.com/jun_song/status/2071552338243076310?s=20
[2]
https://x.com/teortaxesTex/status/2071367631269986648?s=20
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.