无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek V4終于來了!我們知道些什么?

0
分享至

萬眾期待的DeepSeek V4預覽版終于在北京時間4月24日上午發布了。此前,媒體和分析師曾反復預測V4即將發布,并已經多次預測失敗,這一次終于成功了。由于模型發布時間還太短,第三方和客戶評測還在緊鑼密鼓的進行中,現在的有效信息其實很少。不過,通過技術文檔和海外AI社區的初步討論,我們還是能得到一些情報的。

首先,V4的戰略方向是提高Agent能力,這與OpenClaw發布以來的世界潮流相符。“全民養龍蝦”的浪潮,給MiniMax, Kimi和智譜等國產大模型廠商帶來了巨大的Token增量,但最重要、最專業的增量被Claude吃掉了。Agent能力與編程能力是密不可分的,Claude Code至今仍是全球最強大的AI編程工具(沒有之一),GPT-Codex也無法撼動其地位。DeepSeek官方公告在開頭最顯眼的部分宣稱“Agent能力大幅提高”,但也承認“(據評測反饋)仍與Opus 4.6思考模式存在一定差距”。

在海外AI社區,一部分用戶十分興奮,期待DeepSeek成為“Claude殺手”——但公允的說,這只是一種美好愿望,畢竟很多人都很痛恨Claude及其開發商Anthropic,“天下苦Anthropic久矣”。從目前的測試數據看,V4的Token性價比很高,但是Agent Benchmark指標并沒有超過Claude Opus-4.6和GPT-5.4。需要注意的是,Benchmark分數只有參考意義,關鍵還是實際用戶體驗,Claude在許多Benchmark測試當中并不優于GPT和Gemini,但并不妨礙它在Agent領域幾乎一枝獨秀。因此,我非常關心接下來一段時間,專業用戶使用DeepSeek進行Agent操作的實際反饋。

上下文窗口擴展到1M是一個重要提升,與較低的Token定價結合起來,可能創造較高的生產力。不過,我們仍需要等待專業客戶執行復雜任務之后的實際反饋,至少還得等兩三天。

我猜測:DeepSeek從傳說中的“1月/2月發布”一直拖到今天發布,實際原因可能是打磨Agent能力,因為龍蝦這波增量超出了所有人的預期。與其發布一個跟不上現實Agentic Workflow需求的大模型,還不如在等幾個月,發布一個完全符合現實需求的大模型。當然這只是我的個人猜測,沒有實證。

其次,最初一波海外客戶使用反饋,在執行“非深度推理、非數學、非代碼”任務,例如頭腦風暴和文藝創作時,V4給人的感覺“太干”(dry),“過于正式”,落后于Claude和GPT的最新版本,甚至有人認為落后于GPT-5.2。需要強調的是,這些零碎的主觀感受代表不了什么,文藝創作任務也并非V4的主要發力方向。不過,這有可能對消費端用戶的傾向造成微妙的影響,從而擾動目前互聯網大廠對C端AI應用市場的爭奪戰。

假設V4的回答真的“太干”“太正式”,有可能是對于V3/R1幻覺率較高問題的一種解決,因為自由發揮幾乎一定意味著幻覺率提升,而限制幻覺率幾乎一定會讓回答“更干”。當然這只是猜測,期待更多更廣泛的測試結果。

第三,也是很多人最關心的:DeepSeek V4技術文件披露了很多訓練細節,但是不包括訓練硬件(顯卡)。整份技術文件當中,僅僅提到“華為”(Huawei)一次,提到“英偉達”(Nvidia)三次(不含腳注);提到"GPU"十四次(不含腳注),但都沒有提到是什么型號的GPU,僅有一次例外——"We validated the fine-grained EP scheme on both NVIDIA GPUs and Huawei NPUs platforms. 但這只是表示測試環境,不代表訓練場景(注:這也是唯一一次提到華為昇騰NPU)。

因此,我們仍不知道DeepSeek究竟是在什么硬件上訓練出來的。技術文件中有幾次提到了CUDA,但也不能據此得出完全基于英偉達架構的結論。是否像某些分析師預期的那樣,“基于英偉達和華為昇騰混合架構進行訓練”,或者“在后訓練環節對昇騰進行了專門優化”?遺憾的是,雖然一切皆有可能,但是DeepSeek官方既無認可、也無否認。相比之下,V3技術文件在一開始就宣布是由英偉達H800和A100訓練出來的。



圖片由Google Nano Banana Pro制作

有人根據DeepSeek公告中“預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調”,得出了“V4針對昇騰做了深度優化”,甚至“從1月推遲發布至今就是為了適配昇騰”的結論。雖然不能完全排除這種可能性,但不得不說,這種思維過于跳躍。這只能說明DeepSeek官方會采購或租用一批昇騰算力,并對昇騰推理進行過一些優化(這是很正常的),至于優化程度多深、乃至是否為了適配昇騰而多次推出發布,均還沒有任何實證支持。

不過,要間接證明或證偽也不難。V4是開源的,從今天起,會有無數廠商用自己的算力運行推理。假設它確實是基于昇騰訓練出來的,或者為昇騰做過深度優化,那么可以推斷——它在昇騰硬件上的推理效率,應該高于在英偉達等其他硬件上的推理效率,或至少處于同一量級。又或者,昇騰硬件能夠促使V4達到某種獨特的性能,而其他硬件做不到。只需要關注一下新聞即可輕松了解實際情況(如果沒看到新聞則代表證偽了)。

最后是對產業界的影響。除了DeepSeek自己,最期待V4發布并震驚世界的,大概就是騰訊了。昨天混元3.0大模型預覽版剛剛發布,結果其光芒完全被今天的DeepSeek V4遮住了。我還沒有機會全面試用混元3.0,但是考慮到此前騰訊在基座大模型方面的落后程度非常大,想用一個版本就達到世界先進水平,似乎不太可能。

因此,騰訊要做好AI生意,不管是做好To B生意(尤其是賣Token的MaaS生意)還是To C生意,恐怕還是要依賴高質量的第三方開源大模型。國內水平最高、使用人數最多的開源大模型是Qwen,那是老對手阿里的,騰訊顯然不太愿意用。那就只有依靠DeepSeek,以及幾天之前才發過新版本的Kimi了。如果DeepSeek真的開放融資,騰訊一定會不惜代價投進去。V4越成功,就越能讓騰訊爭取到更多時間,一邊爭取把自己做成“國產開源生態”的一個集合平臺,另一邊竭盡全力把自研大模型實力趕上來。

我想,現在最期待V4在用戶測試當中傳來捷報的,應該是騰訊的投資人和管理層。幸運的是,從最初期的一波反饋看,似乎還不錯,海外社區的評價偏向積極一面。但確實還需要更多信息,而且僅僅“偏向積極”是不夠的,最好是“十分積極”——我們恐怕還得等上一個星期才能確認。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
iPhone Ultra 9 月發布,售價很猛!

iPhone Ultra 9 月發布,售價很猛!

花果科技
2026-06-22 15:35:19
世界杯梗最多的男人來了!

世界杯梗最多的男人來了!

這里是美國
2026-06-23 17:12:28
買不動了:兩個女裝老牌的中年危機

買不動了:兩個女裝老牌的中年危機

碼上閑敘
2026-06-22 02:12:19
電訊報:梅西神級發揮徹底終結梅羅之爭

電訊報:梅西神級發揮徹底終結梅羅之爭

懂球帝
2026-06-23 19:04:10
我決定為以前無數次調侃向佐道歉!

我決定為以前無數次調侃向佐道歉!

BenSir本色說
2026-06-23 01:11:55
地球真的生病了?塔克拉瑪干沙漠迎來暴雨,中國最干的地方發洪水

地球真的生病了?塔克拉瑪干沙漠迎來暴雨,中國最干的地方發洪水

墜入二次元的海洋
2026-06-23 17:08:04
廖三寧蛻變為郭導第一利刃!末節10分力挽狂瀾 媒體人:統治一切

廖三寧蛻變為郭導第一利刃!末節10分力挽狂瀾 媒體人:統治一切

顏小白的籃球夢
2026-06-23 21:39:19
2.5億成本,《抓特務》預測票房僅1.39億,馮小剛虧到懷疑人生

2.5億成本,《抓特務》預測票房僅1.39億,馮小剛虧到懷疑人生

電影票房預告片
2026-06-21 15:54:02
著名雜志:C羅為世界杯進行形象大改造,包括發型和妝容

著名雜志:C羅為世界杯進行形象大改造,包括發型和妝容

懂球帝
2026-06-23 18:20:45
中國800萬公頃竹海,正在把中東油王“逼上絕路”

中國800萬公頃竹海,正在把中東油王“逼上絕路”

毒sir財經
2026-06-23 15:53:26
WPS,被罵慘了

WPS,被罵慘了

中國新聞周刊
2026-06-23 19:34:05
建國后周恩來數次邀請張發奎回國,張發奎婉拒:我兩頭都不會去的

建國后周恩來數次邀請張發奎回國,張發奎婉拒:我兩頭都不會去的

浩渺青史
2026-06-23 13:36:47
穆里尼奧整活!世界第一中場主動來都不要,死磕世界杯 18 歲新星

穆里尼奧整活!世界第一中場主動來都不要,死磕世界杯 18 歲新星

奶蓋熊本熊
2026-06-23 04:46:37
劉子歌近況:定居澳洲,當家庭主婦養雞種菜,與國內泳壇沒聯系

劉子歌近況:定居澳洲,當家庭主婦養雞種菜,與國內泳壇沒聯系

以茶帶書
2026-06-23 17:32:32
登上熱搜!向太說梁朝偉是假社恐

登上熱搜!向太說梁朝偉是假社恐

暖心萌阿菇涼
2026-06-23 21:09:05
庫利巴耶夫家族:百億帝國黃昏,哈薩克斯坦的清算利劍懸了多久?

庫利巴耶夫家族:百億帝國黃昏,哈薩克斯坦的清算利劍懸了多久?

別人都叫我阿腈
2026-06-23 15:41:39
自作主張!塔利班把路修到中國邊境,結果看到的是一排排鐵絲網

自作主張!塔利班把路修到中國邊境,結果看到的是一排排鐵絲網

孤城落葉
2026-06-23 20:54:48
徐飛洪硬剛印度簽證威脅,網友評論區瞬間炸鍋

徐飛洪硬剛印度簽證威脅,網友評論區瞬間炸鍋

小虎新車推薦員
2026-06-23 15:21:23
他爸是一國總統,他卻不替父親的國家踢球

他爸是一國總統,他卻不替父親的國家踢球

首席商業評論
2026-06-22 17:43:53
臺當局人員被扣押,賴清德全面潰敗,多國已站隊,兩岸也統一戰線

臺當局人員被扣押,賴清德全面潰敗,多國已站隊,兩岸也統一戰線

深層奧秘
2026-06-22 18:41:54
2026-06-23 23:08:49
互聯網怪盜團丶 incentive-icons
互聯網怪盜團丶
互聯網行業觀察者
422文章數 375關注度
往期回顧 全部

科技要聞

48名中國開發者聯名舉報蘋果

頭條要聞

看到熱搜新聞查了下自己 男子結婚8年發現3娃均非親生

頭條要聞

看到熱搜新聞查了下自己 男子結婚8年發現3娃均非親生

體育要聞

揚尼斯去了邁阿密:凱爾特人怎么辦?

娛樂要聞

內娛95后頂流格局發生潛移默化的變化

財經要聞

屋頂光伏度苦夏

汽車要聞

施鵬澤:為什么奧迪E7X強調座艙氣味安全?

態度原創

教育
時尚
手機
數碼
本地

教育要聞

孩子是否優秀,90%取決于爸爸

除了瑪麗珍、薄底鞋,今年最火的鞋子就是它了

手機要聞

曝字節新一代豆包AI手機發布時間或延遲,主要原因與備案認證有關

數碼要聞

極摩客EVO-X3迷你工作站首發21699元起:銳龍AI Max+ 395、128GB大內存

本地新聞

吃一次廣東龍舟飯,才懂什么是豪華盛宴

無障礙瀏覽 進入關懷版