![]()
文/長焦Focus
今天DeepSeek-V4預覽版上線,還同步開源。
這個已經傳了幾個月的V4版,在不斷“跳票”之后,終于揭開了面紗。
![]()
評測得分都老生常談了,但看了他們官方公號上寫的幾句話,屬實被他們的耿直給驚到了。
原話大概是這么個意思:
V4-Pro的Agent能力大幅提升,已經是開源最強水平了。內部員工拿它做Agentic Coding,反饋體驗比Sonnet 4.5好,交付質量也接近了Opus 4.6的非思考模式。
結果,緊跟著就給自己來了個轉折:
但仍與Opus 4.6思考模式存在一定差距。
還不止這個。
聊到世界知識儲備時,說自己大幅領先其他開源模型,然后又補了一句:
僅稍遜于頂尖閉源模型Gemini-Pro-3.1。
![]()
看到這幾句時候我還真愣了一下。
現在的模型圈發新品,還有這樣的耿直boy?
通常做法,不都是按榜單的測試題目來投喂語料進行訓練,在榜單中各項都能打,結果實際上手卻是一坨?
我還專門上網搜了下,想看看有沒有哪款產品會這么直接列出自己和對手的差距。
結果估計都不用我說,你們大概也能猜到了,幾乎沒有。
平時我們看發布會或者通稿,廠商的做法基本是只挑自己贏的測試項放出來,搞各種拉踩式營銷。
汽車圈有句名言:
你選擇對標誰,就是承認不如誰。
但這幾年大家對標競品,基本上都是為了在PPT上造勢,最后好喊出一句:
我們碾壓了標桿。
在媒體采訪時被問到短板,也基本是各種公關話術遮遮掩掩。
真要找同類的話,大概也就之前豆包2.0在長篇大論的技術文檔里,坦誠過自己世界知識長尾覆蓋不如Gemini,Coding不如Claude。
但像DeepSeek這樣,一點不藏著掖著,直接把“不如Opus 4.6思考模式”“不如Gemini-Pro-3.1”大大方方擺在核心宣發里的,屬實是罕見。
雖然已經好久不用DeepSeek了,但還是被他們這種不規矩的表達圈粉了。
在這個人均拳打GPT,腳踢Gemini的宣發大環境下,不吹噓、不粉飾,能大方承認差距在哪,真的比什么華麗的發布會都讓人覺得踏實。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.