今天V4終于上線了,我經過一番使用,發現果然沒有超預期,但是也不算低于我的預期。
以下7個測試里,DeepSeek排第一的是奧數能力(Apex shortlist)和代碼能力(SWE vertifed),其它都是中游,HLE墊底。
![]()
所有測試大家分數基本都很接近,反而是在SimpleQA里 DeepSeek領先Claude和GPT不少,但大家都遠遠輸給 Gemini。
為啥?這其實只是一個簡單的百科類短知識測試,比如某人哪年出生,哪地在哪國境內,就是你以前會在搜索引擎上搜的,而Gemini背后有谷歌。
DeepSeek 墊底的還是HLE,人類最后的考試,這是所有模型的噩夢,超高難度的綜合學科推理與通用智力測試,看各家的分數就知道,它還遠遠沒被大模型征服,我以前有篇文章專門介紹過。
最終結論似乎也很簡單了:在所有開源模型里, V4 依然領先,但已不是遙遙領先,相比閉源大模型,依然有差距,但依然差距不大。
這個結論,也是 DeepSeek給自己的一個結論:強于所有開源,略輸頂級閉源。
![]()
但是這個相比其它開源模型的不再遙遙領先,恰恰正反映出了過去15個月以來, DeepSeek 遇到的困境。
![]()
我猶記得25年1月,R1上線,一時舉世轟動,國產大模型六小龍的封號,正式成為歷史,很多人甚至質疑智譜和月之暗面還繼續做下去的意義是什么。
國外開源社區對 DeepSeek一片好評, 一眾媒體也都在驚呼,難道中國AI水平即將反超美國?英偉達更是暴跌20%以表尊敬。
但是過去的15個月, DeepSeek的優勢在明顯縮小,而肉眼可見的未來,DeepSeek回到遙遙領先狀態的概率,是不大的,因為過去一年限制它的所有因素,今天依然在限制它,包括人才流失和國產芯片。
![]()
融資,當然能緩解這件事,至少可以給內部人才發期權了,可以延緩人才流失了,但融資本身也會帶來不少新問題。
我最近幾天拜讀了DeepMind創始人哈撒比斯的傳記(為行文方便以下簡稱小哈),看到第七章時,心中一動:小哈當年的選擇,不恰恰就是 DeepSeek融資的最佳出路嗎?
![]()
DeepMind成立后其實有過幾輪融資,但是又要做研究,又要搞融資,智商爆表的小哈都被搞煩了,所以才會在最終的最終,索性一次性賣給了谷歌,然后自己安心加入做研究。
然后的故事我們都知道了,他做出了AlphaGO,獲得了諾貝爾獎,并讓Gemini迎頭趕上了ChatGPT
這,難道不也正是梁文鋒的最佳選擇么?
而我之前的文章 里提過:“DeepSeek如果真要開始融資,人的因素又是個問題。如果看過梁文 鋒早期采訪,就會發現這個團隊還得有個專門管融資的人,梁的性格特質,非常不適合和那些想要盡快看到一個大餅被吹起來的投資人接觸。我記得25年春節后有過一陣討論就是,為什么中國的VC們,集體錯過DeepSeek?當然,作為嘲諷VC的文章,這個視角沒問題,也是一般讀者愛看的,但當時我覺得更應該問一問的是,為什么DeepSeek其實沒接觸過多少投資人?怎么說呢,放到當下,我其實更希望看到的新聞是,DeepSeek已經直接拿到一輪天使或者A輪了,估值和金額都沒那么重要了,甚至可以完全保密。因為這說明背后肯定是有了讓梁非常信任的人,而他也信任梁,能答應梁相對理想化的條件。 這也說明融資這件梁相對不擅長的事情,以一種高效的方式被迅速解決了,他可以繼續專注模型的研究了。 現在這種正在融資的新聞不斷傳出來,說明DeepSeek似乎進入了一種廣撒網的階段,且中國應該幾乎沒有不想投DeepSeek的基金,至少會派人去接觸,這么一來一去,得分散多少時間精力?”
小梁和當年的小哈,其實遇到的是一樣的困境。
DeepMind 先是在2010-2013年間,拿了幾輪包括Peter Thiel和馬斯克的融資,之后才整體賣給了谷歌。這其中的一個因素是, Peter Thiel傷到了小哈的心。
小哈以為最初對他有知遇之恩的 Peter Thiel ,會在后繼每輪持續支持他,然而實際上因為AlexNet在ImageNet比賽上的突破性勝利,AI在當時已經算是個熱門賽道了,買卡的成本也已經高了不少,精明的從0到1大師,這次似乎不太愿意繼續在從1-10下注了。他給D eepMind的評估就是,科學層面是頂級A+,商業層面是最差的F,可能永遠無法盈利。
![]()
其實說起來,整體賣掉公司,尤其在早期就整體賣掉公司,還是賣給大廠,本來對很多硅谷初創公司來說,就是一種比較主流的選擇,區別只是創始人馬上離開還是繼續加入。
Youtube創始團隊其實很早就把公司賣掉了,ins和WhatsApp也是如此。這些產品后來的發展雖也曾有坎坷,但整體還是相當不錯的。
所以,到時候如果真看到DeepSeek直接被某大廠收購了,你也別覺得太驚訝。 在操作上,這本就并無任何的不可行性, 融資就是包含收購選項的,而 DeepSeek的問題是之前一直沒出來談過估值,一旦估值確定了,后面就好說了。
不進行一輪一輪的融資,在避免牽扯研究的精力之外還有一個好處,那就是如果公司走到上市IPO,是必須對商業化有個交代的,市場是會考核你的,你必須有可觀的收入和利潤,并且還得嚴控成本和資本支出,由此一來,很多關乎10年AGI大計的長遠投入,就不得不受到限制了。
更別說,這些考核是永久循環的,每隔三個月,那些焦慮自己排名的基金經理和焦慮自己派點的分析師, 就會來找你一次,而他們想看的只是公司增速是否beat預期 。
那么問題來了,如果小梁整體加入一家公司,哪家大廠最合適呢?
在我心中,當然是那家已經和DeepSeek業務聯動最多的公司。
我不會在本文中直接說出這家公司的名字,以免文章被刪。
因為,這家公司本身也非常愿意整體收購D eepSeek的最大理由是:他家的模型,是比較弱的,他家的AI產品,是那種砸了紅包也扶不起來的。
畢竟,雙向奔赴的感情,才是最有希望長久走下去的。
當然也是因為,這家公司,也是過去相對最善待被投公司的。
我曾在,賣了公司的張小龍,反而做成了遠超他原本上限的事,這些事對他和他的收購方來說,是一場絕對重大的雙贏。
張小龍不用再為融資而苦惱,彼時的他只是一個樸素的程序員啊。而后來他也可以長期讓微信保持相對較低的商業化程度,慢慢探索微信里的小程序和視頻號等生態。
如果微信是獨立上市公司,他再堅持也很難做到這件事。
![]()
當然,其實我覺得還有一條最佳出路:DeepSeek像OpenAI一樣,從開源模型轉為閉源模型。但是要繼續保持模型能力領先,然后像 OpenAI一樣 開始C端收費或者加入廣告。
當然這條路,除了網友不答應,梁文鋒自己也不愿意吧。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.