網易首頁 > 網易號 > 正文 申請入駐

DeepSeek-R1持續震撼硅谷:躋身競技榜前三,創始人梁文鋒采訪被“拿放大鏡”看

0
分享至

“神秘東方力量”DeepSeek給硅谷帶來的影響,還在不斷泛起漣漪——

剛剛,DeepSeek-R1躋身大模型競技榜前三。

以開源、便宜20倍的“身價”與ChatGPT-4o(2024.11.20)并列。

在復雜提示詞/風格控制榜單上,R1位列第一。

目前結果來看,它在各個維度上都保持領先。

在衡量模型編程開發能力的WebDev分榜上,R1位列第二,與閉源的Claude 3.5 Sonnet相差不到40分。

網友實測體驗表示,確實如此,R1在30場battle中只輸了4、5次。

另一邊,硅谷對DeepSeek的好奇不減。

畢竟,它可是一個“副業”。

創始人梁文鋒的中文采訪更是被翻譯成英文,“拿著放大鏡”逐字認真閱讀。

他提出的觀點也被總結成箴言,在互聯網上流傳。

“真正的差距不是1年或2年,而在于是原創還是模仿!

圖靈獎得主LeCun也為DeepSeek做出中肯評價:

這幫人是一群有點理想化的“技術狂”,他們堅信自己能搞出通用人工智能(AGI),而且他們確實有這個資源和天賦。我真是太喜歡他們了!

值得一提的是,同為開源領域代表的Meta剛剛公布了2025年在AI領域的布局計劃:650億美元,投算力、投人才。

有爆料稱,Meta內部已經因為DeepSeek感到恐慌。

1

“他們讓OpenAI一次又一次看清自己”

所以,在硅谷視角里,他們更關心DeepSeek的哪些信息?

最首要的莫過于,DeepSeek如何賺錢。

挖到的信息有點出乎意料,或許DeepSeek還沒想賺錢的事。

控股DeepSeek的是幻方量化,他們有一批頂級科學家,有充裕的算力資源,DeepSeek其實是一個“副產物”。

在2023年末我就聽說他們在做DeepSeek。即使在當時的中國,還沒有人把他們當回事。

其次,為何DeepSeek能成功。梁文鋒在2023年5月2024年7月接受暗涌的兩次采訪,也被老外扒出來了。

他們最關心的五個方面分別是:

1、創新第一性原則:與其他致力于快速商業化的中國AI公司不同,DeepSeek專注于基礎的AGI研究和創新。他們認為,中國必須從全球人工智能發展的“搭便車者”轉變為“貢獻者”。梁文鋒說,創新不完全是商業驅動的,還需要好奇心和創造欲。

2、革命性架構:DeepSeek V2中采用的新型MLA(多頭潛在注意力機制)架構,把顯存占用降到了過去最常用的MHA架構的5%-13%,實現了成本大幅降低。它的推理成本僅為Llama 370B的1/7、GPT-4 Turbo的1/70。

這并不是為了挑起一場價格戰——他們只是在“成本上稍微有點利潤”來定價。這種創新架構繼續應用于V3和R1模型中。

3、獨特的公司文化和人才戰略:DeepSeek保持著一個完全自下而上的組織結構,為研究人員提供無限的計算資源,優先看創造熱情而不是證書。他們的突破性創新來自年輕的本土人才——中國本土的應屆畢業生和年輕技術人才,而非海外招聘。

4、致力于開源:盡管行業開始趨向于閉源模型(OpenAI和Mistral),DeepSeek仍致力于開源,并認為開源對于建立一個強大的技術生態系統至關重要。梁文鋒認為,在顛覆性技術面前,閉源形成的護城河是短暫的。

他們的真正價值在于建立一個具備創新能力的組織。

5、底層計算挑戰:盡管擁有足夠的資金和技術,DeepSeek也面臨來自底層計算的挑戰和壓力。目前公司還沒有新的融資計劃。梁文鋒認為,面臨的主要制約因素不是資金,而是高端算力的使用權,這些芯片對于訓練先進AI模型至關重要。

除此之外,采訪中的諸多細節也被網友認真品味。

原文中,梁文鋒被問道:怎么看待做量化同時做大量基礎研發,不燒錢嗎?

他回答:一件激動人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因為有一群急于在上面彈奏樂曲的人。

海外網友感慨:

這幫人是一群有點理想化的“技術狂”,他們堅信自己能搞出通用人工智能(AGI),而且他們確實有這個資源和天賦。我真是太喜歡他們了!

此外也避免不了一些對比:

梁文鋒展現出一種完全不同的心態,他們的成功當之無愧,我也很期待看到他們一次又一次讓“OpenAI”認清自己。

當然放眼AI領域的整體發展,能夠看到DeepSeek,對于所有人而言或許都是興奮的。

盡管我忍不住覺得他們有點天真,畢竟在商業化上他們有點“自斷后路”。但看到一個團隊堅持理想并取得成功,確實讓人覺得很欣慰。

隨著R1的驚艷亮相,DeepSeek正在兌現自己所說的一切。拓寬技術邊界、堅持開源、專注于技術開發……

那么,DeepSeek是如何走到現在的呢?

2

用AI做量化,再回到AI

梁文鋒本碩均就讀于浙江大學信息與電子工程學專業。

2008年,梁文鋒畢業,開始帶領團隊使用機器學習等技術探索全自動量化交易。

當時量化在國內還是個新鮮概念,能否賺錢是個未知數。2010年滬深300股指期貨推出,量化投資迎來春天。據公開信息顯示,梁文鋒團隊正是乘上這股東風,很快自營資金超過5億元。

與此同時,深度學習浪潮的齒輪開始轉動,人工智能率先在硅谷爆發。

2015年,梁文鋒與校友共同創立幻方量化。僅僅1年后,他們就推出了旗下第一個AI模型,第一份由深度學習生成的交易倉位上線執行,使用GPU進行計算。

2017年,幻方量化宣稱實現投資策略全面AI化。

2018年,幻方量化確立AI為公司的主要發展方向。

AI加持下,幻方量化旗下基金回報率遠超同期滬深300指數。2019年,資金管理規模突破百億元。

2019年,梁文鋒在當年的金牛獎頒獎儀式上,發表主題演講《一名程序員眼里中國量化投資的未來》,這是他少見的公開演講。

演講全文的確充滿“程序員視角”:

量化公司是沒有基金經理的,基金經理就是一堆服務器。人來做投資決策的時候,它是一種藝術,要憑感覺。程序來決策的時候,它是一種科學,它有最優解。

也是這一年,幻方量化開始大規模布局AI算力,搭建起“螢火一號”集群。2021年,“螢火二號”落成。這樣的算力基建,成為如今DeepSeek快速奔跑的底層支撐。

2021年,幻方量化成為國內首家突破千億規模的的量化私募大廠,被稱為國內量化私募“四大天王”之一。

值得一提的是,在幻方量化的官網上,AI基礎科學研究始終占據重要位置,包括在大模型浪潮前。

幻方量化曾表示,多年以來,該公司堅持把營收的大部分投入人工智能領域,建設領先的AI硬件基礎設施,進行大規模的研究,探索人類未知的奧秘。

我們相信幾乎所有的創新都是從大膽嘗試和點滴積累中孕育而來。

2023年,幻方量化將下場做大模型的獨立新組織命名為深度求索,并強調將專注于做真正人類級別的人工智能。

目標不是復刻ChatGPT,而是研究和揭秘AGI的更多未知信息。

DeepSeek的故事也就開始于這一刻。

一個80后程序員在攪動中國量化市場后,完成資金積累,組建起年輕蓬勃的團隊,似乎又回到了他原本的起點、回到AI,但產生的能量正在全球掀起駭浪。

3

One More Thing

值得一提的是,幻方量化還長期向慈善機構捐贈,官網披露公司員工“一只平凡的小豬”個人捐助 1.38 億元,支持 15 家慈善機構的 23 個公益項目,在全國范圍內幫助弱勢群體,促進社會的公平和發展。

爆料消息稱,這個員工就是梁文鋒本人。

參考鏈接:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1i6dlvj/inside_deepseeks_bold_mission_ceo_liang_wenfeng/
[2]https://www.threads.net/@yannlecun/post/DFNvN3euNEV?xmt=AQGzPcW8Rr7oXT6-rHIoKzBNL5x2PNnaprvJBL6uIhgoQA
[3]https://finance.eastmoney.com/a/202501223304127161.html
[4]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

轉自公眾號:量子位

圖文網絡,侵刪

粉絲福利領取

近期,公眾號收集了科研指導、編程學習、科學哲學、科學史、數學和物理科普書、中醫書籍、文學著作、升學就業相關資料等資源大禮包,點擊了解詳情

點擊資源推文頁,領取方式在文末

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“小女孩擰油門”是為傳遞陌生人溫柔?視頻發布者回應:女孩并非陌生人

“小女孩擰油門”是為傳遞陌生人溫柔?視頻發布者回應:女孩并非陌生人

極目新聞
2026-04-30 19:45:58
男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現驚人現象

男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現驚人現象

詭譎怪談
2025-04-01 17:37:59
越南少將的坦白:中國軍隊在諒山再停留五天,越軍將無一幸免

越南少將的坦白:中國軍隊在諒山再停留五天,越軍將無一幸免

今日養生之道
2026-04-30 15:01:19
北京退休教授娶30歲美女空姐,次年生下龍鳳胎,前男友突然找來

北京退休教授娶30歲美女空姐,次年生下龍鳳胎,前男友突然找來

秋風專欄
2025-04-27 11:16:32
第4艘航母將至?人民海軍用兩字暗示,中國首艘核航母可能要來了

第4艘航母將至?人民海軍用兩字暗示,中國首艘核航母可能要來了

皇朝冰酷
2026-04-29 17:34:24
搞不好被0-3逆轉?老詹25分7助,小里復出替補22+4+6,艾頓18+17

搞不好被0-3逆轉?老詹25分7助,小里復出替補22+4+6,艾頓18+17

無術不學
2026-04-30 13:13:54
太陽系每2.2億年繞銀河轉一圈,上次公轉完,人類還沒誕生!

太陽系每2.2億年繞銀河轉一圈,上次公轉完,人類還沒誕生!

觀察宇宙
2026-04-29 21:10:12
伊能靜長文控訴!十年沒二人世界,她抑郁是秦昊缺位還是自作自受

伊能靜長文控訴!十年沒二人世界,她抑郁是秦昊缺位還是自作自受

郭蛹包工頭
2026-04-17 14:14:44
美國研究:比脂肪更可怕的其實是低質量碳水!國人健康都毀在這

美國研究:比脂肪更可怕的其實是低質量碳水!國人健康都毀在這

39健康網
2026-04-29 18:36:22
日本“一天一頓飯”!求助無門,開始呼叫中國?

日本“一天一頓飯”!求助無門,開始呼叫中國?

混沌錄
2026-04-29 19:36:05
賽季報銷!朱婷迎來挑戰,主力副攻嚴重受傷,球隊三連冠阻力大

賽季報銷!朱婷迎來挑戰,主力副攻嚴重受傷,球隊三連冠阻力大

跑者排球視角
2026-04-30 19:38:48
天王山不再低迷,哈登全面表現高效砍23分9板5助2斷1帽

天王山不再低迷,哈登全面表現高效砍23分9板5助2斷1帽

懂球帝
2026-04-30 10:44:13
詹姆斯:我的巔峰結束于2021年被希爾壓傷腳踝!

詹姆斯:我的巔峰結束于2021年被希爾壓傷腳踝!

歷史第一人梅西
2026-04-30 10:05:54
開國授銜時上將分為十七個類別,哪六位上將的軍銜與眾不同?

開國授銜時上將分為十七個類別,哪六位上將的軍銜與眾不同?

史不語
2026-04-30 16:30:04
終于換裝了!港警首次曝光國產LS-7沖鋒槍,為什么不用進口槍了?

終于換裝了!港警首次曝光國產LS-7沖鋒槍,為什么不用進口槍了?

史行途
2026-04-29 19:59:46
越南這場鬧劇,終于還是沒演下去,670億美金的高鐵夢徹底碎了!

越南這場鬧劇,終于還是沒演下去,670億美金的高鐵夢徹底碎了!

青青子衿
2025-12-27 02:06:04
美媒:民調顯示特朗普支持率跌至本屆任期新低

美媒:民調顯示特朗普支持率跌至本屆任期新低

參考消息
2026-04-29 19:21:07
吳宇森的好萊塢階段,這部最好

吳宇森的好萊塢階段,這部最好

虹膜
2026-04-30 21:16:39
堅決擁核!賴清德政策大變化,蔡正元社交平臺憤怒發聲

堅決擁核!賴清德政策大變化,蔡正元社交平臺憤怒發聲

阿龍聊軍事
2026-04-30 21:04:57
小因扎吉:如果國米贏歐冠我肯定不會走;我來沙特不是為了錢

小因扎吉:如果國米贏歐冠我肯定不會走;我來沙特不是為了錢

懂球帝
2026-04-30 14:35:12
2026-04-30 22:08:49
天地生人 incentive-icons
天地生人
科技
865文章數 4619關注度
往期回顧 全部

科技要聞

9000億美元估值,Anthropic即將反超OpenAI

頭條要聞

廣州一段路泊位最高收132元/天 市民收萬元罰單也不停

頭條要聞

廣州一段路泊位最高收132元/天 市民收萬元罰單也不停

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發?

娛樂要聞

孫楊博士學歷有問題?官方含糊其辭

財經要聞

易會滿被“雙開”!

汽車要聞

專訪捷途汪如生:捷途雙線作戰 全球化全面落地

態度原創

藝術
時尚
教育
公開課
軍事航空

藝術要聞

安東·愛德華·基爾德魯普:19世紀丹麥風景畫家

緞面裙,時髦又高級!

教育要聞

報考強基計劃到底好不好?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

意大利議會批準:捐贈航母給印度尼西亞

無障礙瀏覽 進入關懷版