今天介紹一位金融和人工智能領域的創業者梁文鋒,他是幻方和深度求索(DeepSeek)兩家公司的創始人。
即刻網友@Chris-Su對梁文鋒的評價我覺得很到位:
“梁文鋒是極少數還沒被‘廣泛解讀和學習’的頂級CEO。”
近期“雷軍千萬年薪挖95后天才AI少女”的熱門話題也間接的與梁文鋒有關,因為雷軍嘗試挖走的這位90后少女羅福莉此前正是梁文鋒旗下深度求索(DeepSeek)團隊的研發成員。
梁文鋒創辦的幻方量化基金目前的管理資金規模超過百億,2021年還一度突破千億元規模;而他創辦的深度求索(DeepSeek)公司,也是國內少有的擁有萬卡集群算力的AI大模型公司,研發實力和成果在最近也震驚了許多國外AI同行。
梁文鋒的深度求索(DeepSeek)公司被稱為“AI界的拼多多”,原因是這家公司的出現極大地降低了大模型訓練和應用的成本,如該公司開發的DeepSeek-V3訓練成本僅557.6萬美元,而OpenAI訓練ChatGPT-4o所花費的成本高達7800萬美元甚至是1億美元,雙方的成本至少是10倍的差距。
DeepSeek-V3在數學、代碼能力和中文知識問答方面還超過了ChatGPT-4o,可以說是性價比超高。
并且梁文鋒的深度求索(DeepSeek)團隊只有139名研發人員,而開發ChatGPT的OpenAI團隊則有1200名研究人員。
在這樣亮眼的成績背后,梁文鋒的低調就顯得更神秘了。
今天我們就用1分鐘時間,來了解一下幻方和深度求索(DeepSeek)這兩家公司的創始人梁文鋒的個人履歷和創業故事:
1985年,梁文鋒出生于廣東湛江,據36氪暗涌報道梁文鋒說自己的出生地是廣東一個五線城市,不過CEO來信君查了查,湛江目前應該是三線城市。
梁文鋒說過自己的父親是一名小學老師。可惜梁文鋒就讀的小學、中學均沒有公開信息。只知道他是一位數學建模愛好者。(也有朋友留言說他是湛江吳川人,畢業于吳川一中)
2002年,17歲的梁文鋒考入了浙江大學電子信息工程專業。
2002年9月至2006年6月,梁文鋒來到浙江杭州,在浙江大學電子信息工程專業讀本科。
2007年,22歲的梁文鋒又考上浙江大學信息與通信工程專業研究生。師從項志宇,主要做機器視覺研究。
梁文鋒的求學歷程
2008年,在浙大讀書期間,23歲的梁文鋒與同學一起組團隊開始積累市場行情數據、金融市場其他相關數據以及宏觀經濟等數據。
這一年梁文鋒也帶領團隊開始使用機器學習等技術探索全自動量化交易。而此時,正值全球金融危機。
有傳聞稱浙江杭州人、大疆創始人汪滔也曾邀請過梁文鋒一起創業,當時也是大疆起步期,如果梁文鋒加入的話,可能也同樣實現財富自由了。梁文鋒很早就相信人工智能會改變世界,最終他還是選擇自己創業。
2010年6月,25歲的梁文鋒從浙江大學信息與通信工程專業碩士畢業,他的碩士畢業論文題目是《基于低成本PTZ攝像機的目標跟蹤算法研究》。
2008年至2014年,梁文鋒一直在探索全自動量化交易。
2013年,28歲的梁文鋒與同樣來自浙江大學的同學徐進一起創辦了杭州雅克比投資管理有限公司。
2015年4月,中證500股指期貨上市。這也標志著中國量化私募進入2.0時代。量化基金擁有了更強大的量化工具,對沖手段的豐富讓資本市場的價格發現功能更完備,市場由純多頭變得更加立體化。
2015年6月,30歲的梁文鋒與徐進一起加入陽光私募大軍,在浙江杭州創辦了杭州幻方科技有限公司(公司英文名High-Flyer),也就是現在的浙江九章資產管理有限公司。梁文鋒及其團隊開始依靠數學與人工智能進行量化投資,立志成為世界頂級的量化對沖基金。
此圖來自幻方官網
2015年,國內還曾發生“股災”,梁文鋒團隊采用的高頻量化投資策略也讓他們取得了不錯的成績。當時他們公司只有10張GPU顯卡。
2015年10月,梁文鋒他們甚至帶領幻方量化在一天內成立了10只產品。同年12月,又成立了另外10只產品,快速提升了自身的募資能力。
2016年2月,梁文鋒與徐進又成立了寧波幻方量化投資管理合伙企業(有限合伙)。
幻方量化在這一年加入了中基協(中國證券投資基金業協會),意味著他們在行業內的專業性和規范性得到了官方認可。
2016年10月21日,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行,使用GPU進行計算,在此之前,梁文鋒團隊的算法主要依靠線性模型和傳統機器學習算法,模型計算主要依賴于CPU。
2016年梁文鋒31歲,到年底時,他們管理的資金規模已經大約10億元。
2017年,32歲的梁文鋒帶領幻方繼續擴大AI算法研究團隊和AI軟硬件研發團隊,到2017年底,幾乎所有的量化策略已經都采用AI模型計算。他們管理的資金規模也擴大到30億元。
2018年,梁文鋒確立公司以AI為主要發展方向,幻方量化也首次獲得了私募金牛獎——這是中國私募證券領域的最高獎項。
此時幻方量化也遇到了算力瓶頸,日益增加的訓練需求受限于有限的計算資源,梁文鋒開始尋求大規模算力解決方案。
2019年,梁文鋒創辦幻方AI公司,投資2億元自主研發深度學習訓練平臺“螢火一號”,為此搭載了1100塊GPU顯卡。
此時34歲的梁文鋒已經帶領幻方量化成為管理資金超百億的私募。這一年幻方資本也在香港成立,并獲得香港九號牌(即資產管理牌照)。
梁文鋒在金牛獎頒獎典禮現場
2019年8月30日,34歲的梁文鋒在金牛獎頒獎儀式上,發表主題演講《一名程序員眼里中國量化投資的未來》,引發金融從業人士熱議。
在演講中,梁文鋒指出量化與非量化的判定標準就是在投資決策的過程中,是用數量化方法進行決策的,還是用人進行決策的。量化公司是沒有基金經理的,基金經理就一堆服務器。
梁文鋒透露,“作為私募,投資人對我們的期望是很高的,如果一年跑贏指數低于25%,投資人是不滿意的。”他當時坦誠壓力很大,但收的手續費也很高。
梁文鋒指出量化投資已經賺了技術面流派原來賺的錢,未來也要搶奪基本面流派原來賺的錢。
演講最后,梁文鋒說幻方量化的使命就是:提高中國二級市場的有效性。
2020年,“螢火一號”投入使用,其壽命為1年半。
一位幻方量化的員工曾在公司博客中寫道,老板本人每天都在寫代碼、跑代碼。這是他們與其他公司的不同之處。
2021年,梁文鋒36歲,這是他和幻方命運的轉折之年。這一年他們還斥資10億元建設“螢火二號”。
2021年2月,《征服市場的人:西蒙斯傳》出版,梁文鋒曾為此文作序,他在書中寫道:每當在工作中遇到困難的時候,我會想起西蒙斯的話“一定有辦法對價格建模”。
注:詹姆斯·西蒙斯是量化投資領域的泰斗,創辦了文藝復興科技公司和大獎章基金。西蒙斯的投資戰績如下:
- 從1988年到2018年,大獎章基金的年化復合收益率接近40%,扣除費用后年化回報率為39%,超過了巴菲特和索羅斯等投資大佬。
- 在1994年至2014年中期,大獎章基金的平均年回報率高達71.8%。
- 2000年互聯網泡沫期間,大獎章基金獲得了98.5%的凈回報。
- 2008年全球金融危機期間,大獎章基金依然獲得80%的收益。
2021年8月,梁文鋒帶領幻方量化的資金管理規模突破千億大關,正式躋身千億量化私募之列。
幻方量化與九坤投資、明汯投資、靈均投資一起,因管理資金規模均超過600億元,被業界稱為量化私募領域的“四大天王”。
在梁文鋒的帶領下,幻方量化用4年時間成為了百億量化私募,然后又僅用2年時間成為千億量化私募,速度確實非常快。
不過2021年11月,由于業績波動,幻方量化關閉了全部募集通道,并在12月底發布致投資者公開信,致歉稱“幻方業績的回撤達到歷史最大值,我們對此深感愧疚”,究其原因,主要是人工智能投資決策在買賣時點上沒有做好。
媒體報道,幻方量化也曾在一個半月內主動縮減了超100億元的管理規模,從近千億規模降至800多億的規模。此后幻方逐漸降低其資金管理規模。
當時有投資者說,看見陸某(幻方高管)這個名字就下意識想要打人。對此陸某在朋友圈致歉說:
“想和投資者說,最近幾個月跑得不好,十分抱歉。我們正在全力加班加點做研發,但的確需要一點時間。這種時候,投資者不難受是不可能的,所以罵我們完全接受。就是千萬莫動手哈,就算動手也別打臉,消消氣,手下留情,等我們重振旗鼓。”
2021年,梁文鋒還帶領幻方先于一些云廠商拿到英偉達A100顯卡,并且其AI集群搭載顯卡的數量達到“萬卡級別”。有報道稱,當時國內超過1萬枚GPU的企業不超過5家,而且除了幻方之外,其他4家公司都是互聯網大廠。
英偉達創始人黃仁勛介紹顯卡產品
2022年,私募基金公司上海銳天投資曾起訴梁文鋒的公司幻方量化,很可能與員工跳槽,存在競業協議有關。該案的另外一名被告楊某,曾擔任上海銳天投資高頻策略研發部門的負責人,被認為掌握著公司的核心商業秘密,即量化交易策略代碼。
2022年,幻方量化的一名員工以“一只平凡的小豬”的名義向慈善機構捐款1.38億元,其中獲得扶持的項目包括白血病救助、鄉村工匠、高中生助學、兒童大病救助、聽障兒童支持、關愛老兵等。
外界猜測這位“一只平凡的小豬”就是37歲的幻方創始人梁文鋒。
圖片來自幻方官網
2023年5月,38歲的梁文鋒宣布要做通用人工智能(AGI)。
2023年7月,梁文鋒創辦了杭州深度求索人工智能基礎技術研究有限公司,就是DeepSeek公司。
梁文鋒被認為是量化投資者投身AI創業的“第一人”,實際上在幻方創業時,梁文鋒的公司也早就用上了AI技術。
2023年10月底,梁文鋒的創業伙伴徐進因為個人家庭事務處理不當,引發負面,被公司給予停職處理。當時幻方量化的管理規模已經降到了400多億元。
2024年5月,39歲的梁文鋒帶領深度求索(DeepSeek)發布了混合專家語言模型DeepSeek-V2。
DeepSeek-V2的API定價為每百萬tokens輸入1元、輸出2元,價格僅為GPT-4 Turbo的百分之一。
DeepSeek-V2模型發布后,字節跳動、阿里巴巴、百度、騰訊等大廠紛紛宣布大模型產品降價。因此,深度求索(DeepSeek)公司也被稱為AI界的拼多多。
2024年10月,梁文鋒的幻方量化向投資者發布公告,宣布未來會逐步將對沖產品投資倉位降低至零。
2024年12月26日,梁文鋒又帶領深度求索(DeepSeek)公司發布了DeepSeek-V3,并且還公開了由梁文鋒、羅福莉等人撰寫的53頁論文《DeepSeek-V3 Technical Report》。
深度求索(DeepSeek)公司官網顯示,DeepSeek-V3的多項數據“吊打了”國內外一眾大模型產品,更關鍵的是它還便宜。被稱為“來自東方的神秘力量”。
DeepSeek-V3的各項測試結果與同行對比
OpenAI創始成員Andrej Karpathy在看到DeepSeek的成績之后,毫不吝嗇地表達了贊賞,他認為深度求索(DeepSeek)在資源受限的情況下展現出了極高的研究和工程能力。
難能可貴的是,梁文鋒組建的還是一支純粹的本土研發團隊,只有中國程序員,沒有海歸人才。不少人都是應屆畢業生和畢業一兩年的年輕人。
甚至有報道稱深度求索(DeepSeek)團隊不招聘高級技術專業人員。員工的工作年限約為3到5年,而那些擁有8年以上研發經驗的人還可能會被直接拒絕。因為他們害怕這樣的人包袱太重、缺乏創新的動力。
有業內人士一語中的:“創新需要擺脫慣性。”
比如深度求索(DeepSeek)的朱琪豪是2024屆北大計算機學院軟件研究所博士畢業生;代達勱是2024年北京大學計算機學院計算語言所的博士畢業生;郭達雅是2023年中山大學博士畢業生……
有不少人是在深度求索(DeepSeek)公司實習時做出了重要貢獻。
OpenAI公司也有類似的傾向,他們招聘時會優先考慮沒有學術榮譽的高潛力新人。
梁文鋒曾對36氪暗涌說:
“如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那么重要,基礎能力、創造性、熱愛等更重要。”
做深度求索(DeepSeek)這家公司時,梁文鋒也意識到了按照他們的研究方法,是沒有VC愿意投資的,因為VC有退出需求,會希望創業者盡快做出產品商業化。所以梁文鋒在AI大模型領域探索的資金,主要還是依靠他的幻方公司在支持。
2025年,梁文鋒的幻方量化資金管理規模已經小于300億元,退出了行業前6名。
2025年1月10日,在西藏日喀則發生地震后,幻方量化向災區捐贈了100萬元救災款。
值得一提的是,雷軍真的挖走了90后天才少女羅福莉嗎?深度求索(DeepSeek)的一篇論文顯示,羅福莉的確已經從深度求索公司離職,但她有沒有加盟小米,還有待進一步確認。
羅福莉已從DeepSeek團隊離職
梁文鋒也非常重視技術的原創度,他對36氪暗涌說:
- 中國必然需要有人站到技術的前沿
- 過去三十多年IT浪潮里,我們基本沒有參與到真正的技術創新里。我們已經習慣摩爾定律從天而降,躺在家里18個月就會出來更好的硬件和軟件。
- 我們認為隨著經濟發展,中國也要逐步成為貢獻者,而不是一直搭便車。
- 真正的差距不是一年或兩年,而是原創和模仿之差。
如今在梁文鋒的帶領下,中國的大模型公司真的很有希望與美國同行們PK一下了,這在美國限制芯片銷售的背景下,顯得尤為可貴。
小結:
梁文鋒從一開始做幻方,就想要用技術驅動的方式,這是他對人工智能的信仰,對詹姆斯·西蒙斯的崇拜。
選擇金融場景去應用AI技術,也為他后來積累更多財力去研究創新打下基礎。
有趣的是,梁文鋒每次創業都會歷經資本寒冬的考驗。
無論是2008年開啟探索量化交易,還是2015年創辦幻方進入私募領域,還是2023年切入AI大模型賽道,這三個年份都被外界認為是“資本市場的寒冬期”,但梁文鋒總能在寒冬期啟動,并迅速取得不俗的成績,給人一種遇險則強的感覺,真的是打鐵還需自身硬。
在實現財富自由之后,梁文鋒把目光瞄準AI大模型,他將深度求索(DeepSeek)公司看作一種好奇心驅使的探索、學術研究,而非商業利益的追逐,所以他才會把技術開源。
此外,梁文鋒不拘一格降人才,總能發現潛力選手,以及公司管理不設KPI,鼓勵員工自由發揮等特點也讓人印象深刻。
梁文鋒才將將要40歲,但他對人工智能技術的篤定與沉穩,讓人心生敬畏,確實有頂級CEO的氣質。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.