網易首頁 > 網易號 > 正文 申請入駐

GIM和港大這篇ACL主會,把量化因子挖掘重做了一遍

0
分享至



如果把量化投資里最難的一件事挑出來,很多人都會指向同一個詞:Alpha。

說白了,就是那些能提前告訴你"這只股票后面大概率怎么走"的有效信號。

問題也恰恰出在這里。市場噪聲太大,數據維度太高,真正有用的信號又少得可憐。人手搓因子,慢;遺傳編程容易在局部打轉,產出一堆長得差不多、經濟意義也不強的東西;深度學習雖然猛,但很多時候你知道它有效,卻說不清它為什么有效,換個市場、換個周期,就不一定穩了。

現在,一篇來自香港大學和 Grace Investment Machine(GIM)的工作想把這件事換個做法。

他們做了一個叫 CogAlpha 的框架,入選 ACL 2026 推薦 Oral。

一句話概括:不再讓大模型只當"寫公式的助手",而是把它當成會分工、會反思、會迭代、還會自己改代碼的研究員團隊,去自動挖掘 Alpha。

在來自中美港三個市場的 5 個數據集上,這套方法穩定跑贏了 21 個基線方法。主實驗 CSI300、10 天預測任務上,年化超額收益達到 16.39%,信息比率1.8999

這事有點意思了。



  • 論文標題:
  • Cognitive Alpha Mining via LLM-Driven Code-Based Evolution
  • 論文作者:
  • Fengyuan Liu, Yi Huang, Sichun Luo, Yuqi Wang, Yazheng Yang, Xinye Li, Zefa Hu, Junlan Feng, Qi Liu, Grace Investment Machine
  • 論文鏈接:
  • https://arxiv.org/abs/2511.18850

這篇論文到底做了什么?

CogAlpha 的第一個關鍵變化,是把 Alpha 從"公式"升級成了"代碼"。

這不是小改動。用公式表達因子,表達能力受限。一旦換成 Python 代碼,因子的搜索空間會一下被打開——大模型不再只是吐一個數學表達式,而是能寫出帶注釋、帶邏輯、能執行、能檢查的候選因子程序。

然后,作者又在這個基礎上,給大模型搭了一個"研究組織架構"。

整個系統里最抓眼球的部分,是一個7 層、21 個智能體的探索體系。這 7 層不是隨便分的,而是按量化研究的思考方式,從宏觀到微觀一路拆下去:

  • 第 1 層看市場結構與周期,比如長期趨勢和階段切換;
  • 第 2 層盯極端風險和脆弱性,比如尾部風險和崩盤前兆;
  • 第 3 層研究價量關系,流動性、買賣失衡;
  • 第 4 層看趨勢延續、短期反轉、波動聚集;
  • 第 5 層處理多尺度復雜性,比如回撤結構和分形粗糙度;
  • 第 6 層做穩定性和狀態門控,讓信號按不同市場狀態決定要不要激活;
  • 第 7 層負責幾何特征和融合,K 線形態、多因子合成、非線性改寫。



你可以把它理解成:不是讓一個大模型悶頭想因子,而是讓一整個分工明確的研究團隊,同時從不同角度去挖。

它不是生成一次就完了,而是會"進化"

這篇論文最像人類研究流程的地方,不在生成,而在后面那套迭代機制。

CogAlpha 走了一條很像研究員反復打磨的路徑:先生成一批候選 Alpha,再檢查代碼能不能跑、邏輯有沒有問題,然后用 IC、RankIC、ICIR、RankICIR 和互信息 MI 五個指標做篩選,接著把好的候選拿去做變異、交叉和進化,最后不斷迭代,把差的淘汰,把更有潛力的留下來。

篩選分兩檔:超過同代 65 分位的算合格因子,超過 80 分位的算精英,后者進入下一輪演化。

為了防止系統越來越保守、最后只會圍著幾個套路打轉,作者還設計了多樣化提示策略:輕度改寫保證穩定,中度改寫引入自然變體,創造性改寫則鼓勵模型從不同研究角度重新理解同一個方向。

這個設計很關鍵。Alpha 挖掘最怕的,不是找不到一個好因子,而是老在同一類因子里繞圈。

結果有多強?消融實驗說得很清楚

論文最硬的一組結果,來自 CSI300 成分股、10 天預測任務。

在這里,CogAlpha 相比 21 個基線方法拿到了最好的整體表現。



換句話說,CogAlpha 在這項核心實驗里,年化超額收益大約翻倍,IR 也明顯拉開。

值得一提的是,論文里有個不符合直覺的發現:閉源模型并沒有天然更強,推理型模型表現甚至偏弱。Alpha 挖掘不是單純比"誰更聰明",而是比誰的結構更適合探索、篩選和演化。真正拉開差距的,是這套認知式工作流本身,而不是底層模型的能力上限。

可解釋性,量化圈真正在意的

量化圈一個老問題是:很多因子能跑,但解釋不清。

CogAlpha 生成的每個 Alpha 不只是一個數字結果,而是附帶詳細注釋、完整代碼實現,解釋這個因子的邏輯和想法。論文展示的一個例子,是用"價格上行幅度除以成交量"衡量流動性沖擊——如果股票價格沖得快但成交量并不大,意味著流動性很薄、價格沖擊更大,短期收益也許更值得關注。

不復雜,但講得通。

對機構來說,這點很重要。真正能進研究流程、進交易流程的,不只是高分因子,而是能被理解、能被復核、能被追責的因子。



這篇 ACL,真正有價值的地方是什么?

如果只把它理解成"又一篇用大模型做量化的論文",有點低估它了。

這篇工作更大的價值,可能在于它給出了一種新范式:讓大模型不只是生成內容,而是參與研究流程本身;不只是給答案,而是組織探索、篩選、反思和進化。

放在量化里,這叫自動化 Alpha 發現。再往外看,更像一種 Agentic Research 的落地案例——把研究任務拆成層級化認知單元,給每個單元設定職責,再讓系統通過反饋做持續演化。

如果這套方法能在 Alpha 挖掘里成立,那別的高噪聲、低信號、需要創造性探索的研究任務,是不是也可以這么干?材料發現、策略生成、實驗設計、復雜工業優化,這個問題值得繼續看。

當然,作者自己也寫得比較克制:回測全在 Qlib 框架里完成,和真實交易環境還有距離;LLM 輸出有隨機性,數據規模越大執行時間越長。CogAlpha 現在更像一個很強的研究引擎,而不是能無腦接到交易端的即插即用系統。

但這不妨礙它的重要性。很多真正改變行業的東西,第一步都不是立刻商用,而是先證明一件此前沒人證明清楚的事:

原來這條路,真的走得通。

量化投資過去幾十年,一直在和同一個問題纏斗:怎么在充滿噪聲的市場里,持續找到新信號。現在,大模型以另一種身份加入了這場游戲——不是聊天機器人,也不是寫摘要的工具,而是一個會分工、會寫代碼、會自查、會進化的研究系統。

CogAlpha 讓人第一次比較具體地看到:AI 也許真的可以參與"發現"本身,而不只是參與"表達"與"執行"。

About GIM

在 GIM(Grace Investment Machine)我們相信,AI技術正處在在重塑資本市場的關鍵節點。因此,我們致力于融合最前沿的AI與大模型技術,打造新一代智能投資范式——不僅是量化方法的升級,更是投資決策邏輯的重構。

我們希望通過智能分析師與交易系統,將金融市場洞察與執行效率提升至全新量級。 我們核心團隊來自全球頂尖對沖基金、DeepMind、Meta、Anthropic 等前沿AI實驗室,以及牛津、清華、北大、港大等知名高校。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
獲得7國支持后,巴拿馬向中國提出相關訴求,中方明確拒絕開先例

獲得7國支持后,巴拿馬向中國提出相關訴求,中方明確拒絕開先例

潮鹿逐夢
2026-05-05 15:40:05
張雪機車反向輸出!法國頂級代理商上門,放話讓中國摩托風靡全球

張雪機車反向輸出!法國頂級代理商上門,放話讓中國摩托風靡全球

小娛樂悠悠
2026-05-05 10:24:30
悲催!從停車場駛出1分鐘,因上人被電子抓拍,一司機經歷引熱議

悲催!從停車場駛出1分鐘,因上人被電子抓拍,一司機經歷引熱議

火山詩話
2026-05-04 15:47:01
湖南瀏陽煙花廠爆炸已致21死61傷 涉事企業負責人被采取控制措施

湖南瀏陽煙花廠爆炸已致21死61傷 涉事企業負責人被采取控制措施

新京報
2026-05-05 09:17:26
五一最堵10大景點出爐!網友:第1名堵到懷疑人生,第5名直接勸退

五一最堵10大景點出爐!網友:第1名堵到懷疑人生,第5名直接勸退

奇思妙想草葉君
2026-05-02 16:12:40
一夫一妻制即將消失?3種新型婚戀模式席卷全國,或取代傳統婚姻

一夫一妻制即將消失?3種新型婚戀模式席卷全國,或取代傳統婚姻

瓦倫西亞月亮
2026-05-01 09:38:21
馬克龍時代將畫上句號,梅朗雄宣布競選法國總統,對華態度已曝光

馬克龍時代將畫上句號,梅朗雄宣布競選法國總統,對華態度已曝光

達文西看世界
2026-05-05 09:47:35
新華社消息|伊朗成功阻止美以軍艦駛入霍爾木茲海峽

新華社消息|伊朗成功阻止美以軍艦駛入霍爾木茲海峽

新華社
2026-05-04 18:37:12
溫碧霞現身草蜢演唱會,疑似沒穿內衣露尷尬點,丈夫看手機不理她

溫碧霞現身草蜢演唱會,疑似沒穿內衣露尷尬點,丈夫看手機不理她

童叔不飆車
2026-05-04 00:07:51
兩性關系:女人最愛這2種肢體觸摸,99%女人都會動情

兩性關系:女人最愛這2種肢體觸摸,99%女人都會動情

皓皓情感說
2026-05-05 10:06:10
3-3!曼城絕平卻交出爭冠命門:格伊致命短路,瓜帥體系現死穴!

3-3!曼城絕平卻交出爭冠命門:格伊致命短路,瓜帥體系現死穴!

落夜足球
2026-05-05 15:40:58
俄最大油港又被點燃!皇俄大V的悲觀預測:1917還是1991?

俄最大油港又被點燃!皇俄大V的悲觀預測:1917還是1991?

鷹眼Defence
2026-05-03 18:44:03
反制國際足聯高價勒索,央視玩了一手漂亮兵法

反制國際足聯高價勒索,央視玩了一手漂亮兵法

云石
2026-05-04 14:41:43
破防!全紅嬋退賽后大變樣,留長發做美甲,活出了19歲該有的樣子

破防!全紅嬋退賽后大變樣,留長發做美甲,活出了19歲該有的樣子

童叔不飆車
2026-05-05 14:36:22
全是套路??!「100%真肥?!钩扇W笑料,思源黑體背鍋?

全是套路啊!「100%真肥?!钩扇W笑料,思源黑體背鍋?

雷科技
2026-05-04 21:20:50
開國十大元帥的另類排名:在黨的七大中央委員會的排名

開國十大元帥的另類排名:在黨的七大中央委員會的排名

阿器談史
2026-05-04 14:19:29
毛主席后代現狀:無心進入政壇,大多從商,從不言是偉人后代

毛主席后代現狀:無心進入政壇,大多從商,從不言是偉人后代

歷史人文2
2026-05-05 11:30:03
季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

籃球大圖
2026-05-05 11:26:52
工資9800-15000(六險二金+雙休)2026年廣州地區公開招聘工作人員公告?。ǜ綅徫灰螅?月5日報名!

工資9800-15000(六險二金+雙休)2026年廣州地區公開招聘工作人員公告?。ǜ綅徫灰螅?月5日報名!

廣州生活美食圈
2026-05-05 10:35:07
諷刺拉滿!國乒男團兩連敗,樊振東淪陷,瑞典球員的話字字戳心窩

諷刺拉滿!國乒男團兩連敗,樊振東淪陷,瑞典球員的話字字戳心窩

阿纂看事
2026-05-04 21:14:03
2026-05-05 16:55:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12917文章數 142642關注度
往期回顧 全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

伊朗警告阿聯酋:勿當以色列棋子 否則將得到難忘教訓

頭條要聞

伊朗警告阿聯酋:勿當以色列棋子 否則將得到難忘教訓

體育要聞

全世界都等著看他笑話,他帶國米拿下冠軍

娛樂要聞

英皇25周年演唱會 張敬軒被救護車拉走

財經要聞

五一假期,中國年輕人的“首爾病”犯了

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

時尚
房產
本地
教育
軍事航空

夏天最經典的銀色,貴氣十足!

房產要聞

五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

本地新聞

用青花瓷的方式,打開西溪濕地

教育要聞

語法第3課(上)-英文造句的被動結構

軍事要聞

特朗普威脅伊朗不要向美國船開火

無障礙瀏覽 進入關懷版