網易首頁 > 網易號 > 正文申請入駐

冠軍獨享200萬！鵝廠聯手KDD發題，高校博士、頂尖大牛連夜組隊

2026-03-21 11:59:26　來源: 算法與數學之美

北京舉報

分享至

冠軍獨享200萬！一場讓頂尖學術大佬、高校博士瘋狂撈人組隊的大賽，已向全球正式開賽。論文發表、大廠offer、算法落地，一鍵三連。

一場比賽，冠軍獨享約200萬！

重賞之下，學術圈早已徹底坐不住了。

去年，曾單槍匹馬殺入50多名的上科大博士，在線發帖邀約組隊。

一大批學者在線撈隊友，這究竟是什么比賽？

深扒一看，能讓學術圈大佬為之瘋狂的賽事，正是一年一屆的騰訊廣告算法大賽。

這幾天，KDD Cup 2026的賽題正式公布，其中一道正是來自騰訊廣告！

這一次，總獎金池高達88.5萬美元，直接刷新了國內外同類企業技術競賽的獎金紀錄。

不僅如此，這次大賽還直接把論文發表路徑、真實落地機會和職業通道綁在了一起，就問一句誰不想去啊！

一道來自中國的題

登上了全球最頂級的擂臺

先說KDD是什么。

ACM SIGKDD，全稱國際數據挖掘與知識發現大會，和ICML、NeurIPS并列，是機器學習和數據挖掘領域全球公認的三大頂會之一。

KDD Cup是其官方競賽環節。能進KDD Cup的賽題，本身就代表著這個問題被學術界認可為「值得全球最聰明的一群人來攻克」。

2026年，騰訊廣告算法大賽（TAAC）直接跳了一個臺階——

以KDD Cup 2026官方賽題的身份，把自己真實業務系統里啃不動的核心工程難題，擺到了全球研究者面前。

大賽官網：algo.qq.com

但這件事真正值得說道的地方，在于出題權。

過去很長一段時間，中國AI企業在國際學術舞臺上的存在感，主要體現在「發論文」和「刷榜單」。

KDD Cup不一樣。誰出題，誰就在定義這個領域的核心問題是什么，全球最頂尖的研究者就圍繞這個問題展開工作。

歷年KDD Cup的出題方，是Google、Amazon、Uber這樣的全球科技巨頭。騰訊廣告這次拿到的，與其說是一個賽事合作的席位，不如說是一次「議題設置」的機會。

從「參與別人的議題」到「定義自己的議題」，這個轉變，可能比賽事本身更值得關注。

跑了二十年的「雙軌」架構

到了必須合并的時候

好了，那這道價值88.5萬美元的題，到底在問什么？

賽題全稱是「Towards Unifying Sequence Modeling and Feature Interaction for Large-scale Recommendation」，翻譯過來就是：

在大規模推薦系統中，把序列建模和特征交互統一起來。

拆開來看，這道題直指推薦系統架構里一個繞不開的矛盾。

過去二十年，推薦系統的研究基本沿著兩條線走。

第一條線是特征交互建模。

就是把用戶的性別、年齡、設備類型、廣告類別等各種靜態特征拿過來，建模它們之間的交叉關系。DeepFM、DCN、Wukong這些經典模型，解決的都是這個問題。

第二條線是序列建模。

就是捕捉用戶的行為軌跡。他先看了什么、后點了什么、買了什么、跳過了什么。DIN、DIEN、SIM、TWIN這些模型，關注的就是行為序列里的時序信號。

這兩條線各自都取得了巨大的成功，但問題在于，它們基本是各自為政的。

在今天幾乎所有大廠的推薦系統里，這兩類信號是由兩套完全不同的子網絡分別處理的。

序列那邊跑一個Transformer，特征那邊跑一個交叉網絡，最后在上層做一個淺層融合。這就是所謂的「雙軌并行、后期融合」架構。

這套架構在CPU時代還能湊合用。但進入GPU時代之后，問題就大了。

兩套異構子網絡意味著算力的割裂。你很難用一塊GPU同時高效地跑兩種完全不同的計算圖。

隨著用戶行為序列越來越長、模型規模越來越大，這種碎片化的架構正在成為系統規模化的核心瓶頸。更別提工程層面的復雜度了，兩套網絡意味著兩套優化目標、兩套調參邏輯、兩套部署流程。

學術界和工業界已經有人意識到了這個問題。

近兩年，Meta和字節跳動等大廠陸續推出了嘗試打通這兩條線的工作：

InterFormer（Meta AI/UIUC，CIKM 2025）探索了異構交互學習
OneTrans（ByteDance/NTU）嘗試用單個Transformer統一特征交互和序列建模
HyFormer（ByteDance）則重新審視了兩種建模范式各自的角色定位。

所以，騰訊今年在KDD Cup上拋出的這道題，實質上是向全球學術和工業界發起了一個挑戰：

能不能設計一個單一同構的Recommendation Block，在一個架構里同時處理序列行為和多域特征交叉？

比賽框架概覽

具體來說，每條訓練/測試樣本對應一個「三元組」（用戶、上下文、目標廣告/商品）。

輸入包含兩部分：一是用戶屬性、廣告屬性、上下文特征、交叉特征等非序列多域特征；二是用戶的歷史行為序列及其附帶的異構側信息。

從模型框架來看，序列特征和非序列特征分別通過專用的tokenizer轉化為S token（序列token）和NS token（非序列token），再一起送入由統一block堆疊而成的同構骨干網絡，最后接一個CVR預測頭完成輸出。

訓練與評估中，模型采用「交叉熵損失函數」，最終排名以AUC of ROC為準。

比賽框架概覽

參賽者需要構建模型，捕捉所有這些特征之間的關聯，輸出目標廣告的預測轉化率（pCVR）。

下面，重點來了。

賽題數據來自騰訊廣告每日服務數十億用戶的真實業務系統，包含100個以上的脫敏特征字段，涵蓋用戶行為序列、用戶屬性、廣告屬性、上下文信號和交叉特征等多個維度。

數據以JSON格式提供，結構清晰。以用戶行為序列為例，每條記錄包含user_id和一個按時間排列的行為序列，每個行為事件包含item_id、action_type（曝光、點擊、轉化等）和timestamp。

非序列特征方面，用戶特征包含性別、年齡、婚姻狀態等字段，物品特征包含類型、品類、廣告主類型等，上下文特征包含設備品牌、操作系統等稀疏特征，交叉特征則以稠密embedding向量的形式給出。

所有稀疏特征均已做匿名化處理，不包含任何原始文本、圖片或個人可識別信息。

目前，官方已經在Hugging Face上開源了一份包含1000條樣本的Demo數據集（TAAC2026/data_sample_1000），約68MB，采用Parquet格式，支持pandas和HuggingFace Datasets庫直接加載，方便參賽者提前熟悉數據結構和字段定義。

傳送門：https://huggingface.co/datasets/TAAC2026/data_sample_1000

值得注意的是，第二輪競賽的數據量是第一輪的10倍。

參賽者需要在AUC指標上追求極致的同時，還必須滿足嚴格的推理延遲限制——超時的提交直接作廢，不論AUC多高。

效果和效率，兩手都要硬。這就是工業界的真實約束。

更有意思的是，賽事還專門設置了兩個獨立于排名之外的創新獎：

統一架構創新獎（4.5萬美元）
Scaling Law創新獎（4.5萬美元）

騰訊希望鼓勵（但不強制）參賽者去探索：如何針對序列和非序列特征（或Token），構建可堆疊的統一建模架構；推薦模型的Scaling Law。

前者獎勵在統一建模架構上有原創突破的團隊，后者獎勵在推薦系統Scaling Law探索上有深刻洞察的團隊。

換句話說，即使你的AUC不是最高的，只要方法有足夠的新意和學術價值，同樣有機會拿到重量級獎項。

還有一條規則值得注意：賽事全程禁止模型集成/融合。

這個限制很有針對性。它逼著參賽者在單一架構上做到極致，而不是靠堆模型數量來刷分。

因為騰訊要的不只是一個跑分最高的模型，它想看到推薦系統架構層面的根本性創新。

高校與業界，首次同解一道題

2026年賽事的另一個重大變化，是首次開設了面向在職人士的工業賽道。

這個決定背后的邏輯值得細說。

過去幾年，騰訊廣告算法大賽一直是高校學生的主場。

學生有創造力、有時間、敢想敢試，但他們缺少對真實系統約束的體感。在實驗室里，你可以把模型搞得很復雜，因為沒有延遲預算；你可以用很大的batch size，因為不用考慮線上serving的內存開銷。但工業界不是這樣的。

反過來，在大廠做推薦系統的工程師們，每天都在和延遲、吞吐量、資源分配搏斗，他們對系統約束的理解是刻在骨子里的。但長期在業務中打補丁式的優化，也容易讓人陷入局部最優，很難跳出來做架構層面的根本性反思。

今年的賽題恰好處在這兩種能力的交叉點上。

「統一建模」既是一個需要架構創新思維的學術問題，也是一個必須尊重工程約束的系統問題。光有想法不夠，光有經驗也不夠。

所以，2026年賽事分成了兩條賽道：

學術賽道面向全球高校全日制在讀學生（本科、碩士、博士、博士后），總獎金54萬美元。冠軍獨享30萬美元（約200萬人民幣），亞軍9萬美元，季軍4.5萬美元，第4到10名各1.5萬美元。參賽者需提供學術身份證明。

工業賽道面向所有社會人士，包括個人、研究機構、企業團隊，總獎金25.5萬美元。冠軍15萬美元，亞軍7.5萬美元，季軍3萬美元，第4到10名每隊獲得一臺Apple iPad Air。

兩條賽道做同一道題，分開排名。但最終呈現在KDD舞臺上的，將是兩個群體對同一個問題給出的不同解法。學生可能會提出結構上更大膽的統一方案，工程師可能會在效率和可落地性上打磨得更精細。

這種碰撞本身，就是產學研融合最理想的形態。

從騰訊廣告的角度看，這也是一步人才生態的棋。

學術賽道吸引的是未來三到五年的核心算法人才儲備，工業賽道觸達的是當下就能產生業務價值的資深工程師群體。兩條線并行，構建的是從校園到職場、從論文到系統的完整人才鏈路。

對于參賽者來說，兩條賽道各有各的實在價值。

工業賽道這邊。

對于工程師來說，這不只是一場競技，也是一張通往騰訊業務前線的「入場券」。

優秀選手有機會加入騰訊，親自把自己的想法放到真實廣告系統中去驗證和迭代。也就是說，你的代碼不是跑完比賽就扔掉，它可能真的會影響每天數十億次的廣告決策。

通過騰訊Angel機器學習平臺，參賽者可直接使用免費高性能GPU算力，對于很多中小公司的參賽團隊來說，這是一次難得的大規模實驗機會。

學術賽道這邊。

對于學生來說，KDD Cup的參賽經歷可以直接寫入學術CV，這個背書在全球ML/AI圈的含金量不用多說。

優秀成果會被邀請在KDD Workshop分享，并收錄在KDD 2026 Workshop Proceedings，進入決賽的隊伍全員還有機會可獲得騰訊實習Offer并有機會轉正。

換個角度來看，這場賽事提供的其實是一個三維價值閉環：

學術維度，KDD Cup的背書、Workshop paper的發表路徑、頂尖評審團的認可；
商業維度，冠軍方案經過離線A/B驗證后有機會直接落地到騰訊廣告的生產系統；
職業維度，參賽者可獲得騰訊人才綠色通道，優秀選手直通校招或社招面試。

三條線在同一場賽事里擰在一起，這在算法競賽里并不多見。

（需要注意的是，騰訊員工不可參加任何賽道。）

推薦系統的下一個范式

可能就藏在這道題里

如果把騰訊廣告算法大賽近兩年的賽題放在一起看，能讀出一條清晰的技術演進脈絡。

2025年的賽題是「全模態序列生成式推薦」（AMGR），探索的是推薦系統從判別式到生成式的范式轉換。能不能用生成模型來「創造」推薦內容，而不是只在候選庫里「挑選」。

2026年的賽題轉向了「統一建模」，追問的是一個更底層的架構問題。在生成式推薦的浪潮到來之前，推薦系統的基座架構本身是不是需要先完成一次根本性的重構？

從「上層范式創新」到「底層架構統一」，這個演進方向耐人尋味。

騰訊廣告的技術團隊正在系統性地沿著推薦系統的技術棧向下挖掘。先探索了上層的生成式可能性，現在要回過頭來把地基打牢。

而統一建模這個地基一旦打下去，緊接著就能釋放另一個巨大的可能性——推薦系統的Scaling Law。

我們已經在大語言模型上見證了Scaling Law的威力。但推薦系統的Scaling Law是什么？這個問題幾乎沒有人系統性地回答過。

原因在于，傳統的推薦系統架構是碎片化的。序列模塊和特征交叉模塊各自獨立，根本沒有一個統一的骨干網絡可以「scale」。

拿DeepFM來說，你把層數從10層疊到100層，效果不會線性提升，因為它的架構天花板很低。再看DIN，你把序列長度從100擴展到10000，延遲直接爆炸，因為它的注意力機制壓根不是為這種規模設計的。

這恰恰是「統一建模」和「Scaling Law」兩個命題深度綁定的原因。

只有當你有了一個統一的、同構的、可堆疊的骨干網絡，Scaling Law的探索才有了載體。你才能系統性地回答：

推薦模型的效果，到底如何隨參數量、數據量、計算量的變化而變化？這條曲線是什么形狀？拐點在哪？

如果這個問題被回答了，推薦系統的優化就能從「經驗驅動的手動調參」走向「規律驅動的可預測擴展」。

廣告平臺將能夠更精確地評估，再投入多少算力，能換來多少轉化率的提升？對于支撐著千億美元數字廣告市場的推薦系統來說，這幾乎是圣杯級別的問題。

騰訊專門為Scaling Law探索設了一個4.5萬美元的創新獎，而且明確說了，這個獎獨立于排名之外，評審看的不是AUC分數，而是方法論的新穎性和洞察的深度。

這個設計本身就說明，騰訊對這個方向的戰略押注是認真的。

3月19日，正式開賽

一道來自中國互聯網廣告前線的工程難題，現在擺在了全球最頂尖算法研究者面前。

88.5萬美元的獎金池已經就位，KDD 2026的頒獎舞臺正在搭建。

3月19日，大賽正式開賽。整個賽程從3月跨越到8月（以下均為AOE時間）。

3月15日：Demo數據集發布
3月19日 - 4月23日：全球報名期
4月24日 - 5月23日：第一輪競賽
5月25日 - 6月24日：第二輪競賽
8月9日：KDD 2026會議現場頒獎

賽事在公平性上也下了功夫。

第一輪采用嚴格的反過擬合控制，包括提交次數限制和延遲反饋機制，必要時還會啟動滾動準入機制（最多支持5000支隊伍并發）。

第二輪所有提交必須在官方環境中通過可復現性驗證和規則合規檢查，確保最終排名經得起檢驗。

每隊1-3人，每人只能加入一支隊伍。4月23日之后不允許任何隊伍變更。排名以AUC of ROC為唯一指標，但必須滿足對應賽道和輪次的推理延遲限制。

不管你是在校園里追論文的學生，還是在大廠里調系統的工程師，這道題都值得你認真看一眼。

大賽官網：algo.qq.com

賽事聯系郵箱：taac@tencent.com

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

算法與數學之美

分享知識，交流思想

5484文章數 64624關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

旅游

家居

手機

手機 / 數碼

房產 / 家居

冠軍獨享200萬！鵝廠聯手KDD發題，高校博士、頂尖大牛連夜組隊

徐匯、黃浦、靜安、嘉定二模作文出爐！

六層樓高大樹"偷"走家里光線 女子起訴隔壁小區業委會

六層樓高大樹"偷"走家里光線 女子起訴隔壁小區業委會

62歲，成為中國足壇最火的人

周潤發時隔16年再賣樓，變現數億資產

現實是最大的荒誕:千億平臺的沖突始末

創造4萬億帝國、訪華20次，庫克留下了什么

全新坦克700正式上市 售價42.8萬-50.8萬元

態度原創

央視發布：春招企業需求排名TOP5專業

時尚啟蒙必看片單，終于更新了

詩意光影 窺見自然之境

OPPO Find X9 Ultra把增距鏡塞進手機里：史無前例

六層樓高大樹"偷"走家里光線女子起訴隔壁小區業委會

六層樓高大樹"偷"走家里光線女子起訴隔壁小區業委會

全新坦克700正式上市售價42.8萬-50.8萬元

詩意光影窺見自然之境