![]()
從“手動擋”到“智能駕駛”:數據分析的范式革新
想象一下,你正駕駛一輛高性能跑車,卻不得不頻繁停車,手動調整引擎參數、更換輪胎,甚至在每次轉彎前下車勘測路況。這聽起來荒謬,卻正是當前許多 AI 在復雜數據分析任務中的真實寫照:盡管擁有強大的計算能力,卻依然被繁瑣的人工干預所束縛。
KDD Cup 2026 正式發(fā)布全新賽道:Data Agents for Complex Data Analysis。本次大賽由香港科技大學(廣州)數據智能與分析實驗室 聯合 清華大學數據庫組 共同承辦,并由 ACM/IEEE Fellow 清華李國良教授和港科廣駱昱宇教授領銜。這不僅是一場全球頂尖的數據挖掘賽事,更是一次面向未來的技術挑戰(zhàn):我們能否構建出真正意義上的“智能駕駛”AI,徹底告別人工干預,自主定義數據分析的能力邊界?
![]()
01
任務驅動:當 AI 必須“學會思考”
傳統(tǒng)的數據分析自動化,更多是“腳本化”的:預設流程、固定工具、單一數據源。一旦任務超出預設范圍,或數據環(huán)境發(fā)生變化,人工干預便不可避免。Data Agents 的核心價值,在于讓 AI 從“執(zhí)行者”升級為“思考者”:
場景模擬:假設你是一名數據科學家,需要評估一家跨國公司在全球各區(qū)域的季度銷售表現,并找出異常波動的原因。這需要你:
1.理解問題:從一份高層報告中提煉出“評估銷售表現”和“找出異常原因”這兩個核心目標。
2.數據尋源:在全球多個數據庫(SQL)、本地文件(CSV、JSON)、甚至郵件附件(PDF 報告)中尋找相關銷售數據、市場報告、匯率信息等。
3.工具選擇:根據數據類型和分析需求,選擇合適的工具:SQL 查詢數據庫、Python 腳本處理 CSV、PDF 解析器提取報告內容。
4.邏輯推理:將不同來源的數據整合,進行復雜的計算(如匯率轉換、同比環(huán)比),識別異常模式,并結合市場報告進行歸因分析。
5.結果呈現:將分析結果以清晰的圖表和文字形式呈現。
目前,這一系列步驟仍需大量人工協(xié)調。而 Data Agent 的目標,正是要自主完成這一切。
02
Data Agents:
突破“人工天花板”的核心能力
![]()
KDD Cup 2026 Data Agents 賽道,旨在推動 AI 具備以下“告別人工干預”的關鍵能力:
1.自主任務分解與策略生成:不再依賴人類指令,Agent 能夠將復雜的高層級目標,自主拆解為一系列可執(zhí)行的子任務,并動態(tài)規(guī)劃最優(yōu)的執(zhí)行路徑。
2.跨模態(tài)工具鏈編排:Agent 能夠智能識別并調用多樣化的工具(數據庫操作、編程語言執(zhí)行、外部 API 交互),并將其靈活編排,形成高效的工作流。
3.異構信息融合與推理:Agent 能夠無縫處理來自結構化、半結構化、非結構化甚至多模態(tài)數據源的信息,進行深度關聯與邏輯推理,構建全面的數據視圖。
4.自適應決策與結果驗證:在執(zhí)行過程中,Agent 能夠根據中間結果進行自適應調整,并對最終分析結果進行自我驗證,確保準確性和可靠性。
03
DataAgent-Bench:
丈量 AI 自主分析的“能力邊界”
![]()
為了精確丈量 AI 在自主數據分析方面的“能力邊界”,本次大賽推出了核心基準測試平臺DataAgent-Bench。它通過構建一系列精心設計的任務,挑戰(zhàn) Agent 的極限:
?真實場景模擬:任務設計深度還原企業(yè)級數據分析場景,數據源涵蓋數據庫、文檔、圖表等異構模態(tài)。
?非線性推理挑戰(zhàn):任務包含順序鏈、分支與合并、迭代循環(huán)等多種推理模式,要求 Agent 具備高級的邏輯判斷和策略調整能力。
?難度梯度分級:從 Easy 到 Extreme 四個難度級別,通過控制“模態(tài)數量”與“干擾項規(guī)模”,系統(tǒng)性地評估 Agent 在不同復雜程度下的表現。
一個 Phase 1 任務示例:
任務:分析公司 2025 年 Q3 季度銷售數據,識別出實際銷售額超出預算目標 20% 的地區(qū),并歸因其驅動因素。
Agent 需處理的數據:
?sales_transactions.sqlite:交易數據庫。
?region_mapping.json:地區(qū)映射文件。
?Company_Ops_Manual.md:預算計算規(guī)則。
?Market_Report_Q3.md:市場分析報告。
Agent 需完成的推理:
1.從手冊中提取預算公式,結合映射文件,解析數據庫中的地區(qū)信息。
2.對交易數據進行復雜查詢和計算,篩選出高增長地區(qū)。
3.結合市場報告,對增長原因進行自動化歸因。
重要信息:Phase 1 Demo 數據集及官方 Starter Kit 已發(fā)布!包含 Easy、Medium、Hard 和 Extreme 四個難度級別,并配套 GitHub 基準代碼與工具鏈。立即前往官網 https://dataagent.top/ 下載,挑戰(zhàn) AI 自主分析的極限!
04
賽制與獎勵:
激發(fā)創(chuàng)新,共塑未來
KDD Cup 2026 采用兩階段賽制,旨在全面激發(fā)參賽者的創(chuàng)新潛力:
?Phase 1(單一主賽道):所有隊伍在公共排行榜上競技,通過自動化評估,考驗基礎能力與算法效率。
? Phase 2(雙子賽道):晉級隊伍可選擇:
Leaderboard Subtrack(排行榜賽道):追求極致準確率,挑戰(zhàn)包含數據圖像、數據視頻等更具挑戰(zhàn)性的新模態(tài)數據,推動性能極限。
Creative Subtrack(創(chuàng)意賽道):更注重系統(tǒng)設計與用戶體驗,鼓勵構建成熟、交互友好且決策透明的 Data Agent 系統(tǒng),探索應用邊界。
本次大賽設立總額120,000 元人民幣的豐厚獎金池,并提供:
?大廠 Offer 直通車:助力職業(yè)發(fā)展,連接頂尖人才與產業(yè)需求。
? KDD Cup Workshop 專屬演講機會:在國際學術舞臺展示成果,提升個人與團隊影響力。
官方獲獎證書:為學術履歷增添價值,彰顯技術實力。
![]()
05
權威陣容:頂尖學者,引領前沿
本次大賽由香港科技大學(廣州)和清華大學聯合組織,匯聚了數據智能領域的學者。組織委員會成員包括:
General Chairs 陣容:
![]()
?李國良,ACM Fellow,IEEE Fellow,清華大學計算機系教授、副主任,國家杰出青年科學基金獲得者(并延續(xù)資助),國家重點研發(fā)計劃項目首席科學家,數據智能北京市重點實驗室主任,計算機學會數據庫專委會副主任。
?駱昱宇,香港科技大學(廣州)助理教授,研究興趣為Data Agents、LLM Agents。在 SIGMOD、VLDB、KDD、ICML 等頂會發(fā)表論文40 余篇。曾獲世界人工智能大會云帆獎、福布斯中國U30、華為火花獎。領導 OpenManus 和 DeepEye 開源智能體項目(GitHub 5.5萬+ Stars),獲日內瓦發(fā)明展銀獎。
?湯南,香港科技大學(廣州)副教授,ACM Distinguished Member,國家高層次人才計劃入選者。研究聚焦 AI4DB 與數據中心化 AI,曾獲 VLDB 最佳論文獎及 SIGMOD 2024 Research Highlight Award。
?李伯巖,香港科技大學(廣州)博士生。研究方向聚焦于Text-to-SQL 和 Data Agents,在SIGMOD、KDD、VLDB、ICML等CCF-A類會議發(fā)表論文10余篇,領導DeepEye數據智能體開源項目,獲日內瓦發(fā)明展銀獎。
Committee Chairs 陣容:
![]()
除上述專家外,大賽還匯聚了一批活躍在數據智能體、文檔智能、信息提取、數據可視化、數據庫系統(tǒng)及以數據為中心的 AI等前沿領域的青年學者。他們將出任本次大賽的 Committee Chairs,深度參與并統(tǒng)籌賽事的注冊流程、全球宣傳、數據構建及評估標準制定,從多維度為大賽的公平性、權威性與技術專業(yè)度保駕護航。
06
關鍵時間節(jié)點:
把握機遇,共赴前沿 (AoE 時區(qū))
? 3月22日 - 4月23日:全球隊伍注冊階段(機會稍縱即逝,立即組隊,搶占先機!)
? 4月24日 - 5月23日:Phase 1 激烈角逐
? 5月28日 - 6月30日:Phase 2 激烈角逐
? 8月9日:KDD 2026 現場公布最終獲獎名單
![]()
07
立即行動,告別干預,定義未來!
Data Agents 的時代已然來臨,KDD Cup 2026 正是你告別人工干預、定義數據智能未來的最佳舞臺!
▎大賽官網(數據集下載 & 賽事詳情):復制鏈接 https://dataagent.top/ 到瀏覽器訪問,或點擊文末左下角“閱讀原文”直達。
▎加入官方交流社區(qū),與全球精英同行:為方便參賽者交流、獲取最新動態(tài)及組隊信息,我們開通了官方交流渠道。關注“數據智能與分析實驗室 DIAL”微信公眾號,回復關鍵詞即可獲取:
?回復KDD大賽:獲取官方 Discord 交流社區(qū)(KDD Cup 2026 | DataAgents)、X (Twitter) 賬號鏈接及賽事 FAQ 快速入口。
您也可以直接復制鏈接 https://discord.gg/7eFwJQN3Fx 加入我們的 Discord 社區(qū),與全球開發(fā)者共同探討 Data Agents 的前沿技術!
讓我們相約 KDD 2026,共同告別人工干預,塑造數據分析的未來!
![]()
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區(qū)進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.