網易首頁 > 網易號 > 正文申請入駐

算力新基建，推薦新智能：快手推薦系統池化的探索與實踐｜AICon 上海

2026-06-10 09:45:05　來源: InfoQ

北京舉報

分享至

當前，以 Agent 為核心的新一輪技術浪潮正在席卷產業。那么，世界模型的下一個突破在哪？Agent 從 Demo 到工程化還差什么？研發體系不重構，還能撐多久？

6 月 26 日 -6 月 27 日，AICon 全球人工智能開發與應用大會將在上海舉辦。本次大會將圍繞以上問題，邀請來自騰訊、阿里、快手、華為、飛豬等 50+ 頭部企業的技術負責人、高校與科研機構的一線專家，分享 Agent 在真實生產環境中的落地經驗與前瞻思考。深入探討 Agent 從原型到量產的工程挑戰、數據與記憶的基礎設施底座、安全可信的落地保障，以及大模型推理優化、智算架構升級等關鍵命題。

快手計算引擎架構組負責人柳嘉強已確認出席 “企業智算架構彈性適配” 專題，并發表題為《算力新基建，推薦新智能：快手推薦系統池化的探索與實踐》的主題分享。隨著深度學習推薦模型（DLRM）的廣泛應用，推薦系統的算力重心正從以 CPU 為主全面轉向以 GPU 為主。與此同時，生成式推薦的興起進一步放大了算力需求，而異構硬件之間增速不均衡的矛盾也愈發突出。傳統的資源供給模式已難以兼顧彈性、效率與穩定性，推動推薦系統底層基礎設施走向算力池化成為必然選擇。本次演講將系統闡述快手在推薦系統算力池化方向上的思考與實踐。

柳嘉強，2008-2017 年在清華大學電子系就讀并獲得博士學位。畢業后加入百度昆侖芯團隊，作為技術骨干參與了人工智能芯片的研發與落地。于 2020 年加入快手算法引擎部，現擔任計算引擎架構組負責人，主導了快手預估引擎的重要技術升級，支撐了快手從 SIM 系列到 OneRec 系列的模型優化與上線。他在本次會議的詳細演講內容如下：

演講提綱：

為什么要做池化？
- 隨著 DLRM 的應用，推薦系統資源從以 CPU 為主轉向以 GPU 為主
- 生成式推薦對算力的需求持續增加
- 異構算力增速不均衡現象持續擴大
池化面臨的挑戰
- 服務分散化與網絡傳輸開銷之間的矛盾
- 資源靈活擴展和物理資源之間不可避免耦合的矛盾
資源高效利用與資源隔離及服務穩定性要求之間的矛盾
快手池化的實踐
- 面向推薦系統的高性能 RDMA 互聯協議
- 多維度極致 CPU 卸載
- 統一智能調度框架
總結與展望

聽眾收益：

了解推薦系統基建的發展歷史和我們認為的演進方向
學習快手在池化過程中的技術經驗

除此之外，本次大會還策劃了端側 AI、物理與數字空間智能化、世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構、AI 原生數據工程、AI 時代的個人提效與組織變革等 14 個專題論壇，屆時將有來自不同行業、不同領域、不同企業的 50+ 資深專家在現場帶來前沿技術洞察和一線實踐經驗。

更多詳情可掃碼或聯系票務經理 13269078023 進行咨詢。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.