![]()
當前,以 Agent 為核心的新一輪技術浪潮正在席卷產業。那么,世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?研發體系不重構,還能撐多久?
6 月 26 日 -6 月 27 日,AICon 全球人工智能開發與應用大會 將在上海舉辦。本次大會將圍繞以上問題,邀請來自騰訊、阿里、快手、華為、飛豬等 50+ 頭部企業的技術負責人、高校與科研機構的一線專家,分享 Agent 在真實生產環境中的落地經驗與前瞻思考。深入探討 Agent 從原型到量產的工程挑戰、數據與記憶的基礎設施底座、安全可信的落地保障,以及大模型推理優化、智算架構升級等關鍵命題。
快手計算引擎架構組負責人柳嘉強已確認出席 “企業智算架構彈性適配” 專題,并發表題為《算力新基建,推薦新智能:快手推薦系統池化的探索與實踐》的主題分享。隨著深度學習推薦模型(DLRM)的廣泛應用,推薦系統的算力重心正從以 CPU 為主全面轉向以 GPU 為主。與此同時,生成式推薦的興起進一步放大了算力需求,而異構硬件之間增速不均衡的矛盾也愈發突出。傳統的資源供給模式已難以兼顧彈性、效率與穩定性,推動推薦系統底層基礎設施走向算力池化成為必然選擇。本次演講將系統闡述快手在推薦系統算力池化方向上的思考與實踐。
柳嘉強,2008-2017 年在清華大學電子系就讀并獲得博士學位。畢業后加入百度昆侖芯團隊,作為技術骨干參與了人工智能芯片的研發與落地。于 2020 年加入快手算法引擎部,現擔任計算引擎架構組負責人,主導了快手預估引擎的重要技術升級,支撐了快手從 SIM 系列到 OneRec 系列的模型優化與上線。他在本次會議的詳細演講內容如下:
演講提綱:
為什么要做池化?
隨著 DLRM 的應用,推薦系統資源從以 CPU 為主轉向以 GPU 為主
生成式推薦對算力的需求持續增加
異構算力增速不均衡現象持續擴大
池化面臨的挑戰
服務分散化與網絡傳輸開銷之間的矛盾
資源靈活擴展和物理資源之間不可避免耦合的矛盾
資源高效利用與資源隔離及服務穩定性要求之間的矛盾
快手池化的實踐
面向推薦系統的高性能 RDMA 互聯協議
多維度極致 CPU 卸載
統一智能調度框架
總結與展望
聽眾收益:
了解推薦系統基建的發展歷史和我們認為的演進方向
學習快手在池化過程中的技術經驗
除此之外,本次大會還策劃了 端側 AI、物理與數字空間智能化、世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構、AI 原生數據工程、AI 時代的個人提效與組織變革 等 14 個專題論壇,屆時將有來自不同行業、不同領域、不同企業的 50+ 資深專家在現場帶來前沿技術洞察和一線實踐經驗。
更多詳情可掃碼或聯系票務經理 13269078023 進行咨詢。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.