AI下半場,騰訊終于交卷了
4月23日,騰訊混元Hy3 preview正式發布。這是姚順雨去年底加入騰訊后從頭重建的模型,今年1月啟動訓練,三個月內完成從底層基礎設施到預訓練和強化學習框架的重建。
姚順雨是ReAct框架提出者,也是AI圈公認的“智能體鼻祖”。他加入騰訊后一直在強調:AI上半場拼參數,下半場拼模型在真實世界里能不能干活。發布前,姚順雨團隊的署名論文CL-bench發現,十個前沿模型平均任務解決率只有17.2%,問題不是模型不夠大,而是“沒讀進去上下文”。
Hy3 preview定位明確:解決真實世界的復雜工程問題。不卷參數,主打實用性。在SWE-Bench Verified、Terminal-Bench 2.0等代碼智能體評測中拿到有競爭力的分數,ClawEval和WildClawBench上表現突出,意味著它能接住“龍蝦”這類復雜Agent任務。
模型采用快慢思考融合的MoE架構,總參數295B,激活參數21B,最大支持256K上下文。團隊在參數上保持克制,重點解決真實世界復雜工程問題。官方測試顯示,代碼和智能體方向提升最顯著。
姚順雨在發布會上表示,Hy3 preview是混元重建的第一步,“希望通過開源和發布獲得來自開源社區和用戶的真實反饋”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.