6月8日,港股上市AI企業云知聲(shturl.)正式推出新一代通用大語言模型U2。作為面向個人、開發者與組織打造的原生智能體大模型,U2以“高智能密度×高Token價值”為核心技術主張,跳出參數競賽誤區,聚焦真實任務執行能力,以多項權威評測成績躋身主流大模型第一梯隊。
![]()
與傳統大模型更偏向單輪問答或短鏈路生成不同,U2更強調面向真實任務的連續執行能力。在復雜辦公、軟件工程、深度研究與多工具協同場景中,U2能夠自主拆解并推進100+步復雜工作流,將需求理解、任務規劃、環境交互、工具調用、過程糾錯與結果驗收串聯為完整閉環,從“給出答案”進一步走向“完成任務”。在最新發布的一系列國內外權威能力評測中,U2已經在多個關鍵能力方向進入主流大模型第一梯隊:
在衡量知識與復雜推理能力的GPQADiamond上,U2取得87.9分,超過GLM-5.1、Hy3preview、DeepSeek-V4-Flash(High)和MiniMaxM2.7,展現出對高難度知識問題的穩定理解、推理與求解能力。在衡量真實軟件工程能力的SWE-BenchVerified上,U2取得75分,進入主流模型第一梯隊。
![]()
而在面向自主Agent端到端執行能力的Claw-Eval(pass@3)上,U2取得76.9分,超過Hy3preview、DeepSeek-V4-Flash(High)和MiniMaxM2.7,進一步驗證了其在工具調用、流程編排與任務交付中的穩定表現。
在面向真實辦公與知識工作交付能力的GDPval上,U2取得72.9分,展現出扎實的專業辦公能力。相比傳統問答式評測,GDPval更關注模型能否完成真實工作場景中的高價值交付,包括資料分析、報告撰寫、表格處理、圖表生成、幻燈片制作等典型辦公任務。
不難發現,U2并不是以單點能力取勝,而是在推理、代碼、Agent和辦公交付等多項關鍵能力上形成了系統性優異表現。U2的發布不只是一次常規的模型升級,更是云知聲在原生智能體大模型長跑中的一次關鍵落子。
U2的發布是云知聲十三年技術積累的里程碑式成果,也是大模型行業從“參數競賽”轉向“價值落地”的重要標志。其“高智能密度×高Token價值”的技術路線,既降低了大模型的應用門檻,也為AI賦能實體經濟、實現產業級落地提供了高效解決方案!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.