網易首頁 > 網易號 > 正文申請入駐

云知聲發布U2原生智能體大模型，多項評測躋身主流第一梯隊

2026-06-11 11:45:21　來源: 潮流科技泛

江西舉報

分享至

6月8日，港股上市AI企業云知聲（shturl.）正式推出新一代通用大語言模型U2。作為面向個人、開發者與組織打造的原生智能體大模型，U2以“高智能密度×高Token價值”為核心技術主張，跳出參數競賽誤區，聚焦真實任務執行能力，以多項權威評測成績躋身主流大模型第一梯隊。

與傳統大模型更偏向單輪問答或短鏈路生成不同，U2更強調面向真實任務的連續執行能力。在復雜辦公、軟件工程、深度研究與多工具協同場景中，U2能夠自主拆解并推進100+步復雜工作流，將需求理解、任務規劃、環境交互、工具調用、過程糾錯與結果驗收串聯為完整閉環，從“給出答案”進一步走向“完成任務”。在最新發布的一系列國內外權威能力評測中，U2已經在多個關鍵能力方向進入主流大模型第一梯隊：

在衡量知識與復雜推理能力的GPQADiamond上，U2取得87.9分，超過GLM-5.1、Hy3preview、DeepSeek-V4-Flash（High）和MiniMaxM2.7，展現出對高難度知識問題的穩定理解、推理與求解能力。在衡量真實軟件工程能力的SWE-BenchVerified上，U2取得75分，進入主流模型第一梯隊。

而在面向自主Agent端到端執行能力的Claw-Eval（pass@3）上，U2取得76.9分，超過Hy3preview、DeepSeek-V4-Flash（High）和MiniMaxM2.7，進一步驗證了其在工具調用、流程編排與任務交付中的穩定表現。

在面向真實辦公與知識工作交付能力的GDPval上，U2取得72.9分，展現出扎實的專業辦公能力。相比傳統問答式評測，GDPval更關注模型能否完成真實工作場景中的高價值交付，包括資料分析、報告撰寫、表格處理、圖表生成、幻燈片制作等典型辦公任務。

不難發現，U2并不是以單點能力取勝，而是在推理、代碼、Agent和辦公交付等多項關鍵能力上形成了系統性優異表現。U2的發布不只是一次常規的模型升級，更是云知聲在原生智能體大模型長跑中的一次關鍵落子。

U2的發布是云知聲十三年技術積累的里程碑式成果，也是大模型行業從“參數競賽”轉向“價值落地”的重要標志。其“高智能密度×高Token價值”的技術路線，既降低了大模型的應用門檻，也為AI賦能實體經濟、實現產業級落地提供了高效解決方案！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.