4月8日,智譜正式上線并開源新一代旗艦模型GLM-5.1。作為目前全球最強的開源模型,GLM-5.1在長程任務(Long Horizon Task)處理能力上實現(xiàn)了顯著突破。壁仞科技(06082.HK)壁礪?166系列產(chǎn)品在模型發(fā)布當日率先完成適配,成為國內(nèi)首批適配GLM-5.1的國產(chǎn)GPU廠商之一。
![]()
GLM-5.1基于BR166芯片完成推理任務
針對GLM-5.1的744B MoE架構(gòu)、200K長上下文、DSA稀疏注意力等核心特性,壁仞科技開展全棧深度優(yōu)化;依托自研芯片的高算力優(yōu)勢與BIRENSUPA?軟件棧的算子級深度協(xié)同能力,基于vLLM、SGLang兩大主流開源框架,精準適配40B激活參數(shù)與Interleave Thinking交叉推理模式,實現(xiàn)200K上下文無損推理。同時,通過MoE調(diào)度、稀疏計算、Tensor Parallel、Context Parallel、MTP等多重優(yōu)化技術(shù),實現(xiàn)低時延、高吞吐的高效推理。
壁礪?166系列為數(shù)據(jù)中心大算力訓推一體芯片,可滿足萬億參數(shù)模型需求,廣泛應用于大語言模型、多模態(tài)AIGC、圖像與語音處理等領域。憑借卓越的技術(shù)成熟度與出色的開箱即用特性,壁礪?166系列產(chǎn)品可顯著降低開發(fā)者的模型部署與應用門檻,以全棧化能力助力國產(chǎn)SOTA(目前最佳)大模型規(guī)模化落地,推動AI應用普惠向?qū)崱?/p>
關于GLM-5.1的官方介紹
相比于GLM-5,GLM-5.1的整體能力得到了全面提升,并在長程任務(Long Horizon Task)處理能力上實現(xiàn)了顯著突破。有別于當前以分鐘級交互為主的模型,GLM-5.1能夠在單次任務中持續(xù)、自主地工作長達8小時,憑借自主規(guī)劃、執(zhí)行與迭代進化,最終交付完整的工程級成果。
一、綜合性能SOTA
GLM-5.1是智譜迄今最智能的旗艦模型,也是目前全球最強的開源模型。下圖是業(yè)內(nèi)最具代表性的三個代碼評測基準的平均結(jié)果,包括衡量模型專業(yè)級軟件開發(fā)工作的SWE-Bench Pro、像工程師一樣操作命令行解決問題的Terminal-Bench 2.0、從零構(gòu)建完整代碼倉庫的NL2Repo。三項綜合平均分,GLM-5.1取得全球模型第三、國產(chǎn)模型第一、開源模型第一的成績。
![]()
在最接近真實軟件開發(fā)的SWE-bench Pro基準測試中,GLM-5.1刷新全球最佳成績,超過GPT-5.4、Claude Opus 4.6。
![]()
二、你睡覺的8小時,是模型上班的8小時
過去兩年,行業(yè)用Benchmark衡量模型有多智能。GLM團隊認為,下一階段的衡量標準應該是“能工作多久”,即模型在長程任務(Long-Horizon Task)中的表現(xiàn)。在METR榜單的同等評估標準下,GLM-5.1是唯一達到8小時級持續(xù)工作的開源模型,也是全球范圍內(nèi)除Claude Opus 4.6外少數(shù)具備這一能力的模型。
國產(chǎn)算力的快速適配能力,是大模型落地的核心支撐,也是國產(chǎn)AI產(chǎn)業(yè)崛起的核心引擎。目前,壁仞科技已具備與全球前沿算法協(xié)同進化的能力,并成為業(yè)內(nèi)極少數(shù)全面適配SOTA大模型的國產(chǎn)算力廠商之一。壁仞科技將持續(xù)深化與國產(chǎn)大模型廠商合作,讓開發(fā)者與客戶在第一時間擁抱全球最前沿模型能力,推動國產(chǎn)大模型從“技術(shù)領先”邁向“應用領先”,共建開放繁榮、自主可控的人工智能產(chǎn)業(yè)生態(tài)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.