[中國,北京,2025年5月23日]鯤鵬昇騰開發(fā)者大會2025——昇騰AI開發(fā)者峰會2025在北京中關村國際創(chuàng)新中心召開。本次峰會以“與時代 共昇騰?攜手全球開發(fā)者一起向上”為主題,聚焦最前沿的AI技術趨勢、熱門行業(yè)應用開發(fā)實踐,以及頂尖AI學者和企業(yè)家的高端對話,致力于為開發(fā)者打造一場高規(guī)格的思想盛宴。峰會帶來多項重磅技術升級,通過構建全面開放的創(chuàng)新生態(tài)與極致效能的算力底座,攜手全球開發(fā)者加速AI技術向千行萬業(yè)滲透,以智能算力革命重塑產(chǎn)業(yè)創(chuàng)新范式。
華為ICT Marketing部部長周軍在致辭中表示,華為將圍繞昇騰,堅持技術創(chuàng)新,聚焦模型趨勢,打造更高效的AI算力系統(tǒng);堅持深度開放,聚焦易用好用,打造更豐富的AI開發(fā)體系;堅持共同成長,聚焦人才培養(yǎng),打造更健康的AI產(chǎn)業(yè)未來。
在主題演講環(huán)節(jié),華為昇騰計算業(yè)務總裁張迪煊圍繞“一起昇騰 共綻光芒”解讀了昇騰AI的前沿創(chuàng)新技術。
昇騰異構計算架構CANN作為本次峰會技術焦點之一,張迪煊著重介紹了其通過分層開放架構,為AI創(chuàng)新按下“加速鍵”。他談到,當前,CANN開源算子加速庫、通信算法、AscendC、集合通信庫等組件已在Gitee社區(qū)上線260+算子、10+通信算法參考樣例,顯著提升開發(fā)效率。同時,runtime運行時的開放,提供底層原子級能力,支持靈活組合,充分釋放硬件性能潛力。在生態(tài)建設上,通過畢昇編譯器的升級與開放,實現(xiàn)與Triton、FlagTree等第三方編程框架的無感對接。截至目前,昇騰已攜手互聯(lián)網(wǎng)、運營商、金融等30多個伙伴,創(chuàng)新開發(fā)260多個高性能算子,大幅提升業(yè)務場景性能表現(xiàn)。此外,CANN持續(xù)升級,在計算加速、通信加速、內(nèi)存優(yōu)化三大領域協(xié)同發(fā)力,不斷突破算力瓶頸、優(yōu)化數(shù)據(jù)傳輸效率、提升資源利用效能,推動人工智能應用邁向更廣闊天地。
峰會上全新發(fā)布的昇騰算子模板庫CATLASS可提供從接口調(diào)用到單條指令的多層可復用模板,基于Gitee開源20+高性能算子樣例,成功將Matmul算子開發(fā)周期從4周縮短至2周,極大降低開發(fā)成本與時間。
針對制約AI發(fā)展的集群算力瓶頸,昇騰384超節(jié)點顛覆傳統(tǒng)計算范式,創(chuàng)新提出了對等計算架構,并把總線從服務器內(nèi)部,擴展到整機柜、甚至跨機柜,從而解決了集群互聯(lián)瓶頸。采用業(yè)界最大規(guī)模的384卡高速總線互聯(lián)體系,對比傳統(tǒng)以太,通信帶寬提升15倍,單跳通信時延降低了10倍,使大規(guī)模集群如同單一計算機般運行流暢,整體訓練性能較傳統(tǒng)方案提升3倍,顯著加速模型訓練效率。
深度思考模型引發(fā)推理能力爆發(fā),Tokens成為衡量AI智能水平的新量綱。面對復雜任務,MoE模型憑借大規(guī)模專家并行(大EP)機制,實現(xiàn)“一份投入N份輸出”,成為推理最優(yōu)解。昇騰率先推出大規(guī)模專家并行方案,全新發(fā)布MindIEMotor推理服務加速庫,通過動態(tài)專家冗余與親和調(diào)度技術均衡負載,結合AutoPD分離部署智能調(diào)配Prefill/Decode資源,同時可基于精細異步調(diào)度使服務化吞吐達到模型峰值的93%。同時,依托三重RAS防護體系將推理實例MTTR從小時級縮短至7分鐘。此外,昇騰基于業(yè)界唯一的384超節(jié)點架構,通過全高速總線互聯(lián)實現(xiàn)專家一卡一域分布,突破性達成Decode時延15ms的極致性能,在同等50ms時延下單卡吞吐達傳統(tǒng)集群4倍。
"我們正站在AI普惠化的關鍵轉折點。"張迪煊強調(diào),除了昇騰社區(qū),昇騰還以開放姿態(tài)共建AI生態(tài):硬件層面開放模組、板卡及參考設計,推動硬件多樣化創(chuàng)新;軟件生態(tài)通過0day支持主流開源模型、深度優(yōu)化PyTorch/vLLM等框架,加速訓練與推理創(chuàng)新落地;同時積極聯(lián)動魔搭、啟智、Gitee等開發(fā)者社區(qū),整合共享適配模型、工具及源碼資源,大幅降低開發(fā)門檻,助力生態(tài)成果高效轉化應用。
會上,華南理工大學計算機科學與工程學院教授、博士生導師陸璐現(xiàn)場演示昇騰CANN算子模板庫CATLASS的使用,展示如何通過自定義模板編程釋放Ascend C高性能算子開發(fā)潛能。華南理工算力并行加速團隊致力于昇騰平臺核心算子性能優(yōu)化,通過模板庫和編譯優(yōu)化等技術手段,使大模型訓練推理一體化算子的開發(fā)更加簡單高效,持續(xù)推動完善昇騰生態(tài)體系。
科大訊飛星火大模型訓練工程資深技術專家張海俊現(xiàn)場分享了基于昇騰超節(jié)點架構的MoE模型訓練實踐,過去一年,訊飛完成了長思考強化學習、MoE訓練推理等多個關鍵技術在昇騰算力底座上的突破和率先應用,未來,將攜手昇騰和廣大開發(fā)者,繼續(xù)全力推進自主創(chuàng)新的星火大模型研發(fā)迭代,通過算法與算力的協(xié)同創(chuàng)新優(yōu)化,構建技術領先優(yōu)勢,加速行業(yè)應用落地。
清華大學博士生、vLLM社區(qū)Maintainer游凱超帶來開源社區(qū)的最新動態(tài),通過與昇騰的全面技術合作,共建更加繁榮的生態(tài)。面向未來,vLLM和昇騰將進一步深化技術創(chuàng)新,通過結合vLLM社區(qū)極速至簡的推理框架和昇騰穩(wěn)定、可靠、高性能的硬件能力,為廣大用戶和開發(fā)者提供更極致的大模型推理體驗。
峰會上,昇騰AI創(chuàng)新大賽2025啟動儀式隆重舉辦,該賽事旨在激發(fā)全球開發(fā)者的創(chuàng)新活力,推動昇騰AI在各行業(yè)的應用落地。大賽設置豐厚獎項與資源支持,鼓勵開發(fā)者基于昇騰平臺開發(fā)前沿AI解決方案。
圓桌討論環(huán)節(jié),科大訊飛副總裁、AI工程院院長潘青華、硅基流動創(chuàng)始人& CEO袁進輝、北京大學信息工程學院助理教授&博士生導師袁粒、清昴智能創(chuàng)始人& CEO關超宇等五位行業(yè)領軍者圍繞“AI技術不斷突破,如何更好地助力全產(chǎn)業(yè)開發(fā)者創(chuàng)新?”展開深度對話。現(xiàn)場,與會嘉賓立足不同行業(yè)、不同視角的見解相互交織,在智慧的交流探討中激發(fā)行業(yè)前沿認知,共同勾勒出AI技術與開發(fā)者生態(tài)共生共榮的壯闊圖景,探尋產(chǎn)業(yè)創(chuàng)新發(fā)展的全新路徑。
昇騰AI開發(fā)者峰會2025以技術突破與生態(tài)共榮為錨點,展現(xiàn)了AI算力從底層架構到行業(yè)落地的全鏈條革新。通過CANN的分層開放、超節(jié)點架構的極致效能,以及MindSpeed RL、MoE并行推理等前沿工具的發(fā)布,昇騰正為全球開發(fā)者構建“所想即所得”的創(chuàng)新土壤。從高校實驗室到產(chǎn)業(yè)一線,從開源社區(qū)到商業(yè)場景,昇騰生態(tài)的蓬勃生長印證了“與時代共昇騰”的愿景。在這場AI的角逐長跑中,昇騰愿攜手更多開發(fā)者共同構建生態(tài)厚度、挖掘技術深度,一起昇騰,共綻光芒。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.