无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

摩爾線程MusaCoder開源:性能比肩國際SOTA

0
分享至


KernelBench評測性能超越Claude Opus 4.7等國際主流SOTA代碼模型。

本文為IPO早知道原創

作者|Stone Jin

據IPO早知道消息,摩爾線程近日正式發布并開源面向GPU底層算子生成的專用代碼大模型MusaCoder。這是業內首個基于國產GPU算力底座完成全鏈路訓練與驗證的開源代碼大模型,其完整后訓練流程均在基于MTT S5000構建的夸娥智算集群上完成。在KernelBench嚴格評測中,MusaCoder-27B-RL以Overall Pass@8 93.2%、Avg.@8 88.60%的成績,超越Claude Opus 4.7、GLM-5.1、DeepSeek-V4 Pro、Kimi K2.6等主流SOTA代碼模型,展現出在GPU原生Kernel生成任務上的領先性能。


專為GPU設計的高性能算子生成模型

MusaCoder是摩爾線程面向GPU底層算子生成任務設計的專用代碼大模型,包含9B和27B兩個參數規模。該模型重點支持從PyTorch標準算子自動生成高性能CUDA/MUSA原生Kernel代碼,旨在降低開發者手寫底層GPU算子的門檻,提升GPU高性能計算場景下的代碼生成、驗證和優化效率。

傳統代碼大模型雖然具備較強的通用編程能力,但在GPU Kernel生成任務中仍面臨顯著挑戰:一方面,GPU Kernel 對并行計算、線程組織、內存訪問、索引映射和硬件執行特性要求極高;另一方面,生成代碼不僅要語法正確,還必須能夠通過編譯、數值正確性驗證、反作弊檢測,并在真實執行中獲得性能收益。


針對上述難點,MusaCoder構建了一套面向GPU原生算子(CUDA/MUSA)生成的大模型全棧后訓練方法論。該流程覆蓋數據構建、執行驗證、強化學習優化等關鍵環節,使模型能夠從基礎代碼能力逐步進化為具備底層算子生成與修復能力的專用模型。

在數據構建階段,MusaCoder 通過結構化推理過程和顯式 Shape 信息注入,增強模型對張量形狀、內存布局和索引關系的理解,解決從通用代碼能力遷移到 GPU Kernel 生成任務時的冷啟動問題。

在評測與訓練環境方面,摩爾線程構建了MooreEval 分布式執行驗證系統。MooreEval 能夠對模型生成的代碼進行自動編譯、執行、正確性驗證、性能測試和反作弊檢測,并將結果轉化為穩定的訓練反饋信號。這使得模型不僅能學習“寫出能運行的代碼”,還能夠進一步學習“寫出正確、合法且更高效的原生 GPU Kernel”。

在強化學習階段,MusaCoder針對GPU Kernel生成任務中的多輪修復、訓練穩定性和長尾困難樣本等問題,引入了PrimeEcho、MirrorPop和BDR等機制,用于提升模型在多輪調試場景下的修復能力和訓練穩定性。通過這些方法,MusaCoder打通了從基礎代碼微調到執行反饋強化學習的完整優化閉環。

核心成果:正確率與真實加速能力雙提升

在MooreEval執行式驗證協議下,MusaCoder-27B-RL在KernelBench評測中取得了顯著領先表現。


從正確率來看,MusaCoder-27B-RL的Overall Pass@8達到93.2%,Avg.@8達到88.60%,均超過Claude Opus 4.7的87.2%和77.30%。在更具挑戰性的Level 3任務上,MusaCoder-27B-RL的優勢更加明顯。Level 3任務通常涉及復雜shape推導、索引映射和多算子組合,對模型的底層代碼理解能力和調試能力提出了更高要求。在該難度級別上,MusaCoder-27B-RL的Pass@8和Avg.@8分別領先Claude Opus 4.7的18個百分點和26.5個百分點。

此外,在MooreEval標準下,只有同時通過正確性驗證、合法性檢查,并且相比PyTorch baseline獲得有效加速的候選實現,才會被計入 Faster Rate。MusaCoder-27B-RL的Overall Faster Rate達到15.0%(vs. PyTorch Eager)和9.2%(vs. torch.compile),分別高于Claude Opus 4.7的11.8%和7.5%。

這表明MusaCoder不僅能夠更穩定地生成正確的GPU Kernel,也更有能力生成具備實際性能收益的原生算子代碼。

國產GPU完成全流程后訓練

驗證夸娥智算集群能力

MusaCoder模型的SFT(監督微調)、RFT(拒絕采樣微調)、RL(強化學習)、異步rollout、在線編譯執行驗證及reward計算等全棧訓練與驗證流程,均依托摩爾線程旗艦級AI訓推一體智算卡MTT S5000所構建的夸娥智算集群完成。

這一成果,充分驗證了國產GPU不僅能夠支撐大模型推理和常規微調任務,更能夠穩定承載代碼大模型后訓練全周期算力需求。尤其是在GPU Kernel生成這一類任務中,訓練系統需要頻繁進行代碼生成、編譯、執行、驗證和反饋計算,對硬件、編譯棧、運行時、調度系統和評測基礎設施都提出了更高要求。

MusaCoder的成功實踐,將一次模型訓練驗證沉淀為可復用的工程范式:不僅為AI Coding、AI Infra等基礎設施的自主可控提供了實踐范例,也展現了摩爾線程在AI軟件棧、訓練平臺、評測系統和開源模型生態方面的完整工程支撐能力。

共建開放生態

推動國產AI創新與應用

MusaCoder的正式開源,旨在為MUSA生態提供面向PyTorch到原生算子生成的基礎模型能力,幫助開發者更高效地完成GPU Kernel 的生成、驗證、修復和優化,降低底層算子開發門檻。

同時,MusaCoder也為高校、科研機構和開源社區提供了一個基于國產全功能GPU的代碼生成研究平臺,推動異構計算編程、AI編譯優化和自動化Kernel生成等方向的開放研究與技術交流。

未來,摩爾線程將持續增強MusaCoder在復雜任務上的生成與修復能力,并進一步探索與IDE插件、自動調試工具、profiling工具等開發者工具鏈的結合,逐步形成從PyTorch參考實現到MUSA原生Kernel的自動生成、驗證、修復和優化閉環,持續推動國產GPU生態建設與AI基礎設施創新。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
少林寺新任住持釋印樂,上任才10個月,少林寺被曝一下少800多萬

少林寺新任住持釋印樂,上任才10個月,少林寺被曝一下少800多萬

嘆為觀止易
2026-06-10 11:49:16
上映16天被觀眾趕出院線!網播也救不了它,事實證明爛片已無市場

上映16天被觀眾趕出院線!網播也救不了它,事實證明爛片已無市場

星宿影視鴨
2026-06-11 14:45:57
劉宇寧發文回應戀情:清醒坦蕩的態度,才是明星該有的模樣

劉宇寧發文回應戀情:清醒坦蕩的態度,才是明星該有的模樣

陳意小可愛
2026-06-13 00:50:31
X航空公司空姐疑似偷拍同事,令人不齒啊。

X航空公司空姐疑似偷拍同事,令人不齒啊。

微微熱評
2026-06-12 12:04:32
墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

舊事別提
2026-06-12 07:09:01
普京再次回應戰爭起源:不是俄開戰,是基輔先向頓巴斯開火

普京再次回應戰爭起源:不是俄開戰,是基輔先向頓巴斯開火

桂系007
2026-06-12 23:57:08
捷克球迷怒斥韓國!沒有裁判你們贏不了,如果輸給了中國我們認了

捷克球迷怒斥韓國!沒有裁判你們贏不了,如果輸給了中國我們認了

酷侃體壇
2026-06-12 18:57:01
存款去哪了?居民存款連續兩個月減少:合計縮水超2萬億元

存款去哪了?居民存款連續兩個月減少:合計縮水超2萬億元

南方都市報
2026-06-12 20:36:03
草臺班子?世界杯開幕式離譜翻車:大力神杯氣球漏氣 當眾癟掉降落

草臺班子?世界杯開幕式離譜翻車:大力神杯氣球漏氣 當眾癟掉降落

風過鄉
2026-06-13 05:35:13
伊朗外長披露伊美諒解備忘錄草案部分內容

伊朗外長披露伊美諒解備忘錄草案部分內容

新華社
2026-06-13 05:57:02
訂單太多?特斯拉中國:Model 3 全系...

訂單太多?特斯拉中國:Model 3 全系...

新浪財經
2026-06-12 22:30:54
伊朗外長稱伊美“從未如此接近達成”諒解備忘錄

伊朗外長稱伊美“從未如此接近達成”諒解備忘錄

界面新聞
2026-06-12 23:09:38
臺軍首次在西部海岸,朝中國大陸方向射擊30枚海馬斯火箭彈。

臺軍首次在西部海岸,朝中國大陸方向射擊30枚海馬斯火箭彈。

果媽聊娛樂
2026-06-12 11:56:07
男子受邀高壓電線桿上安監控,觸電身亡留下兩名未成年孩子,河北遷西縣多部門組成核查組

男子受邀高壓電線桿上安監控,觸電身亡留下兩名未成年孩子,河北遷西縣多部門組成核查組

大風新聞
2026-06-12 17:58:06
一聲嘆息,林詩棟、溫瑞博都止步薩格勒布16強,都輸得很不服氣

一聲嘆息,林詩棟、溫瑞博都止步薩格勒布16強,都輸得很不服氣

真理是我親戚
2026-06-13 01:25:43
重磅!中超第1身價突然加盟,球迷:偉大的簽約,城市集團太猛了

重磅!中超第1身價突然加盟,球迷:偉大的簽約,城市集團太猛了

足球大腕
2026-06-12 23:25:25
厄爾尼諾正式登場,這個冬天天氣要亂套了

厄爾尼諾正式登場,這個冬天天氣要亂套了

字節漫游指南
2026-06-12 05:14:39
中國連續取消兩場會議,歐盟外長惹怒所有人,法德討論對其削權

中國連續取消兩場會議,歐盟外長惹怒所有人,法德討論對其削權

流史歲月
2026-06-12 16:50:04
“SpaceX沒說,但所有線索都指向中國”

“SpaceX沒說,但所有線索都指向中國”

觀察者網
2026-06-12 09:23:04
馬斯克正式成為人類首個10000億美元富豪,還帶動約400名員工成為億萬富翁;這些錢每小時花100萬美元、24小時不停,需要超114年才能花完

馬斯克正式成為人類首個10000億美元富豪,還帶動約400名員工成為億萬富翁;這些錢每小時花100萬美元、24小時不停,需要超114年才能花完

極目新聞
2026-06-12 22:28:06
2026-06-13 06:56:49
IPO早知道 incentive-icons
IPO早知道
IPO情報專家。
7034文章數 2412關注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

伊美諒解備忘錄草案部分內容披露 涉及撤軍、戰爭賠償等

頭條要聞

伊美諒解備忘錄草案部分內容披露 涉及撤軍、戰爭賠償等

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

房產
手機
教育
數碼
時尚

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

手機要聞

蘋果iOS 27、macOS 27新系統暗示,兩款Ultra級新品即將到來!

教育要聞

高考出分后,24小時內做好這7件事!

數碼要聞

英國監管機構警告:亞馬遜、eBay仍在售可能致命的假冒手機充電器

夏天別總穿一身白或一身黑!試試一半彩色、一半基礎色,高級亮眼

無障礙瀏覽 進入關懷版