无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

華為昇騰向開發者彎腰了

0
分享至


文:王智遠 | ID:Z201440

5月22號,華為昇騰開發者大會。

有一場演講我印象挺深。周斌,昇騰計算產品部部長,講了30分鐘,就一件事:昇騰軟件生態怎么讓開發者用得順手。

他列了十幾項改進,全沖著一個目標去的:讓開發者愿意用。

這個發現挺有意思的。外面人聊芯片競爭,永遠在比算力,好像誰的算力大誰就贏,他翻過來在講另一件事:芯片做出來了,用起來太疼了。

怎么個疼法?他開場放了一組數據,開發者社區攢了一年的反饋。我翻譯成人話,就三句:

一,底層鎖太死,我施展不開。 二,編程方式太別扭,效率上不去。 三,主流開源社區的東西搬不過來,學習成本太高。

這三句話,往深了想,說的是一個更底層的東西。

AI開發者這幫人,過去十幾年是在NVIDIA的CUDA生態里泡大的。寫代碼用PyTorch,寫算子用Triton,部署用CUDA。社區里的教程、代碼庫、最佳實踐,全圍著這一套轉。

十幾年,練成肌肉記憶了。

你讓一個在CUDA體系里寫了五六年代碼的工程師,突然切到昇騰上。他要面對的,是換一套思維方式、一套開發習慣、一套查資料的路徑,以前踩過的坑、攢過的經驗、寫過的代碼,全部清零。

這個成本太高了。高到大部分人第一反應就是:算了。

所以開發者抱怨那三件事,本質上是一件事:華為芯片可能不錯,可我用起來太累了,這道墻,是CUDA用十幾年時間,一行代碼一行代碼砌起來的。

墻在這,怎么解決?周斌給的答案挺出乎意料。他說:你別學了,你原來咋寫,現在還咋寫。

先說算子編程。

算子這東西,是AI模型里最底層的計算單元,你可以當成蓋房子的磚。以前在NVIDIA上寫算子,主流用兩個工具:Triton和PyTorch;切到昇騰上,這兩樣都得重新學,很多人就卡在這一步,不來了。

周斌說,現在Triton的接口100%兼容了。你手里現有的Triton代碼,不用改,直接跑。

目前已經支持了600多個Triton算子,300多個Taichi算子,DeepSeek、千問這些主流模型的關鍵算子,全包了。

PyTorch那邊也一樣。2300多個API和上游社區對齊了,覆蓋大語言模型、多模態、推薦系統等五個主流場景。說人話就是:你在PyTorch社區學的寫法、用的接口,搬過來就能用。

他在講這些改進的時候,反復用一個詞:一致。API體驗一致、精度一致、內存占用一致、計算出來的結果也一致。這個詞念叨了好多遍。

「一致」這倆字,才是整件事的關鍵。

華為做的,是一個「讓你感覺不到切換」的替代品;開發者搬過來之后,手感和原來一樣,不用重新適應。

這個思路,現場有一個很直觀的演示。

中山大學的沈明華教授,帶了一個叫Flash Attention NPU的開源庫,專門幫昇騰加速注意力計算的東西。

演示過程特別簡單,左邊是GPU跑的代碼,右邊是昇騰NPU。沈教授干了三件事:一鍵安裝這個庫,把代碼拷過來,改一行代碼的引用來源。

三秒跑完,精度啥的和GPU那邊的誤差,在正常范圍內,這個庫已經發到PyPI(就是Python那個裝包平臺)上了,GitHub上也開源了。一鍵安裝,改一行代碼,無感切換。

同樣的「降門檻」思路,也體現在更多細節上。

以前一個算子要交付,開發者得準備七個文件,現在簡化成一個。Docker容器鏡像也上線了,云端開發環境也上了,聽著不性感,對每天寫代碼的人來說,省的是實打實的時間。

周斌還提了一個更底層的變化:昇騰在全面擁抱Python生態。

他們給底層的編程工具加了Python接口,又把復雜的底層指令封裝成了Python模板庫,還推出了一個原生支持Python的張量編程工具。

這些名字不重要,重點是方向:

AI開發者現在基本都用Python,華為就把自己的底層能力全部包上一層Python的殼。你不用學華為的語言,華為來學你的。

光說「你的語言我都兼容」,不夠。如果華為自己的軟件架構還是鐵板一塊,開發者進來也動不了手腳。

所以,周斌講的第二件大事,是華為對自己動了刀子。

CANN,這是昇騰整個軟件棧的地基,所有的計算、通信、算子開發,全長在這上面。去年華為把它全部開源了。

50多個源碼包全部給你打開,不給你看一眼就算完,運行時、算子編譯、通信庫、算子庫,每一層的接口都給你亮出來。

開源的意義在哪?

以前在昇騰上搞開發,像在一個關著門的房間里干活,墻上開了幾個窗口,你就只能從窗口遞東西進去。現在墻全拆了。

你想動哪一層就動哪一層,組件也能自己升級,不用牽一發而動全身。

再往上看芯片。昇騰從910B到950,這一代有一個重要變化,950在架構上多了一種計算單元。

周斌說,華為做了一套混合編程能力,開發者可以在同一個算子里,根據不同階段的特點,靈活切兩種編程方式。

遇到規則的、連續的計算,用一種,發揮高吞吐的優勢。遇到不規則的、離散的邏輯控制,換另一種,發揮靈活性。

聽著挺技術,翻譯過來就一句話:以前一把錘子敲所有釘子,現在工具箱里有扳手也有螺絲刀,看情況選。

通信這邊也有大變,大規模訓練和推理的時候,多個芯片之間要互相「說話」,這個環節經常卡脖子。

周斌說,現在把跨芯片的通信編程改成了像讀寫本地內存一樣的方式,一行代碼直達底層,通信下發延遲優化了30倍。

他們還搞了一個計算和通信融合的模板庫,開發者拿來就能用。融合算子的開發周期縮短50%,性能還能再提30%。50%和30%,做過程序的都懂是啥概念。

軟件棧上層也在拆,MindSpeed,就是那個大模型訓練加速套件。

周斌原話說,把原來大而全的方案拆開重構了,組件獨立解耦。拆完之后,開發者額外要適配的代碼量,從過去的上萬行,降到了百行級別。

MindIE,推理服務那邊也升級了,兩個數字比較扎眼:容器出故障后,恢復時間壓到了一分鐘以內;長視頻推理場景下,用了注意力稀疏加速,端到端性能提升超過40%。

MindStudio,工具鏈那邊全面開放底層API接口,支持二次開發,能對接第三方生態。

模型量化這塊,就是把大模型里那些精度很高的參數壓縮成低精度的,省內存還跑得快,新模型進來,量化效率提升了50%以上。

還有一個東西值得說說,MindSpore,華為自己的AI框架,這次也出了兩個新組件。

打個比方:

你在廚房做飯,每個菜單獨炒,鍋用完洗了再炒下一個,效率很低;聰明的廚師會把幾個菜的步驟合在一起,同時開兩三個灶眼,邊炒這個邊煮那個。

AI模型跑起來也是這回事,很多計算步驟其實可以合并著做,省掉中間的等待。

華為搞了一個叫AKG的組件,專門干這個事;它能自動把模型里可以合并的計算找出來,融合到一起跑,在30多個主流模型上都跑過了,加速效果明顯。

第二個組件叫HyperParallel。

現在大模型訓練動不動就是幾千張卡一起算,這些卡怎么分工、怎么配合,是個很復雜的排布問題。

HyperParallel幫你把這個復雜度藏起來了,開發者加一行代碼就能用上,MoE類型的模型,就是把大模型拆成一堆小專家,誰擅長誰上,可以提速10%以上。

這一串名字你不用記,記住一件事就行:

華為把自己的軟件棧,從底到頂,一層一層拆開了。拆開不為別的,讓外面的人能把手伸進來。

還有一件事值得單獨說:華為這次的策略里,有一條是「我去你家」,不等你來。

周斌專門講了華為在主流開源社區的投入。

vLLM,目前最主流的大模型推理框架,昇騰是里面唯一的國產硬件廠商;SGLang,另一個主流推理引擎,昇騰也是主倉里唯一的國產非GPU類廠商,代碼直接合入主干。

VERL,大模型強化學習的主流框架,華為在里面累計貢獻超過一萬行代碼,拿到了多個maintainer席位。

強化學習這塊華為下的注不輕;除了VERL,他們還跟vo、slim等好幾個社區建了官方合作,設備支持、特性開發、模型適配都在做。

還貢獻了一個叫transferQ的組件。這玩意干啥的?

大模型訓練時,數據在不同節點之間搬來搬去,搬運效率直接影響整體速度。transferQ就是專門優化這個搬運過程的,端到端性能能提升7%到20%。

這個組件現在已經成了VERL和其他幾個社區的核心基礎設施。

就好比,不光去別人家幫忙干活,你還帶了自己的工具箱,用完之后工具箱留在人家那了,大家都在用。這個融入的程度,不是蹭個名字掛個logo能比的。

注意,這些社區是開發者每天都在用的家伙;華為選擇去那里貢獻代碼、搞持續集成、拿維護者的身份,沒另起爐灶讓大家過來。

除了大模型訓推這塊,在搜索推薦這種AI最常用的場景上,華為也把整條鏈路都打通了;從芯片底層的本事,到開源的算子庫,全都適配好。已經在好幾個頭部互聯網公司跑起來了,真在用了。

再加上和高校合作共建的擴展庫,覆蓋了深度學習、智能駕駛、廣告推薦什么的。

所有,這些動作指向同一個意思:華為在拆自己的圍墻。拆墻比砌墻難,但拆完了,外面的人才進得來。

做到這一步,大部分人覺得差不多了吧。兼容了、開源了、社區也去了,開發者該來了吧。

周斌又加了一層。

他說華為搞了一套叫CANBot的算子開發工具,基于AI Agent。這玩意能干嘛?你告訴它你要什么算子,它自己去寫。

單個算子,從生成到部署,一天之內搞定;傳統人工干這活,差五倍以上效率。

往深了想,這事挺讓人感慨的,前面聊的三個問題,全在琢磨「怎么讓開發者少學點」。到這一步,連「學」這件事本身都快被跳過了。

華為還干了一件配套的事,他們把4000多名昇騰工程師多年攢的開發經驗,提煉成了200多個skills技能包。這些skills已經上線開源社區,開發者兩條命令就能調。

你可以這么理解:

以前你去一家陌生工廠干活,所有坑都得自己踩一遍。現在這家工廠把老師傅的經驗整理成了操作手冊,塞進了Agent里。你不用找老師傅請教,Agent替你問了。

這個思路不只在算子開發上。周斌說了,MindStudio工具鏈也在全面Agent化。

把專家的調試調優經驗轉化成Agent的skills,再讓多個Agent協同干活。實測下來,端到端開發流程提速超過50%。

同一個演講里,華為還出了一份算子的「教材」和「考試卷」。

「教材」就是算子數據集,里面各類算子數據都有,先把數據洗干凈,再把解題思路捋好。大模型拿這東西去學,學出來的效果自然更對路。

「考試卷」就是評測集,分了不同難度等級,覆蓋22類典型算子,內置4000多個考點。

合在一起什么意思?數據給你了,怎么考你也知道了,誰想學都能來比劃比劃。

這一步才是整場演講里最該注意的信號。前面那些改進,不管兼容、開源還是進社區,說到底都是在降低「人學昇騰」的成本。到這一步,開始變成「讓AI學昇騰」了。

如果AI自己就能寫出合格的昇騰算子,那開發者要「學」的東西,又少了一大塊。

國產AI芯片這仗,打到今天,最大的檻早就不在算力上了,是開發者愿不愿意坐到你這張桌子前面來。

周斌的意思,說到底就一句話:

讓芯片去適應開發者,別讓開發者伺候芯片;這道理聽著簡單。做起來呢?要學別人的話、去別人的地盤干活、把自家的門檻一道一道削平,最后還得把壓箱底的經驗全交出去。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
有料又勁爆!私飛+同框!這關系太頂了!

有料又勁爆!私飛+同框!這關系太頂了!

柚子說球
2026-05-21 23:00:00
廈門一小區新舊物業爭地盤,新物業帶20名保安沖入小區,沖突中七旬業主倒地昏迷,轄區派出所介入

廈門一小區新舊物業爭地盤,新物業帶20名保安沖入小區,沖突中七旬業主倒地昏迷,轄區派出所介入

大風新聞
2026-05-24 15:48:46
張海迪是個謎!她1955年出生,雖然曾患有多種疾病,但面色紅潤

張海迪是個謎!她1955年出生,雖然曾患有多種疾病,但面色紅潤

歲月有情1314
2026-05-23 01:19:55
山西煤礦爆炸事故已致82人遇難,涉事企業有重大違法行為

山西煤礦爆炸事故已致82人遇難,涉事企業有重大違法行為

時代周報
2026-05-24 00:13:11
副熱帶高壓發威,廣東持續高溫!個別市縣氣溫直沖38℃

副熱帶高壓發威,廣東持續高溫!個別市縣氣溫直沖38℃

南方都市報
2026-05-24 12:10:32
不裝了?特朗普訪華剛回去沒幾天,美財長喊話中國:還需要再談談

不裝了?特朗普訪華剛回去沒幾天,美財長喊話中國:還需要再談談

漫步獨行俠
2026-05-23 08:47:55
2-0橫掃世界第7!中國女網15歲新星進決賽沖冠:鄭欽文后繼有人

2-0橫掃世界第7!中國女網15歲新星進決賽沖冠:鄭欽文后繼有人

李喜林籃球絕殺
2026-05-24 09:43:33
“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

“你找媒體,我們就不幫你了”:30多萬買的問界,12天增程器壞了

番外行
2026-05-21 15:54:40
西甲大結局!赫羅納1-1降級,2年前還在爭冠,馬洛卡3-0也沒保級

西甲大結局!赫羅納1-1降級,2年前還在爭冠,馬洛卡3-0也沒保級

體育知多少
2026-05-24 07:47:32
國際足聯也慌了!原來除了中國,還有這么多國家不給世界杯買單了

國際足聯也慌了!原來除了中國,還有這么多國家不給世界杯買單了

八斗小先生
2026-05-06 18:05:58
捅破天了!烏克蘭血洗校園,普京宣布更大決定!

捅破天了!烏克蘭血洗校園,普京宣布更大決定!

大嘴說天下
2026-05-23 22:45:03
董路暴怒:為浮嶋敏洗地的不是球盲就是漢奸 你不瞎就不會替他說話

董路暴怒:為浮嶋敏洗地的不是球盲就是漢奸 你不瞎就不會替他說話

風過鄉
2026-05-24 13:47:48
“蛋白吃得好,醫院跑得少”,建議5種蛋白食物換著吃,增強體質

“蛋白吃得好,醫院跑得少”,建議5種蛋白食物換著吃,增強體質

春序娛樂
2026-05-23 21:04:38
丁太升評價《歌手2026》:竇靖童最驚喜,張碧晨最差,庾澄慶老了

丁太升評價《歌手2026》:竇靖童最驚喜,張碧晨最差,庾澄慶老了

糊咖娛樂
2026-05-23 18:41:55
帥惟浩加盟在即,王子銘太糙 約翰只會1種陣型 成都傷病潮

帥惟浩加盟在即,王子銘太糙 約翰只會1種陣型 成都傷病潮

替補席看球
2026-05-24 10:52:39
記者:樸鎮燮入選世界杯名單后,特意宴請浙江FC全隊聚餐慶祝

記者:樸鎮燮入選世界杯名單后,特意宴請浙江FC全隊聚餐慶祝

懂球帝
2026-05-24 08:18:08
紀委監委能恢復你多久前刪掉的微信?答案可能讓你睡不著覺

紀委監委能恢復你多久前刪掉的微信?答案可能讓你睡不著覺

黑哥講現代史
2026-05-21 13:52:20
解放臺灣以意想不到方式實現?專家建言:來一場新的“西安事變”

解放臺灣以意想不到方式實現?專家建言:來一場新的“西安事變”

神秘莫測的世界
2026-05-24 09:37:15
反轉!不少杰青可以睡安穩覺,耿同學明確表示,近期不會學術打假

反轉!不少杰青可以睡安穩覺,耿同學明確表示,近期不會學術打假

火山詩話
2026-05-23 05:42:26
情況不對勁,中國被曝已經斷供日本稀土4個月,日方還沒出現危機

情況不對勁,中國被曝已經斷供日本稀土4個月,日方還沒出現危機

愛看劇的阿峰
2026-05-24 00:30:05
2026-05-24 17:00:49
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
718文章數 171關注度
往期回顧 全部

科技要聞

我戴著攝像頭上班,正在幫AI搶走我飯碗

頭條要聞

夫妻婚后未同房 妻子:剛結婚時沒成功 第二次他很懊惱

頭條要聞

夫妻婚后未同房 妻子:剛結婚時沒成功 第二次他很懊惱

體育要聞

唐斯發牌,大頭逆襲:騎士跌向殘忍夏季

娛樂要聞

李晨鄭愷沖上熱搜!跑男停宣引熱議

財經要聞

爆炸致82人遇難 留神峪煤業存違法行為

汽車要聞

2027款星途瑤光上市 把"全球車"標準卷進13萬級市場

態度原創

教育
數碼
本地
健康
公開課

教育要聞

團團速遞|“天宮”迎來首位香港航天員

數碼要聞

OPPO Reno 16官宣AI鍵,一鍵閃記有多強?

本地新聞

用云錦的方式,打開江蘇南京

外泌體 ≠ 生長因子!它們之間究竟有何區別?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版