一邊是AI賽道黑馬DeepSeek得到國家集成電路產(chǎn)業(yè)投資基金、騰訊、寧德時代等多家巨頭青睞,極有可能刷新國產(chǎn)大模型單輪融資紀錄;另一邊是華為重磅發(fā)布韜(τ)定律,跳出摩爾定律桎梏重構(gòu)芯片發(fā)展邏輯。
看似兩家公司分處AI、半導(dǎo)體不同賽道,但底層都是用協(xié)同優(yōu)化,找到了中國科技的破局點。
DeepSeek打破AI規(guī)模縮放定律!
路透社6月3日報道,DeepSeek首輪融資額超過人民幣500億元,估值超過4000億,國家集成電路產(chǎn)業(yè)投資基金入局,騰訊和寧德時代將成為最大的外部投資者。這家從量化巨頭——幻方量化內(nèi)部孵化的AI企業(yè),長期依靠自有資金研發(fā)、堅持模型開源,不靠高價API收割利潤,為什么能獲得各路大佬青睞?
多年以來,全球AI行業(yè)長期信奉“更多數(shù)據(jù)+更多參數(shù)+更多GPU=更強模型”的AI規(guī)模縮放定律,只有一條路可以走——砸海量資金增加模型參數(shù)、囤上萬張高端GPU堆算力,訓(xùn)練成本動輒數(shù)千萬美元,再用高收費回本。
DeepSeek沒有輕信。2024年1月,DeepSeek還未發(fā)布AI大模型,就先以“長期主義視角”審視AI規(guī)模縮放定律,要描述“超參數(shù)”,尋找不同預(yù)算下,如何讓大模型在不同預(yù)算的情況下達到最佳性能(將成本、性價比概念引入AI大模型領(lǐng)域)。
這是DeepSeek的原始創(chuàng)新!
![]()
為了降低“最終成本”,DeepSeek在算法、訓(xùn)練模式、硬件和系統(tǒng)四個層面上進行了協(xié)同優(yōu)化。
在算法上,DeepSeek改進了MoE混合專家架構(gòu),每次推理只激活少數(shù)“專家”子系統(tǒng),用“精確調(diào)用”代替“全員上陣”。比如DeepSeek V3總參數(shù)量6710億,計算一個Token時僅激活370億參數(shù),極大提高了性價比。
在訓(xùn)練模式上,DeepSeek發(fā)明了顛覆性的GRPO算法,替代了傳統(tǒng)算法的“演員-評審”機制,即需要同時訓(xùn)練兩個模型,一個負責回答問題,另一個負責給回答打分反饋。GRPO不再需要評審模型,只按照規(guī)則對同一個問題的多個輸出打分,讓大模型跟自己回答的平均值博弈,找出“正確方向”。結(jié)果證明,該算法不但讓大模型涌現(xiàn)出推理能力,還極大降低了大模型的訓(xùn)練成本,研究成果登上《自然》雜志封面。
在硬件上,DeepSeek受制于美國的先進算力卡禁令,只能使用“閹割過的英偉達H800”,就寫出FlashMLA程序優(yōu)化硬件,讓大模型使用H800內(nèi)存帶寬的能力,從平均60%提升到95%。
在系統(tǒng)層面,DeepSeek發(fā)明DualPipe,給整個系統(tǒng)裝上了GPU監(jiān)工,時刻“鞭笞”閑置算力,將GPU利用率提升30%以上。DeepSeek 還推出了DeepEP,全球首個專門針對MoE的并行通信庫,優(yōu)化跨節(jié)點通信,確保協(xié)同的效率最大化。
結(jié)果肉眼可見:同等性能下,DeepSeek推理定價僅為歐美大廠幾十分之一!美國用戶驚呼,改用DeepSeek V4以后,不但效果更好,而且費用降低90% +!
而且大模型開源之后,帶動了整個AI行業(yè)的再次重構(gòu),雖然用了大量前人的技術(shù)和代碼,但DeepSeek確實是一次重大的原始創(chuàng)新。實際上所有原始創(chuàng)新都是源于組合創(chuàng)新。
![]()
華為韜定律顛覆摩爾定律!
5月25日,華為半導(dǎo)體總裁何庭波在國際電路研討會上正式發(fā)布韜(τ)定律,全球半導(dǎo)體行業(yè)劇烈震蕩,外媒直言中國走出繞開EUV封鎖的芯片自主新路。
韜(τ)定律是華為的原始創(chuàng)新!
原始創(chuàng)新之處在于,第一次提出要把“韜(τ)定律”作為技術(shù)進化的主要方向。之所以可以稱之為原始創(chuàng)新,這是因為主攻方向的不同,會產(chǎn)生完全不同的發(fā)展路徑。
過去數(shù)十年,摩爾定律主導(dǎo)全球芯片發(fā)展:靠不斷縮小晶體管物理尺寸、攻堅EUV光刻機向下沖刺先進制程,7nm、5nm、3nm芯片研發(fā)成本指數(shù)級暴漲,3nm晶圓廠建設(shè)成本百億起步,行業(yè)紅利逐漸淪為蘋果、英偉達等巨頭專屬,再加上對華封鎖高端EUV設(shè)備,國內(nèi)芯片在這條賽道上處處受限。
韜定律另辟蹊徑:放棄空間微縮,轉(zhuǎn)向時間微縮,搭建晶體管-電路-芯片-系統(tǒng)四層全棧優(yōu)化體系。縮小晶體管不是目的,更高的算力密度和更短的信號傳播時間才是。
在電路層,華為獨創(chuàng)邏輯折疊技術(shù),把平鋪的芯片電路像折紙一樣立體對折,如同《盜夢空間》里折疊的都市,線路長度縮短30%。
在芯片層,華為進行軟件、架構(gòu)、芯片的三者協(xié)同,也就是根據(jù)實際任務(wù)需求來調(diào)配芯片內(nèi)部的資源,砍掉一切不必要的等待。
在系統(tǒng)層,華為自研靈衢總線,統(tǒng)一系統(tǒng)內(nèi)部的協(xié)議體系,解決計算節(jié)點間的割裂問題,將系統(tǒng)通信延遲從幾十微秒降到約100納秒,降低了時間延遲近500倍。在靈衢總線之上,華為還發(fā)明了Hi-ONE光互連引擎,用光替代銅傳輸數(shù)據(jù),單模塊帶寬高達8Tb/s,能讓數(shù)萬張GPU像一臺機器一樣協(xié)同工作。
韜定律要想開枝散葉樹大根深,還需要建設(shè)共享的供應(yīng)鏈生態(tài),在四層優(yōu)化的體系中,每一層都能帶動半導(dǎo)體產(chǎn)業(yè)鏈的再次重構(gòu)。從這個角度來說,提出韜定律無疑是一次原始創(chuàng)新。
華為將在2026年秋季發(fā)布麒麟2026手機芯片,靠韜定律+邏輯折疊技術(shù),將峰值主頻提升到3.1GHz,晶體管密度提升53.5%達到每平方毫米2.38億顆晶體管,在不依賴海外先進光刻制程的前提下,綜合水準對標行業(yè)3nm旗艦芯片!
華為測算,依托韜定律,2031年成熟制程芯片即可實現(xiàn)等效1.4nm先進制程水準,打破“先進芯片必須依賴EUV”的藩籬。
![]()
中國的創(chuàng)新哲學(xué)
DeepSeek和華為韜定律,最大的相似之處不是具體技術(shù),而是與美國不同的創(chuàng)新哲學(xué)。
從AI規(guī)模縮放和摩爾定律來看,美國科技追求系統(tǒng)產(chǎn)出,毫不在乎用了多少資源,很像西方古代的粗放農(nóng)業(yè)模式——靠擴大耕種面積提高產(chǎn)出。
中國科技則在追求系統(tǒng)產(chǎn)出/資源占用之比,像中國古代農(nóng)業(yè)的精耕細作——優(yōu)化堆肥、施肥、選種、育種、耕作、整地、除草、耘田、追肥、灌溉、收獲的每個環(huán)節(jié),增加土地肥力,增加莊稼的產(chǎn)量。
DeepSeek和華為都從“最微觀”的單元上改起。DeepSeek改進MoE算法,按需調(diào)用少量參數(shù);華為用邏輯折疊縮短芯片內(nèi)部電路節(jié)點之間的距離。他們都在打通全鏈條所有環(huán)節(jié)統(tǒng)籌調(diào)配,統(tǒng)一通信協(xié)議,優(yōu)化信息傳遞,減少互聯(lián)損耗,“逐一挖掘”每個部分的剩余性能,從“縫隙”里摳出“性價比”,全力增加總產(chǎn)出。
簡而言之,無法在資源規(guī)模上取勝時,就用協(xié)同優(yōu)化在系統(tǒng)效率上重構(gòu)游戲規(guī)則。
這可能就是中國科技破局的關(guān)鍵!
而協(xié)同優(yōu)化的思想源頭,與錢學(xué)森首創(chuàng)的系統(tǒng)論非常接近。
錢學(xué)森認為,系統(tǒng)比零件更重要,整體最優(yōu)優(yōu)于局部最優(yōu),總體設(shè)計決定成敗,復(fù)雜系統(tǒng)依賴反饋和協(xié)同,現(xiàn)代國家競爭越來越是系統(tǒng)與系統(tǒng)之間的競爭。
錢學(xué)森特別強調(diào),抓系統(tǒng)主要矛盾,而不是抓局部指標,就是從“極限突破”轉(zhuǎn)向“協(xié)同突破”。
錢學(xué)森在中國航天體系中實踐了他的系統(tǒng)論思想,比如專門負責協(xié)同優(yōu)化的總體設(shè)計部制度,能將一項大型工程里的上萬名工程師、數(shù)百家協(xié)作單位和供應(yīng)商擰成一股繩攻堅克難!
直到今天,中國的各種大型項目里都能看到系統(tǒng)論的影子,而且這種思想還被引入了國家治理體系之中,比如頂層設(shè)計和整體謀劃的概念,統(tǒng)籌多產(chǎn)業(yè)發(fā)展布局、銜接中長期發(fā)展目標的五年規(guī)劃。這已成為東方不同于西方的典型特色。
外國人總驚訝中國的長期主義、戰(zhàn)略遠見和革新魄力,實際上中國人都知道“不謀萬世者,不足謀一時;不謀全局者,不足謀一域”,正因如此,我們才能協(xié)同起來下好“全國一盤棋”。
中國創(chuàng)新哲學(xué)是中華文明孕育出的超級基因,讓世界尖端科技博弈的關(guān)鍵,不再是單一指標的極限沖刺,而是協(xié)同優(yōu)化的破局能力。當西方還在沿用“粗放模式”瘋狂卷資本時,華為與DeepSeek 已經(jīng)用原始創(chuàng)新的累累碩果證明,中國不再簡單追趕,我們開始原始創(chuàng)新。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.