協(xié)同優(yōu)化，中國科技創(chuàng)新的破局點！

2026-06-05 23:48:55　來源: 宋鴻兵

北京舉報

分享至

一邊是AI賽道黑馬DeepSeek得到國家集成電路產(chǎn)業(yè)投資基金、騰訊、寧德時代等多家巨頭青睞，極有可能刷新國產(chǎn)大模型單輪融資紀錄；另一邊是華為重磅發(fā)布韜（τ）定律，跳出摩爾定律桎梏重構(gòu)芯片發(fā)展邏輯。

看似兩家公司分處AI、半導(dǎo)體不同賽道，但底層都是用協(xié)同優(yōu)化，找到了中國科技的破局點。

DeepSeek打破AI規(guī)模縮放定律！

路透社6月3日報道，DeepSeek首輪融資額超過人民幣500億元，估值超過4000億，國家集成電路產(chǎn)業(yè)投資基金入局，騰訊和寧德時代將成為最大的外部投資者。這家從量化巨頭——幻方量化內(nèi)部孵化的AI企業(yè)，長期依靠自有資金研發(fā)、堅持模型開源，不靠高價API收割利潤，為什么能獲得各路大佬青睞？

多年以來，全球AI行業(yè)長期信奉“更多數(shù)據(jù)+更多參數(shù)+更多GPU=更強模型”的AI規(guī)模縮放定律，只有一條路可以走——砸海量資金增加模型參數(shù)、囤上萬張高端GPU堆算力，訓(xùn)練成本動輒數(shù)千萬美元，再用高收費回本。

DeepSeek沒有輕信。2024年1月，DeepSeek還未發(fā)布AI大模型，就先以“長期主義視角”審視AI規(guī)模縮放定律，要描述“超參數(shù)”，尋找不同預(yù)算下，如何讓大模型在不同預(yù)算的情況下達到最佳性能（將成本、性價比概念引入AI大模型領(lǐng)域）。

這是DeepSeek的原始創(chuàng)新！

為了降低“最終成本”，DeepSeek在算法、訓(xùn)練模式、硬件和系統(tǒng)四個層面上進行了協(xié)同優(yōu)化。

在算法上，DeepSeek改進了MoE混合專家架構(gòu)，每次推理只激活少數(shù)“專家”子系統(tǒng)，用“精確調(diào)用”代替“全員上陣”。比如DeepSeek V3總參數(shù)量6710億，計算一個Token時僅激活370億參數(shù)，極大提高了性價比。

在訓(xùn)練模式上，DeepSeek發(fā)明了顛覆性的GRPO算法，替代了傳統(tǒng)算法的“演員-評審”機制，即需要同時訓(xùn)練兩個模型，一個負責回答問題，另一個負責給回答打分反饋。GRPO不再需要評審模型，只按照規(guī)則對同一個問題的多個輸出打分，讓大模型跟自己回答的平均值博弈，找出“正確方向”。結(jié)果證明，該算法不但讓大模型涌現(xiàn)出推理能力，還極大降低了大模型的訓(xùn)練成本，研究成果登上《自然》雜志封面。

在硬件上，DeepSeek受制于美國的先進算力卡禁令，只能使用“閹割過的英偉達H800”，就寫出FlashMLA程序優(yōu)化硬件，讓大模型使用H800內(nèi)存帶寬的能力，從平均60%提升到95%。

在系統(tǒng)層面，DeepSeek發(fā)明DualPipe，給整個系統(tǒng)裝上了GPU監(jiān)工，時刻“鞭笞”閑置算力，將GPU利用率提升30%以上。DeepSeek 還推出了DeepEP，全球首個專門針對MoE的并行通信庫，優(yōu)化跨節(jié)點通信，確保協(xié)同的效率最大化。

結(jié)果肉眼可見：同等性能下，DeepSeek推理定價僅為歐美大廠幾十分之一！美國用戶驚呼，改用DeepSeek V4以后，不但效果更好，而且費用降低90% +！

而且大模型開源之后，帶動了整個AI行業(yè)的再次重構(gòu)，雖然用了大量前人的技術(shù)和代碼，但DeepSeek確實是一次重大的原始創(chuàng)新。實際上所有原始創(chuàng)新都是源于組合創(chuàng)新。

華為韜定律顛覆摩爾定律！

5月25日，華為半導(dǎo)體總裁何庭波在國際電路研討會上正式發(fā)布韜（τ）定律，全球半導(dǎo)體行業(yè)劇烈震蕩，外媒直言中國走出繞開EUV封鎖的芯片自主新路。

韜（τ）定律是華為的原始創(chuàng)新！

原始創(chuàng)新之處在于，第一次提出要把“韜(τ)定律”作為技術(shù)進化的主要方向。之所以可以稱之為原始創(chuàng)新，這是因為主攻方向的不同，會產(chǎn)生完全不同的發(fā)展路徑。

過去數(shù)十年，摩爾定律主導(dǎo)全球芯片發(fā)展：靠不斷縮小晶體管物理尺寸、攻堅EUV光刻機向下沖刺先進制程，7nm、5nm、3nm芯片研發(fā)成本指數(shù)級暴漲，3nm晶圓廠建設(shè)成本百億起步，行業(yè)紅利逐漸淪為蘋果、英偉達等巨頭專屬，再加上對華封鎖高端EUV設(shè)備，國內(nèi)芯片在這條賽道上處處受限。

韜定律另辟蹊徑：放棄空間微縮，轉(zhuǎn)向時間微縮，搭建晶體管-電路-芯片-系統(tǒng)四層全棧優(yōu)化體系。縮小晶體管不是目的，更高的算力密度和更短的信號傳播時間才是。

在電路層，華為獨創(chuàng)邏輯折疊技術(shù)，把平鋪的芯片電路像折紙一樣立體對折，如同《盜夢空間》里折疊的都市，線路長度縮短30%。

在芯片層，華為進行軟件、架構(gòu)、芯片的三者協(xié)同，也就是根據(jù)實際任務(wù)需求來調(diào)配芯片內(nèi)部的資源，砍掉一切不必要的等待。

在系統(tǒng)層，華為自研靈衢總線，統(tǒng)一系統(tǒng)內(nèi)部的協(xié)議體系，解決計算節(jié)點間的割裂問題，將系統(tǒng)通信延遲從幾十微秒降到約100納秒，降低了時間延遲近500倍。在靈衢總線之上，華為還發(fā)明了Hi-ONE光互連引擎，用光替代銅傳輸數(shù)據(jù)，單模塊帶寬高達8Tb/s，能讓數(shù)萬張GPU像一臺機器一樣協(xié)同工作。

韜定律要想開枝散葉樹大根深，還需要建設(shè)共享的供應(yīng)鏈生態(tài)，在四層優(yōu)化的體系中，每一層都能帶動半導(dǎo)體產(chǎn)業(yè)鏈的再次重構(gòu)。從這個角度來說，提出韜定律無疑是一次原始創(chuàng)新。

華為將在2026年秋季發(fā)布麒麟2026手機芯片，靠韜定律+邏輯折疊技術(shù)，將峰值主頻提升到3.1GHz，晶體管密度提升53.5%達到每平方毫米2.38億顆晶體管，在不依賴海外先進光刻制程的前提下，綜合水準對標行業(yè)3nm旗艦芯片！

華為測算，依托韜定律，2031年成熟制程芯片即可實現(xiàn)等效1.4nm先進制程水準，打破“先進芯片必須依賴EUV”的藩籬。

中國的創(chuàng)新哲學(xué)

DeepSeek和華為韜定律，最大的相似之處不是具體技術(shù)，而是與美國不同的創(chuàng)新哲學(xué)。

從AI規(guī)模縮放和摩爾定律來看，美國科技追求系統(tǒng)產(chǎn)出，毫不在乎用了多少資源，很像西方古代的粗放農(nóng)業(yè)模式——靠擴大耕種面積提高產(chǎn)出。

中國科技則在追求系統(tǒng)產(chǎn)出/資源占用之比，像中國古代農(nóng)業(yè)的精耕細作——優(yōu)化堆肥、施肥、選種、育種、耕作、整地、除草、耘田、追肥、灌溉、收獲的每個環(huán)節(jié)，增加土地肥力，增加莊稼的產(chǎn)量。

DeepSeek和華為都從“最微觀”的單元上改起。DeepSeek改進MoE算法，按需調(diào)用少量參數(shù)；華為用邏輯折疊縮短芯片內(nèi)部電路節(jié)點之間的距離。他們都在打通全鏈條所有環(huán)節(jié)統(tǒng)籌調(diào)配，統(tǒng)一通信協(xié)議，優(yōu)化信息傳遞，減少互聯(lián)損耗，“逐一挖掘”每個部分的剩余性能，從“縫隙”里摳出“性價比”，全力增加總產(chǎn)出。

簡而言之，無法在資源規(guī)模上取勝時，就用協(xié)同優(yōu)化在系統(tǒng)效率上重構(gòu)游戲規(guī)則。

這可能就是中國科技破局的關(guān)鍵！

而協(xié)同優(yōu)化的思想源頭，與錢學(xué)森首創(chuàng)的系統(tǒng)論非常接近。

錢學(xué)森認為，系統(tǒng)比零件更重要，整體最優(yōu)優(yōu)于局部最優(yōu)，總體設(shè)計決定成敗，復(fù)雜系統(tǒng)依賴反饋和協(xié)同，現(xiàn)代國家競爭越來越是系統(tǒng)與系統(tǒng)之間的競爭。

錢學(xué)森特別強調(diào)，抓系統(tǒng)主要矛盾，而不是抓局部指標，就是從“極限突破”轉(zhuǎn)向“協(xié)同突破”。

錢學(xué)森在中國航天體系中實踐了他的系統(tǒng)論思想，比如專門負責協(xié)同優(yōu)化的總體設(shè)計部制度，能將一項大型工程里的上萬名工程師、數(shù)百家協(xié)作單位和供應(yīng)商擰成一股繩攻堅克難！

直到今天，中國的各種大型項目里都能看到系統(tǒng)論的影子，而且這種思想還被引入了國家治理體系之中，比如頂層設(shè)計和整體謀劃的概念，統(tǒng)籌多產(chǎn)業(yè)發(fā)展布局、銜接中長期發(fā)展目標的五年規(guī)劃。這已成為東方不同于西方的典型特色。

外國人總驚訝中國的長期主義、戰(zhàn)略遠見和革新魄力，實際上中國人都知道“不謀萬世者，不足謀一時；不謀全局者，不足謀一域”，正因如此，我們才能協(xié)同起來下好“全國一盤棋”。

中國創(chuàng)新哲學(xué)是中華文明孕育出的超級基因，讓世界尖端科技博弈的關(guān)鍵，不再是單一指標的極限沖刺，而是協(xié)同優(yōu)化的破局能力。當西方還在沿用“粗放模式”瘋狂卷資本時，華為與DeepSeek 已經(jīng)用原始創(chuàng)新的累累碩果證明，中國不再簡單追趕，我們開始原始創(chuàng)新。

聲明：內(nèi)容由AI生成

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.