AI算力的爭奪戰(zhàn)正在進入一個新階段。大模型參數(shù)量從千億邁向萬億,單次推理所需的token數(shù)量呈指數(shù)級增長,推理成本正成為制約整個行業(yè)規(guī)模化商業(yè)落地的核心瓶頸。誰能把token的生成成本打下來,誰就可能拿到下一輪競爭的入場券。
“基于稀疏計算的優(yōu)勢,墨芯產(chǎn)品的單token成本,可做到遠低于主流競品。”墨芯人工智能董秘兼企業(yè)發(fā)展及資本市場部總經(jīng)理王率宇給出了這個答案。
什么是稀疏計算?
簡而言之,傳統(tǒng)AI芯片采用“稠密計算”模式,對矩陣中的所有參數(shù)一視同仁地做運算,其中大量計算是在處理無效或冗余的數(shù)據(jù)。稀疏計算則通過算法預先識別并跳過這些“無用功”,只對真正有效的參數(shù)進行計算,從而在同等硬件條件下大幅提升有效算力、降低能耗和成本。
近日,投中網(wǎng)獲悉,專注于為云端和終端設(shè)備提供AI算力平臺的墨芯完成了C輪近十億元人民幣融資,深創(chuàng)投、大灣區(qū)共同家園、力鼎資本、蘊盛資本等機構(gòu)入局,老股東凱旋創(chuàng)投、盛景嘉成、巖山科技等投資人持續(xù)加注。
“當前行業(yè)仍處于快速擴張、加碼資本投入的階段,整體市場機遇巨大。”王率宇形容當下的AI算力市場,“但推理成本,是決定企業(yè)能否穿越行業(yè)周期、活到下一輪競爭的核心生死牌。”
在國產(chǎn)AI芯片賽道,墨芯走出了一條差異化的創(chuàng)新路徑:依托自研稀疏算法為芯片計算“做減法”,以算法+軟件+硬件協(xié)同設(shè)計,實現(xiàn)真正創(chuàng)新的算力解決方案,把每個Token的生成成本優(yōu)化做到更高的量級。
“做減法”的人
2018年,兩位卡內(nèi)基梅隆大學校友在硅谷相遇,攜手開啟AI芯片創(chuàng)業(yè)之路,創(chuàng)立墨芯人工智能。
創(chuàng)始人兼CEO王維是卡內(nèi)基梅隆大學ECE碩士,擁有超過15年經(jīng)驗的硅谷芯片專家。他曾擔任英特爾五代到十代CPU處理器的核心架構(gòu)師,先后在高通和英特爾任職,主導及參與的芯片累計量產(chǎn)超50億片。
聯(lián)合創(chuàng)始人兼首席科學家嚴恩勖博士同樣畢業(yè)于卡內(nèi)基梅隆大學,在機器學習領(lǐng)域深耕十余年,是神經(jīng)網(wǎng)絡(luò)動態(tài)稀疏算法的發(fā)明人,獨創(chuàng)雙稀疏算法。這是一種通過神經(jīng)網(wǎng)絡(luò)的“權(quán)重稀疏化+激活稀疏化”進一步提高AI計算效率的革命性思路,嚴恩勖博士已圍繞相關(guān)領(lǐng)域在國際頂級AI期刊發(fā)表論文40余篇。
另一位聯(lián)合創(chuàng)始人蘆勇畢業(yè)于浙江大學電子工程專業(yè),曾在SK Hynix和Marvell等知名半導體公司任職,主導開發(fā)多款全球量產(chǎn)的SSD控制器芯片。
三人形成了完美的能力互補。一個擅長產(chǎn)品架構(gòu),一個精于算法創(chuàng)新與系統(tǒng)優(yōu)化,一個精通硬件工程和產(chǎn)品落地。三位一致認定,稀疏化是AI計算的未來,將前沿學術(shù)層面的稀疏化理論,逐步落地、迭代為可商業(yè)化的算力計算方案。
墨芯獨創(chuàng)的雙稀疏算法,通過軟件前置優(yōu)化,剔除模型中無效、非核心的計算元素,將計算任務(wù),轉(zhuǎn)化為高效、精準的稀疏計算任務(wù)。
“AI模型的大量參數(shù)處于歸零、不參與計算的狀態(tài),稀疏化技術(shù)的核心,就是讓AI模型實現(xiàn)真正的按需計算。”王率宇解釋道。
這一思路,在業(yè)界并非新鮮概念,但真正將“權(quán)重稀疏化+激活稀疏化”雙稀疏路線做成量產(chǎn)產(chǎn)品和軟硬協(xié)同方案并率先商業(yè)化的,墨芯是第一家。目前墨芯已累計申請全球相關(guān)專利100余項。
更具說服力的驗證來自國際權(quán)威AI基準測試MLPerfTM。墨芯S30計算卡連續(xù)三次登頂MLPerfTM推理榜首,硬核技術(shù)實力也得到了國際權(quán)威機構(gòu)的驗證。
而資本入局的節(jié)奏,是最誠實的投票。
早在墨芯第一代芯片流片前后,深圳天使母基金、凱旋創(chuàng)投、將門投資、真格基金、基石資本等知名財務(wù)機構(gòu)相繼加注。
但真正的轉(zhuǎn)折發(fā)生在2024年。隨著大模型從技術(shù)競賽轉(zhuǎn)向商業(yè)落地,資本開始密集押注具備落地能力的算力企業(yè)。
加速融資的背后還是在于產(chǎn)品的突破性進展。基于稀疏化優(yōu)化的AI推理方案,墨芯已在多個真實場景中驗證了其商業(yè)價值。經(jīng)實測,搭載墨芯計算卡的AI推理業(yè)務(wù),不僅整體推理成本大幅下降,推理速度也實現(xiàn)數(shù)倍提升。
據(jù)IDC預測,2028年推理工作負載占比將達到73%。在中國AI算力市場正從“訓練為王”轉(zhuǎn)向“推理為王”的產(chǎn)業(yè)拐點上。在此背景下,極致降本增效的核心能力,成為墨芯在商業(yè)化落地階段最堅實的核心競爭壁壘。
“護城河”與“加速度”
對于稀疏計算技術(shù)路線,其他競爭對手是否可能快速復制或繞過?
王率宇認為,墨芯的核心壁壘有三層:
第一層是專利壁壘。墨芯從硅谷創(chuàng)業(yè)之初就進行了全球PCT專利布局,覆蓋硬件、算法、軟件各個維度。
第二層是工程積累。稀疏化理論雖公開,但真正將算法落地到軟硬協(xié)同的量產(chǎn)芯片,需要多年的系統(tǒng)化投入。墨芯從2021年第一代芯片流片至今,已與互聯(lián)網(wǎng)、行業(yè)垂類、智算中心三類標桿客戶完成了長達三四年的場景適配。
第三層是生態(tài)先發(fā)。稀疏計算并非單一芯片技術(shù),而是涵蓋芯片、編譯器、工具鏈、客戶模型的整套協(xié)同體系。墨芯深耕行業(yè)多年,已與眾多大客戶形成深入合作,這種時間成本和信任壁壘,非一日可破。
正是這道壁壘,讓墨芯的商業(yè)化落子有了獨特的底氣。
截至目前,墨芯已在西北、西南、華東、華北四大片區(qū)實現(xiàn)智算中心集群的戰(zhàn)略性鋪開。西北片區(qū)部署的千卡級推理集群,已在電子制造、消費品生產(chǎn)等場景落地多個工廠安防項目,于邊緣側(cè)實現(xiàn)實時AI分析;西南片區(qū)結(jié)合當?shù)鼐G電資源,構(gòu)建低功耗綠色算力池;華東片區(qū)則面向生信分析、醫(yī)療健康等高端服務(wù)業(yè),與行業(yè)頭部企業(yè)合作加速基因測序數(shù)據(jù)分析流程;華北片區(qū)賦能城市治理與社區(qū)智能化升級。
要穿越周期,光靠單一市場不夠。被問到想成為什么樣公司時,王率宇轉(zhuǎn)述了創(chuàng)始人王維的愿景:讓墨芯成為稀疏計算引領(lǐng)者,依托技術(shù)創(chuàng)新降低AI推理成本,用稀疏計算賦能AI全民普惠。
據(jù)悉,融資資金將重點投向全新一代計算卡SparsePrime?的量產(chǎn)與商業(yè)化,以及全國算力網(wǎng)絡(luò)版圖的進一步擴張。
“推理成本是AI普及的關(guān)鍵瓶頸,稀疏計算正在給出根本性的解答。從投資視角看,評判一家AI芯片公司的價值,不應(yīng)只看單卡理論算力,更要看其在真實集群環(huán)境中完成同等AI任務(wù)的有效算力和能效比。墨芯的多地部署與客戶持續(xù)擴容,正是產(chǎn)品力和商業(yè)價值的硬核驗證。”王率宇表示。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.