6月17日,專注3D架構AI云端大算力芯片研發設計的算苗科技宣布,旗下3D TokenPU芯片A4E已于6月15日正式流片。據悉,該芯片面向大模型推理需求,基于自研RISC-V架構,采用成熟國產工藝,專攻推理場景的極致性能與更低總擁有成本(TCO)。
“我們不是在別人的賽道上追趕,而是在開辟新的方向。”算苗科技創始人兼CEO、中科院聲學所國家重點實驗室博士汪福全在接受《每日經濟新聞》記者采訪時表示,“3D TokenPU專為大模型Token處理而生,不必單純依賴制程縮小,就能實現算力密度、能效比的跨越式提升。”
![]()
圖片來源:每經記者 劉曦 攝
據悉,A4E將8層存儲晶圓垂直堆疊在計算邏輯晶圓上,通過硅通孔(TSV)與凸點(bump)技術實現微米級互聯,將傳統芯片間毫米級傳輸距離壓縮兩個數量級,帶來超大訪存帶寬,有效緩解大模型推理中因數據搬運效率低導致的“數據饑餓”問題。
實際上,當前AI算力需求正從訓練側向推理側遷移。德勤預計,長期來看全球推理負載占AI算力比例有望超過80%,同時開源RISC-V架構正從“備選”走向“主流”,在數據中心及AI推理等場景加速滲透。
與此同時,車百智庫報告指出,無論是電子電氣架構還是智能駕駛解決方案,都在很大程度上依賴算力的合理分布與高效利用,算力已成為智能汽車的核心要素。相比車端計算芯片,云端芯片需承擔復雜訓練任務和海量數據處理,算力更為強勁。
算苗科技技術人士向記者介紹,3D TokenPU目前主要面向云端大算力AI推理場景,應用在頭部大模型公司的超節點服務器、大型智算中心服務器,以及部分金融等專業領域需要私有化部署到本地的場景中。當前汽車的智聯、智駕功能日益普及,許多智能化處理同樣需要通過云端服務器完成,其中就會涉及云端AI服務器,進而有機會用到3D TokenPU這類推理芯片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.