无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

24人團(tuán)隊(duì)硬剛英偉達(dá)!AMD前高管夢(mèng)之隊(duì)出手,新芯片每秒17000個(gè)token

0
分享至

造芯片的還有高手?

剛剛推出的一款最新芯片,直接沖上硅谷熱榜。

峰值推理速度高達(dá)每秒17000個(gè)token

什么概念呢?當(dāng)前公認(rèn)最強(qiáng)的Cerebras,速度約為2000 token/s。

速度直接快10倍,同時(shí)成本驟減20倍、功耗降低10倍。

這就意味著,LLM真正來到了亞毫秒級(jí)的即時(shí)響應(yīng)速度。實(shí)機(jī)效果be like:

但這塊一夜之間刷屏硅谷的芯片,并非出自英偉達(dá)、AMD之手,而是一家成立僅兩年、團(tuán)隊(duì)僅有24人的初創(chuàng)公司——Taalas。


芯片代號(hào)HC1,也是公司的首款產(chǎn)品。

不同于所有競(jìng)爭對(duì)手,Taalas選擇了迄今為止最極端的技術(shù)方案——

模型不再加載到內(nèi)存里,而是直接刻在硅片上。換言之,芯片即模型。

結(jié)果顯而易見,Taalas撬動(dòng)了芯片算力護(hù)城河:H100買不到,試試HC1又何妨?

速度快10倍,功耗降至10分之一

HC1目前搭載Llama 3.1 8B模型,用戶每秒最高可生成17000 token/s,遠(yuǎn)高于主流GPU/ASIC。


其中,在同一模型下Cerebras接近每秒2000個(gè)token,SambaNova約為每秒900個(gè)token,Groq約為每秒600個(gè),英偉達(dá)Blackwell架構(gòu)的B200為每秒350個(gè)。

具體來說,HC1采用臺(tái)積電N6工藝,面積為815mm2,體積小巧而且開源,單顆芯片即可滿足8B模型需求。

每顆芯片典型功耗僅為250W,一個(gè)服務(wù)器如果同時(shí)裝配10顆HC1,功耗也才2.5kW,可以直接使用常規(guī)空氣冷卻機(jī)架部署。

那么是如何做到這么大的性能飛躍的呢?

首先HC1借鑒了2000年代初期的結(jié)構(gòu)化ASIC芯片理念。結(jié)構(gòu)化ASIC芯片采用門陣列和固化IP,然后僅通過改變互連層就能使芯片適應(yīng)特定的工作負(fù)載。

這樣下來,結(jié)構(gòu)化ASIC芯片不僅比全定制ASIC更便宜,也比FPGA性能更優(yōu)。


HC1則采用類似思路,不改變底層電路,只通過調(diào)整兩層掩模,就能低成本快速做出專用AI推理芯片。

它放棄了大多數(shù)可編程功能,將模型連同權(quán)重一起通過基于掩模ROM的調(diào)用架構(gòu)存儲(chǔ)在芯片上,并保留一個(gè)可編程SRAM,用于保存微調(diào)后的權(quán)重(如LoRA)和KV緩存。其余則全部通過掩模ROM固化執(zhí)行。

這一策略能在設(shè)計(jì)成本相對(duì)可控的前提下,實(shí)現(xiàn)模型到芯片的快速轉(zhuǎn)化,將芯片生產(chǎn)周期從原先的六個(gè)月縮短到兩個(gè)月。

而如此激進(jìn)的量化方式勢(shì)必會(huì)影響性能,研究團(tuán)隊(duì)也意識(shí)到了這一點(diǎn),所以可以通過LaRA適配器進(jìn)行重新訓(xùn)練,以及可配置的上下文窗口,讓芯片的最低限度靈活性得以保留。

換句話說,就是將一個(gè)完整大模型通過物理硬連線進(jìn)芯片中,省去了傳統(tǒng)存算分離的成本,用靈活性換取極致的速度和效率。


除了Llama 3.1,Taalas也嘗試將其它模型集成到HC1上,例如對(duì)DeepSeekR1-671B的多芯片解決方案。

將SRAM部分拆分到單獨(dú)的芯片上,然后可以將每片HC1的存儲(chǔ)密度提高到約20位參數(shù),總計(jì)需要30個(gè)定制HC1。

整體處理速度可達(dá)到每用戶每秒12000個(gè)token,如果考慮到30顆芯片成本為每百萬token是7.6美分,那么該方案成本也不到同等吞吐量的GPU方案的一半。

假設(shè)GPU更新周期為四年,而HC1每年都需要重新更換,總成本也仍然具備優(yōu)勢(shì)。

AMD前高管夢(mèng)之隊(duì)

其背后的公司Taalas成立于兩年前,由AMD前集成電路設(shè)計(jì)總監(jiān)Ljubi?a Baji?、AMD/ATI/Altera前技術(shù)經(jīng)理和工程師Leila Baji?、AMD前ASIC設(shè)計(jì)總監(jiān)Drago Ignjatovi?共同創(chuàng)立,堪稱AMD前高管夢(mèng)之隊(duì)。

其中,Ljubi?a Baji?不僅曾在AMD和英偉達(dá)擔(dān)任高級(jí)職位,負(fù)責(zé)高性能GPU研發(fā)設(shè)計(jì),還是Tenstorrent的創(chuàng)始人兼首任CEO。

新公司致力于開發(fā)專為AI推理和訓(xùn)練設(shè)計(jì)的全新架構(gòu),強(qiáng)調(diào)分層設(shè)計(jì)和晶格網(wǎng)絡(luò),能夠讓芯片像大腦一樣根據(jù)任務(wù)需求動(dòng)態(tài)處理數(shù)據(jù)。

在2020年,芯片教父Jim Keller也強(qiáng)勢(shì)加入Tenstorrent,并接任CEO一職,而Ljubi?a Baji?轉(zhuǎn)任首席技術(shù)官CTO,專注于產(chǎn)品研發(fā)。


隨后,他又創(chuàng)立了Taalas,試圖通過類似硅基編譯器的方式,直接將AI模型轉(zhuǎn)化為硅芯片。

于是首戰(zhàn)告捷,一個(gè)僅有24名成員的團(tuán)隊(duì),產(chǎn)品投入僅3000萬美元,就創(chuàng)造出比通用AI芯片高出幾個(gè)數(shù)量級(jí)的能效比。

目前Taalas已籌集2億美元投資,預(yù)計(jì)將在春季基于HC1發(fā)布第二代變體,將集成一款中等規(guī)模的推理大模型。

隨后預(yù)計(jì)將在冬季部署上線HC2,HC2密度更高、運(yùn)行速度也會(huì)更快。

不過對(duì)于HC1,網(wǎng)友們的評(píng)價(jià)卻是兩極分化。

一方面,網(wǎng)友認(rèn)為HC1的超低延遲將有益于推動(dòng)具身智能等領(lǐng)域發(fā)展。


另一方面,也有網(wǎng)友實(shí)測(cè)過后發(fā)現(xiàn),HC1高速推理的背后,卻是糟糕的推理深度:


以及對(duì)于迭代周期相當(dāng)迅速的大模型來說,HC1的硬編碼可能會(huì)使芯片很容易過時(shí)。

這也是為什么當(dāng)前芯片廠商都在普遍推出通用型芯片的原因之一。


參考鏈接:
[1]https://x.com/wildmindai/status/2024810128487096357?s=20
[2]https://taalas.com/the-path-to-ubiquitous-ai/
[3]https://chatjimmy.ai/
[4]https://www.eetimes.com/taalas-specializes-to-extremes-for-extraordinary-token-speed

文章來源:量子位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
全國大清查全面鋪開!聚焦兩大領(lǐng)域,3000元即立案,查到必重罰!

全國大清查全面鋪開!聚焦兩大領(lǐng)域,3000元即立案,查到必重罰!

細(xì)說職場(chǎng)
2026-06-09 12:09:52
生育率的“回旋鏢”還是呼啦啦來了

生育率的“回旋鏢”還是呼啦啦來了

新浪財(cái)經(jīng)
2026-05-18 07:42:35
“好好的孩子喂成了低能兒!”孩子奶奶的發(fā)型,預(yù)示了家教水平!

“好好的孩子喂成了低能兒!”孩子奶奶的發(fā)型,預(yù)示了家教水平!

林林先生
2026-06-10 07:10:03
數(shù)百名醫(yī)生已證實(shí):苯磺酸氨氯地平的真相,最好花點(diǎn)時(shí)間看看

數(shù)百名醫(yī)生已證實(shí):苯磺酸氨氯地平的真相,最好花點(diǎn)時(shí)間看看

垚垚分享健康
2026-06-10 08:59:48
炸鍋了!網(wǎng)傳短劇界出臺(tái)嚴(yán)苛制度:禁止修仙,禁止傷人,禁止下跪

炸鍋了!網(wǎng)傳短劇界出臺(tái)嚴(yán)苛制度:禁止修仙,禁止傷人,禁止下跪

小徐講八卦
2026-06-08 07:39:30
夏天襯衫,真絲的更有質(zhì)感!

夏天襯衫,真絲的更有質(zhì)感!

Yuki女人故事
2026-06-08 22:00:21
GPT-5.6首批實(shí)測(cè)來了!精準(zhǔn)狙擊Mythos

GPT-5.6首批實(shí)測(cè)來了!精準(zhǔn)狙擊Mythos

量子位
2026-06-10 14:45:24
世界上最大的煤田厚達(dá)1千米,1200公里橫跨九州,真的是植物變的

世界上最大的煤田厚達(dá)1千米,1200公里橫跨九州,真的是植物變的

磊子講史
2026-06-08 14:39:19
馬特·達(dá)蒙《傳染病》翻紅登頂,15年前神預(yù)言再應(yīng)驗(yàn)

馬特·達(dá)蒙《傳染病》翻紅登頂,15年前神預(yù)言再應(yīng)驗(yàn)

赴一場(chǎng)山海啊
2026-06-10 00:36:12
賽力斯賽豆科技正式發(fā)布:品牌Logo亮相、首車高顏值!

賽力斯賽豆科技正式發(fā)布:品牌Logo亮相、首車高顏值!

快科技
2026-06-09 22:22:17
法國隊(duì)徹底變天!姆巴佩位置被搶走,昔日王牌地位不保!

法國隊(duì)徹底變天!姆巴佩位置被搶走,昔日王牌地位不保!

奶蓋熊本熊
2026-06-10 04:55:09
一場(chǎng)0:0驗(yàn)出國足3大水貨,難堪大任,明年亞洲杯恐遭邵佳一冷落

一場(chǎng)0:0驗(yàn)出國足3大水貨,難堪大任,明年亞洲杯恐遭邵佳一冷落

零度眼看球
2026-06-10 13:56:05
心理學(xué):有福女子的面相,不是美貌,也不是圓潤,而是這兩個(gè)特征

心理學(xué):有福女子的面相,不是美貌,也不是圓潤,而是這兩個(gè)特征

心理觀察局
2026-06-10 06:49:08
“自作自受!” 印尼這下慌了。

“自作自受!” 印尼這下慌了。

小馬姨
2026-06-10 08:47:43
演員中的天花板比想象中來的更快,張彬彬已轉(zhuǎn)行?韓棟哭著沒戲拍

演員中的天花板比想象中來的更快,張彬彬已轉(zhuǎn)行?韓棟哭著沒戲拍

仙味少女心
2026-06-10 12:56:49
高考最“倒霉”考生出現(xiàn),青島一女進(jìn)入考場(chǎng),竟然就她自己一人

高考最“倒霉”考生出現(xiàn),青島一女進(jìn)入考場(chǎng),竟然就她自己一人

戶外阿毽
2026-06-10 12:07:35
特朗普捅了馬蜂窩!各國討說法,美媒卻瘋狂追問中國:說兩句?

特朗普捅了馬蜂窩!各國討說法,美媒卻瘋狂追問中國:說兩句?

蜉蝣說
2026-06-09 15:40:27
穆里尼奧又打臉!歐冠決賽坐板凳的棄將,皇馬砸 5000 萬搶著要

穆里尼奧又打臉!歐冠決賽坐板凳的棄將,皇馬砸 5000 萬搶著要

瀾歸序
2026-06-10 06:23:35
博格巴致敬梅西:2018年淘汰阿根廷后,第一次向?qū)κ终f“對(duì)不起”

博格巴致敬梅西:2018年淘汰阿根廷后,第一次向?qū)κ终f“對(duì)不起”

體育閑話說
2026-06-10 08:06:07
廣西2名干部同日官宣被查

廣西2名干部同日官宣被查

黃河新聞網(wǎng)呂梁
2026-06-10 14:42:34
2026-06-10 19:31:00
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識(shí),交流思想
5604文章數(shù) 64624關(guān)注度
往期回顧 全部

科技要聞

凌晨突發(fā)!Anthropic神級(jí)模型向你開放

頭條要聞

廣州公交客流暴跌59% 10個(gè)曾經(jīng)坐車的乘客中6個(gè)不坐了

頭條要聞

廣州公交客流暴跌59% 10個(gè)曾經(jīng)坐車的乘客中6個(gè)不坐了

體育要聞

2026世界杯,我們看什么?

娛樂要聞

蒙淇淇發(fā)文開撕白鹿!輿論再次反轉(zhuǎn)

財(cái)經(jīng)要聞

一紙研報(bào)引"光"速下跌 CPO落地節(jié)奏有變?

汽車要聞

首款搭載激光雷達(dá)的A00級(jí)車型 2026款海鷗煥新上市

態(tài)度原創(chuàng)

數(shù)碼
教育
游戲
旅游
軍事航空

數(shù)碼要聞

手表回微信更方便了!小米手表S5新版內(nèi)測(cè):支持語音轉(zhuǎn)文字發(fā)消息

教育要聞

第八屆中小學(xué)班主任發(fā)展大會(huì),從“管 到“育”重塑班主任勝任力

敖廠長復(fù)出被全網(wǎng)噴爆!彈幕刷屏怒稱“也夠”

旅游要聞

“玩”美新消費(fèi)|在未來感湯泉館解鎖都市“微度假”

軍事要聞

伊朗襲擊美軍第五艦隊(duì)

無障礙瀏覽 進(jìn)入關(guān)懷版