當英偉達憑借通用GPU與CUDA生態構筑起難以撼動的行業壁壘時,一家僅24人的初創公司Taalas,卻以一枚極致芯片撕開了AI芯片賽道的全新可能。
![]()
其推出的HC1芯片,運行Llama 3.1 8B模型推理速度高達17000 token/秒,是英偉達H200的七十多倍。更顛覆認知的是,它摒棄了昂貴的HBM高帶寬內存與復雜液冷,功耗僅為傳統方案的十分之一。而這顆芯片最極致、也最受爭議的特點是:一經出廠,便只能運行固定模型,完全不可編程。
這支團隊的掌舵人Ljubisa Bajic,是擁有13年AMD、英偉達任職經歷的資深芯片架構師,也曾是明星AI芯片公司Tenstorrent的創始人。在“硅仙人”Jim Keller加入Tenstorrent并轉向通用化路線后,Bajic選擇出走,創立Taalas,走上了極致專用化的另一條道路。
Taalas的邏輯直白而暴力:當前AI推理的核心瓶頸是“內存墻”,數據在計算和存儲之間搬運消耗了95%以上的能耗。既然如此,不如直接拆掉這堵墻。HC1采用臺積電6nm工藝,通過Mask ROM工藝將Llama 3.1 8B模型權重直接“刻”入電路連接中,實現芯片即模型,模型即芯片。電流流過的瞬間即可完成推理,無需數據搬運,換來能效比的質變。
但極致的效率,也意味著極致的風險。
![]()
HC1雖性能炸裂,卻只能跑2024年發布的Llama 3.1 8B。在GPT-5.2、Claude 4.6、DeepSeek R1等新一代模型加速迭代的今天,這顆芯片出廠即面臨過時風險。Taalas宣稱新模型流片僅需兩個月,可在AI行業,兩個月足以完成一輪技術洗牌。Bajic坦言,這條路無人涉足,正是因為AI迭代太快、風險太高。其商業模式要求客戶承諾一年內不更換模型,以攤平定制成本——在大模型軍備競賽的當下,幾乎沒有企業敢給出這樣的承諾。
除了過時風險,HC1還面臨智能質量的妥協。為將80億參數集成于單芯片,它采用激進的3-bit量化,雖能壓縮體積,卻帶來明顯的效果損失。實測顯示,芯片輸出速度極快,但面對復雜邏輯問題時錯誤率偏高。這也拋出一個核心問題:AI推理的終極追求,究竟是極致速度,還是可靠的智能質量?
Taalas的出現,本質是AI芯片路線的終極分野。
通用派堅信,可編程、軟件友好的平臺,才能適配未知的未來。而專用派則豪賭:AI模型終將走向收斂,屆時效率將遠重于靈活性。有人將這種硬件固化類比人腦:人類大腦的神經連接高度特化,多數人終身使用一種語言、專注一項工作,本質也是“固化模型”。在云端需要全能通用的同時,工業質檢、智能家居等垂直場景,恰恰需要低成本、低功耗、高穩定的專用AI。
24人的“夢之隊”,以極致專用化向現有格局發起沖鋒。成,則開啟低功耗AI的新可能;敗,也將成為技術史上一次勇敢而浪漫的探索。無論結局如何,Taalas已經證明:在英偉達的霸權之外,AI芯片仍有狂野且充滿想象的未來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.