網易首頁 > 網易號 > 正文申請入駐

24人組建“夢之隊”，挑戰AI模型芯片化的未來。

2026-02-24 10:39:24　來源: 觀科技生活

山東舉報

分享至

當英偉達憑借通用GPU與CUDA生態構筑起難以撼動的行業壁壘時，一家僅24人的初創公司Taalas，卻以一枚極致芯片撕開了AI芯片賽道的全新可能。

其推出的HC1芯片，運行Llama 3.1 8B模型推理速度高達17000 token/秒，是英偉達H200的七十多倍。更顛覆認知的是，它摒棄了昂貴的HBM高帶寬內存與復雜液冷，功耗僅為傳統方案的十分之一。而這顆芯片最極致、也最受爭議的特點是：一經出廠，便只能運行固定模型，完全不可編程。

這支團隊的掌舵人Ljubisa Bajic，是擁有13年AMD、英偉達任職經歷的資深芯片架構師，也曾是明星AI芯片公司Tenstorrent的創始人。在“硅仙人”Jim Keller加入Tenstorrent并轉向通用化路線后，Bajic選擇出走，創立Taalas，走上了極致專用化的另一條道路。

Taalas的邏輯直白而暴力：當前AI推理的核心瓶頸是“內存墻”，數據在計算和存儲之間搬運消耗了95%以上的能耗。既然如此，不如直接拆掉這堵墻。HC1采用臺積電6nm工藝，通過Mask ROM工藝將Llama 3.1 8B模型權重直接“刻”入電路連接中，實現芯片即模型，模型即芯片。電流流過的瞬間即可完成推理，無需數據搬運，換來能效比的質變。

但極致的效率，也意味著極致的風險。

HC1雖性能炸裂，卻只能跑2024年發布的Llama 3.1 8B。在GPT-5.2、Claude 4.6、DeepSeek R1等新一代模型加速迭代的今天，這顆芯片出廠即面臨過時風險。Taalas宣稱新模型流片僅需兩個月，可在AI行業，兩個月足以完成一輪技術洗牌。Bajic坦言，這條路無人涉足，正是因為AI迭代太快、風險太高。其商業模式要求客戶承諾一年內不更換模型，以攤平定制成本——在大模型軍備競賽的當下，幾乎沒有企業敢給出這樣的承諾。

除了過時風險，HC1還面臨智能質量的妥協。為將80億參數集成于單芯片，它采用激進的3-bit量化，雖能壓縮體積，卻帶來明顯的效果損失。實測顯示，芯片輸出速度極快，但面對復雜邏輯問題時錯誤率偏高。這也拋出一個核心問題：AI推理的終極追求，究竟是極致速度，還是可靠的智能質量？

Taalas的出現，本質是AI芯片路線的終極分野。

通用派堅信，可編程、軟件友好的平臺，才能適配未知的未來。而專用派則豪賭：AI模型終將走向收斂，屆時效率將遠重于靈活性。有人將這種硬件固化類比人腦：人類大腦的神經連接高度特化，多數人終身使用一種語言、專注一項工作，本質也是“固化模型”。在云端需要全能通用的同時，工業質檢、智能家居等垂直場景，恰恰需要低成本、低功耗、高穩定的專用AI。

24人的“夢之隊”，以極致專用化向現有格局發起沖鋒。成，則開啟低功耗AI的新可能；敗，也將成為技術史上一次勇敢而浪漫的探索。無論結局如何，Taalas已經證明：在英偉達的霸權之外，AI芯片仍有狂野且充滿想象的未來。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.