![]()
欄目|《態度》
作者|丁廣勝
做芯片,所有人都想成為英偉達,但國家超算背景的太初元碁有截然不同的解法。
“算力只是入場券,真正的競爭是成本和模型適配能力。”在太初元碁CEO楊晉喆看來,AI芯片的比拼,早已不再停留在參數和峰值算力層面,而是進入到圍繞總擁有成本(TCO)與系統效率的深水區。
“我們不做中國的英偉達,要做世界的太初。”他說。這意味著,這家公司并不滿足于“國產替代”的位置,而是試圖打通從底層硬件到上層應用、從算力到Token的完整鏈路,在全球范圍內爭奪下一代AI計算體系的話語權。
楊晉喆說,如果只做GPU,創業公司本質上只能做英偉達生態的追隨者。單一架構的路徑不僅難以形成差異化,還會被鎖定在既有的軟件生態之中,難以掌握真正的技術主動權。
所以,太初元碁從成立之初就選擇了一條更“重”的路徑,不做單一芯片,而是構建“芯片+集群+軟件”的一體化計算體系,押注異構眾核架構與系統級能力。
楊晉喆告訴《態度》欄目,未來的競爭,不是單顆芯片的性能之爭,而是集群效率、系統協同與模型適配速度的綜合較量。“芯片的賽道雖然不是一個掙快錢的賽道,但AI 未來的核心市場在中國,相比英偉達我們會具備更大發展空間。”
在訪談中,他還回應了“自主可控”的標簽,楊晉喆坦言,自主可控只是一個小的目標,內部已經三年沒提過這樣的概念,自主可控最終仍然要回歸到創新。
以下為《態度》欄目與對話楊晉喆實錄(經調整):
網易科技:在你看來,未來AI芯片競爭的核心是算力、成本,還是模型適配能力?
楊晉喆:算力只是一張入場券,進入競技場后真正的比拼和較量,是成本跟模型適配的能力。算力是一個客觀的要求,是基礎門檻,只要達到基本閾值即可滿足需求,夠使就行。真正關鍵的,還是成本控制和模型適配能力。企業采購芯片,看的是整體 TCO 總擁有成本。一方面是你提供算力的實際成本,另一方面是把模型遷移、適配過來要投入多少人力、時間和額外開銷,這兩塊才是決定客戶選不選你的核心。
誰能把這兩點做好,誰就有真正的競爭力。
網易科技:你們選擇“芯片+集群+軟件一體化”,而不是專注做GPU,這背后的核心判斷是什么?
楊晉喆:太初在公司創立初期就已經形成核心判斷,之所以不聚焦做單一GPU,主要是基于兩方面的關鍵認知:
首先是基于我們對單一架構的芯片從技術維度上的理解,我們認為單一架構的芯片缺乏靈活性,尤其是對將其放置到一個長期發展的維度來看,是比較難去支撐時代發展的需求的。隨著智能體時代的到來,算力需求呈爆發式增長態勢,而目前單顆芯片的性能已經制約AI發展,未來一定會需要更高性能的計算系統來支撐大規模甚至超大規模的算力互聯。AI不再是單一場景應用,而是要賦能千行百業、支撐各類行業場景,而滿足復雜多樣的場景需求,必須依靠更通用的架構來支撐。但現階段GPU的通用性實際正在持續下降,大量AI模塊被硬化到芯片中,硬件固化就會直接削弱通用性,難以適配多元化、差異化的行業應用,這也是我們不聚焦做單一GPU的核心原因。
二是從創業公司的發展路徑來看,一旦確定專注GPU的架構,其實作為一個創業公司沒有其他的選擇,只能兼容英偉達CUDA生態。CUDA采用軟硬件協同的保護機制,前70%功能通過逆向工程比較容易實現,但剩余20%-30%的核心功能會極難破解,而且英偉達本身自己也還在不斷迭代升級。在這種路線下,創業類公司做國產GPU會很難形成差異化競爭優勢。換言之,創業型公司要搭建一套能代替CUDA的生態體系,這是非常困難的,并且復刻并不是一個很好的差異化商業選擇。
網易科技:太初未來更希望成為類似NVIDIA這樣的芯片公司,還是類似AWS的算力服務平臺?
楊晉喆:我們有一個宏大的愿景:不做中國的英偉達,而要成為世界的“太初”。在成立之初,太初就是朝著聚焦高性能計算的智能計算系統服務提供商的定位來設計,AI芯片是太初技術轉化的一個載體,但并不是唯一載體和形式。
我們跟英偉達這類芯片公司會有一些類似,不同的是太初服務于云端、大型集群等場景,集群化相關產品也會納入服務體系中。在此基礎上,太初也會推出類似 AWS 的算力服務平臺類產品形態,部分能力自主建設,部分會與合作伙伴聯合打造,通過生態共建的方式共同提供算力服務。而芯片與硬件系統,則是我們對外提供各類服務的基礎底座。
AI 時代到來后,行業已從單純輸出底層標準計算芯片,轉向從算力到Token的輸出模式。在我看來,AI 未來的核心市場在中國,我國擁有著龐大的應用市場,相比英偉達我們會具備更大發展空間。同時,太初不準備走單純“替代”這條路,不是只做芯片,只服務本土市場,而是要打通從上層應用到token再到底層硬件的一個結合,目標是成為全球算力服務提供商,掌握軟硬件定義權,實現真正自主可控。
網易科技:太初的核心競爭力是什么?
楊晉喆:太初服務的核心邏輯就是面向于未來全球市場或者叫做算力市場,也是剛剛提到的要做世界的“太初”。我們看到,目前包括英偉達等等這樣的企業,其實都在往異構的方向去轉變,太初成立之初就聚焦異構眾核,我們并不會面臨之前做的一些技術需要轉向異構這樣的“歷史包袱”。因此,我們做的最極致,也效率最高。當我們的產品投入到了一定的程度之后,在完全開放的市場里面,是會有我們自己的獨到的商業化優勢。
網易科技:太初元碁成立五年了,感受如何?經歷過哪些挑戰甚至質疑。
楊晉喆:堅持一種技術路線并長期走下來,這是最大的一個挑戰。芯片的賽道不是一個掙快錢的賽道,在面對產品市場、資本市場可能會存在的變化,我們能夠始終堅守去沿著我們的這種技術路線去持續地探索堅持下去,然后做我們認為計算領域或者是未來算力領域正確的這種產品形態的打磨,讓更多的人去認可我們,這個肯定是挑戰很大的。
早期,異構眾核的這個技術路線在國內的資本市場會遇到一些“質疑”,但是隨著全球技術的發展和我們一直以來的堅持,現在大家開始非常認可異構的理念,也逐漸認可太初在這一套技術體系下在做的事情。
網易科技:如果三年后太初沒有成功,你認為最可能出問題的環節在哪?
楊晉喆:對于“成功”我們不會用一些具體的事件或者標準來衡量,可能有的觀點會認為上市了是成功,但從企業長期發展路徑來看,這只是企業發展會經歷的一環。而像我們提到的愿景,也是一個時間周期非常長的事情,短期內太初會做并且應該做的,是繼續堅持我們的技術路線來打磨更多產品,服務市場對于算力的需求。
在這個基礎上,我想提另一個點:關于自主可控。我認為自主可控只是一個小的目標,如果你做的事情真的是創新的,那么它一定是自主可控的。自主可控是我們自己在內部已經有三年都沒有提過的這樣的一個概念,它是我們最基礎的一個,就是能達到的一個點,而國內其實在現在的階段,一部分是需要自主可控,但是自主可控的最終落腳點目前也仍然要回歸到創新。
芯片的話它做出來只是第一步,它上面的軟件的事情,其實軟件生態的這個東西也非常的關鍵。那么你做了一顆芯片,然后軟件這邊的事情掌握在別人的手里面,你也沒有辦法稱之為自主可控。所以只有說你的芯片從硬件到軟件的決定權都在你的手里面,然后這個時候才能稱之為自主可控,我認為太初從開始做這個公司一直堅守的就是這樣的一個理念。
我們做異構眾核,毫不夸張地說,是全球比較早就開始聚焦這個領域的團隊。剛剛提到太初最大的困難是什么,太初最難的事情是在于沒有作業可以去抄,面臨的風險就是創新的風險。沒有人,你抄不了別的人的作業,但是它的收益就是在于你一切的東西都可以去可控,當你真正的完成了你的商業化落地了之后,面向未來市場無論市場怎么樣變化,你都能夠最快速地去進行響應。
網易科技:太初的異構眾核架構,與傳統GPU相比,優勢在哪?
楊晉喆:異構融合已經成為計算體系架構的明確演進方向,英偉達、AMD等國際大廠及 Tenstorrent 等頭部芯片創業公司,都在持續迭代異構技術與產品布局。而太初元碁的異構眾核技術路線采用芯片級原生異構設計,將通用控制、加速計算與數據處理等不同類型核心深度集成于單芯片內,這種架構不僅具備更高的技術上限,還同時兼具 GPU 的高性能計算能力與 CPU 的編程通用性,為國產高端算力芯片突破現有技術格局、追趕國際領先水平,提供了一條自主可控且獨具優勢的發展路徑。
這樣的優勢會主要體現在:
首先是架構上更全面:我們在一顆芯片上就集成了通用計算核心、加速計算核心和數據處理核心等不同異構處理單元,而且支持統一內存尋址,計算精度能從FP4覆蓋到FP64,還能通過高速片間互聯技術,能支持基于內存語義的百卡規模Scale Up互聯。
其次是分工特別明確:我們讓每類核心都各司其職,這樣就避免了傳統GPU中不同類型任務會爭搶計算資源的結構性問題,可以把計算資源的高性能算力充分釋放出來,不浪費算力。
更靈活高效:除了支持傳統的Host-Device模式外,異構眾核可以在自主計算模式下作為獨立主機工作,這樣就能讓一部分負載在芯片上的通用計算核心上運行,不用在Host和Device之間頻繁地搬數據、通信,能給負載提供更高的性能。
在應用場景的應對上,這些優勢也會轉換成為“更能打、更劃算、更流暢”的硬核能力:
科學計算場景更能打:比如在超智融合這種科學計算場景中,單顆芯片就能同時滿足AI模型的低精度需求和HPC負載的高精度要求;而且在HPC和AI交替執行的場景里,相比于傳統CPU-GPU系統架構,可以在通用核心和加速核心之間提供更低延遲、更高帶寬和更高的性能表現。
大模型推理更劃算:在大模型推理場景中,相比傳統的CPU-GPU系統架構,異構眾核架構可將部分軟件棧運行在通用計算核心之上,進而降低Host側CPU和內存在整體系統中的占比,為應用提供更高的性價比。
Agentic場景更流暢:在Agentic LLM場景里,面對coding、chat、文獻分析等場景中超長上下文帶來的性能挑戰,相比傳統CPU-GPU系統架構,異構眾核架構可以優化CPU-GPU之間的數據通信性能和訪存效率,降低端到端系統延遲,讓用戶體驗更好。
網易科技:你們已經適配的多個大模型中,有多少進入了真實生產環境?
楊晉喆:今年春節以來,我們能看到,國產AI大模型的發展勢頭越發猛烈,甚至一度呈現“周更”趨勢。截至目前,太初依托自研AI加速卡與SDAA軟件棧的深度協同,完成了超過40個AI大模型的即發即適配,上線即可用,完整覆蓋了智譜GLM、阿里千問Qwen3.5、DeepSeek、Minimax等國內主流大模型廠商的新品,將行業普遍數周甚至數月的適配周期壓縮至天級,打破了模型迭代與國產化落地的時間壁壘。
我們的客戶對于國產AI大模型都有不同的需求,剛剛提到的40多個大模型適配后,很多也都走入了真實的落地場景中。在教科研領域,在智慧政務領域,在工業算力基礎設施領域都已經落地。比如,基于對通義千問與DeepSeek大模型的深度適配,我們攜手上海寶山行政服務中心打造并落地了“AI+”智慧政務便民應用“寶你HUI AI小寶”,為辦事群眾提供便捷高效的全流程智能化政務服務,累計服務用戶數萬名。
網易科技:客戶選擇太初,是會出于性能優勢,還是政策與供應鏈安全的考慮?
楊晉喆:綜合性的考慮。在性能方面,客戶的核心考量往往并非單點指標,而是集群化部署后,能否切實解決實際業務問題的綜合性能,這是我們的核心優勢之一。在商業化落地過程中,國內市場為本土企業提供了關鍵的培育環境,國家出臺的很多政策利好,也給市場提振信心來選擇國產。
太初采用開源開放生態,區別于部分閉源方案可能帶來的綁定問題,能讓客戶擁有更強的自主優化與定制空間,使用更放心、更靈活,這也是客戶傾向選擇我們的重要原因。
網易科技:你有關注龍蝦嗎,自己和團隊對它有什么見解?
楊晉喆:我們肯定是高度關注的。說得直接一點,作為一家AI芯片公司,如果連人工智能都用不好,那肯定是要掉隊的。
所以我們現在在整個芯片研發流程里,都在積極用 AI 做輔助,希望借助人工智能包括龍蝦,幫我們降成本、提效率。AI 會大幅縮短芯片的迭代周期、降低研發門檻,這是大勢所趨,我們必須提前做好準備,用最快的速度推進芯片研發迭代。
另一方面,對企業來說,未來的趨勢一定是人力投入越來越少、AI占比越來越高。誰能更早、更好地用好AI,誰就能在研發上領先一步。所以對我們而言,AI 既是挑戰也是機遇,同時也讓我們很有危機感。但它帶來的好處也很明顯:隨著 AI、智能體等技術越來越成熟,以前我們主要服務大型企業,未來 AI 可以覆蓋更多中小企業,整個市場的打通和增長速度都會明顯加快。
此外,在自身應用龍蝦的同時,我們也在緊跟行業需求,配套提供對應服務。3月18日,太初元碁發布了OpenClaw全棧國產化適配方案,同步推出了開箱即用的太初龍蝦一體機(TecoClaw)。大家可以去了解一下。
