網易首頁 > 網易號 > 正文 申請入駐

GMI Cloud蔣劍彪:全球AI產業的范式轉移,從“模型為王”到“系統制勝”

0
分享至


4月21日至22日,以“奔赴AGI 重塑未來”為主題的2026中國生成式AI大會(北京站)圓滿舉行。

這場大會集結73位產學研投嘉賓,通過1場開幕式、3場專題論壇、6場技術研討會,全景式解析AI產業的產業脈絡、創新范式、Token經濟與中國機會。

議題跨度很大,從大語言模型、多模態模型、世界模型、智能體、AI眼鏡等前沿模型與應用,到數據、芯片、存儲、通信、云服務等基礎設施。

在這場信息密度超高的大會上,GMI Cloud中國區總裁蔣劍彪帶來了題為《全球AI產業的范式轉移——從“模型為王”到“系統制勝”》的主題演講。

蔣劍彪在演講中指出,大模型從2023年進入大眾視野,到2026年全面滲透到各行各業,行業競賽的核心已發生根本性轉移:不再是比誰的模型參數更大、誰的研究論文更多,而是看誰能構建一整套完整的系統工程能力。從單個模型的性能比拼,到數據、算力、調度、應用的全鏈路系統集成,AI產業的勝負手正在從“模型為王”轉向“系統制勝”。

GMI Cloud是英偉達在全球遴選的七家Reference Platform NVIDIA Cloud Partner之一,其總部位于美國硅谷,在美國、歐洲及亞洲多地擁有基于H200、B300、GB200、GB300等自建智算中心。

在蔣劍彪看來,2026年的AI市場呈現出四大鮮明特征:第一,推理幾乎完全取代訓練,成為AI基礎設施的主戰場,客戶需求從千卡集群迅速收縮至256卡級的輕量化推理集群,且追求低延時與高性價比;第二,AI Agent從實驗室走向生產,國內大廠對Token業務的規劃已是十倍、百倍的增長,算力市場徹底轉為賣方市場,客戶不得不提前8-10個月鎖定資源;第三,AI Coding推動“一人公司”(OPC)爆發;第四,智算中心正從“存儲倉庫”重構為“算力工廠”,即面向大規模AI訓練與推理的一體化AI Factory,追求極致算力密度、能效比和Token吞吐量,實現統一編排與全局調度。

面對這四大浪潮,GMI Cloud的應對策略清晰而堅決:在全球自建萬卡集群,快速迭代Inference Engine平臺,以幫助AI出海企業獲取高性價比算力。據悉,不久后,GMI Cloud還將上線全新產品「The GMI CLAW MARKETPLACE」。

值得一提的是,GMI Cloud啟動了全球AI探路者計劃,面向全球AI領域KOL、企業伙伴、社區伙伴共建出海內容生態,實現平臺與創作者雙向賦能;下半年,GMI Cloud全球AI Startup 加速計劃也將陸續推出,入選團隊將有機會獲得價值萬元美金的Token、對接全球頂級VC及多地路演機會。

以下是演講實錄:

一、GMI Cloud:英偉達的全球七家Reference Platform NVIDIA Cloud Partner之一

各位下午好,非常榮幸有機會與大家分享GMI Cloud在近兩年AI快速發展歷程中的一些經驗。


從2023年大模型進入大眾視野,到2026年它已逐步深入各行各業的生產環境之中。這四年的發展極為迅猛,從最初大家專注于各類算法的研究,到如今人手一個“小龍蝦”,這種變化給我們帶來了極為強烈的震撼。

我先簡單介紹一下GMI Cloud。GMICloud是一家基于AI Native原生人工智能)的NeoCloud公司,我們在全球部署了大量的數據中心,這些數據中心全部采用最新的英偉達頂尖算力卡,包括B300、GB300等。同時,GMI Cloud也是英偉達全球七家Reference Platform NVIDIA Cloud Partner之一。GMICloud協同英偉達全球多地構建AIFactory。


除了擁有頂級算力的AI Factory,GMI Cloud還打造了面向AI應用的云原生算力管理調度平臺——Cluster Engine。此外,因為現在越來越多的業務已經從底層的算力開始變成上層的Token,我們在去年底又推出了新的產品GMI Cloud Inference Engine(推理引擎),在全球市場,尤其是北美市場,集成全球最先進、最新的頂尖模型,提供MaaS(模型即服務)服務,滿足AI應用企業直接API調用需求。

接下來我重點講一下GMI Cloud的整體布局。GMI Cloud的總部在硅谷,所以我們在美國的算力布局是最密集的,其次是在歐洲,亞洲的日本、中國臺灣,以及澳大利亞。在這些地區,我們陸續上線的集群基本上基于英偉達的H200、B300、GB200、GB300。比如即將在曼谷和中國臺灣上線的集群就是基于GB300,明年將在日本上線的集群則是基于Vera Rubin。

二、行業四大趨勢:推理主戰場、Agent爆發、AI Coding與“一人公司”、智算中心重構

如今,行業普遍認識到,AI領域的發展節奏極快,幾乎每隔半年或一年便會涌現出全新的熱點。縱觀整體AI市場,競爭焦點已發生根本性轉移:從最初局限于算法本身的比拼、算法研究的較量,逐步演進為系統層面的綜合能力競爭。

對于企業而言,若想在AI領域真正取得成功,單純依靠構建一個出色的算法已遠遠不夠。核心在于打造一整套完備的系統能力,唯有如此,方能在激烈的市場競爭中贏得主動權。


具體來看,這套系統能力包含四個層面:推理系統負責統一調度全球算力,在保證低延遲的同時最大限度優化吞吐與成本;Agent協同系統支撐高Token比、復雜任務規劃及多工具、多API的調用,實現智能體的快速構建與高效協作;智算基礎設施系統將分散的智算中心整合成高效的“算力工廠”,提升資源利用率;全球化交付與安全系統則用一套架構覆蓋全球,確保數據合規、鏈路可控、運維統一,讓企業無需為每個區域重做一套AI。唯有構建起這四個系統協同發力的完整能力,才能在這場競爭中真正實現“系統制勝”。


具體來說,趨勢一:模型能力決定上限,推理效率決定商業價值。前幾年,行業集群主要聚焦于訓練任務,每個集群需配備大規模的GPU及存儲資源。然而今年,一級市場上涌現的主要是各類推理服務,整個一級市場已轉變為賣方市場。客戶對推理集群的需求也從原先的千卡、兩千卡規模,逐步下降至僅需32臺(即256卡)即可滿足。

這表明推理市場的競爭已日趨激烈,企業的關注重點正從單純追求模型參數規模,轉向落地效率、高性價比以及低延時推理服務,這一領域已成為行業角逐的主要戰場。


趨勢二:Token消耗呈現千倍級增長,推動推理系統革新。2025年,AI Agent雖然已成為行業熱點,但當時更多停留在概念討論層面,尚未真正融入用戶的工作與生活場景。因此,大多數人對Agent的感知并不強烈,它主要存在于AI初創公司的產品概念中。

然而,進入2026年,Agent已開始從實驗室走向實際生產環境。尤其是Claude Code等產品的問世,其后端任務復雜度極高,導致Token調用量的增長速度遠超我們去年的預期。

去年,業界對Token增速的預期約為十倍。進入2026年,包括國內大量頭部企業,其對Token業務的規劃已達到十倍乃至百倍的增幅。需求的急劇膨脹,給底層基礎設施帶來了巨大壓力。

與此同時,整個算力市場已由買方市場徹底轉向賣方市場,GPU資源供不應求。在此背景下,絕大多數海外客戶已開始提前八至十個月鎖定未來的定制化算力資源。2026年最為顯著的特征將是AI的規?;虡I落地,Token總量預計將飆升至千倍量級,這對整個推理架構構成了前所未有的挑戰。


趨勢三:AI Coding大幅降低開發門檻,催生OPC模式爆發。AI Coding在去年已經比較熱了,今年隨著Claude推出Claude Opus 4.5、Opus 4.6、Opus 4.7,在性能和效率方面越來越高,也推動了“一人公司”的爆發。

大量AI生成的音樂、數字人、短劇、視頻乃至虛擬音樂會開始涌現,在B站等平臺上隨處可見,這些內容已逐步融入大眾日常生活,且呈現出極高的制作水準。隨著2026年下半年新一代多模態大模型的陸續發布,內容生產門檻將進一步降低。


趨勢四:智算中心從存儲倉庫轉向算力工廠以往數據中心主要聚焦于“通算”,如今已全面轉向“智算”。智算的目標也從充當通算的替代品,逐步轉向追求極致的算力密度、能效比以及Token吞吐量,這些已成為衡量智算中心的核心指標。

Vera Rubin將于今年7月實現量產,預計明年全球范圍內的Vera Rubin智算中心將陸續投入交付,其在Token吞吐能效比方面的表現將更為突出。

三、GMI Cloud的策略:AI工廠、萬卡集群與Inference Engine

所以作為一家全球AI Native Cloud公司,GMI Cloud如何去承載這些行業未來發展的趨勢?


第一,我們會在全球構建AI工廠。GMI Cloud有最快的、最優的GPU供應鏈,具備頂級的渠道,基于與英偉達的深度聯動,能夠確保最新、最頂級的卡最快速供給,同時我們的交付速度以及性能調優都有助于提供給用戶一個非常強大的AI Factory。

第二,我們已在全球多地啟動萬卡集群的自建工作。包括位于中國臺灣桃園的機房,以及計劃于明年在日本和泰國建設的數據中心,均已陸續開始部署GB300這一級別的頂尖算力。

四、基于Inference Engine的優秀實踐:ModCraft——用Agent為《我的世界》生成模組

除了上述提到的算力中心的布局,GMICloud還提供MaaS級Token服務。GMI Cloud Inference Engine(推理引擎)平臺,旨在幫助用戶快速獲取最新模型及相應專屬折扣,助力出海AI應用公司以較高性價比獲得Token資源。


該平臺具備廣泛的模型聚合能力、原生托管支持以及生成優化功能。目前,已有眾多用戶基于Inference Engine平臺開展業務,并打造出優秀的產品。

接下來,有請我們的優秀創作者代表,分享他如何借助Inference Engine平臺進行產品創作。歡迎ModCraft團隊:

大家好,我是劉澈,是ModCraft的負責人。與GMI Cloud合作以來,我們已取得多項產出。在介紹具體成果之前,先簡要說明一下項目背景:我們致力于為《我的世界》游戲開發一款用于自動生成模組的Agent。


部分觀眾可能對《我的世界》較為陌生。作為全球最知名的沙盒游戲之一,《我的世界》月活躍用戶高達2.04億。所謂模組(MOD),是指玩家將自創內容添加至游戲中的載體。例如,若要添加家具類物品(即玩家可放置、使用或交互的裝飾性元素),或創作一個魔法主題、戰斗主題的模組,開發者需先編寫相應代碼,隨后安裝至游戲,方可呈現預期內容。

根據統計數據,MOD玩家達到4400萬左右,而真正開發MOD的開發者卻只有10萬左右。為什么會有這樣巨大差距?主要還是因為創意和開發實踐之間存在鴻溝。

開發《我的世界》模組并非易事。開發者需要掌握Java編程語言與Gradle構建工具,深入研讀游戲提供的API文檔,甚至可能需要直接閱讀游戲源代碼,因為游戲版本迭代頻繁,API可能隨之變動。此外,還需具備3D建模、音頻工程等多方面的技能。因此,在Reddit、Discord等社區中,經??梢钥吹酱罅客婕以敢飧顿M委托開發者為其定制所需的模組。

因此,我們做了這樣一個平臺,希望用Agent來為《我的世界》生成相關的模組。這樣,用戶就可以使用自然語言生成自己想要的東西。

以下是我們已部署在ModCraft平臺上的一個演示案例。用戶可創建一個新的工作空間,例如設計一個名為“海藍寶石戒指”的物品。界面中央為Canvas模塊,右側為與AI對話的區域。以用戶輸入“我需要海藍寶石及其配套工具”為例,AI將解析其需求,判斷除了海藍寶石本身之外,可能還需要劍和鎬子等輔助資源,隨后在界面中央生成相應的結果。在此過程中,用戶可對大量nodes(節點)或DSL(Domain Specific Language,領域特定語言)進行細致的調整與修改。


我們通過不同的node將游戲中的各類元素進行連接,例如recipe(合成配方),并支持對其進行進一步的微調。此外,平臺還支持為游戲內的物品生成相應的texture(紋理貼圖),用戶可選取某一紋理后進一步編輯,如添加黑色邊框、將顏色調整為紅色等。

如此一來,用戶無需自行學習像素風格繪畫,即可創作出符合自身需求的游戲內容。在所有紋理貼圖生成完畢后,只需點擊相應按鈕,即可生成一個可在游戲中實際運行的模組。

以上為前端呈現的效果。那么,底層的Agent架構是如何設計的呢?當前行業內存在一個競品,其架構相對簡單:用戶直接向大語言模型發送prompt(提示詞),模型直接返回代碼并以此生成相關內容。

但是我們希望可以讓用戶看到中間態的東西,比如剛才看到的那些nodes,并可以進一步對它進行微調,真正讓MOD的創作由用戶來決定。

為此,我們設計了一套全新的架構:用戶輸入的prompt經由大語言模型處理后,首先轉化為一份被稱為spec(規范文檔)或DSL的中間表示。我們專門為《我的世界》模組生成編寫了一套DSL,其底層直接采用YAML語言實現。


該DSL支持約63種不同類型的node(節點),涵蓋此前展示的items(物品)、blocks(方塊)、recipe block(配方塊)等,同時還支持自定義維度及生物群系的實現。

根據這樣的架構,代碼生成都是基于中間那個DSL想要的模塊去生成的,所以問題會非常少。其次因為中間態的展示,讓用戶可以看到很多東西,可以真正意義上理解自己在生成什么,而且是extendable(可擴展)和rollback supported(支持回滾)的。

我們的整個架構就像git commit(代碼版本控制系統中的提交操作)一樣,每次對話都會向中間表示中提交一部分內容并完成相應修改,用戶可以隨時rollback到之前的任一版本。

此外,spec作為唯一真實來源,避免了多輪對話中意圖丟失的問題。相比之下,競品在大語言模型多輪交互后,往往會出現注意力分散、意圖模糊等情況。而我們始終將中間層的DSL作為唯一真實來源,大語言模型可隨時參考該中間表示,清晰知曉已生成的內容、待完成的部分以及各元素之間的關聯關系。

此外,該架構采用數據庫變更式的迭代方式,即小步迭代,用戶可在測試當前生成內容正常運行后,再執行下一步操作。而競品在生成過程中一旦出現問題,通常需要從頭開始重新生成,無法回退至某一中間狀態繼續迭代。

講完我們的技術架構之后,再講一講我們和GMI Cloud的合作。


我們借助GMI Cloud的Inference Engine調用了多種模型。由于業務面向北美市場,我們需要將服務器部署于北美,并保持前述的調用速度。

我們利用GMI Cloud Inference Engine調用不同模型以實現不同功能。例如,DSL生成采用Kimi或Arc,Java文件生成則使用Codex,因其代碼生成能力較強。自然語言生成方面選用Gemini,目前使用的是Gemini Flash 2.0 Pro版本,主要因其成本較低。未來我們也會在該平臺上調用其他模型,如需升級,例如更換為Banana或其他模型,均可實現。

此外,我們的代碼生成同樣基于Codex模型。此處展示的是我們后端系統的部分實現。目前,我們均可直接通過GMI Cloud調用多種不同模型,且多數接口具備良好的兼容性。非常感謝大家,接下來把時間交還給劍彪。

五、新品發布:GMI Claw Marketplace

基于剛剛講的一些產品應用場景,我們不久之后,即將推出一個新的產品——TheGMI Claw Marketplace。


基于Claw Marketplace,我們提供端到端的解決方案。在Marketplace上,我們為客戶提供開發者工具包、Model Library、API Key的管理,以及大量的生態插件和存儲服務。該平臺同時面向企業級客戶與AI開發者兩大場景:

  • 面向企業商業用戶,我們將與用戶共同探索解決方案,提供一鍵部署服務與自動化工作流,形成完整的打包方案,攜手服務終端市場。
  • 面向AI開發者創作者,我們主要提供企業級托管服務,并針對API接口進行智能調度。在商業化變現與規模化擴展方面,我們將與開發者共同推進更深度的市場合作。


六、GMI Cloud開放全球生態合作:全球AI探路者計劃+AI Starup加速計劃

GMI Cloud今年年初推出了一個全球生態計劃。我們號召全球AI行業內的大牛和AI應用廠商伙伴、社區伙伴一起加入計劃,共同關注AI出海、AI產業發展。

GMI Cloud在全球設有多個辦公室,包括新加坡、日本、臺灣、美國、香港等地,并將定期舉辦大量路演活動。

我們希望聯合優質內容創作者,通過真實的產品體驗與內容輸出,打造AI出海的權威發聲矩陣,實現平臺與創作者之間的雙向賦能。目前已有眾多品牌合作伙伴加入,我們也誠摯邀請更多社區伙伴、AI應用廠商及基礎模型廠商共同參與。

除了剛提到的“全球AI探路者計劃”外,GMI Cloud下半年還將在全球多個城市同時面向AI初創企業開啟“GMICloud全球AIStarup加速計劃。加入此計劃的團隊,將獲得價值一萬美金的Token支持,并一站式觸達多家全球頂級VC,獲得GMI Cloud及其計劃其他合作伙伴提供的網絡、數據庫、算力等創業大禮包,屆時大家可以以團隊、企業組織的名義,參與計劃進階訓練營,在全球多地進行路演。


以上,感謝大家的聆聽,GMI Cloud將持續關注中國AI企業出海與算力基礎設施產業發展,請大家持續關注我們。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
重慶中小學今年暑假放假時間,已確定

重慶中小學今年暑假放假時間,已確定

上游新聞
2026-05-06 19:53:02
美國賣烏克蘭1200套JDAM,俄真正麻煩的不是導彈而是“廉價精準”

美國賣烏克蘭1200套JDAM,俄真正麻煩的不是導彈而是“廉價精準”

桂系007
2026-05-06 09:38:30
云南一女子遭大象襲擊身亡,入土7天后墳墓又被破壞,調查發現,竟是大象復仇?

云南一女子遭大象襲擊身亡,入土7天后墳墓又被破壞,調查發現,竟是大象復仇?

譚老師地理大課堂
2026-05-06 14:55:09
Claude Code之父紅杉演講震撼全場! 26年未寫1行代碼, 電腦都不開了

Claude Code之父紅杉演講震撼全場! 26年未寫1行代碼, 電腦都不開了

新智元
2026-05-06 17:15:48
全固態硬盤時代結束了?2026年裝機新邏輯

全固態硬盤時代結束了?2026年裝機新邏輯

野生運營
2026-05-05 21:05:19
晚年看透現實:有錢有房沒用,子女安穩才是真底氣

晚年看透現實:有錢有房沒用,子女安穩才是真底氣

九哥哥車評
2026-05-06 19:29:12
利好突襲!剛剛,熔斷,暴漲!

利好突襲!剛剛,熔斷,暴漲!

中國基金報
2026-05-06 09:23:57
三千年考古史最大遺憾:西周三十七個君主陵墓,竟然全都沒找到

三千年考古史最大遺憾:西周三十七個君主陵墓,竟然全都沒找到

抽象派大師
2026-05-06 16:30:44
趁女神睡著偷親了她一口,她突然睜開眼,壞笑著說:親完可得負責

趁女神睡著偷親了她一口,她突然睜開眼,壞笑著說:親完可得負責

千秋文化
2026-05-04 18:23:56
奧園全面違約

奧園全面違約

地產微資訊
2026-05-06 15:35:24
特朗普:談美伊達成協議“為時過早”

特朗普:談美伊達成協議“為時過早”

新華社
2026-05-06 21:08:38
伊朗外長抵京后!特朗普態度180度轉變:連說中國三句好話夸贊!

伊朗外長抵京后!特朗普態度180度轉變:連說中國三句好話夸贊!

藍色海邊
2026-05-06 19:17:18
醫生發現:大量喝茶的高血壓患者,用不了多久,身體或有2個變化

醫生發現:大量喝茶的高血壓患者,用不了多久,身體或有2個變化

醫學科普匯
2026-05-06 20:40:10
剛剛,今年第5號臺風生成!東莞天氣大反轉!

剛剛,今年第5號臺風生成!東莞天氣大反轉!

東莞好生活
2026-05-06 20:18:38
1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

興趣知識
2026-05-05 17:43:16
利好來襲!剛剛,集體大漲!美伊談判,傳來重磅消息!

利好來襲!剛剛,集體大漲!美伊談判,傳來重磅消息!

數據寶
2026-05-06 19:06:37
我國又一款摩托車奪冠!春風動力在世界摩托車大獎賽上大幅度領先

我國又一款摩托車奪冠!春風動力在世界摩托車大獎賽上大幅度領先

科普大世界
2026-05-05 21:57:22
純電版桑塔納?雖是惡搞,但熱度極高!

純電版桑塔納?雖是惡搞,但熱度極高!

熱點科技
2026-05-05 15:51:10
小楊哥一家四口罕現身!懶理大徒弟小黃背刺,二二因勞累被推著走

小楊哥一家四口罕現身!懶理大徒弟小黃背刺,二二因勞累被推著走

裕豐娛間說
2026-05-05 10:25:42
SGA:第一天就知道切特對籃球多么投入 像他這樣的人都會成功

SGA:第一天就知道切特對籃球多么投入 像他這樣的人都會成功

北青網-北京青年報
2026-05-06 19:59:08
2026-05-06 21:36:49
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
11749文章數 117061關注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當庭戳老底

頭條要聞

知情人士:伊朗將同意將鈾濃縮材料運出伊朗

頭條要聞

知情人士:伊朗將同意將鈾濃縮材料運出伊朗

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續10年為張一山慶生

財經要聞

最新GDP!全國30強城市,又變了

汽車要聞

領克10/領克10+ 無論能源形式 領克都要快樂

態度原創

手機
健康
教育
房產
親子

手機要聞

REDMI K90 Max首銷周表現曝光,后續新機待發布

干細胞治燒燙傷面臨這些“瓶頸”

教育要聞

“潮”人出動!沖沖沖!

房產要聞

遙遙領先!這個澄邁頂流紅盤,憑什么持續霸榜

親子要聞

跟著荷蘭奶奶學識顏色

無障礙瀏覽 進入關懷版