網易首頁 > 網易號 > 正文申請入駐

“AI云新貴”Nebius CEO：“四層架構”對抗巨頭，“只有不斷移動才能生存”

2026-06-12 16:42:41　來源: 華爾街見聞官方

上海舉報

分享至

面對資本支出規模約為自身八倍的超大規模云服務商，市值約570億美元的AI基礎設施公司Nebius，正以一套從物理層延伸至智能體層的"四層架構"尋求差異化生存空間，并將客戶多元化與軟件平臺能力視為抵御行業整合壓力的核心武器。

Nebius聯合創始人兼首席商務官Roman Chernin近日在訪談中闡述公司競爭戰略。他表示，Nebius今年資本支出計劃為200至250億美元，而超大規模云服務商的同期資本支出規模約為Nebius的八倍。盡管存在明顯資本劣勢，Roman認為AI基礎設施當前處于起點而非泡沫階段——在他看來，代碼生成是目前唯一真正在規模上跑通的AI應用場景，而這一突破距今不過數月。

資本市場對Nebius的關注度正在升溫。知名分析師Leopold Aschenbrenner近期披露，Nebius占其個人投資組合約15%，持股比例約為5.3%，消息公布后公司股價出現跳漲。Roman對此保持克制："這是交付的機會，不是慶功的理由。回去做好工作。"

然而Roman坦言，公司面臨的最大威脅并非直接競爭，而是行業過度整合。"如果世界最終只剩三五家超級公司控制一切，Nebius就只能在物理層為它們提供服務。世界越多元化、越去中心化，我們的生存空間就越大。"他以鯊魚自比——"你游動，你才活著，我們必須不斷前進。"

AI基礎設施：起點而非泡沫

對于外界關于AI基礎設施泡沫的擔憂，Roman給出明確否定。他認為，真正意義上的算力需求規模化普及才剛剛開始，目前AI唯一真正跑通的規模化應用場景僅有編程一項，而這一突破發生在數月之前。

"即便你去看全球技術上相當先進的大公司，他們在AI應用上也才處于起步階段，用在第一個百分之幾的業務量上。"Roman以DeepSeek事件作為佐證：約15個月前DeepSeek發布當周，Nebius股價單周下跌約40%，市場擔憂AI基礎設施需求將萎縮；然而同一周，Nebius銷售額創下公司歷史最佳。

他將這一現象概括為AI領域的"杰文斯悖論"：每次智能變得更便宜，行業不會減少算力消耗，而是用同樣的預算去解決更復雜的任務，或終于可以經濟可行地解決那些此前成本模型跑不通的問題。"這種經濟效益改善的動態，是非常值得觀察的。"

"四層架構"：從裸金屬到智能體

Nebius的核心競爭策略體現在其產品體系的分層設計上。Roman將公司的產品架構分為四個層次，認為越往高層走，可服務的客戶群體越大，差異化壁壘也越高。

第一層是裸金屬基礎設施，面向微軟、Meta等超大規模客戶，以兆瓦為計量單位提供大宗算力合同。Roman坦言，這一層全球客戶可能只有幾十家，且客戶自帶完整軟件棧，基礎設施供應商能提供的附加價值有限。

第二層是多租戶云，面向數百至數千個研究型團隊，提供包括存儲、計算、網絡虛擬化在內的完整云環境，以GPU小時為計量單位。客戶登錄即可獲得配置好的集群，直接開始訓練或推理，無需處理底層基礎設施。

第三層是托管推理平臺，即Roman所稱的"Nebius Token Factory"。目標客戶是垂直AI公司和企業客戶——他們構建產品，不做模型，不想自行處理GPU部署和推理優化，以Token為單位消耗算力。Roman表示，這一層可服務客戶規模可達數千家。

第四層是尚在前瞻規劃中的智能體層。在這一層，開發者無需考慮調用哪個模型或消耗多少Token，只需提交任務，由平臺引擎自動決策執行路徑——包括何時調用更智能的模型、何時并行調用多個輕量模型再由裁判模型擇優。Roman表示，這一層將直接與OpenRouter等平臺競爭，可服務開發者規模將達數萬乃至更多。

Token Factory：以系統優化降低推理成本

Roman在訪談中披露，Token Factory目前支持約60個開源模型，通過模型蒸餾、投機解碼、緩存優化等系統級技術手段，最高可將推理成本降低70%。他強調，這一成果并非依賴價格戰，而是將模型打造成一個系統，在特定需求和約束下以最優經濟效益運行的結果。

Token Factory同時為客戶解決了開源模型頻繁迭代帶來的運維壓力。Roman指出，目前幾乎每隔數周就有新模型發布，每次新模型在某些基準測試上表現更優，但在另一些上未必。客戶需要持續實驗和切換，而這一負擔由平臺承擔，確保客戶始終運行在性能前沿。

Roman以金融科技公司Revolut為例說明企業客戶遷移路徑：該公司最初99%的推理預算集中在OpenAI等封閉模型上，隨應用場景擴大經濟模型難以為繼，開始轉向開源模型。這一過程需要先行建立評估體系和AI開發的CI/CD流程——Roman認為這一基礎性投資被市場嚴重低估。但一旦基礎打好，客戶AI使用量便會指數級增長。"你從外面看，會覺得這些公司增長很慢，但這是在打基礎。等他們打好基礎，就會爆發式增長。"他預計，Revolut、Shopify、Booking.com等云原生企業完成冷啟動后，AI使用量將出現爆發。

開源與封閉模型：并非零和博弈

Roman明確反對將"開源 vs. 封閉"視為對立命題。他認為，開源模型的崛起對OpenAI、Anthropic等前沿模型提供商的沖擊，遠不如市場擔憂的那么大。

其邏輯在于：前沿模型提供商始終在向下一個前沿邁進，尚有大量未解決的任務等待攻克；每當某個任務找到更高效的解決方案，行業不會減少總算力消耗，而是將同等預算投入更復雜的未解決問題。"Anthropic和OpenAI還有大量尚未開墾的市場，仍在指數級增長。"

與此同時，他指出開源模型最重要的特性不只是開放，而是可微調、可繼續訓練，能夠在特定場景下構建出性能超越通用前沿模型的專用模型。他預計，隨著生命科學、機器人、網絡安全等垂直領域專用模型持續涌現，這種分層化趨勢將進一步深化，整個生態足以容納不同層級的參與者共同獲益。

資本劣勢與生存哲學

面對超大規模云服務商的資本碾壓，Roman的態度坦率且務實。他表示，若手握十倍資本，公司只會做一件事：更快建設更多數據中心、填入更多GPU。但他同時強調，資本在短期內并不能解決所有問題。"未來6個月，錢解決不了問題——6個月太短了，你只能用手里有的資源交付。到了24個月的維度，資本才能真正解鎖大量事情。"

針對約40%數據中心規劃審批遭拒的行業現狀，Roman將其定性為組合管理問題：通過保持充分超額儲備，即便某個項目延誤，仍能向客戶交付足夠容量；大多數客戶工作負載不綁定特定物理位置，可靈活調配。

在更深層的戰略判斷上，Roman認為Nebius最大的商業風險不是某個具體競爭對手，而是行業走向過度整合——少數超級平臺控制一切將大幅壓縮獨立基礎設施供應商的價值空間。他以樂觀主義者自居，相信人類內在的探索與創造沖動將推動世界保持多元化，但他也承認這并非確定結論。

"就像鯊魚——你游動，你才活著。我們沒有時間停下來慶功，必須不斷前進。"Roman說。

以下為訪談文字實錄：

主持人：Roman，我太期待這次對話了。我認為Nebius是過去幾年里最不可思議的故事之一，而未來幾年更是令人振奮。感謝你接受我們的邀請。
Roman：感謝邀請，很高興來到這里。
AI基礎設施：泡沫還是起點？主持人：我想從一個很多人都在思考的問題開始——我們現在處于AI基礎設施的哪個階段？很多人看到涌入的資本，認為這是泡沫；也有很多人說這才剛剛開始。你怎么看待當前AI基礎設施是否存在泡沫？
Roman：我不認為這是泡沫。泡沫怎么定義？如果問我是否相信我們需要再建設數十倍乃至數百倍的算力——我完全相信，當然我可能有些偏頗，畢竟如果我不這么相信，我也不會在做我們正在做的事。
我認為，我們正處于這個偉大時代的起點，Jensen稱之為"有用的AI"，而真正意義上的規模化普及才剛剛開始。誠實地說，在所有可能的應用場景中，目前真正跑通的大概只有一個，那就是代碼——編程場景大概是幾個月前才開始真正發揮作用的。所以請把這件事放在正確的視角下看：我們距離第一個真正在規模上跑通的應用場景，也不過才幾個月的時間。
如果你去看全球任何一家公司——除了那些跑得最快的初創公司——看看他們的AI應用程度，你會發現他們才剛剛開始，用在第一個百分之幾的業務量上，探索第一批應用場景。哪怕是技術上相當先進的大公司，也才處于起步階段。所以我的判斷是，我們還只是剛剛開始。
即便你不相信馬斯克關于未來和太空的一切愿景，僅從企業落地的角度來看，這也只是第一步。
開源對OpenAI和Anthropic真正的沖擊主持人：過去6到12個月，代碼場景確實跑通了。但有一種觀點認為：由于成本問題，企業將大規模轉向本地部署的開源模型，這個轉變即將發生。如果真的發生，對OpenAI、Anthropic這樣的模型提供商，以及對Nebius，都會是打擊。這種觀點哪里錯了？
Roman：首先，這不是未來的事，這已經是現在進行時了。我們看到很多案例——當一個客戶或產品構建者達到一定規模后，他們就會開始尋找改善經濟效益或加速增長的方法，這時很多人自然會開始考慮替代模型。
今天最好的建法，當然是在OpenAI、Anthropic、谷歌這樣的一流提供商的前沿模型上構建，因為他們確實提供了全球最頂尖的能力。但是，當你把應用場景跑通、看到用戶數據飛輪開始轉動之后，你可能會發現有成本更低或質量更高的方式來服務同樣的場景。你不需要全球最強的通用模型，你可以構建一個專用模型，在你的特定場景下表現甚至更好。
這些開源模型最重要的特點不僅僅是開放，而是它們可以微調、可以訓練——你可以在它們的基礎上繼續訓練，構建出在特定場景下性能更優的專用模型。
但這為什么不會傷害Anthropic和OpenAI？因為它們始終在向下一個前沿邁進。還有太多未解決的任務，或者說預算不受限制的任務，尚待解決。每當我們找到更高效地解決某個任務的方式，我們不會減少使用量，而是用同樣的預算去解決更復雜的任務——這是一段持續的旅程。你始終在推動前沿，始終有更復雜的問題等待解決。一旦解決了，你可以向下遷移，降低成本或提升質量。而現在有太多未解決的任務，Anthropic和OpenAI還有大量尚未開墾的市場，仍在指數級增長。
主持人：你真的相信這一點嗎？這些公司很多估值已經達到萬億美元、趨于完美定價。如果它們創造的價值不斷被侵蝕，而它們還要持續地從一個價值點跳躍到下一個價值點，同時開源不斷從后方蠶食……你得持續找到足夠多的問題，這日子不好過吧？
Roman：其實大多數人的擔憂恰恰是另一面——開源環境和專用模型生態是否足夠強大，能不能撐起這個底座。我認為我們還處于如此早期的應用階段，未解決的問題如此之多，關鍵在于整塊蛋糕的大小。我認為這塊蛋糕足夠大，無論是最前沿的模型能力，還是高度調優的特定場景模型，以及我們可以在其上構建的整個開源和專用模型生態，都能分得一杯羹。
有個故事我很喜歡——大約15個月前發生了DeepSeek時刻，你應該記得，當時Nebius的股價在一周內下跌了大約40%。而諷刺的是，就在同一周，我們的銷售額創下了公司歷史最佳。市場擔心AI變便宜了、基礎設施公司不再被需要，但與此同時，大量用戶發現他們可以用DeepSeek在生產環境中跑推理，而且經濟模型跑得通，Cursor也在那時開始騰飛，成為最早從這些模型微調中受益的公司之一。
每次智能變得更便宜，我們不會減少消費，而是增加消費——因為我們可以在同樣的預算下解決更復雜的任務，或者終于可以經濟可行地解決那些我們早就知道技術上能解決但成本模型跑不通的問題。這種經濟效益改善的動態，是非常值得觀察的。
杰文斯悖論：AI越便宜，需求越大主持人：說到杰文斯悖論——產能提升反而帶動更多需求——那你現在哪些方面推進得還不夠快，希望可以更快？
Roman：我們從四個維度來思考公司的建設。
第一個維度是容量——我們有多少兆瓦、吉瓦的算力，部署了多少GPU。我們是基礎設施公司，必須足夠大，如果規模不夠，沒人需要我們的存在。團隊在這方面做得很出色，但永遠不夠快，因為現實世界有很多障礙——新建一個數據中心要走完整的供應鏈、監管審批流程，還要應對火災、水患以及現實中發生的各種突發情況。
第二個維度是產品——要足夠快地適應新型工作負載和新型客戶群體。
AI基礎設施的四層架構Roman：這個行業從最早建造模型的公司開始——OpenAI、大型超大規模云服務商、大型實驗室等——他們對基礎設施的需求基本上就是"給我算力"，市場上也確實有很多大型裸金屬合同，我們也在做。但這只是我們構建內容的第一層：規模化的物理基礎設施，供微軟、Meta這樣的大客戶大規模消耗。
第二層是我們稱之為"多租戶云"的層級，面向以研究為主但規模更廣的客戶群——數百乃至數千個團隊，他們不想處理物理基礎設施，想要托管基礎設施，即云計算層面的基礎設施即服務，包括存儲、計算、網絡的虛擬化，以及API、可觀測性、安全性等一套完整的云環境。你登錄進來，集群就給你撥好了，你可以直接開始訓練或推理，管理自己的應用或工作流，基礎設施的事交給我們。
第一層用兆瓦來衡量，大家在大合同里談的是兆瓦數；第二層用GPU小時來衡量，因為你賣的是高效的算力時間，附帶存儲和輔助服務，但核心單位還是算力。
第三層是托管推理。客戶不想糾結GPU小時，不想分辨B200、H200、B300哪個更適合特定工作負載，不想自己部署vLLM、SGLang，不想做所有的優化工作。我們在這里的產品叫做"Nebius Token Factory"，這是一個托管推理平臺。這里的新客戶群體，我們稱之為垂直AI公司或企業——他們構建產品，不做模型，而是在模型之上構建應用。這也正是你提到的專用模型和開源模型場景——當他們需要從Anthropic遷移或者多元化他們使用的模型時，就來到這里。
在這一層，計量單位變成了Token——你不再為GPU集群付費，而是消耗Token，構建應用時不需要考慮底層集群的事。
第四層是未來。因為現在人們在構建智能體應用和智能體工作流，在構建端到端智能體時，你甚至不需要考慮具體用哪個模型，不需要考慮生成多少Token，你只需要任務被高效執行并得到預期結果。平臺能做的魔法，是替你判斷在某次具體調用中該用哪個模型——是調用更智能的模型，還是用同樣的推理預算調用兩個更輕量的模型，再用一個裁判模型選出最優結果？用多大的上下文窗口？未來開發者可能甚至不需要考慮具體的Token類型，只需要思考任務的端到端執行。
第四層直接競爭的是OpenRouter這類平臺。我們想在這一層帶來的，和我們在下層做的事一樣——優化引擎。你可以用各種開源或專有工具構建智能體，但當你需要擴展規模時，你開始思考經濟性、可靠性和可重復執行性。這不只是模型選擇問題，也不只是結果問題，而是一個系統工程問題——你需要讓它可靠、可重復、經濟可行。這里可能正是Nebius能創造價值的地方：就像我們不告訴客戶怎么構建應用，而是說"如果你需要這個模型以這樣的經濟效益運轉，我們幫你優化"——在這一層也是一樣：如果你需要這個智能體以這樣的預算和質量跑通，也許我們能幫你優化。當然，這還有些前瞻性的思考，不是我們現有的產品，而是我們看到客戶正在演進的方向。
主持人：如果你今天有10倍的容量，會有什么不同？你能在一夜之間賣出去嗎？
Roman：不是一夜之間，但我們肯定有那樣的需求。關鍵不在于我們有沒有需求，而在于如何構建需求組合——因為市場上有太多客戶，你可以在他們之間做平衡。你可以賣裸金屬，可以賣托管基礎設施，可以賣推理服務，未來可以賣新的產品層。我們盡量構建多元化的客戶組合，越往產品棧的高層走，我們能服務的客戶群體越大：裸金屬層可能只有全球幾十家客戶，托管基礎設施層有幾百家，推理層有幾千家，到智能體層將會有數以萬計的新開發者。
主持人：在客戶集中度方面，你愿意接受來自Meta或微軟這樣大客戶的多高營收集中度？
Roman：這是我們業務的核心問題，不只是Nebius，而是整個產品類別的核心問題。我們一直公開告訴投資者和客戶：Nebius的長期戰略是服務盡可能多元化的客戶組合。
服務Meta、微軟這個量級的客戶，他們有完整的軟件棧，真正需要你的只有物理基礎設施——他們把自己的一切帶過來，部署在你的基礎設施上運行。在物理基礎設施之上，你能提供的附加價值微乎其微。而且，光是在物理基礎設施層面滿足他們的需求就已經極具挑戰性，因為他們要求的是全球最頂尖的超大規模基礎設施。有人說這是大宗商品，但真正到了這個規模，什么都不是大宗商品。
這樣的客戶群體規模很小，而且服務他們不需要完整的軟件棧。正因如此，Nebius從第一天起就在建軟件棧——我們認為這對我們更有價值，也更有益于世界——因為這樣我們能在物理基礎設施層之上，為客戶提供長期的深度支持。
主持人：如果當下容量供不應求，你把價格翻倍，需求會有什么變化？
Roman：這是個難回答的問題。其實我們幾個月前剛剛漲價，目前供給壓力依然相當大。但我們其實并不確切知道均衡點在哪里，原因是這不只是供需彈性的問題。訓練是一次性成本，相對而言客戶有一定的價格承受能力；但如果你相信整個行業在向推理遷移，推理是服務客戶的運營成本，那么價格一旦超過某個臨界點，客戶產品的經濟模型就會跑不通，他們就沒辦法增長，我們也跟著增長不了。所以這不是簡單的供需彈性問題——價格確實有彈性，但我們同樣希望對客戶有實質意義，希望客戶能健康發展。
而且成本不只是GPU時的價格，還有所有的優化空間，我們稱之為TCO（總擁有成本）。這部分原因也是為什么我們要構建軟件平臺。客觀上，人們太癡迷于容量、太癡迷于GPU的標價了。你可以把GPU定價在3美元、4美元或5美元，但根據應用場景和平臺質量，它給客戶帶來的實際成本結果可以完全不同。推理能跑多久？一段時間內的有效不中斷時長是多少？你能從模型中提取多少Token？這些優化加在一起，可以把Token成本改變一個數量級。所以如果你只做裸金屬，你只能管價格；但如果你構建平臺，提供高水平的服務，你能創造的經濟價值就遠遠不止于基礎設施成本了。
主持人：在產品的多租戶云層面，這一層的核心問題是什么？
Roman：客戶需要什么——這是所有產品工作的核心問題。我們看到從訓練到推理的轉變，從只用模型到構建智能體的轉變，從主要是AI實驗室消耗AI算力到企業客戶大量涌入的轉變。我們每時每刻都要問自己：Nebius的差異化價值在哪里？客戶在朝哪個方向演進？我們規模還小，不能什么都做，必須非常清楚自己能比別人做得更好的是什么。
從訓練到推理和智能體的遷移主持人：你在客戶需求變化上看到了什么公眾談論得還不夠多的東西？最近讓你震驚的是什么？
Roman：大家都在說從訓練到推理的遷移，但這個視角太宏觀了。這個遷移意味著人們在構建具體產品，這些產品有自己的經濟模型和增長路徑，不只是同樣的GPU換了個用途。它帶來了全新的需求——你需要構建推理平臺，幫助客戶不只是跑推理，還要解決他們推理所用的模型從哪里來。每個人都在拿開源模型微調，所以我們怎么幫客戶做？當他們運行應用、跑推理的時候，會產生大量數據，我們怎么幫他們收集和利用這些數據來改進模型？
這就是人們喜歡講的飛輪——跑推理、生成數據、觀察數據、改進模型、持續提升產品質量。這里面有很多系統層面和AI層面的工作要做。
對我來說，現在最令人著迷的是：構建的門檻在持續下降。越來越多的構建者走進市場，他們不一定是AI研究員，也不一定是推理工程師。Nebius這樣的公司能創造的價值，正是降低構建AI應用的門檻——把基礎設施的復雜度、模型調優的復雜度、推理優化的復雜度都藏起來，讓開發者專注于他們的客戶和應用場景。這和使用Anthropic、OpenAI這樣的封閉生態是一樣的邏輯。
主持人：你剛才提到了差異化。當大家拿Nebius和CoreWeave比較時——你們都跑GPU，都有英偉達關系，都有Meta作為客戶——區別在哪里？
Roman：我不太喜歡直接跟別人比較。我們的建設原則是全棧整合——"向下全棧"和"向上全棧"兩個方向。向下全棧，是指我們深深扎根于物理世界——我們自建數據中心，自建機架和服務器，自建平臺。控制這些下游的東西，讓你能移動得更快，壓縮更多成本，為客戶提供更經濟的解決方案。向上全棧，就是我們談到的產品——跟隨客戶需求和客戶細分的演進，不被局限于那批只需要基礎設施的小客戶群體，而是真正服務企業客戶和產品公司，在他們需要我們的地方遇見他們。
這種差異體現在：更低的客戶集中度，更多元化的客戶組合，以及我們相信長期來看更好的企業市場定位。現在我們主要服務AI原生客戶，但存量企業、非AI原生公司是一塊巨大的市場，需要有人服務他們，而他們不會直接購買裸算力——他們需要平臺，需要工具，需要供應商尊重他們的歷史包袱并能與其復雜的遺留系統協作。他們不像創業公司那樣靈活，有數據要遷移，有系統要整合，這才是真正的大賽局。
主持人：第三層——托管推理——請解釋給不了解的人聽？
Roman：很簡單。假設你用OpenAI構建了一款出色的產品，跑通了應用場景，用戶增長勢頭很好。唯一的問題可能是利潤空間不夠，或者你想更積極地利用數據來調優模型行為，但封閉生態不支持。于是你去查開源模型，發現benchmark上和OpenAI差距不大，推理成本可能便宜10倍，還能微調、應用你的數據、加速增長——聽起來很美。
于是你從HuggingFace下載模型權重，找一個推理引擎比如vLLM或SGLang來跑，但發現事情并不像想象中那樣順利。因為要真正提取你期望的價值，你需要做各種優化：需要正確部署，不是只跑單個GPU的推理，而是你的產品跑在數十萬個GPU上，你需要所有的編排、緩存、可觀測性——你的客戶會問你系統怎么運作——而這些在OpenAI上你都是現成的，因為它是生產服務，你不需要考慮基礎設施的事。
這就是Token Factory這類產品存在的原因——托管推理平臺，你可以跑現成的開源模型，也可以微調后部署自己的模型權重，我們負責其余的一切：所有優化技術、更好的經濟效益、可靠性、下一批GPU在哪里找——這是一項托管服務。
Token Factory如何將推理成本降低70%主持人：Token Factory支持60個開源模型，你之前提到通過優化可以將推理成本降低最高70%。我想問一個"蠢問題"——怎么讓一個Token變得更便宜？
Roman：這沒什么魔法。你拿到一個基礎模型，然后針對你的特定場景做優化——你可以做模型蒸餾，訓練出一個更小但在同等質量下運行的模型；可以做投機解碼；可以優化緩存；等等。本質上，你把一個模型做成一個系統，讓它在你的特定需求和約束下，以最優的經濟效益運行。
另外一個原因是模型更新的速度——幾乎每周、每月都有新模型發布。今天MiniMax 3可能剛發布，Ultra版本也剛宣布。每隔幾周就有新模型出來，每次新模型在某些benchmark上更好，但在另一些上不一定。你希望有人幫你持續實驗和切換，確保你始終跑在前沿，讓這個過程對你來說順滑透明。
主持人：模型迭代的節奏會持續嗎？我甚至會說每隔幾天就有新發布，5年后還會保持這種頻率嗎？
Roman：我不知道。大概率我們會持續看到大量垂直領域的新模型出現并持續改進。我相信我們離"撞墻"還很遠，還會看到大量模型改進發生。
我們也會看到更多新模態和更專用的模型進入賽場——生命科學模型、機器人模型、世界模型、視頻模型、圖像模型——每類都有自己的應用場景，大量針對特定場景高度優化的小型專用模型也會持續涌現。今天早上我剛和以色列一個團隊聊過，他們在做一個專門用于構建網絡防御智能體的基礎模型——他們不是從零開始，而是在某個開源基礎模型上針對網絡防御場景的質量和延遲需求進行訓練優化。這種模式還會持續發展，大量經過后訓練的專用模型仍然需要優化推理和優化的基礎設施來支撐。
主持人：Token使用量方面，有什么你認為現在還沒有被充分討論的、讓你震驚的現象嗎？
Roman：大家都在談增速，Anthropic、Cursor、Cognition在代碼領域的快速增長，以及其他垂直領域——醫療、金融等開始出現的應用案例。但真正有趣的，是看非AI原生的大公司如何移動。
我給你舉個例子。我們有個客戶Revolut，剛開始合作時，他們推理預算的99%在封閉模型上，也就是OpenAI。他們開始攻堅一些應用場景，發現有些場景在經濟上跑不通——無法真正替代或增強人工來完成他們想解決的任務。于是他們開始轉向開源模型，但進展很慢，因為他們必須在公司內部自己搭建一整套引擎，首先要專注于構建評估體系。
這一點被很多人低估——構建持續改進和實驗的基礎設施有多重要。當你跑通了某個場景，但想換一個模型，你怎么知道你沒有損害質量？你需要指標體系，需要驗證機制，需要為AI開發建立CI/CD流程。很多像Revolut這樣的客戶，都需要先做這樣的基礎性投資——搞清楚如何安全地演進模型、如何將其安全地整合到生產流程中。
但是，一旦他們解決了這些基礎性問題，他們就開始指數級增長。解決了"如何快速迭代"這個問題之后——他們知道如何演進、如何做決策——增速就會騰飛。我們在很多客戶身上都看到了這個規律：有一段"冷啟動期"，但一旦建好了快速迭代的系統，他們的AI使用量就會指數級增長，他們能使用的模型多了，能構建的產品多了，能解決的問題也多了。
你從外面看，會覺得這些公司增長很慢，但這是在打基礎。等他們打好基礎，就會爆發式增長。我認為我們會看到大量企業客戶、云原生公司——Revolut、Shopify、Booking.com這些公司——解決完冷啟動問題、建好快速迭代體系之后，AI使用量會像瘋了一樣增長。
主持人：我一直認為開源不會對最大的模型提供商構成真正威脅，因為最大的企業客戶要的是可靠性、安全性和便捷性，他們不想折騰底層架構。但你告訴我，Nebius能幫他們擺脫這些顧慮，以更低成本、更好體驗轉向替代方案，因為你把管道都藏起來了？
Roman：對，但我要強調，這不是"封閉模型 vs 開源模型"的非此即彼。前沿封閉模型非常優秀，而且會越來越好，會解決大量我們現在還沒有解決的問題。我們有如此多樣化的應用場景需要解決，未來的市場足以容納全球最智能的模型、最快的模型、以及介于兩者之間的模型——足夠智能同時足夠便宜的模型。作為客戶，你可以為每個具體任務選擇合適的Token來源。
而到了智能體層，甚至不需要客戶來做這個選擇——引擎知道底層所有模型的能力，當你在OpenAI做研究時，你不需要考慮它要循環多少次、什么時候調用LLM、什么時候調用搜索、調哪個Prompt。這一切都在發生，你只是給出一個任務，推理引擎決定如何執行，你得到結果。未來很多企業場景和智能體任務都會以這種方式解決——開發者不需要編排所有的Token和模型，讓最智能的模型處理最復雜的推理，讓最快的模型做快速迭代。
主權AI、歐洲與模型建設的未來主持人：看到模型大爆發和專用化的趨勢，有一件事非常清晰——歐洲在模型建設方面遠遠落后于美國和中國。你認為各個國家擁有自己的主權AI模型有多重要？
Roman：看起來世界正在分裂，我們也許無法改變這一點。我認為，讓足夠好的基礎模型在世界的主要地區可以獲取是重要的。在歐洲，至少在我們所在的這部分世界，我們應該思考如何在這里擁有足夠的能力。
過去幾年關于主權AI的討論，我認為太過于聚焦在兆瓦數和算力上，而不是真正關鍵的構建者層面。算力會來的，如果有需求，像Nebius這樣的公司會去建。真正需要關注的，是如何擁有更多像Lovable、Black Forest Labs、Mistral這樣的優秀公司，更多投資于研究和產品的人。他們會創造出足夠的需求，推動飛輪轉動，進而產生足夠好的模型。
主持人：今天最值得投資的方向是什么？給你四個選項：基礎設施、通用模型、垂直模型、應用層。
Roman：我們做基礎設施，所以我認為這是個好地方。但說實話，我認為在這個行業里最了不起的，是那些敢于去構建面向終端用戶產品的人。他們承擔的是真正的風險——構建的東西有沒有人需要——他們才是AI旅程中真正的英雄。
與超大規模云服務商正面競爭主持人：關于與英偉達的關系——這場婚姻里雙方權力不對等，你怎么看這種權力動態？
Roman：我們的思路很簡單：做好我們該做的事，構建好我們的產品，講好我們的故事，其他的自然會水到渠成。
英偉達在很大程度上仍然是一家工程師驅動的公司，我認為獲得英偉達尊重的最好方式，是讓英偉達的工程師尊重你的工程師。我們一遍又一遍地證明了我們知道自己在做什么，我們有一支強大的工程團隊。他們看到了這一點，也尊重這一點，我們在硬件層、軟件層和推理平臺層都有大量工程師之間的橫向交流。英偉達工程師越看重你，合作關系就越好。
也許我們的想法是錯的，但我們就這么做，專注于做合理的事，專注于長期價值。聽起來很空洞，人人都這么說。但說到底，把你該做的事做好就行了，不是嗎？
主持人：那"把該做的事做好"，今天最難的部分是什么？
Roman：四個維度：規模建設、產品建設、客戶服務，以及資本。
規模和產品我們前面談過了。第三個維度是客戶——我們是一個交付驅動的業務，云是銷售后才真正開始的生意。你簽了合同，你賣的是承諾，然后你必須滿足客戶。與客戶緊密合作，覆蓋客戶，有一支強大的客戶面向工程團隊——這是第三個維度，要不斷與客戶溝通，了解他們，讓他們了解你。
第四個維度是資本——最枯燥但也最激動人心的。我們在資本密集型賽道里與全球資本最雄厚的公司競爭。
如果給你無限預算，你會做什么不同的事？答案很簡單：更快地建設。更快地建什么？數據中心，然后填滿GPU。我們今年的資本支出計劃是200到250億美元，我們的競爭對手超大規模云服務商的資本支出是我們的八倍左右。如果我有10倍的資本，我就更快地建更多數據中心，更快地填滿GPU，服務更多客戶。
Gavin Baker曾經說過一句很有見地的話：監管和審批導致的數據中心建設延誤實際上幫了我們，因為如果你今天能建10倍的數據中心，反而會造成過剩。這是個很好的問題——我們的投資者有時也問這個——關鍵在于時間跨度。
未來6個月，錢解決不了問題，6個月太短了，你只能用手里有的資源交付。接下來12個月，可以加速一些事情，但更多是容量約束問題。到了24個月的維度，資本可以解鎖大量事情，建設可以大幅加速。我們建的不是一個數據中心，而是一個容量組合。執行力越強、資本越多，就能更多地并行推進——先鎖定電力和土地，再建數據中心，再填入GPU，每個階段需要更多資本，但我們盡量提前做好準備，確保到了下一階段時，電力已經鎖定，數據中心已經在運行。
主持人：我們看到越來越多的公眾對AI的抵觸情緒，40%的數據中心在規劃審批中被否。你們內部怎么看待這個問題？
Roman：這是我們必須在其中運作的環境。有兩個層面。
從商業角度，我們把這視為組合管理問題——保持充分的超額儲備，即便某個數據中心被延誤，我們仍然能向客戶交付足夠的容量。大多數客戶不綁定在某個物理位置，可以把工作負載調配到有容量的地方。
另一方面，我們確實看到社區和地方政府要求我們深入合作，解釋我們在做什么，回應他們的關切。這是現實，也是應盡的義務。可以類比當年Uber進入新市場時遭遇的反彈——有些關切是因為不了解，有些是合理的關切，都可以去解決。關鍵是參與進去，做好溝通工作，這就是應盡的職責。
主持人：在地球上建數據中心已經這么復雜了，太空數據中心更是完全另一個量級。你怎么看？
Roman：我覺得現在看到的一切都瘋了，這件事也不例外。有這么多聰明的人在致力于讓它發生，很可能他們會做到。我不敢說3年內太空計算會超過地球計算，我很謙遜——但我也不會說它不會發生。如果3年前有人告訴你，我們會建多吉瓦規模的互聯超大算力集群，你會相信嗎？我不會。但現在這已經是常規操作了。
快問快答主持人：5年后最常見但今天還不存在的職位是什么？
Roman：我們正在讓"開發者"這個身份平民化——我們每個人都能成為開發者，把一個想法轉化為數字資產。我希望這種建設的平民化能打開大量我們現在甚至無法想象的機會。當數以千萬計的新人獲得把想法變為現實的能力，將會涌現出大量全新的業務和職位。
但隨之而來的挑戰，同時也是風險和機遇，是教育的變革。當所有人都能獲取智能，人們應該學什么？你不需要記憶事實，所有知識都觸手可及。怎么訓練人們真正思考？怎么幫助人們在不斷變化的職業環境中找到自己的位置？很多職業將不再穩定，如何持續學習新概念？這些都是巨大的機遇和風險。
主持人：你有兩個正在進入職場的女兒，你給她們什么建議？
Roman：我告訴她們兩件事將會是最重要的。第一，能夠以共情的方式與人溝通——真正理解人，與人建立連接，有同理心。第二，創造力——藝術和創造力，我希望它們不會消失。我10年前認為數學和工程是最重要的，現在我已經完全不這么認為了。我很高興她們比我當年更注重軟技能。理解人、與人建立共情、保持創造力、勇于嘗試新事物——如果你能幫孩子培養這兩點，我認為10年后他們會很吃香。
Nebius最大的威脅不是競爭主持人：幫我完成這句話：Nebius最大的威脅不是競爭，而是……
Roman：是整合，是過度集中。Nebius最大的商業威脅，是世界變得過于整合。就像我們談到的，我們努力服務多元化的客戶群體，在不同層級服務不同客戶。如果世界最終只剩三五家超級公司、超級帝國控制一切，那Nebius這樣的公司就只能幫它們在物理層提供服務。世界越多元化、越去中心化，我們的生存空間就越大。
主持人：你認為這種極度整合有多大可能發生？我們確實在看到價值向越來越少的玩家集中。
Roman：我希望不會發生。作為人類，多元化的世界也更好。我是樂觀主義者——有太多人希望獨立地構建自己的東西，有太多人有探索和創造的沖動，這種內生的力量會推動世界保持多元化。
主持人：Leopold Aschenbrenner最近披露了一筆對Nebius的大倉位——占他投資組合的15%左右，Nebius 5.3%的股份。你們內部怎么看這件事？
Roman：我們當然注意到了，股價也跳漲了，是個大消息。我認為我們把它視為對我們所做事情的一種認可。但每次有人給我們這樣的認可，我就告訴自己：他們給了你交付的機會和信任，回去做好你的工作，交付。
我們身處一個情緒化的市場，你必須始終腳踏實地。記住，所有這些來自客戶和投資者的信任和認可，都是交付的機會，不是慶功的理由。回去做好工作。
我想我在這一點上更像俄國人——俄國人總是務實地看問題，總是預期會有什么事情發生，時刻做好準備。
這也是我們CEO和創始人Arkady的風格——每天醒來，新的客戶，新的一天，你需要交付，沒有任何東西是理所當然的。市場移動這么快，要保持相關性，你必須以同樣的速度甚至更快的速度移動。
我應該承認，我們可能應該多一點慶祝，給團隊更多認可——他們做到了很多艱難的事，但我們沒有時間慶祝。不過，我們是不會停下來的——就像鯊魚，你游動，你才活著，我們必須不斷前進。
主持人：Roman，非常感謝你今天的到來，感謝你耐心回答我所有七拐八繞的問題，你真的太棒了。
Roman：謝謝，是你太客氣了。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.