![]()
真正的 AI 攻勢,是堅決把自己變成一家科技企業(yè)。
文丨陳然
2026 年 2 月初,中國的兩大互聯(lián)網(wǎng)公司騰訊與阿里巴巴率先打響了新一年的 AI 大戰(zhàn)——騰訊的元寶端出 10 億元現(xiàn)金激勵,并上線新的 AI 社交功能 “元寶派”;阿里的千問拿出 30 億元的福利,鼓勵用戶在 App 里點外賣。
盡管字節(jié)跳動在這之前已經(jīng)靠火山引擎奪得了這一年央視春晚的總冠名,但在紅包與補貼的喧囂中,它并未成為輿論主角。直到農(nóng)歷春節(jié)前一周,視頻生成模型 Seedance 2.0 問世,在創(chuàng)作者圈與行業(yè)討論中迅速發(fā)酵,把它重新推回了討論中心。2 月 14 日,字節(jié)跳動陸續(xù)上線了豆包大模型 2.0 與圖像創(chuàng)作模型 Seedream 5.0 Lite。
除夕當(dāng)晚,字節(jié)跳動又帶著火山引擎、豆包 App,以及 Seed 系列大模型來到了春晚舞臺上。從舞美視效、機器人說話到播出保障,AI 第一次如此全面地滲透進了春晚這場全民狂歡之中。
就連互動玩法也被重新設(shè)計:觀眾需要調(diào)用豆包里的大模型生成圖片或文字才能獲得紅包福利。紅包里不只有現(xiàn)金,還有 3D 打印機、汽車、無人機、機器人等科技產(chǎn)品。
這是字節(jié)的春節(jié)戰(zhàn)役。
一位字節(jié)跳動人士告訴我們,相比許多公司把春節(jié)當(dāng)作單純的增長機遇,他們更希望在這個節(jié)點,創(chuàng)造關(guān)于 AI 和科技的集體記憶;也試圖告訴外界,做 AI 不是只做一、兩款應(yīng)用,而是要服務(wù)各個產(chǎn)業(yè)。據(jù)了解,春晚上送出去的科技產(chǎn)品都是豆包大模型的客戶。
官方數(shù)據(jù)顯示,除夕當(dāng)天豆包的 AI 總互動 19 億。除夕前,備受國內(nèi)外關(guān)注的視頻生成模型 Seedance 2.0 和最新的豆包大模型 2.0Pro 也接連第一時間接入豆包(『專家』模式),讓先進的模型能力第一時間落到產(chǎn)品觸達用戶。
無論是與新春等生活場景的貼合,還是模型能力上限的提升,可以說,豆包都已具備國民級 AI 產(chǎn)品的特征。
在過去幾年的科技行業(yè),最有說服力的增長故事從來不是借補貼堆出來的。2022 年 11 月,ChatGPT 掀起全球 AI 熱潮后,靠著模型迭代成為了一個周活躍用戶數(shù)達 8 億的超級產(chǎn)品;兩年多后走紅的 DeepSeek 在沒有任何廣告投放、沒有多模態(tài)能力的情況下,穩(wěn)定維持著超過 3000 萬的日活躍用戶數(shù)。
字節(jié)跳動 CEO 梁汝波在年初的員工大會上將公司 2026 年的關(guān)鍵詞設(shè)定為了 “勇攀高峰”。他提到,AI 時代存在很多重要的機會,字節(jié)要追求其中最重要的,去攀登最高的高峰。
“真正的 AI 攻勢,是堅決把自己變成一家科技企業(yè)。” 上述字節(jié)跳動人士說。2026 年春節(jié),這家公司正試圖點亮自己的 ChatGPT 時刻。
從水墨舞臺、機器人到算力洪峰,不一樣的春節(jié)戰(zhàn)役
作為少有的全民級晚會平臺,春晚在過去十年里一直是各互聯(lián)網(wǎng)公司重要的新用戶增長渠道,它與一眾互聯(lián)網(wǎng)產(chǎn)品之間的合作也幾乎與 “紅包” 綁定。從 2015 年開始,微信、支付寶、淘寶、京東、抖音、拼多多、快手等知名互聯(lián)網(wǎng)產(chǎn)品均在春晚上發(fā)放過紅包福利。
但在今年春晚,冠名方火山引擎接到的第一個任務(wù)卻是與舞臺視覺相關(guān)的。
一位字節(jié)跳動人士告訴我們,今年春晚導(dǎo)演組一直在探索將最新科技和傳統(tǒng)文化藝術(shù)相結(jié)合。因此作為獨家 AI 云伙伴,火山引擎及其背后的字節(jié)跳動不僅要以贊助方身份參與冠名,還要把 AI 與云計算能力嵌入到春晚節(jié)目的創(chuàng)作與制作流程中。
在《馭風(fēng)歌》這個節(jié)目里,歌手身后出現(xiàn)了一幅國寶級的駿馬水墨畫。節(jié)目籌備時,導(dǎo)演組并不滿足于將其當(dāng)作一個靜態(tài)背景,而是希望讓這些馬匹在舞臺空間里動起來,并與歌手互動。
![]()
為了達成這個效果,他們最初試過一些海外模型,但大多抓不住水墨畫的氣韻;國內(nèi)模型也同樣受限,水墨風(fēng)格的高質(zhì)量訓(xùn)練語料稀缺,生成出來的畫作風(fēng)格容易跑偏。更棘手的是運動一致性:馬要跑得流暢,卻又必須在每一幀都貼合原畫的筆觸與結(jié)構(gòu)、不變形;馬匹的數(shù)量、每匹馬之間的動作都要始終保持一致。
轉(zhuǎn)折來自字節(jié)跳動團隊帶來的 Seedance 2.0。這個全新的視頻生成模型不僅能更好地遵循物理規(guī)律,讓馬的步態(tài)更接近真實,關(guān)節(jié)銜接自然、動作連貫;還能很好地遵循導(dǎo)演的要求,實現(xiàn)像 “跑慢一點”“鬃毛飄動輕一點” 這類帶副詞的細微調(diào)度指令。它還有另一個重要的突破——模型不再是只能學(xué)單張圖的風(fēng)格,而是能同時學(xué)習(xí)大量不同風(fēng)格的多模態(tài)素材。
一位字節(jié)春晚項目組人士告訴我們,他們把導(dǎo)演組畫的草圖、水墨畫作,還有許多關(guān)于馬的影像素材一起喂給模型,通過參考生成的方式,實現(xiàn)畫風(fēng)與動作能穩(wěn)定地在同一個標(biāo)準(zhǔn)之下生成。他們還繞開了直接寫提示詞的方式,改用 Seedance 2.0 與圖像生成模型 Seedream 協(xié)作:先由 Seedream 生成每一幀關(guān)鍵幀,再由 Seedance 在關(guān)鍵幀約束下生成動態(tài)視頻,實現(xiàn)了風(fēng)格的一致性和運動的連貫性。
把理想中的效果表現(xiàn)出來只是第一步。春晚的每個節(jié)目迭代頻率都極高,因此字節(jié)團隊常遇到的情況是,剛交付一版滿意的畫面,導(dǎo)演組馬上提出:“能不能再往前走一步”。這些節(jié)目還需要經(jīng)歷反復(fù)過審與驗收,這也意味著他們每次都必須拿出更好的版本。“整體節(jié)奏基本得按 ‘周’ 來迭代推進。” 上述字節(jié)春晚項目組人士說。
很快新的難題又出現(xiàn)了。雖然《大鬧天宮》《小蝌蚪找媽媽》等上美影經(jīng)典作代表了手繪全動畫的巔峰,但在 AI 數(shù)字化生成的語境下,如何在高幀率、高分辨率的現(xiàn)代廣播標(biāo)準(zhǔn)中,讓水墨這種 ‘無邊界’ 的藝術(shù)形式在高速大運動下不閃爍、不崩壞,是行業(yè)公認的難題。
考慮到主流視頻生成模型通常輸出 720p 或 1080p 分辨率、24 幀/秒的視頻,字節(jié)團隊將突破點放在后處理鏈路,借助火山引擎視頻點播的畫質(zhì)增強能力升級畫質(zhì):先通過超分技術(shù),在不改變畫面內(nèi)容的前提下將較小尺寸的畫面放大至 6K 或 8K;再通過插幀技術(shù)將幀率從 24FPS 提升至 50FPS。這套處理也非一刀切的通用算法,而是能根據(jù)每一幀畫面的畫質(zhì)與內(nèi)容特點做專屬優(yōu)化。最終他們順利解決了這個難題。
除了舞美,字節(jié)團隊還將 AI 能力帶入了春晚的多個環(huán)節(jié)。舞臺上出現(xiàn)的機器人接入了豆包的視覺大模型、文本大模型和語音識別模型,語音側(cè)采用了豆包的合成與復(fù)刻模型。模型讓它們不僅有了 “大腦”,還裝上了 “嘴巴” 和 “耳朵”。
他們還提前收集了舞蹈演員的 3D 素材,再利用了空間視頻技術(shù),將舞蹈演員制作成 3D 數(shù)字分身,在舞臺上實現(xiàn)真人 3D 克隆效果讓觀眾難辨真假。最后又加上了字節(jié)自研的 4D 高斯算法、豆包大模型優(yōu)化光影效果。
豆包 App 是今年春晚與觀眾互動的核心載體。與往年常見的在互聯(lián)網(wǎng)產(chǎn)品上搖紅包、搶紅包不同,今年互動流程改為,用戶需先在豆包上用大模型生成頭像或新春祝福,再搶紅包。這樣的變化極大抬高了成本——以往紅包互動形式的主要開銷集中在網(wǎng)絡(luò)、IO 和實時連接,現(xiàn)在則在原有基礎(chǔ)上疊加了龐大的算力請求與算力支出。
調(diào)控算力資源的難題也在大幅上升。一位字節(jié)的春晚項目組人士保守測算,用戶生成一條新春祝福或一張圖片,一次請求就需要完成 10 TOPS(每秒 10 萬億次操作)的計算量。而以往類似互動請求的計算量僅約 1/100000 TOPS,兩者在算力需求上相差了整整 100 萬倍。與此同時,他們在除夕當(dāng)晚還要應(yīng)對抖音、今日頭條等產(chǎn)品春節(jié)活動帶來的大模型調(diào)用。
由于時間緊迫,字節(jié)沒辦法靠臨時堆機器頂住算力洪峰。好在火山方舟頂了上來,這是字節(jié)統(tǒng)一調(diào)度算力的總控臺,長期在字節(jié)和外部客戶的各類高并發(fā)場景中沉淀了資源調(diào)度能力。火山方舟的一個特點是將推理、訓(xùn)練和離線任務(wù)放進同一資源池統(tǒng)一統(tǒng)籌,因此在春節(jié)算力與流量峰值來臨時,系統(tǒng)能把可延遲的負載錯峰挪開,為各類春節(jié)活動騰出更多資源。
這不是件容易做到的事情。它涉及到海量場景、多個機房、多種機型和多類模型,還要持續(xù)動態(tài)分配資源。一位火山引擎人士把這個過程形容為 “裝箱”:一方面,不同流量的延遲要求不同、對異構(gòu)硬件的依賴不同,約束極多、解空間巨大;另一方面,大模型推理不像傳統(tǒng) CPU 服務(wù)那樣資源類型相對統(tǒng)一,同一個推理服務(wù)里也可能混用多種硬件。更麻煩的是,GPU 的遷移不是單點動作,存儲、網(wǎng)絡(luò)、上游負載均衡等配套資源也要協(xié)同遷移,否則算力挪過去也接不住流量。
“冠名春晚對字節(jié)來說,不再是一場簡單的增長活動,它更像一次真正的技術(shù)試煉。” 一位字節(jié)跳動人士說。
AI 時代,靠紅包換增長的模式失靈了
字節(jié)跳動今年與春晚合作方式的變化,似乎再一次說明:AI 時代的增長邏輯正在改寫。
移動互聯(lián)網(wǎng)時代,巨頭崛起不是靠時刻引領(lǐng)創(chuàng)新,而是靠在有人驗證了某個需求后,成體系地做出同款產(chǎn)品,以更高效率大量拉來用戶,再根據(jù)用戶反饋快速迭代改進體驗。更好的體驗帶來更多的收入,這些收入又被拿來投放,獲得更多用戶,如此循環(huán)。撒錢則是最直接的增長手段。
“核心是極速增長、極速迭代、極速變現(xiàn)的飛輪。” 一位互聯(lián)網(wǎng)公司的產(chǎn)品經(jīng)理說。
對互聯(lián)網(wǎng)產(chǎn)品而言,越快拉新,產(chǎn)品體驗越快提升。“多數(shù)情況下,推薦算法是發(fā)現(xiàn)你和另一個用戶偏好相似,然后把他喜歡的東西展示給你。” 一名推薦產(chǎn)品經(jīng)理說。用戶增加,可供算法學(xué)習(xí)、發(fā)現(xiàn)關(guān)聯(lián)的數(shù)據(jù)隨之增加。這既適用于推薦視頻、小說,也適用于推薦商品卡、帶貨直播間。微信支付的崛起是另一個例子,它用紅包把支付變成了社交的一部分,想?yún)⑴c就得綁卡、能轉(zhuǎn)賬。人越多,越常用,久而久之就成了默認的支付工具。
交易型產(chǎn)品同樣受益于此。一個打車平臺會同時補兩端:一邊補司機提高供給,一邊補乘客拉動需求。司機密度上來后,乘客等待時間縮短;訂單密了,司機空駛更少,平臺的履約成本也會隨之下降,用戶體驗也更好。
互聯(lián)網(wǎng)產(chǎn)品的成本也不會隨著用戶增加而線性上漲;新增開銷主要在帶寬、存儲和機器資源上,它還會隨著用戶規(guī)模的提升而被攤薄。
但 AI 產(chǎn)品幾乎是互聯(lián)網(wǎng)產(chǎn)品的另一面。
2025 年初,字節(jié)跳動 CEO 梁汝波曾在集團全員會上提到,豆包沒顯出 “越多人用越好用” 的互聯(lián)網(wǎng)產(chǎn)品特性。這部分因為 chatbot 產(chǎn)品不是社交網(wǎng)絡(luò)或平臺。
用戶數(shù)量增長帶來的新數(shù)據(jù)也有限。一個短視頻產(chǎn)品,只要用戶還在上下刷,就會產(chǎn)生一組組數(shù)據(jù)供推薦算法優(yōu)化;但 chatbot 類產(chǎn)品生成一段回復(fù),只有極糟時,用戶才有動力多點下按鈕反饋。能收集來數(shù)據(jù),也不保證它們能讓底層模型更聰明。“多數(shù)用戶的問題高度重合,又沒什么深度,沒辦法提高模型能力。” 一位互聯(lián)網(wǎng)公司的 AI 產(chǎn)品經(jīng)理說。“比如代碼方向,公司就會在內(nèi)部找程序員寫案例。”
大模型的專業(yè)能力早已超過大多數(shù)人類,它們不能通過收集普通人的數(shù)據(jù)改善自己,就像 AlphaGo 不需要和普通人對弈來提升技藝——它后來的變種 AlphaGo Zero 甚至連世界冠軍的數(shù)據(jù)都不用,只是機器訓(xùn)練機器就能贏過所有人。即便 ChatGPT 應(yīng)用的月活躍用戶量比 Claude 高出 100 多倍,但這沒有讓 OpenAI 的模型比 Claude 好用哪怕一倍。
AI 還無法像互聯(lián)網(wǎng)產(chǎn)品那樣,靠用戶量攤薄成本。一位深入研究 AI 的二級市場人士曾測算,目前的主流 AI 產(chǎn)品如果服務(wù) 1 億日活用戶,每天的模型推理成本就要幾千萬元。這個計算還沒有考慮新的 Agent 產(chǎn)品,如果類似 Manus 的產(chǎn)品開始流行,單個用戶每天需要的算力可能還會再翻幾倍。
最關(guān)鍵的是商業(yè)化難題。在海外,ChatGPT、Gemini、Claude 砸下了巨額投資以滿足復(fù)雜計算,用戶也必須付錢,低一檔 17-20 美元/月,高一檔可以到數(shù)百美元/月。但愿意為軟件服務(wù)支付這般費用的中國用戶很少,字節(jié)和阿里等公司更多是靠云服務(wù)賺回在 AI 上投入的錢——把模型能力做成云上的 API/托管服務(wù)與行業(yè)解決方案,企業(yè)按調(diào)用量、并發(fā)、存儲與算力時長付費。
根據(jù)官方數(shù)據(jù),2025 年 12 月,火山引擎上的豆包大模型日均 Token 處理量超過 50 萬億,半年增長超 200%。增長的動力不只來自字節(jié)旗下豆包、即夢等 AI 應(yīng)用快速發(fā)展,還有一批外部客戶在深入使用大模型:累計使用上萬億 Token 的超過 100 家,比全球云計算巨頭 AWS 還多了一倍。
當(dāng)下,AI 產(chǎn)品體驗提升幾乎全部來自底層模型能力提升。AI 代碼編輯器 Cursor 能出圈,前提是它接入了 Claude 系列模型代碼能力大幅提升。OpenAI 的 Deep Research 體驗驚艷,也是靠底層模型學(xué)會了長鏈思考、分步解題。
如果大模型能持續(xù)進步,許多精心調(diào)教后的產(chǎn)品能力成為龐大模型的一部分,用戶直接說幾句話就能實現(xiàn)想要的效果,那大模型本身就是終極產(chǎn)品。ChatGPT 與 DeepSeek 的成功都在說明,靠投流、補貼去搬運用戶的老辦法越來越吃力,真正能拉開差距的,還是模型與產(chǎn)品體驗的硬實力。
唯一的解法:更堅定地成為一家科技公司
2017 年的一次 CEO 面對面上,有字節(jié)跳動的員工問算法技術(shù)負責(zé)人楊震原:公司在人工智能上與 BAT 的差距在哪里?楊震原回答說,“今日頭條本來就是一家人工智能公司。” 他進一步解釋,做信息分發(fā)就是需要人工智能,今日頭條想通過機器和人結(jié)合的方式提升創(chuàng)作、分發(fā)、討論等每個環(huán)節(jié)的效率。
當(dāng)時,AI 在字節(jié)跳動的產(chǎn)品中已經(jīng)有一些應(yīng)用,比如推薦、內(nèi)容創(chuàng)作、抖音的 AR 效果、 內(nèi)容審核、廣告系統(tǒng)、頭條號自動生成封面、時光相冊和東方 IC 對圖片的篩選功能等等。
2022 年底,ChatGPT 橫空出世帶來了新的 AI 熱潮。字節(jié)跳動是這一輪里投入最大的中國科技巨頭之一。它迅速訂購了大量 GPU、組建全新的 AI 部門,從 infra、數(shù)據(jù)、模型、產(chǎn)品到人才全方位追趕硅谷公司。兩年后,字節(jié)的模型數(shù)量、迭代速度和表現(xiàn)明顯提升。
技術(shù)的躍升很少一蹴而就,背后需要堅定的長期投入。一位字節(jié)跳動人士回憶,Seedance 1.5 推出時,外界對它的評價并不高:人物在運動中容易崩壞,細節(jié)也不夠穩(wěn)定。后來 Seedance 2.0 的效果明顯提升,有人猜測這是團隊調(diào)整了 Benchmark,把更影響用戶體驗的指標(biāo)排在了更前面。
“其實大家都忽略了基礎(chǔ)工作的重要性。” 上述人士說。以運動崩壞為例,團隊需要反復(fù)驗證不同方案,找到更有效的路徑,這類工作很耗時,卻是必須補齊的基礎(chǔ)能力。“就像一個很聰明的小朋友,未來也許能解大學(xué)題,但如果基礎(chǔ)知識沒學(xué)完,現(xiàn)在硬讓他做,結(jié)果肯定不會好。”
另一個例子是豆包的語音合成模型(Seed TTS)。2024 年,團隊在做 Seed TTS 1.0 時的目標(biāo)是讓模型能自然流暢地復(fù)刻說話者特征,尤其在跨語種時也能保持相似度與韻律。當(dāng) 1.0 達到可用水平后,新的問題又暴露出來了:模型的語氣表達太平淡。但這個難題在當(dāng)時無法快速解決,于是他們在研發(fā) 2.0 版本時,把重點放在了將理解與思考能力融入端到端語音鏈路上。直到 2025 年中 Seed TTS 2.0 發(fā)布,模型才具備了更強的情感表達能力。
字節(jié)也是少有愿意在基礎(chǔ)研究上投入資源的中國科技公司。一位接近字節(jié)高層的人士曾告訴我們,字節(jié)目前的 infra (工程化能力)已經(jīng)比國內(nèi)任何一家公司都要強。但和全球比,最大的問題是缺少 OpenAI 里那種能提出方向、能做前沿探索的人,比如 GPT 4o、Sora。
“中國過去沒有真正的企業(yè)研究院是因為民營企業(yè)盈利能力有限,現(xiàn)在終于可以試一試了。” 上述人士說。
2025 年 1 月下旬,字節(jié)正式設(shè)立了代號為 “Seed Edge” 的研究項目,核心目標(biāo)是做比預(yù)訓(xùn)練和大模型迭代更長期、更基礎(chǔ)的 AGI 前沿研究。該計劃設(shè)定了更寬松的考核機制:字節(jié)本來每半年考核一次績效,而 Seed Edge 則在項目取得突破進展后,再做最終評估。
字節(jié)在考察 AI 項目時,ROI 依然重要,但周期更長了。一位字節(jié) AI 產(chǎn)品團隊人士告訴我們,字節(jié)現(xiàn)在會以 AI 產(chǎn)品一定周期后的單用戶價值作為考核系數(shù),以測算未來收益,不同產(chǎn)品的考核周期不同,長的甚至可以到 5 年;但字節(jié)也沒對這種考核方式做強制要求。
商業(yè)和科技史上無數(shù)次驗證過了,想要拿下用戶、市場,或者是更大的機會,靠的永遠是技術(shù)的躍遷與產(chǎn)品的硬實力。
二十多年前,Google 因擔(dān)心微軟殺入搜索市場,在內(nèi)部制定了 “芬蘭計劃”。這套計劃的核心不是守城,而是逼自己持續(xù)做出更有創(chuàng)造力、把體驗打到極致的產(chǎn)品——哪怕在 Windows 這 樣的主場上,也要做出比微軟自帶工具更好用的瀏覽器。最終,在沒有產(chǎn)品迭代優(yōu)勢、沒有網(wǎng)絡(luò)效應(yīng)的背景之下,Google 硬是靠著出色的工程技術(shù)能力做出了 Chrome 并贏得了戰(zhàn)爭的勝利。
在與微軟的競爭中,Google 還鍛造出一套強大的商業(yè)化系統(tǒng) AdSense,把源源不斷的現(xiàn)金流與生態(tài)網(wǎng)絡(luò)牢牢綁定在自己身上,并在此后多年逐步沉淀為難以撼動的壁壘。
2024 年,OpenAI 聯(lián)合創(chuàng)始人、前首席科學(xué)家伊爾亞·蘇茨克維 (Ilya Sutskever) 曾提到,“2010 年代是擴大規(guī)模的時代,現(xiàn)在我們再次回到了需要奇跡和新發(fā)現(xiàn)的時代。” 對字節(jié)跳動來說,它用 13 年長成中國最大的互聯(lián)網(wǎng)公司;如今又遇到一場上限足夠高的新游戲,需要用真正的技術(shù)與產(chǎn)品去再次證明自己——這樣的機會,它不會錯過。
題圖來源:視覺中國
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.