字節(jié)跳動在春節(jié)點亮自己的 ChatGPT 時刻

2026-02-17 12:17:46　來源: 晚點LatePost

山東舉報

分享至

真正的 AI 攻勢，是堅決把自己變成一家科技企業(yè)。

文丨陳然

2026 年 2 月初，中國的兩大互聯(lián)網(wǎng)公司騰訊與阿里巴巴率先打響了新一年的 AI 大戰(zhàn)——騰訊的元寶端出 10 億元現(xiàn)金激勵，并上線新的 AI 社交功能 “元寶派”；阿里的千問拿出 30 億元的福利，鼓勵用戶在 App 里點外賣。

盡管字節(jié)跳動在這之前已經(jīng)靠火山引擎奪得了這一年央視春晚的總冠名，但在紅包與補貼的喧囂中，它并未成為輿論主角。直到農(nóng)歷春節(jié)前一周，視頻生成模型 Seedance 2.0 問世，在創(chuàng)作者圈與行業(yè)討論中迅速發(fā)酵，把它重新推回了討論中心。2 月 14 日，字節(jié)跳動陸續(xù)上線了豆包大模型 2.0 與圖像創(chuàng)作模型 Seedream 5.0 Lite。

除夕當(dāng)晚，字節(jié)跳動又帶著火山引擎、豆包 App，以及 Seed 系列大模型來到了春晚舞臺上。從舞美視效、機器人說話到播出保障，AI 第一次如此全面地滲透進了春晚這場全民狂歡之中。

就連互動玩法也被重新設(shè)計：觀眾需要調(diào)用豆包里的大模型生成圖片或文字才能獲得紅包福利。紅包里不只有現(xiàn)金，還有 3D 打印機、汽車、無人機、機器人等科技產(chǎn)品。

這是字節(jié)的春節(jié)戰(zhàn)役。

一位字節(jié)跳動人士告訴我們，相比許多公司把春節(jié)當(dāng)作單純的增長機遇，他們更希望在這個節(jié)點，創(chuàng)造關(guān)于 AI 和科技的集體記憶；也試圖告訴外界，做 AI 不是只做一、兩款應(yīng)用，而是要服務(wù)各個產(chǎn)業(yè)。據(jù)了解，春晚上送出去的科技產(chǎn)品都是豆包大模型的客戶。

官方數(shù)據(jù)顯示，除夕當(dāng)天豆包的 AI 總互動 19 億。除夕前，備受國內(nèi)外關(guān)注的視頻生成模型 Seedance 2.0 和最新的豆包大模型 2.0Pro 也接連第一時間接入豆包（『專家』模式），讓先進的模型能力第一時間落到產(chǎn)品觸達用戶。

無論是與新春等生活場景的貼合，還是模型能力上限的提升，可以說，豆包都已具備國民級 AI 產(chǎn)品的特征。

在過去幾年的科技行業(yè)，最有說服力的增長故事從來不是借補貼堆出來的。2022 年 11 月，ChatGPT 掀起全球 AI 熱潮后，靠著模型迭代成為了一個周活躍用戶數(shù)達 8 億的超級產(chǎn)品；兩年多后走紅的 DeepSeek 在沒有任何廣告投放、沒有多模態(tài)能力的情況下，穩(wěn)定維持著超過 3000 萬的日活躍用戶數(shù)。

字節(jié)跳動 CEO 梁汝波在年初的員工大會上將公司 2026 年的關(guān)鍵詞設(shè)定為了 “勇攀高峰”。他提到，AI 時代存在很多重要的機會，字節(jié)要追求其中最重要的，去攀登最高的高峰。

“真正的 AI 攻勢，是堅決把自己變成一家科技企業(yè)。” 上述字節(jié)跳動人士說。2026 年春節(jié)，這家公司正試圖點亮自己的 ChatGPT 時刻。

從水墨舞臺、機器人到算力洪峰，不一樣的春節(jié)戰(zhàn)役

作為少有的全民級晚會平臺，春晚在過去十年里一直是各互聯(lián)網(wǎng)公司重要的新用戶增長渠道，它與一眾互聯(lián)網(wǎng)產(chǎn)品之間的合作也幾乎與 “紅包” 綁定。從 2015 年開始，微信、支付寶、淘寶、京東、抖音、拼多多、快手等知名互聯(lián)網(wǎng)產(chǎn)品均在春晚上發(fā)放過紅包福利。

但在今年春晚，冠名方火山引擎接到的第一個任務(wù)卻是與舞臺視覺相關(guān)的。

一位字節(jié)跳動人士告訴我們，今年春晚導(dǎo)演組一直在探索將最新科技和傳統(tǒng)文化藝術(shù)相結(jié)合。因此作為獨家 AI 云伙伴，火山引擎及其背后的字節(jié)跳動不僅要以贊助方身份參與冠名，還要把 AI 與云計算能力嵌入到春晚節(jié)目的創(chuàng)作與制作流程中。

在《馭風(fēng)歌》這個節(jié)目里，歌手身后出現(xiàn)了一幅國寶級的駿馬水墨畫。節(jié)目籌備時，導(dǎo)演組并不滿足于將其當(dāng)作一個靜態(tài)背景，而是希望讓這些馬匹在舞臺空間里動起來，并與歌手互動。

為了達成這個效果，他們最初試過一些海外模型，但大多抓不住水墨畫的氣韻；國內(nèi)模型也同樣受限，水墨風(fēng)格的高質(zhì)量訓(xùn)練語料稀缺，生成出來的畫作風(fēng)格容易跑偏。更棘手的是運動一致性：馬要跑得流暢，卻又必須在每一幀都貼合原畫的筆觸與結(jié)構(gòu)、不變形；馬匹的數(shù)量、每匹馬之間的動作都要始終保持一致。

轉(zhuǎn)折來自字節(jié)跳動團隊帶來的 Seedance 2.0。這個全新的視頻生成模型不僅能更好地遵循物理規(guī)律，讓馬的步態(tài)更接近真實，關(guān)節(jié)銜接自然、動作連貫；還能很好地遵循導(dǎo)演的要求，實現(xiàn)像 “跑慢一點”“鬃毛飄動輕一點” 這類帶副詞的細微調(diào)度指令。它還有另一個重要的突破——模型不再是只能學(xué)單張圖的風(fēng)格，而是能同時學(xué)習(xí)大量不同風(fēng)格的多模態(tài)素材。

一位字節(jié)春晚項目組人士告訴我們，他們把導(dǎo)演組畫的草圖、水墨畫作，還有許多關(guān)于馬的影像素材一起喂給模型，通過參考生成的方式，實現(xiàn)畫風(fēng)與動作能穩(wěn)定地在同一個標(biāo)準(zhǔn)之下生成。他們還繞開了直接寫提示詞的方式，改用 Seedance 2.0 與圖像生成模型 Seedream 協(xié)作：先由 Seedream 生成每一幀關(guān)鍵幀，再由 Seedance 在關(guān)鍵幀約束下生成動態(tài)視頻，實現(xiàn)了風(fēng)格的一致性和運動的連貫性。

把理想中的效果表現(xiàn)出來只是第一步。春晚的每個節(jié)目迭代頻率都極高，因此字節(jié)團隊常遇到的情況是，剛交付一版滿意的畫面，導(dǎo)演組馬上提出：“能不能再往前走一步”。這些節(jié)目還需要經(jīng)歷反復(fù)過審與驗收，這也意味著他們每次都必須拿出更好的版本。“整體節(jié)奏基本得按 ‘周’ 來迭代推進。” 上述字節(jié)春晚項目組人士說。

很快新的難題又出現(xiàn)了。雖然《大鬧天宮》《小蝌蚪找媽媽》等上美影經(jīng)典作代表了手繪全動畫的巔峰，但在 AI 數(shù)字化生成的語境下，如何在高幀率、高分辨率的現(xiàn)代廣播標(biāo)準(zhǔn)中，讓水墨這種 ‘無邊界’ 的藝術(shù)形式在高速大運動下不閃爍、不崩壞，是行業(yè)公認的難題。

考慮到主流視頻生成模型通常輸出 720p 或 1080p 分辨率、24 幀/秒的視頻，字節(jié)團隊將突破點放在后處理鏈路，借助火山引擎視頻點播的畫質(zhì)增強能力升級畫質(zhì)：先通過超分技術(shù)，在不改變畫面內(nèi)容的前提下將較小尺寸的畫面放大至 6K 或 8K；再通過插幀技術(shù)將幀率從 24FPS 提升至 50FPS。這套處理也非一刀切的通用算法，而是能根據(jù)每一幀畫面的畫質(zhì)與內(nèi)容特點做專屬優(yōu)化。最終他們順利解決了這個難題。

除了舞美，字節(jié)團隊還將 AI 能力帶入了春晚的多個環(huán)節(jié)。舞臺上出現(xiàn)的機器人接入了豆包的視覺大模型、文本大模型和語音識別模型，語音側(cè)采用了豆包的合成與復(fù)刻模型。模型讓它們不僅有了 “大腦”，還裝上了 “嘴巴” 和 “耳朵”。

他們還提前收集了舞蹈演員的 3D 素材，再利用了空間視頻技術(shù)，將舞蹈演員制作成 3D 數(shù)字分身，在舞臺上實現(xiàn)真人 3D 克隆效果讓觀眾難辨真假。最后又加上了字節(jié)自研的 4D 高斯算法、豆包大模型優(yōu)化光影效果。

豆包 App 是今年春晚與觀眾互動的核心載體。與往年常見的在互聯(lián)網(wǎng)產(chǎn)品上搖紅包、搶紅包不同，今年互動流程改為，用戶需先在豆包上用大模型生成頭像或新春祝福，再搶紅包。這樣的變化極大抬高了成本——以往紅包互動形式的主要開銷集中在網(wǎng)絡(luò)、IO 和實時連接，現(xiàn)在則在原有基礎(chǔ)上疊加了龐大的算力請求與算力支出。

調(diào)控算力資源的難題也在大幅上升。一位字節(jié)的春晚項目組人士保守測算，用戶生成一條新春祝福或一張圖片，一次請求就需要完成 10 TOPS（每秒 10 萬億次操作）的計算量。而以往類似互動請求的計算量僅約 1/100000 TOPS，兩者在算力需求上相差了整整 100 萬倍。與此同時，他們在除夕當(dāng)晚還要應(yīng)對抖音、今日頭條等產(chǎn)品春節(jié)活動帶來的大模型調(diào)用。

由于時間緊迫，字節(jié)沒辦法靠臨時堆機器頂住算力洪峰。好在火山方舟頂了上來，這是字節(jié)統(tǒng)一調(diào)度算力的總控臺，長期在字節(jié)和外部客戶的各類高并發(fā)場景中沉淀了資源調(diào)度能力。火山方舟的一個特點是將推理、訓(xùn)練和離線任務(wù)放進同一資源池統(tǒng)一統(tǒng)籌，因此在春節(jié)算力與流量峰值來臨時，系統(tǒng)能把可延遲的負載錯峰挪開，為各類春節(jié)活動騰出更多資源。

這不是件容易做到的事情。它涉及到海量場景、多個機房、多種機型和多類模型，還要持續(xù)動態(tài)分配資源。一位火山引擎人士把這個過程形容為 “裝箱”：一方面，不同流量的延遲要求不同、對異構(gòu)硬件的依賴不同，約束極多、解空間巨大；另一方面，大模型推理不像傳統(tǒng) CPU 服務(wù)那樣資源類型相對統(tǒng)一，同一個推理服務(wù)里也可能混用多種硬件。更麻煩的是，GPU 的遷移不是單點動作，存儲、網(wǎng)絡(luò)、上游負載均衡等配套資源也要協(xié)同遷移，否則算力挪過去也接不住流量。

“冠名春晚對字節(jié)來說，不再是一場簡單的增長活動，它更像一次真正的技術(shù)試煉。” 一位字節(jié)跳動人士說。

AI 時代，靠紅包換增長的模式失靈了

字節(jié)跳動今年與春晚合作方式的變化，似乎再一次說明：AI 時代的增長邏輯正在改寫。

移動互聯(lián)網(wǎng)時代，巨頭崛起不是靠時刻引領(lǐng)創(chuàng)新，而是靠在有人驗證了某個需求后，成體系地做出同款產(chǎn)品，以更高效率大量拉來用戶，再根據(jù)用戶反饋快速迭代改進體驗。更好的體驗帶來更多的收入，這些收入又被拿來投放，獲得更多用戶，如此循環(huán)。撒錢則是最直接的增長手段。

“核心是極速增長、極速迭代、極速變現(xiàn)的飛輪。” 一位互聯(lián)網(wǎng)公司的產(chǎn)品經(jīng)理說。

對互聯(lián)網(wǎng)產(chǎn)品而言，越快拉新，產(chǎn)品體驗越快提升。“多數(shù)情況下，推薦算法是發(fā)現(xiàn)你和另一個用戶偏好相似，然后把他喜歡的東西展示給你。” 一名推薦產(chǎn)品經(jīng)理說。用戶增加，可供算法學(xué)習(xí)、發(fā)現(xiàn)關(guān)聯(lián)的數(shù)據(jù)隨之增加。這既適用于推薦視頻、小說，也適用于推薦商品卡、帶貨直播間。微信支付的崛起是另一個例子，它用紅包把支付變成了社交的一部分，想?yún)⑴c就得綁卡、能轉(zhuǎn)賬。人越多，越常用，久而久之就成了默認的支付工具。

交易型產(chǎn)品同樣受益于此。一個打車平臺會同時補兩端：一邊補司機提高供給，一邊補乘客拉動需求。司機密度上來后，乘客等待時間縮短；訂單密了，司機空駛更少，平臺的履約成本也會隨之下降，用戶體驗也更好。

互聯(lián)網(wǎng)產(chǎn)品的成本也不會隨著用戶增加而線性上漲；新增開銷主要在帶寬、存儲和機器資源上，它還會隨著用戶規(guī)模的提升而被攤薄。

但 AI 產(chǎn)品幾乎是互聯(lián)網(wǎng)產(chǎn)品的另一面。

2025 年初，字節(jié)跳動 CEO 梁汝波曾在集團全員會上提到，豆包沒顯出 “越多人用越好用” 的互聯(lián)網(wǎng)產(chǎn)品特性。這部分因為 chatbot 產(chǎn)品不是社交網(wǎng)絡(luò)或平臺。

用戶數(shù)量增長帶來的新數(shù)據(jù)也有限。一個短視頻產(chǎn)品，只要用戶還在上下刷，就會產(chǎn)生一組組數(shù)據(jù)供推薦算法優(yōu)化；但 chatbot 類產(chǎn)品生成一段回復(fù)，只有極糟時，用戶才有動力多點下按鈕反饋。能收集來數(shù)據(jù)，也不保證它們能讓底層模型更聰明。“多數(shù)用戶的問題高度重合，又沒什么深度，沒辦法提高模型能力。” 一位互聯(lián)網(wǎng)公司的 AI 產(chǎn)品經(jīng)理說。“比如代碼方向，公司就會在內(nèi)部找程序員寫案例。”

大模型的專業(yè)能力早已超過大多數(shù)人類，它們不能通過收集普通人的數(shù)據(jù)改善自己，就像 AlphaGo 不需要和普通人對弈來提升技藝——它后來的變種 AlphaGo Zero 甚至連世界冠軍的數(shù)據(jù)都不用，只是機器訓(xùn)練機器就能贏過所有人。即便 ChatGPT 應(yīng)用的月活躍用戶量比 Claude 高出 100 多倍，但這沒有讓 OpenAI 的模型比 Claude 好用哪怕一倍。

AI 還無法像互聯(lián)網(wǎng)產(chǎn)品那樣，靠用戶量攤薄成本。一位深入研究 AI 的二級市場人士曾測算，目前的主流 AI 產(chǎn)品如果服務(wù) 1 億日活用戶，每天的模型推理成本就要幾千萬元。這個計算還沒有考慮新的 Agent 產(chǎn)品，如果類似 Manus 的產(chǎn)品開始流行，單個用戶每天需要的算力可能還會再翻幾倍。

最關(guān)鍵的是商業(yè)化難題。在海外，ChatGPT、Gemini、Claude 砸下了巨額投資以滿足復(fù)雜計算，用戶也必須付錢，低一檔 17-20 美元/月，高一檔可以到數(shù)百美元/月。但愿意為軟件服務(wù)支付這般費用的中國用戶很少，字節(jié)和阿里等公司更多是靠云服務(wù)賺回在 AI 上投入的錢——把模型能力做成云上的 API/托管服務(wù)與行業(yè)解決方案，企業(yè)按調(diào)用量、并發(fā)、存儲與算力時長付費。

根據(jù)官方數(shù)據(jù)，2025 年 12 月，火山引擎上的豆包大模型日均 Token 處理量超過 50 萬億，半年增長超 200%。增長的動力不只來自字節(jié)旗下豆包、即夢等 AI 應(yīng)用快速發(fā)展，還有一批外部客戶在深入使用大模型：累計使用上萬億 Token 的超過 100 家，比全球云計算巨頭 AWS 還多了一倍。

當(dāng)下，AI 產(chǎn)品體驗提升幾乎全部來自底層模型能力提升。AI 代碼編輯器 Cursor 能出圈，前提是它接入了 Claude 系列模型代碼能力大幅提升。OpenAI 的 Deep Research 體驗驚艷，也是靠底層模型學(xué)會了長鏈思考、分步解題。

如果大模型能持續(xù)進步，許多精心調(diào)教后的產(chǎn)品能力成為龐大模型的一部分，用戶直接說幾句話就能實現(xiàn)想要的效果，那大模型本身就是終極產(chǎn)品。ChatGPT 與 DeepSeek 的成功都在說明，靠投流、補貼去搬運用戶的老辦法越來越吃力，真正能拉開差距的，還是模型與產(chǎn)品體驗的硬實力。

唯一的解法：更堅定地成為一家科技公司

2017 年的一次 CEO 面對面上，有字節(jié)跳動的員工問算法技術(shù)負責(zé)人楊震原：公司在人工智能上與 BAT 的差距在哪里？楊震原回答說，“今日頭條本來就是一家人工智能公司。” 他進一步解釋，做信息分發(fā)就是需要人工智能，今日頭條想通過機器和人結(jié)合的方式提升創(chuàng)作、分發(fā)、討論等每個環(huán)節(jié)的效率。

當(dāng)時，AI 在字節(jié)跳動的產(chǎn)品中已經(jīng)有一些應(yīng)用，比如推薦、內(nèi)容創(chuàng)作、抖音的 AR 效果、內(nèi)容審核、廣告系統(tǒng)、頭條號自動生成封面、時光相冊和東方 IC 對圖片的篩選功能等等。

2022 年底，ChatGPT 橫空出世帶來了新的 AI 熱潮。字節(jié)跳動是這一輪里投入最大的中國科技巨頭之一。它迅速訂購了大量 GPU、組建全新的 AI 部門，從 infra、數(shù)據(jù)、模型、產(chǎn)品到人才全方位追趕硅谷公司。兩年后，字節(jié)的模型數(shù)量、迭代速度和表現(xiàn)明顯提升。

技術(shù)的躍升很少一蹴而就，背后需要堅定的長期投入。一位字節(jié)跳動人士回憶，Seedance 1.5 推出時，外界對它的評價并不高：人物在運動中容易崩壞，細節(jié)也不夠穩(wěn)定。后來 Seedance 2.0 的效果明顯提升，有人猜測這是團隊調(diào)整了 Benchmark，把更影響用戶體驗的指標(biāo)排在了更前面。

“其實大家都忽略了基礎(chǔ)工作的重要性。” 上述人士說。以運動崩壞為例，團隊需要反復(fù)驗證不同方案，找到更有效的路徑，這類工作很耗時，卻是必須補齊的基礎(chǔ)能力。“就像一個很聰明的小朋友，未來也許能解大學(xué)題，但如果基礎(chǔ)知識沒學(xué)完，現(xiàn)在硬讓他做，結(jié)果肯定不會好。”

另一個例子是豆包的語音合成模型（Seed TTS）。2024 年，團隊在做 Seed TTS 1.0 時的目標(biāo)是讓模型能自然流暢地復(fù)刻說話者特征，尤其在跨語種時也能保持相似度與韻律。當(dāng) 1.0 達到可用水平后，新的問題又暴露出來了：模型的語氣表達太平淡。但這個難題在當(dāng)時無法快速解決，于是他們在研發(fā) 2.0 版本時，把重點放在了將理解與思考能力融入端到端語音鏈路上。直到 2025 年中 Seed TTS 2.0 發(fā)布，模型才具備了更強的情感表達能力。

字節(jié)也是少有愿意在基礎(chǔ)研究上投入資源的中國科技公司。一位接近字節(jié)高層的人士曾告訴我們，字節(jié)目前的 infra （工程化能力）已經(jīng)比國內(nèi)任何一家公司都要強。但和全球比，最大的問題是缺少 OpenAI 里那種能提出方向、能做前沿探索的人，比如 GPT 4o、Sora。

“中國過去沒有真正的企業(yè)研究院是因為民營企業(yè)盈利能力有限，現(xiàn)在終于可以試一試了。” 上述人士說。

2025 年 1 月下旬，字節(jié)正式設(shè)立了代號為 “Seed Edge” 的研究項目，核心目標(biāo)是做比預(yù)訓(xùn)練和大模型迭代更長期、更基礎(chǔ)的 AGI 前沿研究。該計劃設(shè)定了更寬松的考核機制：字節(jié)本來每半年考核一次績效，而 Seed Edge 則在項目取得突破進展后，再做最終評估。

字節(jié)在考察 AI 項目時，ROI 依然重要，但周期更長了。一位字節(jié) AI 產(chǎn)品團隊人士告訴我們，字節(jié)現(xiàn)在會以 AI 產(chǎn)品一定周期后的單用戶價值作為考核系數(shù)，以測算未來收益，不同產(chǎn)品的考核周期不同，長的甚至可以到 5 年；但字節(jié)也沒對這種考核方式做強制要求。

商業(yè)和科技史上無數(shù)次驗證過了，想要拿下用戶、市場，或者是更大的機會，靠的永遠是技術(shù)的躍遷與產(chǎn)品的硬實力。

二十多年前，Google 因擔(dān)心微軟殺入搜索市場，在內(nèi)部制定了 “芬蘭計劃”。這套計劃的核心不是守城，而是逼自己持續(xù)做出更有創(chuàng)造力、把體驗打到極致的產(chǎn)品——哪怕在 Windows 這樣的主場上，也要做出比微軟自帶工具更好用的瀏覽器。最終，在沒有產(chǎn)品迭代優(yōu)勢、沒有網(wǎng)絡(luò)效應(yīng)的背景之下，Google 硬是靠著出色的工程技術(shù)能力做出了 Chrome 并贏得了戰(zhàn)爭的勝利。

在與微軟的競爭中，Google 還鍛造出一套強大的商業(yè)化系統(tǒng) AdSense，把源源不斷的現(xiàn)金流與生態(tài)網(wǎng)絡(luò)牢牢綁定在自己身上，并在此后多年逐步沉淀為難以撼動的壁壘。

2024 年，OpenAI 聯(lián)合創(chuàng)始人、前首席科學(xué)家伊爾亞·蘇茨克維 (Ilya Sutskever) 曾提到，“2010 年代是擴大規(guī)模的時代，現(xiàn)在我們再次回到了需要奇跡和新發(fā)現(xiàn)的時代。” 對字節(jié)跳動來說，它用 13 年長成中國最大的互聯(lián)網(wǎng)公司；如今又遇到一場上限足夠高的新游戲，需要用真正的技術(shù)與產(chǎn)品去再次證明自己——這樣的機會，它不會錯過。

題圖來源：視覺中國

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.