網易首頁 > 網易號 > 正文 申請入駐

字節證明了,豆包不止是個搞笑姐

0
分享至



文|魏琳華

編|王一粟

越到春節越熱鬧,2月接近過半,全球AI行業迎來了一個忙碌的“超級發布月”。

海外御三家先后參戰,先是OpenAI和Anthropic撞檔期,前后腳發布了GPT 5.3 codex和Claude Opus 4.6,隔了幾天,Google把Deep Think端了上來;國內,兩家上市的六小虎智譜、MiniMax發模型,視頻領域,快手的可靈3.0和字節的Seedance對打。真是好不熱鬧。

在這場模型對決中,字節算得上是本周掀起最大熱度的一家參戰者。不說Seedance 2.0的破圈效應,在發模型的力度上,字節本周一口氣把視頻、圖片生成和大語言模型全都放了出來,每個領域都在刷存在感。

回顧這兩年,其實在大語言模型的領域,字節的存在感顯然不如視頻、圖文等多模態領域更強,但豆包卻成了AI入口之爭中表現最好的產品。

事事爭先的字節,目標一定是全領域覆蓋。所以這次的豆包2.0大模型(Seed 2.0),也是有備而來。

豆包之所以領先,靠的不僅僅是字節系流量的灌溉,更關鍵的是找對了用戶想玩的場景。比如最近刷視頻,天天都能刷到豆包指點人類穿搭。

所以在大語言模型的優化上,豆包的進展也延續了場景思路,重點在兩個方向:一是繼續在多模態能力上發光發熱,二是為了火山引擎做鋪墊,優化了Agent相關能力,讓它在企業端更好用。

字節的AI野心,正在隨著模型能力的補全緩緩展開。

進化靠場景:左手多模態、右手抓Agent

可以說,Seed 2.0更新最亮眼的能力,就是多模態的進化。

在官方曬出取得成績的一系列領域中,一部分功勞就要歸到視覺理解能力身上。以數學領域為例,字節超過海外多個閉源大模型的其中兩個指標MathVista、MathVision,這兩者重點考察模型對包含視覺信息的數學問題的理解能力——也就是模型不僅得數學好,還得“看”得明白。



除了視覺推理,在視頻場景的理解上,Seed 2.0的表現也相對突出。在官方演示中,它能通過對于時間、運動感知的理解,讓大模型看明白視頻中的內容。比如吃透臺球的走位、推測擊打臺球的位置。

不難想象,這個功能如果后期和視頻通話進行聯動,豆包又能做出來多少出圈視頻。

多模態能力的加強,也讓Seed 2.0優化了一些在現實中更剛需的場景。豆包不僅僅是基于用戶需求優化,字節在做模型的思路上,也同樣是朝著場景落地來做優化。

在Seed 2.0文檔描述中,官方提到,之前分析過Seed 通用模型在 MaaS 服務中的調用情況,發現,最高比例的需求為處理混雜圖表、文檔等非結構化信息的知識內容。

光錐智能用網上搜集來的一張簡歷表的圖片給到豆包做參考,讓它做個一模一樣的表格出來。在實際測試效果中,雖然表格的大小比例還需要自己優化,但豆包已經能把表格的內容完整復制下來。


左為參考圖片,右為Seed 2.0生成的表格

我們又丟了一張混雜著各種柱狀圖表的圖片讓豆包解讀,它也能準確識別不同軸每個月份的信息。并且讀出來柱狀圖上的數字、不同顏色的軸代表的意義是收入和差值,然后講解圖片代表的意義。





另外,除了提升文件信息的處理,豆包這次把重心放在了Agent上。同樣是為了企業應用的場景考慮,做了對長內容理解和連續多步驟執行能力的優化。

從測評數據來看,在Agent任務的執行上,Seed 2.0確實站上了第一梯隊的位置。

以HLE(人類最后的測試,用于評判處理復雜任務的能力)為例,Seed 2.0拿到了52.4,超過了海外多個模型,超過了這幾天新發的模型GLM 5.0、MiniMax 2.5。但如果和開源老大哥阿里的Qwen-3 Thinking Max(58.3)相比,還有些許差距。



為了測試豆包的Agent能力,光錐智能給了豆包一串月之暗面曾經展示過的提示詞,讓Seed 2.0做一個在手機端運行防止作弊的小問卷,主題是考驗用戶對豆包2.0的理解,一共出十道題就行。

雖然豆包一開始做的版本沒辦法點擊測試按鈕跳轉到題目,但我們讓它自動修正兩次后,豆包把這個需求成功復刻出來了。能運行、能跳轉、能打分。

再讓它做了下連連看、黃金礦工這類小游戲,雖然在畫面上還有很大的優化空間,不算美觀。但豆包給到的已經是一個能直接運行的游戲網頁。



可以說,現在的Seed 2.0,對于普通用戶的體驗來說足夠友好。不過在今年大火的Coding場景上,豆包的大模型梯隊還背著追趕第一梯隊的任務。

比如,在SWE-bench Verfied(用代碼解決問題的能力)測試上,Seed 2.0的表現還沒辦法和智譜、MiniMax的新模型抗衡。Vibe Coding上,Seed 2.0的表現也不算突出。不過字節也沒準備把Coding塞到這個模型里,而是另發了一個Coding模型補全代碼能力。



在模型定價上,Seed 2.0可以說把價格壓到了非常低的程度,這一如既往地符合字節在大模型方面的低價策略。官方給出的價格展示中,Seed 2.0的輸入價格被壓低至0.6元/百萬tokens,對比Claude Sonnet 4.5 3美元/百萬token的價格,Seed僅是其 1/35,相比智譜GLM-5每百萬tokens6元的價格,它僅是其1/10。

這樣的價格,在Agent搶跑的2026年,可以想象,會成為字節做Agent的落地優勢。

字節式勝利:視頻模型的場景和速度戰

如果說Seed 2.0是基礎設施的加固,那么本周發布的視頻模型Seedance 2.0,則算得上字節打得相當漂亮的一場仗。

時間倒退回幾年前,可靈是第一個在國內引起震動的視頻生成模型。而現在,這種先發優勢正在被后者追趕上。

本月,快手和字節先后發布了視頻生成模型的更新,快手發了可靈3.0,在分鏡能力上有所優化,但目前還在內測階段,尚未在官網全量上線;字節的Seedance 2.0雖然發得晚,但在真人素材、分鏡、物理規律理解和視頻匹配的音頻效果上的優化,加上不到一周時間就基本開放到人人可用的程度,后者成為當前聲量最大的視頻生成產品。

但在實際測試中,光錐智能以快手可靈2.6和字節Seedance 2.0做測試,其實兩者拉開的差距并沒有大到拉開一個量級的差距。

就以物理規律為例,光錐智能以“臺球撞擊”為提示詞,讓兩個模型分別生成白球擊打紅球、紅球落袋的視頻,從結果來看,兩者各有優勢:可靈2.6沒有生成球桿擊打的效果,但白球擊中紅球一次后就順利落袋;Seedance 2.0給到了球桿擊打的畫面碰撞了兩次紅球才落袋。

但復盤Seedance 2.0的破圈之路,會發現,這個模型的破圈在場景需求+字節工廠的能力下,幾乎是必勝的。

先說場景,字節在社媒的快速破圈,不僅是靠影視颶風Tim、游戲科學創始人馮驥的點評和測試,還有真人素材生成視頻的玩法破圈。這種生成的真實度包括了人像的真實、語音效果和本人的接近,讓更多用戶愿意“嘗鮮”。

找到場景的情況下,字節正在靠剪映、豆包覆蓋到更多用戶。當競爭對手快手可靈3.0仍處于內測階段,僅限小范圍用戶體驗的情況下,字節把Seedance 2.0的體驗放到了剪映、豆包中。當前,剪映及海外CCapcu工具t在剪輯中處在斷層領先的優勢,而豆包也是AI助手月活第一的產品。


現在,你可以直接在豆包里用上Seedance 2.0

可以說,字節用速度和生態的覆蓋,成功拿下了市場。

除了視頻生成模型外,在圖像生成方面,字節本周發布的Seedream 5.0 Lite延續了字節在圖片生成領域的優勢。這次的更新,主要圍繞著實時信息搜索和指令遵循兩部分能力的提升,前者讓圖片生成能夠基于網上的信息增強理解效果,后者則讓它生成的結果更符合用戶提示詞給出的需求。

反過來,字節在多模態能力上的持續加強,也在反哺著豆包App。

最近爆火的豆包視頻實時指導你穿搭,效果搞笑,被更多人當成了新奇玩法,這些高頻場景不僅培養了用戶習慣,也為模型提供了更多有效的對話信息。

本周三個大模型更新的“超級發布周”,是一次典型的字節式勝利:優勢不僅是單點技術的突破,還靠接地氣的產品化能力和與普通用戶貼近的場景。

模型層面,字節在春節前交了一個能讓團隊滿意的答卷,證明了豆包不止是一個“搞笑姐”。產品層面,豆包要和各家大廠AI App打的仗,即將在春晚掀開帷幕。

隨著模型能力差距的拉近,這場AI戰爭,注定越來越激烈。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
利潤559萬到市值一萬億:誰在把中際旭創的“命大”包裝成神話?

利潤559萬到市值一萬億:誰在把中際旭創的“命大”包裝成神話?

新浪財經
2026-04-26 22:41:16
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,但素顏卻沒有那么美

趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,但素顏卻沒有那么美

喜歡歷史的阿繁
2026-04-26 12:24:07
日本政府圖謀出口二手武器,不斷突破“紅線”引擔憂

日本政府圖謀出口二手武器,不斷突破“紅線”引擔憂

參考消息
2026-04-26 20:00:08
1984年中美黑鷹直升機交易內幕:原計劃提供100架,為何只有24架

1984年中美黑鷹直升機交易內幕:原計劃提供100架,為何只有24架

文史達觀
2026-04-27 17:47:47
002378,一季度凈利潤暴增近800%!

002378,一季度凈利潤暴增近800%!

證券時報e公司
2026-04-27 20:40:53
妹子,你露個大白胸脯,在這兒干什么呢?

妹子,你露個大白胸脯,在這兒干什么呢?

飛娛日記
2026-04-18 10:48:09
女人只要嘗過男人這三種滋味,心就被拴死了,趕都趕不走

女人只要嘗過男人這三種滋味,心就被拴死了,趕都趕不走

荷蘭豆愛健康
2026-04-27 18:36:33
斯諾克賽程:決出4席8強,吳宜澤生死戰,火箭沖8冠,5虎變3虎?

斯諾克賽程:決出4席8強,吳宜澤生死戰,火箭沖8冠,5虎變3虎?

劉姚堯的文字城堡
2026-04-27 07:56:16
CBA季后賽賽程出爐,預測這4隊進8強,常規賽單項獎,老六等入選

CBA季后賽賽程出爐,預測這4隊進8強,常規賽單項獎,老六等入選

第五才子
2026-04-27 11:17:31
回來了!你好,隆多!已經面試NBA球隊主帥

回來了!你好,隆多!已經面試NBA球隊主帥

籃球實戰寶典
2026-04-27 19:00:50
記者:恰爾汗奧盧可能賽季報銷,世界杯時才能復出

記者:恰爾汗奧盧可能賽季報銷,世界杯時才能復出

懂球帝
2026-04-27 18:48:21
雞蛋能不能天天吃?醫生忠告:過了60歲以后,吃雞蛋牢記5個關鍵

雞蛋能不能天天吃?醫生忠告:過了60歲以后,吃雞蛋牢記5個關鍵

芹姐說生活
2026-04-27 17:13:55
湖人故意輸球還是真打不過?雷迪克早給出“答案”,詹姆斯盡力了

湖人故意輸球還是真打不過?雷迪克早給出“答案”,詹姆斯盡力了

麥子的籃球故事
2026-04-27 15:20:19
4月底截止!退休老人這3件事不辦,5月養老金、醫保全受影響

4月底截止!退休老人這3件事不辦,5月養老金、醫保全受影響

頤年齋
2026-04-27 08:30:27
三大利好!外資大舉加倉(名單)

三大利好!外資大舉加倉(名單)

證券之星
2026-04-27 16:16:04
天地會逃到海外,成立了一個國家,面積比兩個日本大,至今說漢語

天地會逃到海外,成立了一個國家,面積比兩個日本大,至今說漢語

史之銘
2026-04-27 16:15:05
Coco死不悔改,解封后又開始爆料!謝賢解衣供她取暖,還借花獻佛

Coco死不悔改,解封后又開始爆料!謝賢解衣供她取暖,還借花獻佛

娛樂團長
2026-04-25 19:23:12
陜西廣電《都市快報》記者王景文因病去世,年僅51歲

陜西廣電《都市快報》記者王景文因病去世,年僅51歲

澎湃新聞
2026-04-27 10:18:27
申京談艾頓肘擊:我沒想到他會被驅逐,既然都吹了那就這樣吧

申京談艾頓肘擊:我沒想到他會被驅逐,既然都吹了那就這樣吧

懂球帝
2026-04-27 14:44:26
2026-04-27 21:51:00
光錐智能 incentive-icons
光錐智能
來這里,看千行百業的數字化、智能化。
963文章數 139關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

游戲
旅游
親子
本地
公開課

再引爭議!PS5實體版黑旗RE也要強制聯網安裝

旅游要聞

【開局之年看中國·遇見不一樣的江蘇】美食、NPC、古風演藝一站式打卡,在這里解鎖南京文商旅融合新姿勢

親子要聞

教孩子防侵犯誤區:對熟悉的壞人孩子不會害怕和恐懼!

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版