2025大模型“中標(biāo)王”出爐了
毫無懸念,又是科大訊飛
無論金額還是數(shù)量,訊飛都高居第一
![]()
為什么說“又”
因?yàn)?024年的大模型中標(biāo)王
也是科大訊飛
甚至,還有很多老司機(jī)預(yù)判
2026年,中標(biāo)王大概率還是科大訊飛
為啥?只因訊飛又踩準(zhǔn)了爆發(fā)點(diǎn)
這就是:智能體
![]()
你發(fā)現(xiàn)了嗎
整個(gè)業(yè)界,從未有過如此統(tǒng)一的共識(shí)
各類廠商步調(diào)出奇一致
全在加碼智能體
![]()
這種大背景之下
大模型落地能力的爭(zhēng)奪
就變成了AI工程化交付能力的較量
而這,恰恰是科大訊飛的強(qiáng)項(xiàng)
![]()
在1月26日剛剛結(jié)束的
訊飛星辰智能體平臺(tái)升級(jí)發(fā)布會(huì)上
科大訊飛“狂卷智能體”的大招來了
這個(gè)大招就是「多模協(xié)同」
![]()
在過去的2025年,我們看到
業(yè)界涌現(xiàn)出各種各樣的智能體
這些智能體都“有點(diǎn)東西但是不多”
多模態(tài)能力不足影響了實(shí)際落地效果
![]()
此次,訊飛以「多模協(xié)同」為技術(shù)基石
打破語音、視覺、動(dòng)作、業(yè)務(wù)流之間的壁壘
將智能體從對(duì)話機(jī)器
升級(jí)為可嵌入千行百業(yè)、具備復(fù)雜問題解決能力的數(shù)字員工與業(yè)務(wù)伙伴
![]()
- 科大訊飛將核心能力全部產(chǎn)品化、模塊化、平臺(tái)化,客戶和生態(tài)只需要按業(yè)務(wù)需求組合能力,即可快速生成一個(gè)可落地、可交付的生產(chǎn)級(jí)Agent。
具體怎么干呢?
我們針對(duì)傳統(tǒng)Agent的各種短板
逐個(gè)來?yè)羝?/p>
01、交互 for Agent
過去,開發(fā)一款機(jī)器人、智能硬件
是一項(xiàng)繁瑣且高門檻的工程
尤其在“五感”和“智商”上
眼睛(視覺)耳口(語音)大腦(大模型)
在不同的開發(fā)平臺(tái)之間來回倒騰
工作量大,交互效果差
![]()
現(xiàn)在,訊飛把兩大核心平臺(tái)打通
1、星辰智能體平臺(tái)是“大腦”
負(fù)責(zé)邏輯思考、任務(wù)編排和業(yè)務(wù)流處理
2、訊飛AIUI開放平臺(tái)是“嘴巴和耳朵”
是讓硬件具備智能交互能力的平臺(tái)
讓硬件能聽得清、說得準(zhǔn)、能交互
![]()
開發(fā)者在構(gòu)建機(jī)器人、智能硬件時(shí)
直接調(diào)用兩個(gè)平臺(tái)的能力
一鍵接入語音交互
瞬間擁有頂級(jí)的“五感”
![]()
這極大降低了開發(fā)門檻
讓機(jī)器人智能體迎來了質(zhì)的飛躍
① 面部識(shí)別
從看見臉到鎖定對(duì)話人
通過視聽融合技術(shù),機(jī)器人不僅能識(shí)別面部,還能在多人嘈雜環(huán)境中結(jié)合聲源定位,精準(zhǔn)鎖定當(dāng)前的對(duì)話主角,實(shí)現(xiàn)自由交互。
![]()
②多模態(tài)感知
這下厲害了,智能體耳聰目明嘴又甜
還能理解周圍環(huán)境,洞察人類意圖
![]()
③ 多模內(nèi)容輸出
智能體和人類的交流方式
可以更加豐富多樣,除了文本、語音
還可以圖像視頻或結(jié)構(gòu)化數(shù)據(jù),甚至某個(gè)行為
![]()
02、運(yùn)動(dòng) for Agent
快速規(guī)劃動(dòng)作軌跡
讓機(jī)器人手腦合一
你可以隨便動(dòng)動(dòng)嘴,使喚機(jī)器人
我們拿訊飛桌面硬件機(jī)器人舉例
①通過對(duì)話布置任務(wù)
![]()
②理解任務(wù),快速規(guī)劃動(dòng)作軌跡
![]()
③結(jié)合多模態(tài),完成任務(wù)執(zhí)行
![]()
03、形象 for Agent
除了實(shí)體機(jī)器人智能體
我們?cè)谏钪懈R姷氖?/p>
活躍在屏幕里的虛擬人智能體
![]()
如何讓這些智能體更有“真人感”呢
訊飛升級(jí)了「多模態(tài)超擬人交互技術(shù)
嘿嘿,虛擬人終于“人里人氣”的了
不僅能說,還會(huì)演
口型、表情、眼神隨語音內(nèi)容實(shí)時(shí)自然變化
![]()
訊飛還提供多人高噪場(chǎng)景自由交互技術(shù)
哪怕是候車大廳這種嘈雜的場(chǎng)景下
也能認(rèn)準(zhǔn)你、聽清你
不受背景噪音干擾
只和你一個(gè)人面對(duì)面交流
![]()
不僅如此,通過訊飛星辰的編排
我們可以為智能體注入“靈魂”
讓他們既懂專業(yè)知識(shí),又懂業(yè)務(wù)邏輯
這才是企業(yè)需要的能扛活的數(shù)字員工
![]()
- 通過這一套「造皮囊+注靈魂」的組合拳,企業(yè)可以快速生成一個(gè)既擁有專業(yè)形象(如穿著制服、表情得體的客服),又具備專業(yè)技能的“數(shù)字員工”。
04、人設(shè) for Agent
千篇一律的客服臉、機(jī)器音
人設(shè)枯燥單一,用戶根本不想聊
企業(yè)想要個(gè)有品牌特色的代言人
定制成本又太高
![]()
訊飛星辰智能體平臺(tái)
可以精準(zhǔn)定制角色模型
實(shí)現(xiàn)智能體交互千人千面
你的AI員工可以是張飛,也可以是貂蟬
![]()
訊飛業(yè)界首發(fā)百變聲音創(chuàng)造
通過聲音與多屬性信息聯(lián)合訓(xùn)練
(語種、方案、情感、風(fēng)格人設(shè))
只需要一句話描述文本
即可實(shí)現(xiàn)聲音百變風(fēng)格切換
![]()
05、執(zhí)行 for Agent
大多數(shù)AI只能給你出主意
(內(nèi)容生成:文本、圖片、視頻)
具體閉環(huán)干活還得靠自己動(dòng)手
(復(fù)制粘貼、鍵鼠操作、工具調(diào)用)
![]()
星辰智能體平臺(tái)與RPA相結(jié)合
一方面,AI智能體有了能直接干活的手腳
另一方面,傳統(tǒng)RPA也有腦子、懂人話了
![]()
接下來,只需要一句話發(fā)號(hào)施令
AI就能幫你閉環(huán)把事兒干完
自動(dòng)化瀏覽器操作
一站完成數(shù)據(jù)處理
![]()
看到這里,你就明白了吧
訊飛通過一系列的多模態(tài)「加持手段」
讓智能體脫胎換骨,扛活兒能力飆升
![]()
在智能體大規(guī)模落地的2026
訊飛拋出了多模態(tài)能力全面升級(jí)殺手锏
死磕落地場(chǎng)景和工程化交付
各種行業(yè)大單,可以盡管放馬過來了
![]()
![]()
同時(shí),訊飛還以場(chǎng)景為核心
打造出面向出海的智能體業(yè)務(wù)矩陣
覆蓋中東、東南亞的8大智能體應(yīng)用場(chǎng)景
訊飛這架勢(shì),不光要做國(guó)內(nèi)的「中標(biāo)王」
還要當(dāng)出海場(chǎng)景的「航海王」
![]()
所以,圈里老司機(jī)這波預(yù)測(cè)很穩(wěn)
用多模協(xié)同,狂卷智能體落地
2026大模型中標(biāo)王
大概率還是科大訊飛!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.