在技術(shù)創(chuàng)新、應(yīng)用深化與產(chǎn)業(yè)融合的多維驅(qū)動(dòng)下,人工智能正全方位重塑智能終端產(chǎn)業(yè)發(fā)展范式,大模型輕量化、邊緣計(jì)算和AI芯片等底層技術(shù)的持續(xù)突破,顯著提升了終端本地化智能處理能力;多模態(tài)交互、生成式AI和情境感知等創(chuàng)新應(yīng)用,推動(dòng)人機(jī)交互從被動(dòng)響應(yīng)向主動(dòng)服務(wù)躍遷升級(jí),為用戶帶來(lái)了更高等級(jí)的智能服務(wù)和更加便捷友好的使用體驗(yàn)。
為進(jìn)一步促進(jìn)人工智能終端智能服務(wù)落地及應(yīng)用過(guò)程規(guī)范化,助推人工智能終端在各應(yīng)用場(chǎng)景穩(wěn)定發(fā)揮效能,中國(guó)信通院已全面啟動(dòng)人工智能終端智能服務(wù)能力分級(jí)場(chǎng)景測(cè)試驗(yàn)證,優(yōu)先聚焦智能手機(jī)12大應(yīng)用場(chǎng)景開展,智能服務(wù)能力等級(jí)涵蓋L1級(jí)-L3級(jí),并發(fā)布6期不同場(chǎng)景測(cè)試報(bào)告。
![]()
本期報(bào)告聚焦交通出行—智能打車場(chǎng)景進(jìn)行分析。
在人工智能技術(shù)加速落地、數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)深度融合的時(shí)代背景下,智能手機(jī)已超越傳統(tǒng)通信終端的定位,推動(dòng)交通出行服務(wù)向便捷化、智能化、高效化轉(zhuǎn)型升級(jí)。隨著生成式AI、多模態(tài)感知、端側(cè)算力優(yōu)化等技術(shù)的迭代突破,終端系統(tǒng)智能體已實(shí)現(xiàn)全維度能力升級(jí),具備自主感知、精準(zhǔn)決策、記憶學(xué)習(xí)、高效執(zhí)行的完整能力體系,徹底重構(gòu)打車服務(wù)的全流程邏輯。相較于傳統(tǒng)模式,升級(jí)后的系統(tǒng)實(shí)現(xiàn)了打車服務(wù)的自動(dòng)化、智能化躍遷——用戶無(wú)需進(jìn)行繁瑣的手動(dòng)操作,僅需通過(guò)語(yǔ)音、文字等自然交互方式,清晰告知終端自身的打車意圖及核心需求(如車型偏好、出行時(shí)效、特殊服務(wù)需求等),系統(tǒng)便能自動(dòng)完成意圖解析、路徑規(guī)劃、車型智能匹配、訂單精準(zhǔn)下發(fā)、行程實(shí)時(shí)跟蹤等全流程操作,大幅簡(jiǎn)化用戶交互鏈路,實(shí)現(xiàn)了更加便捷的出行體驗(yàn)。未來(lái),終端系統(tǒng)智能體將依托用戶出行行為數(shù)據(jù)的深度挖掘與學(xué)習(xí),實(shí)現(xiàn)出行需求的提前預(yù)判,主動(dòng)推送適配的打車方案;同時(shí),結(jié)合城市交通大數(shù)據(jù)的協(xié)同聯(lián)動(dòng),進(jìn)一步優(yōu)化運(yùn)力調(diào)度效率,推動(dòng)打車服務(wù)與公共交通、共享出行等業(yè)態(tài)深度融合,構(gòu)建全域協(xié)同的智慧出行體系,為交通出行領(lǐng)域的高質(zhì)量發(fā)展注入持久動(dòng)力。
1、測(cè)試用例
本次測(cè)評(píng)體系以用戶真實(shí)出行場(chǎng)景需求為核心導(dǎo)向,結(jié)合端側(cè) AI 技術(shù)實(shí)際落地應(yīng)用效果,對(duì)終端設(shè)備在基礎(chǔ)及復(fù)雜出行場(chǎng)景下的打車服務(wù)能力開展全面評(píng)估。測(cè)評(píng)場(chǎng)景體系圍繞基礎(chǔ)即時(shí)打車、條件約束打車、預(yù)約打車、合乘順風(fēng)打車等典型場(chǎng)景構(gòu)建,并依據(jù)智能服務(wù)能力等級(jí)評(píng)價(jià)標(biāo)準(zhǔn),進(jìn)一步拆解形成多維度細(xì)分子場(chǎng)景。各子場(chǎng)景均設(shè)置差異化、任務(wù)復(fù)雜度梯度遞進(jìn)的測(cè)試用例,最終實(shí)現(xiàn)多維度、多指標(biāo)、全流程的打車服務(wù)能力覆蓋。
2、測(cè)試方案
為科學(xué)、公正、客觀地對(duì)不同終端不同應(yīng)用場(chǎng)景的智能服務(wù)能力程度進(jìn)行測(cè)試評(píng)估,中國(guó)信通院泰爾終端實(shí)驗(yàn)室創(chuàng)新性地提出了基于場(chǎng)景適應(yīng)性的動(dòng)態(tài)分級(jí)評(píng)價(jià)方案。針對(duì)場(chǎng)景分類矩陣,參照智能服務(wù)能力五大分級(jí)要素制定出多維度評(píng)價(jià)指標(biāo),設(shè)計(jì)動(dòng)態(tài)權(quán)重計(jì)算策略,結(jié)合場(chǎng)景系數(shù)、指標(biāo)權(quán)重與等級(jí)系數(shù)的動(dòng)態(tài)調(diào)節(jié)機(jī)制,構(gòu)建出覆蓋“基礎(chǔ)級(jí)-優(yōu)秀級(jí)-卓越級(jí)”的三階動(dòng)態(tài)演進(jìn)“智能服務(wù)能力分級(jí)測(cè)試評(píng)估模型”。
3、測(cè)試結(jié)果
本期測(cè)試圍繞打車業(yè)務(wù)場(chǎng)景,分別開展單輪交互與多輪連貫對(duì)話測(cè)試,重點(diǎn)評(píng)估意圖理解準(zhǔn)確率、任務(wù)完成率、綜合滿意度等核心指標(biāo)。依據(jù)“智能服務(wù)能力分級(jí)測(cè)試評(píng)估模型”的評(píng)分規(guī)則,綜合計(jì)算得出智能打車能力總分。本期報(bào)告展示9款不同品牌旗艦終端產(chǎn)品的測(cè)試結(jié)果。
![]()
(注:本次測(cè)試結(jié)論均基于當(dāng)前版本測(cè)試集得出。隨著相關(guān)技術(shù)持續(xù)迭代演進(jìn),測(cè)試集將同步進(jìn)行更新與優(yōu)化升級(jí),后續(xù)測(cè)試結(jié)果亦會(huì)隨之產(chǎn)生相應(yīng)變化。)
測(cè)試結(jié)果顯示,9款主流旗艦機(jī)型在核心基礎(chǔ)能力維度表現(xiàn)均衡,基本能精準(zhǔn)實(shí)現(xiàn)打車語(yǔ)音指令識(shí)別、簡(jiǎn)單用車意圖解析及基礎(chǔ)訂單發(fā)起等核心操作,可高效響應(yīng)包含明確起點(diǎn)、終點(diǎn)的簡(jiǎn)單打車訴求,能夠充分滿足用戶日常通勤、即時(shí)用車等基礎(chǔ)出行場(chǎng)景的使用需求,這一表現(xiàn)充分彰顯了當(dāng)前端側(cè)AI技術(shù)在基礎(chǔ)出行服務(wù)領(lǐng)域的產(chǎn)業(yè)化落地成效,也體現(xiàn)了手機(jī)系統(tǒng)智能體對(duì)用戶核心出行需求的精準(zhǔn)適配能力。
然而,在復(fù)雜出行場(chǎng)景任務(wù)測(cè)試中,各旗艦機(jī)型的服務(wù)能力顯著分化,這種差異在多條件復(fù)合用車指令理解、長(zhǎng)鏈路任務(wù)執(zhí)行等核心復(fù)雜場(chǎng)景中尤為突出,成為衡量不同機(jī)型智能服務(wù)水平、拉開產(chǎn)品競(jìng)爭(zhēng)力差距的核心指標(biāo)。其中,部分頭部旗艦機(jī)型表現(xiàn)突出,展現(xiàn)出優(yōu)異的復(fù)雜場(chǎng)景智能適配能力:針對(duì)包含車型等級(jí)、用車時(shí)間、費(fèi)用預(yù)算、拼車偏好等多條件約束的出行需求,以及預(yù)約打車、順風(fēng)車等多元復(fù)雜場(chǎng)景,能夠精準(zhǔn)拆解復(fù)合型指令中的核心約束條件,深度挖掘用戶潛在出行需求,高效匹配打車服務(wù)執(zhí)行鏈路,實(shí)現(xiàn)多條件約束下的最優(yōu)車型匹配、動(dòng)態(tài)行程調(diào)度與訂單高效落地,在端側(cè)AI復(fù)雜場(chǎng)景應(yīng)用中形成了明顯的領(lǐng)先優(yōu)勢(shì)。
綜合來(lái)看,當(dāng)前智能手機(jī)系統(tǒng)智能體已完成對(duì)用戶簡(jiǎn)單日常打車場(chǎng)景的全面覆蓋,能夠高效完成基礎(chǔ)打車任務(wù),滿足用戶核心出行需求。但從行業(yè)高質(zhì)量發(fā)展導(dǎo)向與用戶高品質(zhì)出行需求升級(jí)趨勢(shì)來(lái)看,當(dāng)前機(jī)型在復(fù)雜場(chǎng)景適配、精細(xì)化復(fù)合指令處理等關(guān)鍵領(lǐng)域仍存在明顯提升空間,主要表現(xiàn)為語(yǔ)義理解精準(zhǔn)度不足、用車需求拆解不徹底、場(chǎng)景策略適配靈活性欠缺、復(fù)雜任務(wù)執(zhí)行耗時(shí)偏長(zhǎng)等突出問(wèn)題。這些問(wèn)題既是當(dāng)前端側(cè)AI技術(shù)應(yīng)用的痛點(diǎn)難點(diǎn),也為后續(xù)端側(cè)AI技術(shù)迭代優(yōu)化、智能手機(jī)智能打車服務(wù)能力升級(jí)明確了核心方向,為行業(yè)技術(shù)創(chuàng)新與服務(wù)提質(zhì)提供了廣闊的探索空間。
隨著人工智能算法的持續(xù)迭代、輕量化大模型在終端側(cè)的深度落地與優(yōu)化,智能手機(jī)打車系統(tǒng)將進(jìn)一步提升復(fù)雜任務(wù)的執(zhí)行能力,逐步實(shí)現(xiàn)打車交互的自然化、打車服務(wù)的個(gè)性化、打車體驗(yàn)的高效化,持續(xù)強(qiáng)化其作為用戶日常生活與工作中不可或缺的核心智能入口價(jià)值,助力智能出行服務(wù)向精細(xì)化、全場(chǎng)景化升級(jí)。
終端智能服務(wù)能力是衡量人工智能技術(shù)落地水平的核心指標(biāo),是推動(dòng)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展的基礎(chǔ)支撐。中國(guó)信通院將繼續(xù)深化與產(chǎn)業(yè)鏈各方的協(xié)同合作,依托技術(shù)創(chuàng)新與標(biāo)準(zhǔn)引領(lǐng),持續(xù)開展終端智能服務(wù)能力分級(jí)場(chǎng)景研究及測(cè)評(píng)驗(yàn)證工作。通過(guò)構(gòu)建科學(xué)、動(dòng)態(tài)的評(píng)估體系,不斷完善智能服務(wù)能力測(cè)評(píng)標(biāo)準(zhǔn),加快人工智能技術(shù)在終端上的應(yīng)用推廣,切實(shí)推動(dòng)我國(guó)智能終端產(chǎn)業(yè)高質(zhì)健康發(fā)展,為數(shù)字中國(guó)建設(shè)注入創(chuàng)新動(dòng)能。
咨詢聯(lián)系人:
黃老師
董老師
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.