无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

黃仁勛100萬億預(yù)言兌現(xiàn)!易鑫Voice Agent落地,汽車金融迎效率革命

0
分享至


新智元報道

編輯:桃子

【新智元導讀】Voice Agent終于能打?qū)崙?zhàn)了!這家中國公司靠一套Model + Harness的方法論,正在重新定義金融級Agent的標桿,也撬動了黃仁勛所預(yù)言的百萬億美元市場。

Voice Agent賽道,從來不缺故事。

2024年,GPT-4o橫空出世,全球科技圈集體高潮——「AI終于會說話了」。

緊接著,數(shù)以百計的Voice Agent創(chuàng)業(yè)公司如雨后春筍般冒出,融資消息一個接一個。


硅谷的投資人們畫了一個萬億級的大餅:AI語音智能體將重塑一切電話交互場景。

但到了2026年,畫風變了。

絕大多數(shù)通用Voice Agent,在實驗室里表現(xiàn)驚艷,到了真實業(yè)務(wù)里卻頻頻翻車——

聽不懂方言、扛不住噪音、一被打斷就「邏輯崩盤」、合規(guī)紅線踩了又踩。

尤其是金融、保險、醫(yī)療這些更復雜、專業(yè)的場景,通用方案幾乎集體啞火。

就在行業(yè)還在糾結(jié)「Voice Agent到底能不能用」的時候,一家中國公司給出了答案。

通用方案水土不服,垂類需要「場景原生」

深耕汽車金融11年的易鑫,沒有去追「通用AI」的風口,而是扎進了最難啃的垂類場景。

為此,他們自研了一套「工業(yè)級」Voice Agent系統(tǒng)。

它集Multi-Agent協(xié)同架構(gòu)、Turn-Taking模型、場景降噪引擎和多語言TTS大模型于一體。

要理解易鑫Voice Agent的價值,首先要理解一個殘酷的現(xiàn)實:通用AI方案在汽車金融面前幾乎是「裸考」。

業(yè)內(nèi)大廠Voice Agent方案,大多是追求普適性與標準化——

在通用場景可以快速落地,但對汽車金融這類鏈路復雜、合規(guī)嚴苛、業(yè)務(wù)節(jié)點密集的垂直場景,適配度始終不足。

更現(xiàn)實的問題是,通用方案追求「播音員級」的優(yōu)美音色,側(cè)重聽覺體驗,本質(zhì)是「體驗優(yōu)先」。

但在電銷場景里,一個聲音好聽但沒有「人味」、不懂業(yè)務(wù)的AI,反而讓客戶秒掛。

易鑫的做法截然不同。

在表層,他們選用貼合車主溝通習慣的音色,適配方言場景;

但在深層,真正讓客戶不掛電話的,是Agent不僅兼顧了親和力與合規(guī)嚴謹性,還學會了老電銷那種「先共情再辦事」的對話直覺。

核心目標只有一個:優(yōu)化客戶體驗,提升轉(zhuǎn)化率,實現(xiàn)「業(yè)務(wù)優(yōu)先」的價值閉環(huán)。

這就是「通用適配」和「場景原生」的根本區(qū)別。

前者在試圖讓一把萬能鑰匙打開所有鎖,后者在為每一把鎖量身打造鑰匙。

把自由聊天,變成「精密流水線」

易鑫Voice Agent最核心的技術(shù)突破,是其基于文本的Multi-Agent協(xié)同架構(gòu)。

這里有一個行業(yè)背景需要交代:目前絕大多數(shù)企業(yè),哪怕是最簡單的單Agent方案,都不敢直接推上生產(chǎn)環(huán)境。

原因很簡單,通用Agent可控性差、工具調(diào)用不穩(wěn)定、任務(wù)容錯率低。

一旦模型「自由發(fā)揮」,在金融合規(guī)場景里就是災(zāi)難。

易鑫的解法是:把一通復雜的銷售電話,拆解成多個高度專注的「小任務(wù)」,分配給不同的Agent專項處理。

具體而言,系統(tǒng)部署了四大Agent板塊:問候與結(jié)束、資質(zhì)確認、添加微信、咨詢問答。

每個Agent專注處理一個細分任務(wù)。這套架構(gòu)的精妙之處,在于以下三個「硬核」設(shè)計:

第一,一個任務(wù)節(jié)點只管一件事。

汽車金融場景真實的電銷SOP包含身份確認、需求確認、資質(zhì)確認、添加微信等一系列遞進環(huán)節(jié)。

如果把所有規(guī)則塞進一個巨大的Prompt里,大模型會瞬間「過載」,極易出現(xiàn)幻覺——不知道先干啥、容易聽錯話、或被客戶一句話帶偏。

所以易鑫的做法是:把整個流程切成一個個任務(wù)節(jié)點。

每個任務(wù)節(jié)點只負責一件事,并且擁有獨立的指令、話術(shù)示例和工具集,AI被嚴格限定在當前任務(wù)范圍內(nèi)——達不成目標,就無法進入下一個任務(wù)節(jié)點。

第二,流程走到哪一步,系統(tǒng)說了算。

一般來說,傳統(tǒng)做法是讓LLM自己判斷「接下來該干什么」,比如輸出「關(guān)鍵詞」決定流程走向。

但這種方式極其脆弱,AI一旦「想岔了」,整個對話就跑偏了。

為此,易鑫專為流程流轉(zhuǎn)上一把「物理鎖」。具體來說:

每個任務(wù)節(jié)點完成后,Agent輸出了符合格式要求的結(jié)果,才會被視為正確的「交接信號」,流程才能往下走。

不僅如此,系統(tǒng)在啟動時,就會強制校驗所有任務(wù)節(jié)點之間的跳轉(zhuǎn)關(guān)系是否真實存在。

如果某個節(jié)點指向了一個根本不存在的下游環(huán)節(jié),直接報錯攔截。

AI想「自由發(fā)揮」,系統(tǒng)根本不給它機會。

第三,用戶打斷時,AI不會「記混」。

電話里用戶隨時可能打斷插話,這是常態(tài)。但對AI來說,這是個大麻煩。

普通單體文本Agent會把所有生成內(nèi)容塞進記憶,導致后續(xù)業(yè)務(wù)邏輯錯亂。

易鑫的處理方式是,對話記錄不由模型自己管,而是交給外部框架統(tǒng)一管理——

當用戶打斷時,系統(tǒng)只保留用戶實際聽到的那部分內(nèi)容,再追加用戶的新輸入。

這樣,當流程從「破冰問候」推進到「資質(zhì)確認」時,下一個任務(wù)節(jié)點拿到的對話記錄是干干凈凈、完整還原真實通話的,不會因為中途被打斷就記串了。

Multi-Agent協(xié)同架構(gòu)把電銷從「不可控的自由對話」,變成了可追溯、可質(zhì)檢、可合規(guī)、可復制、可運營優(yōu)化的SOP。

這才是Agent能進核心業(yè)務(wù)的前提。

讓AI選擇性失聰,掌握「說話的藝術(shù)」

如果說Multi-Agent架構(gòu)是「大腦」,那降噪引擎和Turn-Taking模型就是「耳朵」和「嘴巴」。

要讓AI打好一通電話,第一步是聽得清,第二步才是接得住。

先說「聽」,降噪引擎要解決的,是讓AI學會「選擇性失聰」。

真實電銷場景里,客戶可能在地鐵上、馬路邊,甚至嘈雜的工地里接電話。

背景噪音經(jīng)常讓AI產(chǎn)生「幻聽」:鳴笛聲、他人交談聲被錯誤識別為客戶指令,產(chǎn)生大量「無效輪次」(Noise Rounds),直接干擾AI的決策邏輯,導致Voice Agent頻繁「亂插話」或「答非所問」。

易鑫AI團隊上線的場景適配降噪引擎,在兩個關(guān)鍵維度實現(xiàn)了突破:

低信噪比噪音消除率80%,將嘈雜環(huán)境的壓力分散到降噪模型,在最低限度損傷音頻的情況下,處理好絕大部分干擾AI決策的噪音。

同時,通過語義保真算法,確保主說話人的語音特征完美保留,ASR識別準確率不降反升。

聽清楚了,下一個問題是:什么時候該開口?

這正是Turn-Taking要解決的「對話節(jié)奏」問題。

在真實電話場景中,每個人的說話習慣千差萬別:有人語速極快,有人說一半停下來想想再繼續(xù)。

傳統(tǒng)方案,AI要么在人還沒說完時就插嘴搶,要么人說完了半天沒反應(yīng),兩種體驗都讓人想掛電話。

為此,易鑫自研的Yx-Turn預(yù)測模型,核心任務(wù)只有一個:判斷客戶到底說完了沒有。


它同時聽兩樣東西。

一是聲學信號,包括客戶的語氣、停頓、拖音等。

二是語義理解,比如客戶說的話里有沒有「嗯…我想一下」、「那你看這樣行不行」這類未完待續(xù)的意思。

模型將每輪會話的交互狀態(tài)分為三種:發(fā)言結(jié)束(EOT)、繼續(xù)發(fā)言(CT)和掛起等待(WAIT),并通過三階段演進式數(shù)據(jù)構(gòu)建策略,逐步從「不搶話」進化到「讀懂意圖」。

舉個例子,當用戶說「等一下」時,系統(tǒng)識別為掛起狀態(tài),回應(yīng)「好的,不著急」,保持收音不中斷,同時繼續(xù)等待客戶后續(xù)發(fā)言。

更值得一提的是框架層的「兜底策略」。在全雙工對話中,用戶隨時可能打斷AI。

易鑫采用了創(chuàng)新的消息合并策略:將未完成消息暫存至緩沖區(qū),設(shè)置觀察等待期,若用戶繼續(xù)表達,系統(tǒng)自動合并新舊消息,確保LLM基于完整上下文推理;若識別為無意發(fā)聲或噪聲,則自動過濾。

這徹底解決了傳統(tǒng)方案中「用戶一打斷,AI就失憶」的尷尬。

這套機制還解決了行業(yè)公認的「幽靈回復」(嗯、額、啊等語氣詞)難題,系統(tǒng)能精確區(qū)分用戶是在隨聲附和,還是在給出答復,不再因誤判導致邏輯跳步或搶話。

這項技術(shù)聽起來不夠「性感」,但在電銷場景里,它直接決定了用戶愿不愿意繼續(xù)聽下去。

用易鑫高級算法工程師的話說,「我們的目標不是訓練一個技術(shù)最牛的模型,而是訓練一個最懂易鑫業(yè)務(wù)的模型」。

這種務(wù)實到骨子里的技術(shù)哲學,恰恰是易鑫Voice Agent能跑通生產(chǎn)環(huán)境的底層原因。

橫掃多種語言,劍指全球市場

Voice Agent的最后一塊拼圖,是語音合成(TTS)。

基于覆蓋全國340余個城市的業(yè)務(wù)網(wǎng)絡(luò),易鑫自研TTS大模型已全面適配普通話,同時支持四川、天津、東北、河南、廣東、福建、湖南等多地主流方言。

更值得關(guān)注的是全球化布局。

易鑫TTS已支持英語、西班牙語、葡萄牙語等主流語言,并針對日本、馬來西亞、新加坡、澳大利亞、墨西哥、巴西等核心出海市場進行了深度本地化定制,兼容多個小語種及變體,可覆蓋全球大部分主流汽車金融商業(yè)化語音場景。

這一成績離不開易鑫在技術(shù)層面的深耕。

為還原真人般的聲音,易鑫搭建了三層語音數(shù)據(jù)體系——標準語音數(shù)據(jù)、真實口語數(shù)據(jù)和專業(yè)錄音數(shù)據(jù),讓模型聽足夠多樣、真實的聲音。

為深度貼合汽車金融業(yè)務(wù)特性,模型對專屬場景、專業(yè)術(shù)語、業(yè)務(wù)話術(shù)做了專項調(diào)優(yōu),使音色、情感、語調(diào)、語速和本土化適配等效果全面升級。

在訓練策略上,團隊引入GRPO強化學習方法進行后訓練:

從內(nèi)容準確性、音色還原度、情感表現(xiàn)力、聽感自然度這四個維度由「AI評委」對合成的語音進行打分(獎勵),最后會匯總成一個綜合獎勵信號,驅(qū)動模型持續(xù)進化。


模型學會的不只是「怎么說」,而是什么時候、以什么方式說,才最契合人類的情感邏輯。

Model + Harness,

一套真正能打的Voice Agent方法論

如果把上述技術(shù)能力拆開來看,每一項都有不少公司在做。

但易鑫Voice Agent真正的差異化,在于它背后的一套完整方法論:Model與Harness的深度結(jié)合。

英偉達CEO黃仁勛曾預(yù)言,AI Agent等AI技術(shù)將創(chuàng)造100萬億美元的市場。

但預(yù)言要落地,便需要這個關(guān)鍵公式:Agent = Model + Harness。

所謂Model,是指大模型本身的能力:語義理解、意圖識別、文本生成、語音合成。這是AI系統(tǒng)的「智力」。

所謂Harness,則是約束、駕馭和編排模型能力的工程化架構(gòu):結(jié)構(gòu)化狀態(tài)機、防幻覺協(xié)議、外部記憶管理、合規(guī)流程門控、工具調(diào)用治理。這是AI系統(tǒng)的「紀律」。

在真實的生產(chǎn)環(huán)境里,一個沒有Harness約束的強模型,就像一匹沒有韁繩的野馬,跑得越快,翻車越狠。

在易鑫Voice Agent系統(tǒng)中,這個理念被貫徹到了每一個技術(shù)模塊:

自研Agentic大模型XinMM-AM1提供300億參數(shù)級的語義理解能力;

而全雙工交互框架、Multi-Agent協(xié)同架構(gòu)、Turn-Taking模型和降噪引擎等模塊,共同構(gòu)成了Harness體系。


易鑫是一家AI驅(qū)動的金融科技平臺,2017年在香港上市,2025年成為港交所科技100指數(shù)成員。目前年交易額已達到約750億元人民幣,全球擁有員工5000多人,核心產(chǎn)品為Agentic AI解決方案,深度賦能汽車金融全鏈路。Voice Agent是易鑫Agentic AI解決方案的關(guān)鍵拼圖,可應(yīng)用于電銷、預(yù)審、客服等多個場景。

兩者融合,才把不可控的LLM變成了聽指揮、守紀律、能實戰(zhàn)的生產(chǎn)級數(shù)字員工。

同時,這套Voice Agent還調(diào)用了豐富的「金融專屬工具」——線索質(zhì)量核查、渠道風險識別、網(wǎng)絡(luò)化欺詐識別、欺詐聲紋檢測、情緒分析、流程合規(guī)檢測,以及加微申請、短信發(fā)送、知識庫檢索等通用工具。

Model負責「想」,Harness負責「管」,工具鏈負責「干」——

三位一體,才是工業(yè)級Voice Agent的完整形態(tài)。

實戰(zhàn)數(shù)據(jù)亮眼

所有技術(shù)敘事的終點,都指向一個樸素的問題:效果到底怎么樣?

易鑫Voice Agent交出的成績單足夠硬氣:

接通率媲美人工坐席,加微成功率超越人工。

在電銷場景中,「接通」只是起點,真正有價值的動作是把線索轉(zhuǎn)化為合規(guī)的私域客戶。

這意味著,后續(xù)可以持續(xù)觸達、深度運營。

易鑫Voice Agent的接通加微轉(zhuǎn)化率可達20%以上,這個數(shù)字在行業(yè)里已屬前列。

跨多個會話連續(xù)推進,線索流失率大幅下滑。

傳統(tǒng)電銷最大的痛點之一是線索跟進不及時、不連續(xù)——人工坐席忙不過來、跟進節(jié)奏不穩(wěn)定、記錄不完整。

易鑫Voice Agent能夠及時、持續(xù)追蹤每一條線索,效率大幅提升。

更讓人興奮的是落地速度:這套系統(tǒng)專為汽車金融全場景定制,支持低代碼快速部署。

而且其模塊化架構(gòu)天然支持場景遷移,80%的流程不變,只需替換20%的業(yè)務(wù)節(jié)點,就能快速適配新業(yè)務(wù)線。

未來,這套方案還將向泛金融領(lǐng)域延伸,為保險、銀行等場景提供同級別的智能語音解決方案。

有用,才是最高級的技術(shù)

回過頭看,Voice Agent賽道的競爭格局已經(jīng)日漸清晰:通用方案追求廣度,垂類方案追求深度。

而在汽車金融這個合規(guī)嚴苛、鏈路復雜、專業(yè)性極強的戰(zhàn)場上,「廣度」解決不了任何真實問題。

易鑫用11年的行業(yè)沉淀,證明了一件事:

真正的工業(yè)級AI,從來不是模型參數(shù)的軍備競賽,而是對業(yè)務(wù)的深刻理解與工程化能力的深度融合。

當行業(yè)還在爭論Voice Agent的技術(shù)路線時,易鑫已經(jīng)在真實的生產(chǎn)線上,用每一通電話、每一個轉(zhuǎn)化數(shù)字,定義著「場景原生」AI的行業(yè)標準。

有用,才是最高級的技術(shù)。而易鑫正在證明,這句話不是口號。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
53歲王軍霞近況:退休定居美國,三個孩子三個爹,人生令人唏噓

53歲王軍霞近況:退休定居美國,三個孩子三個爹,人生令人唏噓

翰飛觀事
2026-04-15 19:56:03
這一刻等了21年!U17國足進世界杯僅一夜 主帥被喊下課 原因曝光

這一刻等了21年!U17國足進世界杯僅一夜 主帥被喊下課 原因曝光

侃球熊弟
2026-05-13 02:34:06
廣東宏遠大調(diào)整!確定更換外援,10人合同到期,杜鋒或離隊

廣東宏遠大調(diào)整!確定更換外援,10人合同到期,杜鋒或離隊

體壇瞎白話
2026-05-13 08:54:06
喜訊!中國足壇在5月12日迎來久違的世界級名帥,已官宣發(fā)聲

喜訊!中國足壇在5月12日迎來久違的世界級名帥,已官宣發(fā)聲

吳朑愛游泳
2026-05-13 13:36:19
釋永信被一女子爆料:她們姐妹住少林寺3天,爭著往釋永信房間跑

釋永信被一女子爆料:她們姐妹住少林寺3天,爭著往釋永信房間跑

江山揮筆
2026-03-23 15:40:31
電影《四渡》發(fā)布角色海報,劉燁為飾演毛澤東,減重17斤

電影《四渡》發(fā)布角色海報,劉燁為飾演毛澤東,減重17斤

紅星新聞
2026-05-13 13:43:30
軍購剛落定,鄭麗文立刻派張榮恭赴陸交底,一出手送上一份大禮!

軍購剛落定,鄭麗文立刻派張榮恭赴陸交底,一出手送上一份大禮!

阿器談史
2026-05-12 07:56:40
Coco高調(diào)曬千萬珠寶,正面回懟落魄謠言:我不缺錢,不靠直播謀生

Coco高調(diào)曬千萬珠寶,正面回懟落魄謠言:我不缺錢,不靠直播謀生

夜深愛雜談
2026-05-12 22:31:40
西方從失望到絕望:印度崛起,取代中國?這是本世紀最大的笑話

西方從失望到絕望:印度崛起,取代中國?這是本世紀最大的笑話

墜入二次元的海洋
2026-05-12 15:21:07
曝東契奇要求湖人留下里夫斯!詹姆斯去留棘手:騎勇很可能招攬他

曝東契奇要求湖人留下里夫斯!詹姆斯去留棘手:騎勇很可能招攬他

羅說NBA
2026-05-12 21:43:19
已經(jīng)宣布獨立建國,但中國拒不承認的10個國家!

已經(jīng)宣布獨立建國,但中國拒不承認的10個國家!

別人都叫我阿腈
2026-05-13 08:09:55
萬科又向深鐵集團借款

萬科又向深鐵集團借款

地產(chǎn)微資訊
2026-05-13 08:34:02
段永平的本分,OPPO掛墻上落灰

段永平的本分,OPPO掛墻上落灰

略大參考
2026-05-13 10:23:03
深度長文:按照進化論,植物為什么不進化得很難吃以防被吃?

深度長文:按照進化論,植物為什么不進化得很難吃以防被吃?

宇宙時空
2026-05-11 20:15:04
遲來的尊重!佩林卡發(fā)聲:給老詹時間,決定他的未來

遲來的尊重!佩林卡發(fā)聲:給老詹時間,決定他的未來

我是阿Sen
2026-05-13 13:48:30
擠走董卿、靠爹上位、央視“窮鬼”,龍洋的私生活謠言有多離譜?

擠走董卿、靠爹上位、央視“窮鬼”,龍洋的私生活謠言有多離譜?

豬小艷吖
2026-05-12 03:50:15
日系供應(yīng)鏈集體失守!豐田日產(chǎn)大舉采用中國零部件:成本低3成、質(zhì)量還一樣

日系供應(yīng)鏈集體失守!豐田日產(chǎn)大舉采用中國零部件:成本低3成、質(zhì)量還一樣

快科技
2026-05-12 12:20:06
夢百合杯,中國棋手大勝韓國,小鹿淘汰金恩持,於之瑩進本賽

夢百合杯,中國棋手大勝韓國,小鹿淘汰金恩持,於之瑩進本賽

月滿大江流
2026-05-13 10:47:58
許家印結(jié)局已定,恒大歌舞團長白珊珊,被曝居然嫁給了這個男人

許家印結(jié)局已定,恒大歌舞團長白珊珊,被曝居然嫁給了這個男人

歷史偉人錄
2026-05-12 17:40:40
戰(zhàn)爭長期化與內(nèi)部失序,普京再不調(diào)整戰(zhàn)略,恐將輸?shù)暨@場戰(zhàn)爭

戰(zhàn)爭長期化與內(nèi)部失序,普京再不調(diào)整戰(zhàn)略,恐將輸?shù)暨@場戰(zhàn)爭

雷養(yǎng)超教授
2026-05-13 11:31:23
2026-05-13 14:24:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
15198文章數(shù) 66864關(guān)注度
往期回顧 全部

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

頭條要聞

特朗普訪華隨行名單:夫人缺席 次子夫婦、魯比奧隨行

頭條要聞

特朗普訪華隨行名單:夫人缺席 次子夫婦、魯比奧隨行

體育要聞

14年半,74萬,何冰嬌沒選那條更安穩(wěn)的路

娛樂要聞

鞏俐用中文宣布戛納開幕,彰顯國際地位

財經(jīng)要聞

深圳夫妻囤芯片,身家飆漲320億

科技要聞

谷歌劇透安卓重大升級 Gemini深度集成底層

態(tài)度原創(chuàng)

家居
數(shù)碼
健康
教育
公開課

家居要聞

極簡主義下的居住場域與空間

數(shù)碼要聞

聯(lián)發(fā)科天璣開發(fā)者大會MDDC 2026:官宣天璣AI智能體化引擎2.0

干細胞能讓人“返老還童”嗎

教育要聞

老師把語文玩出新花樣,創(chuàng)意教學讓語文秒變有趣。這樣的課堂,誰能不愛聽?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版