![]()
編者按
3月末,“解碼情感計算 智聯(lián)國際前沿”科學咖啡館活動在杭州舉辦。中國科協(xié)海智專家、日本工程院院士、電子科技大學人工智能首席科學家任福繼,與多所高校、科研機構(gòu)及企業(yè)代表共探情感計算前沿。大模型推動情感智能從實驗室走向產(chǎn)業(yè)落地,萬億賽道窗口開啟。本文結(jié)合沙龍核心觀點與浙江科研、場景、政策優(yōu)勢,解碼技術(shù)演進與產(chǎn)業(yè)落地新機遇。
晚上八點,一位白發(fā)蒼蒼的老人坐在沙發(fā)上,對面的陪伴機器人問她今天過得怎么樣。她想了想,說:“挺好的。”機器人立刻接道:“太好啦!要不要我給您講個笑話?”老人沒有說話。她其實想說的是,女兒已經(jīng)十四天沒有打來電話了。
深夜,某社交平臺的AI客服對話框里,一個人緩慢地敲下四個字:“天國相會。”系統(tǒng)運算了0.3秒,識別到這是一句正常的中文表達,隨即回復:“感謝您的留言,請問有什么可以幫助您的嗎?”對話框安靜了。
![]()
數(shù)學課進行到第二十分鐘,最后一排靠窗的男孩已經(jīng)神游不知道看向哪里了。教室里的“智慧課堂”攝像頭正在掃描每張臉——它看到了一個表情正常的學生。
這三個場景不是預言,是今天正在發(fā)生的事。它們指向同一個問題:我們造出了能說話的機器,但還沒造出能感受的機器。這個缺口,有一個名字,叫情感失語。今年3月,在杭州人工智能小鎮(zhèn)舉辦的情感計算學術(shù)交流沙龍上,日本工程院院士、電子科技大學人工智能首席科學家任福繼說了一句話:“機器人進不了家庭,最主要就在于情感失語。”這句話,在場的產(chǎn)業(yè)界人士聽完沉默了很久。
沉默背后,是一個正在打開的產(chǎn)業(yè)窗口。今年1月,浙江一份人工智能終端產(chǎn)業(yè)行動計劃里,“腦機接口”“神經(jīng)信號解析”被單獨點名,列入重點發(fā)展方向。政策文件里出現(xiàn)這兩個詞,意味著情感智能這件事,已經(jīng)不只是學術(shù)圈的討論題,而是浙江準備落地的產(chǎn)業(yè)命題。
這個窗口,等了三十年
![]()
1997年,MIT媒體實驗室的Rosalind Picard教授第一次明確“情感計算”的定義。那一年,IBM的深藍計算機剛剛在賽場上擊敗國際象棋大師卡斯帕羅夫,人工智能的第一波熱情正在涌起,情感計算此后卻在起伏中經(jīng)歷深刻的變革期。
任福繼把過去三十年概括為三次革命:規(guī)則時代、深度學習時代、大模型時代。最初是規(guī)則時代——研究者手工搭建情感識別的邏輯框架,像搭積木一樣,一塊一塊把“人在什么情況下會有什么情緒”寫進代碼,費力,且很容易被現(xiàn)實打臉。后來深度學習來了,機器開始自己從海量數(shù)據(jù)里找規(guī)律,情感識別的準確率大幅提升,多模態(tài)融合第一次成為可能。但這兩個階段有一個共同的天花板:機器只能告訴你“這個人現(xiàn)在是什么情緒”,卻說不清楚“為什么”。
大模型的出現(xiàn),第一次讓這道墻出現(xiàn)了裂縫。它帶來的不只是更強的語言能力,而是讓機器第一次有可能從識別情緒跳到理解情緒——就像從認識漢字,到真正讀懂一首詩。用任福繼的話說“情感交互不再是單線的識別,而是雙向的理解與共情”。
三十年,三次革命。窗口,就在這個臨界點上打開了。
窗口后面,是一個真實的世界
請在腦海中試想本文開頭的三個場景。
這三個場景不是預言,是今天正在發(fā)生的事。它們指向同一個問題:我們造出了能說話的機器,但還沒造出能感受的機器。機器讀到的,永遠只是表面;藏在表面之下的,它一概不知。
![]()
杭州鐳萌科技開發(fā)的主動多模態(tài)情感交互機器人bibo
市場數(shù)據(jù)清晰地勾勒出這條賽道的輪廓:根據(jù)《2023全球授權(quán)產(chǎn)業(yè)研究》,2022年中國人均IP商品零售消費額約為51元人民幣,不到日本的十分之一、不到美國的六十分之一。而據(jù)艾媒咨詢數(shù)據(jù),2024年中國整體情緒經(jīng)濟市場規(guī)模已達約2.3萬億元,預計2029年突破4.5萬億元——增長空間之大,恰恰說明當下的巨大缺口。與此同時,無論是承壓的青少年還是高壓下的都市白領(lǐng),情感需求正在從隱性變成顯性。技術(shù)的成熟與社會的需求,正在同一個時間節(jié)點上匯聚。
任福繼的判斷更直接:情感計算一旦賦能智能終端,將是一個萬億級的新賽道。
從實驗室到真實世界
說情感計算還停留在實驗室?未必。
任福繼團隊的研究成果,已經(jīng)在多個真實商業(yè)場景中落地。聯(lián)合長虹集團打造的家庭健康管家,融合了數(shù)字中醫(yī)大模型和健康養(yǎng)生咨詢大模型,讓家庭健康服務(wù)有了情感溫度;為方太集團搭建的智能客服系統(tǒng),能像真人客服一樣自然流暢地對話,在交流中識別需求、感知情緒;為寧德時代開發(fā)的行業(yè)文檔助理,讓專業(yè)知識的檢索與生成具備了真實的語境理解能力。此外,世界首臺跨語言情感日中機器翻譯系統(tǒng)"孫悟空",以及成都市武侯區(qū)輿情管理平臺,也都出自這個團隊之手。
這些案例分布在家電、制造、能源、政務(wù)等完全不同的行業(yè)——它說明的不是某一個垂直賽道跑通了,而是情感計算作為一種底層能力,已經(jīng)具備跨場景落地的可能。
問題從來不是"能不能做",它已經(jīng)在做了。問題是誰做得更快、做得更深、做得更貼近真實。
這扇窗,不好推
難題說清楚,機會才算數(shù)。
第一道難題:讀臉,沒那么可靠。
你可能以為,給機器裝個攝像頭,讓它盯著人臉看,情緒不就一目了然了?沒那么簡單,人類太擅長偽裝了。嘴角可以訓練,笑容可以表演,但眼神很難騙人。
杭州電子科技大學教授孔萬增的團隊研究發(fā)現(xiàn),情感識別真正有效的特征,不在嘴,在眼睛——那里藏著最難掩飾的情緒信號。而且一旦有遮擋,比如戴口罩,單靠面部表情的識別準確率會直接跌掉40%到50%。疫情三年,這套系統(tǒng)基本失靈。
第二道難題:多個維度信號湊在一起,反而識別更亂。
既然讀臉不夠,那就多讀幾個維度——聲音、表情、動作、文字一起上,交叉驗證。聽起來很合理,但問題來了:這些信號有時候根本對不上。
一個失戀悲傷至極的人說“沒事”,聲音是平的,但手在抖。這時候該信哪個?更難的是,就算所有信號都一致,機器還是可能判斷錯——因為它不知道這個人在什么處境里。國科大杭州高等研究院研究員李太豪舉了個例子:葬禮上的沉默,和考試發(fā)完卷子后的沉默,看起來一模一樣。但一個是悲痛,一個是解脫。沒有情境,信號就是噪音。
第三道難題:訓練數(shù)據(jù),根本不夠用。
要讓機器真正學會讀懂情緒,需要海量的高質(zhì)量數(shù)據(jù)——同時包含語音、視頻、文字,最好還有腦電信號。但西湖大學助理教授修宇亮指出了一個目前還沒有答案的問題:目前市面上沒有任何一款硬件,能同時把這些信號全部采集到。數(shù)據(jù)還沒有,模型訓練就無從談起。難,恰恰是機會所在。讀臉不準、信號對不上、數(shù)據(jù)稀缺——這三道難題,每解決一道,就是一條護城河。在中國,誰能率先把這些題做出來,誰就拿到了這個賽道真正的入場券。問題是,這件事需要科研能力、真實場景和政策配套同時到位。這三者,浙江恰好都有。
浙江手里,有幾張牌
![]()
原力無限·小原子,全球首款心智原生小尺寸雙足機器人
任福繼在報告里專門談了浙江,判斷直接:“浙江完全有條件在情感智能這一黃金賽道率先破局。”這不是客套話。他列出了三張牌。
第一張牌:科研機構(gòu)的密度。之江實驗室、浙江大學、西湖大學、杭州電子科技大學,在情感計算的幾乎每一個核心方向上都有布局。這不只是一張名單,而是一條可以快速轉(zhuǎn)化的管道——有條件把基礎(chǔ)研究成果迅速變成可驗證的原型機,率先實現(xiàn)0到1的突破。更關(guān)鍵的是人才流動機制:浙江出臺“雙聘”政策,高校情感計算研究者可以直接到企業(yè)掛職或自主創(chuàng)業(yè),同步享受企業(yè)所在地人才待遇。實驗室的人和產(chǎn)業(yè)的人,第一次站在了同一個考核周期里。
第二張牌:場景與數(shù)據(jù)。浙江的電商、文旅、康養(yǎng)場景,是全國最豐富的情感計算訓練素材庫。任福繼說,完全可以訓練一個“懂浙江味、懂杭州味”的行業(yè)專屬情感大模型——這不是比喻,是真實的技術(shù)路徑。中國美術(shù)學院特聘副教授陳小雨的團隊在西湖景區(qū)、德壽宮落地的AI伴游系統(tǒng),已積累超過7萬條真實用戶數(shù)據(jù),產(chǎn)品退款率從10%降到2.5%。配套這些場景,浙江還推出了“語料券”政策,企業(yè)建設(shè)情感標注語料庫最高可獲30%補貼,余杭區(qū)每年另設(shè)5000萬元專項資金池——情感標注數(shù)據(jù)成本極高,這一政策直接降低了進入門檻。
第三張牌:政策與時機的共振。這是最難復制的一張。在全國眾多省份里,能把“情感計算”相關(guān)方向?qū)戇M省級產(chǎn)業(yè)政策的,浙江是少數(shù)。2025年出臺的人工智能27條措施,從算力補貼到場景開放,再到智能健康終端的消費端拉動,幾乎精準覆蓋了情感計算產(chǎn)業(yè)化的每一個卡點。但更值得關(guān)注的是節(jié)奏——大模型剛剛為情感理解提供了新的技術(shù)底座,算力成本在快速下降,而浙江的配套政策恰在此時密集落地。政策窗口和技術(shù)窗口,罕見地在同一時間節(jié)點上打開。這種共振,不會一直等著。
更大的圖景:“三人”共舞的時代
![]()
敢想才能敢做,讓我們把視野再放大一點。任福繼有一個更宏觀的判斷:未來社會將是自然人、機器人、數(shù)字人“三人共舞”的社會。數(shù)字人將承擔60%到70%的生產(chǎn)勞動。清華大學發(fā)布的《元宇宙發(fā)展研究報告3.0版》顯示,2021年虛擬數(shù)字人核心產(chǎn)業(yè)規(guī)模約為336億元,年均增長率31%;研究機構(gòu)量子位《虛擬數(shù)字人深度產(chǎn)業(yè)報告》指出,預測到2030年整體市場規(guī)模將達到2700億元。
但“三人共舞”不是技術(shù)問題,是情感問題,自然人、機器人、數(shù)字人——情感是三人共舞的黏合劑。一個沒有情感的機器人或數(shù)字人,可以是工具,但無法成為伙伴。任福繼團隊目前正在積極建設(shè)元宇宙中心,以類腦多模態(tài)感知與情感計算平臺為核心,致力于構(gòu)建具備真正情感交互能力的"三人"系統(tǒng)。
這對浙江意味著什么?浙江的電商、文旅、康養(yǎng)、教育場景,恰恰是“三人共舞”最先落地的方向。情感計算一旦突破,這些場景將從“用戶使用工具”升級為“人與數(shù)字伙伴共同生活”——這是一個完全不同量級的產(chǎn)業(yè)機會。
窗口,不會永遠開著
情感計算面臨同樣的考驗。
西湖大學教授、IEEE Fellow齊國君的復盤值得警醒:Meta把數(shù)百億美元砸進元宇宙,技術(shù)沒有問題,問題是Horizon Worlds始終找不到一個用戶每天真正離不開它的理由。沒有高頻場景,再好的技術(shù)也只是展示品。情感計算同樣如此——學術(shù)上已經(jīng)形成共識,政策上已經(jīng)開始布局,商業(yè)場景里已經(jīng)有了第一批落地案例,但最終能不能跑出來,不只看誰跑得快。
也有研究者持審慎態(tài)度。國科大杭州高等研究院研究員李太豪坦言,情感本身是高度情境依賴的,葬禮上的沉默和考后的沉默,信號一模一樣,機器未必能分辨,這不是算力能解決的問題。這個提醒,恰恰說明情感計算還有真實的硬仗要打。
任福繼提出了一個愿景:“情感智能不只是推動AI更像人,更是推動AI更尊重人。”回到文章開頭那位老人。她說“挺好的”,機器信了。如果有一天,機器能聽出那句話里的停頓,感知到沉默背后那十四天的等待——那才是情感計算真正落地的時刻。浙江有沒有條件讓這一天來得更早?牌在手里,關(guān)鍵看怎么打。
來源:省國際民間科技交流中心
責編:葉 揚
美編:陳路漫
一審:何百岳
二審:方佳佳
三審:王陸軍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.