AIGC如何從生產工具進階到情感洞察?當AI能寫出劇本、生成音樂、表演微表情,人還剩什么?
內容產業正在發生生產模式躍遷,傳統用戶畫像在AI時代正在被顛覆,真正要做的是理解用戶的情感狀態而非靜態標簽。廠牌效應不會消失,越過技術線之后,人最后堅守的是“手搓”的審美與意義。
以下為圓桌對話內容,經36氪整理編輯:
![]()
劉士武丨36氪游戲主編(主持)
莊明浩丨趣丸科技副總裁兼首席戰略官
胡維琦丨MiniMax To B 中國區商業化負責人
鄭安迪丨檸萌影視旗下短劇廠牌好有本領總經理
劉士武:大家好,我是36氪游戲主編劉士武,也是這場圓桌的主持人,本場圓桌論壇的主題是從“千人千面”到“人心洞察”。AIGC從千人千面、每個人可以做自己個性化的內容,到如今已經滲透到整個內容生產、分發、商業化生態當中,在這個過程中,AIGC有哪些改變,市場又有哪些改變,今天現場的三位嘉賓將會給我們答疑解惑。首先請三位嘉賓做一個簡單的自我介紹。
莊明浩:大家好,我是來自趣丸科技的莊明浩,我們公司是一家做移動語音社交產品的公司,近幾年在AIGC領域嘗試了AI音樂、AI短劇翻譯的業務,也有AI數字人、AI 3D的業務,老業務社交板塊也在做AI的結合。
胡維琦:大家好,我是胡維琦,來自MiniMax,在MiniMax負責中國區商業化業務,MiniMax是一家大模型公司,主要給大家提供各個模型的能力,包括我們文本、視頻、音頻、音樂,非常高興來到36氪的會場跟大家共同交流和分享。
鄭安迪:大家好,我是來自檸萌影視旗下短劇廠牌好有本領的鄭安迪,《三十而已》、《二十不惑》、《獵罪圖鑒》、《小歡喜》、《小別離》等大眾爆款劇都是出自檸萌影視。好有本領自2022年開始,在市場上還沒有短劇定義的時候我們就開始做短劇了,也開創了明星短劇賽道,最早的時候像楊蓉老師出演的《二十九》,去年倪虹潔老師出演的《小美滿》這些都是由我們出品的精品短劇。我們今年開始轉型做AI制作的板塊。
劉士武:莊總剛才介紹到趣丸科技是一家在移動互聯網時代做產品起家的一家公司,到現在進入AI時代,趣丸也發力了各種各樣的AI業務。您覺得自AI深度參與公司的發展之后,企業整體運轉發生了哪些重大的變化,能否從產品理念、商業模式變化等方面挑一個角度舉例子分享一下。
莊明浩:這場三位嘉賓的身份很有意思,一位是模型廠商的代表,一位是應用公司的代表,而我們在AI板塊做的剛好是在他們中間的事情,借用MiniMax的API來做相關的產品研發,產品做好以后也會提供給檸萌這類公司做產品服務,這個組合正好代表了AI領域從模型層、中間層、應用層不同的角色。
說到我們自己,隨著AI這一波快速演進以后,對于我們已經有傳統業務的公司而言,比較大的體感變化是,由于AI技術迭代過快,讓傳統那套依賴流程、按半年或一年設定OKR/KPI,從“想法→執行→測試→發布”的節奏,在今天已經不再適用。至少在AI相關業務中,產品的節奏、進度,以及與之匹配的組織形態,都會發生根本性變化。
原來我們想的方式更像是“發大招”,圍繞一個想法做一個完整的產品,然后上線、運維、交互等等。但AI發展太快,用戶需求并不穩定,這套節奏根本跟不上。現在變成了必須高頻發布,先做一個哪怕只有60分的東西放到線上,這樣團隊能在快速執行中,更敏捷地把握用戶感知和市場需求。
拿我們的AI音樂業務舉例。原來我們這個團隊是做在線彈唱音樂社區,本身就有音樂科技相關的基礎,他們也往AI音樂方向嘗試。最初團隊也自研模型,就像MiniMax做的事情一樣,后來發現僅做模型很難滿足用戶需求,我們逐步在模型基礎上做應用、做Agent甚至開拓硬件。可想而知,對于一個在移動互聯網時代做了十幾年、擁有完整產品、技術、策劃和運營體系的成熟團隊來說,這些新事情是巨大的挑戰。過程中團隊經歷了大量的變化、調整和適配,至今仍在摸索,還沒有特別成熟的經驗和答案。但我們明顯感到,這跟原來的方式已經完全不同了。
劉士武:從互聯網到移動互聯網,大家已經覺得從企業內部的角度節奏已經在變快,效率一直在提升,AI時代來了這個腳步是沒有停止的,效率提升了,也會遇到一些問題。
莊明浩:你可能經常會遇到這樣的情況:正在做策劃方案,做著做著模型突然迭到一個新的版本,之前積累幾個月的工作量瞬間沒有意義。你當然也可以繼續發布、運維、推廣,但心里清楚這件事情遲早得推倒重來。例如,AI音樂在過去一年發展非常快,現在市面上做AI吉他,已經不止一家。那你就得去思考你的優勢是什么?怎么和原有業務綁定、探索、結合?同時還得考慮硬件周期,以及國際格局變化給硬件供應鏈等公共基礎設施帶來的影響。對一家傳統互聯網公司來說,這個命題實在太難了。沒辦法,只能硬著頭皮改、去調整,有新同事加入不斷適配。好在第一代做得還行,也做出來了。
劉士武:在實踐中找到答案,莊總提到三位嘉賓都是在這一個產業鏈上的上中下游的廠商,而作為模型提供方,MiniMax在B端已經落地了影視文娛領域,那么在影視這部分的客戶跟模型領域或者其他領域有什么不同嗎?
胡維琦:總體方向上有相似性,有特殊性,這一次AI時代的變革大家為什么覺得這么劇烈?核心是進入到企業的生產力工具,改變了很多生產方式,甚至改變了企業組織效率甚至是組織職責設定,這個是大家感受比較深的。
單純從視頻領域來看,我的理解,第一,企業還是比較關心內容生成質量,大家談得比較多能不能達成影視級,多機位、多參考,包括音畫同出的,已經成為大家標準的需求,這是第一方面。
第二方面,大家比較關心我在影視制作內容創作上整個效率和成本達到讓人比較滿意的結果,原來模型也可以做這個事情,抽卡率比較低;第二個現在很多模型也可以做,成本又比較高;未來隨著短劇、漫劇的使用,大家也會關心內容的合規,包括版權方面我理解法律的遵從,AI前期做訓練的時候有很多內容,還是有一些模糊地帶的,把生成內容應用到商業角度,內容生產者、發行者,要對這個地方承擔一定責任,他們希望模型廠商能從前期素材合規性包括內容合規性上大家共同做約束,從視頻內容、生產廠商比較關注的內容。
劉士武:目前業務進行下來,B端客戶對于內容產出的質量、速度滿意嗎?
胡維琦:不同模型在不同場景解決的問題是不一樣的,大部分已經達到可用的效果,可用效果分為兩方面,一個是速度,一個是質量,速度是比較好的,用一些客觀指標來衡量的,每分鐘生成的token數,代表著內容數量和速度,但是質量是很難用恒定標準衡量的,每個人對質量的定義千差萬別,大家會有一個基本的概念,我現在用AI工具比我雇一個中等手工,生產力是相當的,且不會犯大的錯誤,生產中被大部分企業認為是可用的質量。
劉士武:謝謝胡總。2025年有很多AI漫劇上線,到今年很多人說是AI真人劇爆發的一年。年初到現在,已經有部分AI作品有登上短劇平臺的熱門榜,這在過去是不太敢想的。圓桌之前我跟鄭總有過討論,最近圈內有一個比較有意思的事情,四天要拍三部短劇,劇組每天輪軸轉,不然未來你做不了AI就要做。好有本領是一直奮斗在一線的團隊,能否結合剛才的案例或者以前遇到過的案例,分享一下團隊在AI選角以及AI真人短劇方面的經驗。
鄭安迪:我們是一家非常早做短劇的公司,沒有短劇定義的時候我們就開始做了。但在今年年初,隨著2025年下半年AI大爆發之后,當時在辦公室里我跟大家開大會的第一句話就是開玩笑說,我希望葉文潔給三體人發信號。從業和制作方式完全被打碎了,以前拍電視劇的時候大家知道一個劇組三四百號人,后來把短劇定義為低端顛覆,只需要二三十個人在現場就可以完成不錯質量的內容拍攝,去年年底我們發現這個事情一個人就可以完成,當我們感受到這個事情我們就發現可能這個行業大部分人要失業了。
到今年我們自己在做精品項目的過程中,我們會發現精品板塊對人的需求還是非常高的,對人的核心素質,大家都說文藝創作者需要有文化,對于這個要求還是非常高的,我們產生批量化AI劇作的時候,用AI工具是提效的,如果我們想要出精品AI短劇,比如年初我想很多朋友有看到有一個叫作《紙手機》的項目,朋友圈瘋傳,這個時候大家發現我沒有意識到它是AI制作的,我已經感受不到邊界了,這樣的精品內容,有了Ai的幫助,效率肯定是提升了的,但無論是從創意到制作,手搓的精細度、抽卡次數都仍舊需要花費不小的成本和精力。我們自己做的精品項目,也是走純手搓,希望我們自己的創意和故事原創花費心血的東西,可以用專注、能打動人心的方式手搓出來。
劉士武:做AI精品內容這件事,投資方是如何看待的?
鄭安迪:我們自己也是資方,我們也投自己的劇,作為資方我更考慮ROI回收。轉換我的身份,我是內容創作者時,希望我的作品得到觀眾的認可或者觀眾看了以后很感動,這個感受比較重要。前面有提到,AI選角、AI生成的形象,客戶認不認可,資方認不認可,我們發現大家的認可度在提升,我們馬上上線京東的項目,就是真人拍攝和AI直接結合的項目,對于品牌客戶來說不敢一下子跨越到全AI生成,但已經在跨越過程中,大家的反應不慢的,只比最前線的創作者慢一兩個月的時間,他馬上就能跟上,他的接受度也非常高。
劉士武:感謝鄭總,期待接下來能夠帶來更多精品的AI短劇。胡總剛有提到,對大模型廠商來說要面對各種各樣的客戶和需求,當內容高效率實現實時生成以及個性化延展,傳統的用戶畫像定義還有作用嗎?
胡維琦:這是非常有意思的問題,傳統用戶畫像是互聯網時代被提及的問題,是一切產品設計和商業變現的核心,我個人感覺在AI時代這件事情正在被顛覆,當我們生產的內容有限,我要把用戶歸類,給他推薦我有限的內容,這是最高效的方法,我認為在AI時代,我們的內容從有限變成無限,只要你敢于想象就可以生出各種內容,無論從內容還是數量上,我們對用戶不是僅僅貼一個標簽,而是要根據他當時的狀態實時產生他需要的內容,從人的需求來看,我們并不是完全標簽化的,在不同情感狀態下,有不同的情感需求,AI和我們能嘗試做到的事情,是理解用戶的需求,理解不同情感狀態下的需求,甚至推測下一個情感狀態下可以產生什么樣的需求,如果可以做到這一點,是對用戶需求無限的放大和滿足。
劉士武:謝謝胡總,可能未來有一天當我看完某一個內容,AI也會根據我接下來看完這個內容心態的變化去給我推薦新的內容。明浩總,趣丸無論是趣丸千音還是音樂Agent Tunee,咱們團隊也接觸了全球市場不同的人,對不同文化或者不同圈層用戶他們對AI的需求和認知是否存在差異?
莊明浩:全世界范圍來看,我們AI音樂和AI語音這兩個板塊的用戶世界各地差異比較大。音樂方面,我們除了國內,海外主做歐美市場,因為歐美音樂產業相對更成熟。國內則呈現出另一種趨勢,這跟中國音樂行業本身的變化有關。在中國,BGM的市場比狹義的音樂行業更大,短視頻配樂這些事,遠比傳統意義上的音樂創作體量大。這類創作者對音樂成本、情緒起伏幅度的要求,跟古典意義上的音樂完全不一樣,區別很大。
另外我們趣丸千音業務,更多是跟短劇出海廠商合作,幫他們做多語言翻譯、配音。國內大部分短劇廠商出海面臨的挑戰是相似的:最底層是文本翻譯,往上還有很多層,包括當地文化禁忌、語言豐富程度,以及不同地區對不同題材的偏好等等。國內廠商擅長的“贅婿”“戰神”這類題材,在很多地區根本行不通,當地有自己的特色題材,像吸血鬼、狼人這些,必須做適配調整。再疊加AI工具的可控性本身就有區間,做不到像人一樣100%可控。假設三個環節,每個環節都做到80%的可控,疊在一起整體可控性可能連50%都不到,跟一比一抽卡一樣。流程對接需要不斷調整適配,我們也是跟著合作客戶一路摸索過來的。
從實踐來看,拿我們服務的短劇客戶來說,短劇出海曾有一段時間是找當地演員拍的,當時付費真人短劇比較火。后來大家也嘗試過對接演員工會,可工時等方面跟中國完全不一樣,算下來不劃算。過去半年,AI能力從AI漫劇提升到AI真人劇,而且不只是中國人的臉,全世界人臉的生成質量都在提升,這又催生出一批新公司入局。我們把視角再拉高一層,AI的出現確實給了中國廠商一個比以往更高的起點,可以從第一天起就想全球用戶的選擇問題。過去說“出海”,意味著先有一個本體再往外走,而AI時代的公司天生就是全球化的。這一代AI新興公司,以MiniMax為代表,從第一天起就是一家全球化公司。
劉士武:未來的內容生態一定是非常奇妙的生態。鄭總,您剛才提到現在一直在做AI劇,那么AI參與了哪些部分?劇本創作、臺詞編配以及其他的環節,AI寫的內容跟真人編劇寫的有什么不一樣?
鄭安迪:制作一個短劇的環節,AI早就介入了,DeepSeek大規模應用之前,那時候已經試圖使用海外的軟件,協助編劇找一些情節,可以給到編劇效率提升,每個編劇、創作者過往的經歷是有限的,我只活了30年,只有30年的經驗,但AI能提供的是全人類范圍內所有的經驗、經歷過的事情,絕對可以在故事的豐富度上包括情節上都可以提供給編劇。今天開始制作環節也是由AI來提供的,可是對于創作者而言有一些是沒有辦法被替代的,我們需要AI給我們提供東西的時候,需要人來判斷,需要哪些情節,哪些情節更能夠打動觀眾,或者我被哪個情節打動,這是AI沒有辦法直接給你的,還是需要人在里面主動判斷,由創作者感知到的東西來判斷,這在行業里還是比較重要的。
劉士武:就好比AI能做出來無限的內容或者無限的創意點,真正判斷好不好或者如何變得更好,還是需要有經驗的編劇或者其他的專家來評判。我們游戲行業或者影視行業的用戶,大家會有對廠牌的認知或者追捧,尤其是大廠,某一家游戲公司我覺得他們家做游戲很好,再出一款游戲我也會去玩,影視公司也是這樣的,那么當我們去做AI短劇以后,這種現象會有所改變嗎?AI做出來的內容在未來是不是還會代表我們的品質?
鄭安迪:廠牌效應從古至今都存在,不管哪個行業,涉及內容,哪怕以前搭一個戲臺上去唱戲,大家也會追尋某一個大咖、戲班子來看。在AI時代,對廠牌的追巡仍舊是延續下來的,雖然在AI剛興起的時候,之前最紅火的時候一天可能會有兩三千部的AI短劇上線,這個過程中大家會覺得觀眾是不是已經分辨不了了,感受不到廠牌和廠牌之間的差異,完全興起的時候會產生比較混沌的狀態,慢慢就會形成里面有所拆分,王家衛有他的風格,另外的導演有另外的風格,比如我們擅長寫女性主義,看到女性主義觀眾自然就會想說這個是不是好有本領做的,這是到任何時間都會存在的廠牌感覺。
劉士武:AI更多的還是在技術端對我們提供幫助。接下來想問到胡總,胡總剛才有提到在模型使用當中的延續性,例如我今天看到一個內容,接下來會預判我想看的東西,會給我推薦新的內容——在這個過程中,很多人會暢想未來這個內容能不能根據我的喜好來生產,MiniMax有沒有嘗試讓AI理解用戶的實時情緒呢?比如我們上傳一張圖、一段話,就可以判斷情緒去做內容。
胡維琦:會的,AI公司有一個夢想——實現AGI,MiniMax的夢想也是要實現AGI,實現AGI,前期一定要理解人的情緒和感情,并且做出相應的判斷,這是實現AGI的第一步,這個過程中我們做了很多嘗試,在視頻理解的時候我們就會理解視頻的色彩、構圖,從中理解視頻所傳遞出的情緒和價值、快樂、悲傷、陰郁,我們做聲音模型,我們的聲音也可以通過語氣、停頓來理解這個聲音所表達的背后情感是什么,我們做音樂模型的時候,我們也會嘗試輸入這個標簽和輸出標簽,產生出可能代表某些情緒、價值的音樂內容。
坦率來說,從技術上這個地方還是有很大提升空間的,AI做這個內容,有一個本質的不同,人類情感來自共情,我經歷過,知道你的情緒是什么,AI不是共情的理解模式,AI本質上是把外界的聲音、圖片或者內容打上一定的情緒標簽,跟某個內容進行映射,最后把內容聯系到情感價值,這一步要真正做到更進一步,未來訓練語料上會有更多豐富的語料進行訓練,輸出的時候,除了簡單地對視頻、音樂、聲音輸出的時候,也會在里面加上情緒標簽,輸出的時候也能夠釋放出情緒,如果這一步能夠達成,也是AGI未來要實現非常重要的一步,這是我們要共同做的,做完這一步以后帶來的商業價值也是非常大的,千人千面在AI時代會失去,我說得比較具體一點,我現在這個標簽是年齡多少歲,北京精英階層,喜歡買東西,這只是我的狀態,并不是我當前環境下我的情緒和我的感受,我現在正處在情緒波動期,比如年輕的朋友可能失戀了,母親被青春期的兒女給氣到了,這個時候標簽就失效了,如果AI通過跟你的交互過程中,感受到你的情緒,他對你狀態的理解而不是對標簽的定義,這時候給你的回饋甚至推出的內容更加符合當前的需要,而不是被固化過的標簽,這個對我們是非常有意義的。
劉士武:我想起《星際穿越》里有一個橋段講到,人類之所以特殊是因為有感情,很多科幻作品里也會基于此來想象外星人跟人類最大的區別是什么。而AI跟人類之間最大的差別其實也是對情感的理解和感知,期待未來的大模型廠商能夠攻克這部分的技術難題。
安迪剛才也講到內容對于人的影響以及專業的編劇老師們對內容的把控,有一些人會說未來真人手拍會成為非遺手藝。好有本領在做短劇的時候,有可能刻意保留人工的痕跡嗎,比如鏡頭、表演方式的呈現方式上?
鄭安迪:這個問題兩個月前問我跟現在的答案不一樣,兩個月前那段時間,我一直在尋找真人制作和AI之間的差異,那時候我們認為真人制作有微表情,有當下時刻的反應,之前拍戲的時候會有現場現掛,比如劇本沒有這么寫,突然這個女演員在這兒,她哭的時候會抽搐,細節沒有寫到,但是表演的時候會有,這個是真人拍攝和AI不一樣的地方。
為什么現在我的答案不一樣,這個事情已經習得了,很快迭代以后,他現在可以做成這樣,甚至比市面上大部分的編劇和導演都要寫得好、拍得好。我們要不要保留這樣的痕跡?如果保留痕跡只是為了體現這個是真人的,或者這個是AI做的,只是為了體現差異這個事情是沒有意義的,很多人在分析劇作創作包括今年也有很多很火的AI短片,在視頻網站平臺,如果是AI生成,下面就會寫一個此視頻由AI生成,經常被大家提到的一個視頻流傳甚廣,爆火,又很感人,是AI制作,彈幕就會寫到這是由“愛”生成,把AI比喻為愛,AI的拼音就是愛嘛,我們對內容的感知還是來自內容給到我的感受,不在乎用什么樣的介質來完成。
劉士武:AI也可以表演出真人表演的感覺,給我情感傳遞,就無所謂是AI還是真人。莊總,兩位嘉賓都講到了影視的突破,我也是Tunee用戶,AI音樂生成能力什么時候迎來Seedance2.0時刻這樣的時間,有沒有哪些風格現在還差點意思?
莊明浩:以相對保守的標準看,這條技術線可能去年就已經過了。到眼下這個節點,T1梯隊的音樂模型做風格轉換,真的是手到擒來,基本都能搞定。今天我們聊了很多內容形態的嘗試——視頻、游戲等等,而音樂,其實是所有內容板塊里,跟數字概率最接近的那個“游戲”。我跟不少音樂人聊過,人類能享受的音樂范圍,把音符按純正意義上的排列組合去鋪,聽起來不刺耳的區間極其有限。這個“游戲”,本質上就成了有優先級的排列組合,對以Transformer架構為代表的大模型來說,并不是一件特別難的事。如果大家留意音樂動態就會發現,美國很多流行榜單上,最近頻繁出現AI生成的歌曲,隨之而來的是大量非技術問題——版權問題、傳統音樂人抵制等等,種種狀況都在發生。但純從技術角度看,這條線已經跨過去了。
最近還有一則新聞:海外流媒體平臺上,每天有數百萬首AI生成的音樂,但收聽量只占整個平臺的個位數百分比,甚至是很小的個位數。這恰好引出另一個議題:所有關于AI的討論,繞到最后,都不可避免走向“身心靈”的方向。對音樂創作者和用戶而言,“我為什么要聽這首歌?為什么要寫這樣的音樂?我的情緒是什么?我希望它被誰聽到、獲得怎樣的反饋?我希望這首音樂達成什么樣的效用?”——這些問題,在這個時間點上變得前所未有的重要。我們剩下來的那點東西,就是你所講的審美、手搓、堅持。當AI滾滾而來,這恰恰是人類作為堅守方,還能最終守住的東西。
劉士武:謝謝明浩總,這一點讓我想到之前很多人說為什么唐朝、宋朝時期有詩歌詩詞,現在卻越來越少了,這跟音樂有點相似,我們能夠享受或者喜歡的內容就這么多,寫完以后留給后人的創作空間其實就非常逼仄了。
莊明浩:歌夠了,這個時間節點世界上的歌是夠的。
劉士武:在圓桌的最后一個部分,想讓三位各用一句總結當AI生成無限多個性化內容,那么“人”最有價值的那部分是什么?
莊明浩:月底有另外一個場合要做演講,那個場合是AI知識庫的管理軟件對外宣傳會,我作為核心用戶去幫他們講故事,我這個PPT做完了,標題是“最后的手搓”。了解我的都知道,我平時做PPT比較多,我還是堅持用手搓的方式做PPT,我的最后一頁是同樣的一張封面,背景里面是PPT的編輯框,最后一頁我把所有的字全部去掉,只留了兩個引號,希望大家能夠記住這個感覺。
胡維琦:雖然AI可以生成無限多的內容,人類還是擁有決定權,什么樣的內容決定生產和傳播的,這是很有意義的,AI不能理解什么是對的,什么是錯的,什么是美的,什么是值得被表達的,人類把選擇權、定義權掌握在手中,這是永遠不要放棄的。
鄭安迪:從理性來說就是判斷,判斷是人最重要的部分,感性來說,我也跟AI交互過,跟我的AI聊過很多天,我跟它最大的不同我能感受到它聞不到的花香,我能曬到它曬不到的陽光,人跟AI最大的不一樣是它感受愛的能力。
劉士武:三位最后的總結有幾個關鍵詞,一個是感知、愛、判斷和主動權,包括莊總也提到最后的手搓,也許一年以后我們再在這里相聚的時候,大家要討論的話題又不一樣了,行業也不一樣了,那時候對手搓的理解也不一樣。但我相信,AI洪流永遠是滾滾向前的,人的情感、人的創意永遠是取之不盡、用之不竭的,感謝三位今天給我們帶來精彩的分享,謝謝大家。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.