![]()
聊了一個小時,美圖CPO——首席產品官陳劍毅(花名小白)幾乎沒提過「參數」兩個字。
這有點反常,要知道 2026 美圖影像節這天,美圖一口氣發完 8 款 AI 產品和一款奇想大模型 V6,好幾款產品背后都站著一支多 Agent 團隊。
![]()
換作其他AI公司,在這種場合大概會跟你聊模型多強、Agent有多少、Token漲了幾倍,小白聊的是卻另一套東西。
怎么挑產品,怎么選人,怎么判斷一個需求該不該做。大多數人對美圖的理解還是一款P圖工具,但聽著聽著你會發現,美圖這波 AI 產品的底色并非效率,是另外三個字:非理性。
小白選擇產品負責人,最看重的是這個人到底熱不熱愛這件事,AI 能力反倒是其次;面試產品經理,他會謹慎看待「AI 狂熱者」,理由是他們容易「誤把產出當創造價值」;他說做影像產品和做游戲一樣,是制作人驅動的,「當所有游戲都在追求低門檻,魂類偏偏要虐死玩家,反而更令人上癮」。
在一個張口閉口數據驅動的行業里,這些話不太像一個上市公司高管會講的,這似乎不是資本和投資人青睞的AI敘事,更像是一位創作者在替另一群創作者著想。
最后我讓他用一個詞定義自己。他想了想,給出的答案是:編劇。
![]()
▲美圖 CPO 陳劍毅(花名小白)
以下是 APPSO 與小白的對話。
給每一種內容格式做一個產品
APPSO:這次美圖一次發布了 8 款 AI 產品,除了設計,還有口播、短劇、MV ……方向這么多,你們的戰略優先級到底放在哪?
小白:真要選,其實就兩個方向——設計和視頻。再往下是具體的內容格式:設計是電商套圖、社媒圖文這些;視頻就是口播、AI 短劇、MV等,內部還在孵化類似動畫短片的產品。我們的判斷是,每一種內容格式,都值得有一款產品專門去做。
APPSO:很多產品大廠也在做。
小白:對。
APPSO:那你們的機會在哪?
小白 : 我覺得做 AI 產品,思路可以參考傳統行業比如消費品,每個非常細分的場景或者一個需求里,都藏著一個頭部產品的機會。大廠的通用型工具能覆蓋很多場景,但大多數細分場景只能做到五六十分,我們要的是把一個細分場景做到100 分。
APPSO:但視頻賽道現在也很擠,很多模型廠商也在做工具,人群也跟你們重疊——電商、短劇用戶,你們怎么應對?
小白 : 原地縮成一團。
APPSO:正經點。
小白:我覺得他們還是太通用了,做一個內容容器,這跟我們不太一樣。就拿我們的 MVLAND 來說,它能更好地把音樂和畫面的情緒關聯起來,怎么突出主角,怎么對口型,歌詞字幕怎么匹配音樂風格。這些深度的東西,通用大模型的工具很難做到。它或許能給你一個開放式編輯器,讓懂的人自己創作,但效率一定比我們低。同樣做一支 MV,用通用工具光調參數就要三小時,用我們的十分鐘,效果還更好,那有什么理由用通用工具?所以要原地縮成一團,聚焦在一個點上。
![]()
▲MVLAND 工作流界面.
APPSO:這都能圓回來。。。那為什么你們能讓這個交付成果更快更好?
小白:還是對特定內容的關鍵構成元素的理解。舉個口播視頻的例子,它跟很多通用剪輯工具不一樣,口播視頻一定有人在說話,有人說話就一定有字幕,有字幕你就能通過編輯文字來驅動剪輯(文字快剪)。我們是把通用工具里 80% 的共性功能保留下來,再把那 20% 跟口播最相關的——花式字幕、黃金三秒、口播腳本、綜藝元素等,做深度定制。這就是垂直工具相比通用工具最大的價值。
APPSO:所以你們是主動去做得很垂直。
小白:就是做小眾剛需,不和大廠硬碰硬。
APPSO:那美圖的核心用戶是專業創作者,還是大眾用戶?
小白:垂直場景的產品,一定是先搞定專業創作者,再做創作者的泛化。這有點像脫口秀類綜藝——第一季上的都是行業里很資深的人。但做了幾年之后,明星、素人都能上去講了。他們不是脫口秀專業的,有專業的人幫他寫稿,稍加練習,用演繹的方式表達,也能像半個脫口秀演員。
所以一開始你面向的,一定是這個領域里最資深的那批人,跟他們共創產品,他們幫你沉淀出配方、模板,再給沒那么資深的人復用,最后才是泛化。
APPSO:開拍也是這么起來的?
小白 : 對。三年前我們做開拍的時候,口播還是個很小眾的品類,只有知識博主、帶貨博主會去做。現在呢?各行各業的人都在做口播了,房產中介,路邊小攤販都在拍。它花了好幾年,才走完從小眾到泛化這個過程。我們就是在它還小眾的時候進去,先跟最專業的那批人共創,再讓更多人涌進來。這個世界就是各種小眾文化不斷走向大眾化,你去看所有成功的東西都是這樣的。
![]()
AI 時代,驗證大于規劃
APPSO:你在美圖很多年了,AI 出現之后,你做產品的方法論,最大的變化是什么?
小白:是在「深度思考」和「動手」之間的取舍。過去我們這批人,比較推崇張小龍這類產品經理,有個想法然后推敲一千遍再去做。但在 AI 時代,深度思考半天,往往不如先做個 demo 上線看一下對不對。當然也得平衡,不能狂推一大堆 feature 去試,還是得有基礎判斷。但總體上,現在驗證大于規劃。
APPSO:有沒有一個大方針,是內部團隊都要遵守的?
小白:先做用戶調研,辨別需求真實性和它能創造的價值。但我個人非常不喜歡一點:團隊做市場研究時,第一反應是去找戰略分析團隊出一份行業分析報告,寫什么行業增速多少、市場規模幾百億——這沒有錯,但太套路化了。
分析團隊給你的往往是二手信息,你沒有真實體感。所以我總跟大家說:你得真的自己去找用戶聊,去做社媒觀察,再做判斷。對于初創產品來說,一個犀利的,親身經歷的用戶洞察,比幾百頁別人做的行業報告有用多了。
APPSO:可用戶的聲音也很雜,張小龍說每天有一億人教他做產品。你們怎么從里面篩出真正能做的需求?
小白:說實話,這件事還是比較依賴主觀判斷。比如調研 30 個用戶,20 多個都指向同一個需求,按常理這需求一定對。但很多時候不是這樣。我常拿喬布斯舉例:他做 iPhone 之前如果去調研,問你想要什么鍵盤,用戶只會說「我想打字更快」,他不會告訴你「我要一臺觸屏手機」。
做影像產品大多時候是件很主觀的事,跟做游戲很像——游戲是制作人驅動的。我有個 idea,把它做成游戲,并且我就是不迎合當下主流玩家的需求。比如當所有游戲都追求低門檻時,魂類偏偏要虐死玩家,這種反主流的游戲模式,反而讓玩家被越虐越上癮,但如果你用互聯網那套看次留周留的方法論去看,就沒有魂類游戲了。所以 1 號位的影像 Sense 很關鍵,選對了人,后面很多事就順了。
APPSO:那這種判斷,很難沉淀成一個 Skill?
小白:有點難。本身是個博弈的過程,你做一個 Skill 說「這件事可以做」,再做另一個 Skill 說「不行」,兩個不停打架,最終也很難出結果。
APPSO:這次發布的產品里,哪個是最靠這種直覺做出來的?
小白:Artflo。因為欣鴻(美圖創始人)是美術生,對藝術和厲害的視覺有天然的興奮感,也特別喜歡概念短片,就會想把這種表達形式產品化。但在很多非視覺驅動的人眼里,它可能沒什么看頭,喜歡視覺的人會興奮,純理科背景的人會覺得奇怪。
APPSO:那這種還沒被主流驗證的產品,你們怎么判斷商業價值?還是先跑出來看看?
小白:還是要做調研,不能全靠直覺。像 MVLAND,我們就去跟音樂工作室聊:你們一年在 MV 上花多少錢?有多少歌沒有 MV?很多工作室有上萬首歌,99% 沒有 MV。假設每首配上 MV 后在 YouTube 有一千播放量,換算成廣告收入,這個價值是能算出來的。包括概念短片,我們以前找外部團隊做,一支動不動五十萬、一百萬,現在用 AI 一條五百塊就出來了,這就是實實在在的商業價值。
![]()
招人先看「第二屬性」,然后才是AI 能力
APPSO:組織上你們也做了變化,開設了很多 AI 工作室,鋪很多產品線,有點像賽馬機制,你們不擔心資源分散嗎?
小白:現在AI讓新產品的開發門檻變得很低,比如公司有2000 人,投入到AI工作室100來人,它占整體公司資源不到 10%,對主業務沒多大影響。但如果占到 30% 到50%,那確實就得掂量了。
APPSO:你提過設計師未來會承擔一部分產品經理的工作。那你們現在對這些崗位的要求,跟以前有什么不一樣?
小白 : 很多影像產品經理都是設計師出身,比如我。公司里有不少設計師兼任產品經理的工作,美圖的設計師還是很全能的,除了做視覺也會深度參與產品定義。
對崗位的要求跟過去還是挺不一樣的。除了基礎能力外,更多看他有沒有「第二屬性」。
這概念是我和欣鴻討論出來的。他因為熱愛攝影創辦了美圖,攝影就是他的第二屬性。后來成立 AI 創新工作室,跑了一段時間后,我倆發現一個規律:1 號位的第二屬性,如果和產品方向契合,項目成功率高不少;不契合的,做起來就比較吃力。
第一屬性是你的本職工作,比如產品經理,運營,設計。第二屬性是對某件事的熱愛和精通。你做 MVLAND,要是個音樂發燒友或重度視頻創作者;做 Artflo,是個有藝術追求的設計師;做開拍,自己也要是個口播創作者。
第二屬性是為了擁有原生體感,自己就是產品最挑剔苛刻的用戶。對于初創產品來說,如果 1 號位沒有原生體感,需要通過用戶調研或招人來獲得間接體感,那轉化到產品上的理解,就永遠隔著一層,少了那種發自內心的挑剔與共情。
![]()
APPSO:所以你們反而對 AI 能力沒那么強的要求?
小白:AI能力當然要考察,但說實話,AI能力只要讀過大學的人都能學會。我面產品經理時,反而會對那些 AI 狂熱者比較謹慎,尤其是離用戶很遠的。有些人整天用 AI 做這做那,卻從不去找用戶聊,不懂如何辨別偽需求,就有點被 AI 魔化了——他誤把用AI來產出當成了創造價值。
有點像當年玩塞班破解,蘋果安卓越獄root,我們現在回頭看,這些技術基本消失了;而十幾年前踏實去觀察用戶場景做App的那批人,很多到現在都還在做。
APPSO:所以洞察用戶需求,始終是最重要的。
小白:不管有沒有AI都是。產品經理要有敏感度,但主次不能亂——用戶需求是主要的,AI 工具是次要的。現在很多人把次要的當成主要了。
APPSO:有了AI,產品的開發周期、團隊配置會變嗎?
小白:周期縮短非常多。以前做一個效果要半年一年,現在三天就出來,團隊也小很多。不過它對從零到一的項目更友好,沒有歷史代碼包袱;老項目反而麻煩,過去的代碼太多,一改就一堆 bug。
APPSO:現在很多公司會對「AI 提效」提硬性要求,你們呢?
小白:我們是鼓勵,訂閱最新 AI 工具,公司都報銷,也暫時沒設上限讓大家去摳成本。但我們不太希望強制去推去考核大家的token消耗,一強制就變味了,大家盯的就不是「我能產出什么好東西」,而是去應付那個指標了。
把決定權,交還給創作者和用戶
APPSO:聽完今天的分享我有個感覺,你們更像用創作者的角色在做產品。
小白:影像產品經理和游戲策劃很像,是創意驅動的。他們其實不好管理,都很有個性,想法很多,有自己的追求。一旦強迫他們去執行你的想法,容易把人逼走。所以很多時候是平等探討,創意被尊重,才能留住那些敢于獨立思考,不唯上的人。未來,我們想把公司搭成一個影像產品的創新平臺:沉淀好規則和避坑指南等,把大家做產品的下限拉高,少出錯,前人踩過的坑就別再踩了;但上限,得靠各位制作人自己去探索。
APPSO:美圖還推出了一個挺有意思的服務,讓專業的人代替用戶來操作 AI。Agent再發展下去,這兩個模式會沖突嗎?真人加 AI 是過渡,還是會一直并存?
小白:我覺得會永遠存在。這世界的信息差還是太大,我們理解的世界跟真實的,完全是兩個世界。拼多多之前我們都用淘寶,快手之前大家都不知道有這么多小鎮青年,誰能想到有那么下沉的消費需求?我們這群互聯網從業者看到的世界,估計只占整個世界 10%,剩下 90% 的人非常不懂這些最新AI技術,但他們有很強烈的內容制作需求。
![]()
APPSO:那真人加 AI 的占比會到多少?是終極形態,還是五年內的過渡?
小白:不說具體產品,就說需求量,至少 80% 的用戶,是想直接花錢解決問題的。
APPSO:花錢解決問題,是不是意味著現在的產品沒法直接解決他的問題?
小白:不是不能解決,可以解決,只是他們不想。
APPSO:這個「不想」,能不能理解成一種學習成本?
小白:你平時會做飯嗎?我是不做飯的。網上做飯教程那么多,為什么我自己不做、要去餐廳吃?因為我不擅長,或者有更低成本的方式能解決它。一個賣燒烤的老板,他的職業是烤串,不是做短視頻。現在很多人是硬撐著為了流量做內容營銷,因為同行們都在做。
但如果你給他一個選擇,他更愿意讓別人幫他去做,自己專注去做擅長、也感興趣的事——做菜。這就是學習能力強的精英們容易對真實用戶造成的誤判:我們總默認這東西「應該」是用戶去學的,可人家就是不想學。
![]()
模型趨同之后,拼的是對用戶的理解
APPSO:多 Agent 協作是這次產品更新的重點。但對用戶來說,打開都是Agent,根本看不出來。
小白:對。
APPSO:你是怎么考慮的?
小白 : 用戶確實不在乎你是單 Agent 還是多 Agent,他要的是效果好。有用戶跟我說,你們搞多Agent就是脫褲子放屁,就跟廚師一樣,給我做個菜我吃就好,我管它廚房里有幾個分工的小弟?這是客觀事實。多 Agent 更像用戶端的一個傳播點:我們效果比別人好,是因為背后有幾個 Agent在配合,這就占住了心智。
但從技術實現來說,多Agent 真正的價值,在于把行業獨特認知做輸出,讓每個 Agent 有自己獨立的行業認知。比如同樣做 logo,奶茶店和食品行業的技法、風格完全不同,我們會讓設計師把每一道工藝植入到對應 Agent 里。通用模型訓練的是互聯網上的共識,而多 Agent 的本質,是我們把「非共識」植入每個 Agent 角色,再讓這些帶著非共識的 Agent 互相協作。
![]()
▲ 美圖創始人吳欣鴻.
APPSO:Notion 的 Ivan Zhao 有個觀點:以后不能被 Agent 調用的產品是沒有未來的。你認同嗎?
小白:這個觀點太極端了。Agent 哪怕做成一個生態,有各種 CLI、Skill接入,它滿足的也只是那20% 的淺度內容創作需求。
因為它最基礎的形態還是對話式交互。但內容創作除了對話,你還要二次編輯、要剪輯模板、要調用過去沉淀的內容資產和效果配方,這后面的鏈路還很長。你用大模型簡單出一條片可以,但真要把這件事做好,還得有地方讓你去調整。所以我理解的Agent 調用是:用戶說「這條視頻我想改」,Agent 吐出一個url,點進去是一個畫布或編輯器——但這個畫布還得在原生產品里面,在Agent里做不了這事。
APPSO:如果每個人都能調用最強的模型,你覺得以后最核心的競爭力是什么?
小白:對用戶的理解,這會是(產品)最大的差距。大模型就像一片汪洋大海,什么魚都有;我們做應用的,是去做不同尺寸的漁網,把不同的魚撈上來。你只玩一玩,我給你一張通用的漁網,撈到什么算什么;但你在這行待久了,我肯定給你各種大小的漁網,讓你撈到對應的魚。產品和技術都能用時間追上來,真正追不上的,是對用戶心智的搶占。
一個把自己當編劇的產品經理
APPSO:如果用一句話總結你現在做的事,你會怎么說?
小白:如果是對內心最深處那個點……我覺得,還是一個小小的編劇吧
APPSO:編劇?
小白:對。因為我做的很多東西,本身都是內容創作的屬性。比如這次美圖影像節,也是跟很多同事一起創作出來的——怎么策劃內容、視頻、設計敘事、哪里埋梗。如果你只是把產品當成一個「產品」來做,你會失去很多從外部視角看它的能力。做內容很關鍵的一點,是會站在受眾的視角:受眾看到之后會有什么反應。這世界上大部分成功的 IP、漫畫、游戲,背后都是很偉大的編劇。好的產品,其實都在講一個好故事,讓用戶更好地走進來。
當然,如果面對投資人或市場,我可能會說自己是個「翻譯官」,把用戶需求翻譯成技術能實現的東西,把技術翻譯成用戶能用的產品。但我內心還是覺得自己更像個內容編劇。
APPSO:所以「編劇」,其實也是你對「產品經理」的一種定義?
小白:我會說自己是內容型產品經理,或創作型產品經理,所以在公司里比起開會,我更喜歡在電腦前沉浸式的創作。比如一份產品需求文檔,如果寫得特別理性,它就是一份公文,很枯燥。但你用編劇的視角去寫,就會這樣考慮問題:我要怎么打動看這份文檔的人,讓他們更愿意、更好地把我這個產品做出來。也會構想這個文檔實現成產品后,用戶們會怎么傳播這個產品,就像你寫個電影劇本前,會做上映后的影評推演一樣。這時候你的產品才是有溫度的,是在創作一個作品,而非交個作業。
APPSO:很有意思。「非理性」在你們整個產品角色里,好像是個挺關鍵的東西。它是不是某種程度上成了讓美圖走到今天的底色?
小白:我覺得一定是的。互聯網從業者大多背景很好,擅長用理性思維做決策。但影像產品本質上是由「審美和流行」驅動的,這種非理性的判斷,在行業里是一種稀缺特質。早期我們做讓女生變美的產品,也算是進入了一個競爭真空地帶,它有點像「角落里的生意」,看似小眾,但背后的潛在市場其實并不小。所以我們也常常感慨自己是幸運的,從最初幫女生修好圖,到今天做商業設計、口播、AI短劇等等垂直場景的生產力工具,我們走出了一條屬于自己的路。
![]()
采訪快結束時,小白跟我分享了一件「吃過虧」的事。過去他們也找過那種極其理性的、數據驅動的人來做影像產品的 1 號位,結果很可怕——「他不管視覺效果,給你講一堆策略,看一堆數據」。
后來他們才想明白:做影像產品,一份好的 BP 不是去算市場規模幾百億,而是直接把效果擺出來,一個個效果評測 case 放出來。投資人看不懂效果,他只看你能回報多少錢;可影像產品偏偏就是效果驅動,不是數據驅動。
這大概能解釋,為什么這次美圖 8 款產品,每一款發布都不是從一張市場規模的圖表開始介紹,而是從一個效果演示視頻,或者一位具體的用戶開始:一位被重復手搓幾十張照片「熬」得懷疑自己是不是一臺修圖機器的修圖博主。一位會員過期三次還沒剪明白一條視頻的新手媽媽。還有那位虧了將近一千萬、最后靠開拍把店做到排隊的牛肉面館老板娘。
AI 能多快、能多強、能替代多少人?如今所有人都在算這筆賬。美圖卻在考慮另外一件事:怎么把那 90% 的時間,還給那個只想去旅行、想帶娃逛公園、想專心做菜的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.