![]()
經常刷短劇,短視頻的各位差友,應該對這張臉不陌生。
沒看過的人可能以為這是哪個新晉網紅,實際上,這是最近在各種視頻里,反反復復出現的一張 AI 生成臉。
五官精致,眼睛夠大,鼻子夠小,皮膚永遠白皙,永遠柔光濾鏡,嘴角弧度剛剛好。
![]()
如果是真人站在面前,估計世超都舍不得嘴一句。可就是這么一張看起來人畜無害的臉,卻被狠狠地 “ 網暴 ” 了。
倒不是因為她有多難看,而是她就像 AI 界帶資進組的關系戶一樣,看點啥都有她出演。
校園里的白月光是她,古裝劇里的大小姐還是她。
五六歲的小女孩是她,七八十的老太太還是她。
再仔細一看,woc,怎么旁邊系著頭巾的大爺還是她???
![]()
每天打開手機看到的全是同一張臉,刷短視頻愣是刷出了被偽人包圍的恐懼感。
而隨著發現的人越來越多,到處都是網友鋪天蓋地的吐槽:
“ 這張臉,我快看吐了。”
“ 現在看到這張臉就生理性厭惡。”
“ 有多少人看見她就反感?”
也有人納悶了,這 AI 怎么生成的人全一個樣,到底是偷了誰的臉?
評論區有猜某已封號女主播的,有說像演員李川的,還有說像樸燦烈他姐姐的。。。你還真別說,國內國外,男的女的看起來都能沾點邊。
![]()
但問題是,猜來猜去也沒個準信。因為比起具體的哪張臉被偷了,這更可能是從 AI 的審美流水線上,被反復捏出來的,一個本不存在的 “ 平均標準臉 ”。
那這張臉到底是怎么來的呢?
不信邪的世超,干脆把 Seedance、可靈、海螺、HappyHorse 這些主流視頻模型挨個試了一遍,在實驗的過程中,還真發現了一點規律。
我們給所有模型兩次機會,相同的 “ 女生騎自行車 ” 提示詞,按理說,它們每次生成的臉都會不一樣,甚至有時候跳亞洲人,有時候跳外國人,這才是大模型的天性。
因為咱們只限定了性別,沒有任何其它提示,不只是人臉,它應該隨機生成任何國籍,任何膚色,任何發型穿著等等,完全不一樣的人。
可實際上,同樣的提示詞,幾乎所有模型兩次生成的都是一樣的臉,穿著打扮,背景環境,拍攝角度,全基本相同。
![]()
在 Seedance 2.0 Fast 這里,世超更是找到了和開頭一模一樣的 AI 臉,看來這就是萬惡之源了。
如果只有一個模型犯錯,也許是它的問題。但要是所有模型同時喪失了多樣性。。。世超研究了一下,發現這里面可能有兩層原因。
第一層,常用視頻模型的差友應該都知道,視頻模型對提示詞是非常敏感的。有時候一個詞,幾個字的排序,都可能影響生成的最終效果。
而為了讓大伙兒能盡量穩定地每次抽卡出金,我們的提示詞往往在生成的后臺會被二次優化。
![]()
以前 “ 提示詞增強 ” 會作為一個單獨的按鈕放在一邊,用戶可以開掛,也可以原提示詞直接沖。但世超翻了不少平臺,似乎現在很少見了,提示詞潤色成了默認項。
比如我輸入的是 “ 女生正在騎自行車,邊騎邊笑 ”,而被優化后實際輸給模型的提示詞,就可能變成了:
“ 一個年輕漂亮的亞洲女孩,在陽光明媚的林蔭道上騎自行車。她皮膚白皙,五官精致,大眼睛,小鼻子,長發自然飄動,穿著白色連衣裙,臉上帶著甜美微笑。鏡頭為中近景,柔和自然光,淺景深,電影感畫面,清新唯美風格,人物表情自然,動作流暢,畫面高清寫實。”
一次兩次看,這叫提示詞優化,成千上萬次都這么補,可不就成流水線了嘛。
所以,在世超修改提示詞,對外貌進行一些特征描寫以后,右下角的臉明顯不一樣了。但沒有額外環境提示,女生依然騎在林蔭道上。
![]()
不過,五官精致也分很多種,世界上美女那么多,為什么 AI 認的就這一個?
這就來到了第二層原因,圖像、視頻模型天生就有審美偏見。
去年一篇發表在《 Nature 》上的論文,就明確地討論了這個問題。他們在研究中發現,如果你指定一個種族,模型搖出來的臉,個個都像親兄弟。
這樣的審美偏差最開始來自數據,比如大部分人喜歡網紅臉,它們自然會被打上美女的標簽。模型啥也不懂,反正以后提示美女,往這個方向靠就完事了。
模型在訓練過程中,還會進一步放大這種偏見,導致相同的特征提示詞,生成的臉越來越像。
![]()
另外,視頻模型為了關注前后一致性,還可能進一步加劇審美同化。
畢竟視頻模型生成的人臉,不光要好看,還要穩,要保證幾十幀上百幀,前后左右都像一個人。
所以模型也會天然偏愛那些更容易維持一致性的臉,五官對稱,輪廓標準,特征不極端,表情好控制,轉頭不易崩。
總之,平臺喜歡安全漂亮的,用戶喜歡短劇網紅的,模型喜歡穩定標準的,三邊一合計,讓大伙兒看吐的臉就誕生了。
說實話,不只是最近廣為流傳的那張,幾乎所有 AI 生成的毫無缺陷的美女,世超都不大喜歡。
來源:小紅書 @Alexander
![]()
讓 AI 臉進入我們的信息流,堪稱一次無意促成的大型賽博異化實驗。
沒有現實對照的臉,在無數網紅數據的洗滌蒸餾下誕生。
而當它們擠兌我們刷手機的時間,取代曾經各色各樣真人美女的時候,世超感覺相當難受。因為我們對世界的感知,對審美的定義正在被 AI 壓迫。
所以,大伙兒反感 AI 臉,一方面也許是那種不真實帶來的恐怖谷效應,其實也有對同質化的本能抗拒。
有人說,AI 視頻以后應該越來越清晰,越來越細節,越來越像真人,等大家分辨不出來真假的時候,就會喜歡了。
但世超覺得,就算技術能做到真假難辨,我們也無法愛上一張完美假臉,沒有靈魂。
撰文:莫莫莫甜甜
編輯:江江 & 面線
美編:素描
圖片、資料來源:
《AI-generated faces influence gender stereotypes and racial homogenization 》N AlDahoul
小紅書、抖音
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.