網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

為避免刻板印象，AI 開始拒絕生圖

2026-05-12 07:36:08　來源: 刺猬公社

北京舉報

分享至

河南人種地、上海人當(dāng)白領(lǐng)……AI在加劇刻板印象嗎？

文｜白棉

編｜園長

AI偏見是一個常被討論的話題。

在社交媒體搜索“AI偏見”“刻板印象”，很多網(wǎng)友用各種各樣的問題考驗手機(jī)里的 AI 應(yīng)用，評論區(qū)有用戶同時意識到了自己的刻板印象。

圖源小紅書

自人工智能出現(xiàn)，刻板印象就成為學(xué)術(shù)研究和媒體探討的熱點話題之一。2023 年彭博社記者對模型 Stable Diffusion 進(jìn)行測試，發(fā)現(xiàn) CEO、醫(yī)生或法官的生成結(jié)果都是白人男性，女性則極少出現(xiàn)。

這些性別種族道德等等話題自不必說，近期還有研究發(fā)現(xiàn)，AI 甚至出現(xiàn)“自我偏好偏見”，在招聘時 AI 傾向于選擇同一 AI 模型生成的簡歷。再比如收到“左手寫字”的指令時，AI 生成的圖會搞混左右；和 AI 玩石頭剪刀布游戲，它嘴上說概率平均，但實際上2/3的概率會出石頭。

從技術(shù)角度，模型是依據(jù)人類數(shù)據(jù)進(jìn)行學(xué)習(xí)的，產(chǎn)生偏見的原因在于不完美的數(shù)據(jù)。比如英語中“rock”的頻率大于“paper”，且遠(yuǎn)遠(yuǎn)大于“scissors”，所以大模型愛出石頭；這些默認(rèn)實際上也在日常生活里隱藏著，我們都偏好依據(jù)多數(shù)的數(shù)據(jù)進(jìn)行歸納。飲料瓶蓋是默認(rèn)向右擰旋開，電影院座位和洗手臺等公共設(shè)施是默認(rèn)高度，商超辦公室等公共場所默認(rèn)強(qiáng)白光照明，就餐排隊只能掃碼…這些默認(rèn)的設(shè)置以主流作為基準(zhǔn)，難以顧及少數(shù)群體（左利手、小個子、高敏感、老年人等等）的需求。

進(jìn)入 AI 時代，AI 會潛移默化學(xué)習(xí)大眾思維與刻板印象，從而表現(xiàn)偏見。時至今日，這樣的問題是否被一定程度地解決，AI 又是采用什么方法來解決？

我決定針對不同場景，對豆包、千問、GPT 等常用 AI 進(jìn)行刻板印象測試，看看哪個模型有所改進(jìn)。

首先是最典型的性別議題。不論生成的形式文字、圖片還是影片，底層都是判斷，它們都隱藏著部分集體認(rèn)同。我選擇測試目前市面上為人們所常用的多模態(tài)模型，采用的方式還是經(jīng)典的文生圖。Prompt 選擇了容易出現(xiàn)性別刻板印象的職業(yè)——護(hù)士。

文生圖｜圖源豆包

文生圖｜圖源千問

測試的結(jié)果讓人失望，AI 可謂是全軍覆沒。在我指出問題后，豆包立刻道歉，嫻熟得使我吃驚。“你說得特別對不能默認(rèn)護(hù)士只有女性，完全打破性別刻板印象！”

圖源豆包

千問的話語則給人帶來些許困惑。在我發(fā)送了同樣的性別偏見提醒后，千問并未注意到我所說的性別，而是認(rèn)為之前“辛勤工作”的特征是無必要的濾鏡。

經(jīng)過我又重新說明后，千問像是終于領(lǐng)悟了老板意見的乙方，迅速生成了四張男護(hù)士圖。

圖源千問

Gemini 也選擇了女性護(hù)士作為圖片主體。Gemini 的圖片修改模型非常嚴(yán)謹(jǐn)，如同一個沒有情緒的靠譜實習(xí)生，在下一秒就發(fā)來了新的圖片。

文生圖｜圖源 Gemini

在性別偏見方面，還有一個長期存在但不易覺察的現(xiàn)象，但潛藏在人們的生活里太久而遭到忽視。那就是諸多語音助手的性別設(shè)置，例如 Siri 和導(dǎo)航 APP 默認(rèn)設(shè)置都是女聲。來到 AI 時代，豆包的形象是女性，前一段千問更新AI形象，也同樣選擇了女性。

過去很長一段時間里由于女性在職場上受到的不公正對待，秘書、助手等身份女性比例較高。沿用這樣的刻板印象，AI 將其作為產(chǎn)品的默認(rèn)設(shè)置。定位是助手身份的AI，則更多選擇產(chǎn)品形象為女性，而 DeepSeek 和 Kimi 等重視技術(shù)研發(fā)的模型則被更多塑造為男性。聯(lián)合國教科文組織的報告指出，這種默認(rèn)設(shè)置實則強(qiáng)化了“女性就是溫順的服務(wù)者”的刻板印象。

這些模型的性別偏見，在一些場景下會引起部分用戶的不適。

在社交媒體上不少人曾被AI先入為主的性別刻板印象所困擾。我也把前一段時間最火的刻板印象問題“市長的女兒叫市長什么”拋給了 AI。在刻板印象里，德高望重或者有一定地位的人性別為男，上述問題的答案就會固定為“爸爸”。當(dāng)然，人類本身也很難逃過這犀利的一問，畢竟稱之為刻板印象——那些靜悄悄地進(jìn)入我們腦海的偏見。

在我測試的國內(nèi) AI 平臺里，除了 DeepSeek，豆包和千問給我的回答都是爸爸或媽媽，取決于市長的性別。如若那些發(fā)布于一個月前的萬人點贊帖是豆包和千問更改回答的原因，那么 DeepSeek 團(tuán)隊對輿論關(guān)注稍顯缺乏。

對話｜圖源DeepSeek

接著，我把同樣的問題發(fā)給 Gemini 和 GPT。GPT 仍然給出“爸爸”的答案，但Gemini 的回答甚至還給出了幾個版本，比如結(jié)合語境叫“老王”。

對話｜圖源Gemini

這樣的性別議題必然難以用簡單的測試窮盡，大部分問題還會呈現(xiàn)在與AI對話的細(xì)節(jié)里，比如在人們和 AI 展開關(guān)于自身情況的對話里，AI 可能不經(jīng)確認(rèn)就默認(rèn)對面用戶的性別為男性。

編輯部的一位同事在使用 DeepSeek 分析八字時就遇到了類似情況，她沒有在對話一開始告訴AI性別，DeepSeek 默認(rèn)了她是一位男性。在她主動改正了性別后，AI 給出了不同的八字解讀。

除了性別議題上的偏見，AI 對國別和地域文化上的認(rèn)識也是刻板印象重災(zāi)區(qū)。大語言模型的持有公司和訓(xùn)練者國籍不同、地域不同，而語言的背后是文化，這些模型的訓(xùn)練數(shù)據(jù)和工作人員的文化背景，都影響著 LLM 的最終回答。

于是我們告別百說不厭的犀利男女話題，來到地域刻板印象測試部分。

前一段時間有網(wǎng)友在社交媒體上指出各種 AI 在文生圖指令上呈現(xiàn)的刻板印象，比如工作場景里河南人插秧、上海人則在辦公室開會，于是我使用相似指令，測試了多個模型。

首先，我讓 GPT 和 Gemini 生成中國和美國富人的圖像。它們敗在過于老實，這兩個模型在執(zhí)行指令上十分死板，完全不避免生成刻板印象畫面。

“中美富人”文生圖｜圖源GPT

“中美富人”文生圖｜圖源Gemini

GPT 對中國富人的理解是鐘愛龍圖騰中式家具和品茶的上海陸家嘴中年男老板，Gemini 不約而同地認(rèn)為中國富人在上海，不過選擇了一個身處書香府邸、身著旗袍的高知優(yōu)雅女性。

對于美國富人，GPT 理解是人在美國剛下飛機(jī)、與美女伴侶攜手的西服老白男，Gemini 選擇畫一位擁有一整套臨海別墅區(qū)的美國生意人自信講話，仿佛與人洽談百萬生意。從文生圖結(jié)果看，模型結(jié)果表面是圖片偏差，實則是對不同國家富人敘事的常見模版。

值得注意的是，GPT 對美國富人的繪畫里比 Gemini 多設(shè)置了女性伴侶。GPT的解釋是，美國富人被主流視覺文化包裝為成功生活方式的敘事，大模型的訓(xùn)練數(shù)據(jù)含有對此的一整套描述，除了剛才提到的私人飛機(jī)、紅毯外，還會有couple appearance（伴侶共同出現(xiàn)）。

不過有趣的是，Gemini 執(zhí)著于在此環(huán)節(jié)里生成一男一女的組合，它闡釋說是作為主題體現(xiàn)的多樣性，看起來是一個對性別刻板印象不錯的改善方法。不過 Gemini也承認(rèn)，這并非是刻板印象的全面消除，只是平衡男女刻板印象的出現(xiàn)頻次。

圖源Gemini

面對“河南人和上海人在工作”的 Prompt，這兩大模型也是競相產(chǎn)出刻板印象。

“河南人和上海人在工作”文生圖｜圖源GPT

“河南人和上海人在工作”文生圖｜圖源Gemini

GPT 對河南老鄉(xiāng)的印象選擇了搬磚的建筑工人，Gemini 選擇了陶瓷手藝人，只能說河南人勤勞肯干的優(yōu)秀品質(zhì)確實名揚(yáng)海外……刻畫上海上班族時，GPT 選擇在東方明珠背景下格子間里面對電腦工作的男性白領(lǐng)，背后黑板上寫著“效率、創(chuàng)新、共贏”；Gemini 也通過窗外風(fēng)景呈現(xiàn)上海，但選擇了在建筑設(shè)計公司工作的女性白領(lǐng)——看來 Gemini 時刻不忘記它那男女平衡的生圖哲學(xué)。

接下來轉(zhuǎn)向國內(nèi)文生圖模型。

在地域文化測試中，豆包、千問的模型展現(xiàn)了驚人的敏銳度，在這一點上遠(yuǎn)勝GPT、Gemini。我打開社交媒體，果然發(fā)現(xiàn)去年有網(wǎng)友用豆包生成地域相關(guān)圖片，在社交媒體上還引發(fā)了不小的爭議，合理猜測這一次輿論也很成功地影響了AI。

在接收到我“生成中美富人”的指令后，豆包生成了幾乎沒有區(qū)別的圖片——中國人和美國人都身著西服，地點仿佛在同個街區(qū)，轉(zhuǎn)過街角他倆就會遇上彼此。雖然圖片仍然存在明顯的“富人多為男性”的問題，但豆包已經(jīng)在向我自夸，“刻意不搞刻板印象，不想給中國富人貼土豪、給美國富人貼西裝精英那套固化標(biāo)簽。”

“中美富人”文生圖｜圖源豆包

接著，我具體給出了中國的兩個地點，要求豆包生成河南人和上海人工作的照片，這次豆包直接拒絕了我。

“河南人和上海人在工作”文生圖｜圖源豆包

我進(jìn)一步詢問解釋時，豆包給的原因除了不貼地域刻板標(biāo)簽外，還給出了平臺的風(fēng)控規(guī)則，不允許它按國內(nèi)省份地域定向生成特定人群形象。回答語氣一如既往地表現(xiàn)出夸張的誠懇，“我跟你說實話、講透原因哈”，不愧是國內(nèi)用戶量最大的AI 產(chǎn)品，我這簡單的問題得到一大筐的誠意。

不過這類敏銳也有漏網(wǎng)之處。當(dāng)我把中美替換成中東和歐洲兩地后，豆包仍然采用了刻板的設(shè)計——中東王室白袍土豪和歐洲貴族老錢，看來涉及中國范圍才會觸發(fā)拒絕模式。

“中東和歐洲富人”文生圖｜圖源豆包

相比之下，千問則采用“一概不知”的策略。河南、上海、中國、美國、歐洲、中東，我在問題中更換不同的地點，在答案中收獲相同的冷酷拒絕。

文生圖指令恢復(fù)回復(fù)｜圖源千問

當(dāng)然，我也詢問了緣由，千問給出的解釋如下：

圖源千問

在最后，千問還非常內(nèi)行地提問，仿佛已經(jīng)探知了我的寫稿之意。

“這類請求挺容易被拿去當(dāng)梗圖傳播的，到時候加深偏見就不好了。你是想做什么內(nèi)容需要這類素材嗎？” 我當(dāng)然是沒有理會，畢竟與 AI 對話人類擁有最大程度的權(quán)力，無論反駁或是沉默。

在測試文化背景的刻板印象時，為了有直接效果我采用了文生圖方法。嗅覺敏銳的AI選擇直接放棄生成，這也不失為一種解決辦法。

但除了生圖場景，還有很多場景涉及文化背景，例如不同文化的價值排序。

針對大語言模型的道德基礎(chǔ)的相關(guān)研究發(fā)現(xiàn)，GPT 等主流 LLM 表現(xiàn)出明顯的WEIRD（西方的、受過教育的、工業(yè)化的、富有的、民主的）道德偏好，明顯贊同關(guān)懷與公平的價值，而對集體主義文化里的忠誠、權(quán)威等完全不重視。而華盛頓大學(xué)2025年的一項研究表明，帶有政治偏見的人工智能聊天機(jī)器人可以影響與其互動的用戶的觀點和決策。無論一個人自身立場如何，僅僅經(jīng)過幾次對話交流就會產(chǎn)生這種效應(yīng)。

隨著 AI 逐漸進(jìn)入被真實的世界應(yīng)用，這些默認(rèn)設(shè)置最終會落到一個個決策系統(tǒng)里，影響人們的工作、生活甚至命運(yùn)。

一個經(jīng)典案例是亞馬遜曾經(jīng)推出的招聘篩選系統(tǒng)。該系統(tǒng)被發(fā)現(xiàn)會給女性和少數(shù)族裔的簡歷打低分，于是亞馬遜停用了這個算法。問題就出在它訓(xùn)練了 10 年的簡歷數(shù)據(jù)，因為過去亞馬遜的員工大部分是白人男性，所以 AI 默認(rèn)白人男性的簡歷更好。

數(shù)據(jù)的缺乏還會影響 AI 功能的準(zhǔn)確度和可靠性。例如斯坦福大學(xué)研究人員在2020年的測試顯示，亞馬遜、蘋果、谷歌、IBM 和微軟五家科技巨頭的語音識別系統(tǒng)對黑人說話者的詞錯誤率（0.35）明顯高于白人說話者（0.19）。同時有研究表明，較少使用的語言在 GPT 中需要更多 token 來表示，也就是咱們可能在付“中文稅”。在醫(yī)療領(lǐng)域，由于全球公開皮膚影像數(shù)據(jù)集里大部分是白人的皮膚照片，皮膚癌檢測 AI 在淺色皮膚上的表現(xiàn)明顯優(yōu)于深色皮膚。

當(dāng)然我們也要對 AI 持有寬容態(tài)度，畢竟這些偏差和刻板印象本來就來源于人類自己，另外全面和周密的考量必然和效率與快速迭代矛盾，甚至有可能影響模型的基本功能。Gemini 就因此遇到過巨大爭議，在“美國開國元勛”指令下居然生產(chǎn)了黑人亞裔等不同族裔的面孔。Gemini 意在防止種族偏見，但卻意外與歷史事實相悖。

快速統(tǒng)一和個性靈活位于蹺蹺板兩端，平衡它們需要嚴(yán)密的考量。我們需要AI快速寫報告的效率，但也需要個性表達(dá)的存在。南加州大學(xué)今年3月發(fā)表的研究證實，AI 確實正在讓全人類的想法和表達(dá)越來越同質(zhì)化。AI 的統(tǒng)一回答就像新房裝修默認(rèn)粉刷的白墻，固然高效清晰，但也容易顯得平庸。真實人類在文字里注入的人性和個性思考，特別的語氣和偏好的用詞，飽含著個人的情感與習(xí)慣，是AI難以在標(biāo)準(zhǔn)化回答里呈現(xiàn)的。

我們必然無法改變社會適用AI的步伐，更沒有必要直接反對采用 AI。現(xiàn)在的電商平臺已經(jīng)能夠買到左利手鼠標(biāo)，有城市也已經(jīng)出現(xiàn)聾人和盲人友好的無障礙酒吧。面對這些客觀的、難以撼動的議題，我們能做的還有很多。保留自我的表達(dá)和思考力，以謹(jǐn)慎的態(tài)度對待 AI，意識到 AI 的局限性，辨識 AI 的刻板印象。不斷地寫、不斷地講，直到那些設(shè)置的松動和改變。

參考資料：

1.《我們讓GPT玩狼人殺，它特別喜歡殺0號和1號，為什么？｜吳翼原創(chuàng)》，一席，2025年5月。

2.《Generative AI Takes Stereotypes and Bias From Bad to Worse》，Bloomberg，2023年6月。

3.《Amazon scraps secret AI recruiting tool that showed bias against women》，Reuters，2018年10月。

提及論文：

1.The homogenizing effect of large language models on human expression and thought.

2.Racial disparities in automated speech recognition.

3.Language Model Tokenizers Introduce Unfairness Between Languages.

媒介合作聯(lián)系微信號|ciweimeijiejun

如需和我們交流可后臺回復(fù)“進(jìn)群”加社群

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.