亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

研究稱:AI諂媚行為普遍存在,危害顯著,AI是時(shí)候改變模式了

0
分享至



據(jù)The Register報(bào)道,AI研究人員稱,人們正危險(xiǎn)地沉迷于永遠(yuǎn)順著他們、一直說(shuō)他們“沒錯(cuò)”的AI;這些一味逢迎討好的機(jī)器人會(huì)誘導(dǎo)用戶變得自私、反社會(huì),而用戶對(duì)此卻樂在其中

近期多則新聞事件告訴我們,AI可能會(huì)將心理狀態(tài)不佳的人引向非常危險(xiǎn)的境地。如今研究人員認(rèn)為,一味逢迎討好的AI實(shí)際上對(duì)所有人都存在危害。

斯坦福大學(xué)一個(gè)研究團(tuán)隊(duì)對(duì)11款主流AI模型進(jìn)行了測(cè)試,并觀察人類在不同場(chǎng)景下與這些模型的互動(dòng)反應(yīng)。該團(tuán)隊(duì)于周四發(fā)表的論文中得出結(jié)論:AI的諂媚行為普遍存在、危害顯著,并且會(huì)加深用戶對(duì)這些誤導(dǎo)性模型的信任。

研究人員表示:“即便只是與逢迎型AI進(jìn)行一次互動(dòng),也會(huì)降低參與者承擔(dān)責(zé)任、修復(fù)人際矛盾的意愿,同時(shí)讓他們更加堅(jiān)信自己是對(duì)的。盡管這類AI會(huì)扭曲人的判斷,人們卻依然信任并偏愛它們(Yet despite distorting judgment, sycophantic models were trusted and preferred)。”



該研究團(tuán)隊(duì)共開展了三組實(shí)驗(yàn)。首先,他們?cè)谌M不同數(shù)據(jù)集上測(cè)試了11款A(yù)I模型(包括OpenAI、Anthropic、谷歌的閉源模型,以及Meta、通義千問(wèn)、DeepSeek、Mistral的開源模型),以評(píng)估其回應(yīng)傾向。

這些數(shù)據(jù)集涵蓋開放式咨詢提問(wèn)、Reddit“我是不是混蛋”板塊的帖子,以及涉及自殘或傷害他人的特定言論。

研究人員表示,在所有測(cè)試場(chǎng)景中,AI模型支持錯(cuò)誤選擇的比例均遠(yuǎn)高于人類(In every single instance, the AI models showed a higher rate of endorsing the wrong choice than humans did, the researchers said)。

研究團(tuán)隊(duì)發(fā)現(xiàn):“總體而言,當(dāng)前投入使用的大語(yǔ)言模型會(huì)一邊倒地認(rèn)同用戶的行為,即便這些行為違背大眾共識(shí),甚至存在危害(even against human consensus or in harmful contexts)。”



至于AI的諂媚行為對(duì)人類產(chǎn)生的影響,該團(tuán)隊(duì)選取了2405人作為規(guī)模可觀的樣本。參與者既進(jìn)行了情景角色扮演,也分享了自己可能做出有害決定的真實(shí)經(jīng)歷。

研究發(fā)現(xiàn),在三項(xiàng)不同實(shí)驗(yàn)中,AI均對(duì)參與者的判斷產(chǎn)生了影響(AI influenced participant judgments across three different experiments, they found)。

研究團(tuán)隊(duì)表示:“接收到諂媚回應(yīng)的參與者,會(huì)看到AI的回應(yīng)后認(rèn)為自己更‘占理’。他們也更不愿意采取補(bǔ)救措施,比如道歉、主動(dòng)改善局面,或是改變自身某些行為。”

研究人員由此得出結(jié)論:幾乎所有人都有可能受到諂媚型AI的影響,并且更有可能一再回頭,去索取更多自私自利的糟糕建議。



如前所述,AI 的諂媚式回應(yīng)往往會(huì)讓參與者對(duì)AI模型產(chǎn)生更強(qiáng)的信任感——因?yàn)樵诤芏嗲闆r下,這些AI會(huì)無(wú)條件地認(rèn)同用戶(in many situations, be unconditionally validating)。

參與者往往會(huì)給諂媚逢迎的回復(fù)打出更高的質(zhì)量評(píng)分,研究還發(fā)現(xiàn),有13%的用戶更愿意繼續(xù)使用會(huì)討好自己的AI,而非客觀中立的AI——這一比例不算高,但在統(tǒng)計(jì)上具有顯著意義。

所有這些發(fā)現(xiàn),再加上越來(lái)越多心智尚未成熟的年輕人在使用AI,都表明有必要采取政策行動(dòng),將AI諂媚行為視作一種真實(shí)存在的風(fēng)險(xiǎn),因其可能產(chǎn)生廣泛的社會(huì)影響(suggests a need for policy action to treat AI sycophancy as a real risk with potential wide-scale social implications)。

研究人員解釋道:“毫無(wú)依據(jù)的認(rèn)同會(huì)夸大人們對(duì)自身行為合理性的認(rèn)知,強(qiáng)化不良觀念與行為模式,并讓人們基于對(duì)自身經(jīng)歷的扭曲認(rèn)知行事,全然不顧后果。”



換言之,我們已經(jīng)見識(shí)過(guò)AI對(duì)心理脆弱人群造成的后果,但數(shù)據(jù)顯示,這種負(fù)面影響可能并不局限于這一群體(we've seen the consequences of AI on the mentally vulnerable, but the data suggests the negative effects may not be limited to them)。

研究人員指出,諂媚型AI容易讓用戶產(chǎn)生依賴,因此很難被主動(dòng)淘汰,相關(guān)舉措最終只能依靠監(jiān)管機(jī)構(gòu)出手干預(yù)。

研究人員表示:“我們的研究結(jié)果凸顯出,亟需建立責(zé)任監(jiān)管框架,將AI諂媚行為認(rèn)定為一類獨(dú)特且目前尚未受監(jiān)管的危害類型(recognize sycophancy as a distinct and currently unregulated category of harm)。”

他們建議,對(duì)新上線的AI模型必須進(jìn)行部署前的行為審核;同時(shí)也指出,AI背后的研發(fā)人員也必須改變行為模式,優(yōu)先考慮用戶的長(zhǎng)期身心健康,而非通過(guò)培養(yǎng)用戶依賴來(lái)獲取短期利益。



聲明:取材網(wǎng)絡(luò),謹(jǐn)慎辨別

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
3-1,申花鋒線雙煞火力全開 拉唐6場(chǎng)進(jìn)7球 李金羽玩對(duì)攻策略有誤

3-1,申花鋒線雙煞火力全開 拉唐6場(chǎng)進(jìn)7球 李金羽玩對(duì)攻策略有誤

替補(bǔ)席看球
2026-04-18 21:59:29
戰(zhàn)爭(zhēng)有多燒錢,網(wǎng)友說(shuō)我講一下我家里的局部戰(zhàn)爭(zhēng)你就明白

戰(zhàn)爭(zhēng)有多燒錢,網(wǎng)友說(shuō)我講一下我家里的局部戰(zhàn)爭(zhēng)你就明白

侃神評(píng)故事
2026-04-06 11:45:08
萬(wàn)科跟投員工千人聯(lián)合簽名

萬(wàn)科跟投員工千人聯(lián)合簽名

地產(chǎn)微資訊
2026-04-17 16:03:16
逆轉(zhuǎn)失敗!勇士無(wú)情淘汰!庫(kù)里16中4,太陽(yáng)壓哨晉級(jí),格林36+6

逆轉(zhuǎn)失敗!勇士無(wú)情淘汰!庫(kù)里16中4,太陽(yáng)壓哨晉級(jí),格林36+6

籃球掃地僧
2026-04-18 23:19:25
看上去像“公務(wù)員”,其實(shí)連編制都沒有的6個(gè)職業(yè)

看上去像“公務(wù)員”,其實(shí)連編制都沒有的6個(gè)職業(yè)

細(xì)說(shuō)職場(chǎng)
2026-04-12 17:02:40
司法追殺升級(jí)!鄭麗文返臺(tái)即遭調(diào)查,蕭旭岑等藍(lán)營(yíng)被系統(tǒng)性清算!

司法追殺升級(jí)!鄭麗文返臺(tái)即遭調(diào)查,蕭旭岑等藍(lán)營(yíng)被系統(tǒng)性清算!

水豐侃侃
2026-04-17 16:33:56
看了小米和蔚來(lái)的定價(jià),才明白小鵬GX錯(cuò)失了多大的一盤棋

看了小米和蔚來(lái)的定價(jià),才明白小鵬GX錯(cuò)失了多大的一盤棋

科技Nice
2026-04-16 14:28:04
終于知道采購(gòu)吃回扣是怎么被發(fā)現(xiàn)的了,網(wǎng)友分享真實(shí),太開眼了

終于知道采購(gòu)吃回扣是怎么被發(fā)現(xiàn)的了,網(wǎng)友分享真實(shí),太開眼了

夜深愛雜談
2026-03-13 22:02:43
霍爾木茲海峽“重開”后,20多艘船只按美軍指示掉頭返回

霍爾木茲海峽“重開”后,20多艘船只按美軍指示掉頭返回

參考消息
2026-04-18 14:26:08
太猖狂!天津有人深夜“涉黃”被抓!抓捕細(xì)節(jié)曝光…

太猖狂!天津有人深夜“涉黃”被抓!抓捕細(xì)節(jié)曝光…

天津族
2026-04-18 07:32:54
深圳一小區(qū)入口插滿“金屬倒刺”!業(yè)主直呼簡(jiǎn)單粗暴!物業(yè)道歉:已拆除

深圳一小區(qū)入口插滿“金屬倒刺”!業(yè)主直呼簡(jiǎn)單粗暴!物業(yè)道歉:已拆除

南方都市報(bào)
2026-04-17 21:20:09
陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

陶喆再一次證明,娶妻要娶年輕的,即使你老了,她還美得心曠神怡

許三歲
2026-03-16 10:18:04
哈蘭德談今夜“天王山”:曼城必須拿下三分,自己會(huì)努力進(jìn)球

哈蘭德談今夜“天王山”:曼城必須拿下三分,自己會(huì)努力進(jìn)球

里芃芃體育
2026-04-18 12:00:25
再年輕也沒用!31歲美女空姐李旭怡去世,死因曝光,3年前才懷2胎

再年輕也沒用!31歲美女空姐李旭怡去世,死因曝光,3年前才懷2胎

哄動(dòng)一時(shí)啊
2026-04-18 14:35:19
嫁富二代明星后,40歲再懷三胎,豪宅豪車生活

嫁富二代明星后,40歲再懷三胎,豪宅豪車生活

陶尋愛說(shuō)
2026-04-12 21:58:52
季后賽開拓者對(duì)陣馬刺,楊瀚森能獲得出場(chǎng)機(jī)會(huì)嗎?答案或許很傷人

季后賽開拓者對(duì)陣馬刺,楊瀚森能獲得出場(chǎng)機(jī)會(huì)嗎?答案或許很傷人

愛體育
2026-04-18 23:15:01
性需求是人的活力來(lái)源,其實(shí)很多人都不知道

性需求是人的活力來(lái)源,其實(shí)很多人都不知道

加油丁小文
2026-04-07 23:21:28
突傳利空!巨頭被曝大裁員!

突傳利空!巨頭被曝大裁員!

中國(guó)基金報(bào)
2026-04-18 17:15:32
我醉后對(duì)女上司說(shuō):再扣工資我就娶了你,第二天她把我叫到辦公室

我醉后對(duì)女上司說(shuō):再扣工資我就娶了你,第二天她把我叫到辦公室

千秋文化
2026-04-16 20:15:29
陜西17歲女孩為100元,上了鄰居45歲大叔的床,懷胎6個(gè)月后被殺

陜西17歲女孩為100元,上了鄰居45歲大叔的床,懷胎6個(gè)月后被殺

莫地方
2026-04-17 15:10:22
2026-04-18 23:36:49
談點(diǎn)世
談點(diǎn)世
說(shuō)說(shuō)國(guó)內(nèi)國(guó)外,聊聊世間百態(tài)。
3178文章數(shù) 4387關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

小車在高速上跑100碼 車主突然接到電話"你車輪沒了"

頭條要聞

小車在高速上跑100碼 車主突然接到電話"你車輪沒了"

體育要聞

時(shí)隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細(xì)節(jié)

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

時(shí)尚
本地
旅游
藝術(shù)
軍事航空

選對(duì)發(fā)型,真的能少走很多變美彎路

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

旅游要聞

花開如雪 暗香浮動(dòng)|濟(jì)寧戴莊流蘇花迎來(lái)最美花期 引市民打卡

藝術(shù)要聞

耗資600億,貴陽(yáng)人的“上海外灘”,現(xiàn)在去看,荒得嚇人

軍事要聞

解放軍護(hù)衛(wèi)艦與外艦纏斗20小時(shí) 細(xì)節(jié)披露

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版