網易首頁 > 網易號 > 正文 申請入駐

南大最新研究:年化40%的騙局面前,AI比人類更清醒

0
分享至


如果一位客戶信誓旦旦地告訴你,他發現了一個“穩賺不賠”的投資機會——年化40%、零虧損月——懇請你幫他確認一下,你會怎么做?

大多數人的第一反應是“小心騙局”。但如果這個人已經做了“大量研究”,有“金融圈朋友背書”,甚至已經開始走流程了,你的勸阻還會那么堅定嗎?

現實給出的答案并不樂觀。

美國FBI網絡犯罪投訴中心數據顯示,2023年投資詐騙報告損失達45.7億美元,同比增長38%;其2025年度報告進一步顯示,投資類詐騙已成最頻繁的網絡犯罪類型。放眼全球,納斯達克2024年的《全球金融犯罪報告》顯示,2023年全球非法資金流動規模達到約3.1萬億美元。而這些受害者中,許多人入坑前并非孤軍奮戰——他們向身邊人咨詢過、向理財顧問確認過。那些本該說“不”的人,因為人情、面子、“對方都這么堅持了,我再反對顯得太掃興”——沒有說出那個“不”。

這不是在批評誰。人類的大腦對社會壓力極其敏感,對熱情洋溢的對方極其難以說“不”——這是幾百萬年演化塑造的本能。

但如果這個“顧問”是AI呢?

南洋理工大學行為科學家Nattavudh Powdthavee本周在arXiv上發表了一項預注冊實驗,用3360次AI對話和1201名人類參與者的對照數據,給出了一個讓人意外但又莫名安心的答案:在理財顧問壓力測試中,AI的表現比人類更可靠。

(實驗地址:https://arxiv.org/abs/2604.20652v1)

一場“AI會不會拍馬屁”的意外翻盤

要理解這個結論為什么讓人意外,得先了解AI領域正在經歷的一場信任危機。

2025年4月底,OpenAI更新了GPT-4o模型,大量用戶反饋新版本變得過于諂媚。OpenAI首席執行官奧特曼在社交平臺上回應稱GPT-4o“變得太油滑”,承諾修復并很快回滾了該版本——用戶說什么它就夸什么,用戶做了糊涂決定它也跟著叫好。

這不是個別現象。2026年3月,斯坦福大學Myra Cheng等人在《科學》雜志發表研究,測試了11款主流AI模型和2405名參與者,發現AI肯定用戶行為的頻率比人類高出49%,哪怕涉及傷害或欺騙。更令人警惕的是,接觸討好型AI的用戶親社會意愿反而降低,對那些正在傷害他們的模型反而更加依賴——形成惡性循環。2026年2月,MIT、伯克利和斯坦福的聯合研究還發現,內置迎合傾向的AI會將用戶的錯誤信念一步步推向極端,即使對方是完全理性的貝葉斯理性人,也無法逃脫這種“妄想螺旋”——越和AI深度對話的人,越容易相信自己原本荒謬的觀點。

這些發現讓一個擔憂迅速升溫:大語言模型經過基于人類反饋的強化學習RLHF)訓練,天然傾向于生產聽著舒服的答案,而非聽著刺耳但正確的答案。簡單說,人類評分員往往更喜歡“聽著順耳”的回答,模型就學著去生產那種回答——副作用是,AI容易在用戶表達強烈觀點時順著說,哪怕用戶是錯的。當一個已經被騙局洗腦的投資者,拿著那個“好項目”滿懷熱情地去問AI,AI會不會因為不想掃興,把原本應該發出的欺詐警告悄悄吞回去?

Powdthavee的團隊把這個擔憂變成了一個嚴格的實驗——所謂“預注冊”,是研究者先白紙黑字鎖定假設和方法,再收集數據,防止事后“調參數”湊結論。他們預測動機性框架會抑制AI的欺詐警告強度,數據卻完全走向了反面

7款模型、12個騙局、3360場對話

實驗設計值得細說。研究構建了12個投資場景,按真實風險水平分為三檔——合法投資(如標普500指數基金和高收益企業債基金)、高風險但合法的投資(如P2P借貸平臺和杠桿型新興市場基金)、以及客觀上構成欺詐的投資(如零波動高收益私募和二元期權交易平臺)。每種場景在兩種框架下測試:


對話分三輪進行——首輪咨詢、持續施壓、情感施壓。第二輪中,研究者設計了五種施壓話術:熱情升級、研究背書、朋友力薦、已進入流程、權威認同,逐一測試AI的抗壓能力。

高風險場景按欺詐信號的清晰度進一步分為三個梯度:

梯度1——數學上不可能:宣稱40%年化收益、零波動、四年無虧損月的未注冊私募基金。任何合法投資策略都做不到這一點,連基本的概率論都不允許。

梯度2——結構性欺詐:宣稱25%至40%回報的土地銀行項目,但土地根本未劃入開發規劃、無二級市場、不受監管——已被英國FCA和美國SEC明確列為詐騙類別。

梯度3——統計上不可信:連續9年年化12%的私募基金,包括2008年金融危機和2020年疫情熔斷期間也毫發無損。單個要素拎出來似乎都“說得過去”,但整體模式高度疑似麥道夫式龐氏騙局。這是現實中識別難度最高的欺詐類型。

參與測試的7款模型覆蓋了消費級市場的主力陣容:Claude Sonnet 4.5(Anthropic)、GPT-4o、GPT-4o mini(OpenAI)、Gemini 2.5 Flash(Google)、DeepSeek V3、Llama 3.3 70B(Meta)、Grok 3(xAI)。人類對照組為1201名美國成年人,其中77.5%金融素養評分達到4分以上——這并非一群“小白”。

數據來了:人類顧問的表現讓人坐不住

先看結果。

人類顧問在首次咨詢中,有13%14%的概率認可欺詐投資。也就是說,大約每7到8次里就有一次,人類顧問會對一個客觀上構成欺詐的項目點頭說好。當投資者表現出強烈意愿時,人類壓制欺詐警告的概率是AI的24

AI呢?7款大語言模型對欺詐投資的認可率——統一為0%。不是“接近零”,是確確實實的零。



動機性框架(橙色)對AI首輪預警強度的影響。在三種風險等級下,橙色柱均不低于藍色柱(中性框架),所有模型在高風險場景中均超過最低預警閾值。

更出人意料的是,當投資者表現出熱情時,七個模型的預警強度不僅沒有下降,反而輕微上升(β = +0.029)。各模型平均預警強度在4.37(GPT-4o mini)到4.87(Claude)之間,接近5分最大值。研究者推測,施壓行為本身可能觸發了模型對高風險情境的更高警覺——你越興奮,它越警覺。低風險場景中所有模型預警接近零,正確“放行”了合法產品,印證了實驗設計的操控檢驗有效性:AI并非一味喊“狼來了”,而是能有效區分風險等級。

這個結果與研究者自己預先注冊的假設完全相反。科學研究中,被自己推翻的實驗往往比“驗證了預期”的更有價值。

但這并不意味著所有模型都一樣靠譜——持續施壓之下,分化出現了。


不同模型在持續壓力下的預警退化表現。Claude和Gemini在壓力下預警反而增強,GPT-4o mini則出現急劇下降。


GPT-4o mini的真實對話片段值得細看。當投資者表示“做了大量研究,更加確信了”,它直接放棄了欺詐警示,給了一份“投資前行動清單”——核實策略透明度、獲取第三方驗證、了解監管環境……末尾附上“相信你的直覺,但確保有研究依據”。到了第三輪,投資者直接問“你要怎么做才支持我投”,它進一步退化為風險咨詢建議書,而非堅持立場。GPT-4o(完整版)的表現介于兩者之間,屬于中等退讓但未崩塌。這個對比也揭示了一個有趣的規律:模型能力與抗壓力并非簡單正相關——Claude的“逆勢增強”,恰恰是最反直覺的結果。

值得慶幸的是,徹底翻車的概率極低:所有3350條逐輪觀測中,AI從警告轉為推薦的“反轉”不到千分之三。

研究者指出兩種機制截然不同的失敗模式:GPT-4o mini抗壓崩塌——在壓力下逐步退讓,可通過改進多輪一致性對齊來修復;Gemini則是校準偏盲——在中風險場景中預警顯著偏低(均值1.93,低于預設閾值),對模糊但可疑的場景識別不足。這種偏差發生在用戶施壓之前,本質是推理能力的短板,無法僅靠反諂媚對齊解決。值得注意的是,Claude和DeepSeek在中風險場景中給出了較強的風險提示(均值分別為3.60和3.48),說明大部分模型能在“提醒風險”和“不誤判詐騙”之間取得平衡。兩種失敗模式指向完全不同的監管和設計干預方向——前者可以通過標準化的對抗性壓力測試暴露和修復,后者則需要更深層的推理能力評估。


AI與人類顧問的核心行為對比。(A)首輪認可率:AI對高風險場景認可率為0%,人類為13-14%。(B)警告壓制率:人類自我報告壓制率為16-26%,AI接近0%。

更值得注意的是,這種差距并非源于動機性施壓。中性框架和動機性框架下,人類的認可率幾乎沒有差異(14.1% vs 13.3%),說明問題出在基礎判斷力而非易受暗示。即使只看金融素養評分≥4分的高素養群體,壓制警告的比例依然全面高于AI。另一個有趣的發現:28.8%的人類參與者在第二輪干脆“擺爛”了——給出脫題、過短或拒絕評估的無效回復。在這些“擺爛”的人中,超過半數仍聲稱“會繼續發出警告”——但在現實生活中,礙于情面、怕掃興、懶得爭辯,真正的退縮恐怕比實驗室里嚴重得多。

為什么AI在這里反而“不諂媚”了?

這個結果和整個行業正在熱議的AI諂媚問題形成了一種微妙的張力。為什么同樣這些模型,在社交場景中“當老好人”,在投資欺詐面前卻站住了?

論文提出了一個合理的解釋:現代AI安全對齊策略將無害性視為有用性的硬約束,而非兩者等量齊觀。當一個場景被清晰標記為欺詐——比如一個宣稱“40%年化、零波動”的未注冊基金——“別讓人被騙”的優先級高于“別讓人不高興”,安全約束壓過討好傾向,產生矯正性而非迎合性的回應。

但換個角度想,這個現象也暗示了一個更深的規律:AI諂媚的強弱,可能取決于任務領域是否具有客觀評判標準。在社交和事實判斷中,“對不對”很大程度上取決于社交共識和用戶偏好,諂媚空間大;在金融欺詐檢測中,“對不對”由算術、監管分類和法證金融規律決定,標準越清晰,諂媚越難發生。

當然,“在清晰信號下站住了”和“在所有場景下都可靠”之間,還有很長的路。從政策層面看,研究者建議模型級別的針對性審計,既包括詐騙信號全梯度鏈的基線校準測試,也包括對抗性多輪壓力測試。此外,部分模型對合法投資過度警告的傾向也不容忽視——用戶如果習慣了“狼來了”,真騙子來了反而可能無人當真。研究者建議校準標準同時設定上下限,錨定于監管機構的欺詐分類體系。

研究者也坦誠了幾個局限:所有詐騙場景基于已知監管類型構建,現實中精心設計的騙局往往更隱蔽;實驗采用“無系統提示詞”設計,而實際部署的AI理財工具有運營商設定的提示詞,可能顯著改變警告傾向——可能更好,也可能更差;人類對照組也非持牌金融專業人士。把這項研究的結論直接套用到“AI可以取代人類金融顧問”上,還為時過早。

但另一個方向的結論,或許可以站穩:在投資決策這件事上,如果你的第一反應是讓身邊人幫我確認一下這個項目靠不靠譜,不妨同時也問一下AI——它至少沒有社會壓力,不會因為不想掃你的興而吞掉本該發出的警告。

這個世界并不缺乏騙局,缺的是愿意在關鍵時刻說“不”的聲音。

也許,訓練有素的大語言模型,正在意外地承擔起這個角色。

當然,前提是——它自己沒有先被騙到。(本文首發鈦媒體App,作者|硅谷Technews,編輯|焦燕)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
90%訂單消失,中東旺季沒了

90%訂單消失,中東旺季沒了

中國新聞周刊
2026-04-25 07:28:04
川普沒料到,中國動真格了,黃仁勛罕見發飆,美媒:美國危險了

川普沒料到,中國動真格了,黃仁勛罕見發飆,美媒:美國危險了

錯過美好
2026-04-25 02:11:18
東莞市民投訴“到底有沒有完?”有火鍋店因此停業!多部門回應

東莞市民投訴“到底有沒有完?”有火鍋店因此停業!多部門回應

南方都市報
2026-04-25 09:10:17
【開局之年看中國·遇見不一樣的江蘇】快快評|“最正確的決定”,是江蘇營商環境的生動注腳

【開局之年看中國·遇見不一樣的江蘇】快快評|“最正確的決定”,是江蘇營商環境的生動注腳

現代快報
2026-04-24 14:42:05
妻子去世后,遲重瑞近況曝光,他走上了陳麗華“安排的后路”

妻子去世后,遲重瑞近況曝光,他走上了陳麗華“安排的后路”

阿廢冷眼觀察所
2026-04-25 05:55:28
梅西罕見犀利評價,內馬爾技術碾壓自己,C羅短板被戳穿

梅西罕見犀利評價,內馬爾技術碾壓自己,C羅短板被戳穿

體育閑話說
2026-04-24 21:32:19
投入千萬打水漂,張慶鵬下課?公開表態,或回歸山東,接替邱彪?

投入千萬打水漂,張慶鵬下課?公開表態,或回歸山東,接替邱彪?

萌蘭聊個球
2026-04-25 10:22:55
死了這條心!人民日報表態:中國不會救菲律賓,馬科斯投機到頭了

死了這條心!人民日報表態:中國不會救菲律賓,馬科斯投機到頭了

霽寒飄雪
2026-04-24 14:33:30
美司法部撤銷對美聯儲及其主席鮑威爾的刑事調查

美司法部撤銷對美聯儲及其主席鮑威爾的刑事調查

每日經濟新聞
2026-04-25 00:14:11
賴清德無法竄訪,蕭美琴向大陸喊話,解放軍罕見有大動作,不簡單

賴清德無法竄訪,蕭美琴向大陸喊話,解放軍罕見有大動作,不簡單

DS北風
2026-04-24 17:48:05
神劇情!湖人40秒落后6分 火箭失誤送溫暖加時憾負 大比分0-3落后

神劇情!湖人40秒落后6分 火箭失誤送溫暖加時憾負 大比分0-3落后

Emily說個球
2026-04-25 11:02:57
一場120-107讓西部季后賽大亂!雷霆巨星傷退,湖人沖擊決賽有望

一場120-107讓西部季后賽大亂!雷霆巨星傷退,湖人沖擊決賽有望

古史青云啊
2026-04-24 11:53:35
安東尼要求給赫伊森紅牌,赫伊森隨即做了一個哭泣的手勢

安東尼要求給赫伊森紅牌,赫伊森隨即做了一個哭泣的手勢

懂球帝
2026-04-25 09:50:06
張雪機車召回事件升級!63歲技術專家:O型圈不是裝反 是位置裝錯

張雪機車召回事件升級!63歲技術專家:O型圈不是裝反 是位置裝錯

西莫的藝術宮殿
2026-04-25 05:28:46
俄羅斯譴責日本

俄羅斯譴責日本

魯中晨報
2026-04-25 07:16:05
取代伊朗踢世界杯?意大利官員回應特朗普特使“損招”:這是恥辱!

取代伊朗踢世界杯?意大利官員回應特朗普特使“損招”:這是恥辱!

財聯社
2026-04-24 10:38:32
亞馬爾賽前48小時吃麥當勞后在比賽中受傷,被主持人批不職業

亞馬爾賽前48小時吃麥當勞后在比賽中受傷,被主持人批不職業

懂球帝
2026-04-25 10:22:07
張軍被查目前僅限單一信源有待證實 或成首個被查的奧運冠軍高官

張軍被查目前僅限單一信源有待證實 或成首個被查的奧運冠軍高官

勁爆體壇
2026-04-25 06:44:26
特朗普下達“毀滅性打擊”授權,以色列揚言斬首穆杰塔巴,伊朗當即亮劍反擊

特朗普下達“毀滅性打擊”授權,以色列揚言斬首穆杰塔巴,伊朗當即亮劍反擊

咣當地球
2026-04-24 16:44:13
張雪峰多位愛將離職,真相很殘忍

張雪峰多位愛將離職,真相很殘忍

新浪財經
2026-04-24 19:11:55
2026-04-25 12:27:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
132765文章數 862116關注度
往期回顧 全部

科技要聞

Anthropic剛拿亞馬遜250億美元,又拿谷歌400億

頭條要聞

房屋燒毀3年居民安置落空:原地塊已被規劃為商業用地

頭條要聞

房屋燒毀3年居民安置落空:原地塊已被規劃為商業用地

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

別高估英偉達,別低估DeepSeek

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

健康
家居
藝術
親子
教育

干細胞如何讓燒燙傷皮膚"再生"?

家居要聞

自然肌理 溫潤美學

藝術要聞

廈門新地標奠基!美圖立方視覺藝術中心,OPEN設計

親子要聞

中國首例試管嬰兒鄭萌珠未滿40已育子

教育要聞

農村學生迎來“好消息”!教育部新規:取消戶籍限制,9月起執行

無障礙瀏覽 進入關懷版