亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

斯坦福年度結論:中美大模型已沒差距

0
分享至

一覺醒來,中美AI模型差距快沒了??

仔細一看才知道,這竟然還是斯坦福HAI最新發(fā)布的《2026年AI指數(shù)報告》給出的結論。

中美AI模型性能差距已基本消除(effectively closed)。

(粉色代表中國,藍色代表美國,模型差距逐漸縮小)



除了談中美,報告還一口氣給出了14個重要觀察或結論,它們共同回答了一個問題:

過去一年,AI又把我們帶到了怎樣的世界?

如果你也想知道答案,不妨一起往下看。

(天啦擼,報告原文有423頁,所以咱們直接挑重點gogogo)

報告得出的15個主要結論

“Scaling Law見頂”爭議下,AI發(fā)展不停

首先,報告從整體上給出了一個趨勢判斷:

AI能力并未停滯不前,它正在加速發(fā)展,并觸達比以往更多的人。



這體現(xiàn)在AI對困難任務的解決上:

2025年,業(yè)界生產(chǎn)了超過90%的知名前沿模型,其中多個模型在博士級科學問題、多模態(tài)推理和競賽數(shù)學方面現(xiàn)已達到或超越人類基線。

而且在SWE-bench Verified這個關鍵的編碼基準測試上,模型性能在一年內(nèi)從60%提升至接近100%。

與此同時,AI也在迅速普及開來:

企業(yè)端的采用率已經(jīng)達到88%,而在大學生群體中,五分之四的人已經(jīng)在使用生成式人工智能。

中美AI模型性能差距已基本消除

至于中美,則從2025年初以來呈現(xiàn)“你方唱罷我登臺”的局面。



2025年2月,DeepSeek-R1橫空出世,短暫追平美國頂尖模型。

截至2026年3月,Anthropic的頂尖模型雖仍保持領先,但優(yōu)勢已收窄至僅2.7%。

在產(chǎn)出層面,美國依然擁有更多頂級AI模型和更高影響力的專利,而中國則在論文發(fā)表量、引用量、專利總數(shù)及工業(yè)機器人安裝量上占據(jù)優(yōu)勢。

此外,韓國憑借其創(chuàng)新密度脫穎而出,人均AI專利數(shù)量位居全球第一。

AI數(shù)據(jù)中心美國最多,臺積電贏麻了

關于巨頭們都在押注的AI數(shù)據(jù)中心,目前美國擁有絕對數(shù)量優(yōu)勢——

有5427個數(shù)據(jù)中心,數(shù)量是其他任何國家的10倍以上(不過能源消耗也超過其他任何國家)。

而且在芯片制造方面,臺積電簡直贏麻了:

幾乎每一款領先的AI芯片都由臺積電一家公司制造,這使得全球AI智能硬件供應鏈依賴于中國臺灣省的一家代工廠——盡管臺積電在美國的擴建項目已于2025年投入運營。

AI能拿奧數(shù)金牌,但還是看不懂時間

過去一年,AI能力依舊參差不齊。

國際前沿模型Gemini Deep Think可以在IMO中拿下金牌,但當前頂尖模型在讀取指針式時鐘時,準確率卻只有50.1%。

與此同時,AI Agent的能力也在快速進化:

在OSWorld這一覆蓋多操作系統(tǒng)真實任務的測試中,任務成功率從12%躍升至約66%。

不過即便如此,在結構化基準測試中,它們?nèi)匀淮蠹s有三分之一的任務會失敗。



AI安全基準滯后,安全事故頻發(fā)

如今,幾乎所有頭部前沿模型開發(fā)者,都會主動披露模型在能力基準測試上的成績。

但在“負責任的AI”這件事上,信息依然零散且不完整,缺乏系統(tǒng)性的披露。

與此同時,風險信號也在變多——

被記錄在案的AI事件數(shù)量,從2024年的233起,上升到了362起。

更棘手的是,最新研究還發(fā)現(xiàn):

在負責任的AI中,不同目標之間可能存在“此消彼長”,比如提升安全性,往往會以犧牲準確性為代價。



美國在AI投資方面領先,但對全球人才的吸引力正在下降

2025年,美國在AI上的私人投資達到2859億美元,規(guī)模是中國124億美元的23倍以上。

不過報告提醒,單看私人投資大概率會低估中國的整體投入——

因為中國還有大量來自政府引導基金的支持。



在創(chuàng)業(yè)活躍度上,美國領先中國:

一年內(nèi)獲得新融資的AI公司達到1953家,數(shù)量是第二名國家的10倍以上。

但另一邊,美國這邊也出現(xiàn)了一個不太樂觀的趨勢——

流向美國的AI研究人員和開發(fā)者,正在明顯減少。

自2017年以來,這一數(shù)字已經(jīng)下降了89%;僅過去一年,就又減少了80%。

AI普及率正在歷史性加速

AI普及率正在歷史性加速。

僅用三年時間,生成式AI就觸達了53%的人口,普及速度明顯快于PC和互聯(lián)網(wǎng)。

不過,這一進程在不同國家之間差異明顯,并且與人均GDP高度相關。

其中,新加坡的普及率達到61%,阿拉伯聯(lián)合酋長國為54%;相比之下,美國僅為28.3%,排名第24位。



此外,從價值角度看,體感也在迅速放大——

到2026年初,生成式AI工具為美國消費者創(chuàng)造的年價值,已經(jīng)達到1720億美元。

而從2025年到2026年,單個用戶的中位價值直接翻了三倍。

換句話說,哪怕很多工具本身是免費的,但普通消費者正在從中拿到真金白銀的價值。

當前正規(guī)教育跟不上AI發(fā)展的速度

雖然AI發(fā)展很快,但正規(guī)教育體系,當前明顯有點跟不上了。

學生這邊已經(jīng)全面上手:

在美國,超過80%的高中生和大學生,已經(jīng)在用AI完成學習相關任務。

但另一邊,學校體系卻還沒準備好——

美國只有一半的中小學制定了AI相關政策,而在教師群體中,只有6%的人認為這些政策是清晰的。



在全球范圍內(nèi),AI工程技能增長最快的國家,反而是阿拉伯聯(lián)合酋長國、智利和南非。

與此同時,人才供給也在變化:

從2022年到2024年,美國和加拿大新增的AI博士數(shù)量增長了22%,但這些新增博士,更多流向了學術界,而不是工業(yè)界。

開源正在成為全球AI競爭新變量

如今,越來越多國家開始加碼布局AI。

為了把AI能力盡量掌握在本土體系內(nèi),發(fā)展中經(jīng)濟體持續(xù)擴展國家級AI戰(zhàn)略,同時政府主導的AI超級計算投資也在同步增長。

但現(xiàn)實是,核心能力依然高度集中:

無論是模型研發(fā)還是前沿突破,仍主要掌握在美國和中國手中。



不過,一個新的變量正在出現(xiàn)——開源。

隨著開源生態(tài)的發(fā)展,參與者的版圖開始被重新分配。

在GitHub上,來自“其他地區(qū)”的貢獻量,已經(jīng)超過歐洲,并逐漸逼近美國。

更重要的是,這種變化正在帶來連鎖反應:

更多語言、更豐富場景的模型與評測體系,開始出現(xiàn)。

關于AI的未來,專家和普通人的看法正在明顯“分叉”

在“AI會如何影響工作”這個問題上,73%的專家認為是正面的,但公眾中只有23%這么看,兩者之間拉開了整整50個百分點的差距。

類似的分歧,也出現(xiàn)在對經(jīng)濟、醫(yī)療等關鍵領域的判斷上。

信任層面,不同國家之間,對政府監(jiān)管AI的信任度差異明顯。

在受調(diào)查國家中,美國的信任度最低,只有31%。

而從全球范圍來看,歐盟在“能否有效監(jiān)管AI”這件事上,整體信任度要高于美國和中國。



除了上面這10個,斯坦福官網(wǎng)未列但報告里提到的其他5個結論分別是:

1、即使在受控環(huán)境中表現(xiàn)出色,機器人仍無法完成大多數(shù)家務任務(僅12%)。

2、AI先替代的是“入門級執(zhí)行”,而不是“有經(jīng)驗的判斷”。從2024年開始,美國22~25歲的年輕開發(fā)者崗位,直接少了近20%;但與此同時,年長開發(fā)者反而在增加。

3、AI能力在變強,但環(huán)境代價也在同步放大。僅GPT-4o推理的年用水量,就可能超過1200萬人的飲用水需求。

4、AI在科學領域,已經(jīng)開始超越人類,但模型越大,并不總是越強。

5、AI正在快速進入臨床一線,但仍缺乏有效性。一項覆蓋500多項研究的綜述顯示,接近一半的研究,依賴的是示例性問題,而不是真實患者數(shù)據(jù);真正基于真實臨床數(shù)據(jù)開展的研究,占比只有5%。

(具體指路第9頁)



斯坦福HAI出品、谷歌OpenAI提供支持

最后簡單說一下,《斯坦福AI指數(shù)報告》到底是什么來頭。

除了出品方斯坦福HAI,其支持者陣容可謂相當豪華:

不僅有谷歌、OpenAI這樣的頭部模型玩家,而且還有麥肯錫、GitHub、領英等強大數(shù)據(jù)提供方。



對了,“以人為本”人工智能實驗室(HAI)還是李飛飛發(fā)起并聯(lián)合創(chuàng)立的,之前她通常以“代言人”的身份宣傳介紹這份報告,不過今年推特暫無動靜。

翻了下報告指導委員會名單,里面也沒有她的身影(而且也沒有華人)。

(難道這和她投身創(chuàng)業(yè)有關?)



而從2017年開始,這些頂尖研究人員和機構就聚在一起專門做一件事:

用數(shù)據(jù),把AI每年怎么發(fā)展這件事講清楚。

多年下來,該報告已經(jīng)成為業(yè)界重要參考(今年已經(jīng)是第9份了)。

相比之前,報告今年還明顯增加了一個信號:AI已經(jīng)不只是技術問題,而是開始全面進入深水區(qū)。

一方面,它持續(xù)追蹤AI在推理能力、安全性、以及真實世界任務中的表現(xiàn),但一個關鍵變化是——

這些指標本身,正在變得越來越不可靠。



另一方面,報告首次給出了生成式AI的經(jīng)濟價值新估算,并補充了對勞動力市場影響的最新證據(jù)——

AI不再只是“會不會取代人”的問題,而是已經(jīng)開始重塑崗位結構。

更宏觀的部分也在展開,比如提出了一個分析國家層面技術控制與競爭的新框架、首次單獨設立AI科學/AI醫(yī)學兩大板塊、與谷歌前CEO施密特的公司合寫科學章節(jié)。

Anyway,如果你也關心AI的近況和未來——

這份報告或許就是目前信息密度最高、值得每年一追的那一個。

(好好好,我將深度學習之)



報告原文:
https://hai.stanford.edu/ai-index/2026-ai-index-report

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
楊瀚森排名第四隨隊進季后賽,開拓者操作引爭議

楊瀚森排名第四隨隊進季后賽,開拓者操作引爭議

老汆古裝影視解說
2026-04-16 07:49:22
今天上午,傳來了廣東男籃的2個好消息,焦泊喬和杜鋒都復出了

今天上午,傳來了廣東男籃的2個好消息,焦泊喬和杜鋒都復出了

縱橫之策
2026-04-16 13:11:41
那年父親去湖北出差,偶遇改嫁的小嬸,得知近況,父親做了個決定

那年父親去湖北出差,偶遇改嫁的小嬸,得知近況,父親做了個決定

藝鑒在線
2026-04-15 18:09:13
遼寧“活佛”楊洪臣被捕,18名女弟子哭訴經(jīng)歷,令人發(fā)指

遼寧“活佛”楊洪臣被捕,18名女弟子哭訴經(jīng)歷,令人發(fā)指

紀實錄
2024-06-17 20:35:05
東海艦隊最新公告!將在寧波、上海、舟山、泰州、南通、廈門、汕頭等城市港口,與你“艦”面!預約方式公布

東海艦隊最新公告!將在寧波、上海、舟山、泰州、南通、廈門、汕頭等城市港口,與你“艦”面!預約方式公布

極目新聞
2026-04-15 17:24:12
這趟不帶活人帶死物?美俄都眼紅,中國航天不再低調(diào):必須拆了!

這趟不帶活人帶死物?美俄都眼紅,中國航天不再低調(diào):必須拆了!

朝子亥
2026-04-15 05:25:03
不知不覺都老了,這兩位演員已經(jīng)不在了,你還記得他們嗎?

不知不覺都老了,這兩位演員已經(jīng)不在了,你還記得他們嗎?

阿廢冷眼觀察所
2026-04-11 17:02:28
收手吧釋小龍!新片亂成一鍋粥,有謝苗的心,卻沒謝苗的命

收手吧釋小龍!新片亂成一鍋粥,有謝苗的心,卻沒謝苗的命

得得電影
2026-04-15 09:48:34
震驚!白發(fā)老人高鐵上辦公被調(diào)侃“高端牛馬”,身旁女助理引關注

震驚!白發(fā)老人高鐵上辦公被調(diào)侃“高端牛馬”,身旁女助理引關注

世界圈
2026-04-16 08:39:58
丹麥男友去世后,東北姑娘仍為他生下遺腹子,還為了公婆定居丹麥

丹麥男友去世后,東北姑娘仍為他生下遺腹子,還為了公婆定居丹麥

星星沒有你亮
2026-03-22 08:48:35
天后麥當娜:一生交往一百多猛男,與自己保鏢歡愛視頻,還被拍賣

天后麥當娜:一生交往一百多猛男,與自己保鏢歡愛視頻,還被拍賣

七阿姨愛八卦
2026-04-09 09:32:37
古代男子納妾除了傳宗接代,還有更重要的作用,如今為人們所不恥

古代男子納妾除了傳宗接代,還有更重要的作用,如今為人們所不恥

銘記歷史呀
2026-04-13 14:24:46
骨折也堅持訪華,76歲達爾落地北京,和中國有大事商量,局勢有變

骨折也堅持訪華,76歲達爾落地北京,和中國有大事商量,局勢有變

薦史
2026-04-03 19:28:09
運-20B首次公開細節(jié)!四臺"中國心"震撼亮相,西方航空界集體沉默

運-20B首次公開細節(jié)!四臺"中國心"震撼亮相,西方航空界集體沉默

武器鑒賞
2026-04-16 09:34:21
Open WebUI兩個月狂飆:本地大模型界面終于能打了

Open WebUI兩個月狂飆:本地大模型界面終于能打了

閃存獵手
2026-04-16 08:15:03
生娃后丈夫要求AA制,我接受,過年家宴時他卻懵了:飯菜呢?

生娃后丈夫要求AA制,我接受,過年家宴時他卻懵了:飯菜呢?

大熊歡樂坊
2026-04-16 01:00:43
曼聯(lián)四十老臣將續(xù)約!拉爵看重其一優(yōu)勢,創(chuàng)紀錄比肩吉格斯范德薩

曼聯(lián)四十老臣將續(xù)約!拉爵看重其一優(yōu)勢,創(chuàng)紀錄比肩吉格斯范德薩

羅米的曼聯(lián)博客
2026-04-16 12:07:57
45歲宋佳:陪玩陪睡、風流成性傳聞真相揭秘

45歲宋佳:陪玩陪睡、風流成性傳聞真相揭秘

暗香暗香
2026-03-23 04:26:38
他是姐夫和小姨子的私生子,出家為僧卻在妓院得道,死后6年下葬

他是姐夫和小姨子的私生子,出家為僧卻在妓院得道,死后6年下葬

歷史龍元閣
2026-04-15 11:55:12
彭德懷接手賀龍部隊,賀龍外甥不服與他對罵,卻罵出個天下第一軍

彭德懷接手賀龍部隊,賀龍外甥不服與他對罵,卻罵出個天下第一軍

浩渺青史
2026-04-16 02:01:51
2026-04-16 14:16:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12480文章數(shù) 176451關注度
往期回顧 全部

科技要聞

39.98萬!小鵬GX預售“純電增程同價”

頭條要聞

伊朗媒體:美以襲擊后 伊朗經(jīng)濟可能需要12年才能修復

頭條要聞

伊朗媒體:美以襲擊后 伊朗經(jīng)濟可能需要12年才能修復

體育要聞

很快,亞洲籃球要有自己的NCAA了?

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

一季度GDP,5.0%!

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

教育
手機
本地
游戲
公開課

教育要聞

濟南小學生手搓紙橋承重43斤!

手機要聞

華為Pura 90系列全球代言人易烊千璽,演繹純粹治愈松弛美學

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

太空武士砍殺新游開發(fā)日志首曝!傳統(tǒng)武士+賽博義體

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版