亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

斯坦福年度結(jié)論:中美大模型已沒差距

0
分享至

一覺醒來,中美AI模型差距快沒了??

仔細一看才知道,這竟然還是斯坦福HAI最新發(fā)布的《2026年AI指數(shù)報告》給出的結(jié)論。

中美AI模型性能差距已基本消除(effectively closed)。

(粉色代表中國,藍色代表美國,模型差距逐漸縮小)



除了談中美,報告還一口氣給出了14個重要觀察或結(jié)論,它們共同回答了一個問題:

過去一年,AI又把我們帶到了怎樣的世界?

如果你也想知道答案,不妨一起往下看。

(天啦擼,報告原文有423頁,所以咱們直接挑重點gogogo)

報告得出的15個主要結(jié)論

“Scaling Law見頂”爭議下,AI發(fā)展不停

首先,報告從整體上給出了一個趨勢判斷:

AI能力并未停滯不前,它正在加速發(fā)展,并觸達比以往更多的人



這體現(xiàn)在AI對困難任務(wù)的解決上:

2025年,業(yè)界生產(chǎn)了超過90%的知名前沿模型,其中多個模型在博士級科學(xué)問題、多模態(tài)推理和競賽數(shù)學(xué)方面現(xiàn)已達到或超越人類基線。

而且在SWE-bench Verified這個關(guān)鍵的編碼基準測試上,模型性能在一年內(nèi)從60%提升至接近100%。

與此同時,AI也在迅速普及開來:

企業(yè)端的采用率已經(jīng)達到88%,而在大學(xué)生群體中,五分之四的人已經(jīng)在使用生成式人工智能。

中美AI模型性能差距已基本消除

至于中美,則從2025年初以來呈現(xiàn)“你方唱罷我登臺”的局面。



2025年2月,DeepSeek-R1橫空出世,短暫追平美國頂尖模型。

截至2026年3月,Anthropic的頂尖模型雖仍保持領(lǐng)先,但優(yōu)勢已收窄至僅2.7%

在產(chǎn)出層面,美國依然擁有更多頂級AI模型和更高影響力的專利,而中國則在論文發(fā)表量、引用量、專利總數(shù)及工業(yè)機器人安裝量上占據(jù)優(yōu)勢。

此外,韓國憑借其創(chuàng)新密度脫穎而出,人均AI專利數(shù)量位居全球第一。

AI數(shù)據(jù)中心美國最多,臺積電贏麻了

關(guān)于巨頭們都在押注的AI數(shù)據(jù)中心,目前美國擁有絕對數(shù)量優(yōu)勢——

有5427個數(shù)據(jù)中心,數(shù)量是其他任何國家的10倍以上(不過能源消耗也超過其他任何國家)。

而且在芯片制造方面,臺積電簡直贏麻了:

幾乎每一款領(lǐng)先的AI芯片都由臺積電一家公司制造,這使得全球AI智能硬件供應(yīng)鏈依賴于中國臺灣省的一家代工廠——盡管臺積電在美國的擴建項目已于2025年投入運營。

AI能拿奧數(shù)金牌,但還是看不懂時間

過去一年,AI能力依舊參差不齊。

國際前沿模型Gemini Deep Think可以在IMO中拿下金牌,但當前頂尖模型在讀取指針式時鐘時,準確率卻只有50.1%。

與此同時,AI Agent的能力也在快速進化:

在OSWorld這一覆蓋多操作系統(tǒng)真實任務(wù)的測試中,任務(wù)成功率從12%躍升至約66%。

不過即便如此,在結(jié)構(gòu)化基準測試中,它們?nèi)匀淮蠹s有三分之一的任務(wù)會失敗。



AI安全基準滯后,安全事故頻發(fā)

如今,幾乎所有頭部前沿模型開發(fā)者,都會主動披露模型在能力基準測試上的成績。

但在“負責任的AI”這件事上,信息依然零散且不完整,缺乏系統(tǒng)性的披露。

與此同時,風險信號也在變多——

被記錄在案的AI事件數(shù)量,從2024年的233起,上升到了362起。

更棘手的是,最新研究還發(fā)現(xiàn):

在負責任的AI中,不同目標之間可能存在“此消彼長”,比如提升安全性,往往會以犧牲準確性為代價。



美國在AI投資方面領(lǐng)先,但對全球人才的吸引力正在下降

2025年,美國在AI上的私人投資達到2859億美元,規(guī)模是中國124億美元的23倍以上。

不過報告提醒,單看私人投資大概率會低估中國的整體投入——

因為中國還有大量來自政府引導(dǎo)基金的支持。



在創(chuàng)業(yè)活躍度上,美國領(lǐng)先中國:

一年內(nèi)獲得新融資的AI公司達到1953家,數(shù)量是第二名國家的10倍以上。

但另一邊,美國這邊也出現(xiàn)了一個不太樂觀的趨勢——

流向美國的AI研究人員和開發(fā)者,正在明顯減少。

自2017年以來,這一數(shù)字已經(jīng)下降了89%;僅過去一年,就又減少了80%。

AI普及率正在歷史性加速

AI普及率正在歷史性加速。

僅用三年時間,生成式AI就觸達了53%的人口,普及速度明顯快于PC和互聯(lián)網(wǎng)

不過,這一進程在不同國家之間差異明顯,并且與人均GDP高度相關(guān)。

其中,新加坡的普及率達到61%,阿拉伯聯(lián)合酋長國為54%;相比之下,美國僅為28.3%,排名第24位。



此外,從價值角度看,體感也在迅速放大——

到2026年初,生成式AI工具為美國消費者創(chuàng)造的年價值,已經(jīng)達到1720億美元。

而從2025年到2026年,單個用戶的中位價值直接翻了三倍。

換句話說,哪怕很多工具本身是免費的,但普通消費者正在從中拿到真金白銀的價值。

當前正規(guī)教育跟不上AI發(fā)展的速度

雖然AI發(fā)展很快,但正規(guī)教育體系,當前明顯有點跟不上了。

學(xué)生這邊已經(jīng)全面上手:

在美國,超過80%的高中生和大學(xué)生,已經(jīng)在用AI完成學(xué)習(xí)相關(guān)任務(wù)。

但另一邊,學(xué)校體系卻還沒準備好——

美國只有一半的中小學(xué)制定了AI相關(guān)政策,而在教師群體中,只有6%的人認為這些政策是清晰的。



在全球范圍內(nèi),AI工程技能增長最快的國家,反而是阿拉伯聯(lián)合酋長國、智利和南非。

與此同時,人才供給也在變化:

從2022年到2024年,美國和加拿大新增的AI博士數(shù)量增長了22%,但這些新增博士,更多流向了學(xué)術(shù)界,而不是工業(yè)界。

開源正在成為全球AI競爭新變量

如今,越來越多國家開始加碼布局AI。

為了把AI能力盡量掌握在本土體系內(nèi),發(fā)展中經(jīng)濟體持續(xù)擴展國家級AI戰(zhàn)略,同時政府主導(dǎo)的AI超級計算投資也在同步增長。

但現(xiàn)實是,核心能力依然高度集中:

無論是模型研發(fā)還是前沿突破,仍主要掌握在美國和中國手中。



不過,一個新的變量正在出現(xiàn)——開源

隨著開源生態(tài)的發(fā)展,參與者的版圖開始被重新分配。

在GitHub上,來自“其他地區(qū)”的貢獻量,已經(jīng)超過歐洲,并逐漸逼近美國。

更重要的是,這種變化正在帶來連鎖反應(yīng):

更多語言、更豐富場景的模型與評測體系,開始出現(xiàn)。

關(guān)于AI的未來,專家和普通人的看法正在明顯“分叉”

在“AI會如何影響工作”這個問題上,73%的專家認為是正面的,但公眾中只有23%這么看,兩者之間拉開了整整50個百分點的差距。

類似的分歧,也出現(xiàn)在對經(jīng)濟、醫(yī)療等關(guān)鍵領(lǐng)域的判斷上。

信任層面,不同國家之間,對政府監(jiān)管AI的信任度差異明顯。

在受調(diào)查國家中,美國的信任度最低,只有31%。

而從全球范圍來看,歐盟在“能否有效監(jiān)管AI”這件事上,整體信任度要高于美國和中國。



除了上面這10個,斯坦福官網(wǎng)未列但報告里提到的其他5個結(jié)論分別是:

1、即使在受控環(huán)境中表現(xiàn)出色,機器人仍無法完成大多數(shù)家務(wù)任務(wù)(僅12%)。

2、AI先替代的是“入門級執(zhí)行”,而不是“有經(jīng)驗的判斷”。從2024年開始,美國22~25歲的年輕開發(fā)者崗位,直接少了近20%;但與此同時,年長開發(fā)者反而在增加。

3、AI能力在變強,但環(huán)境代價也在同步放大。僅GPT-4o推理的年用水量,就可能超過1200萬人的飲用水需求

4、AI在科學(xué)領(lǐng)域,已經(jīng)開始超越人類,但模型越大,并不總是越強。

5、AI正在快速進入臨床一線,但仍缺乏有效性。一項覆蓋500多項研究的綜述顯示,接近一半的研究,依賴的是示例性問題,而不是真實患者數(shù)據(jù);真正基于真實臨床數(shù)據(jù)開展的研究,占比只有5%。

(具體指路第9頁)



斯坦福HAI出品、谷歌OpenAI提供支持

最后簡單說一下,《斯坦福AI指數(shù)報告》到底是什么來頭。

除了出品方斯坦福HAI,其支持者陣容可謂相當豪華:

不僅有谷歌、OpenAI這樣的頭部模型玩家,而且還有麥肯錫、GitHub、領(lǐng)英等強大數(shù)據(jù)提供方。



對了,“以人為本”人工智能實驗室(HAI)還是李飛飛發(fā)起并聯(lián)合創(chuàng)立的,之前她通常以“代言人”的身份宣傳介紹這份報告,不過今年推特暫無動靜。

翻了下報告指導(dǎo)委員會名單,里面也沒有她的身影(而且也沒有華人)。

(難道這和她投身創(chuàng)業(yè)有關(guān)?)



而從2017年開始,這些頂尖研究人員和機構(gòu)就聚在一起專門做一件事:

用數(shù)據(jù),把AI每年怎么發(fā)展這件事講清楚

多年下來,該報告已經(jīng)成為業(yè)界重要參考(今年已經(jīng)是第9份了)。

相比之前,報告今年還明顯增加了一個信號:AI已經(jīng)不只是技術(shù)問題,而是開始全面進入深水區(qū)

一方面,它持續(xù)追蹤AI在推理能力、安全性、以及真實世界任務(wù)中的表現(xiàn),但一個關(guān)鍵變化是——

這些指標本身,正在變得越來越不可靠。



另一方面,報告首次給出了生成式AI的經(jīng)濟價值新估算,并補充了對勞動力市場影響的最新證據(jù)——

AI不再只是“會不會取代人”的問題,而是已經(jīng)開始重塑崗位結(jié)構(gòu)。

更宏觀的部分也在展開,比如提出了一個分析國家層面技術(shù)控制與競爭的新框架、首次單獨設(shè)立AI科學(xué)/AI醫(yī)學(xué)兩大板塊、與谷歌前CEO施密特的公司合寫科學(xué)章節(jié)。

Anyway,如果你也關(guān)心AI的近況和未來——

這份報告或許就是目前信息密度最高、值得每年一追的那一個。

(好好好,我將深度學(xué)習(xí)之)



報告原文:
https://hai.stanford.edu/ai-index/2026-ai-index-report

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
洪龍同志工作期間突發(fā)心臟驟停,不幸因公犧牲

洪龍同志工作期間突發(fā)心臟驟停,不幸因公犧牲

新京報
2026-04-18 09:44:40
我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

千秋文化
2026-04-16 20:12:45
我媽取走我600萬房本,我馬上報失重辦,隔天弟弟撥了我200多通電話

我媽取走我600萬房本,我馬上報失重辦,隔天弟弟撥了我200多通電話

三農(nóng)老歷
2026-04-17 19:22:34
“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

“魔幻”接連發(fā)生,老百姓已經(jīng)麻木了!

胖胖說他不胖
2026-04-18 09:00:31
揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

揮淚斬馬謖!皇馬正式出售2.1億“頂星”!新主帥攜巨星空降加盟

頭狼追球
2026-04-18 17:53:28
滾出中國!云南潑水節(jié)炸出一群“男流氓”,潑女性“臟水”太齷齪

滾出中國!云南潑水節(jié)炸出一群“男流氓”,潑女性“臟水”太齷齪

奇思妙想草葉君
2026-04-18 02:30:58
在醫(yī)療領(lǐng)域搞新型隱性腐敗,武漢大學(xué)中南醫(yī)院原黨委常委、院長王行環(huán)被“雙開”,曾任武漢雷神山醫(yī)院院長

在醫(yī)療領(lǐng)域搞新型隱性腐敗,武漢大學(xué)中南醫(yī)院原黨委常委、院長王行環(huán)被“雙開”,曾任武漢雷神山醫(yī)院院長

大風新聞
2026-04-18 11:25:25
快檢查自家陽臺!有人家里已大量出現(xiàn),官方提醒:千萬別摸

快檢查自家陽臺!有人家里已大量出現(xiàn),官方提醒:千萬別摸

環(huán)球網(wǎng)資訊
2026-04-18 16:23:18
男子因噪音過敏住5年隔音艙:自己設(shè)計,已接上百個訂單,幫噪音受困者找回睡眠

男子因噪音過敏住5年隔音艙:自己設(shè)計,已接上百個訂單,幫噪音受困者找回睡眠

半島官網(wǎng)
2026-04-16 11:20:50
難以置信!網(wǎng)傳多年前某殯儀館為省燃料,將多名逝者“拼爐”火化

難以置信!網(wǎng)傳多年前某殯儀館為省燃料,將多名逝者“拼爐”火化

火山詩話
2026-04-18 15:43:01
決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

決裂?姆巴佩硬剛皇馬!拒絕克洛普執(zhí)教,力挺一人入主

奶蓋熊本熊
2026-04-19 00:32:00
事發(fā)浦東機場!女子稱兩次拒絕幫陌生人帶行李,多名網(wǎng)友:我也遇到過!

事發(fā)浦東機場!女子稱兩次拒絕幫陌生人帶行李,多名網(wǎng)友:我也遇到過!

上觀新聞
2026-04-18 20:28:04
全部遇難!印尼發(fā)生墜機事故

全部遇難!印尼發(fā)生墜機事故

魯中晨報
2026-04-18 09:56:04
一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀檢這道關(guān)

一條煙、一瓶酒,2026年5月起,連茶葉盒都得過紀檢這道關(guān)

周哥一影視
2026-04-17 19:29:59
收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

千羽解讀
2026-04-18 10:12:15
難過啊!80后男人的葬禮上,出殯草草了事,家人連一聲痛哭都沒有

難過啊!80后男人的葬禮上,出殯草草了事,家人連一聲痛哭都沒有

火山詩話
2026-04-18 16:26:38
中方行使否決權(quán),新加坡稱感到失望,新國大使:應(yīng)取消一票否決權(quán)

中方行使否決權(quán),新加坡稱感到失望,新國大使:應(yīng)取消一票否決權(quán)

知法而形
2026-04-17 20:43:46
5大超巨同登一陣!NBA最恐怖時代降臨,這支新王要統(tǒng)治未來10年!

5大超巨同登一陣!NBA最恐怖時代降臨,這支新王要統(tǒng)治未來10年!

茅塞盾開本尊
2026-04-18 14:06:38
新華社點名曝光:拼多多暴力抗法細節(jié)!

新華社點名曝光:拼多多暴力抗法細節(jié)!

仕道
2026-04-18 20:55:32
國家工作人員巨額財產(chǎn)來源不明罪新規(guī)立案標準從30萬提高到300萬

國家工作人員巨額財產(chǎn)來源不明罪新規(guī)立案標準從30萬提高到300萬

深度報
2026-04-17 22:54:19
2026-04-19 02:19:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12491文章數(shù) 176454關(guān)注度
往期回顧 全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

頭條要聞

伊朗革命衛(wèi)隊向油輪開火 伊朗最高領(lǐng)袖發(fā)聲

體育要聞

時隔25年重返英超!沒有人再嘲笑他了

娛樂要聞

劉德華回應(yīng)潘宏彬去世,拒談喪禮細節(jié)

財經(jīng)要聞

"影子萬科"2.0:管理層如何吸血萬物云?

汽車要聞

奇瑞威麟R08 PRO正式上市 售價14.48萬元起

態(tài)度原創(chuàng)

家居
健康
手機
旅游
房產(chǎn)

家居要聞

法式線條 時光靜淌

干細胞抗衰4大誤區(qū),90%的人都中招

手機要聞

榮耀600系列參數(shù)、外觀全曝光

旅游要聞

云南昆明游客踩在鮮花上拍照,把電動車扔進滇池:建議拉入黑名單

房產(chǎn)要聞

官宣簽約最強城更!海口樓市,突然殺入神秘房企!

無障礙瀏覽 進入關(guān)懷版