无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI創(chuàng)始成員年度總結(jié):這6項技術(shù),顛覆了整個大模型行業(yè)

0
分享至

2025 年,大模型行業(yè)走過了喧囂的探索期,迎來了真正的質(zhì)變時刻。近日,前特斯拉 AI 總監(jiān)、OpenAI 創(chuàng)始成員,同時也是“Vibe Coding”概念的提出者 Andrej Karpathy,發(fā)表了備受矚目的年度重磅總結(jié)——《2025 LLM Year in Review》。

在這份清單中,Karpathy 以敏銳的視角捕捉了這一年中最具顛覆性的六大技術(shù)成果。從打破舊有訓練鐵三角的 RLVR,到讓代碼消隱于無形的 Vibe Coding,這不僅是對過去一年的復盤,更是對未來計算新紀元的深刻預言。

他寫道:“2025 年是大語言模型風云激蕩、成果豐碩的一年。以下列舉了我個人眼中顯著且頗具驚喜的‘范式轉(zhuǎn)變’。這些變化重塑了行業(yè)格局,并在概念層面上令我耳目一新。”

值得注意的是,Karpathy 曾入選《麻省理工科技評論》2020 年度“35 歲以下科技創(chuàng)新 35 人”。

(來源:社交媒體 X)

RLVR

可驗證獎勵的強化學習

在 2025 年初,各大實驗室的 LLM 量產(chǎn)訓練棧大致還是這套經(jīng)典流程:預訓練、監(jiān)督微調(diào)(SFT)以及人類反饋強化學習(RLHF)。這套流程一直被視為訓練生產(chǎn)級大模型既穩(wěn)定又成熟的金科玉律。

但在 2025 年,來自可驗證獎勵的強化學習(RLVR)的崛起,成為事實上的新核心階段,融入了這一體系。

RLVR 的邏輯很簡單:不再讓 AI 模仿人類的語氣,而是通過數(shù)學和代碼等有唯一標準答案的任務,倒逼 AI 在數(shù)萬次的自我博弈中演化出“推理能力”。

這種訓練方式讓 AI 學會了像人類一樣慢思考,遇到難題時,它不再是靠直覺秒回,而是懂得拆解步驟、自我糾錯。這種轉(zhuǎn)變帶來了全新的縮放定律:只要給 AI 更多的“思考時間”,即便是參數(shù)規(guī)模不大的模型,也能爆發(fā)出驚人的解題智慧。

從時間線上看,OpenAI 的 o1(2024 年末)可以視作 RLVR 模型的首次公開示范;但真正讓人明顯感到拐點已至的,是 2025 年初的 o3 發(fā)布,那種直觀的差異感,幾乎不需要復雜指標就能被感知到。

Jagged Intelligence

參差不齊的智能

Karpathy 認為,2025 年,行業(yè)人士開始以更直觀的方式理解 LLM 智能的“形態(tài)”:我們并非在培育進化的“野獸”,而是在召喚為了刷分而生的“幽靈”。

人類的智慧源于生存本能,而 AI 的智慧純粹源于對獎勵的貪婪。這種本質(zhì)差異造就了 AI 極端的參差不齊的智能(Jagged Intelligence)——它們就像是被雞娃出來的偏科天才,在數(shù)學和代碼等有標準答案的領域表現(xiàn)得無所不知,但在常識判斷和安全防范上卻幼稚得像個小學生。

圖 | 藍色表示人類智能,紅色表示AI智能。它指出了人類智能也以其獨特的方式呈現(xiàn)出參差形態(tài)

這也解釋了為何現(xiàn)在的 AI 榜單已失去公信力:當實驗室都在搞應試教育,針對考題范圍進行填鴨式訓練時,橫掃榜單的成績單只證明了 AI 是個完美的做題家,卻掩蓋了它們距離真正具備常識的通用人工智能(AGI)依然遙遠的事實。

Cursor

大模型應用的新標桿

2025 年,Cursor 的崛起確立了一個全新的行業(yè)標桿:大模型應用層不再是簡單的套殼對話框,而是一個深度集成的智能工作流。

這一層級的核心價值在于“編排”,它在后臺默默處理了繁瑣的上下文工程,將無數(shù)次模型調(diào)用串聯(lián)成復雜的任務鏈,并通過“自主性滑塊”讓用戶在掌控與放權(quán)之間自由切換。

如果說大模型實驗室(如 OpenAI)是在批量輸送智商超群但缺乏經(jīng)驗的大學畢業(yè)生,那么應用層的使命,就是利用私有數(shù)據(jù)和專業(yè)工具,將這些通用人才打磨成特定領域內(nèi)真正可落地、可實戰(zhàn)的行業(yè)專家。

2025 年,Cursor 最值得注意的地方在于,它有力地界定并揭示了一種全新的大模型應用層級。如今,某某領域的 Cursor (Cursor for X) 已成為人們熱議的高頻詞。

Claude Code

駐留在你電腦里的 AI

Claude Code 的出現(xiàn),標志著 AI 交互范式的一次回歸與升維。

Karpathy 敏銳地指出,OpenAI 在智能體(Agent)開發(fā)的早期略顯失策。盡管云端集群可能是 AGI 的終局,但在當前能力參差的過渡期,將智能體直接部署在開發(fā)者電腦上顯然更為務實。

Anthropic 恰恰做對了這一點:他們讓 AI 走下了云端神壇,棲息到了開發(fā)者的命令行(CLI)中。 這種駐場模式讓 AI 能夠直接訪問用戶的本地環(huán)境、配置、數(shù)據(jù)與密鑰,從而實現(xiàn)了極低延遲的感知-行動循環(huán)。這不再是我們像用 Google 那樣去訪問一個網(wǎng)站,而是一個真正寄居在你電腦里、隨時聽候調(diào)遣的“數(shù)字幽靈”。

Vibe coding

氛圍編程

2025年,AI 能力跨越了臨界點,人們只需使用自然語言即可構(gòu)建程序,代碼本身已消隱于無形。有趣的是,“Vibe coding”這個詞源于 Karpathy 的一條推文,沒想到竟會如此風靡。

(來源:社交媒體 X)

這種模式打破了專業(yè)壁壘,讓編程成為人人皆可觸及的技能。這印證了他的觀點:相比專業(yè)機構(gòu),普通人反而從大模型中獲得了更大的技術(shù)紅利。

同時,它也極大地解放了專業(yè)人士,催生了大量原本因成本過高而無法誕生的軟件。無論是用不熟悉的語言快速構(gòu)建組件,還是為了修 Bug 編寫“用完即棄”的臨時應用,代碼如今已變得免費、輕量且易塑。Vibe coding 必將重塑軟件生態(tài),并徹底改寫職業(yè)定義的內(nèi)涵。

Nano banana

大模型圖形界面

Karpathy 在回顧中拋出了一個精彩的類比:當下的 AI 對話框,本質(zhì)上就是 80 年代的 DOS 命令行。 雖然文本是機器的通用語,但對于人類而言,視覺化與空間化的信息才是最高效的交互介質(zhì)。因此,大模型的發(fā)展必然經(jīng)歷從純文本交互向大模型圖形界面(LLM GUI)的躍遷。

Google Gemini Nano banana 的橫空出世,便是這一未來的最早投影。它超越了傳統(tǒng) Markdown 的簡單排版,實現(xiàn)了真正的視覺思維——通過將文本生成、圖像理解與世界知識在模型權(quán)重層面進行深度交織,AI 終于不再只是一個陪你聊天的機器人,而進化為一個能通過圖表、幻燈片乃至交互式應用與你溝通的全能認知媒介。

最后,Karpathy 表示,2025年,是大模型領域激動人心且充滿驚喜的一年?!按竽P驼葑?yōu)橐环N全新的智能形態(tài)——它集矛盾于一身,既展現(xiàn)出遠超我預期的智慧,又暴露出令人咋舌的愚鈍。但無論如何,其實用價值毋庸置疑。”

在他看來,即便僅基于當前的模型能力,全行業(yè)對其潛力的挖掘也尚不足 10%。

“這一領域依然是一片尚待開墾的廣闊天地,無數(shù)新奇的想法正等待著我們?nèi)L試。正如我今年早些時候在 Dwarkesh 播客中所言,我抱持著一種看似矛盾的觀點:我們既要篤信飛速且持續(xù)的進步必將到來,也要清醒地認識到,前方仍有漫漫長路要走?!?/p>

1.https://karpathy.bearblog.dev/year-in-review-2025/

2.https://www.technologyreview.com/innovator/andrej-karpathy/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
南方"小清華"賺麻了,卻依然是中國最被低估的頂級985

南方"小清華"賺麻了,卻依然是中國最被低估的頂級985

新10億商業(yè)參考
2026-06-22 09:35:17
《諜影重重》換血!贊達亞接棒馬特·達蒙

《諜影重重》換血!贊達亞接棒馬特·達蒙

追星雷達站
2026-06-25 00:37:33
94歲原中央保健局局長王敏清:50年沒感冒,無三高,靠的就是這幾招

94歲原中央保健局局長王敏清:50年沒感冒,無三高,靠的就是這幾招

新浪財經(jīng)
2026-06-24 02:28:33
“明史”可不可信,國家明史修訂工程:重新發(fā)現(xiàn)8400多條錯誤

“明史”可不可信,國家明史修訂工程:重新發(fā)現(xiàn)8400多條錯誤

百家雜評
2026-06-24 07:35:42
向太曝馬伊琍已再婚:當年文章過不了心理那關

向太曝馬伊琍已再婚:當年文章過不了心理那關

娛樂看阿敞
2025-12-12 15:50:00
終于沒了!大量應用開屏廣告被取消,App 秒進時代回歸

終于沒了!大量應用開屏廣告被取消,App 秒進時代回歸

XCiOS俱樂部
2026-06-24 19:44:49
中國足壇6月24日迎來久違巨星!曾是英格蘭隊主力,已現(xiàn)身村超

中國足壇6月24日迎來久違巨星!曾是英格蘭隊主力,已現(xiàn)身村超

振剛說足球
2026-06-25 10:01:32
確定壓倒四支小組第三,波黑4分、-1凈勝球晉級32強!

確定壓倒四支小組第三,波黑4分、-1凈勝球晉級32強!

懂球帝
2026-06-25 08:10:33
捷克0-3墨西哥 積1分小組墊底出局 40歲門將奧喬亞替補登場創(chuàng)紀錄

捷克0-3墨西哥 積1分小組墊底出局 40歲門將奧喬亞替補登場創(chuàng)紀錄

我愛英超
2026-06-25 11:02:14
6月25日俄烏:克里米亞繼續(xù)挨炸,烏克蘭成功改變戰(zhàn)場態(tài)勢

6月25日俄烏:克里米亞繼續(xù)挨炸,烏克蘭成功改變戰(zhàn)場態(tài)勢

山河路口
2026-06-25 19:42:59
俄羅斯頻繁喊話烏克蘭和談

俄羅斯頻繁喊話烏克蘭和談

原某報記者
2026-06-25 11:05:40
被曝門緊閉、不見人?實探“靠譜老王” 背后深圳公司,本人最新回應

被曝門緊閉、不見人?實探“靠譜老王” 背后深圳公司,本人最新回應

南方都市報
2026-06-25 08:27:29
陳敏兒安息禮倆兒子送花圈,遺照笑容慈祥,94歲胡楓來送最后一程

陳敏兒安息禮倆兒子送花圈,遺照笑容慈祥,94歲胡楓來送最后一程

洲洲影視娛評
2026-06-25 23:16:15
辦世界杯竟成燙手山芋,2030年僅兩個申辦國,為啥沒人搶?

辦世界杯竟成燙手山芋,2030年僅兩個申辦國,為啥沒人搶?

嘆為觀止易
2026-06-08 14:22:53
張維為:中國哲學從不信奉所謂的“絕對真理”

張維為:中國哲學從不信奉所謂的“絕對真理”

看看新聞Knews
2026-06-24 23:22:23
當今社會存在的五類蛀蟲,第五種最可恨!

當今社會存在的五類蛀蟲,第五種最可恨!

細說職場
2026-06-25 23:28:32
華為余承東:我們的理念和特斯拉不一樣,尊界S800Grand Design典藏大觀面向L3+自動駕駛設計

華為余承東:我們的理念和特斯拉不一樣,尊界S800Grand Design典藏大觀面向L3+自動駕駛設計

金融界
2026-06-25 22:41:11
委內(nèi)瑞拉7.2級地震后現(xiàn)7.5級余震,特朗普愿提供援助

委內(nèi)瑞拉7.2級地震后現(xiàn)7.5級余震,特朗普愿提供援助

地球記
2026-06-25 23:51:19
印代表團訪華后,回國對莫迪說了句狠話:不親近中國就淪為盤中餐

印代表團訪華后,回國對莫迪說了句狠話:不親近中國就淪為盤中餐

好賢觀史記
2026-06-25 15:15:08
油價要跌破天了!6月23日油價迎來大幅暴跌,調(diào)價后全國油價價格

油價要跌破天了!6月23日油價迎來大幅暴跌,調(diào)價后全國油價價格

娛樂圈的筆娛君
2026-06-23 19:50:23
2026-06-26 00:51:00
問芯 incentive-icons
問芯
訪遍天下芯事,聆聽大時代人物芯聲
179文章數(shù) 28關注度
往期回顧 全部

科技要聞

存儲成本壓力山大!蘋果罕見全球提價

頭條要聞

男子徒手抓蛇被咬還淡定合影 結(jié)果歷經(jīng)4次搶救兩進ICU

頭條要聞

男子徒手抓蛇被咬還淡定合影 結(jié)果歷經(jīng)4次搶救兩進ICU

體育要聞

世界杯最動人一吻:我若離世 你就改嫁吧

娛樂要聞

這國產(chǎn)劇太裝了,居然還熱播第一?

財經(jīng)要聞

又有紙尿褲送檢后被檢測出甲酰胺!

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預訂

態(tài)度原創(chuàng)

本地
數(shù)碼
教育
公開課
軍事航空

本地新聞

2026世界杯全勤太難?這份保姆級攻略請收好

數(shù)碼要聞

蘋果全面漲價!iPad和Mac起售價最高漲了3500元,暫未影響iPhone

教育要聞

6月24日,2026年河南普通高校招生批次錄取控制分數(shù)線出爐

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:現(xiàn)在到了關注朝鮮問題的時候了

無障礙瀏覽 進入關懷版