无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

OpenAI最新報告:Codex取代ChatGPT,大神讓“Agent團隊”干活

0
分享至

文 | 世界模型工場

Agent到底有沒有真的改變工作?

OpenAI最新發布的一份報告《The Shift to Agentic AI: Evidence from Codex》,給出了目前最直接的一組數據。

這份報告由OpenAI、哥倫比亞商學院、沃頓商學院、杜克大學Fuqua商學院的研究者共同完成。

報告分析了OpenAI Codex的真實使用數據,比較了三類人群:個人賬戶用戶、組織賬戶用戶,以及OpenAI內部員工。

它不僅展示了OpenAI內部是如何最大化使用Codex的,還會讓人產生一種感受:

AI的使用方式正在經歷一次靜默的范式轉移。

從和AI對話到讓AI干活,從自己動手到管理一群AI員工,這個過程已經在發生,但大多數人還沒意識到這件事已經在發生了。


Codex用戶半年增長五倍,但采用不均衡

報告顯示,2026年上半年,Codex的周活躍用戶數增長超過5倍。

但在個人用戶、組織用戶、OpenAI內部員工之間,Codex的使用強度差異很大。

報告數據表明,過去28天內使用過Codex的活躍用戶,個人用戶中的比例只有0.7%,組織用戶中的比例達到17.3%,OpenAI內部員工中達到97.9%。


也就是說,在普通個人用戶中,Codex仍然是早期產品;在企業組織中,Codex已經開始擴散;但在OpenAI內部,它已經接近全面普及。

報告特別指出,在OpenAI內部,Codex已經基本替代ChatGPT,成為主要的工作AI界面。

因為OpenAI是一個異常有利的環境,員工熟悉前沿模型、使用成本低、組織支持度高、培訓和非正式知識分享普遍。

盡管OpenAI的使用不代表今天的典型企業,但它展示了一個信號:

當所有的采用障礙都被移除后,Agent的使用會是什么樣子。

Agent任務越來越難,輸出越來越多

報告還分析了用戶交給Codex任務的復雜度,并為測試設置了一個巧妙的問題:

如果沒有AI,一個有經驗的人類完成同樣任務,需要多長時間?

結果很驚人。

2025年12月,只有35.4%的活躍個人用戶,發送過至少一個需要1小時以上人工完成的任務。

到了2026年5月,這個比例翻倍到了70.2%。

更夸張的是需要8小時以上人工完成的任務,發送過這類任務的用戶比例從2.1%,飆升到了25.6%,增長了10倍還多。


與此同時,產出也在暴漲。

2026年6月,OpenAI法律崗位的普通員工通過Codex和ChatGPT生成的月輸出Token,比2025年11月增長了13倍,普通研究人員的增長更是超過了50倍。

報告還發現一個有趣的現象:

在Agent時代,用戶從一開始就在委派最復雜的工作。用戶先提出最宏大、最復雜的需求,后續的對話只是不斷地細化和修正。

這跟傳統的“先問簡單問題、再逐步深入”的交互模式完全相反。

Codex早就不只是寫代碼了

雖然Codex最初是為軟件開發設計的,但它的使用早已超出這個范圍。

在Codex所有用戶群體中,最常見的仍然是工程運維、代碼實現、代碼理解等軟件相關任務。

但Codex也被廣泛用于文檔編寫、數據分析、研究、協作溝通等非編碼工作。

在OpenAI內部,Codex還被用于研究、規劃、溝通、招聘、銷售、產品工作和數據分析。

使用范圍越廣的組織,Agent的滲透越深,這似乎是一個自我強化的循環。


報告還比較了不同職能的使用差異。

在組織中,工程運維占大多數資歷組輸出Token的最大份額,但知識工件類任務在管理人員和高管中占比更高。

在OpenAI內部,個體貢獻者更偏向工程運維,而管理層更偏向協作類任務。

不同角色用Agent做不同的事,但所有人都在用。

最深度用戶在“管理一群AI員工”

如果說普通用戶還在用AI干活,那最前沿的用戶已經在管一群AI員工干活了。

在OpenAI內部,只有10.7%的員工在同一時間只運行一個Agent,近30%的員工在某個時間點同時管理5個或以上的并發Agent。

報告描述這是一種“人類監督一支Agent團隊”的工作方式,同時把任務分配給多個Agent,監控進度,選擇性介入。

在外部,這種并行工作流還不普遍。

約67%的組織用戶和64%的個人用戶,完全不使用并發Agent。

但在OpenAI內部,這批最重度用戶每天平均會讓Codex累計運行約71小時。

比如,一個員工同時讓3個Codex agents分別修bug、寫測試、整理文檔。如果這3個任務各自運行1小時,報告就會記為累計運行3小時。


報告顯示,從2026年4月7日以來,OpenAI內部這批前1%重度用戶的Codex累計每日運行時長,增長了近88%。

外部用戶也在增長,但強度明顯低得多。

在組織用戶中,使用強度排在前1%的用戶,每日運行時長增長約25%。

在個人用戶中,前1%重度用戶的每日運行時長增長約50%。

用戶開始把工作流封裝起來反復使用

一次性使用AI完成某個任務,跟把一套工作流封裝好讓AI反復執行,是兩種完全不同的深度。

Codex通過“技能”(Skills)和“插件”來實現工作流的系統化,即把指令、軟件和外部工具集成打包,可以反復調用,甚至跨用戶、跨組織共享。

2026年3月1日,只有5.4%的活躍Codex用戶調用過技能。到6月11日,這個比例達到了26.6%。


分群體看差距更明顯:

25.7%的個人用戶和30.4%的組織用戶調用了技能,而在OpenAI內部,96.2%的活躍用戶調用了至少一個技能。

報告特別提到,自定義技能的增長尤其快,就是那些用戶或組織自己編寫的、針對特定團隊標準或工作流程的技能。

這是一次更深層的工作方式變革。

一旦組織下定決心,AI轉型可以非常快

很多人以為,新技術總是從頂層先普及,但Codex的數據給出了相反的答案。

從職位來看,工程師是最早、最深地使用Codex的群體。

在組織用戶中,普通工程師有26.8%的Token是在Codex上生成的,這一份額自年初以來增長了5倍。

數據和數據分析從業者緊隨其后,達到15.2%。

但從資歷來看,Codex的采用橫跨了整個層級,從初級員工到高管都在用。

報告認為,高級用戶用Codex不只是為了寫代碼,更多是為了規劃、審查和委派任務。

有意思的是,在OpenAI內部,后來采用Codex的部門如:法務、招聘的轉型速度,反而比早期采用的工程部門更快。

2026年1月時,這些部門的Codex使用率接近于零,到4月初達到約20%,一個月內就飆升至75%。

這表明,一旦組織下定決心,轉型可以非常快。


最會造AI的人,也是把AI用得最狠的人

這份報告最核心的一個洞見是:

Agent的采用,不取決于模型有多強,而取決于組織環境有多支持。

同樣的Codex,在個人、組織和OpenAI內部,呈現出完全不同的使用模式。

報告認為,決定因素包括:相關文件和系統的訪問權限、管理層的期望、員工的技能水平、以及是否有配套的審查流程。

這跟歷史上所有通用技術的擴散規律一致。

技術本身只是催化劑,真正的變革發生在組織如何圍繞技術重新設計工作流程。

報告用了一個經典的類比:

19世紀末從蒸汽動力轉向電力的過程中,早期工廠只是把蒸汽機換成電動機,工廠布局和 工作流基本沒變。

真正的生產力爆發,發生在幾十年后工廠被重新設計、生產流程被徹底重構的時候。

Agent可能正在經歷同樣的過程。

當下的使用情況或許只是冰山一角,真正的變革還在后面。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
市人大常委會黨組召開會議 堅決擁護省委決定

市人大常委會黨組召開會議 堅決擁護省委決定

微昭通
2026-06-25 18:42:49
國泰航空向吳尊致歉:由于中轉地銜接轉運問題,行李未能及時裝載,已追蹤到該行李;此前吳尊發文怒斥國泰:行李丟失,苦等三天無回應

國泰航空向吳尊致歉:由于中轉地銜接轉運問題,行李未能及時裝載,已追蹤到該行李;此前吳尊發文怒斥國泰:行李丟失,苦等三天無回應

極目新聞
2026-06-26 08:40:41
阿根廷好命! 在4強前可能不會遇傳統豪門梅西會在約旦比賽上場

阿根廷好命! 在4強前可能不會遇傳統豪門梅西會在約旦比賽上場

80后體育大蜀黍
2026-06-26 14:07:19
iPhone 18 Pro Max曝光:靈動島暴瘦35,蘋果正面設計四年首變

iPhone 18 Pro Max曝光:靈動島暴瘦35,蘋果正面設計四年首變

小柱解說游戲
2026-06-25 02:56:49
世界杯重磅對決!巴西VS日本,又遇淘汰賽魔咒,荷蘭對決摩洛哥

世界杯重磅對決!巴西VS日本,又遇淘汰賽魔咒,荷蘭對決摩洛哥

奧拜爾
2026-06-26 09:00:47
猛料!珠海揚名廣場將迎新超市!

猛料!珠海揚名廣場將迎新超市!

說故事的阿襲
2026-06-26 14:32:41
性感A妹胸部全漏走光!本人幽默回應

性感A妹胸部全漏走光!本人幽默回應

草莓解說體育
2026-06-25 17:55:37
韓紅,你還是要點臉吧!

韓紅,你還是要點臉吧!

柴差說
2026-06-26 19:17:33
北美院線已恢復疫情前最好成績,而國內持續走冷,為何差這么大?

北美院線已恢復疫情前最好成績,而國內持續走冷,為何差這么大?

有愛評論區
2026-06-25 18:31:17
鮑鵬山:如果中國真的足夠強大!我們沒必要脆弱到那么害怕批評!

鮑鵬山:如果中國真的足夠強大!我們沒必要脆弱到那么害怕批評!

用冷眼洞悉世界
2026-06-24 00:44:14
人民日報評“桔橘”之爭與“小面”之辯:靠搶注囤積拿下的“鐵招牌”,或耍心機、玩套路得來的“紙招牌”,都不可能長久

人民日報評“桔橘”之爭與“小面”之辯:靠搶注囤積拿下的“鐵招牌”,或耍心機、玩套路得來的“紙招牌”,都不可能長久

大風新聞
2026-06-26 09:45:06
你的公積金是什么段位?

你的公積金是什么段位?

細說職場
2026-06-26 12:42:12
甲鈷胺立大功!研究發現:老人吃甲鈷胺,或能緩解8種癥狀

甲鈷胺立大功!研究發現:老人吃甲鈷胺,或能緩解8種癥狀

垚垚分享健康
2026-06-26 18:07:55
安切洛蒂戰術助維尼修斯爆發!巴西隊真正考驗來了!

安切洛蒂戰術助維尼修斯爆發!巴西隊真正考驗來了!

李喜林籃球絕殺
2026-06-26 17:25:05
原來他是張柏芝背后的男人,64歲至今孤身一人,默默幫她長達27年

原來他是張柏芝背后的男人,64歲至今孤身一人,默默幫她長達27年

阿纂看事
2026-06-26 12:55:24
自然界腦科學證實:雌性對某個雄性瘋狂上癮,壓根不是情感在作祟,而是他偶然間點燃了她大腦深處一套隱秘的成癮機制

自然界腦科學證實:雌性對某個雄性瘋狂上癮,壓根不是情感在作祟,而是他偶然間點燃了她大腦深處一套隱秘的成癮機制

心理觀察局
2026-06-24 07:27:05
岸田文雄:中日對話很重要 兩國關系影響重大

岸田文雄:中日對話很重要 兩國關系影響重大

看看新聞Knews
2026-06-26 17:48:30
以色列人追悔莫及,以色列在全球范圍內,又到了人神共憤的地步了

以色列人追悔莫及,以色列在全球范圍內,又到了人神共憤的地步了

農夫史記
2026-06-24 20:11:17
洗衣機快洗模式,我勸你慎用啊

洗衣機快洗模式,我勸你慎用啊

丁香生活研究所
2026-06-26 12:52:56
黃金跌麻了!6月26日國內金價全線下跌,現在能上車嗎?

黃金跌麻了!6月26日國內金價全線下跌,現在能上車嗎?

別人都叫我阿腈
2026-06-26 14:40:04
2026-06-26 19:44:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
135703文章數 862335關注度
往期回顧 全部

科技要聞

拿了500億的梁文鋒,只挖地基,不信銷售

頭條要聞

女子稱遭性侵警方不予立案 內褲襠部和胸部檢出男方DNA

頭條要聞

女子稱遭性侵警方不予立案 內褲襠部和胸部檢出男方DNA

體育要聞

我在世界杯的每次奔跑,都為了證明你沒看錯

娛樂要聞

玥兒不回北京,馬筱梅解釋后媽身份

財經要聞

懸在科技頭上的達摩克利斯之劍

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預訂

態度原創

手機
本地
教育
藝術
房產

手機要聞

蘋果折疊屏iPhone Ultra售價突破1.5萬元:刷新iPhone產品價格紀錄

本地新聞

世界杯球迷節:比球賽更好玩的派對

教育要聞

什么樣的孩子適合學醫?醫生:游戲玩得好的是潛力股

藝術要聞

王羲之《道德經》現身美國,這小楷登峰造極

房產要聞

全國高考大放水,300分就能上本科!論上岸率,海南沒輸過!

無障礙瀏覽 進入關懷版