![]()
新智元報道
![]()
【新智元導讀】你此刻喝的干凈水、用的電、看的病,1170億人里絕大多數做夢都夠不著。而算清這串概率的Opus 4.8,前天剛把GPT-5.5踢下全球第一的王座。
如果你在1170億人里隨機投胎,你大概率是一個1650年以前出生的文盲農民,活不過15歲!
算出這個答案的,不是哪個熬白了頭的歷史學家,是一個AI。
就在剛剛,沃頓商學院教授Ethan Mollick的一條推文,直接在上刷屏了。
![]()
點開他做的這個網站,全人類十幾萬年的命運,被換算成了一串冷冰冰的概率。
而這串概率背后,從查文獻、建模型,到敲下第一行代碼、調完每一個像素,連一個真人程序員的影子都沒有。
全是Claude Opus 4.8,聽著那一句話,一個AI干完的。
![]()
![]()
Prompt:assume a universal veil of ignorance and you could be born as any human who has ever lived in history, what are the most likely socioeconomic conditions and locations that you would be born in, give the top 10 by percentage chance. This should be sourced. do research as needed
1170億人的生死貧勞
被AI算盡了
這個網站叫「The Veil of History」,歷史的無知之幕。
名字來自哲學家羅爾斯那個著名的思想實驗。
假設你還沒出生,不知道自己會落在哪個階層、哪個種族、哪個國家,你會怎么去設計這個社會。
Mollick用Opus 4.8把這塊幕布,一把拉到了整個人類史的尺度上。
它的算法不按世紀平攤,而是按每個時代實際出生的人頭來加權。哪個時代生的人多,你就更可能投胎到那兒去。
結果顯示,人類有史以來,大約出生過1170億人。其中約81%,生在1650年以前。約94%,生在1900年以前。
![]()
![]()
網站把這1170億人,壓成一張100個小人的方格圖。
切到「時代」那一欄你會發現,絕大多數小人都堆在工業革命以前的格子里。
越往現代走越稀疏,能站到「1900年以后」的,數來數去就那么幾個。
絕大多數的「你」,是在田里彎著腰的那一個。
![]()
網站繼續往下拉,是「十種最可能的人生」,排在最前頭的幾種,幾乎清一色是農耕時代的無名之輩。
![]()
![]()
沒名字,沒頭銜,在歷史里連一行字都沒留下,卻占掉了整個抽獎池里最大的幾塊。
而你從小背到大的帝王將相加在一起,湊不出一個小人。
加權之后,極端貧困是常態,識字是例外,能活到成年本身就是一場概率游戲。
![]()
點一下抽一條命,你活到了21歲
光看統計不過癮。這個網站最絕的,是結尾那個「抽一條命」的按鈕。
點一下,它就從完整的概率分布里,真給你隨機抽一個出生。
年代、地區、階層、能享什么福、最后什么結局,一次性全配齊。
隨手抽一把,多半是這樣一張卡面。
公元前6400年前后,一個女孩,東亞河谷里的農民。極端貧困,不識字,沒有電,也沒有自來水。
活到了大約21歲。
就這么短短兩行字,啪地砸在屏幕上。
![]()
你可以一直按,按到那個抽象的「1170億分之一」,終于變成一個具體的、有死法的人為止。
多點幾次你會發現,自己一次次落回差不多的境遇里。
不信邪的話,點開文末「閱讀原文」,拉到「DRAW A LIFE」這個按鈕前,看看能不能撞上一條現代人的好簽。
抽完之后,歡迎到評論區里報個數——是哪年、哪片地、活到了幾歲。
除此之外,網站還專門做了一張真實地理的交互世界地圖,用D3和Natural Earth畫的。
拖動時間滑塊,能從12個時代里一格格掃過去。
大部分時間里,這個重心都死死壓在亞洲。一路到近現代,才會看見它開始往歐洲、往美洲挪動。
換句話說,人類這本大書,絕大部分章節,都寫在了亞洲的田埂上。
![]()
實際上,整段人類史里,能喝上干凈水、生病找得著醫生、孩子大概率能平安長大的人生,加一塊兒都湊不滿一小撮。
更不用提用上電、住進城里、過上一份現代中等收入的日子了。
你此刻隨手就有的這些,是1170億人里的絕大多數,做夢都夠不著的配置。
說到底,今天的人覺得稀松平常的活法,丟回整條人類時間線里看,是一個刺眼到不像話的異常值。
「投胎模擬器」
一個AI,分飾四個角
如此高質量的產品級交付,可不是生成幾行HTML和CSS那么簡單。
如果讓一支傳統團隊來做,數據分析師清洗人口曲線,歷史研究員翻文獻佐證,UX設計師畫線框圖,前端工程師一行行敲D3。幾樣湊齊、磨到能上線,怎么也得搭進去好幾周。
換成Opus 4.8,一個AI就分飾了四個截然不同的高薪崗位,把中間所有的毛刺全部抹平了。
![]()
第一層,它是個嚴謹的數據研究員。
為了算出1170億這個數和對應的時代分布,它先是翻出人口資料局2022年那份《地球上一共活過多少人》,然后又交叉引用了麥迪遜項目數據庫、HYDE數據集和聯合國的人口展望,最后合成出了這張各時代各地區的人口份額矩陣。
![]()
在這個過程中,算某個地區一共出生過多少人,靠的是一條干凈的公式——
每個時代的出生總數,乘以那個時代這個地區占全球的人口比例,再逐代累加。
![]()
第二層,是數學建模專家。
棘手的是,從沒有任何機構統計過「按地區累計的出生人數」。
于是它自主決定用蒙特卡洛方法處理不確定性,跑了4000輪模擬,越古老、越沒把握的年代噪聲給得越大,最后輸出中位數加5%到95%的置信區間。
![]()
第三層,前端架構師。
要在一個單頁里把絲滑的滾動敘事和數據狀態同步起來,絕非易事。
為此,Opus自己設計了一套現代審美的滾動結構,把海量數據點在瀏覽器里的渲染、圖表的動態響應全解決了,動效順滑不卡頓。
第四層,它拿出了頂級文案和情緒導演的功力。
首先是宏大的歷史長河鋪墊,再猛地拋出個體命運的渺小。它用帶肉身痛感的短句,把冰冷的統計學一刀刀刺進普通人心里。
代碼寫得好不稀奇。懂得怎么調動人類情緒,這幾乎是碳基生命最后的自留地。
能搓出這個的腦子,前天剛登頂
回到Opus 4.8這邊。
在Artificial Analysis的榜單上,它就像一臺沒感情的壓路機,61.4分滿血登頂,把GPT-5.5反超了下去。
這是OpenAI 4月坐上頭把交椅以來,Claude頭一回坐回第一。
![]()
在號稱「人類最后考試」的Humanity's Last Exam上,Opus 4.8拿到45.7%,領先第二名整整1分。
前沿物理基準CritPt上,它也越過了Gemini 3.1 Pro。
![]()
編程沒什么懸念。
在更難刷滿的SWE-Bench Pro上,它考了69.2%,GPT-5.5是58.6%,直接拉開十個百分點。
![]()
在專門模擬真實職場里那些,要動手、要查資料、要敲命令行的基準GDPval-AA中。
Opus 4.8拿了1890 Elo,把第二名GPT-5.5甩開約121分,正面單挑隱含勝率約67%。
不僅如此,它把完成同樣復雜任務的平均交互輪數壓到了38次,不需要人類反復糾錯,自己就能在一連串試錯和推理里摸到最優解。
這正是它能獨自交付整個網站的底層邏輯。
![]()
決賽打到這兒
比的不只是分數
這場AI王座的爭奪戰,上個月還是GPT-5.5的天下,它把Opus 4.7掀下了榜首。一個多月后,Opus 4.8原樣奉還。
今年春天到現在,這把椅子來回換了好幾次手,誰都沒坐熱過。代差正在被壓成以周計的拉鋸。
但榜單換來換去,真正在變的是評判的標準。
模型一旦被當成能獨立干活的Agent,光聰明就不夠了,還得看它知不知道自己的邊界。
![]()
據稱Anthropic正洽談至少300億美元的新融資,估值沖上9000億,落定就將越過OpenAI的8520億,坐上全球最貴AI公司的位置。
發布Opus 4.8的同一天,Anthropic還甩出另一手。
比Opus更強的Mythos級模型,幾周內就對所有人開放,而4.8這代的對齊評分,已經追平了那個只給極少數機構試用的Mythos Preview。
聰明和誠實從來不是二選一,Opus 4.8這次的狠處,是兩樣一塊兒往上頂。
個那讓全網破防的投胎網站,不過是它隨手呼出的一口氣。
參考資料:
https://x.com/ArtificialAnlys/status/2060117582120976868
https://x.com/emollick/status/2060165879908749490
https://veil-of-history.netlify.app/#draw
編輯:摩西
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.