![]()
Cloudflare和OpenAI最近搞了個大動作,把GPT-5.4這類前沿模型塞進(jìn)了Agent Cloud,數(shù)百萬企業(yè)現(xiàn)在能像租云服務(wù)器一樣直接調(diào)用AI代理。這相當(dāng)于把AI從實(shí)驗(yàn)室的象牙塔搬到了工廠車間——開發(fā)者不用從零搭基建,Accenture、Walmart這些企業(yè)已經(jīng)在用,Codex每周還有300萬活躍用戶。云服務(wù)商們樂得合不攏嘴:中國日均Token調(diào)用量去年3月是140萬億,比2024年初漲了1000倍,漲價5%-30%都有人搶著買單。
斯坦福剛發(fā)布的AI指數(shù)報告則像一盆溫水,泡著冰火兩重天的現(xiàn)實(shí)。2025年全球AI投資5810億美元,美國占了3440億,但瑞銀預(yù)測2026年會"只"漲到5710億——增速放緩的信號。更微妙的是中美分工:美國去年扔了50個知名模型出來,中國呢?悶聲裝了全球一半的工業(yè)機(jī)器人,29.5萬臺。Nvidia GPU占AI算力六成以上,但xAI訓(xùn)練Grok4燒出的7.2萬噸碳排放,是GPT-4的14倍。公眾態(tài)度也挺分裂:59%覺得AI利大于弊,52%又說自己緊張。入門級程序員和客服崗位在縮水,中高級職位倒是穩(wěn)住了。
英偉達(dá)收購PC廠商的傳聞被官方否了,但Gartner的數(shù)據(jù)說明問題——今年底AI PC要占到全球市場的31%,明年沖55%。黃仁勛的算盤很清楚:從賣GPU零件轉(zhuǎn)向賣整套方案,用CUDA生態(tài)綁住用戶,減少對聯(lián)想、戴爾們的依賴。這有點(diǎn)像手機(jī)廠商從供應(yīng)鏈采購轉(zhuǎn)向自研芯片,只不過PC行業(yè)的"高通"想自己下場造手機(jī)。
英國監(jiān)管最近被Anthropic的Claude Mythos Preview嚇得不輕。這個模型意外挖出了數(shù)千個軟件漏洞,最古老的27歲,修復(fù)成本可能數(shù)億美元。倫敦股市當(dāng)場跌了0.8%,F(xiàn)DIC緊急要求銀行交AI風(fēng)險評估報告。Google DeepMind的反應(yīng)很直接:把AI安全測試預(yù)算提到2億美元。歐盟也在趕工《AI法案》補(bǔ)充條款——發(fā)現(xiàn)漏洞和制造漏洞之間,有時候只差一個提示詞的惡意。
馬斯克的Grok Computer 4月16日開測,架構(gòu)設(shè)計很有意思:"系統(tǒng)2"負(fù)責(zé)決策,"系統(tǒng)1"負(fù)責(zé)執(zhí)行,像大腦皮層指揮小腦。特斯拉股價盤前漲了2.1%,但競爭對手也沒閑著——OpenAI的"AutoGPT-4"企業(yè)版三季度上線,Google DeepMind拉著微軟Azure搞企業(yè)自動化,蘋果在下一代Siri里塞屏幕操作功能。這個賽道的融資額一季度已經(jīng)12.7億美元,環(huán)比增長15%。
微軟一位高管的提法可能讓整個SaaS行業(yè)重新定價:AI智能體應(yīng)該算"獨(dú)立用戶",單獨(dú)買許可。按人頭收費(fèi)的邏輯要變成"人頭+機(jī)器頭",企業(yè)軟件收入可能翻倍。谷歌云已經(jīng)在試點(diǎn)"智能體許可",Salesforce的Einstein GPT加了智能體計數(shù)模塊。這相當(dāng)于從賣椅子改成賣工位——椅子還是那把椅子,但算法要占一張桌。
OpenAI 2027年要在倫敦國王十字區(qū)開首個歐洲永久辦公室,544個工位,把當(dāng)?shù)貓F(tuán)隊從200人擴(kuò)到規(guī)模可觀。這個選址很講究:和Google DeepMind、Meta當(dāng)鄰居,形成AI集群。但"星際之門"英國項(xiàng)目已經(jīng)暫停,能源成本和監(jiān)管壓力讓OpenAI選擇了更輕的研發(fā)中心路線。《歐洲人工智能法案》8月生效,提前占位是為了合規(guī),也是為了搶歐洲的多語言人才。
亞馬遜云科技給S3加了文件系統(tǒng)接口,叫Amazon S3 Files。對象存儲終于能當(dāng)文件存儲用了,企業(yè)不用倒騰數(shù)據(jù)就能直接訪問。這個市場的年復(fù)合增長率6.8%,但非結(jié)構(gòu)化數(shù)據(jù)已經(jīng)占到總量八成以上。微軟Azure和阿里云都在跟進(jìn),統(tǒng)一存儲成了云廠商的必爭之地——畢竟數(shù)據(jù)搬家的成本,比存儲本身貴多了。
專家和普通人對AI的認(rèn)知差距,斯坦福報告里有個刺眼的數(shù)字:73%的AI專家認(rèn)為效率會提升,只有23%的公眾認(rèn)同。56%的專家積極樂觀,公眾里只有17%跟得上。這種"鋸齒狀前沿"背后,是美國坐擁全球43%的數(shù)據(jù)中心,臺積電壟斷九成先進(jìn)封裝產(chǎn)能。技術(shù)紅利和感知紅利,從來不在同一個時區(qū)。
Sam Altman的住宅兩天內(nèi)被襲擊兩次,OpenAI和馬斯克的千億訴訟4月27日開庭。Moderna更憋屈:mRNA癌癥療法被迫從"疫苗"改名"個體化新抗原療法",丟了7.76億美元聯(lián)邦合同。AI武器化也在加速,中東沖突驗(yàn)證了大模型的實(shí)戰(zhàn)價值,全球算力軍備競賽連帶推高了能源、化工、軍工產(chǎn)業(yè)鏈的重構(gòu)預(yù)期。
Meta的Ray-Ban智能眼鏡想加面部識別,70多個組織聯(lián)名反對,警告這會變成跟蹤者和施虐者的工具。EPIC已經(jīng)向FTC投訴,說實(shí)時識別會"徹底摧毀公共空間的隱私"。Meta此前為生物識別隱私付了約20億美元和解金,這次爭議可能讓智能眼鏡的擴(kuò)張計劃再踩一腳剎車。
微軟開源了Phi-4多模態(tài)推理模型,150億參數(shù),能在消費(fèi)級硬件上跑。VQAv2基準(zhǔn)準(zhǔn)確率72.3%,和250億的Llava-13B打平,但速度快18%、內(nèi)存省22%。工業(yè)檢測場景里缺陷識別準(zhǔn)確率91.2%,延遲壓到1.5秒內(nèi)。谷歌Gemini Nano 2只有80億參數(shù),Meta更新了Llava-14B,輕量化多模態(tài)成了2024年的顯學(xué)——邊緣計算和工廠車間,容不下機(jī)房里的大塊頭。
Transformer的注意力機(jī)制4月11日有個重要升級:Interleaved Head Attention(IHA)讓頭與頭之間共享信息,GSM8K推理任務(wù)提升5.8%,16k長上下文場景性能翻倍還多。2026年全球AI基礎(chǔ)設(shè)施支出預(yù)計4500億美元,推理算力首次占到七成以上,HBM市場規(guī)模要沖到546億美元,但產(chǎn)能缺口還有一半。IHA這類架構(gòu)創(chuàng)新,正在把AI從"+AI"的錦上添花,推向"AI+"的底層重構(gòu)。
哈佛大學(xué)的研究團(tuán)隊則用神經(jīng)網(wǎng)絡(luò)解量子錯誤,基于注意力機(jī)制的模塊化設(shè)計,在表面碼和顏色碼上都跑出了接近最優(yōu)的性能。關(guān)鍵是能處理量子比特丟失這類現(xiàn)實(shí)噪聲,容錯量子計算所需的物理量子比特數(shù)量可能大幅減少。另一項(xiàng)理論更激進(jìn):500個邏輯量子比特就能探測普朗克尺度的物理極限,檢驗(yàn)廣義相對論和量子力學(xué)的根本沖突。商業(yè)量子計算機(jī)的發(fā)展計劃,預(yù)計能突破這個閾值。
微軟那位高管的"智能體獨(dú)立席位"提法,目前還只是觀點(diǎn)。但Salesforce的計數(shù)模塊已經(jīng)上線,谷歌云的試點(diǎn)也在跑。SaaS行業(yè)按人頭收費(fèi)的邏輯,可能正在經(jīng)歷它自己的"Y2K時刻"——不是系統(tǒng)崩潰,是計價單位的徹底換底。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.