網易首頁 > 網易號 > 正文 申請入駐

馬云押寶成功,阿里新模型驚動馬斯克

0
分享至

阿里又發模型了。

昨晚,通義千問團隊在X上公布了Qwen3.5小模型系列,一共四個尺寸:0.8B、2B、4B、9B。

發完沒多久,馬斯克突然出現在評論區,毫不吝嗇地留下一句“Impressive intelligence density(令人印象深刻的智能密度)”



圖源:X

消息傳回國內,很快就有了“馬斯克點贊中國AI”的話題。

可以理解。畢竟馬斯克這個名字,自帶流量。但說實話,如果把注意力全放在“馬斯克點贊”這件事上,反而可能錯過真正有意思的東西。



阿里掀桌,終結參數內卷游戲

先看一個數字。

Qwen3.5-9B,參數量90億,它在GPQA Diamond上的得分是81.7。作為對比,ChatGPT有一個開源模型,參數量1200億,得分差不多。



圖源:X

也就是說,90億參數的模型,和1200億參數的模型,在同一個測試里打成了平手。

十三分之一的體積,差不多的本事。這背后是這兩年AI圈一直在琢磨的一件事:參數規模,到底是不是越大越好?

過去兩年的邏輯很簡單粗暴——誰參數多誰厲害。萬億參數的模型一個接一個往外冒,像重型卡車,馬力確實足,但油耗也驚人。

訓練一次的成本動輒上千萬美元,推理一次的電費都能讓中小公司肉疼。最后變成只有巨頭玩得起的游戲,但這顯然違背了科技發展的初衷。

因此,Qwen3.5走了另一條路。

它在架構上做了個改動:把“門控增量網絡”和“稀疏混合專家”結合起來,前向傳播的時候只激活當前任務需要的部分,不是所有神經元都撲上去。

聽起來有點繞,那我們換一種說法:假設你有一個4000萬冊的圖書館,以前每次查資料,得把整個館翻一遍。但現在有個聰明的檢索系統,只需要調那170萬冊核心藏書,就能答出差不多的答案。

這就是馬斯克說的“智能密度”——不在參數規模上堆料,在有限資源里壓榨出盡可能多的智能。

而這還不是全部。多模態能力的整合方式,藏著另一層門道。

Qwen3.5用的是“早期融合”——文本、圖像、視頻在底層就一起處理了,不像很多模型那樣,先有個文本模型,再在外面掛個視覺編碼器當附件。

這種差別,直接讓0.8B這種迷你模型的表現同樣征服了一眾開發者——它在語言基準MMLU-Pro上只拿到了29.7分,但在視覺任務MathVista上沖到了62.2,OCRBench拿了74.5。

有開發者甚至已經想到了該模型的應用價值,直言:“本地人工智能終于開始變得實用了。”



圖源:X



跑分是起點,場景才是終局

跑分歸跑分。真正讓開發者興奮的,是另一件事。

有人算了一筆賬:現在3萬美元的硬件,就能跑出去年需要20萬美元GPU才有的推理能力。



圖源:X

還有人直接上手演示——在iPhone 17 Pro上,用針對Apple Silicon優化的MLX框架,本地跑Qwen3.5-2B的6-bit版本,實時視覺理解、實時問答,全都跑得動。



圖源:X

這意味著什么?意味著普通人終于能用得起AI了!

意味著你可以不用聯網,不用把需求上傳到誰的云端,就能在自己手機里,有一個能看、能聽、能琢磨事兒的AI。

這背后其實是一個正在發生的轉變。

智能手機時代本質上是“單向輸入”的范式——你對著屏幕戳戳點點,手機給你反饋。

但即將到來的AI硬件浪潮,路子不一樣了。AI廠商們想干的事,是用更碎、更粘的方式,滲透進你的記憶和生活。

比如你戴著一副AI眼鏡走在路上,隨口問一句前面有沒有障礙物。這時候如果AI延遲了五秒才回答,那這功能幾乎就廢了。

而這恰恰是云端大模型繞不過去的物理瓶頸——上傳、計算、返回,再快的網絡也有那點延遲。

端側小模型的價值就在這兒。遇到真需要深度推理的復雜問題,可以扔給云端;但日常的、實時的、隱私敏感的,本地搞定。

阿里已經把Qwen小模型塞進了AI眼鏡這類可穿戴設備里,能做到毫秒級的端側視覺解析。

聽說蘋果那邊也在搗鼓帶攝像頭的AirPods和新一代VR智能眼鏡——這些玩意兒,將來可能就是你的“第二雙眼睛和耳朵”。

工業方面,IoT設備、工廠傳感器、醫療監測終端,這些場景里數據隱私更敏感,本地推理同樣是硬需求。



阿里野心勃勃,模型與硬件并發

事實上,阿里的這一步,邁得比大多數人想象的要大。

3月2日,千問AI眼鏡開啟“0元預約”,G1系列疊加補貼后最低1997元,3月8日現貨發售。

同一天,巴塞羅那MWC展臺上,五米高的“Qwen”標志下,海外觀眾排著隊等試戴。



圖源:巴塞羅那MWC現場

據媒體爆料,有美國用戶試完后給出高度評價——換電設計“太妙了”,續航焦慮明顯降低,“基本可以全天開機使用智能服務”。

而這只是開始。內部人士透露,今年年內,AI指環、AI耳機也會陸續落地,面向全球發售。

你可能想問:阿里做硬件,圖什么?

表面看是跟風——Meta的Ray-Ban眼鏡吃掉了七成市場份額,OpenAI組了兩千人的硬件團隊,字節的眼鏡耳機也在路上。巨頭們都在搶同一個東西:下一個AI入口。

但阿里的打法,跟別人不太一樣。

1月底,平頭哥官網上線了一款叫“真武810E”的AI芯片。

參數上看,性能對標英偉達H20,已經在阿里云部署了多個萬卡集群,服務了國家電網、中科院、小鵬汽車等400多家客戶。更重要的是,它被大規模用于千問大模型的訓練和推理。

芯片亮相的同時,一個叫“通云哥”的黃金三角浮出水面——通義實驗室做模型,阿里云做算力,平頭哥做芯片。

三個東西捏在一起,意味著什么?意味著阿里可以在芯片架構、云平臺架構、模型架構三個層面協同優化,而不是像大多數玩家那樣,拿著英偉達的卡、跑別人的框架、調第三方的模型。

業內有一種說法:全球能做到“大模型+云+芯片”全棧自研的公司,目前只有兩家,一家是谷歌,另一家是阿里。

這個說法含金量高不高另說,但邏輯是通的——端側硬件對成本和功耗極其敏感,如果芯片、模型、云不能深度耦合,體驗上就永遠差一口氣。

千問3.5能把部署顯存占用降低60%、推理吞吐量提升19倍,靠的不只是算法,還有底層硬件的配合。

所以硬件本身,從來不是阿里的目的。

春節期間,用戶在千問APP上“一句話下單”接近2億次,Questmobile數據顯示,千問在春節期間日活沖到7352萬,以940%增幅居國內AI應用首位。

這說明:千問已經從一個聊天機器人,變成了一個能點外賣、訂酒店、打車的國民級AI助手。

現在的問題是,這個助手能不能走出手機屏幕?

當你戴著AI眼鏡路過一家餐廳,掃一眼招牌,說一句“這家評價怎么樣,幫我訂個位”,隨即眼鏡開始識別畫面,調高德的數據,用支付寶完成支付——全程不用掏手機;你在異國街頭看不懂菜單,眼鏡直接在你視野里疊上翻譯;你騎車想記錄路線,對著指環說句話就搞定。

這就是阿里想要的“所見即所得”。它依賴的不只是模型聰明,更是背后那個能觸達數百萬商家、打通支付和出行、覆蓋生活服務全場景的生態。

阿里集團CEO吳泳銘有句話說的很好:AI最大的想象力,不在手機屏幕,而在于如何接管數字世界。

從這個角度看,千問做硬件的邏輯就清晰了——它想做的,是用硬件把阿里的服務網絡,編織到現實世界的每一個節點上。

而讓這一切能夠成為可能的,正是Qwen3.5這批被馬斯克大贊的、幾十億參數的“小東西”。

作者 | 劉峰

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
63歲李玲玉游西沙群島顯年輕,將不再幫兒子兒媳帶寶寶

63歲李玲玉游西沙群島顯年輕,將不再幫兒子兒媳帶寶寶

生命之泉的奧秘
2026-04-24 18:31:05
七千年前就開始化妝,中國古代貴婦的護膚史比你想的野多了

七千年前就開始化妝,中國古代貴婦的護膚史比你想的野多了

言安堂
2026-04-24 07:38:17
DeepSeek和梁文鋒給中國的兩個重大提醒

DeepSeek和梁文鋒給中國的兩個重大提醒

自由評論
2026-04-25 08:15:46
從越南難民到掌舵海軍:終結美軍政治正確的時代

從越南難民到掌舵海軍:終結美軍政治正確的時代

斌聞天下
2026-04-25 07:00:03
28歲華裔天才成百億富豪,建議美國封鎖中國AI技術,網友:太壞了

28歲華裔天才成百億富豪,建議美國封鎖中國AI技術,網友:太壞了

毒sir財經
2026-04-05 21:07:06
普京首次公開回應斷網情況

普京首次公開回應斷網情況

上觀新聞
2026-04-24 12:49:13
日本又地震,15萬人收到避難提醒,東京爆發抗議,高市或被迫下臺

日本又地震,15萬人收到避難提醒,東京爆發抗議,高市或被迫下臺

志宏教授
2026-04-25 08:24:40
女子和父母斷絕關系20年,母親來電拆遷分錢,女子:你有好心?

女子和父母斷絕關系20年,母親來電拆遷分錢,女子:你有好心?

紅豆講堂
2025-09-21 16:10:10
《八千里路云和月》收官,演技評分出爐,萬茜倒數,于和偉沒意外

《八千里路云和月》收官,演技評分出爐,萬茜倒數,于和偉沒意外

八斗小先生
2026-04-24 18:11:43
以牙還牙,中國打響反制第一槍,一舉切斷美歐命脈,美歐坐立難安

以牙還牙,中國打響反制第一槍,一舉切斷美歐命脈,美歐坐立難安

凡知
2026-04-24 17:49:57
金價跌破新低,持續震蕩!深圳水貝冷清不少!有商戶銷量下滑30%,消費者:再看看

金價跌破新低,持續震蕩!深圳水貝冷清不少!有商戶銷量下滑30%,消費者:再看看

南方都市報
2026-04-24 09:29:16
涉嫌計劃襲擊猶太會堂“盡可能多殺猶太人”,美國一18歲女子被捕

涉嫌計劃襲擊猶太會堂“盡可能多殺猶太人”,美國一18歲女子被捕

觀察者網
2026-04-24 08:57:24
何鴻燊最后11年過得是什么樣的日子?說出來可能顛覆很多人的認知

何鴻燊最后11年過得是什么樣的日子?說出來可能顛覆很多人的認知

人生錄
2026-04-22 19:01:34
震驚!男方登門提親,飯店用餐男方未主動結賬,由女方付款引熱議

震驚!男方登門提親,飯店用餐男方未主動結賬,由女方付款引熱議

火山詩話
2026-04-24 13:23:25
賴清德無法竄訪,盧秀燕表態后,日本也發聲了,非常不簡單

賴清德無法竄訪,盧秀燕表態后,日本也發聲了,非常不簡單

凡知
2026-04-24 17:17:02
古蒂:穆里尼奧早已不在巔峰水準,不看好他回歸皇馬

古蒂:穆里尼奧早已不在巔峰水準,不看好他回歸皇馬

懂球帝
2026-04-25 07:41:07
降級已定,萊斯特城為何還要拼命

降級已定,萊斯特城為何還要拼命

籃壇第一線
2026-04-25 08:08:54
駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

駐日武官王慶簡:為日本潛伏20年出賣軍事機密,卻因一動作暴露身份

睡前講故事
2026-02-03 20:55:43
高峰現狀:離開那英后娶了同學,住北京郊區小院,和兒子形同陌路

高峰現狀:離開那英后娶了同學,住北京郊區小院,和兒子形同陌路

冷紫葉
2026-04-21 13:26:25
距離謝娜演唱會開唱,還有10余天,我已經笑死在評論區了!

距離謝娜演唱會開唱,還有10余天,我已經笑死在評論區了!

娛樂圈筆娛君
2026-04-22 14:35:22
2026-04-25 08:59:00
新行情 incentive-icons
新行情
做最具價值的商業信息分享平臺
3007文章數 1112關注度
往期回顧 全部

科技要聞

DeepSeek V4牽手華為,價格依然"屠夫級"

頭條要聞

兩屆奧運冠軍、中國羽協主席張軍"失聯" 知情人士發聲

頭條要聞

兩屆奧運冠軍、中國羽協主席張軍"失聯" 知情人士發聲

體育要聞

上海男籃23連勝+主場全勝 姚明之后最強一季

娛樂要聞

停工16個月!趙露思證實接拍新劇

財經要聞

LG財閥內斗:百億美元商業帝國爭奪戰

汽車要聞

零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

態度原創

教育
房產
時尚
親子
家居

教育要聞

“只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

朱珠到底為什么接這部劇?

親子要聞

34歲男星喜得女!妻子試管成功保胎三月,28周早產

家居要聞

自然肌理 溫潤美學

無障礙瀏覽 進入關懷版