網易首頁 > 網易號 > 正文 申請入駐

千問3.5,把「貴」字從AI字典里刪了

0
分享至


文:王智遠 | ID:Z201440

今天除夕,阿里發了Qwen 3.5。

為什么阿里非要把這款大模型放在春節期間發布?因為春節是中國人最重要的日子,他們對這款產品有絕對的信心。

這款讓阿里「除夕夜加班」的模型,到底強在哪?

01

先看一組數字。Qwen 3.5-Plus,總參數3970億,激活只用了170億。

什么意思呢?打個比方:

一個公司有3970名員工,涵蓋各種領域的專家;但每次接到任務,他們不搞全員大會,只根據任務類型,精準叫醒最懂行的170個人出來干活。

結果呢?這170個人干的活,比對手1萬人的團隊、數百人的專家還要漂亮。

這就是「以小勝大」。

上一代Qwen3-Max是萬億參數,這一代Qwen3.5-Plus只有不到4000億總參數,但性能反超了;推理吞吐量最高提升19倍,部署成本降低60%。

翻譯成大白話即:跑得更快,吃得還少。憑什么能做到呢?憑阿里這次在底層架構上動了三刀。

第一個刀法叫「混合注意力機制」。以前大模型處理長文本,像一個人讀一本厚厚的書,每讀一個字都要回頭復習前面所有的字。

讀到第1萬字,得把前面9999個字都過一遍;這誰受得了?

千問3.5的做法:重要的內容精讀,次要的內容略讀,像人讀書一樣,該快的地方快,該慢的地方慢。效率和精度,同時保住了。

第二個刀法叫「極致稀疏MoE」。

前面說的那3970名員工,每次只叫醒最相關的17個,這叫「稀疏」,誰懂誰進來;過去那種「把所有專家都請到會議室」的稠密模型,太累了,看著陣仗大,其實大部分人在玩手機。

第三個刀法叫「多Token預測」。

以前模型生成文字,是一個字一個字往外蹦,蹦完第一個想第二個,蹦完第二個想第三個。

千問3.5換了個思路:先想好接下來幾步說什么,然后一口氣說出來。就像你聊天,是想好一整句話再說。結果呢?響應速度翻倍。



注釋:同樣的時間內,千問3.5能吐出多少內容。32K上下文時,它是Qwen3-Max的8.6倍;256K超長上下文時,直接飆到19倍。

值得一提的是,還有一個刀法叫「門控機制」。這是千問團隊拿了NeurIPS 2025最佳論文的技術。

簡單說,給注意力裝了個「智能水龍頭」,該放大的信息放大,該過濾的過濾,防止有效信息被淹沒,也防止無效信息瞎嚷嚷。

這個水龍頭裝在哪、怎么調,是人家一年前就開始琢磨的事,現在終于用上了。

所以,幾道下來,效果怎么樣?

考驗知識廣度的MMLU-Pro評測中,千問3.5拿了87.8分,超過GPT-5.2。專為難倒博士設計的GPQA難題集上,88.4分,超過Claude 4.5。

考驗模型能不能聽懂人話的IFBench指令遵循測試中,76.5分,刷新所有模型紀錄。

至于動手能力,也就是行業里說的Agent智能體,BFCL-V4和Browsecomp兩個評測里,千問3.5全面超越Gemini 3 Pro和GPT-5.2。

說白了,樣樣強。但比分數更有意思的是方向。

過去兩年,大模型行業信奉「大力出奇跡」,參數從千億堆到萬億,性能確實在漲;代價也在漲,部署要專用集群,推理要燒算力,中小企業用不起,端側設備跑不動。

千問3.5換了一條路:用技術創新替代參數堆砌,用架構效率替代蠻力硬扛。這條路,至少目前看,走通了。

02

走通了,問題來了,當模型變得更聰明、更便宜,它能幫我們做什么?

用一個詞總結就是:原生多模態。

市面上很多模型也說自己「多模態」,能看圖、能識字。但仔細看,大多是拼裝的;先訓好一個語言模型,再外掛一個視覺模塊,中間靠「適配器」勉強對齊。

有的產品甚至在后臺做路由分發,你發一張圖,它悄悄轉給另一個模型處理,用戶以為是一個模型全能,其實多個模型輪班。

千問3.5走了一條不同的路。

預訓練第一天起,在文本、視覺混合數據上一起學。不是先學會說話再睜開眼睛,是一邊看世界一邊學說話。

視覺和語言在同一個神經網絡里深度融合,看到一張圖,自然就懂它的語義;讀到一段文字,腦子里能自動構建對應的畫面。沒有中間翻譯,沒有信息折損。

這叫「原生」。

智遠認為,「原生」價值在于它為后續的能力進化埋下了伏筆,因為只有從底層打通了視覺和語言,模型才可能真正理解物理世界的邏輯,這是通往AGI的必經之路。

打通之后,千問3.5能做什么?

先說看得見的。

它能理解長達2小時的視頻;你扔進去一部電影,它能分析劇情走向、人物關系、因果關系,是真的看懂了時間線上的變化。

它能對圖像做像素級定位,你想改圖上某個地方,說句話它就懂;它還能把手繪的界面草圖直接轉成可運行的前端代碼,產品經理畫個框,程序員不用寫了。

甚至,它能看懂截圖里的UI問題,然后自動修復。

數字也能說明問題;多模態推理的MathVison評測里,千問3.5拿了第一。通用視覺問答RealWorldQA里,第一。OCR文字識別CC_OCR里,第一。

空間智能RefCOCO里,第一。視頻理解MLVU里,還是第一。相比上一代的千問視覺專項模型,千問3.5的空間定位推理、帶圖推理能力都大幅增強,看得見,還看得準。

有了「看懂世界」的能力,千問3.5開始「動手辦事」了。

它可以自主操作手機和電腦,跨應用完成復雜任務。你說「幫我把昨晚聚會的照片整理成相冊,再挑幾張發朋友圈」,它能自己打開相冊、篩選照片、編輯文案、切換到微信、發布。

一系列操作,不用你動手。

千問團隊還專門搭了一套強化學習框架,讓智能體在真實場景里反復練習,端到端效率提升3到5倍。

春節期間,千問App的AI購物Agent上線,6天時間幫用戶完成了1.2億筆訂單,這是全球第一次,AI在真實世界里大規模幫人辦事,還辦成了。

從「看懂」到「動手」,千問3.5邁出了關鍵一步。這些技術創新,對于商業有什么影響呢?

03

先說結論:價格便宜了,API價格每百萬Token只要0.8元,只有Gemini 3 Pro的1/18。

很多人第一反應:這不是賠本賺吆喝嗎?錯了。極致性價比,是設計出來的。如果補貼,那不可持續;但如果成本結構本身就不一樣,那就是降維打擊。

那成本咋降的呢?就三點:

一,架構本身就省錢。總參數3970億只激活170億,算力需求本來就少,成本天然就低。

第二,芯片幫了大忙。阿里有平頭哥,有自己真武芯片。這顆芯片針對MoE架構做了大量優化。

通用芯片跑MoE,很多算力浪費在「調度專家」這件事上;真武芯片專門為這種模式設計,相當于給模型配了個「懂行的調度員」,同樣的電,干更多的活。

這部分是云廠商自研芯片才有的紅利,第三方模型拿不到。

第三,云基礎設施的協同。

千問3.5的訓練和推理都在阿里云上跑,通過FP8/FP32混合精度這類底層優化,激活內存減少約50%,訓練提速10%。

不懂這兩個詞沒關系,你可以把它理解成,就像裝修時有的地方用實木、有的地方用復合板,整體效果不變但材料成本低了。

更關鍵的是,模型和云是「一家人」,調度、部署、擴容都比跨廠商順暢得多。這種效率損耗的減少,最終都折算成成本的降低。

三點說完就清晰了,千問3.5的便宜,是「設計」出來的。

當頂級模型變成白菜價,商業世界會發生什么?

門檻肯定拉平。過去調用頂級模型,中小企業要掂量掂量預算;現在每百萬Token 0.8元,相當于寫一本《三體》那樣的長篇小說,成本也就幾塊錢。

AI能力不再是巨頭的專利,創業團隊、個人開發者都用得起。

然后,是場景被激活;成本足夠低,開發者才敢放心大膽地用,做錯了重來,實驗失敗了再來一次,不心疼。這會催生一大批之前不敢想的AI應用。

沙利文數據顯示,千問在中國企業級大模型調用市場中位居第一;Omdia的數據說,2025年上半年,中國AI云市場阿里云占35.8%,超過第二到第四名總和。

2025年全年,阿里云在中國云市場的份額從33%提升到36%,領先優勢進一步擴大。

這些數據說明一件事,在千問3.5發布之前,「Powered by 阿里云」就已經是很多企業的默認選項。而今天,當新模型把性能推到新高、把成本打到新低,這個「默認選項」的勢能只會被進一步放大。

就像云計算當年把服務器成本打下來,催生了無數互聯網創新。模型、芯片、云形成的正循環,正在讓阿里云成為AI時代的基礎設施。

但,還有更狠的,阿里居然在春節把它開源了。

04

你想想,一個模型性能追平甚至超過GPT-5.2、Gemini 3 Pro,API價格只要人家的1/18,按理說藏著賣錢多好;阿里偏不,直接開源,代碼、權重全放出來,誰愛下誰下,誰愛改誰改。

圖啥呢?智遠覺得,阿里打的算盤是「建生態」。

你看幾個數字:

到今天,千問開源模型超過400個,什么尺寸都有,從0.5B的小模型到400B的大模型,純文本的、視覺的、多模態的,覆蓋得嚴嚴實實。

全球開發者基于千問做的衍生模型,超過20萬個;下載量突破10億次,甚至單月下載量比DeepSeek、Meta、OpenAI、智譜、Kimi、MiniMax這六家加起來還多。

李飛飛團隊在用,愛彼迎在用,全球各地的創業公司、個人開發者都在用。

這意味著什么?

千問成了AI圈的「公共基礎設施」。你做項目,想找個開源模型,不用糾結選哪個,因為千問最好用、最全、還免費,你用著用著,就習慣了;習慣著習慣著,就離不開了。

這就是開源的魔力。

歷史上,這套打法被驗證過兩次。第一次是Linux。上世紀90年代,服務器操作系統還是Windows NT和各種Unix的天下,Linux橫空出世,免費、開源、全世界一起改bug。

一開始沒人當回事,覺得「免費的東西能好到哪去?」結果呢?今天互聯網服務器超過96%跑在Linux上;沒人問「為什么不用Windows Server」,因為Linux就是默認選項。

安卓也這么干的。手機廠商想做系統,要么自己從頭造(累死),要么用安卓(省事);結果全球幾十億臺手機,都跑在安卓上。

阿里現在做的,就是AI時代的Linux和安卓。

把最強模型開源,讓全球開發者幫你迭代、幫你完善、幫你把它用到各種奇奇怪怪的場景里;衍生模型越多,生態就越厚;生態越厚,后來者就越難繞過。到最后,「用千問」就變成了「不用思考的事」。

而且這個生態,最后會流回阿里云。

你想,開發者用千問做應用,跑在哪里?最順手、最便宜、最沒兼容問題的地方,當然是阿里云;企業用千問做業務,調API找誰?當然是「模型芯片云一家人」的阿里云。

這就是閉環,開源吸引開發者,開發者繁榮生態,生態帶動云服務,云服務反哺模型迭代;一圈轉起來,越轉越快。

智遠認為,這才是阿里「除夕開源」的真正用意,搶未來十年的生態位;所以,你看,千問3.5發布,表面是技術事件,其實阿里在AI時代布的一盤大棋。

千問3.5憑什么「以小勝大」?因為有技術創新、有原生多模態、有極致性價比、有開源技術。

大模型的「噸位戰」結束了。

接下來比的,是誰能讓更多人用得起、用得上、用得順手;參數不重要,效率才重要;跑分不重要,生態才重要;閉源不重要,開源才重要。

2026年剛開始,阿里就把牌桌掀了。接下來,就看其他人怎么跟。

對了,開發者現在就能上手,魔搭社區和HuggingFace已經可以下載新模型,想直接調API的,去阿里云百煉就行。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
丟人!假空姐大鬧亞航后續:賬號被扒正臉曝光,十級美顏淪為笑話

丟人!假空姐大鬧亞航后續:賬號被扒正臉曝光,十級美顏淪為笑話

壹月情感
2026-04-25 13:23:50
NBA季后賽明天4月26日賽程:雷霆沖擊賽點,掘金PK狼隊避免3連敗

NBA季后賽明天4月26日賽程:雷霆沖擊賽點,掘金PK狼隊避免3連敗

薇說體育
2026-04-25 16:52:59
下課倒計時!火箭3連敗+烏杜卡遭完爆,拒絕哈登加盟,你后悔嗎?

下課倒計時!火箭3連敗+烏杜卡遭完爆,拒絕哈登加盟,你后悔嗎?

兵哥籃球故事
2026-04-25 15:57:34
全世界會發現,伊朗戰爭打完后,世界只剩下一個超級大國了

全世界會發現,伊朗戰爭打完后,世界只剩下一個超級大國了

深析古今
2026-04-14 00:35:58
老人1500元賣掉自家大狗,小孫女舍不得哭得撕心裂肺,狗販心軟不收了,只要求退回1300元,“那200塊就當補償小姑娘吧”

老人1500元賣掉自家大狗,小孫女舍不得哭得撕心裂肺,狗販心軟不收了,只要求退回1300元,“那200塊就當補償小姑娘吧”

觀威海
2026-04-24 10:56:04
用了這么多年Mac才發現,我天天拔插充電線的樣子像個傻子…

用了這么多年Mac才發現,我天天拔插充電線的樣子像個傻子…

小柱解說游戲
2026-04-22 11:19:09
出乎意料!2032奧運主辦地確定了,不知名小城市以72:5碾壓當選

出乎意料!2032奧運主辦地確定了,不知名小城市以72:5碾壓當選

安珈使者啊
2026-04-24 11:44:45
猛降14℃!降溫、降雨、雷暴大風即將抵達長沙!另外,“五一”假期長沙天氣最新預測→

猛降14℃!降溫、降雨、雷暴大風即將抵達長沙!另外,“五一”假期長沙天氣最新預測→

芒果都市
2026-04-25 15:31:14
鄭愷苗苗合體露面被偶遇,手挽手同行超甜蜜,真夫妻就是好嗑

鄭愷苗苗合體露面被偶遇,手挽手同行超甜蜜,真夫妻就是好嗑

扒蝦侃娛
2026-04-24 16:32:53
斯馬特加時賽拿下8分,97年以來湖人球員僅次于科比

斯馬特加時賽拿下8分,97年以來湖人球員僅次于科比

懂球帝
2026-04-25 12:50:45
她為兒子息影,卻在丈夫肝癌去世后,從主持人到演員,靠演技出圈

她為兒子息影,卻在丈夫肝癌去世后,從主持人到演員,靠演技出圈

以茶帶書
2026-04-25 15:05:16
昔日福建地產首富黃其森卸任泰禾集團董事長,年初剛解除留置,身家曾達200億

昔日福建地產首富黃其森卸任泰禾集團董事長,年初剛解除留置,身家曾達200億

紅星新聞
2026-04-25 14:28:17
全球最疲憊總統宣布退場

全球最疲憊總統宣布退場

劉瀾昌
2026-04-25 08:43:52
TVB老戲骨忍無可忍含淚揭家丑,每月接濟兒子五萬,走了向太老路

TVB老戲骨忍無可忍含淚揭家丑,每月接濟兒子五萬,走了向太老路

翰飛觀事
2026-04-22 19:35:28
萬萬沒想到,打敗彩禮居然是社保

萬萬沒想到,打敗彩禮居然是社保

放牛娃的遐想
2026-03-03 08:34:32
廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開眼

廣東珠海一女神好漂亮, 身高179cm,體重50kg 美的讓人移不開眼

今日搞笑分享
2026-04-06 17:55:16
黃一鳴回應:沒結婚一天找8個男的也沒關系,承認跟40歲大叔交往過

黃一鳴回應:沒結婚一天找8個男的也沒關系,承認跟40歲大叔交往過

林雁飛
2026-04-25 17:07:43
局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

云舟史策
2026-04-23 07:32:35
我勒個去!25歲還是當家老大,26歲成魚腩替補,他怎么混這么差

我勒個去!25歲還是當家老大,26歲成魚腩替補,他怎么混這么差

球毛鬼胎
2026-04-25 16:13:02
成都一居民小區凌晨起火致5死2傷,記者現場探訪:起火樓棟入口被熏黑,傷者無生命危險

成都一居民小區凌晨起火致5死2傷,記者現場探訪:起火樓棟入口被熏黑,傷者無生命危險

極目新聞
2026-04-25 16:02:45
2026-04-25 17:56:49
智遠同學 incentive-icons
智遠同學
暢銷書《復利思維》作者;精神生活與商業探索,關注科技人文、消費電商、品牌營銷、商業認知思維等方面。
683文章數 160關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

伊朗最高領袖一條腿截肢面部嚴重燒傷 通信方式披露

頭條要聞

伊朗最高領袖一條腿截肢面部嚴重燒傷 通信方式披露

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

家居
時尚
本地
公開課
軍事航空

家居要聞

自然肌理 溫潤美學

上新|| 入夏第一件短袖,買它!

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美防長:戰事不會“沒完沒了”

無障礙瀏覽 進入關懷版