大家好,我是冷逸。
最近阿里千問的節奏,已經不能用“高強度更新”來形容了,更像是“腹瀉式發布”。
想問下阿里的小伙伴,你們是不是把整個Qwen團隊都蒸餾成了同事.skill啊,不然怎么做到一天發一個模型的?
你看這節奏:
3月30日,發布全模態模型Qwen3.5-Omni,直接拿下215項SOTA;
4月1日,發布圖像模型Wan2.7-Image,據我身邊不少朋友實測,超長文字渲染能力離譜地強;
4月2日,發布基座大模型Qwen3.6-Plus,比3.5又拉開了一截;
4月3日,又掏出Wan2.7-Video,一句話就能P視頻。
![]()
真的,如果我有5個冷逸.skill,我一定把這些模型全都測一遍。
可惜,目前我還沒完成自我煉化,只有一個真人冷逸。所以今天,我們重點測一下Qwen3.6-Plus。
先快速認識一下這個模型:
100M上下文窗口
重點強化Agentic Coding
原生多模態(支持文本/圖片/視頻輸入)
原生聯網+Function Calling,可調用外部工具,適配龍蝦
API價格:輸入¥2/百萬tokens,輸出¥12/百萬tokens,不到Claude的1/18
兼容OpenAI和Anthropic協議,Claude Code、Codex和OpenClaw都能用
![]()
順帶一提,這張信息圖,也是Qwen3.6-Plus直接生成的。
![]()
一手實測
這次,我主要測了3大場景6個Case,交叉使用Claude Code、OpenClaw、cherry studio、chat.qwen.ai來綜合評估這個模型。
1)視覺編程
先來個簡單的。
我給了Qwen3.6-Plus一張學生書包圖片,讓它生成商品網頁。
Prompt:請為這款學生書包設計一個精致的圖文發布網頁,目標人群是6-15歲的中小學生。
![]()
出來的頁面還挺像那么回事。
![]()
整體主色調是奶油白 + 暖灰,和書包本身的米白色呼應。視覺風格是典型的日系極簡風(Minimalist & Clean)。
既保留了學生用品的親和力,又不會顯得廉價。
能看出,這個模型對視覺內容的理解還是比較在線的。
于是我決定給它加點難度。我喂了一整個文件夾模特照片,讓它生成一個攝影師作品網站。
Prompt:我是拍模特廣告的攝影師,我的工作室叫「小逸攝影」,文件夾 D:\Vibe Coding\Qwen3.6-plus\模特圖片 放了一些模特圖片,給我生成一個高級審美、大師水準的攝影師作品網站,用上文件夾里的圖片并配上精美的講解。
成品出來的時候,我第一反應是:有點驚艷。
整體是深色主題+金色點綴+優雅字體,整個氣質看起來像那種電影節攝影展網站。
而且細節也沒偷懶:
點擊圖片燈箱放大
頁面滾動漸顯動畫
響應式設計(手機/平板自適應)
但真正讓我意外的,是它的文案能力,我挑幾張給大家看下。
![]()
![]()
![]()
真的,這種一看就很高級,很舒服。
很多模型做網頁有個通病:「UI很好看,但文案像實習生寫的。」
但Qwen3.6-Plus這次,從Logo到Slogan,以及小字解釋,它寫的文案,我幾乎挑不出什么毛病。
Vibe Coding真正進入生產場景,多模態能力是剛需。目前全球既擅長Coding又具備視覺理解能力的模型,其實沒幾家。
從我的實測來看,Qwen3.6-Plus在視覺編程這一塊,是合格的。
2)視覺理解&推理
接著,我測了一個稍微變態一點的題。
一張成都地鐵線路圖。
![]()
問題是:我在二仙橋,如果7號線癱瘓,我去火車南站一共有多少條路線?最少的換乘路線是哪條?
這題其實挺難的,模型思考了128秒才回答我。
![]()
我原本以為它會翻車,結果卻答對了。
![]()
接著我又測了一道題,把Qwen3.6-Plus的視覺benchmark表現發過去,問它Qwen3.6究竟強在哪里。
![]()
答案:
![]()
現在,再回過頭來看這張benchmark,一下子就懂了。
這說明什么?
說明這個模型已經不只是看圖識物、OCR文字識別,而是能結合視覺理解、路徑推理、信息定位,來完成復雜任務。
當模型不再停留在“看懂圖片”,而是開始圖表解析、UI理解、文檔理解、細粒度定位……那它就已經不是一個“視覺模型”,而是開始向多模態智能體進化。
而Qwen3.6-Plus,正是阿里發布的第二款原生多模態基座模型。
3)Agentic任務
最后,我重點測了一件事情:Agentic能力+長程任務。
第一個case,是我前幾天給大家介紹過的自動寫公眾號神器。
我的需求是:
給我做一個“沃垠AI寫作神器”的全功能網站,直接打開html主頁就能運行。功能要求:
1、有三個核心功能:正文生成、標題摘要生成(先生成正文后,再根據正文來生成標題和摘要)、封面生成。正文、標題摘要接同一個模型,圖片接另外一個模型。
2、主界面有一個輸入會話框,給到示例模板“幫我寫一篇公眾號文章,主題是xx,字數xx,內容要點有:1.xx,2.xx……”,用戶輸入內容主題和寫作要求后,開始調用大模型進行寫作。
3、輸入會話框設計有“聯網”功能,支持用戶手動打開和關閉聯網功能。
4、輸入會話框還設計有風格1、風格2等可選的寫作風格模板。目前只有一個“風格1:科技媒體評論”,風格控制Prompt見本地文件“風格1:科技媒體評論.txt”。
5、寫作和生圖均支持用戶自行調用大模型。調用接口設計成可視化窗口,用戶只需要輸入模型url、模型key和模型名字,就可以使用。
5、先寫正文,寫完正文后,再批量出一批標題和摘要,供用戶選擇。
6、最后,再根據本文的核心內容提煉2-3個關鍵內容點,并生成封面圖片的文生圖prompt,統一尺寸比例2.35:1,用戶選定某個prompt后,調用生圖模型一鍵生成封面圖片。
7、正文和標題摘要,都設計有復制按鈕,支持用戶一鍵復制文本。封面圖片,設計有下載按鈕,支持用戶下載到本地。
新版「沃垠AI寫作神器」,不需要做本地配置,直接打開HTML,然后接入API就能用。
它可以自由加載你訓練的寫作風格(結構化的提示詞),只需要點“寫作風格”旁的+號,它會自動解析文件內容(文件名統一為“風格xxx.txt”),并添加到下拉列表。后面,我們只需要點一下就能使用。
![]()
需要新版本的朋友,直接后臺回復【寫作】,就能領走這個HTML。
這次開發,我只迭代了5個版本,整個過程半小時搞定,直接交付2000+行可運行代碼。
比我上次的開發效率,至少提升了兩倍。
接著,我又用搜索+office+skills任務測了一輪Qwen3.6-Plus。
需求是,聯網調研張雪機車的發展軌跡,生成5000字Word報告,然后調用skills把報告做成知識網站。
Prompt:聯網搜索、調研張雪機車的發展軌跡,盡量從權威信源獲取信息。首先,給我創建一份5000字的word調研報告。然后,調用Knowledge Site Creator Skills給這份報告創建一個知識學習網站,頁面高級審美。
期間,模型調用了web search、python-docx、Claude skills等工具。我數了一下,工具調用超過50次。
先看word報告。
![]()
信息完整度還是不錯的。老實說,我一直想系統了解張雪機車,這份報告對我來說挺有價值。
然后再看它生成的知識網站。
我第一眼看到的時候,直接一句「臥槽」。
這UI和內容質量,都比我預期高很多。
整體跑下來,我的結論很簡單:Qwen3.6-Plus的Agentic能力,明顯被低估了。
當一個模型同時擁有:
100M上下文
原生多模態
強工具調用能力
那它在Agentic Coding和Agentic Work領域,都是非常有想象空間的。
![]()
整體體驗下來,我覺得Qwen3.6-Plus在文本推理、視覺理解、代碼能力、長程任務和Agentic能力上都還挺強的。
難怪它能夠在多個benchmark上拉開Qwen3.5一大截。
![]()
而這個價格卻不到Claude的1/18。
這就有點像什么?
就好像一個演員,明明是小李子的演技,卻拿著李洪綢的片酬,然后天天坐在片場看隔壁李現的表演。
更離譜的是,這個李洪綢,還時不時把自己的作品免費上傳B站。
這對嗎?
說實話,我不知道。
但我在他們官方文章里看到一句話:在未來不久,我們還將開源更小規模的模型版本,以此重申我們對技術普惠與社區驅動創新的堅定承諾。
看完后,我就覺得:源神牛逼。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.