无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Qwen3.6-35B 量化版,vLLM本地部署,性能實測

0
分享至

一文中我把這個模型和本地部署(原版以及 GGUF)講清楚了,但是它 70 多個 GB 的模型文件,我的 4090 吃起來很費勁。

昨天我又向大家介紹了 ,包括 4bit 量化版、推理加速版、Claude Opus 蒸餾版,模型文件壓到 20GB 左右就舒服多了


我更喜歡的事 vLLM 啟動,兼顧速度與并發,內網其他業務系統也能用到

我之前部署了 Qwen3.5-35B 的這個量化版本,vLLM 0.17 部署它很完美

關閉思考之后的性能測試,單并發可以到 148Token/s

PS:以下測試均為關閉思考后的結果 Qwen3.6關閉思考方式沒變


雖然官方建議是 vLLM 0.19 起步,但是我發現 0.17 也可以拉起 Qwen3.6-35B

啟動腳本:

set -euo pipefail

MODEL_DIR="/data/models/Qwen3.6-35B-A3B-AWQ-4bit"
CONTAINER_NAME="qwen35-35b-a3b-int4"
PORT=3004

docker rm -f "${CONTAINER_NAME}" 2>/dev/null || true

docker run -d \
--name "${CONTAINER_NAME}" \
--gpus '"device=1,2"' \
--ipc=host \
--shm-size=16g \
-p ${PORT}:8000 \
-v "${MODEL_DIR}":/model \
-e NCCL_P2P_DISABLE=0 \
-e NCCL_IB_DISABLE=1 \
--restart unless-stopped \
vllm/vllm-openai:v0.17.0 \
--model /model \
--served-model-name qwen3.5-35-int4 \
--tensor-parallel-size 2 \
--max-model-len 102400 \
--kv-cache-dtype fp8 \
--gpu-memory-utilization 0.9 \
--max-num-seqs 24 \
--max-num-batched-tokens 8192 \
--language-model-only \
--enable-prefix-caching \
--default-chat-template-kwargs '{"enable_thinking":false}' \
--host 0.0.0.0 \
--port 8000

100K 上下文的顯存占用


性能測試,稍微弱于 Qwen3.5 一丟丟,微乎其微


,用它啟動 Qwen3.6-35B-A5B,性能又弱了一丟丟。。。


內網沒辦法做 toolcall 測試,我只是簡單對比了一下它們的編程能力


代碼量上,3.5 大約 477 行,3.6 大約 256 行

3.5 明顯更長,用 CSS 動畫實現,但長出來的很多部分其實是解釋、重復和前后不一致的內容,不是真正有效的實現,沒次刷新頁面才能短暫看到燃放瞬間。


3.6 的想法更單純,就是用 Cancas 把煙花升空、爆開、消散這一整套過程連續畫出來,甚至還用了數據計算模擬重力,所以方向更清楚,最大的問題是畫面位置弄錯了,所以我實際打開時幾乎就是黑屏


半斤八兩吧,初版都有 bug,指出問題重新生成

最后看下生成速度 150 左右 tokens 每秒 還是很賞心悅目的

本文核心是性能測試,實際體驗,要再用用

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
突發!內塔尼亞胡,危險了!

突發!內塔尼亞胡,危險了!

財經要參
2026-06-17 09:00:06
阿根廷主持人自曝:梅西在世界杯前主動發消息,還幫老婆擋采訪

阿根廷主持人自曝:梅西在世界杯前主動發消息,還幫老婆擋采訪

喜歡歷史的阿繁
2026-06-17 17:39:25
再打假!耿同學發視頻稱北航杰青副院長Nature論文漏洞百出,共同通訊作者單位已刪除宣傳稿

再打假!耿同學發視頻稱北航杰青副院長Nature論文漏洞百出,共同通訊作者單位已刪除宣傳稿

TOP大學來了
2026-06-17 18:00:35
印巴空戰打醒印尼!砸錢買中國戰機,直接復刻巴鐵配置

印巴空戰打醒印尼!砸錢買中國戰機,直接復刻巴鐵配置

魔神主的仇恨
2026-06-16 18:42:01
三大AI預測烏茲別克斯坦vs哥倫比亞:各家均預測哥倫比亞2比0

三大AI預測烏茲別克斯坦vs哥倫比亞:各家均預測哥倫比亞2比0

懂球帝
2026-06-17 16:30:32
沉默5天后,國防部通告菲律賓,中國停止仁慈,對菲反制說到就到

沉默5天后,國防部通告菲律賓,中國停止仁慈,對菲反制說到就到

今墨緣
2026-06-17 10:09:16
日本是無法造出核武器,但能造出一種大殺器威脅中國,必須警惕!

日本是無法造出核武器,但能造出一種大殺器威脅中國,必須警惕!

阿胡
2025-12-23 19:00:39
原來她是哈蘭德的女友,難怪老公2億歐元身價,曾在20歲未婚生子

原來她是哈蘭德的女友,難怪老公2億歐元身價,曾在20歲未婚生子

動物奇奇怪怪
2026-06-17 21:20:48
劉濱已經擔任扇子藝術協會會長,從毛新宇妻子蛻變成女強人

劉濱已經擔任扇子藝術協會會長,從毛新宇妻子蛻變成女強人

李昕言溫度空間
2026-06-15 20:54:42
德尚:草皮下面的土壤厚度不夠,使得球鞋沒法形成有效的抓地

德尚:草皮下面的土壤厚度不夠,使得球鞋沒法形成有效的抓地

懂球帝
2026-06-17 07:40:10
“一天四次誰受得了呀”,丈夫需求太旺盛,妻子無法忍受將其毒死

“一天四次誰受得了呀”,丈夫需求太旺盛,妻子無法忍受將其毒死

易玄
2026-06-13 19:17:27
西蒙斯帶女友度假,求婚成功,女友很性感,1億合同到期了

西蒙斯帶女友度假,求婚成功,女友很性感,1億合同到期了

TVB的四小花
2026-06-18 01:24:10
孫穎莎就算退役,也不會和王楚欽一起,她的征途,遠不止一張球臺

孫穎莎就算退役,也不會和王楚欽一起,她的征途,遠不止一張球臺

法老不說教
2026-06-17 23:13:36
這個“臺獨”教授當選立委后,開始力挺兩岸交流?

這個“臺獨”教授當選立委后,開始力挺兩岸交流?

金牛傳聲
2026-06-17 17:38:45
國乒女隊迎來新格局!22 歲草根黑馬逆襲上位

國乒女隊迎來新格局!22 歲草根黑馬逆襲上位

最愛乒乓球
2026-06-18 00:08:53
換上2名老將后瞬間變強,中國女排3-2逆轉勝德國女排,但有隱憂

換上2名老將后瞬間變強,中國女排3-2逆轉勝德國女排,但有隱憂

真理是我親戚
2026-06-17 20:16:55
瞞不住了!帕公主靈前提幫功全程失態,泰王多年布局徹底落空!

瞞不住了!帕公主靈前提幫功全程失態,泰王多年布局徹底落空!

小魚愛魚樂
2026-06-17 22:14:36
重磅交易!馬刺3換1,全力追逐杜蘭特,聯手文班沖冠

重磅交易!馬刺3換1,全力追逐杜蘭特,聯手文班沖冠

體育見習官
2026-06-17 10:09:56
跟兒女相處:講道理是下策,閉嘴是中策,上策你絕對想不到

跟兒女相處:講道理是下策,閉嘴是中策,上策你絕對想不到

熱心市民小黃
2026-06-03 13:30:41
圖解|遼寧省人民政府關于調整一?...

圖解|遼寧省人民政府關于調整一?...

新浪財經
2026-06-16 17:02:25
2026-06-18 03:32:49
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3435文章數 11165關注度
往期回顧 全部

科技要聞

馬斯克好友長文:他最可怕的,是這套方法論

頭條要聞

荷蘭政府對中國進行無理指責 中使館發聲

頭條要聞

荷蘭政府對中國進行無理指責 中使館發聲

體育要聞

梅西帽子戲法:紀錄厚重,球王輕盈

娛樂要聞

陳紅一反常態保持沉默

財經要聞

拉加德警告:AI可能引爆下一場金融危機

汽車要聞

23.99萬起 比亞迪大唐帶2+2+3大七座掀桌子 這才是中國大家庭夢中情車!

態度原創

手機
房產
教育
公開課
軍事航空

手機要聞

蘋果iPhone傳四喜:辟謠、漲內存、漲影像、紀念版也有新變化!

房產要聞

最新房價:??凇⑷齺?;新房、二手房全線下跌!

教育要聞

認知天性|一本改變你人生的書

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美被指拒絕以色列看美伊諒解備忘錄

無障礙瀏覽 進入關懷版