網易首頁 > 網易號 > 正文 申請入駐

神操作再現,單卡3090 起跑!Claude-4.6-Opus蒸餾Qwen3.5-27B

0
分享至

,介紹了 TeichAI 將 Claude 的高階推理能力蒸餾進大模型的操作。今天再來介紹兩個最新的硬核蒸餾模型,這次的主角換成了Qwen3.5-27B加上地表最強邏輯王之一的 Claude Opus 4.6

核心就是用 Claude Opus 4.6 的“思維鏈”(Chain-of-Thought, CoT)高質量數據,去重新訓練(蒸餾) Qwen3.5-27B 這個 270 億參數的中等體量開源模型。不僅推理能力有了質的飛躍,最關鍵的是:單張 RTX 3090 或 4090 就能輕松跑起來!

1. Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

首先是 HuggingFace 用戶 Jackrong 做的開源版本,短短幾天已經在社區狂攬數萬次下載量。

它的訓練理念極其純粹:利用 Unsloth 框架,配合 LoRA(Rank=64),使用大概 3,280 條極高質量的 Claude Opus 4.6 推理數據進行監督微調(SFT)。有趣的是,作者使用了train_on_responses_only策略——強迫模型的 Loss 函數只在 思考過程和最終答案上計算,完全屏蔽了中間的任務要求。借此逼著模型去死磕和模仿 Claude 那種深度結構化思考模式。


https://huggingface.co/Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

模型在推理時,會主動開啟思維鏈:

 

Let me analyze this request carefully:
1. Identify the core objective of the problem.
2. Break the task into clearly defined subcomponents.
3. Evaluate constraints and edge cases.
4. Formulate a step-by-step solution plan.
5. Execute the reasoning sequentially and verify consistency...


實測怎么跑最省錢?社區大佬分享,使用Q4_K_M量化版本:

  • 顯存占用只有約 16.5 GB,手捏 24G 顯存的 3090 老玩家毫無壓力!

  • 生成速度 29–35 tok/s,足夠絲滑。

  • 保留完整長上下文,沒有像早前一些劣質微調那樣把注意力窗口閹割到 8k,它宣稱跑滿 262K 上下文沒有打折。

  • 修復了官方模型在 Jinja 模板里不支持developerrole 導致的崩潰

而且這模型跟 AI 代碼智能體框架(如 Claude Code、OpenCode)天生一對,支持原生developer角色。實測中,它可以全自動在后臺跑上 9 分鐘,看報錯、修代碼、寫 README 一氣呵成,連中途死機卡頓的幾率都大幅降低。

2. TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill

上次我們提過的“模型煉丹師” TeichAI 也沒有閑著,幾乎同時發布了同系列的高質量底模。他們同樣基于unsloth/Qwen3.5-27B為基座,配合自己的過濾版數據集進行調教。


https://huggingface.co/TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill

相比其他的傻瓜包,TeichAI 非常貼心地給出了實戰跑模型的超參保姆級指南

  • 普通任務(思考模式):溫度調滿 1.0,Top_P 0.95,Min_P 0.0,可以極大限度激發 AI 創意推理。

  • 寫代碼/Web 開發(高精度防胡說模式):溫度降到 0.6,同時存在懲罰(presence_penalty)設為 0.0,讓它死死咬住你的邏輯不跑偏。

  • 輸出長度建議:普通對話放開到 32,768 tokens,如果是高難度編程競賽題,直接拉滿到 81,920 tokens,給思維鏈留下足夠揮灑的空間。

下圖就是模型卡里的對比圖:


TeichAI Benchmark

從模型卡里的表格看,TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill相比unsloth/Qwen3.5-27B,至少在下面這些指標上是有提升的:


蒸餾的得與失

所以你會發現,這條線其實已經不是單點開花了,而是在慢慢形成一個“Claude reasoning distill 數據集 + Qwen 底座 + Unsloth 微調”的公開玩法。

萬事皆有代價,享受了極強的單體思維能力,也要承受某些缺失。原版 Qwen3.5-27B 的多模態技能在這些微調版上蕩然無存,這類蒸餾版目前專攻純代碼、純數學計算和重度邏輯推理場景。再加上由于是早期發布,相關的 prompt 模板生態還不算完美,偶爾可能會有些排版錯位的外殼 bug。

感興趣可以去弄個 GGUF 跑跑,看它是不是真的能平替掉某些時候昂貴的云端 API。

-Opus

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
青島海牛4-1山東泰山,賽后評分:青島海牛28號排第一

青島海牛4-1山東泰山,賽后評分:青島海牛28號排第一

凌空倒鉤
2026-04-26 19:04:02
比鄭麗文更直接!洪秀柱訪問上海,上來就強調祖國要統一!

比鄭麗文更直接!洪秀柱訪問上海,上來就強調祖國要統一!

小嵩
2026-04-26 20:15:03
歐爾班宣布辭任議員職位,馬扎爾指控其圈子正在轉移資產

歐爾班宣布辭任議員職位,馬扎爾指控其圈子正在轉移資產

山河路口
2026-04-26 20:21:01
四川控煙新規5月1日生效,室內全禁煙,違規最高罰2000元!

四川控煙新規5月1日生效,室內全禁煙,違規最高罰2000元!

老特有話說
2026-04-26 16:04:05
又一個3-0!SGA42+8雷霆再勝太陽,布魯克斯33+7布克16中6

又一個3-0!SGA42+8雷霆再勝太陽,布魯克斯33+7布克16中6

湖人崛起
2026-04-26 06:03:20
張雪身后的摩幫江湖

張雪身后的摩幫江湖

上觀新聞
2026-04-26 08:30:22
杭州23歲小伙打籃球僅20多分鐘,突發心臟驟停!41歲球友邊打120邊做按壓,還用上了AED緊急搶救……跪到腿麻,壓到手酸,人救回來了

杭州23歲小伙打籃球僅20多分鐘,突發心臟驟停!41歲球友邊打120邊做按壓,還用上了AED緊急搶救……跪到腿麻,壓到手酸,人救回來了

都市快報橙柿互動
2026-04-26 20:41:14
經常“放屁”是肝不好嗎?提醒:放屁多很可能與這5種疾病有關!

經?!胺牌ā笔歉尾缓脝??提醒:放屁多很可能與這5種疾病有關!

芹姐說生活
2026-04-25 16:12:39
猛降14℃!暴雨大暴雨、冰雹、雷暴大風馬上到湖北

猛降14℃!暴雨大暴雨、冰雹、雷暴大風馬上到湖北

極目新聞
2026-04-26 08:40:20
外交部一錘定音!賴清德沒資格,鄭麗文就算贏了選舉也不認!

外交部一錘定音!賴清德沒資格,鄭麗文就算贏了選舉也不認!

果媽聊娛樂
2026-04-25 13:48:35
體育局正式宣布,陳夢走馬上任

體育局正式宣布,陳夢走馬上任

最愛乒乓球
2026-04-26 00:04:52
中國全面斷供開始,高市請出日本八旬老將訪華,中方已讀未答應

中國全面斷供開始,高市請出日本八旬老將訪華,中方已讀未答應

流史歲月
2026-04-25 14:00:03
全市領導干部會議召開,宣布省委關于景德鎮市委主要負責同志調整的決定

全市領導干部會議召開,宣布省委關于景德鎮市委主要負責同志調整的決定

景德鎮瓷局
2026-04-26 09:16:19
趙露思真把“看著不大,實則敞亮”玩明白了!

趙露思真把“看著不大,實則敞亮”玩明白了!

飛娛日記
2026-04-26 08:49:04
羽協主席張軍失聯超十天被查!近照曝光,小4歲妻子是奧運冠軍

羽協主席張軍失聯超十天被查!近照曝光,小4歲妻子是奧運冠軍

老貓觀點
2026-04-26 07:29:30
快訊!芬蘭外長強硬放話了!

快訊!芬蘭外長強硬放話了!

有態度的何總
2026-04-26 14:53:05
全院6部門指認院長王行環,長期大搞權色交易、錢色交易

全院6部門指認院長王行環,長期大搞權色交易、錢色交易

雪中風車
2026-04-26 19:32:33
曾獲山西省五一勞動獎章的49歲局長猝死,被認定為因公犧牲,遺體告別儀式三天后舉行

曾獲山西省五一勞動獎章的49歲局長猝死,被認定為因公犧牲,遺體告別儀式三天后舉行

極目新聞
2026-04-26 20:01:20
取消戶籍限制!教育部突發新規!9月1日起執行:家長再也不用焦慮

取消戶籍限制!教育部突發新規!9月1日起執行:家長再也不用焦慮

芳姐侃社會
2026-04-24 22:52:50
楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

觀魚聽雨
2026-04-25 23:23:30
2026-04-26 22:55:00
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3353文章數 11139關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

以色列政壇重大變局 內塔尼亞胡迎來勁敵

頭條要聞

以色列政壇重大變局 內塔尼亞胡迎來勁敵

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

親子
教育
藝術
游戲
健康

親子要聞

這西瓜遇到他,可真的倒霉啊

教育要聞

加速社會與數字斷連:為了“上岸”身不由己

藝術要聞

總投資35億!汾酒集團太原的地標大樓,呈現白酒文化!

3D區女神淪陷!蒂法胸口被加布料 玩家直呼失望

干細胞如何讓燒燙傷皮膚"再生"?

無障礙瀏覽 進入關懷版