網易首頁 > 網易號 > 正文 申請入駐

在 Mac 上微調一切大模型

0
分享至

聊個讓我非常興奮的項目——mlx-tune

一句話概括:在你的 Mac 上,用 Unsloth 的 API 微調一切

LLM、視覺模型、TTS、STT、OCR、Embedding,全都能在 Apple Silicon 上本地微調

Mac 用戶的微調困境

做大模型微調的同學應該都有過這種體驗:想在本地跑個小實驗驗證下 idea,結果發現 Unsloth 依賴 Triton,而 Triton 不支持 Mac

于是你只剩兩條路:

  1. 1. 花錢開云 GPU —— 就跑個 100 條數據的實驗,有必要嗎?

  2. 2. 用 mlx-lm 原生 API —— 但代碼和 完全不兼容,到了云上還得重寫一遍

mlx-tune(github.com/ARahim3/mlx-tune)的作者也遇到了一模一樣的問題

他的解決思路非常簡單粗暴:把 MLX 包裝成 Unsloth 的 API

你在 Mac 上寫的訓練腳本,換個 import 就能直接在 CUDA 集群跑

# Unsloth (CUDA)                        # MLX-Tune (Apple Silicon)
from unsloth import FastLanguageModel from mlx_tune import FastLanguageModel
from trl import SFTTrainer from mlx_tune import SFTTrainer


# 后面的代碼一模一樣!

這才是真正解決問題的設計

下面這張圖清楚展示了 mlx-tune 的工作流——本地原型驗證,改個 import 就能上云訓練:


功能有多全?看完嚇一跳

它支持的訓練方法比很多正經公司的內部工具都全:

語言模型訓練:

  • ? SFT :基礎指令微調,這是最常用的

  • ? DPO / ORPO / KTO / SimPO :各種偏好學習方法全覆蓋

  • ? GRPO :DeepSeek R1 風格的多生成 + 獎勵訓練

  • ? CPT :持續預訓練,支持解耦學習率

多模態訓練:

  • ? Vision :支持 Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 等 VLM 微調

  • ? TTS :Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 五個 TTS 模型

  • ? STT :Whisper、Moonshine、Qwen3-ASR、NVIDIA Canary、Voxtral 五個 STT 模型

  • ? Embedding :BERT、ModernBERT、Qwen3-Embedding、Harrier,支持對比學習

  • ? OCR :DeepSeek-OCR、GLM-OCR、olmOCR、Qwen-VL,內置 CER/WER 指標

進階能力:

  • ? MoE 微調 :支持 39+ 種 MoE 架構,包括 Qwen3.5-35B、Mixtral、DeepSeek 系列

  • ? Gemma 4 Audio :12 層 Conformer 音頻塔,原生處理 16kHz 音頻

  • ? LFM2 :Liquid AI 的混合卷積+GQA 架構

說真的,一個社區項目做到這個程度,相當離譜

全景架構一覽——從 API 到硬件的五層設計:


快速上手

安裝很簡單,推薦用 uv:

# 標準安裝
uv pip install mlx-tune


# 帶音頻支持
uv pip install 'mlx-tune[audio]'
brew install ffmpeg

來個最基礎的 SFT 微調示例:

from mlx_tune import FastLanguageModel, SFTTrainer, SFTConfig
from datasets import load_dataset

# 加載模型(4bit 量化,省顯存)
model, tokenizer = FastLanguageModel.from_pretrained(
model_name="mlx-community/Llama-3.2-1B-Instruct-4bit",
max_seq_length=2048,
load_in_4bit=True,
)

# 加 LoRA
model = FastLanguageModel.get_peft_model(
model,
r=16,
target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
lora_alpha=16,
)

# 加載數據集
dataset = load_dataset("yahma/alpaca-cleaned", split="train[:100]")

# 訓練
trainer = SFTTrainer(
model=model,
train_dataset=dataset,
tokenizer=tokenizer,
args=SFTConfig(
output_dir="outputs",
per_device_train_batch_size=2,
learning_rate=2e-4,
max_steps=50,
),
)
trainer.train()

# 保存:三種格式隨你選
model.save_pretrained("lora_model") # LoRA 適配器
model.save_pretrained_merged("merged", tokenizer) # 合并后的完整模型
model.save_pretrained_gguf("model", tokenizer) # GGUF 格式,直接給 Ollama 用

如果你用過 Unsloth,這代碼看著是不是特別眼熟?對,就是同一套 API

視覺模型微調

VLM 微調也是同樣簡潔的體驗:

from mlx_tune import FastVisionModel, UnslothVisionDataCollator, VLMSFTTrainer
from mlx_tune.vlm import VLMSFTConfig

model, processor = FastVisionModel.from_pretrained(
"mlx-community/Qwen3.5-0.8B-bf16",
)

model = FastVisionModel.get_peft_model(
model,
finetune_vision_layers=True, # 視覺層也微調
finetune_language_layers=True,
r=16, lora_alpha=16,
)

# 訓練(數據集格式和 Unsloth 一致)
FastVisionModel.for_training(model)
trainer = VLMSFTTrainer(
model=model,
tokenizer=processor,
data_collator=UnslothVisionDataCollator(model, processor),
train_dataset=dataset,
args=VLMSFTConfig(max_steps=30, learning_rate=2e-4),
)
trainer.train()

Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 都支持

你甚至可以用 Vision GRPO 來訓練視覺推理能力

TTS 微調:在 Mac 上克隆聲音

這個功能我覺得特別有意思——在 Mac 上本地微調 TTS 模型:

from mlx_tune import FastTTSModel, TTSSFTTrainer, TTSSFTConfig, TTSDataCollator
from datasets import load_dataset, Audio

# 自動檢測模型類型、編碼器和 token 格式
model, tokenizer = FastTTSModel.from_pretrained(
"mlx-community/orpheus-3b-0.1-ft-bf16"
)
model = FastTTSModel.get_peft_model(model, r=16, lora_alpha=16)

dataset = load_dataset("MrDragonFox/Elise", split="train[:100]")
dataset = dataset.cast_column("audio", Audio(sampling_rate=24000))

trainer = TTSSFTTrainer(
model=model, tokenizer=tokenizer,
data_collator=TTSDataCollator(model, tokenizer),
train_dataset=dataset,
args=TTSSFTConfig(output_dir="./tts_output", max_steps=60),
)
trainer.train()

Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 都支持

想做聲音克隆或者風格化 TTS,再也不用租 GPU 了

工作流全景

mlx-tune 的定位非常清晰:本地原型 → 云端量產

本地 Mac (mlx-tune)              云端 GPU (Unsloth)
├── 快速實驗 ├── 大規模訓練
├── 小數據集驗證 ├── 完整數據集
├── 秒級迭代 ├── 生產級優化
└── 同一套代碼 ─────────────────── └── 同一套代碼

訓練完還能直接導出:

  • ? HuggingFace 格式 :標準保存

  • ? GGUF :直接丟給 Ollama / llama.cpp

  • ? push_to_hub :一鍵推到 HuggingFace Hub

它適合誰?

我覺得 mlx-tune 最適合這幾類人:

  1. 1. Mac 用戶 + 微調需求 :你有 M1/M2/M3/M4/M5,想在本地跑微調實驗,這是最佳選擇

  2. 2. 混合工作流用戶 :本地調試、云端訓練,代碼無縫遷移

  3. 3. 多模態探索者 :想同時玩 LLM、Vision、TTS、STT、OCR 微調的人

  4. 4. 學習者 :想理解微調原理,在本地快速迭代比去 Colab 排隊強太多

局限性也得說清楚:

  • ? 訓練速度肯定比不上 A100 + Unsloth,這是物理定律決定的

  • ? GGUF 導出對量化模型有限制,建議用非量化基座模型

  • ? 內存受限于 Mac 的統一內存(不過 Mac Studio 最高 512GB,夠用了)

如果你是 Mac 用戶,又對微調大模型感興趣,強烈建議試試

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

以茶帶書
2026-04-25 16:22:06
王石真的老了!突然現身大梅沙,他赤裸著上半身,貼著胰島素針頭

王石真的老了!突然現身大梅沙,他赤裸著上半身,貼著胰島素針頭

火山詩話
2026-04-26 06:11:32
5月1日起,有房有車有身份證的人,或要吃大虧了!

5月1日起,有房有車有身份證的人,或要吃大虧了!

小談食刻美食
2026-04-26 09:09:28
趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,素顏依然很美

趙麗穎在上海某高檔餐廳被偶遇,瘦是真的瘦,素顏依然很美

一盅情懷
2026-04-25 19:36:00
中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

福建睿平
2026-04-26 10:53:36
小米:李某華已被行拘

小米:李某華已被行拘

南方都市報
2026-04-26 12:01:47
曝球球退出陳翔六點半!疑細節原因曝光,否認與“蘑菇頭”是夫妻

曝球球退出陳翔六點半!疑細節原因曝光,否認與“蘑菇頭”是夫妻

橙星文娛
2026-04-26 14:26:26
華為余承東:尊界新車價格在200萬左右

華為余承東:尊界新車價格在200萬左右

界面新聞
2026-04-26 13:08:56
馬齒莧立功!研究發現:其天然成分4周降脂33%,還能減少血管斑塊

馬齒莧立功!研究發現:其天然成分4周降脂33%,還能減少血管斑塊

思思夜話
2026-04-25 11:16:17
網友開盒掛出“深圳派出所煙男”名單,微博官方:嚴重違規,已關號處理

網友開盒掛出“深圳派出所煙男”名單,微博官方:嚴重違規,已關號處理

極目新聞
2026-04-26 17:45:26
月入過萬!“崩老頭”登上熱搜,80后90后男性,成為年輕女性目標

月入過萬!“崩老頭”登上熱搜,80后90后男性,成為年輕女性目標

火山詩話
2026-04-26 15:18:10
全變味了?蘇超開幕不到半月,不對勁的一幕上演,輿論風向又變了

全變味了?蘇超開幕不到半月,不對勁的一幕上演,輿論風向又變了

墨印齋
2026-04-25 18:07:43
飯店老板被顧客踹續:一腳踹出三米遠,強喂服務員吃菜,警方介入

飯店老板被顧客踹續:一腳踹出三米遠,強喂服務員吃菜,警方介入

奇思妙想草葉君
2026-04-25 15:02:47
斯諾克世錦賽:吳宜澤出師不利!2局僅得1分,塞爾比狂轟2破百!

斯諾克世錦賽:吳宜澤出師不利!2局僅得1分,塞爾比狂轟2破百!

劉姚堯的文字城堡
2026-04-26 17:56:36
田馥甄曬3人合體爬山,陳嘉樺帶包子接地氣,任家萱現在最沒星味

田馥甄曬3人合體爬山,陳嘉樺帶包子接地氣,任家萱現在最沒星味

離離言幾許
2026-04-25 20:49:13
手機拍完相機拍 白宮晚宴槍擊現場男子淡定記錄

手機拍完相機拍 白宮晚宴槍擊現場男子淡定記錄

看看新聞Knews
2026-04-26 12:48:06
白宮晚宴槍擊案全網最全細節:特工疑與槍手互開數槍,特朗普在臺上十分淡定

白宮晚宴槍擊案全網最全細節:特工疑與槍手互開數槍,特朗普在臺上十分淡定

爆角追蹤
2026-04-26 10:29:13
網紅女主播因父親重病去世失聯停播,公司要求其支付違約金:親人去世值得同情,但違約事實已發生;經法院調解,公司降低違約金數額

網紅女主播因父親重病去世失聯停播,公司要求其支付違約金:親人去世值得同情,但違約事實已發生;經法院調解,公司降低違約金數額

魯中晨報
2026-04-26 15:40:06
孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

醫脈圈
2026-04-25 20:04:06
結束了!再見愛德華茲!NBA最慘季后賽球隊

結束了!再見愛德華茲!NBA最慘季后賽球隊

籃球實戰寶典
2026-04-26 19:48:57
2026-04-26 20:00:49
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3352文章數 11139關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

藝術
本地
手機
公開課
軍事航空

藝術要聞

18幅 列賓美院教師Artem Tikhonov風景寫生

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

手機要聞

一加Ace 6至尊版規格全揭曉,堆料堆到友商沉默!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗總統:不會在壓力、威脅下進行談判

無障礙瀏覽 進入關懷版