无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<source id="odc3n"><tr id="odc3n"></tr></source>

<td id="odc3n"></td>

<td id="odc3n"><tr id="odc3n"><label id="odc3n"></label></tr></td>

<td id="odc3n"></td>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

用Mac本地跑大模型，靠譜嗎？

2026-05-06 09:06:53　來源: AI異類

北京舉報

0

分享至

看到橘子說：強烈建議購買MacBook Air或者Mac Mini。

我經常被人問到一個問題：你那臺MacBook Pro到底能不能跑得動大模型？

這個問題背后藏著一種普遍的懷疑。

Apple Silicon出來之后，蘋果一直強調它的AI算力有多強，M系列芯片的神經網絡引擎跑分多漂亮。

但真正上手之后你會發現，事情沒那么簡單。模型是能跑，但跑得怎么樣，那就是另一回事了。

我自己用MLX跑過不少模型，Qwen、Llama、Mistral都試過。

MLX確實是個好東西，蘋果官方開源生態，上手快，社區活躍。

但你跑著跑著就會發現一些讓人抓狂的地方。

比如激活量化基本沒有，W8A8這種在很多推理框架里已經是標配的模式，在MLX里就是缺的。

你想壓榨一下Apple GPU的INT8 TensorOps能力，發現原生框架根本調不動。

硬件擺在那里，但你用不上，這種感覺就像買了一輛法拉利，結果只能開60邁。

直到最近，明略科技開源了一個叫Cider的項目，我才覺得事情開始變得有意思了。

01Mano-P：把GUI測試的成本打到地板

先說說Mano-P。

這是明略科技開箱的一個端側GUI Agent模型，4B參數，專門做圖形界面理解和操作。

聽起來可能有點抽象，我換一個說法。

現在的AI編程工具已經很火了，Copilot、Cursor這些大家用得飛起。

但你發現沒有，AI能幫你寫代碼，但它寫完代碼之后呢？

它不能幫你跑起來測試，不能幫你點開界面驗證功能，不能幫你發現問題然后自己修。

完整的軟件開發流程里，寫代碼只是其中一環。

寫完代碼要編譯，要部署，要測試，尤其是GUI測試，你得打開軟件，點點按鈕，填填表單，看看頁面跳轉是不是正常。

這些事，目前都還得人來做。

Mano-P想做的是把這個最后環節也自動化。

它通過純視覺理解屏幕截圖，定位界面元素，然后像人一樣去點擊、輸入、判斷結果。

不依賴什么CDP協議，不依賴HTML解析，所以不管是網頁系統還是桌面軟件，甚至3D應用和專業工具，它都能操作。

但這里面有一個硬成本問題。

GUI測試要頻繁處理截圖，持續推理，如果每次都調用云端大模型，token消耗會非常夸張。

明略科技給過一個數據，在全自動編程流水線里，GUI測試消耗的云端token占比往往超過百分之五十。

也就是說，你花在讓AI幫你測試上的錢，比讓它幫你寫代碼的錢還多。

Mano-P的解法是把模型搬到端側，在你自己的Mac上跑。

4B量化模型在M4 Pro上能做到476 tokens每秒的預填充，76 tokens每秒的解碼，峰值內存只占4.3GB。

這意味著你不用花一分錢API費用，所有截圖和數據都不出設備，就能完成整個GUI自動化流程。

我自己測試了一下，在一個典型的網頁表單填寫任務里，Mano-P的準確率和云端那些幾十B甚至上百B的模型差不多，坐標偏差控制在1像素以內。

這不是縮水版AI，這是在端側重新實現了大模型級別的能力。

但問題來了，模型能力到了，推理效率能不能跟上？這就要說到Cider了。

02Cider：比蘋果原生框架更懂Apple Silicon

Mano-P證明了端側GUI Agent有落地價值，但它跑得快不快，省不省內存，開發者接入門檻高不高，這些底層問題需要一個基礎設施來解決。

Cider就是那個基礎設施。

Cider是基于MLX生態的一個推理加速框架，但它做的事情比MLX原生更進一步。

原生MLX支持W4A16、W8A16這樣的權重量化模式，也就是說權重可以壓到4bit或8bit，但激活值還是16bit。

這在很多場景下夠用，但如果想要更極致的性能，就需要把激活值也壓到8bit，同時讓GPU跑INT8的TensorOps。

Cider是第一個在Apple GPU上實現硬件加速INT8 TensorOps的開源框架。

它通過調用蘋果底層的Metal 4 API，提供了W8A8和W4A8兩種模式。W8A8是權重和激活都壓到8bit，W4A8是把權重壓到4bit，激活保持8bit。

實測數據很實在。相比原生MLX，Cider在W8A8模式下的算子速度提升了1.4倍到2.2倍，具體看Batch Size。

W4A8模式下，權重的內存占用比W8A8直接減半，而且在Batch Size大于等于16的高并發場景里，性能完全不輸給原生MLX的W4A16方案。

我用自己的一個實際項目測了一下，跑的是Qwen3-VL-2B這個視覺語言模型。

在chunked prefill場景里，Cider帶來了百分之十到十九的端到端預填充加速。

都不是那種實驗室環境下的理論峰值，是真實跑出來的數字。

更有意思的是Cider的接入方式。

它不是一個封閉的專屬加速庫，只要你模型接入了MLX生態，就可以用Cider來加速。

Qwen可以，Llama可以，Mistral可以，當然Mano-P也可以。

開發者不需要改模型結構，不需要重新訓練，幾行代碼就能把原來的推理后端換成Cider。

這讓我想起當年CUDA生態早期的時候，NVIDIA也是先把硬件性能釋放出來，然后開發者自然就涌過來了。

Cider在做類似的事情，只不過它是在Apple Silicon上，而且是開源的。

03數據零上云，不是一個安全口號

端側AI這兩年提得很多，但大家有沒有想過一個問題，為什么說了這么久，真正落地的案例還是少？

原因很簡單，很多號稱端側AI的方案，其實只是在本地跑一個很小的模型做一些簡單任務，稍微復雜一點的事情還是要走云端。

根本問題在于本地推理效率跟不上。模型大了跑不動，模型小了能力不夠。

你跟我說數據不出設備很安全，但一個任務要等半分鐘才有結果，用戶體驗就崩了。

Mano-P和Cider的組合解決的是這個工程層面的死結。

Mano-P提供了足夠強的端側模型能力，Cider確保這個能力能跑得足夠快足夠省。

每秒476個token的預填充速度意味著什么？

意味著你給它一張截圖，它幾乎在瞬間就能理解屏幕上有什么。76的解碼速度意味著它生成下一步操作指令的時間，比你手動點一下鼠標還要短。

4.3GB的內存占用意味著你可以在跑模型的同時，正常開瀏覽器、開IDE、開設計軟件，完全不影響日常使用。

這種效率提升帶來的不僅是體驗上的改善，更是一種工程上的可行性。

以前你覺得端側AI不靠譜，是因為你試過，確實慢、確實卡、確實不好用。

現在有人告訴你，在Mac上跑一個4B的GUI Agent，速度比PyTorch CPU推理快60倍以上，量化后的精度和全精度輸出幾乎沒差別，坐標偏差控制在1像素以內。

再去試，發現真的可以用了。

這對于企業級場景尤其重要。很多公司做AI應用開發，最大的顧慮不是模型能力，而是數據安全。

業務數據、用戶信息、界面截圖，這些東西一旦上傳到云端模型，就在別人的服務器上過了一遍。

法律合規是一方面，商業機密是另一方面。

Mano-P的本地運行模式實現了真正的物理隔離，所有截圖和任務數據都不出設備，離線狀態下也能完成自主規劃和決策。

這不是寫在白皮書里的安全承諾，是工程上確定的。

04開源生態的下一站：本地智能基礎設施

我一直在想一個問題，開源模型的價值到底在哪里。

很多人說是免費，是不用給OpenAI或者Anthropic交API費用。但這只是表面。

真正的價值在于，開源模型給了開發者控制權。你可以自己部署，自己微調，自己決定數據流向哪里。

當你需要在敏感數據上做AI應用時，閉源模型的API就像一條透明的管道，數據從你這頭進去，從他那頭出來，你永遠不知道中間發生了什么。

開源模型不一樣，你可以把它鎖在自己的機房或者自己的Mac里，運行邏輯完全可控。

但光有模型還不夠。你還需要一個能讓模型高效跑起來的本地推理基礎設施。

Cider做的就是這件事，它不屬于某一個模型，它屬于整個開源模型生態。

Qwen的用戶能用，Llama的用戶能用，Mistral的用戶能用，任何接入MLX生態的模型都能用。

這種基礎設施層面的開源，比單個模型的開源更有生態意義。因為模型會迭代，今天最強的4B模型，過兩個月可能就被新的替代了。

但推理框架不一樣，它沉淀下來的是硬件利用的工程經驗，是底層API的調用邏輯，是量化計算的優化路徑。這些東西的復用價值更高，周期更長。

明略科技這次把Cider和Mano-P一起開源，而且Mano-P的訓練方法、剪枝、量化技術后續也會陸續放出來。

這種做法讓我想起早年的Hugging Face，他們不是只做一個模型，而是做了一整套工具鏈，讓整個生態都能用起來。

Cider目前主要解決的是Apple Silicon上的推理效率問題。但我覺得它的想象空間不止于此。

未來端側AI的設備會越來越多，Mac只是第一步。手機、平板、甚至邊緣計算設備，都需要類似的本地推理基礎設施。

Cider的技術路徑，調用底層Metal API實現INT8 TensorOps，補齊激活量化的能力，這些思路在被其他硬件平臺上復用，只是時間問題。

05端側AI不是未來，是現在

最后說一些個人判斷。

很多人覺得端側AI是下一代的事，現在的主流還是云端大模型。

但從工程落地的角度看，端側和云端從來不是替代關系，是分工關系。

云端負責那些需要超大參數規模、海量知識、復雜推理的任務，端側負責那些需要低延遲、高隱私、低成本的任務。

GUI自動化恰恰屬于后者。

一個企業內部的自動化流程，天天都要跑，每次跑都傳截圖到云端，成本根本扛不住。

而且界面數據里可能包含客戶信息、業務邏輯、內部系統結構，這些你愿意交給第三方的API嗎？大概率不愿意。

所以端側不是云端的高配替代，而是特定場景下的唯一解。

Mano-P和Cider的組合證明了，在Mac這個平臺上，端側AI已經可以達到接近實用的水平。

推理速度夠快，內存占用夠小，模型能力夠強，接入門檻夠低。四個條件同時滿足，才叫真正的可用。

我還注意到一個有意思的細節。

Cider是在Apple MLX生態上做的二次開發，但它比蘋果原生框架走得更遠。蘋果自己的MLX沒有做W8A8，沒有做INT8 TensorOps，Cider補齊了。

這其實反映了開源生態的一個優勢，大廠提供基礎框架和硬件驅動，社區貢獻者把邊界往外推。蘋果不會為所有小眾場景寫代碼，但開源社區會。

端側AI的最后一公里，往往不是模型架構的問題，而是工程優化的問題。

誰能把硬件潛能釋放得最徹底，誰就能在端側落地這場競賽里跑在前面。

Cider目前走在了前面，但后面肯定會有更多人跟上來。

對于開發者和企業用戶來說，現在是一個很好的時機。

工具鏈已經基本齊了，Mano-P提供了端側GUI Agent的能力參考，Cider提供了通用的本地推理加速方案。

你可以直接拿它們做產品，也可以基于它們做二次開發。

代碼都在GitHub上，Apache 2.0協議，商業使用沒問題。

https://github.com/Mininglamp-AI

https://github.com/Mininglamp-AI/Mano-P

https://github.com/Mininglamp-AI/cider

接下來的半年到一年，端側AI會進入真正的落地爆發期。

推理框架會越來越成熟，硬件利用率會越來越高，模型參數和能力的平衡會找到更優解。

Apple Silicon在這個生態里的角色會越來越重要，不是因為蘋果自己做了什么，而是因為開源社區在它的硬件上把事做成了。

回去再看那個問題，Mac到底能不能跑大模型。

答案是可以，而且跑得比很多人想象的要好。

只是需要一點正確的方法。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

杭州公園引入“黑科技”：一天抓7000多只蚊子！“河邊坐一個半小時沒被咬”“我都想買一個放家里”

都市快報橙柿互動 2026-05-29 09:17:46
5474 跟貼 5474
小男孩經過多次思考后終于跳上平臺，網友：看到了小時候的自己

學申論的談妹 2026-05-29 03:00:38
163 跟貼 163

再被曝光“圈路收費”的瀘沽湖景區：已開通過境車輛專用通道

南方都市報 2026-05-29 17:10:06
1041 跟貼 1041

官方通報低保老人被貸款20萬

看看新聞Knews 2026-05-29 15:25:38
1167 跟貼 1167
神舟二十二號載人飛船順利撤離空間站組合體

央視新聞客戶端 2026-05-29 14:55:45
1231 跟貼 1231

稻城亞丁景區問題，最新通報

云南網絡廣播電視臺 2026-05-29 09:45:59
1248 跟貼 1248

歐盟官員：中國占全球制造業的份額已從6%增長到30%

澎湃新聞 2026-05-29 14:22:13
426 跟貼 426
網線被人拔斷、傳感器被阻斷，瓦斯監測為何失效？

中國新聞周刊 2026-05-29 13:28:03
82 跟貼 82

優衣庫等品牌收集非必要個人信息被通報

封面新聞 2026-05-29 12:10:44
1819 跟貼 1819
“張雪機車”位列超級桿位賽第二名

央視新聞客戶端 2026-05-29 21:06:29
55 跟貼 55
貴州大學招聘管理崗引質疑，要求配偶須是本校在職博士，校方：不是“蘿卜崗”

封面新聞 2026-05-29 16:08:24
44 跟貼 44
諾基亞發布首款微聊手機，售價199元，可視頻通話，但連不了WiFi

上觀新聞 2026-05-29 14:54:16
263 跟貼 263
安世中國獨立運營體系已基本完成搭建

財聯社 2026-05-29 10:57:08
924 跟貼 924
煙臺一企業所售雞蛋獸藥超標69倍

現代快報 2026-05-29 17:09:28
244 跟貼 244
幼兒園集中用餐新規：飯菜燒熟到食用不得超2小時

央視新聞 2026-05-29 16:10:22
633 跟貼 633
收評：創業板指跌2.11% 大消費板塊走強

證券時報 2026-05-29 15:22:05
689 跟貼 689
從5G、5G-A到6G，新一代通信網加速到來

極目新聞 2026-05-29 07:05:19
418 跟貼 418
貓咪與蝴蝶玩耍的溫馨一幕，網友:這畫面太治愈了#睡個好覺

環球網資訊 2026-05-29 22:13:10
7 跟貼 7
電車，是時候交養路費了

第一財經資訊 2026-05-29 10:11:25
0 跟貼 0
夜空中最亮的星

國際在線 2026-05-29 08:57:49
135 跟貼 135
驅車13小時赴同學會，到場只見兩人

自愈小日子 2026-05-30 00:16:28
0 跟貼 0
山東濟南一小區充電車棚發生火情，消防人員第一時間到場滅火，物業：初步判斷因車輛充電時短路引發自燃

新浪財經 2026-05-30 00:21:19
0 跟貼 0
鮮奶雪糕包裝印“不加一滴水”配料表首位竟是水廠家：系舊包裝，已改名“一滴水”

上游新聞 2026-05-29 18:03:05
0 跟貼 0
為190元榴蓮驅車1600公里維權，商家收到“死亡恐嚇”：淘寶抖音私信被狂轟濫炸，匿名網友自稱女孩哥哥放話“敢立案去河南找你”

都市快報橙柿互動 2026-05-30 00:14:37
0 跟貼 0
日韓股市雙雙創收盤歷史新高

財聯社 2026-05-29 14:48:18
0 跟貼 0
杭州外賣事件后續視頻傳到國外，老板也被網友舉報

深度報 2026-05-30 00:22:56
0 跟貼 0

女子和情夫幽會，完事后丈夫發現有液體，女子找情夫提要求被殺

女子和情夫幽會，完事后丈夫發現有液體，女子找情夫提要求被殺

丫頭舫

2026-05-28 11:50:39

高市時代將畫上句號？日本62歲皇后被請出山，中日歷史性一幕誕生

高市時代將畫上句號？日本62歲皇后被請出山，中日歷史性一幕誕生

混沌錄

2026-05-28 20:45:03

黃仁勛披露隨特朗普訪華細節：原本不去，特朗普致電堅持讓其上飛機，“我就匆忙收拾了一下”

黃仁勛披露隨特朗普訪華細節：原本不去，特朗普致電堅持讓其上飛機，“我就匆忙收拾了一下”

澎湃新聞

2026-05-29 08:24:10

解放軍在越南戰場撿回一種武器，花一年仿制后，痛擊越軍偷襲部隊

解放軍在越南戰場撿回一種武器，花一年仿制后，痛擊越軍偷襲部隊

瘋狂的小歷史

2026-05-29 11:37:45

女博主要求男人常備衛生巾，以便女人不時之需，遭網友集體怒懟！

女博主要求男人常備衛生巾，以便女人不時之需，遭網友集體怒懟！

譚談社會

2026-05-29 07:36:24

Claude Code官方桌面端正式發布，夯爆了！

Claude Code官方桌面端正式發布，夯爆了！

新浪財經

2026-05-28 11:59:12

俄宣布退群，歐洲9國跳反，澤連斯基麻煩大了：戰爭只剩一個結局

俄宣布退群，歐洲9國跳反，澤連斯基麻煩大了：戰爭只剩一個結局

你是我心中最美星空

2026-05-29 05:15:50

集體“逃離”！38名球員選擇退出！NBA時代怎么了？

集體“逃離”！38名球員選擇退出！NBA時代怎么了？

體育新角度

2026-05-29 18:22:28

古德溫：張鎮麟最后防布朗防得非常棒，我也是賭一把去搶斷

古德溫：張鎮麟最后防布朗防得非常棒，我也是賭一把去搶斷

懂球帝

2026-05-28 23:23:16

總統夫人突襲上海小店，店主嚇得差點免單：她堅持付錢后圈粉無數

總統夫人突襲上海小店，店主嚇得差點免單：她堅持付錢后圈粉無數

卷史

2026-05-29 13:51:18

加盟騙局太狠！13天虧光首付，百萬積蓄數月清零，全是精準收割

加盟騙局太狠！13天虧光首付，百萬積蓄數月清零，全是精準收割

青眼財經

2026-05-29 20:17:14

性生活史被醫生寫在健康證上，女生急了：我至今還沒交過男友

性生活史被醫生寫在健康證上，女生急了：我至今還沒交過男友

映射生活的身影

2026-05-29 20:32:03

38歲少帥成AC米蘭新帥熱門，朗尼克欽點人選浮出水面

38歲少帥成AC米蘭新帥熱門，朗尼克欽點人選浮出水面

晚風知我意21

2026-05-29 00:08:16

夫妻性生活別急著進入！學會這招“延遲滿足”，爽感增倍

夫妻性生活別急著進入！學會這招“延遲滿足”，爽感增倍

精彩分享快樂

2026-05-13 12:05:07

澤連斯基做夢沒料到，先等來的不是俄軍打基輔，中方突然劃下紅線

澤連斯基做夢沒料到，先等來的不是俄軍打基輔，中方突然劃下紅線

一網打盡全球焦點

2026-05-29 21:20:15

56歲中醫名家死于肝癌，曾撰寫《把脈癌癥》，如何解讀更符合實際

56歲中醫名家死于肝癌，曾撰寫《把脈癌癥》，如何解讀更符合實際

醫院院長

2026-05-27 11:28:02

明明俄羅斯大豆更近更廉價，為什么我國進口更偏愛美國大豆？

明明俄羅斯大豆更近更廉價，為什么我國進口更偏愛美國大豆？

祈福所有

2026-05-28 23:43:14

錯把魚目當珍珠，2026世界杯最大敗筆，就是請Lisa來唱開幕式

錯把魚目當珍珠，2026世界杯最大敗筆，就是請Lisa來唱開幕式

冷紫葉

2026-05-28 21:33:12

臺灣綠營幾十年的謊言，一夜之間被神舟二十三號徹底撕碎

臺灣綠營幾十年的謊言，一夜之間被神舟二十三號徹底撕碎

精彩瞬間回顧

2026-05-28 00:07:27

國務院：嚴格規范城市軌道交通規劃建設鼓勵建設集約化停車設施

國務院：嚴格規范城市軌道交通規劃建設鼓勵建設集約化停車設施

財聯社

2026-05-28 19:06:05

從硅谷到中關村，AI信息與測評

188文章數 8關注度

往期回顧全部

數碼要聞

LG電子澄清：并無出售電視業務的計劃

頭條要聞

釋永信被判24年中國佛教協會：完全是咎由自取

頭條要聞

釋永信被判24年中國佛教協會：完全是咎由自取

體育要聞

即使是文班亞馬，也做不到這件事

娛樂要聞

奚夢瑤何猷君將于6月在法國舉行婚禮

財經要聞

近3個月跌超20% 黃金"猴市"下的眾生相

科技要聞

Claude Opus 4.8凌晨突發上線

汽車要聞

900V+3.2秒破百領克10+&領克10上市16.99萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

本地

家居

藝術

公開課

數碼要聞

宏碁推多款游戲新品：兩款筆記本、一款串流掌機，還有鍵盤、背包

本地新聞

用剪紙的方式，打開江蘇揚州

家居要聞

云棲舒展如流云

蜂鳥餐椅線面交錯
古老而持久石影扶手椅
生與命相依舊公寓改造

藝術要聞

吳湖帆小品冊頁

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

^{<noscript id="9s9rp"></noscript>}