網易首頁 > 網易號 > 正文申請入駐

AMD銳龍AI Max PRO 400系列處理器發布：最高192GB統一內存、可跑300B以上模型

2026-06-01 22:14:45　來源: 微型計算機

重慶舉報

分享至

如今，AI正快速從云端部署轉向線下實際應用場景，PC也隨之轉型，既是AI交互窗口，也成為實時任務的本地運行載體。想要從簡單的聊天機器人升級為可自主運轉的實時智能體，開發者與企業就需要搭建本地運行環境，以滿足智能體AI對大內存、低延遲的嚴苛需求。

為了滿足這些需求，AMD正通過賦能廣大開發者、企業及整機廠商，支持在本地電腦上部署先進AI工作負載與智能體。如今，AMD再度加碼布局，宣布AMD銳龍AI Halo將于2026年6月開啟預售，同時正式發布全新的銳龍AI Max PRO 400系列處理器，為新一代智能體主機提供核心動力。這類搭載AI能力的新型電腦能夠自主讀懂指令、規劃流程并在較少人工干預的情況下完成任務。

AMD高級副總裁、計算與圖形總經理Jack Huynh對這輪變化的判斷很直接：AI已經不再只屬于云端，開發者越來越希望在本地完成模型的構建、訓練和運行，而要支撐這件事，終端側就必須同時具備足夠的性能、內存資源和可用的軟件棧。Jack Huynh表示：“依托銳龍AI Halo及銳龍AI Max PRO 400系列產品，我們提供充足的性能、內存資源與開源AI軟件棧，助力開發者與企業在桌面終端打造出新一代智能體AI系統。”

銳龍 AI Halo：專為本地AI開發打造

按照AMD的定義，銳龍AI Halo是一款“首款緊湊型AI開發者平臺”，目標用戶不是普通辦公本用戶，而是要在本地搭建、測試并運行智能體與生成式AI應用的開發者。

從硬件規格看，銳龍AI Halo搭載的是銳龍AI Max+ 395處理器，采用Zen 5 CPU架構，擁有16核心32線程。圖形部分為高達40組RDNA 3.5 GPU計算單元的Radeon 8060S集顯。同時，銳龍AI Halo配備算力達到50 TOPS的NPU、最高128 GB LPDDR5X 8000統一內存，整機性能釋放水平達到120 W。銳龍AI Halo還支持最高2 TB SSD，提供Wi-Fi 7、藍牙5.4、HDMI 2.1b、10Gbps以太網、3個USB-C接口和1個USB-C供電接口。

如果只看參數，這套配置算是把工作站能力塞進小盒子，但銳龍AI Halo 真正的關鍵還是統一內存和完整的軟件棧的組合。AMD表示，這個平臺最高可本地運行2000億參數級的大模型，開發者可以在不依賴云端基礎設施的前提下，依托它完成從Linux環境原型搭建、模型微調，直至Windows系統正式部署的全流程工作。

AMD表示，銳龍AI Halo在操作系統的支持上、模型性能上相比NVIDIA DGX Spark都有很大優勢，比如在120B的GPT-OSS模型上領先對方7%，在122B的Qwen-3.5B模型上領先對方12%。

銳龍AI Halo開發者平臺兼容開發者常用主流框架與工具，包括PyTorch、vLLM、llama.cpp、Ollama、ComfyUI及LM Studio，同時針對AMD ROCm軟件完成深度優化，可助力在單設備上本地流暢運行大語言模型、擴散模型與各類智能體工作流。

對于AI開發者、AI創作者而言，銳龍AI Halo能夠提供完整的開發閉環：從最初實驗到本地推理，再到多智能體和混合控制工作流，銳龍AI Halo平臺都覆蓋。這也是AMD想切入的真正位置。

過去很多所謂AI PC更像是帶AI功能的消費電腦，能做一些會議紀要、圖像增強、輕量端側推理，但離開發者真正想做的事情還有距離。開發者需要的不只是一個會跑輕量模型的終端，而是一個能裝好環境、拉起框架、加載模型、調試Agent Workflow，還能兼顧Windows與Linux的本地開發平臺。圍繞這一點，AMD給銳龍AI Halo配了一套明顯偏開發者思路的軟件方案。

根據AMD介紹，銳龍AI Halo配有銳龍AI Developer Center，用來統一獲取更新、功能和工具；同時還有預裝應用與模型、面向入門的AI Playbooks以及經過驗證的ROCm平臺配置。

AMD還特別強調“Best Known Configuration”這一套邏輯，也就是把驅動、ROCm平臺、框架和應用都做過驗證，盡量降低更新后工作流斷裂的風險。在玩法上，AMD AI Playbooks目前預裝5套工作流，另有10套可在線獲取，而且AMD聲稱會按月更新。

這些預置內容覆蓋用ComfyUI和Z Image Turbo生圖、用ROCm和LM Studio運行大語言模型、用PyTorch配合ROCm做高級LLM用例、在VS Code里跑Qwen3-Coder-30B，以及用n8n搭配gpt-oss-120b做自動化工作流等方向。

毫無疑問，銳龍AI Halo對AI開發者有重要意義。對于需要頻繁試錯的開發者來說，本地環境最怕的是搭環境時間比寫代碼時間還長，而AMD反復強調“Spend time building, not configuring”，本質上就是想把裝驅動、配后端、找兼容模型這類前置成本壓下去。再加上Windows與Linux雙系統支持、PyTorch、vLLM、llama.cpp、Ollama、ComfyUI和LM Studio等主流工具的兼容，以及對ROCm的深度優化，讓銳龍AI Halo對本地實驗、原型驗證和私有部署的吸引力比一般AI PC都強。

此外，銳龍AI Halo對AI創作者的價值也不只是“跑得更快”。AMD專門針對AI圖像、AI視頻和AI音樂生成做了詳細介紹。比如，AI視頻生成服務的訂閱費用每月價格可達250美元，AI音樂生成也要24美元，而如果換成用銳龍AI Halo在本地運行，那么最大的意義不僅是省訂閱費，更是把素材、腳本、分鏡和成品盡量留在本地處理。

性能數據方面，AMD也給了不少對比。例如在音樂生成場景里，AMD宣稱銳龍AI Max+ 395 在Ace Step 1.5 XL上相較蘋果M4 Pro可實現最高7倍的速度提升；在一組基于PyTorch和ROCm的測試中，在Stable Diffusion XL、Flux Schnell、Qwen Image、Qwen Image Edit、Z Image Turbo、Ace Step 1.5 XL、Hunyuan 3D 2.1以及LTX 2.3等生成式AI負載中，銳龍AI Halo相對蘋果平臺的領先幅度在3.3倍到7.3倍之間。

對智能體應用來說，銳龍AI Halo的價值則集中地體現在“Token吞吐能力”和“本地可持續運行”上。AMD表示，智能體每天可能消耗超過一百萬Token，本地模型已經足夠承擔很多原本會給前沿云模型的“苦活累活”。AMD援引模型卡的數據表示，開源的Qwen-3.6-35B-A3B模型在Agentic Terminal Bench上的分數為51.5，而閉源的商業模型Claude Sonnet 4.5的分數為50，二者的能力相當，意味著不少Agent workflow里的中間環節確實可以遷回本地處理。

AMD給出的本地推理數字也很有針對性。在128K預填充上下文條件下，銳龍AI Max+ 395運行Qwen-3.6-35B的時候，持續解碼速度是36 Tokens/s，按每天8小時使用計算，對應最高每月3100萬輸出Token；持續預填充吞吐為446 Tokens/s，按每天8小時使用計算，對應最高每月3.85億輸入Token。

更重要的是，AMD還表示本地算力在成本上相對云端有很大優勢。根據AMD的假設，如果用戶把一部分Claude Sonnet 4.5 API調用遷移到銳龍AI Halo，本地場景下每月電費約為16.2 美元，設備初始價格為3999美元，三年總成本約為4582美元，6個月即可回本，而等量云側成本高達27828美元。

綜合來看，銳龍AI Halo并不是一款面向大眾消費市場的普通新品，而是一款很有明確目標的本地AI開發產品。它用大統一內存+完整的ROCm棧+預裝工作流+跨Windows/Linux環境的方式把環境搭建、模型加載和多工作流試驗環節前置打包，便于AI開發者、AI創作者使用。

發售信息方面，搭載銳龍AI Max+ 395處理器的銳龍AI Halo將于2026年6月開啟預售，起售價3999美元。AMD還表示，2026年第三季度會進一步升級銳龍AI Halo開發者平臺，新平臺將引入銳龍AI Max PRO 400系列處理器，屆時統一內存最高提升到192 GB，顯存最高可到160 GB，并預計會有OEM合作伙伴推出相應整機方案。

銳龍AI Max PRO 400系列處理器：賦能新一代AI系統

除了銳龍AI Halo，此次AMD還重磅推出全新的銳龍AI Max PRO 400系列處理器。銳龍AI Max PRO 400系列處理器面向商用臺式機、移動工作站及迷你主機打造，可助力在同一設備中流暢協同運行AI、圖形渲染與專業算力任務。

銳龍AI Max PRO 400系列被定義為“面向創作者和開發者的終極AI處理器”，重點針對復雜并發的智能體工作流、創意專業場景，以及設計和工程類項目加速。

在介紹銳龍AI Max PRO 400系列處理器的時候，AMD將其稱為“全球首款可運行300B+ LLM的x86客戶端處理器”。這類說法顯然帶有很強的宣示意味，但它背后真正要強調的仍然是統一內存容量和可分配顯存規模對大模型本地部署的重要性。

規格方面，銳龍AI Max PRO 400系列處理器采用Zen 5 CPU架構，最多提供16核心32線程，最大加速頻率可達5.2 GHz。圖形部分最高配備40組RDNA 3.5 GPU計算單元，GPU Boost頻率可達3.0 GHz，NPU則基于XDNA 2架構，算力最高可達55 TOPS。內存是這代產品最值得關注的地方：平臺最高支持192 GB統一內存并可提供最高160 GB VRAM，這也是它能夠承接多智能體和更大參數模型的底層前提。

AMD宣稱，銳龍AI Max PRO 400系列處理器可在工作站級使用場景下，支持海量復雜數據集運算、實時渲染以及高階AI應用。銳龍AI Max PRO 400系列處理器專為深耕仿真模擬、內容創作及海量數據處理領域的AI開發者、工程師與創意從業者量身打造。整機廠商可依托該平臺推出便攜款及緊湊型工作站級設備，將AI、視覺可視化與高性能算力融于統一架構，從而簡化設備部署流程，優化專業工作流程。

目前AMD公布了銳龍AI Max PRO 400系列處理器家族的幾個核心SKU，具體規格如下：

銳龍AI Max+ PRO 495作為家族中的旗艦型號，其采用Zen 5 CPU架構，配備16核心32線程，處理器最高加速頻率達到5.2 GHz，配備80 MB總緩存以及40組CU單元的Radeon 8065S集顯，同時它還配備最高192 GB統一內存。

銳龍AI Max PRO 400系列處理器將于2026年第三季度由惠普、聯想等領先OEM合作伙伴在其系統中推出。

友情提示

MCer請注意，由于微信公眾號調整了推薦機制，如果你發現最近很難刷到Microcomputer（微型計算機）公眾賬號推送的文章，但是又不想錯過微機的精彩評測內容，可以動動小手指把Microcomputer設置成星標公眾賬號哦！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.