AMD推出锐龙AI Halo迷你主机 搭载16核处理器定价3999美元
6月13日,AMD正式发布旗下首款第一方AI开发者迷你主机锐龙AI Halo。该产品提供Win11专业版与Linux两个SKU,定价为3999美元(约合2.7万元人民币)。
核心硬件架构配置
该设备主控芯片采用锐龙AI Max+ 395处理器,内部集成16核32线程。处理器底层基于Zen 5架构构建,整机热设计功耗(TDP)设定为120W。
图形与AI算力层面,主板集成Radeon 8060S核显,内含40个RDNA 3.5计算单元。独立XDNA 2 NPU提供50 TOPS算力,负责执行矩阵运算与本地化模型负载。
锐龙AI Max+ 395处理器 | Zen 5架构 | 16核32线程 | 120W TDP
开发者场景指向
XDNA 2 NPU属于专用于张量计算的独立硬件模块,在此机型中脱离通用CPU与GPU直接接管AI推理任务。该产品的上市直接针对垂直开发者群体,固定功耗与高算力NPU的组合,表明其设计初衷是满足本地大模型微调、多模态数据预处理等重度计算场景的桌面级部署需求。
- 系统版本:Win11专业版 / Linux
- 核显规格:40个RDNA 3.5计算单元
- AI加速指标:50 TOPS算力NPU

AMD发布Ryzen AI Halo本地算力平台 标配128GB统一内存与锐龙AI Max+ 395处理器
AMD正式发布Ryzen AI Halo本地大模型运行平台。该整机物理尺寸为149×149×43mm,整机重量约1.2kg,内部标配128GB LPDDR5X-8000统一内存与2TB PCIe Gen4×4 SSD。
架构革新与性能基准
该平台采用CPU、GPU与NPU共享同一内存池的设计。此项架构直接消除跨芯片数据搬运环节,使设备具备在本地运行最高2000亿参数大模型的能力。
AMD指出,搭载锐龙AI Max+ 395处理器的Halo平台每日可处理约6百万token。按此吞吐量测算,平台每月可为AI开发者节省约750美元云服务支出,整机成本预计于数月内回收。
竞品对标与市场定位
在与NVIDIA DGX Spark(定价4679美元)的对比中,Ryzen AI Halo在GLM 4.7基准测试中提速14%,GPT-OSS 120B提速7%,Qwen 3.5 122B提速12%。系统层面提供Windows与Linux双系统支持,而DGX Spark仅兼容Linux环境。
针对Apple Mac Mini M4 Pro,该机在Ace Step 1.5 XL等计算任务中性能输出达到3.3至7.3倍。设备售价与Mac Mini M4 Pro基本持平,且支持加载参数规模大两倍的模型。
软件生态与迭代规划
底层软件完整支持AMD ROCm 7.2.2开发套件。平台已针对PyTorch、vLLM、llama.cpp、ComfyUI、LM Studio等主流框架完成底层优化,并内置5份预置AI Playbooks。开发路线承诺对GPT-OSS、FLUX.2等前沿模型提供零日支持。
统一内存池机制解析:通过单一物理内存空间汇聚三大计算单元,避免数据在CPU、GPU、NPU间反复拷贝传输,直接提升本地推理效率。
成本效益口径解读:每月750美元的云服务替代空间,对应的是本地算力替代外部API调用或云端实例的边际成本下降,结合硬件一次性投入,形成数月成本回收期。
该平台的本地部署特性直接降低了企业构建垂直领域大模型的硬件门槛。针对后续硬件演进,AMD规划于2026年第三季度推出升级版本。该版本将集成锐龙AI Max+ PRO 495处理器,统一内存扩容至192GB,其中最多160GB可分配为显存,NPU算力指标提升至55 TOPS,目标于本地环境运行3000亿参数规模的大模型。
