英伟达发布首款ARM架构PC芯片RTX Spark,端侧AI算力达1 PFLOPS
在近日结束的Computex展上,英伟达正式推出其首款ARM架构PC芯片RTX Spark,同步披露该芯片搭载Blackwell架构GPU,端侧AI算力达到1 PFLOPS,并配备128GB统一内存。这一产品标志着英伟达正式切入PC芯片市场,与高通等厂商共同角逐AI PC赛道。
四家芯片厂商同台竞争AI PC
随着英伟达的加入,PC行业首次凑齐了四家强势的芯片厂商。其中两家为传统的x86架构厂商,另外两家则是新晋的ARM定制厂商——英伟达与高通。业内人士指出,这一格局意味着AI PC赛道正式进入多强竞争阶段。
RTX Spark产品细节
RTX Spark是英伟达首款面向PC的ARM架构芯片,其GPU部分采用Blackwell架构,端侧AI算力达到1 PFLOPS。所谓PFLOPS(PetaFLOPS),即每秒千万亿次浮点运算,是衡量高性能计算与AI推理能力的常用单位。此外,该芯片集成了128GB的统一内存——一种允许CPU和GPU直接访问同一内存区域的架构设计,有助于减少数据搬运开销,支撑大模型推理等本地AI应用。
“如果说此前PC芯片市场主要被x86架构主导,那么ARM架构的加入正在改写竞争版图。”——业内人士指出。
目前,高通已在ARM架构PC芯片领域有所布局,英伟达的入局使得ARM阵营实力进一步增强。对于传统x86厂商而言,来自ARM架构的挑战越发明显。
- 英伟达RTX Spark:首款ARM架构PC芯片,搭载Blackwell GPU,1 PFLOPS AI算力,128GB统一内存。
- 竞争格局:四家芯片厂商(x86两家+ARM两家)同台竞争AI PC赛道。

AMD回应英伟达入局智能体PC赛道:两年耕耘已占先机
在2025年Computex展会期间,AMD高级副总裁、客户端业务总经理Rahul Tikoo针对英伟达新发布的RTX Spark平台首次公开表态。他表示,AMD对这一竞争者的入局持欢迎态度,认为这将共同推动端侧AI市场的发展。
“很高兴看到英伟达进入这一领域,两年以来,我们几乎是这一领域唯一的参与者。”—— Rahul Tikoo
两代产品迭代与35款设备落地
AMD自2025年初推出锐龙AI Max系列(代号Strix Halo)以来,已在智能体AI市场完成了从产品发布到产业生态的初步构建。该系列旗舰产品锐龙AI Max+ 395采用“CPU+GPU+NPU”三位一体的异构融合架构。
- CPU:16个大核、32线程,基于Zen 5架构
- GPU:RDNA 3.5架构的Radeon 8060S,拥有40个计算单元
- NPU:算力达50 TOPS
- 内存:最高支持128GB统一内存,通过AMD可变显存技术可将最多96GB用于显存
AMD表示,该配置能支持千亿参数级别的大语言模型在本地流畅运行。截至目前,AMD已与合作伙伴推出超过35款搭载锐龙AI Max系列的智能体主机产品。在Computex期间,AMD还发布了更新的锐龙AI Max PRO 400系列,完成了在该领域的完整迭代。
智能体主机概念与生态支持
AMD提出了“智能体主机”(Agent Computer)的概念,与传统的PC运行用户应用、执行用户指令不同,智能体主机可根据用户需求主动运行应用程序、代用户下达指令并输出最终结果。
为推动开发者生态,AMD推出了锐龙AI Halo开发者平台,并持续投入软件优化工作。该公司计划将优化软件扩展部署到全系列锐龙AI Max产品,覆盖笔记本、工作站、台式机等各类OEM设备。
对英伟达RTX Spark的对比
英伟达发布的RTX Spark并非传统PC处理器,而是由拥有6144个CUDA核心的Blackwell架构GPU与定制的20核Grace CPU组成的合成体,主要针对智能体AI应用。根据英伟达创始人黄仁勋的表述,RTX Spark旨在将大语言模型、长期记忆、工具调用等能力本地化,让PC成为“个人AI计算平台”。
然而,RTX Spark的终端产品预计还需约半年才能上市。相比之下,AMD已拥有两代产品迭代积累的产品成熟度,以及原生x86架构在Windows生态中的深度兼容优势。Rahul Tikoo认为,在这一时间维度与产业布局的广度与深度上,AMD具有显著先发优势。

AMD锐龙AI Max系列部署一年半后 智能体AI应用加速落地
2026年初,以OpenClaw为代表的智能体AI迅速兴起。这一类型的AI不仅能够回答问题,更能够自主进行研究、写作、总结、分析、规划并执行任务,并持续在各类任务、工具和信息之间协作。随着智能体成为现实,PC第一次从“被人操作的工具”变为“可以去操作其他工具的主体”,智能体主机(Agent Computer)的概念应运而生。
智能体AI被视为当下杀手级应用
AMD高级副总裁Rahul在谈及这一趋势时表示:“现在,智能体AI就是那个杀手级应用。”他指出,一年多以前AMD所做的技术准备已让PC上的AI跨越了重要里程碑。Rahul的主力机本身配备锐龙AI Max+395的惠普G1a,拥有128GB内存,可用来运行龙虾等各种智能体。
128GB统一内存与96GB显存成关键支撑
回溯至2025年1月CES期间,AMD发布了锐龙AI Max系列。当时行业普遍在讨论NPU的TOPS值含义,并追问推动端侧AI起飞的杀手级应用是什么。AMD的应对是将128GB大容量统一内存塞入笔记本,并以高达96GB的显存,把本地运行大模型从实验室场景推向市场。这一决策的成效通过两个维度显现:一方面是智能体AI的快速兴起,另一方面是产品落地速度——
锐龙AI Max系列发布后,惠普、联想、华硕和众多国内厂商跟进推出了超过35款产品,覆盖笔记本、工作站、台式机的全品类形态。
智能体AI可被视为一类能够自主执行任务的AI系统,其核心特征包括规划、工具调用和持续协作。由于本地运行需要较大内存容量,AMD预先部署的128GB统一内存方案恰好匹配了这一需求。
PC角色转变 本地AI能力从实验走向市场
从市场直接表现看,多品牌厂商的快速跟进表明端侧AI硬件已具备规模化条件。智能体AI的兴起进一步推动了PC使用逻辑的转变,本地大模型运行也因此从前期实验室尝试转向实际应用阶段。

AMD锐龙AI Max PRO 400系列2026年第三季度上市 显存分配升至192GB
AMD正在加速其智能体AI产品的迭代节奏。根据最新披露的信息,锐龙AI Max PRO 400系列预计于2026年第三季度上市,该产品将在内存架构上实现显著升级,从而为本地大模型运行提供更强的支持。
统一内存架构升级:最大支持160GB显存分配
新一代锐龙AI Max PRO 400系列将内存容量从上一代的128GB提升至192GB。通过统一内存架构,该产品可分配最高160GB显存用于计算任务,这一容量几乎是上代产品(分配容量)的两倍。对于需要本地运行大语言模型的用户而言,可支持的模型参数将从70B级别跃升至300B级别。
“本地可运行的模型参数也从70B级别跃升到300B级别,同时支持多个大语言模型并行运行和智能体集群协作。” —— 原始素材
统一内存架构是指CPU和GPU共享同一物理内存池,无需在两者之间显式拷贝数据。这一设计使得GPU可以访问系统全部内存资源,从而在模型推理和训练过程中获得更大的显存空间,减少因显存不足导致的内存交换与性能损失。
产品迭代节奏加快:从第一代到第二代的快速升级
在智能体AI产品领域,AMD正努力加快产品更新周期。锐龙AI Max PRO 400系列是继初代产品后的第二代型号,其内部代号为Gorgon Halo。此次迭代发生于RTX Spark产品进入市场之前的时间窗口内,AMD借此完成了从第一代到第二代的完整升级周期。
在支持多个大语言模型并行运行以及智能体集群协作方面,新一代产品的性能提升将为本地化AI部署提供更大弹性。

AMD上海AI开发者日揭示x86生态优势,锐龙AI Max PRO系列以192GB内存对位英伟达RTX Spark
5月19日,AMD在上海举办了国内首场AI开发者日活动。活动现场,AMD客户端业务核心负责人与开发者进行全天面对面交流,并提供了沙盒试验环境,允许开发者携带项目在AMD硬件和软件栈上运行、调试和优化,由工程师现场协助。此次活动涵盖了主旨演讲、技术会议、实践工作坊、作品分享与产品应用演示。
产品定位对比:内存与模型能力差异
根据活动期间透露的信息,锐龙AI Max PRO 400系列提供192GB超大容量统一内存,可支持300B参数规模的模型;而英伟达RTX Spark的硬件指标为128GB内存、支持70B模型。市场预期RTX Spark最早在2026年Q3发布,搭载该芯片的PC产品可能至2026年底或2027年初才上市。相较之下,AMD基于x86架构的锐龙AI Max系列已历经两代迭代,产品成熟度与生态配合度被认为优于尚处量产前夜的RTX Spark。
“锐龙AI Max PRO 400系列的192GB超大容量统一内存和300B模型能力,直接对位的是RTX Spark的128GB和70B模型。两代迭代积累下的产品成熟度和生态配合度,与一颗还处在量产前夜阶段的芯片之间存在着本质差异。”
生态兼容性:x86原生优势与Arm架构的适配挑战
RTX Spark采用Arm架构的Grace CPU与Blackwell GPU组合,受底层架构限制无法兼容常规Windows,需依赖微软定制的Windows on Arm版本,通过模拟层运行,可能带来性能损耗和兼容性问题。而AMD的x86平台在PC领域已积累四十年经验,Windows、Linux及主流AI框架(如PyTorch、TensorFlow、Llama.cpp)均原生支持。开发者拿到搭载AMD锐龙AI Max系列的设备,装好驱动即可直接运行项目,无需ARM翻译层适配,也跳过了CUDA兼容性验证过程。
软件生态投入:ROCm与Playbook降低开发门槛
AMD在软件方面强调了ROCm开发平台与Playbook开源指南两项关键措施。ROCm实现了全部主流AI框架的Day 0首发适配,即框架发布当天即提供支持,从云端到终端全链路无缝兼容。Playbook是一套开源的逐步操作指南,覆盖环境搭建、依赖安装到具体项目实践。目前已提供五套Playbook,涵盖ComfyUI文生图、Agent项目、N8N自动化流程等高频需求场景,后续将继续增加。平台侧预装完整开发环境,开机即可使用。
生态赋能:面向高校与开发者赛事
为降低开发者门槛,AMD还部署了系列生态赋能项目:面向高校AI教育、科研实践和成果转化的“春雨计划”,“AMD锐龙AI智能体创新应用大赛”,以及全球举办的AMD AI开发者日。这些活动旨在让智能体走向普及。AMD表示,AI开发不应只局限于资深技术人员,普通开发者也能在x86生态的低门槛下轻松上手,普惠全行业。

AMD披露开发者计划细节 称AI PC市场2025年占全球PC逾三成
AMD在近期发布的开发者计划中披露了多项具体支撑措施,包括在线云资源访问、向开发者免费提供Token、定期发布最佳已知配置(BKC)更新,以及由AMD工程团队提供直接技术支持。该计划旨在降低开发者利用本地设备进行AI推理的门槛。
开发者支撑体系与市场定位
AMD将中国市场视为全球AI应用开发者和硬件供应链的关键环节,早前已把赋能开发者置于优先位置。计划中的“最佳已知配置”(BKC)是经AMD验证的硬件与软件参数组合,可帮助开发者在特定平台上稳定运行AI模型。
在云端AI使用成本持续上升的背景下,本地推理的价值变得前所未有地清晰。
根据Gartner的数据,AI PC在2025年将占全球PC出货量超过三成,到2029年或成为市场常态。AMD高级副总裁Rahul在采访中表示,该市场目前仍处于起步阶段,未来将发展为一个规模巨大的市场。
企业成本对比:本地+云端协作可大幅削减开支
Rahul在拜访一家大型企业时给出了一笔经济账:若对8000名开发者推广使用Claude Code,预计每位开发人员每月需要大约3000美元,月Token费接近2400万美元。而如果让智能体主机成为AI节点的一部分,改为本地主机与云端协作的工作组合,则可大幅节省费用。
Rahul强调:“本地推理不是替代云端,是给开发者多一个高效的选择。AMD要做的,就是让这个选择变得足够简单。”
未来竞争格局:x86先发优势与英伟达入局
Rahul认为,未来的AI计算架构大概率是混合模式——本地、私有基础设施、云端三层协同,每层执行差异化的计算负载。在此架构中,x86凭借通用性和生态优势占据重要位置。随着英伟达加入智能体AI赛道,竞争进入新阶段。AMD在x86传统优势市场的先发和原生优势、技术路线选择、生态广度、深度与开放性、以及开发者赋能等关键布局已初见成效。
- AMD开发者计划支撑:在线云资源、免费Token、BKC更新、工程团队支持
- Gartner预测:AI PC 2025年占全球PC逾三成,2029年或成常态
- 企业案例:8000开发者使用Claude Code月费近2400万美元,改用本地+云端协作可大幅节省
