首页 / 科技 / 英伟达发布首款ARM架构PC芯片RTX Spark，端侧AI算力达1 PFLOPS

英伟达发布首款ARM架构PC芯片RTX Spark，端侧AI算力达1 PFLOPS

摸鱼不慌管理员 2026-06-12 16:26:43

在近日结束的Computex展上，英伟达正式推出其首款ARM架构PC芯片RTX Spark，同步披露该芯片搭载Blackwell架构GPU，端侧AI算力达到1 PFLOPS，并配备128GB统一内存。这一产品标志着英伟达正式切入PC芯片市场，与高通等厂商共同角逐AI PC赛道。

四家芯片厂商同台竞争AI PC

随着英伟达的加入，PC行业首次凑齐了四家强势的芯片厂商。其中两家为传统的x86架构厂商，另外两家则是新晋的ARM定制厂商——英伟达与高通。业内人士指出，这一格局意味着AI PC赛道正式进入多强竞争阶段。

RTX Spark产品细节

RTX Spark是英伟达首款面向PC的ARM架构芯片，其GPU部分采用Blackwell架构，端侧AI算力达到1 PFLOPS。所谓PFLOPS（PetaFLOPS），即每秒千万亿次浮点运算，是衡量高性能计算与AI推理能力的常用单位。此外，该芯片集成了128GB的统一内存——一种允许CPU和GPU直接访问同一内存区域的架构设计，有助于减少数据搬运开销，支撑大模型推理等本地AI应用。

“如果说此前PC芯片市场主要被x86架构主导，那么ARM架构的加入正在改写竞争版图。”——业内人士指出。

目前，高通已在ARM架构PC芯片领域有所布局，英伟达的入局使得ARM阵营实力进一步增强。对于传统x86厂商而言，来自ARM架构的挑战越发明显。

英伟达RTX Spark：首款ARM架构PC芯片，搭载Blackwell GPU，1 PFLOPS AI算力，128GB统一内存。
竞争格局：四家芯片厂商（x86两家+ARM两家）同台竞争AI PC赛道。

英伟达发布首款ARM架构PC芯片RTX Spark，端侧AI算力达1 PFLOPS 第1张

AMD回应英伟达入局智能体PC赛道：两年耕耘已占先机

在2025年Computex展会期间，AMD高级副总裁、客户端业务总经理Rahul Tikoo针对英伟达新发布的RTX Spark平台首次公开表态。他表示，AMD对这一竞争者的入局持欢迎态度，认为这将共同推动端侧AI市场的发展。

“很高兴看到英伟达进入这一领域，两年以来，我们几乎是这一领域唯一的参与者。”—— Rahul Tikoo

两代产品迭代与35款设备落地

AMD自2025年初推出锐龙AI Max系列（代号Strix Halo）以来，已在智能体AI市场完成了从产品发布到产业生态的初步构建。该系列旗舰产品锐龙AI Max+ 395采用“CPU+GPU+NPU”三位一体的异构融合架构。

CPU：16个大核、32线程，基于Zen 5架构
GPU：RDNA 3.5架构的Radeon 8060S，拥有40个计算单元
NPU：算力达50 TOPS
内存：最高支持128GB统一内存，通过AMD可变显存技术可将最多96GB用于显存

AMD表示，该配置能支持千亿参数级别的大语言模型在本地流畅运行。截至目前，AMD已与合作伙伴推出超过35款搭载锐龙AI Max系列的智能体主机产品。在Computex期间，AMD还发布了更新的锐龙AI Max PRO 400系列，完成了在该领域的完整迭代。

智能体主机概念与生态支持

AMD提出了“智能体主机”（Agent Computer）的概念，与传统的PC运行用户应用、执行用户指令不同，智能体主机可根据用户需求主动运行应用程序、代用户下达指令并输出最终结果。

为推动开发者生态，AMD推出了锐龙AI Halo开发者平台，并持续投入软件优化工作。该公司计划将优化软件扩展部署到全系列锐龙AI Max产品，覆盖笔记本、工作站、台式机等各类OEM设备。

对英伟达RTX Spark的对比

英伟达发布的RTX Spark并非传统PC处理器，而是由拥有6144个CUDA核心的Blackwell架构GPU与定制的20核Grace CPU组成的合成体，主要针对智能体AI应用。根据英伟达创始人黄仁勋的表述，RTX Spark旨在将大语言模型、长期记忆、工具调用等能力本地化，让PC成为“个人AI计算平台”。

然而，RTX Spark的终端产品预计还需约半年才能上市。相比之下，AMD已拥有两代产品迭代积累的产品成熟度，以及原生x86架构在Windows生态中的深度兼容优势。Rahul Tikoo认为，在这一时间维度与产业布局的广度与深度上，AMD具有显著先发优势。

英伟达发布首款ARM架构PC芯片RTX Spark，端侧AI算力达1 PFLOPS 第2张

AMD锐龙AI Max系列部署一年半后智能体AI应用加速落地

2026年初，以OpenClaw为代表的智能体AI迅速兴起。这一类型的AI不仅能够回答问题，更能够自主进行研究、写作、总结、分析、规划并执行任务，并持续在各类任务、工具和信息之间协作。随着智能体成为现实，PC第一次从“被人操作的工具”变为“可以去操作其他工具的主体”，智能体主机（Agent Computer）的概念应运而生。

智能体AI被视为当下杀手级应用

AMD高级副总裁Rahul在谈及这一趋势时表示：“现在，智能体AI就是那个杀手级应用。”他指出，一年多以前AMD所做的技术准备已让PC上的AI跨越了重要里程碑。Rahul的主力机本身配备锐龙AI Max+395的惠普G1a，拥有128GB内存，可用来运行龙虾等各种智能体。

128GB统一内存与96GB显存成关键支撑

回溯至2025年1月CES期间，AMD发布了锐龙AI Max系列。当时行业普遍在讨论NPU的TOPS值含义，并追问推动端侧AI起飞的杀手级应用是什么。AMD的应对是将128GB大容量统一内存塞入笔记本，并以高达96GB的显存，把本地运行大模型从实验室场景推向市场。这一决策的成效通过两个维度显现：一方面是智能体AI的快速兴起，另一方面是产品落地速度——

锐龙AI Max系列发布后，惠普、联想、华硕和众多国内厂商跟进推出了超过35款产品，覆盖笔记本、工作站、台式机的全品类形态。

智能体AI可被视为一类能够自主执行任务的AI系统，其核心特征包括规划、工具调用和持续协作。由于本地运行需要较大内存容量，AMD预先部署的128GB统一内存方案恰好匹配了这一需求。

PC角色转变本地AI能力从实验走向市场

从市场直接表现看，多品牌厂商的快速跟进表明端侧AI硬件已具备规模化条件。智能体AI的兴起进一步推动了PC使用逻辑的转变，本地大模型运行也因此从前期实验室尝试转向实际应用阶段。

英伟达发布首款ARM架构PC芯片RTX Spark，端侧AI算力达1 PFLOPS 第3张

AMD锐龙AI Max PRO 400系列2026年第三季度上市显存分配升至192GB

AMD正在加速其智能体AI产品的迭代节奏。根据最新披露的信息，锐龙AI Max PRO 400系列预计于2026年第三季度上市，该产品将在内存架构上实现显著升级，从而为本地大模型运行提供更强的支持。

统一内存架构升级：最大支持160GB显存分配

新一代锐龙AI Max PRO 400系列将内存容量从上一代的128GB提升至192GB。通过统一内存架构，该产品可分配最高160GB显存用于计算任务，这一容量几乎是上代产品（分配容量）的两倍。对于需要本地运行大语言模型的用户而言，可支持的模型参数将从70B级别跃升至300B级别。

“本地可运行的模型参数也从70B级别跃升到300B级别，同时支持多个大语言模型并行运行和智能体集群协作。” —— 原始素材

统一内存架构是指CPU和GPU共享同一物理内存池，无需在两者之间显式拷贝数据。这一设计使得GPU可以访问系统全部内存资源，从而在模型推理和训练过程中获得更大的显存空间，减少因显存不足导致的内存交换与性能损失。

产品迭代节奏加快：从第一代到第二代的快速升级

在智能体AI产品领域，AMD正努力加快产品更新周期。锐龙AI Max PRO 400系列是继初代产品后的第二代型号，其内部代号为Gorgon Halo。此次迭代发生于RTX Spark产品进入市场之前的时间窗口内，AMD借此完成了从第一代到第二代的完整升级周期。

在支持多个大语言模型并行运行以及智能体集群协作方面，新一代产品的性能提升将为本地化AI部署提供更大弹性。

英伟达发布首款ARM架构PC芯片RTX Spark，端侧AI算力达1 PFLOPS 第4张

AMD上海AI开发者日揭示x86生态优势，锐龙AI Max PRO系列以192GB内存对位英伟达RTX Spark

5月19日，AMD在上海举办了国内首场AI开发者日活动。活动现场，AMD客户端业务核心负责人与开发者进行全天面对面交流，并提供了沙盒试验环境，允许开发者携带项目在AMD硬件和软件栈上运行、调试和优化，由工程师现场协助。此次活动涵盖了主旨演讲、技术会议、实践工作坊、作品分享与产品应用演示。

产品定位对比：内存与模型能力差异

根据活动期间透露的信息，锐龙AI Max PRO 400系列提供192GB超大容量统一内存，可支持300B参数规模的模型；而英伟达RTX Spark的硬件指标为128GB内存、支持70B模型。市场预期RTX Spark最早在2026年Q3发布，搭载该芯片的PC产品可能至2026年底或2027年初才上市。相较之下，AMD基于x86架构的锐龙AI Max系列已历经两代迭代，产品成熟度与生态配合度被认为优于尚处量产前夜的RTX Spark。

“锐龙AI Max PRO 400系列的192GB超大容量统一内存和300B模型能力，直接对位的是RTX Spark的128GB和70B模型。两代迭代积累下的产品成熟度和生态配合度，与一颗还处在量产前夜阶段的芯片之间存在着本质差异。”

生态兼容性：x86原生优势与Arm架构的适配挑战

RTX Spark采用Arm架构的Grace CPU与Blackwell GPU组合，受底层架构限制无法兼容常规Windows，需依赖微软定制的Windows on Arm版本，通过模拟层运行，可能带来性能损耗和兼容性问题。而AMD的x86平台在PC领域已积累四十年经验，Windows、Linux及主流AI框架（如PyTorch、TensorFlow、Llama.cpp）均原生支持。开发者拿到搭载AMD锐龙AI Max系列的设备，装好驱动即可直接运行项目，无需ARM翻译层适配，也跳过了CUDA兼容性验证过程。

软件生态投入：ROCm与Playbook降低开发门槛

AMD在软件方面强调了ROCm开发平台与Playbook开源指南两项关键措施。ROCm实现了全部主流AI框架的Day 0首发适配，即框架发布当天即提供支持，从云端到终端全链路无缝兼容。Playbook是一套开源的逐步操作指南，覆盖环境搭建、依赖安装到具体项目实践。目前已提供五套Playbook，涵盖ComfyUI文生图、Agent项目、N8N自动化流程等高频需求场景，后续将继续增加。平台侧预装完整开发环境，开机即可使用。

生态赋能：面向高校与开发者赛事

为降低开发者门槛，AMD还部署了系列生态赋能项目：面向高校AI教育、科研实践和成果转化的“春雨计划”，“AMD锐龙AI智能体创新应用大赛”，以及全球举办的AMD AI开发者日。这些活动旨在让智能体走向普及。AMD表示，AI开发不应只局限于资深技术人员，普通开发者也能在x86生态的低门槛下轻松上手，普惠全行业。

英伟达发布首款ARM架构PC芯片RTX Spark，端侧AI算力达1 PFLOPS 第5张

AMD披露开发者计划细节称AI PC市场2025年占全球PC逾三成

AMD在近期发布的开发者计划中披露了多项具体支撑措施，包括在线云资源访问、向开发者免费提供Token、定期发布最佳已知配置（BKC）更新，以及由AMD工程团队提供直接技术支持。该计划旨在降低开发者利用本地设备进行AI推理的门槛。

开发者支撑体系与市场定位

AMD将中国市场视为全球AI应用开发者和硬件供应链的关键环节，早前已把赋能开发者置于优先位置。计划中的“最佳已知配置”（BKC）是经AMD验证的硬件与软件参数组合，可帮助开发者在特定平台上稳定运行AI模型。

在云端AI使用成本持续上升的背景下，本地推理的价值变得前所未有地清晰。

根据Gartner的数据，AI PC在2025年将占全球PC出货量超过三成，到2029年或成为市场常态。AMD高级副总裁Rahul在采访中表示，该市场目前仍处于起步阶段，未来将发展为一个规模巨大的市场。

企业成本对比：本地+云端协作可大幅削减开支

Rahul在拜访一家大型企业时给出了一笔经济账：若对8000名开发者推广使用Claude Code，预计每位开发人员每月需要大约3000美元，月Token费接近2400万美元。而如果让智能体主机成为AI节点的一部分，改为本地主机与云端协作的工作组合，则可大幅节省费用。

Rahul强调：“本地推理不是替代云端，是给开发者多一个高效的选择。AMD要做的，就是让这个选择变得足够简单。”

未来竞争格局：x86先发优势与英伟达入局

Rahul认为，未来的AI计算架构大概率是混合模式——本地、私有基础设施、云端三层协同，每层执行差异化的计算负载。在此架构中，x86凭借通用性和生态优势占据重要位置。随着英伟达加入智能体AI赛道，竞争进入新阶段。AMD在x86传统优势市场的先发和原生优势、技术路线选择、生态广度、深度与开放性、以及开发者赋能等关键布局已初见成效。