首页 / 科技 / x86生态系统咨询小组发布ACE规范1.15版本集成原生矩阵乘法引擎与低精度格式

x86生态系统咨询小组发布ACE规范1.15版本集成原生矩阵乘法引擎与低精度格式

摸鱼不慌管理员 2026-06-20 12:07:14

科技媒体Wccftech于昨日（6月19日）报道，x86生态系统咨询小组（EAG）正式发布ACE规范1.15版本。该版本通过引入原生矩阵乘法引擎和低精度格式，旨在提升x86架构在人工智能任务中的执行效率。

ACE规范1.15版本的两项关键技术特性被明确：

本次更新标志着x86生态系统在AI加速标准化方面迈出新的一步。通过将矩阵乘法引擎与低精度格式直接纳入架构规范，x86处理器有望在不依赖独立异构加速器的情况下更高效地执行AI推理任务。

ACE规范1.15版本由x86生态系统咨询小组（EAG）于6月19日正式发布，该小组由多家行业公司组成，负责维护x86架构的生态标准与演进路线。

业界观察人士指出，该规范为未来x86芯片的AI性能提升提供了统一的硬件接口基础，有助于软件开发者在跨平台场景下获得一致的加速体验。

英特尔与AMD联合成立EAG小组推动x86架构标准化并推出ACE指令集

2024年，英特尔与AMD公司宣布联合成立EAG小组，旨在协调x86架构的未来演进方向，推动x86生态的规范化和标准化。这一合作被业界视为“世纪破冰”，两大芯片巨头首次在指令集层面展开深度协作。

作为EAG小组的首批成果，ACE（AI Compute Extensions）是一组专为加速人工智能与机器学习负载设计的x86指令集。其核心目标是优化矩阵乘法运算——深度学习中最频繁的计算操作——以及低精度数据格式处理。

矩阵乘法运算是深度学习模型中线性层和卷积层的基础计算单元，其效率直接影响模型训练与推理速度。

ACE指令集在设计之初即要求AMD与英特尔共同承诺支持，且未来产品更迭不会轻易废弃。这一机制旨在避免此前AVX-512指令集因各厂商不同实现导致的软件生态碎片化问题。

在技术实现上，ACE在现有AVX向量指令基础上，新增了“图块寄存器”（tile register）状态，并定义了相应的数据移动与处理操作。图块寄存器可视为一种二维数据缓存结构，专门用于高效处理矩阵块数据。

ACE还纳入AVX10框架下的专用格式转换指令，进一步完善对低精度数据格式的支持。

这一路线图表明，ACE指令集将从底层硬件层面全面赋能AI计算，逐步覆盖未来数代处理器产品。

在数据支持范围上，ACE兼容多种整数与浮点数据格式，包括标准数据类型以及MX联盟定义的微缩格式。

标准数据类型包含整数（INT8、INT32）与浮点（FP32、BF16、FP16）。此外，E8M0与FP8也作为标准浮点格式被纳入支持范围。

MX联盟定义的格式通过重新分配符号、指数和尾数的位宽实现紧凑数值编码。对应子格式列表如下：

ACE支持的数据类型完整列表：INT8、INT32、FP32、BF16、FP16、E8M0、FP8，以及MX联盟定义的MX FP8（SE5M2/SE4M3）、MX FP6（SE3M2/SE2M3）、MX FP4（SE2M1）和MX INT8。

本文由摸鱼不慌发布，转载请注明出处。
文章链接：https://www.moyubuhuang.com/keji/202606/20562.html