行业评测再添新成果 中兴智能体展现硬核实力
【TechWeb评测】近日,中文通用大模型评测领域权威机构SuperCLUE正式发布了2024年6月手机助手GUI智能体测评榜单的重磅结果。依据本次评测公布的最新数据,中兴通讯旗下手机智能体产品以91.29分的卓越成绩夺得总成绩第一名桂冠,更为亮眼的是,该产品在全部评测维度的激烈竞争中均稳定占据首位,展现出全面而强劲的技术实力。
评测体系全面升级 聚焦智能体核心能力
据CNMO科技了解,SuperCLUE作为中文通用大模型领域具有重要影响力的评测基准平台,此次手机助手GUI智能体测评经过了严谨的评估体系设计。测评重点聚焦于具备完整智能体架构及配套大模型能力的产品,旨在客观呈现当前行业发展的真实水平。
本次评测共选取了市场上6款主流手机助手GUI智能体产品作为评测对象,涵盖了行业头部厂商的核心产品线。评测维度包括但不限于任务理解能力、对话交互体验、意图识别准确率、多轮对话管理、复杂场景处理等多个关键指标,全面考察各产品的综合智能表现。
中兴通讯拔得头筹 技术积累成效显著
在本次评测中,中兴通讯手机智能体产品表现尤为突出,以91.29分的绝对优势锁定榜首位置。值得注意的是,该产品并非仅在单一维度取得领先,而是在全部参评维度中均实现领跑,这一成绩充分证明了中兴在移动端智能体技术研发方面的深厚积累与均衡发展能力。
行业分析认为,中兴通讯此次能够在众多强劲竞争对手中脱颖而出,得益于其在人工智能领域持续的研发投入以及对移动端用户需求的深度理解。随着大模型技术在消费电子领域的应用深化,手机智能体正在成为厂商差异化竞争的重要赛道,中兴的率先布局已初见成效。
业内人士指出,SuperCLUE评测结果的发布为行业提供了重要的参考坐标,有助于推动手机智能体技术的规范化发展,同时为消费者选择相关产品提供了客观依据。


AI手机智能体评测结果揭晓:中兴gui手机智能体领跑榜单
行业评测发布:AI手机智能体综合能力排行公布
【综合消息】近日,国内AI领域一项关于手机智能体的综合评测结果正式公布。根据评测数据显示,参与测试的多款主流AI手机智能体产品呈现明显分层态势,其中中兴gui手机智能体在总成绩方面表现突出,与其他参测产品形成较大差距。
评测排名详细披露
根据评测机构公布的最终得分数据,排名第一位的为中兴gui手机智能体。紧随其后,第2至第6名的产品排名及得分情况如下:
第二名为智谱AI旗下的Open-AutoGLM,得分73.11分;第三名是阿里巴巴推出的Mobile-Agent-3.5,得分67.74分;第四名同样来自阿里巴巴,MAI-U1产品得分65.91分;第五名为阶跃星辰的GELab-Zero产品,得分54.26分;第六名*是字节跳动的UI-TARS,得分30.19分。从整体评测数据来看,排名第2至第6位的各产品在得分方面呈现逐级递减趋势,各产品间存在一定分差。业内分析认为,这一评测结果反映出当前国内AI手机智能体市场的发展格局,各厂商在技术积累与产品落地方面存在差异化表现。
--该评测涵盖国内主流AI厂商的手机智能体产品,从多个维度进行了综合评估。*
中兴通讯手机智能体分项能力获行业第一
近日,在手机智能体领域的多项核心能力评测中,中兴通讯GUI手机智能体表现突出,于分项维度评选中斩获多项第一。
核心能力获权威认可
在本次评测中,中兴手机智能体分别在复杂意图拆解与动态规划、多模态GUI感知与理解、跨应用全链路执行等关键项目中获得第一,充分展现其在手机智能体技术领域的领先实力。
三大能力构建核心优势
上述评测成果主要对应手机智能体在实际应用场景中的三大关键环节:
复杂意图拆解与动态规划能力*:该能力主要解决用户任务目标的理解问题。针对用户提出的复杂需求,智能体能够进行深度语义分析,将模糊的用户意图转化为明确、可执行的任务步骤,并制定科学合理的执行计划。多模态GUI感知与理解能力*:该能力聚焦于手机界面信息的识别。智能体可精准识别屏幕中的各类视觉元素,包括按钮、文本、图标等界面组件,为后续操作提供准确的交互对象定位。跨应用全链路执行能力*:该能力专注于多个应用之间的连续操作执行。智能体能够自主完成应用间的跳转、数据传递等复杂操作流程,实现用户指令的全自动化完成。这三大能力的协同作用,使中兴手机智能体能够更好地理解用户意图、感知界面环境、执行复杂任务,为用户带来更加智能、便捷的移动端交互体验。

SuperCLUE发布全新评测体系 推动端侧智能体量化标准建设
【TechWeb报道】随着大语言模型技术与端侧人工智能的深度融合,智能手机助手正在经历从传统语音交互向智能体Agent的重大变革。日前,SuperCLUE正式公布最新测评说明,旨在为行业建立统一的端侧AI能力量化基准,推动手机智能助手向具备图形用户界面自动化和复杂任务规划能力的方向演进。
手机助手智能化转型加速
业内人士分析指出,传统的手机语音助手主要依赖预设指令执行简单任务,用户体验受到较大局限。而大模型与端侧AI的结合,为手机助手注入了新的技术动能,使其能够理解更为复杂的用户意图,并具备跨应用协作与长链路任务执行的能力。这一技术趋势正在重塑人机交互范式,推动手机助手向真正的“智能体”形态转变。
统一评测标准填补行业空白
为解决当前端侧AI评测标准分散、难以横向对比的问题,SuperCLUE此次评测在技术架构上进行了系统创新。据测评说明显示,评测体系采用统一的ADB(Android Debug Bridge)手机交互环境与纯视觉输入方案,有效排除了硬件差异对评测结果的干扰。
在具体评测维度上,该体系设置了标准化任务集与科学评分体系,重点考察三大核心能力:意图解析精准度、视觉感知能力以及长链路任务执行质量。通过对Agent在复杂场景下决策质量的量化衡量,为行业提供了可参考的能力评估框架。
推动产业生态规范化发展
分析认为,SuperCLUE评测体系的发布填补了端侧智能体量化评估的空白,有助于推动产业链上下游协同发展。对于终端厂商而言,统一的评测标准能够指导产品优化方向;对于开发者而言,明确的能力评估指标有助于提升应用开发效率;对于用户而言,标准化评测结果将成为选购参考的重要依据。
随着端侧AI技术的持续成熟,手机智能助手的能力边界将进一步拓展。行业专家建议,相关企业应密切关注评测体系的后续更新,及时调整技术路线,以适应智能化转型的行业趋势。