百度智能云6月12日发布DAA衡量体系 推动通用智能体接入真实工作流
6月12日,北京智源大会大模型产业论坛现场,百度智能云副总裁殷大伟就通用智能体在产业端的落地路径进行公开演示。
当前大模型应用正在向智能体阶段演进。殷大伟在论坛上指出,通用智能体“百度搭子DuMate”的部署,旨在将原有的技术验证环节直接嵌入企业日常业务流转中。
核心指标与底层支撑架构
围绕智能体规模化应用,百度智能云正式提出以DAA(Daily Active Agent,即每日活跃智能体)为核心的价值衡量体系。该指标将软件生态的演进方向明确为全面Agent化,直接替代传统单一的算力消耗评估模式。
“AI的价值正从单纯的对话走向真实的生产力闭环。”殷大伟表示,该衡量体系正引领AI行业从“算力消耗”走向“真实赋能”。
技术落地路径与生态支撑
为满足智能体规模化落地的基础需求,百度千帆Agent Infra平台被正式推向市场。针对该平台的运作逻辑,其功能模块主要划分为四个层级:
- 基座模型:为智能体提供基础推理与决策能力
- 开发工具:匹配不同业务场景的操作接口
- 驾驭工程:负责智能体的调度与流程管控
- 运行生态:保障智能体在复杂环境下的稳定交互
该体系的推广将直接促使AI应用的评价标准从底层资源投入转向具体业务场景的渗透程度。

百度智能云推出通用智能体百度搭子DuMate,月访问量增速达114.72%
百度智能云副总裁殷大伟指出,自进化型Agent落地面临部署复杂、数据合规要求高及权限管理矛盾三大门槛。通用智能体从测试阶段走向生产环境,核心在于安全可控的环境交付。
今年3月底,百度智能云正式发布通用智能体百度搭子DuMate。该产品以端云协同架构切入企业级市场,以114.72%的月访问量增速登顶AI产品增速榜,月访问量达到116万,位列总榜第三。
双沙箱机制与风险阻断逻辑
针对多平台部署复杂与数据安全痛点,DuMate采用端云协同与双沙箱运行机制。云端环境负责不间断执行7×24小时监控任务,本地端侧专用于运行数据敏感型业务,确保数据不出域。
权限管理是Agent执行任务的关键变量。权限过大易引发操作风险,权限过窄则限制功能发挥。DuMate内置二次确认机制,针对高权限敏感操作设置风险阻断节点,有效规避误操作。在交互与任务执行过程中,系统会自动总结历史经验,持续优化系统提示词与记忆结构。
评测数据与DAA指标转向
在国际评测中,DuMate以93.3%的任务成功率登顶PinchBench与DeepResearch Bench榜首,获得全球Agent执行争霸赛冠军,超越Anthropic与OpenAI同期表现。
业界过去多以Token消耗评估AI规模,该指标直接对应算力成本与资源投入。百度创始人李彦宏于今年5月百度Create大会上首次提出日活智能体数(DAA)。该指标字面含义为每日独立活跃的智能体数量,衡量维度从成本侧切换至应用侧,直接统计正在为人类工作并交付结果的任务频次。
DAA指标的引入,将推动智能体平台考核逻辑由底层资源消耗转向上层业务交付,促使产品迭代重心向实际工作流嵌入迁移。
底层架构支撑与千帆生态布局
殷大伟表示,卓越智能体需依托坚实的Agent Infra。百度智能云搭建千帆Agent Infra,划分为词元工厂、工具服务、驾驭工程与智能体四层架构。
- 词元工厂整合文心及主流开源模型共150个SOTA模型,主流模型推理速度领先行业25%,首Token延时缩短16%。
- 工具服务汇聚百度自有及第三方海量Skills与MCP组件。
- 驾驭工程覆盖自主进化与端云协同能力,Token消耗较行业平均节省23%,任务成功率超95%。
该基础设施之上,平台部署了通用智能体百度搭子DuMate、零门槛代码智能体百度秒哒、自我演化决策智能体百度伐谋及基于本体的数据智能体百度胜算等产品矩阵。
目前平台开放的Agent数量突破140万。组件调用量已达千万级规模。该体系已服务全国80%的央企及超46万家企业客户。
垂直场景验证与生产力转化
DuMate在真实业务流中已呈现效率替代效果。野生动物摄影师面临100TB监控素材处理需求。以往人工检索剪辑需数天,通过一句话输入需求,产品可自动拆解工作流。
几分钟内即可精准归档动物出现的关键片段。创业者将产品测评、文稿撰写、排版及发布流程交由DuMate辅助。原需多人协同近20小时的工作,现压缩至5分钟内完成一键工作流。
从模型到Agent,我们正在见证真实生产力的爆发。百度智能云将持续依托全栈AI能力,加速中国智能体应用生态的繁荣,让每一个人和企业都能拥有自己强大的“AI搭子”。
