首页 / 财经 / 智源研究院院长王仲远:世界模型是下一代人工智能基座,三大瓶颈制约发展

智源研究院院长王仲远:世界模型是下一代人工智能基座,三大瓶颈制约发展

摸鱼不慌
摸鱼不慌管理员

真实物理数据匮乏、技术路线尚未收敛、评测体系不完善——在2026北京智源大会召开之际,智源研究院院长王仲远接受中国证券报记者采访时,将这些难题列为当前世界模型发展道路上的核心障碍。

王仲远明确表示,世界模型被定位为下一代人工智能的基座模型,其突破方向将深刻影响通用人工智能的整体演进。

“世界模型是下一代人工智能的基座模型,当前的瓶颈主要体现在真实物理数据匮乏、技术路线尚未收敛、评测体系不完善等。”王仲远说。

世界模型的内涵

世界模型指能够理解并模拟真实物理世界运行规律的人工智能系统。不同于当前以语言处理为主的大模型,它试图让机器具备对物理规则、因果关系的认知能力,因而被视为构建通用人工智能的关键基座。

从“悟道”到“悟界”的技术演进

王仲远同时详细阐释了智源研究院从早期“悟道”系列模型到“悟界”世界模型的技术逻辑。这一演进路径意味着研究重点从语言智能向物理世界理解、交互能力的战略性迁移,背后的决策依据正是对下一代人工智能核心能力的重新判断。

在2026北京智源大会这一行业节点上,智源研究院披露的最新方向,为人工智能下一阶段的技术路线选择提供了重要参照。

王仲远解析世界模型四类技术路径 智源发布悟界·Physis-v0.1探索第五范式

在人工智能从数字世界迈向物理世界的范式变革期,智源研究院院长王仲远对世界模型的演进给出了三到五年的持续迭代预期。他同时呼吁行业围绕“预测下一个物理状态”构建统一的评测基准,并指出将视频生成模型等同于世界模型是典型的概念误用。

“预测下一个物理状态”与四类技术路线

王仲远将人工智能的发展脉络概括为:大语言模型处理文字问题,多模态模型引入图像、音频、脑信号,而下一步需要解决的是真实物理世界的问题。智源研究院推出的“悟界”系列大模型,其设计理念即是构建面向物理世界的人工智能基座模型。

这一方向意味着AI的重心正从“预测下一个词元”向“预测下一个物理状态”跃迁。所谓预测下一个物理状态,指的是让AI基于当前物理环境的信息,推演下一步将发生的、符合真实世界规则的变化,而非仅仅生成视觉上合理的画面。

王仲远直言:“很多人把视频生成模型等同于世界模型,这是典型的概念误用。视频生成模型可以生成‘猪在天上飞’的画面,因为它的训练目标从来不是还原真实物理规则。语言大模型能答对高考物理题,但也不代表它理解真实物理世界的交互逻辑。”

他将当前主流的世界模型技术路径划分为四类:以语言为中心、以像素为中心、以三维结构为中心,以及以视觉表征为中心。王仲远评估认为,这四类模型距离真正面向物理世界的基座模型都尚有较大距离,各自有其技术价值,但世界模型整体仍处于早期阶段,需要大量科研探索。

数据瓶颈与仿真缺陷

数据被王仲远视为当前世界模型发展的核心瓶颈之一。他以具身智能为例分析,机器人之所以无法像人类一样灵活应对各类场景,核心在于缺乏对世界常识和物理规律的通用理解。一个杯子从桌边掉落的结果,人类凭直觉即可判断,而AI要在感知、理解、交互、决策的完整链路上实现这一能力,目前还未能完全做到。

真实物理世界的多模态交互数据极度稀缺。王仲远判断,未来随着具身硬件的普及,形成“物理世界的互联网”并大规模积累真实数据之后,才有可能催生出跨时代的世界模型。这一逻辑与当年数字互联网数据催化大语言模型爆发的路径相似。

王仲远同时提醒:“各种物理仿真工具、游戏引擎都可以对世界进行模拟,但因为人类掌握的真实物理知识、引擎规则和算法还不够完备,仿真始终不能达到真正的100%,都会有各自的遗憾和缺陷。”

他还透露,关于缺陷数据的具体占比,目前仍在实验阶段。

智源发布悟界·Physis-v0.1

此前,智源研究院于2025年发布的悟界·Emu3.5,内置了时空关系、因果逻辑与物理世界演化规律建模能力,相关成果于2026年1月刊发在《Nature》正刊。

在本届智源大会上,该机构发布了全球首个通用世界基座模型悟界·Physis-v0.1,尝试开辟第五个技术路径。该模型以物理隐空间表征替代传统的像素级或帧级预测方案,实现跨场景通用物理规律的强化学习。所谓隐空间,指的是将多种模态的原始信息压缩成一个标准化的内部表征,模型在这个表征空间中进行运算和推演,再解码为不同形式的输出。

悟界·Physis-v0.1搭载了专属物理状态编码器,可将视频、深度RGB、3D点云、力触反馈等全模态信息,统一转化为标准化的隐空间物理状态。模型支持50多个复杂物理场景的长程推理,具备物理一致性、动作因果性、长程可推演性和通用泛化性四项能力,瞄准严肃工业、具身智能、物理仿真和科学研究等应用场景。

王仲远表示:“目前悟界·Physis-v0.1还只是0.1版本,我们愿意把研发中的思考和进展全部分享出来,希望推动行业扎扎实实把底层问题做透。”

行业评测与远期展望

关于世界模型的未来发展节奏,王仲远持谨慎乐观态度。他认为,至少未来三到五年都将是世界模型持续演进迭代的阶段,科研探索可能长期卡在某一个难点上,也可能突然迎来技术爆发。

在推动技术进步的具体举措上,他呼吁行业共建评测体系,围绕“预测下一个物理状态”这一核心能力构建统一的评测基准。