世界模型站上智源大会C位图灵奖得主把AI普及的时间往前拨了50年_全局洞察

世界模型站上智源大会C位图灵奖得主把AI普及的时间往前拨了50年

创始人

2026-06-13 14:53:09

0次

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（来源：财联社）

《科创板日报》6月13日讯（记者李明明）6月12日，第八届北京智源大会在中关村国际创新中心开幕。2015年图灵奖得主惠特菲尔德·迪菲在现场抛出的远期判断，为这场行业盛会定下了核心基调：人工智能正从数字世界向物理世界跃迁，世界模型正在成为下一阶段技术竞争的核心赛道。

迪菲在《护AI智能体之安，御AI智能体之险》的主旨演讲中明确提出，机器智能终将深度主导社会运行，且不会以科幻作品中的人机对抗形式出现。人类会主动接纳技术带来的效率提升，逐步将事务决策权交由机器代劳，最终形成深度依赖的共存关系。他将这一进程的预判时间从本世纪末提前至2050年前后。

这一判断的技术落点，正是本届大会最受关注的世界模型。此前大语言模型仅能处理数字世界的文本信息，并不具备介入真实物理场景的决策能力；而世界模型实现了从“预测下一个词元”到“预测下一个物理状态”的范式跃迁，让AI得以理解时空规律、推演场景演化，成为机器代劳真实事务的底层技术支撑。这种渗透进工业、物流、家居等日常场景的技术演进，恰好契合迪菲所说的“非对抗式接管”路径。

迪菲同时敲响安全警钟：当前行业惯用的补丁式安全逻辑，已无法适配智能体自主行动的新场景，智能体权限边界缺失是当下最突出的短板。当世界模型驱动AI从生成内容转向操控实体，行为偏差的代价将从信息误差升级为现实损害，安全框架必须前置布局。

针对当下“人人皆言世界模型”的行业热潮，智源研究院院长王仲远在大会期间做出正本清源。他首次将当前主流技术路线划分为四类：以语言为中心的多模态模型、以像素为中心的视频生成模型、以3D重建为中心的空间模型，以及以隐空间表征为中心的JEPA路线。

“视频生成不等于世界模型。”王仲远告诉《科创板日报》记者，以Sora为代表的视频生成模型本质是“世界模拟器”，训练数据掺杂大量影视科幻内容，无法保证物理规律的正确性，不足以支撑真实物理场景的决策。3D重建路线则更多服务于元宇宙、数字孪生等虚拟场景，并未触达物理世界的因果规律。

据王仲远介绍，智源选择的是语言与视觉表征融合的技术路线，在统一潜空间中编码物理状态，核心是预测“下一个物理状态”而非生成具体像素画面。本届大会上，智源发布全球首个通用世界基座模型“悟界·Physis-v0.1”，主打物理一致性、动作因果性、长程可推演性与通用泛化性。

据介绍，悟界·Physis-v0.1具备四大核心特性：物理正确、动作因果可溯、长程一致与通用泛化。模型可适配机器人、视频生成、游戏、工业等全垂类真实物理应用场景，为具身智能、严肃工业等领域提供底层支撑。

在产业阶段判断上，王仲远认为，当前世界模型大致相当于2012年深度学习刚兴起的时期，技术路线尚未收敛，真实物理数据严重不足，距离规模化应用仍有较长距离。但与大语言模型时代中美存在明显代差不同，他明确表示，在世界模型领域中美站在同一起跑线，中国科研机构有机会走出自己的原创技术路线。

数据是当前世界模型发展的核心卡点。真实物理世界的多模态交互数据极度分散，尚未形成类似互联网文本的规模化数据集。王仲远表示，视频数据仍是当前最易规模化获取的资源，其价值尚未被充分挖掘；而具身场景的逐步落地将持续积累真实交互数据，形成技术迭代的正向循环。

从图灵奖得主的远期预判到一线科研机构的路线探索，本届智源大会清晰传递出行业信号：参数竞赛的红利已逐步见顶，物理世界正在成为人工智能的新赛场。而技术突破与安全建设能否同频推进，将决定这场范式跃迁的最终走向。

上一篇：巴拉圭主帅回应5张黄牌

下一篇：文旅增收要摆脱门票依赖

世界模型站上智源大会C位图灵奖得主把AI普及的时间往前拨了50年

相关内容

热门资讯

世界模型站上智源大会C位 图灵奖得主把AI普及的时间往前拨了50年

相关内容

热门资讯

世界模型站上智源大会C位图灵奖得主把AI普及的时间往前拨了50年