新京报贝壳财经讯(记者罗亦丹)对于AI大模型应用,人们已经熟悉了“文生文”、“文生图”以及“文生视频”。而12月17日,腾讯混元发布世界模型1.5(Tencent HY WorldPlay),提供了“文生3D”和“图生3D”能力。
具体来看,用户输入文字描述或者图片即可创建专属的互动世界,通过键盘、鼠标或手柄实时控制虚拟相机的移动和转向,像玩游戏一样自由探索AI生成的世界。这是国内首个开放体验的实时世界模型,用户可以在腾讯混元3D官网申请使用(https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)。
同时,混元世界模型1.5(WorldPlay) 首次开源了实时世界模型框架,涵盖数据、训练、流式推理部署等全链路、全环节,并提出了重构记忆力、长上下文蒸馏、基于3D的自回归扩散模型强化学习等算法模块。
混元世界模型1.5带来世界建模的全新可能性,用户可以在生成的世界里随意移动探索,离开某个区域后再次返回时,模型能够"记住"该区域的三维结构,呈现前后一致的场景——这种空间记忆能力标志着模型在三维世界理解上的突破。此外,用户还可以选择将用于交互的3D场景导出为可多次使用的3D点云。
编辑 杨娟娟
校对 柳宝庆