TAG:世界模型
Sora 2 之后,北京人形WoW具身世界模型带来aha时刻
北京人形机器人创新中心开源了WoW具身世界模型,这是一个融合视觉、动作、物理感知与推理的统一框架,让机器人能够理解物理规律并在真实环境中自主操作。相较于Sora 2,WoW在时空一致性和物理推理方面表现更出色,具备跨机器人形态、任务和场景的泛化能力,有望成为世界模型领域的'Deepseek',推动具身智能发展。
单块GPU上跑出实时3D宇宙,李飞飞世界模型新成果震撼问世
斯坦福李飞飞团队推出实时3D世界模型RTFM,可在单块H100 GPU上运行。该模型通过2D图像输入直接生成多视角新图像,无需显式3D建模,实现了实时、持续的3D一致性渲染。作为学习型渲染器,RTFM融合了重建与生成功能,能处理光照、反射等复杂视觉效果,标志着空间智能领域的重大突破。
宇树直接开源“王炸”技术,机器人圈疯了
宇树科技开源UnifoLM-WMA-0架构,这是专为通用机器人学习设计的世界模型-动作架构。该架构具备仿真引擎和策略增强两大核心功能,支持决策模式和仿真模式,能够预测机器人与环境的物理交互并生成高保真反馈。此次开源有望推动全球具身智能行业发展,为机器人控制算法优化提供重要基础。
中国首个基于世界模型的机器人任务执行系统在蓉发布
成都人形机器人创新中心成功研发国内首个基于世界模型的机器人任务执行系统(R-WMES),该系统通过学习现实世界物理规律,使机器人具备类似人类的物理直觉和自主规划能力。只需输入目标图片,机器人就能自动判断状态、规划并执行任务,在陌生环境中展现出强大的自适应性和任务完成度,解决了人形机器人不够聪明的问题,是推动机器人实用化、商业化的重要突破。
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
昆仑万维开源了交互式世界模型 Matrix-Game 2.0,实现了通用场景下的实时长序列交互生成能力,成为业内首个开源的世界模型。与 DeepMind 未开源的 Genie 3 相比,Matrix-Game 2.0 更注重产业化落地,可直接应用于游戏引擎、具身智能等场景。文章详细介绍了该模型的技术架构和实时交互能力,展示了其在虚拟世界生成方面的突破性进展。