TAG:世界模型
再携手!清华陈建宇×斯坦福Chelsea团队发布VLAW,世界模型×VLA协同进化
清华陈建宇团队与斯坦福Chelsea Finn团队联合发布VLAW框架,首次实现视觉语言动作策略与世界模型的协同进化。该框架通过真实交互数据提升世界模型的物理保真度,同时利用高质量虚拟数据强化VLA策略,解决了现有世界模型盲目乐观和物理模拟不准确的难题,为具身智能的发展提供了新思路。
VT-WM突破视觉局限 机器人更懂物理接触
本文介绍了VT-WM(视觉-触觉世界模型)如何突破纯视觉世界模型的局限,通过融合视觉与触觉感知,让机器人能够更准确地理解和预测物理接触任务。该模型解决了在抓取、堆叠等高接触操作中常见的物体消失、幻觉等问题,显著提升了任务规划成功率,为机器人交互提供了更可靠的多模态解决方案。
春晚机器人告别僵硬,具身智能迎来大脑进化
文章分析了2026年春晚机器人表演从“僵硬”到“灵动”的转变,指出其背后是控制算法等本体技术的进步。然而,文章强调,机器人要真正应用于复杂现实场景,关键在于发展能理解物理世界的“大脑”。文章深入探讨了当前主流的VLA(视觉-语言-动作)范式的局限,并介绍了具身智能向世界模型范式跃迁的技术趋势,以蚂蚁灵波等为例,阐述了通过仿真环境预演和闭环控制来赋予机器人物理常识与规划能力的前沿进展。
中科第五纪联合中科院自动化所发布BridgeV2W 机器人预演未来技术
中科第五纪联合中科院自动化所团队推出BridgeV2W,通过创新的具身掩码技术,将机器人动作渲染为像素级的动作剪影,解决了视频生成模型与机器人动作表征之间的鸿沟。该方法实现了动作与画面的精准对齐、视角自适应和跨机器人平台的通用性,让机器人能够可靠地预演未来动作,并在多场景实验中展现出卓越的泛化能力和下游任务应用价值。
酷哇推出WAM 2.0世界模型 推动RoboCity新基建发展
酷哇科技发布WAM 2.0世界模型,实现EBITDA回正,加速构建“自动驾驶+机器人”的RoboCity新基建。文章介绍了酷哇在智慧出行、物业和城市管家三大领域的业务矩阵,以及其作为唯一集齐北上广深版图的行业领跑者的商业化成果。同时,分析了从技术供给到全球生态的战略跃迁,揭示了通过Physical AI全栈通用底座实现规模化部署的关键路径。
ASC26聚焦具身智能 机器人"秒级思考"成新攻关方向
ASC26世界大学生超算竞赛聚焦具身智能前沿,赛题要求优化机器人“世界模型”的推理性能,实现秒级决策预演。文章探讨了当前机器人产业在认知与决策能力上的算力效率瓶颈,分析了从实验室走向商业应用的核心挑战,并指出通过竞赛培养复合型人才对推动产业发展的重要性。
谷歌开放世界模型精灵 AI开启凭空造世时代
谷歌DeepMind首次向公众开放世界模型Project Genie,该AI模型能够根据文字描述或图片瞬间生成可交互的3D虚拟世界,实现“凭空造世”。这不仅是多模态内容生成的突破,更为AI智能体提供了模拟训练场,被视为连接当前AI与未来具身智能的关键桥梁,加速了通用人工智能的发展进程。
世界模型走入物理世界,蚂蚁灵波开源LingBot-VA,让机器人“先思后行”
蚂蚁灵波科技开源具身世界模型LingBot-VA,首次提出自回归视频-动作世界建模框架,将大规模视频生成与机器人控制深度融合,使机器人能够“边推演、边行动”。该模型在真机评测中对复杂物理交互展现出强适应能力,仅需少量演示数据即可适配高难度任务,成功率平均提升20%;在仿真评测中刷新行业纪录,为具身智能发展开辟新路径。
1X世界模型升级发布,首席科学家意外离职
本文探讨了1X公司世界模型升级与首席科学家离职的背离现象,分析了机器人通过观看视频自学新任务的技术突破,以及商业化进程中理想与现实的张力。文章深入剖析了家庭场景中机器人落地面临的非结构化环境、性价比和安全挑战,引发对人工智能商业化前景的思考。
李飞飞再创AI神话 World Labs估值500亿美元瞄准世界模型
文章报道了由AI领域知名学者李飞飞创立的World Labs公司,在一年内估值从10亿美元飙升至50亿美元,正进行新一轮融资。公司专注于开发“大世界模型”,旨在让AI理解物理世界,其首款3D生成模型Marble已能创建可探索空间。文章分析了世界模型作为“空间智能”基础设施的潜力,并提及与Yann LeCun团队的竞争,预示AI未来将从语言转向对物理世界的建模与交互。
华为哈勃投资加持,半年融资三连跳,这家公司如何成为世界模型黑马
文章介绍了流形空间这家初创公司在成立仅半年内完成三轮融资的惊人成就,背后是其创始人武伟博士带领团队研发的WorldScape世界模型技术。该技术通过物理推演能力重新定义具身智能,获得华为哈勃等顶级资本押注,展现了在机器人、自动驾驶等领域的巨大潜力。
2025年人形机器人十大看点
本文通过十个关键词梳理了2025年人形机器人产业的发展脉络,重点分析了具身智能、端到端控制、世界模型和数据飞轮等核心技术趋势,探讨了行业面临的风口与挑战,为理解该领域的技术突破与生态演变提供了清晰视角。
1X发布“世界模型”为Neo赋予进化能力 机器人通过视频自学新技能
1X公司发布“世界模型”AI系统,使Neo人形机器人能够通过视频数据自主学习新技能,实现从执行预设程序到理解物理动态的进化。该模型结合视频与提示词,通过闭环学习机制持续提升机器人集群的整体能力,并支持思维过程可视化。随着Neo商业化交付临近,这一技术标志着机器人自主学习的重大进展。
高德FantasyWorld发布即登顶全球模型榜首 阿里空间智能再创佳绩
高德地图发布自研世界模型FantasyWorld,凭借海量真实导航数据优势,在国际权威基准WorldScore Leaderboard上夺得综合得分第一。该模型聚焦高品质3D世界构建,通过创新技术实现视频潜变量和隐式3D场的联合建模,显著提升视觉真实感和几何保真度。目前已应用于高德“飞行街景”功能,助力商家生成虚拟漫游街景,并推动具身智能和自动驾驶领域发展。
高德上线飞行街景 足不出户逛遍万千门店
高德地图推出基于自研世界模型的“飞行街景”功能,实现了从平面导航到连续动态实景还原的跨越。用户可沉浸式预览到店路线,清晰查看门店细节,降低决策成本;商家则获得数字化营销新窗口。这一技术正重塑虚拟与物理世界的连接方式。